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THTOC1 


Thème 1 : cardinalité Le Frido ! ne définit pas la notion de nombre cardinal ; ça nous mènerait 
trop loin. Au lieu de cela, nous allons nous contenter des notions d’équipotence, surpotence et 


1. Ici je mets la référence [1] ; pas parce qu'elle est utile ici, mais parce que je veux être sûr qu’elle soit numéro 


1 de façon à être facilement reconnaissable. Elle indique les affirmations à propos desquelles le lecteur doit être 
doublement attentif. 


subpotence, et démontrer un certain nombre de résultats en utilisant sans retenue le lemme de 
Zorn 1.23. 


(1) Ensemble infini, définition 1.113. 

(2) Ensemble dénombrable, définition 1.125. 

(3) Cardinal d’un ensemble fini, définition 1.122. 
(4) 


Définition d’équipotence, surpotence et subpotence, notations À > B et À & B, définition 
1 TILL. 


(5) Toute partie d’un ensemble fini est finie, lemme 1.115. 
(6) Si À est un ensemble fini ou dénombrable, alors il existe une surjection N — À, lemme 1.127. 


(7) Si À est un ensemble infini et si f: À — B est une application injective, alors f(A) est infini, 
proposition 1.120. 


Toute partie infinie de N est dénombrable, proposition 1.128 
Une bijection N — N x N, proposition 1.131. 


) 
) 
(10) Une décomposition de N en une infinité de parties équipotentes à N, corolaire 1.132. 
) Si il existe une surjection N — À, alors À est fini ou dénombrable, lemme 1.133. 
) 


Une union dénombrable d’ensembles finis ou dénombrables est finie ou dénombrable, propo- 
sition 1.134 


(13) Tout ensemble infini contient une partie en bijection avec N, proposition 1.138. 


(14) Toute partie d’un ensemble fini est finie, et toute partie d’un ensemble dénombrable est finie 
ou dénombrable, proposition 1.139. 


(5) SiA> Bet BY A, alors À & B, théorème de Cantor-Schrôder-Bernstein 1.142 


(16) Le théorème de Cantor 1.145 dit qu'il n'existe pas de surjection d’un ensemble vers son 
ensemble des parties. On en déduit qu’il n’existe pas d'ensemble contenant tous les ensembles 
(corolaire 1.147). 


(17) Si À est infini et si À > B, alors À & A LU B par le lemme 1.149. 
(18) Si S est un ensemble infini alors il existe une bijection w: {0,1} x S — S, proposition 1.150. 
(19) Si À est infini, alors À x N # À, proposition 1.152. 
(20) Si À est infini et si B < À, alors A\B & À, lemme 1.154. 
(21) Si À est infini, alors À & À x À, théorème 1.158. 
Il y a aussi des résultats de cardinalité autour des extensions de corps. 
(1) Si K est un corps infini, alors K[X] & K. 


(2) Le théorème de Steinitz 6.134 affirme que tout corps admet une unique clôture algébrique. 
La preuve utilise pas mal de cardinalité ainsi que le lemme de Zorn 1.23. 
THTOC2 

Thème 2 : morphismes et compagnie 

(1) Un morphisme est un concept algébrique. Il s’agit d’une application (pas spécialement in- 
versible) qui préserve la structure. Quand on parle de morphisme, il faut donc préciser la 
structure. On dit & morphisme de groupe », « morphisme d’espace vectoriel », & morphisme 
d’anneaux », etc. 
Morphisme de module, définition 1.323. 


Morphisme de groupes, définition 1.37. 
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Un isomorphisme d’espaces topologiques est une application continue, inversible, dont l’in- 
verse est continue, 7.37. On dit aussi un homéomorphisme. 


(5) Un difféomorphisme est différentiable d’inverse différentiable, définition 11.231. 
(6) Un C*-difféomorphisme est une application CF d’inverse C*. Définition 11.231. 


Le mot « homomorphisme » signifie exactement « morphisme », et, sauf incohérence de ma part, 
il n’est pas utilisé dans le Frido. 


THEMEOoONRZHooYHHGS8 
Thème 3 : arithmétique modulo, théorème de Bézout 


(1) Pour Z* c’est le théorème 1.229. 

(2) Théorème de Bézout dans un anneau principal : corolaire 3.70. 

(3) Théorème de Bézout dans un anneau de polynômes : théorème 6.47. 
(4) 


En parlant des racines de l’unité et des générateurs du groupe unitaire dans le lemme 19.6. 
Au passage nous y parlerons de solfège. 


(5) La proposition 1.255 qui donne tout entier assez grand comme combinaisons de a et b à 
coefficients positifs est utilisée en chaines de Markov, voir la définition 38.33 et ce qui suit. 


(6) PGCD et PPCM sont dans la définition 1.182. 
(7) Calcul effectif du PGCD puis des coefficients de Bézout : sous-sections 3.2.1.1 et 3.2.1.2. 


THTOC4 
Thème 4 : divisibilité 
(1) Si a divise bc et si a est premier avec c, alors a divise b. Lemme de Gauss 3.12. 
(2) Si a divise b et b divise a, alors a = b, lemme 3.14. 
THTOCS5 


Thème 5 : équations diophantiennes 
(1) Équation ax + by = c dans N, équation (3.58). 
(2) Dans 3.2.6, nous résolvons ax + by = c en utilisant Bézout (théorème 1.229). 


(3) L'exemple 3.88 donne une application de la pure notion de modulo pour x? = 3y? + 8. Pas 
de solutions. 


(4) L'exemple 3.89 résout l'équation x? +2 = y° en parlant de l’extension Z[iV2] et de stathme. 
(5) Les propositions 3.93 et 3.95 parlent de triplets pythagoriciens. 


(6) Le dénombrement des solutions de l'équation ain: + ...ayn, = n utilise des séries entières 
et des décompositions de fractions en éléments simples, théorème 26.99. 


(7) La proposition 1.131 donne une bijection IN x N — N en résolvant dans N (entre autres) 
l'équation k = y? + x pour k fixé. 


THEMEooVIQIooUHFAQS 
Thème 6 : types d’anneaux 


(1) Définition d’anneau : définition 1.41. 
(2) La définition d’anneau principal est 1.221 ; pour un idéal principal, c’est 1.220. 
(3) Z est intègre, lemme 1.245, principal et euclidien (proposition 1.248). 
(4) Z[X] n’est pas principal (voir (5)). ITEMooNQQMooSnuK vi! 
(5) Si À est un anneau intègre ? qui n’est pas un corps, alors A[ X] n’est pas principal, lemme 1.249. 
(6) L’anneau des fonctions holomorphes sur un compact donné est principal, proposition 26.68. 
(7) L'anneau Z[i3] n’est pas factoriel, exemple 3.66. 
(8) L’anneau Z{[iV5] n’est ni factoriel ni principal, exemple 3.79. 
(9) Tous les idéaux de Z/6Z sont principaux, mais Z/6Z n’est pas principal. Exemple 1.241. 
anneau principal 
— Définition 1.221. 
— Ilest intègre, définition 1.221. 
— Il est noetherien, lemme 3.75. 


— il est factoriel, théorème 3.77. 


2. Définition 1.193. 


anneau euclidien 


Définition 1.244. 
Il est principal par 1.247 


anneau intègre 


Définition 1.193. 


anneau noetherien 


Définition 3.74. 


anneau factoriel 


corps 


Dans 


Dans 


Dans 


Dans 


Définition 3.61. 
Il est intègre, définition 3.61. 


Corps, définition 1.202. 

Il est un anneau intègre, lemme 1.194. 

Il est un anneau principal, proposition 3.78. 

Il est un anneau factoriel, proposition 3.78. 

anneau intègre 

Un anneau fini intègre est un corps, proposition 3.59. 

A est intègre si et seulement si A[X] est intègre, théorème 3.101. 

Si un pgcd * est inversible, tous les pgcd sont inversibles, lemme 1.196. 
anneau principal 


p est premier si et seulement si il est irréductible si et seulement si l’idéal pA est maximal, 
proposition 1.227. 


Tous les idéaux sont principaux, définition 1.221. 

Si pgcd(a, b) = 1, pgcd(a, c) = 1, alors pgcd(a, bc) = 1, lemme 3.72. 

anneau factoriel 

Si p est irréductible et si p | ab, alors p divise a ou b, lemme 3.62. 

Tout élément irréductible est premier, proposition 3.63. 

Si p est irréductible, pA est un idéal premier, lemme 3.64. 

Si p est irréductible, A/pA est un anneau intègre, lemme 3.64 et proposition 1.224. 
P et Q sont primitifs si et seulement si PQ est primitif, lemme 3.116. 

Formule c(PQ) = c(P)c(Q). Lemme 3.116. 

L’anneau des polynômes P(A) = A[X] est factoriel, théorème 6.35. 

corps commutatif 

L’anneau K[X1] est factoriel, proposition 6.36, euclidien et principal, lemme 3.107. 
Les seuls idéaux de K sont {0} et K, lemme 1.179. 


L’anneau P(K) est euclidien, lemme 3.107. 


élément irréductible 


Définition 1.185 


élément premier 


Définition 1.184 


Si À est intègre et unitaire, l'élément p est premier si et seulement si l'idéal pA est 
premier, proposition 1.195. 


3. pgcd, définition 1.182. 


éléments associés 
— Définition 3.51. 


Dans un anneau, un idéal est 1.178. 

idéal premier 

— Définition 1.222. 

— Idéal premier si et seulement si A/I est anneau intègre, proposition 1.224. 
idéal maximal 

— Idéal maximal si et seulement si A/I est un corps, proposition 1.224. 
idéal principal 

— Définition 1.220. 


— Dans un anneau unitaire intègre, p est irréductible si et seulement si il n’y à pas d’idéal 
principal 1 tel que pA& 1€ À, proposition 1.195. 


THTOC7 
Thème 7 : sous-groupes 


(1) Théorème de Burnside sur les sous-groupes d’exposant fini de GL(n, C), théorème 9.307. 
(2) Sous-groupes compacts de GL(n, R), lemme 13.40 ou proposition 13.41. 
THEMEooQEEWooXHEUE8 
Thème 8 : groupe symétrique 
(1) Définition 1.267. 


(2) La signature €: S, — {—1,1} est l'unique morphisme surjectif de $,, sur {—1,1}, proposition 
1.293(1). 


(3) La table des caractères du groupe symétrique S4 est donné dans la section 16.5. 


(4) Le groupe symétrique 54 est le groupe des symétries affines du tétraèdre régulier *, proposi- 
tion 18.195. 


(5) Le groupe alterné A est l'unique groupe simple d'ordre ® 60, proposition 5.54. 


(6) La proposition 5.44 donne la position du groupe alterné dans le groupe symétrique : À, est 
un sous-groupe caractéristique de $,, et l'unique sous-groupe d’indice 2. 


THEMEooKZHBooKEUDE® 
Thème 9 : action de groupe 


(1) Définition d’une action de groupe sur un ensemble : 1.360. 
(2) Action du groupe modulaire sur le demi-plan de Poincaré, théorème 23.95. 


(3) La formule de Burnside (théorème 2.40) parle du nombre d’orbites pour l’action d’un groupe 
fini sur un ensemble fini. 


(4) Des applications de la formule de Burnside : le jeu de la roulette et laffaire du collier, 18.10.15.1 
et 18.10.15.2. 


(5) Le groupe symétrique $, agit sur l’anneau K[T:,...,7,], lemme 1.361. 


THTOC10 
Thème 10 : classification de groupes 


(1) Ordre d’un groupe, définition 1.260. 
2) 
3) 
4) Définition 5.6 d’un p-groupe. 
5) Théorème de Sylow 5.11. 


Structure des groupes d'ordre pq, théorème 5.25. 


Le groupe alterné est simple, théorème 5.50. 


( 
( 
( 
( 


4. Définition 12.147. 
5. Ordre d’un groupe, définition 1.260. 


(6) Théorème de Burnside sur les sous-groupes d’exposant fini de GL(n, C), théorème 9.307. 
(7) (Z/p2Z)* = Z/(p — 1), corolaire 19.32. 

(8) Le groupe (Z/pZ)* est cyclique, proposition 3.134. 

(9) 


9) Le premier théorème d’isomorphisme 2.6 dit que si 0 est un morphisme de groupes, alors 


G/ker(8) = Image(6). 


(10) Le deuxième théorème d’isomorphisme 2.7 dit que si N est normal dans G, alors NH/N = 
H/(HnN). 


(11) Le troisième théorème d’isomorphisme 2.9 dit que, avec des hypothèses de normalité, (G/M)/(N/M) = 


G/N. 
À propos d'ordre dans un groupe. 


(1) L'ordre d’un groupe est son cardinal. L'ordre d’un élément est le plus petit n tel que g”=e, 
définition 1.261. 


(2) L'ordre d’un élément divise l’ordre du groupe, corolaire 2.14. 
(3) Si H est normal dans G, alors |G/H| = |G|/|G|, théorème de Lagrange 2.13. 


(4) Si G est un groupe cyclique, pour tout diviseur p de |G|, le groupe G contient au moins un 
élément d’ordre p. Théorème de Cauchy 3.26. 


THMooUDYMo&ETRA 
Thème 11 : fonction indicatrice d’Euler 


(1) Définition de : IN* — N* dans 5.29. 

(2) Propriétés genre w(pq) = w(p)y(q), corolaire 5.42. 
(3) win) = Card(A,), proposition 19.12. 

(4) n = Lun pd), lemme 5.37. 

(5) L 

(6) 


e théorème de Euler-Fermat 5.33 donne a°() e [1], dès que a et n sont premiers entre eux. 


Si À et B sont premiers entre eux, il existe p,m tels que 47 = mB + 1, proposition 5.33. 


THTOC12 
Thème 12 : produit semi-direct de groupes 
(1) Définition 2.47. 
(2) Le corolaire 2.49 donne un critère pour prouver qu’un produit NH est un produit semi-direct. 
(3) L'exemple 18.177 donne le groupe des isométries du carré comme un produit semi-direct. 
(4) 


4) Le théorème 5.25 classifie les groupes d’ordre pq (p, q premiers distincts) à grands coups de 
produit semi-directs. 


(5) Le théorème 18.79 donne les isométries de R” par Isom(R”?) = T(n) x, O(n) où T(n) est le 
groupe des translations. 


(6) La proposition 18.81 donne une décomposition du groupe orthogonal O(n) = SO(n) x, Co 
où C2 = {Id, R} où R est de déterminant —1. 
(7) La proposition 8.63 donne AfF(R”) = T{n) x, GL(n, R) où AF(R?) est le groupe des appli- 


cations affines bijectives de R?. 


THTOC13 
Thème 13 : théorie des représentations 


(1) Définition 4.134. 
(2) Table des caractères du groupe diédral, section 18.17. 


(3) Table des caractères du groupe symétrique S41, section 16.5. 


THTOC14 


Thème 14 : espaces vectoriels 


(1) 


(2) 
(3) 


Les notations £L(V,W), L(V,W), GL(V, W) ainsi que les notions de morphismes et d’isomor- 
phismes d’espaces vectoriels normés sont dans la définition 11.237. 


Existence d’une base. Pour un espace vectoriel quelconque, proposition 4.23. 
Théorème de la base incomplète. Pour un espace vectoriel quelconque, théorème 4.24. 


THTOC15 


Thème 15 : rang 


(1) 


Définition pour une application linéaire : 4.45, pour une matrice : 4.105. L’équivalence est la 
proposition 4.109. 


Le théorème du rang, théorème 4.46 


Pour une applicaton linéaire entre deux espaces vectoriels de même dimension finie, il est 
équivalent d’être injectif, surjectif ou bijectif, c’est le corolaire 4.48. 


Pour prouver que des matrices sont équivalentes et pour les mettre sous des formes cano- 
niques, nous avons le lemme 4.111 et son corolaire 4.112. 


Tout hyperplan de M(n,K) coupe GL(n, K), corolaire 4.112. Cela utilise la forme canonique 
sus-mentionnée. 


Le lien entre application duale et orthogonal de la proposition 9.189 utilise la notion de rang. 


Le lemme 9.297 parle de commutant et utilise la notion de rang. Ce lemme sert à prouver 
diverses conditions équivalentes à être un endomorphisme cyclique dans le théorème 9.298. 


THEMEooUAJKoGEYOCY6 


Thème 16 : formes bilinéaires et quadratiques 


(11) 


Les formes bilinéaires sont définies en 9.122. 
Forme quadratique, définition 9.123. 


Équivalence de forme quadratiques, définition 9.246. Deux formes quadratiques sont équiva- 
lentes si et seulement si elles ont même signature, proposition 9.247. 


Une isométrie d’une forme bilinéaire est affine ou linéaire, théorème 9.155. 
Forme bilinéaire dégénérée, définition 9.127. 


Une forme bilinéaire est non-dégénérée si et seulement si sa matrice associée est inversible, 
c’est la proposition 9.223. 


Une isométrie d’une forme bilinéaire est linéaire ou affine par le théorème 9.155. 


Toute forme quadratique admet des bases orthogonales, théorème 9.239 pour le cas général ; 
proposition 9.250 pour le cas de R”, en se basant sur le théorème spectral. 


Base g-orthogonale pour une forme quadratique, théorème 9.239. 


Le concept de projection orthogonale est la définition 12.142 en dimension finie et la définition 
25.7 dans le cas des espaces de Hilbert. 


Produit hermitien, définition 9.172. Opérateur hermitien (Af = 4), opérateur unitaire (Af A = 
1), définition 9.175 


matrice 


(1) Matrice d’une forme quadratique, définition 9.146. 


(2) Théorème de Sylvester à propos de signature (définition 9.160) de forme quadratique 
réelle : 9.245. 


orthogonalité 


(1) Il existe une base g-orhogonale, proposition 9.237 et théorème 9.239. 
(2) Définition de l’orthogonal At et du noyau ker(b), définitions 9.129, 9.130. 
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(3) Diverses propriétés comme A1 = Span(A)+ et V n V+ = ker(by), propositions 9.131 et 
9:192;: 


(4) En dimension finie, (V4) = V, lemme 9.135. 
(5) Nous avons dim(V) + dim(V+) = dim(Æ), lemme 9.134. 


(6) Pour une forme quadratique strictement définie positive ou négative, £ = F@ Et, 
lemme 9.137. 


THTOC17 
Thème 17 : endomorphismes cycliques 
(1) Définition 9.102. 
(2) Groupe cyclique, définition 1.319. 
(3) Son lien avec le commutant donné dans la proposition 9.295 et le théorème 9.298. 
(4) Utilisation dans le théorème de Frobenius (invariants de similitude), théorème 9.286. 


THEMEooZYKFo&HXRE€PB 
Thème 18 : extension de corps et polynômes 


(1) Définition d’une extension de corps 6.59. 
(2) Définition de polynôme minimal : 6.64. 


(3) Pour l’extension du corps de base d’un espace vectoriel et les propriétés d'extension des 
applications linéaires, voir la section 9.15. 


(4) Extension de corps de base et similitude d'application linéaire (ou de matrices, c’est la même 
chose), théorème 9.300. 


Extension de corps de base et cyclicité des applications linéaires, corolaire 9.299. 
À propos d’extensions de Q, le lemme 6.181. 
Corps de rupture : définition 6.113 existence par la proposition 6.119. Il n’y a pas unicité. 


Corps de décomposition : définition 6.140. Attention : le plus souvent nous parlons de corps 
de décomposition d’un seul polynôme. Cette définition est un peu surfaite. Existence par la 
proposition 6.141 qui le donne même comme extension par toutes les racines, et unicité à iso- 
morphisme près par le théorème 6.143, énoncé de façon plus simple (mais pas indépendante !) 
en la proposition 6.144. 


(9) Si K est algébrique clos et si a: K — L est une extension algébrique, alors a(K) = L par le 
lemme 6.79. 


Un trio de résultats d’enfer est : 


(1) Dans un anneau principal qui n’est pas un corps, un idéal est maximal si et seulement si il 
est engendré par un irréductible © (proposition 1.237). 


(2) Dans un anneau, un idéal Z est maximal si et seulement si A/I est un corps (proposition 1.213) 
(3) Si K est un corps, K[X] est principal (lemme 3.107). 


THTOC19 
Thème 19 : polynômes 


Définitions Soient un anneau À, un corps K, une extension L de K et un élément a € L. 


(1) La définition la plus formelle est en tant que module produit AN), définition 1.352. Le 
produit et l'évaluation sont définis en 1.355 et la formule (PQ)(x) = P(x)Q(x) dans 
1.356. 


(2) Si À est commutatif, alors A[X] est également commutatif, lemme 1.357. 


(3) En ce qui concerne la notation A[X|, elle ne devrait pas être utilisée, voir 1.19.2. L’en- 
semble des polynômes sera noté P(A) et ceux de degré n (définition 1.354), Ph(A). 


6. Irréductibilité, y compris polynôme irréductible, définition 1.185. 
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(4) A[X], définition 1.352; l'anneau K[X] a même définition parce que c’est un cas parti- 
culier. L'évaluation d’un polynôme en un élément de l’anneau, P(a) est définie en 1.355. 


(5) Liens entre K[a], K[X], K(a) et K(X) lorsque a est transcendant, proposition 6.99. 
Et la proposition 6.102 pour le cas où a est algébrique ?. 


(6) Si À est un anneau et si & est un élément d’une extension de À (comme anneau), 
nous écrivons A[a] pour le plus petit sous-anneau de B contenant À et a. C’est la 
définition 3.99. 


(7) K(X), le corps des fractions de K[X], définition 6.83. Si R = P/Q dans K(X), l’éva- 
luation est R(a) = P(a)Q(a) !, définition 6.84. 
(8) K(a)x est le plus petit corps de L contenant K et à, définition 6.85. 
(9) À propos de polynômes à plusieurs variables. 
— Anneau de polynômes : A[X:,...,X,] est la définition 3.47. 
— Corps engendré : K(a1,...,ah) est la définition 6.137. 
— Corps des fractions rationnelles : K(X1,...,X,) est la définition 6.138. 
contenu À propos de c(P). 
(1) Définition du contenu c(P), 3.110. 
(2) c(PQ) = c(P)c(Q), lemme de Gauss 19.46, et lemme 3.116 pour un anneau factoriel. 
(3) 
(4) Si a € À nous avons c(aP) = ac(P) par le lemme 1.197. 


Si c(P) = 1, on dit que P est primitif au sens des pgcd, définition 3.112. 


(5) Un polynôme primitif est la définition 3.112. 
Dérivation Plusieurs propriétés du polynôme dérivé P’. 
(1) La définition 6.153 donne P' = YF, ka; XK- 1. 
(2) Règle de Leiïbnitz, lemme 6.154. 
(3) Caractérisation de P’ = 0 en fonction de la caractéristique de K, lemme 6.155. 


Coefficients dans un anneau commutatif (1) Les polynômes à coefficients dans un anneau 
commutatif sont à la section 3.7. 


(2) Un anneau À est intègre si et seulement si A[X] est intègre ; théorème 3.101. 
Coefficients dans un corps Les polynômes à coefficients dans un corps sont à la section 6.3. 

(1) Si K est un corps, K[X] est euclidien et principal, lemme 3.107. 

(2) Nous parlons de l’idéal des polynômes annulateurs dans le théorème 6.43. 


(3) Le théorème 6.43 dit que K[X] est un anneau principal et que tous ses idéaux sont 
engendrés par un unique polynôme unitaire. 


(4) Le polynôme minimal est irréductible, proposition 6.67. 
(5) Quelques formules sur le pgcd, lemme 6.57. 


Polynôme primitif (1) Un polynôme est irréductible sur À si et seulement si il est irréductible 
et primitif sur le corps des fractions, corolaire 3.131. 


Polynôme d’endomorphisme C’est la section 9.7. 
Racines et factorisation (1) Si À est un anneau, la proposition 3.120 factorise une racine. 
(2) Si À est un anneau, la proposition 3.125 factorise une racine avec sa multiplicité. 
(3) Si À est un anneau, le théorème 3.127 factorise plusieurs racines avec leurs multiplicités. 
(4) Le théorème 3.127 nous indique que lorsqu'on à autant de racines (multiplicité comprise) 
que le degré, alors nous avons toutes les racines. 


(5) Si K est un corps et a une racine dans une extension, le polynôme minimal de à divise 
tout polynôme annulateur par la proposition 6.100. 


7. Définition 6.71. 
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(6) Le théorème 6.110 annule un polynôme de degré n ayant n + 1 racines distinctes. 


(7) La proposition 6.184 nous annule un polynôme à plusieurs variables lorsqu'il a trop de 
racines. 


(8) En analyse complexe, le principe des zéros isolés 17.139 annule en gros toute série entière 
possédant un zéro non isolé. 


(9) Polynômes irréductibles sur F,. 


THTOC20 
Thème 20 : polynôme d’endomorphismes 


(1) Endomorphismes cycliques et commutant dans le cas diagonalisable, proposition 9.295. 
2 
3 
4 
5 


Racine carrée d’une matrice hermitienne positive, proposition 13.27. 
Théorème de Burnside sur les sous-groupes d’exposant fini de GL(n, C), théorème 9.307. 


(2) 
(3) 
(4) Décomposition de Dunford, théorème 9.250. 
(5) Algorithme des facteurs invariants 4.113. 


THEMEooULGFoGHSGE2C 
Thème 21 : dualité Ne pas confondre dual algébrique et dual topologique d’un espace vectoriel. 
(1) Définition du dual, 4.125. 
(2) Le dual d’un espace de Banach est de Banach, proposition 7.257. 
(3) Définition de la base duale 4.126. 
(4) dim(E) = dim(E*), lemme 4.126. 
(5) Base préduale (existence, unicité) : proposition 4.130. 
(6) Théorème de représentation de Riez 27.171 : LP = (LA4)', et en particulier L° = (L!)/. 
(7) Il n’est pas vrai que (L®°)’ = L!, voir la proposition 27.217. 
(8) 


Dans un espace de Banach*, |x| = max ep [p(x)|, proposition 27.159. 
lpl=1 


Dual topologique et algébrique Ils sont définis par 4.125. Le dual algébrique est l’ensemble 
des formes linéaires, et le dual topologique ne considère que les formes linéaires continues (en 
dimension infinie, les applications linéaires ne sont pas toutes continues). 


Topologie Une topologie possible sur le dual d’un espace vectoriel topologique est celle +-faible 
de la définition 7.343. 


Nous comparons les topologies faibles et de la norme en la section 11.15. 
Théorèmes de dualité Quelques théorèmes établissent des dualités entre des espaces courants. 


(1) En dimension finie, x — b(x,.) est isomorphisme Æ — E* lorsque b est une forme 
bilinéaire, proposition 9.133. 


(2) Le théorème de représentation de Riesz 25.18 pour les espaces de Hilbert. 

(3) La proposition 27.169 pour les espaces L?([0,1]) avec 1 < p < 2. 

(4) Le théorème de représentation de Riesz 27.171 pour les espaces LP en général. 
Tous ces théorèmes donnent la dualité par l’application ®, = (x,.). 


THTOC22 
Thème 22 : injections 


(1) L'espace de Sobolev H!(T) s’injecte de façon compacte dans C(1), proposition 31.6. 
(2) L'espace de Sobolev H!(I) s’injecte de façon continue dans L?(1), proposition 31.6. 
(3) L'espace L?(Q) s'injecte continument dans Z'(Q) (les distributions), proposition 30.36. 


8. Espace de Banach, définition 7.255. 
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INTooVDSCo&HXDCRS 
Thème 23 : tribu, algèbre de parties, À-systèmes et co. Il existe des centaines de notions 
de mesures et de classes de parties. 


(1) Le plus souvent lorsque nous parlons de mesure est que nous parlons de mesure positive, 
définition 14.18 sur un espace mesuré avec une tribu, définition 14.1. 


(2) Une mesure extérieure est la définition 14.10 


(3) Une algèbre de partie : définition 14.13. Une mesure sur une algèbre de parties : défini- 
tion 14.11. L'intérêt est que si on connait une mesure sur une algèbre de parties, elle se pro- 
longe en une mesure sur la tribu engendrée par le théorème de prolongement de Hahn 14.77. 


(4) Un )-système : définition 14.30. 
(5) Une mesure complexe : définition 14.232. 


En théorie de l'intégration, si X est une partie de IR”, la convention est de considérer des 
fonctions 
f: (X, Leb(X)) — (R, Bor(R)). 
Voir les points 14.117 et 14.162 pour les conventions à ce propos. 
À propos d’applications mesurables : 
(1) Définition d’une application mesurable, définition 14.42. 
(2) Une fonction continue est borélienne, théorème 14.53. 
(3) Si les f, sont mesutables (au sens des boréliens), alors sup,, f, est mesurable, lemme 14.97. 
À propos de tribu induite : 
(1) Définition 14.8. 


(2) Les boréliens induits sont bien les boréliens de la topologie induite : Bor(Y) = Bor(X)}y, 
théorème 14.54. 


Tribu engendrée. 
(1) Tribu engendrée par des parties, définition 14.4. 


THEMEooKLVRoGH&GBCQK 
Thème 24 : théorie de la mesure 


Mesure À propos de mesure. 

1) Tribu des boréliens, définition 14.47. 

2) Mesure positive, mesure finie et o-finie, c’est la définition 14.18. 
3 
4 
5 
6 


Le produit de tribus est donné par la définition 14.124, 

Produit d’une mesure par une fonction, définition 14.205. 

le produit d'espaces mesurés est donné par la définition 14.240. 

Mesure de Lebesgue sur R, définition 14.139. 

7) Une partie de R non mesurable au sens de Lebesgue : l’exemple 14.153. 
8) Mesure de Lebesgue sur R\, définition 14.242. 

(9) Mesure à densité, définition 14.205. 


Théorèmes d’approximation Il est important de pouvoir approcher des fonctions continues 
ou LP par des fonctions étagées, sinon on ne parvient pas à faire tourner la machine de 
l'intégration de Lebesgue. 


(1) 
(2) 
(3) 
(4) 
(5) 
(6) 
(7) 
(8) 


(1) Si (S, A, x) est un espace mesuré et si f: $ — [0,+00] est une fonction mesurable, le 
théorème fondamental d’approximation 14.115 dit qu’il existe une suite croissante de 
fonctions étagées qui converge vers f. 

(2) Les fonctions simples sont denses dans LP, proposition 27.47. 


(3) Encadrement d’un borélien À par un fermé F et un ouvert V par le lemme 14.83 : 
FCACV avec u(V\F) <e. 
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(4) Approximation LP? de la fonction caractéristique d’un borélien par une fonction continue 
par le théorème 14.235. 


Produit (1) La tribu produit, définition 14.124. 
(2) La mesure produit, définition 14.239. 


THEMEooUJVXo0HGDfaS 
Thème 25 : normes 


Définitions (1) Espace vectoriel normé : définition 7.149. 
(2) Produit scalaire, définition 9.164. 
(3) Norme associée à un produit scalaire (cas réel), théorème 11.1. 
(4) Norme associée à une forme sesquilinéaire (cas complexe), proposition 10.106. 
(5) Produit scalaire sur R”, définition 9.169. Norme sur R”, définition 11.3. 
(6) Forme hermitienne sur C”, définition 9.179. Norme sur €”, définition 10.107. 
(7) La proposition 11.41 donne les normes |x|1, |xl2 et [xl sur R?. 
(8) Sur R”, la proposition 17.108 dit que }x|, est une norme. 
Topologie (1) Métrique associée à une norme d(x,y) = |x — y|, définition 7.154. 
(2) La topologie d’un espace vectoriel normé est la topologie métrique du théorème 7.109. 
(3) Les boules sont les boules métrique définies en (7.100). 
Inégalités (1) En général pour les normes |.|,, il y a des inégalités dans 17.109 et 17.101. 
(2) La proposition 17.114 donne l'inégalité |x|, < ns »|«l, dès que 0 < q < p. 
Équivalence de norme (1) Définition de l’équivalence de norme 11.43. 
(2) La proposition 11.44 sur l’équivalence des normes |.]2, |.|1 et ||. dans R”. 


(3) Toutes les normes sur un espace vectoriel de dimension finie sont équivalentes par le 
théorème 11.46. 


Autres (1) Montrer que le problème a — b est stable dans l’exemple 34.27. 


(2) La proposition 12.114 donnant p(A) < | A| utilise l’'équivalence de toutes les normes sur 
un espace vectoriel de dimension finie (théorème 11.46.). 


(3) La norme x + |x| est une application continue, proposition 7.157. 
Norme opérateur et d’algèbre voir le thème 39. 


THTOC26 
Thème 26 : inégalités Dans C nous avons |a + b| < |a| + |b| par la proposition 10.97(6). 


Inégalité de Young Nous avons 
ab < — + — (-2.1) 


par la proposition 27.30. 
Inégalité de Jensen (1) Une version discrète pour CE At), la proposition 17.105. 
(2) Une version intégrale pour I adj), la proposition 27.31. 
(3) Une version pour l'espérance conditionnelle, la proposition 36.72. 
Inégalité de Hôlder Il en existe de nombreuses versions et variations. 
(1) Hôlder pour LP : | fgl1 < | flplgla, proposition 27.33. 
(2) Hôlder pour € : |x|, < na» xl, proposition 17.114. 
(3) [rl < [rlp < n/?|xlo, théorème 17.109 
(4) [xp <nP|xl4, corolaire 17.110. 
Inégalité de Minkowsky (1) Pour une forme quadratique ” q sur R” nous avons 4/q(x + y) < 


A/q(x) + 4/q(y). Proposition 11.10. 


9. Définition 9.123. 
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(2) Si1 <p < w et si f,g € LP(Q, A, y) alors | f + gl < [lp + lglp. Proposition 27.38. 


(3) L’inégalité de Minkowsky sous forme intégrale s'écrit sous forme déballée 


If, (J, LONITO) ETC) . - Î. (I, (FC y Pdu(e)) avt). 


ou sous forme compacte 


— [ fand(y)l < J \flpdo(u) 
4 p Y 


C’est la proposition 27.40. 
Transformée de Fourier Pour tout f e L!(R") nous avons |f|4 < ||f|1, lemme 29.12. 


Inégalité des normes Inégalité de normes : si f € LP et g € L\, alors |f x gl, < |fllgli 
proposition 27.60. 


THEMEooYRIWoGHXZ6BX 
Thème 27 : constructions topologiques 


topologie produit Si X et Ÿ sont des espaces topologiques, nous pouvons construire une topo- 
logie sur X x Y. 


(1) La définition de la topologie produit est 7.15. 
(2) Pour les espaces vectoriels normés, le produit est donné par la définition 7.216. 


(3) L'équivalence entre la topologie de la norme produit et la topologie produit est le 
lemme 7.216. 


(4) Quand V et W sont des espaces métriques, la topologie considérée sur V x W est celle 
de la définition 7.216. C’est à la fois la topologie de la norme produit et la topologie 
produit. 


(5) La convergence dans un espace vectoriel est si et seulement si il y a convergence com- 
posante par composante, proposition 7.60. 


(6) Dans le cas d'espaces normés, la topologie produit est la même que celle de la norme 
produit, lemme 7.217. 


topologie induite Si X est un espace topologique et si À est une partie de X, nous mettons une 
topologie sur À. 


(1) Le topologie induite, définition 7.24. 


(2) Si X est un espace vectoriel normé, la topologie induite est celle de la norme restreinte : 
lemme 7.114. 


topologie quotient Si X est topologique et si + est une relation d'équivalence, nous définissons 
une topologie sur X/ +. 


(1) La topologie quotient est définie en 7.44. 


(2) Si X est vectoriel normé, la topologie sur X/ + est aussi donnée par une norme quo- 
tient de la définition 7.340. La proposition 7.342 donne l’équivalence entre la topologie 
quotient et la norme quotient. 


topologie rendant continues des applications Si nous avons une application f: X — Y et si 
Y est topologique, nous mettons une topologie sur X rendant f continue. 


(1) Définition de la plus petite topologie rendant des applications continues, proposition 
7.39. 
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THTOC28 


Thème 28 : espaces métriques, normés 


Un espace métrique est un ensemble muni d’une distance, définition 7.107. 
La distance entre un point et un ensemble est la définition 7.140. 


Le théorème-définition 7.109 donne la topologie sur un espace métrique en disant que les 
boules ouvertes sont une base de la topologie (définition 7.2). 


La définition de la convergence d’une suite est la définition 7.13. 


Dans un espace vectoriel normé, une application est continue si et seulement si elle est bornée, 
proposition 11.62. 


Un espace vectoriel topologique !° qui possède en tout point une base dénombrable de topo- 
logie accepte une distance, théorème 7.267. 


THEMEo0GVCCoO&SHBPENA 


Thème 29 : limite et continuité 


(1) 


Limite d’une fonction en un point : définition 7.102. Il n’y a pas unicité en général comme le 
montre l’exemple 7.54 dans un espace non séparé. 


Définition de la continuité d’une fonction en un point et sur une partie de l’espace de départ : 
définition 7.32. 


Caractérisation de la limite dans KR, proposition 12.1. 


Unicité de la limite d’une suite dans un espace séparé : proposition 7.57. Unicité de la limite 
d’une fonction, toujours dans le cas d’un espace séparé : proposition 7.105. 


La proposition 7.346 donne l’unicité de la limite dans le cas des espaces duaux pour la 
topologie +-faible. La proposition 7.105 nous dira qu'il y a unicité dès que l’espace d’arrivée 
est séparé. 

Continuité sur une partie si et seulement si continue en chaque point, c’est le théorème 7.196. 


Voir l'exemple 12.57 traité en détail pour la (non) continuité d’une fonction qui fait un saut 
en un point. 


La fonction f(x, y) = x + y est continue, lemme 10.29. 


THEMEOOHINHOGH&STQU 


Thème 30 : intégration À propos d'intégration. 


L’ordre dans lequel les choses sont faites — Nous commençons par considérer des fonc- 


tions f: Q — [0, +] dans la définition 14.163. 


— Nous donnerons ensuite quelques propriétés restreintes aux fonctions à valeurs positives, 
par exemple 


(1) La convergence monotone 14.173, 

(2) Lemme de Fatou 14.177. 

(3) (presque) linéarité pour les fonctions positives, théorème 14.178. 
— La définition pour les fonctions à valeurs dans R puis C est 14.181. 


— Pour les fonctions à valeurs dans un espace vectoriel, c’est la définition 14.190. 


primitive et intégrale (1) La définition 14.261 donne Ç F = Va y f lorsque f est intégrable 


sur ]a, b|. 


(2) Lorsque f n’est pas intégrable sur |a, b] nous pouvons poser lim,;_,4 p j et dire que c’est 
une intégrale impropre, définition 14.274. 


Quelque résultats (1) Intégrale associée à une mesure, définition 14.163 


(2) L'existence d’une primitive pour toute fonction continue est le théorème 12.434. 
(3) La définition d’une primitive est la définition 12.201. 


10. Définition 7.161. 
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(4) Primitive et intégrale, proposition 14.262. 
(5) Intégrale impropre, définition 14.274. 


Intégrale et mesure (1) L'intégrale de la fonction 1 donne la mesure : [,, 1du = y1(B), c’est le 


lemme 14.170. 
(2) Le théorème de Radon-Nikodym 14.228 donne une densité pour certaines mesures. 


(3) Le produit d’une mesure par une fonction donnée par la définition 14.205 introduit aussi 
une densité : (w : u)(A) = Ÿ, wdy. 


Autre résultats (1) Si 4,B © Q sont des parties disjointes, alors {4,8 f = (4 f + [x f, propo- 


sition 14.187. 


2) La o-additivité dénombrable, _fdu= Y?,f, fdu est dans les propositions 14.203 
Ü; Ai i=0 JA; 
et 14.204. ‘ 
THTOC31 


Thème 31 : connexité 


Définition 7.64 

L'image d’un connexe par une fonction continue est connexe, lemme 7.209. 
Connexité par arcs, définition 10.61. 

Si U est connexe et si U € S & Ü, alors S est connexe, proposition 7.69. 


Une partie de R? qui est connexe, mais pas connexe par arcs, proposition 21.56. 


Une partie de R est connexe si et seulement si elle est un intervalle, proposition 10.52. 

Le groupe SL(n, K) est connexe par arcs, proposition 13.18. 

Le groupe GL(n, €) est connexe par arcs, proposition 13.19. 

Le groupe GL(n, R) a exactement deux composantes connexes par arcs, proposition 13.20. 
Le groupe Of(n, R) n’est pas connexe, lemme 13.15. 

Les groupes U(n) et SU(n) sont connexes par arcs, lemme 13.16. 


Pour tout n > 2, le groupe SO(n) est connexe, le groupe O(n) a deux composantes connexes, 
proposition 13.4. 


Connexité des formes quadratiques de signature donnée, proposition 17.120. 


Dans un espace vectoriel normé, les connexes par arcs sont connexes par arcs C1, proposition 
15.6. 


THEMEooQQBHoGEHTAGRB 


Thème 32 : compacts 


Propriétés générales Quelques propriétés de compacts. 


(1) La définition d’un ensemble compact est la définition 7.74. 
(2) Ne pas confondre le compactifié d’Alexandrov 7.98 avec la droite réelle achevée 12.27. 


(3) Si M est un compact de À x B, alors M € K x L où K est compact de À et L de B, 
proposition 7.96. 


(4) Un fermé dans un compact est compact, lemme 7.91 
(5) Dans un espace Hausdorff !!, les compacts sont fermés, 7.91(2). 


(6) Un espace est compact si et seulement si toute intersection finie de fermé est non vide, 
théorème 7.101. 


(7) Tout compact d’un espace topologique séparé est fermé, lemme 7.91(2). 


(8) Dans un espace vectoriel réel de dimension finie, les compacts sont les fermés bornés 
par le théorème 10.24. 


11. Hausdorff, définition 7.55. 
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(9) Le théorème de Borel-Lebesgue 10.19 dit qu’un intervalle l? de IR est compact si et 
seulement si il est de la forme [a, b]. 


(10) Théorème des fermés emboîtés dans le cas compact, corolaire 7.88. À ne pas confondre 
avec celui dans le cas des espaces métrique, théorème 7.284. 


L'image d’un compact par une fonction continue est un compact, théorème 7.211. 
Si f: À — X est une bijection continue, sa réciproque est continue, lemme 7.213. 
Suites dans un compact 


13a) Toute suite dans un compact admet une sous-suite convergente, théorème 7.275. 


TS 
En 
Co 
TRUC 


13b) Dans R”, toute suite dans un compact admet une sous-suite convergente, théorème 
10.55. La démonstration de ce théorème est non seulement plus compliquée que le 
cas général, mais utilise en plus le cas dans R ; lequel cas n’est pas démontré de 
façon directe dans le Frido. 


(13c) Un espace métrique est compact si et seulement si toute suite contient une sous-suite 
convergente. C’est le théorème de Bolzano-Weierstrass 7.136. La démonstration de 
ce théorème est indépendante. 


(14) Une fonction continue sur un compact est bornée et atteint ses bornes, théorème 7.138. 


(15) Une fonction continue sur un compact y est uniformément continue, théorème de Heine 
12:81; 


(16) Une bijection continue f: K — X entre un compact et un séparé est un isomorphisme, 
1.212: 


Produits de compacts À propos de produits de compacts. C’est un compact dans tous les cas 


métriques l?. 


(1) Les produits d'espaces métriques compacts sont compacts. Il s’agit du théorème de 
Tykhonov que nous verrons ce résultat dans les cas suivants. 


— KR, lemme 10.21. 

— Produit fini d'espaces métriques compacts, théorème 7.299. 

— Produit dénombrable d'espaces métriques compacts, théorème 7.301. 
Composante connexe À propos de composantes connexes et de compacts. 


(1) Si À est compact dans ©, alors la partie C\X possède exactement une composante 
connexe non bornée. Lemme 26.49. 


THEooPUIIo&HIBU84 
Thème 33 : densité 


(1) Densité de Q dans R, proposition 10.16. 

(2) Densité des polynômes dans (c°(1o, 1]), ll), théorème de Bernstein 36.168, ou une consé- 
quence de Stone-Weierstrass 12.428. 

Densité des polynômes dans (C°(1),|.|+) lorsque 1 = [a,b], corolaire 36.169. 

Densité de Z(RŸ) dans LP(RŸ) pour 1 < p < ©, théorème 27.50. 

Densité de .7(R) dans l’espace de Sobolev H*(R1), proposition 31.15. 


Densité de Z(R1) dans l’espace de Sobolev H*(R‘), proposition 31.17. 
Cela est utilisé pour le théorème de trace 31.19. 


(7) Les applications étagées dans les applications mesurables (qui plus est avec limite croissante), 
théorème fondamental d’approximation 27.53. 


(8) Les fonctions continues à support compact dans Z?(1), théorème 27.54. 


12. Définition 1.21. 
13. Si vous connaissez des exemples non métriques de produits de compacts qui ne sont pas compacts, écrivez-moi. 
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(9) Les polynômes trigonométriques sont denses dans LP(S1) pour 1 < p < 00. Deux démonstra- 
tions indépendantes par le théorème 28.8 et le théorème 27.81. 


Les densités sont bien entendu utilisées pour prouver des formules sur un espace en sachant qu’elles 
sont vraies sur une partie dense. Mais également pour étendre une application définie seulement 
sur une partie dense. C’est par exemple ce qui est fait pour définir la trace +0 sur les espaces de 
Sobolev H*(R4) en utilisant le théorème d’extension 17.130. 

Comme presque tous les théorèmes importants, le théorème de Stone-Weierstrass possède de 
nombreuses formulations à divers degrés de généralité. 


— Le lemme 12.424 le donne pour la racine carré. 


— Le théorème 12.430 donne la densité des polynômes dans les fonctions continues sur un 
compact. 


— Le théorème 12.427 est une généralisation qui donne la densité uniforme d’une sous-algèbre 
de C(X,R) dès que X sépare les points. 


— Le théorème 12.428 donne le même résultat pour la densité dans C(X, ©). 
— Le lemme 28.1 est une version pour les polynômes trigonométriques. 


— Le lemme 12.424 est un cas particulier du théorème 12.430, mais nous en donnons une 
démonstration indépendante afin d'isoler la preuve de la généralisation 12.428. Une version 
pour les polynômes trigonométriques sera donnée dans le lemme 28.1. 


Le théorème de Stone-Weierstrass est utilisé, entre autres nombreuses choses, pour prouver la 
densité des polynômes trigonométriques dans les fonctions continues sur $!, voir la proposition 
27.98. 


THEMEooUXNQoGHEGEGZ 
Thème 34 : application réciproque 


(1) Définition 7.203. 

Dans le cas des réels, des exemples sont donnés en 10.9. 
Continuité, théorème de la bijection 12.54. 

Continuité de la réciproque pour f: K — X, lemme 7.213. 


Si f est strictement monotone sur un intervalle, son inverse est continue, théorème de la 
bijection 12.54. 


(6) Théorème de la bijection 12.54 (qui contient aussi de la continuité). 
(7) Dérivabilité, proposition 12.180. 


(8) Une application continue est injective si et seulement si elle est strictement monotone, lemme 
12:51. 


THEMEoo YCBUoSEHGBE 
Thème 35 : applications continues et bornées 


(1) Application continue, définition 7.32. 


(2) Une application linéaire non continue : exemple 11.63 de ex + key. Les dérivées partielles 
sont calculées en (25.156). 


(3) La dérivation sur les polynômes (exemple 11.64) donne un autre exemple d’application li- 
néaire non continue. 


(4) Une application linéaire est bornée si et seulement si elle est continue, proposition 11.62. 
(5) Une forme sesquilinéaire est bornée si et seulement si elle est continue, proposition 25.2. 


THMooUCXToGNKENT3E 
Thème 36 : suite de Cauchy, espace complet Nous parlons d'espaces topologiques complets. 
À ne pas confondre avec un espace mesuré complet, définition 14.65. 


(1) Corps complet : définition 1.367(5), espace métrique complet : définition 7.253. 
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(2) L'image d’une suite de Cauchy est de Cauchy. Si (x,) est de Cauchy, alors ( Î (tn) est de 
Cauchy quand f est une isométrie, lemme 17.134. 


(3) La définition 7.252 donne la notion de suite de Cauchy dans un espace métrique. 
(4) La définition 7.250 donne la notion de suite de r-Cauchy dans un espace vectoriel topologique. 


(5) Deux espaces métriques (avec une distance) peuvent être isomorphes en tant qu’espaces 
topologiques, mais ne pas avoir les mêmes suites de Cauchy, exemple 7.256. 


(6) La proposition 7.258 donne l’équivalence entre les suites de Cauchy et les suites 7-Cauchy 
dans le cas des espaces vectoriels topologiques normés. 


(7) L'exemple 7.256 est un exemple pire que simplement une suite de Cauchy qui ne converge 
pas. Le problème de convergence de cette suite n’est pas simplement que la limite n’est pas 
dans l’espace ; c’est que la suite de Cauchy donnée ne convergerait même pas dans R. 


(8) Le théorème 17.138 est un théorème de complétion d’un espace métrique. 
(9) Dans R, une suite est convergente si et seulement si elle est de Cauchy, théorème 7.272(2). 
(10) Toute suite convergente dans un espace métrique est de Cauchy, proposition 7.259. 


Quelques espaces qui sont complets sont listés ci-dessous. Attention : la complétude est bien 
une propriété de la métrique ; le même ensemble peut être complet pour une distance et pas pour 
une autre. Souvent, cependant la distance à considérer est donnée par le contexte. 


(1) Les réels R, théorème 7.272. sont complets. 


(2) Les complexes C, proposition 7.274. (5) Le lemme 12.370 dit que (C°(4, B), |.|æ) 
est complet dès que À est compact et B 


(3) Un espace vectoriel normé sur un corps 
est complet. 


complet est complet, proposition 7.278. 

(6) L'espace Z(K) est complet tant pour la 
topologie des seminormes l que pour la 
topologie métrique (qui sont les mêmes). 
C’est la proposition 30.29. 


(4) La proposition 12.369 donne quelques es- 
paces complets. Soit X un espace topolo- 
gique métrique, (Y, d) un espace métrique 
complet. Alors les espaces mL 2 , . 

’espace est complet et métrisable 

(4) (AS Fe I.) par la proposition 30.81. 

(4b) (COCA, Y), |) (8) L'espace LP(Q,A,u) par le théorème 

(4c) (CÉ(X, Y), |.) 27.43. 


La limite uniforme d’une suite de fonctions dérivables n’est pas spécialement dérivable. Même 
si les fonctions sont de classe C®, la limite n’est pas spécialement mieux que continue. En effet, le 
théorème de Stone-Weierstrass 12.430 nous dit que les polynômes (qui sont C'©) sont denses dans 
les fonctions continues sur un compact pour la norme uniforme. Vous ne pouvez donc pas espérer 
que (CP(X,Y),|.|æ) soit complet en général. 

THTOC37 
Thème 37 : caractérisations séquentielles Diverses caractérisations séquentielles. 
continuité Des résultats de continuité séquentielle. 


(1) Fonction séquentiellement continue, définition 7.199. Dans un espace métrisable séparé, 
la continuité séquentielle est équivalente à la continuité, proposition 7.245. 


(2) Quand une topologie est donnée par un ensemble dénombrable de seminormes, il est 
métrisable, proposition 7.335. 


(3) La continuité implique la continuité séquentielle, proposition 7.201 et corolaire 7.129. 
(4) Une version spéciale pour R’”? est donnée par le théorème 12.222. 
fermeture Fermeture séquentielle, proposition 7.242. 


compacité Un espace topologique séquentiellement compact : toute suite possède une sous-suite 
convergente, définition 7.84. 


14. Seminorme, définition 7.311, et la topologie des seminormes est la définition 7.327. 
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THEMEooYEVLoGNGOGH& 
Thème 38 : valeurs propres, définie positive 


À propos de valeurs propres (1) Définition des valeurs propres d’une forme quadratique : 
définition 9.248. 


(2) Définition de valeur propre et vecteur propre pour un endomorphisme f: VW — V, 
définition 9.83. 


À propos de choses définies positives (1) Une application bilinéaire est définie positive lorsque 
g(u,u) > 0 et g(u,u) = 0 si et seulement si u = 0 est la définition 9.124. 


(2) Un opérateur ou une matrice est défini positif si toutes ses valeurs propres sont positives, 
c’est la définition 9.224. 


(3) Pour une matrice symétrique, définie positive si et seulement si {Ax,x) > 0 pour tout 
x. C’est le lemme 9.228. 


(4) Une application linéaire est définie positive si et seulement si sa matrice associée l’est. 
C’est la proposition 9.229. 


Remarque : nous ne définissons pas la notion de matrice définie positive dans le cas d’une 
matrice non symétrique. 


THEMEoo0JJFo6NM6a82 
Thème 39 : norme matricielle, norme opérateur et rayon spectral Quelques définitions 


(1) Définition de la norme opérateur : définition 11.51. 
(2) Définition du rayon spectral 11.57. 


La norme matricielle n’est rien d’autre que la norme opérateur de l’application linéaire donnée 
par la matrice. 


(1) Lien entre norme matricielle et rayon spectral, le théorème 12.120 assure que | A2 = 4/p(AtA). 


(2) Lien entre valeurs propres et norme opérateur : le lemme 12.121 pour les matrices symétriques 
strictement définies positives donne | A2 = Anar. 


(3) Pour une matrice diagonale, |D|2 = max{|À;|}, lemme 12.122. 
(4) Pour toute norme algébrique nous avons p(A) < | A|, proposition 12.114. 


(5) Dans le cadre du conditionnement de matrice. Voir en particulier la proposition 34.110 qui 
utilise le théorème 12.120. 


(6) Rayon spectral et convergence de méthode itérative, proposition 34.148. 
Pour la norme opérateur nous avons les résultats suivants. 


La majoration | Au] < |A||ul est le lemme 11.59. 
Définition d’une algèbre : 1.340 et pour une norme d’algèbre : 11.56. 
La norme opérateur est une norme d’algèbre, lemme 11.61. 


Pour des espaces vectoriels normés, être borné est équivalent à être continu : proposi- 
tion 11.62. 


(5) Le lemme à propos d’exponentielle de matrice 15.152 donne : 
T 
le'4] < PH) D etre0). 
i=1 


La norme opérateur est utilisée pour donner une norme sur les produits tensoriels, définition 
112219: 

Une norme matricielle donne une topologie. Il y a donc également des liens entre rayon spectral 
et convergence de série. Dans cette optique, pour les séries de matrices, voir le thème 40. 
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THEME00PQKDoGHAUREH 
Thème 40 : série de matrices 


(1) Rayon spectral et norme opérateur : thème 39. 
(2) Exponentielle de matrices : thème 49. 
(3) Série entière de matrices : section 15.13. 
(4) Pour la série 3, A* = (1 — A)-!. 
— Pour un espace de Banach : proposition 11.261. 
— Pour les matrices nilpotentes : proposition 9.208. 
— En lien avec le rayon spectral (si et seulement si p(A) < 1) dans la proposition 15.148. 
— Le lemme 15.47 parle de la série entière 3,0 24 = (1— 2*#)-1. 


Cette série est utilisée entre autres dans la proposition 34.168 pour prouver qu’une M-matrice 
irréductible vérifie A1 > 0. 


DECooWTAIoGNEUGES 
Thème 41 : décomposition de matrices 


(1) Décomposition de Bruhat, théorème 13.39. 
(2) Décomposition de Dunford, théorème 9.250. 


(3) Décomposition polaire 13.32 des matrices symétriques et la proposition 17.60 pour la régu- 
larité. 
THTOC42 
Thème 42 : systèmes d’équations linéaires 


— Algorithme des facteurs invariants 4.113. 


— La méthode du gradient à pas optimal permet de résoudre par itérations Ax = b lorsque À 
est symétrique strictement définie positive. Il s’agit de minimiser une fonction bien choisie. 
Propositions 17.116 pour l'existence et 17.117 pour la méthode. 


THTOC43 
Thème 43 : réduction, diagonalisation Des résultats qui parlent diagonalisation 


(1) Définition d’un endomorphisme diagonalisable : 9.209. 


(2) Conditions équivalentes au fait d’être diagonalisable en termes de polynôme minimal, y 
compris la décomposition en espaces propres : théorème 9.213. 


(3) Diagonalisation simultanée 9.216, pseudo-diagonalisation simultanée 11.37. 
(4) Diagonalisation d’exponentielle 15.130 utilisant la décomposition de Dunford. 


(5) Décomposition polaire théorème 13.32. M = SQ, S est symétrique, réelle, définie positive, 
Q est orthogonale. 


(6) Décomposition de Dunford 9.259. u = s + n où s est diagonalisable et n est nilpotent, 
[s,n] = 0. 


(7) Réduction de Jordan (bloc-diagonale) 9.289. 


(8) L’algorithme des facteurs invariants 4.113 donne U = PDQ avec P et Q inversibles, D 
diagonale, sans hypothèse sur U. De plus les éléments de D forment une chaine d'éléments 
qui se divisent l’un l’autre. 


Le théorème spectral et ses variantes : 


(1) Théorème spectral, matrice symétrique, théorème 9.221. Via le lemme de Schur complexe 
12100! 


(2) Théorème spectral autoadjoint (c’est le même, mais vu sans matrices), théorème 11.6 
(3) Théorème spectral hermitien, lemme 11.18. 


(4) Théorème spectral, matrice normales, théorème 12.102. 
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Pour les résultats de décomposition dont une partie est diagonale, voir le thème 41 sur les décom- 
positions. Réduction de quadriques : 


(1) Réduction de Gauss, théorème 9.235. 
Trigonalisation. 


(1) Le lemme de Schur complexe 12.100 dit que toute matrice est unitairement équivalente à une 
matrice triangulaire suppérieure. 


THMooUXJMo®HF6RkÆ 
Thème 44 : déterminant 


(1) Déterminant d’une matrice : définition 4.78. 
) Déterminant d’un endomorphisme 9.12. 
) Le lemme 11.5 donne la formule det(f) = Yes, e(o)][-1<eoti f(ei)) 
4) Principales propriétés algébriques du déterminant : la proposition 9.13. 
) 


La formule det(AB) = det(A) det(B) est la proposition 9.243 pour des matrices et la propo- 
sition 9.13(1) pour les applications linéaires. 


(6) Déterminant et manipulations de lignes et colonnes, section 4.3.11 et les propositions qui 
précèdent à partir du lemme 4.80 qui dit que det(A) = det(Af). 


(7) Les n-formes alternées forment un espace de dimension 1, proposition 9.7. 
(8) Déterminant d’une famille de vecteurs 9.8. 

(9) Calcul d’un déterminant de taille 2 x 2 : équation (4.104). 

) Interprétations géométriques 


(10a) À propos d’orthogonalité, le déterminant est très lié au produit vectoriel en dimension 3. 
Et il le généralise en dimension supérieure. 


(10a.i) Liaison au produit vectoriel (orthogonalité) dans la proposition 11.34. 
(10ai) En particulier le lemme 11.35 nous dit comment un déterminant donne un vecteur 
orthogonal à une famille donnée de vecteurs. 
(10b) Déterminant et aires, volumes 
(10b.ü) Déterminant et mesure de Lebesgue : théorème 14.280. 


(10b.ü) Aire du parallélogramme : il y a la formule avec le produit vectoriel dans la propo- 
sition 18.55, mais l’aire proprement dite, avec une intégrale est dans la proposition 
20.25. 


(10b.üi) Volume du parallélépipède avec le produit mixte et le déterminant 3 x 3, 18.56. 


Tant que nous en sommes dans les interprétations géométriques, il faut lier déterminant, 
produit vectoriel, orthogonalité et mesure en notant que l’élément de volume lors de l’inté- 
gration en dimension 3 est donné par (20.181) : dS = |T, x T,| qui est la norme du produit 
vectoriel des vecteurs tangents au paramétrage. 

Nous voyons dans l’équation (20.178) que l’élément de volume pour une partie de dimension 
n dans R”? (à l’occasion d’y intégrer une fonction) est donné par un déterminant mettant en 
jeu les vecteurs tangents du paramétrage. 


(11) Le déterminant de Vandermonde est à la proposition 9.15. Il est utilisé à divers endroits : 


(11a) Pour prouver que u est nilpotente si et seulement si Tr(uw?) = 0 pour tout p (lemme 
9.205) 


(11b) Pour prouver qu’un endomorphisme possédant dim(Æ) valeurs propres distinctes est 
cyclique (proposition 9.295). 
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THEMooNMYKoGHY8GÆ5 
Thème 45 : espaces de fonctions En ce qui concerne les densités, voir le thème 33. 


(1) C?(A) est l’ensemble des fonctions de classe C® sur A. Les éléments de C'?(A) peuvent être 
à valeurs dans R ou dans € selon le contexte. 


(2) Z(A) est l’ensemble des fonctions de classe C® dont le support est un compact dans À. 


Pour les ensembles .7(A), Z(A) et LP(A), les fonctions sont à valeurs dans C. La raison est que, 
de toutes façons, le passage à la transformée de Fourier produit en général des fonctions à valeurs 
dans € même si les fonctions de départ sont à valeurs dans KR. 


Topologie Les espaces de fonctions sont souvent munis de topologies définies par des semi- 
normes !°. 
(1) La topologie des seminormes est la définition 7.311. 
(2) La définition 30.16 donne les topologies sur C?°(Q), Z(K) et Z(Q). 
(3) La topologie +-faible sur Ÿ'(Q) est donnée par la définition 30.32. 
(4) pkm(f) = Eyjem l0 fx est une seminorme sur C7(Q), proposition 30.10. 
L’espace L?([0, 2x]) C’est un espace très important, entre autres parce qu'il est de Hilbert et est 
bien adapté à la transformée de Fourier. 
(1) Un rappel de la construction en 27.83. 
(2) Le produit scalaire ! (f, g) est donné en (27.466) et la base trigonométrique est (27.467). 


(3) La densité des polynômes trigonométriques dans LP(S?) est le théorème 27.81 ou le 
théorème 28.8, au choix. 


(4) Une conséquence de cette densité est que le système trigonométrique est une base hil- 
bertienne !7 de L? par le lemme 27.124. 


L'espace L? est discuté en analyse fonctionnelle, dans la section 27.6 et les suivantes parce 
que l'étude de L? utilise entre autres l'inégalité de Hôlder 27.33. 
Le fait que L? soit un espace de Hilbert est utilisé dans la preuve du théorème de représen- 
tation de Riesz 27.169. 
Si (Q,.4, u) est un espace mesuré, alors LP(Q, À, ui) est un espace de Banach; c’est le théorème de 
Riesz-Fischer 27.44. 


THTOC46 
Thème 46 : fonctions Lipschitz 


(1) Définition : 12.327. 
(2) La notion de Lipschitz est utilisée pour définir la stabilité d’un problème, définition 34.26. 
(3) Toute fonction Lipschitz est uniformément continue, proposition 12.332. 


THTOCA47 
Thème 47 : suites et séries 


Opérations sur les suites (1) Les limites xx + yy — x + y et xx — Àx sont la proposition 
1:195: 


(2) La limite xgyx — æy est la proposition 10.27. 


Suites La proposition 10.26 donne une caractérisation de limite de suite dans un espace vectoriel 
normé. 


(1) Les suites adjacentes, c’est la définition 10.39. 


(2) Les séries alternées, théorème 11.127. Il s’agit de dire que D ot—1)far converge quand 
ax est décroissante et tend vers zéro. 


15. Définition 7.311. 
16. Produit scalaire, définition 9.164. 
17. Définition 25.27. 
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Le concept de suite adjacente sert à étudier la série de Taylor de In(x+1), voir le lemme 
15.99 et ce qui l'entoure. 


La définition de la convergence absolue est la définition 11.81. 
Une suite réelle croissante et majorée converge, proposition 10.35. 
Toute suite dans un compact admet une sous-suite convergente, théorème 7.275. 


Pour tout réel, il existe une suite croissante de rationnels qui y converge, proposition 
TO LT. 


Produit de Cauchy (1) Dans une algèbre normée, proposition 11.95, 


(2) 


Dans C, théorème 15.32. 


Calcul de suites (1) Somme : æ» + Yyn — x + y est la proposition 10.28. 


Série Les séries sont en général dans la section 11.7. 


(1) 


(2) 
(3) 


(4) 
(5) 


Sommes 


( 
( 
( 
( 


Quelques séries usuelles en 11.9.3 : série harmonique, géométrique, de Riemann, et la 
mythique arithmético-géométrique. 


la) La série est associative : D (ax + bx) = D ax + DL bk. C’est la proposition 11.91. 
1b) La série harmonique diverge : X}, À = 0, exemple 11.120. 


1-27, proposition 11.122. 


ic) La série géométrique : NE g° = 
14) Une autre cool série : D, EEE L =: lemme 11.126. 
Critère des séries alternées, théorème 11.127. 


Convergence d’une série implique convergence vers zéro du terme général, proposi- 
tion 11.89. 


Dans une algèbre normée : (DE 9 ax)b = Yj_o(axb), proposition 11.94. 
Produit de Cauchy : théorème 15.32 et proposition 11.95. 


infinies En ce qui concerne les sommes finies, la notation ÿ ;_, est définie en 1.84. Pour 


permuter les termes d’une somme avec un élément du groupe symétrique, nous avons la 
proposition 1.303. 


Voici quelques résultats à propos de sommes infinies. 


(1) 


(6) 


Une somme indexée par un ensemble quelconque est la définition 11.99. 
La proposition 11.103 donne une caractérisation pour le sommes de réels positifs. 
La définition de la somme d’une infinité de termes est donnée par la définition 11.78. 


Une somme de termes positifs indexée par un ensemble indénombrable est toujours 
infinie par le lemme 11.109. 


si la série converge, on peut regrouper ses termes sans modifier la convergence ni la 
somme (associativité) ; pour les sommes infinies l’associativité et la commutativité dans 
une série sont perdues. Néanmoins, il subsiste que 


(5a) si la série converge absolument, on peut modifier l’ordre des termes sans modifier 
la convergence ni la somme (commutativité, proposition 11.97). 


Permuter une somme infinie avec une application linéaire : f(D 7 wi) = Der f(vi), c'est 
la proposition 11.114. 


Série entières (1) Rayon de convergence, définition 15.12. 


(2) 
(3) 


(4) 


Convervence absolue à l’intérieur du rayon de convergence, lemme d’Abel 15.18. 


La fonction définie par la série entière z + LS änz” est holomorphe dans son disque 
de convergence par la proposition 15.42. 
1 


= sont dans le lemme 15.47. 


La série entière pour -L+, pour et pour 
1—2k 


1 
(w—2)5 
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THTOC48 
Thème 48 : suite de fonctions 


(1) Une limite uniforme de fonctions continues est continue, proposition 12.368. 
(2) Sous certaines hypothèses, si f; — f, alors f? — f', théorème 12.384. 


(3) Siles fx sont continues et si la convergence Ÿ , fx est uniforme, alors la somme est continue, 
théorème 12.380. 
THEMEooKXSGoGEH5QU4y% 
Thème 49 : exponentielle Toutes les exponentielles sont définies par la série 


exp(x -ù … 


tant que la somme a un sens. 
Réels Voici le plan que nous suivons dans le Frido : 
— L’exponentielle est définie par sa série en 15.59. 


— Nous démontrons qu’elle vérifie l'équation différentielle y = y, y(0) = 1 (théorème 
15.75). 


— Nous démontrons l’unicité de la solution à cette équation différentielle. 


— Nous démontrons qu’elle est égale à x > y(1)*. Cela donne la définition du nombre e 
comme valant y(1). 


— Nous définissons le logarithme comme l’application réciproque de l’exponentielle (déf- 
nition 15.81). 


— Les fonctions trigonométriques (sinus et cosinus) sont définies par leurs séries. Il est 
alors montré que e"? = cos(x) + isin(x) (lemme 18.11). 


Propriétés 

— La formule a * = 1/a° est la proposition 12.408(3). 

— exp(x) = e”, proposition 15.78. 

— Nous avons l'encadrement 2.5 < e < 3, lemme 15.79. 

— Le nombre e est irrationnel, proposition 15.80. 
Complexes (1) La définition de exp(a + 4b) est la définition 15.59. 


Zz+w 


(2) Les principales propriétés, dont e = ee", sont dans la proposition 18.9. 


(3) Nous avons ef? = eŸ si et seulement si il existe & € Z tel que y = x + 2kr, corolaire 
18.24. 
(4) Le fait que e/? donne tous les nombres complexes de norme 1 est la proposition 18.61(1). 
(5) Le groupe des racines de l’unité est donné par l’équation (19.1). 
Algèbre normée commutative Pour la définition c’est la proposition 15.59 et pour la régularité 
C® c’est la proposition 15.64. 
Idem non commutatif Il y a une tentative de théorème 15.65, mais c’est principalement pour 
les matrices qu'il y a des résultats. 
Matrices De nombreux résultats sont disponibles pour les exponentielles de matrices. 


e“AetA = e(S##)A, proposition 15.69. 


Si À est une matrice, alors (et A)'(u) = Ae“4, proposition 15.71. 


) 

) 

) Les sections 11.14 et 15.5.3 parlent d’exponentielle de matrices. 

) L’exponentielle donne lieu à une fonction de classe C®, proposition 15.149. 
) 


TR R TR TR 
Co 


(SA) 


Le lemme à propos d’exponentielle de matrice 15.152 donne : 


T 

A tRe(;) 

le4] < (14) De r* 
i=1 
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(6) La proposition 15.130 : si À € Mn, R) a un polynôme caractéristique scindé, alors À 
est diagonalisable si et seulement si e est diagonalisable. 


(7) La section 15.13.3 parle des fonctions exponentielle et logarithme pour les matrices. 
Entre autres la dérivation et les séries. 


Pour résoudre des équations différentielles linéaires : sous-section 32.6.1. 


La proposition 15.129 dit que l’exponentielle est surjective sur GL(n, C). 


Calcul effectif : sous-section 15.13.4. 
Proposition 13.23 : si À e M(n, C) alors e (4) = det(e4). 


(13) Les séries entières de matrices sont traitées autour de la proposition 15.146. 


) 
) 
10) La proposition 11.264 : si u est un endomorphisme, alors exp(u) est un polynôme en u. 
) 
) 


Paramétrisation du cercle (1) La proposition 18.61 parle des propriétés de 


@: ]0,27[ — S! 


t 


. -2.2 
ti e". #2) 


THTOC50 


Thème 50 : logarithme 


(1) 


Le logarithme pour les réels strictement positifs In: [0,00[ — IR est donné en la défini- 
tion 15.81 ; c’est l’application réciproque de exp. 
Les principales propriétés sont dans la proposition 15.84 : In(xy) = In(x) + In(y) etc. 


Dérivée : In’(x) = À, proposition 15.83. 


La proposition 15.100 donne la série 


STE 
In(1 = À", -2.3 
n(1+x) » PE (-2.3) 
k=1 
L'exemple 20.146 donne l'encadrement 0.644 < In(2) < 0.846. 
La proposition 15.129 dit que toute matrice complexe admet un logarithme. En particulier 
une série explicite est donnée pour le logarithme d’un bloc de Jordan !?. 
Sur les complexes, le logarithme In: C* — € est la définition 26.29. Attention : ce n’est pas 
la seule définition possible. 
La série harmonique diverge à vitesse logarithmique, et la série des inverses des nombres 
premiers, c’est encore plus lent : théorème 15.118. 
Détermination du logarithme le long d’un chemin dans C, définition 26.45. 
Un logarithme continu d’une fonction, définition 26.44. 
Théorème de Borsuk 26.47 : il y a toujours un logarithme continu le long d’un chemin 


homotope à une constante (et il y a même équivalence avec admettre une extension sur C*). 


J 
T+2 


Si ze C, nous avons [dx = In(x + 2), proposition 26.42. 


La proposition 26.58 dit qu'une application f a un logarithme continu si et seulement si 
Ind{f o 7,0) = 0. 


THEMEooBSBLoëNTaQ5R 


Thème 51 : fonction puissance Il y a beaucoup de choses à dire... 


Définition Nous considérons, pour a > 0, la fonction g,: R — R donnée par g(x) = a*. La 


définition de cette fonction se fait en de nombreuses étapes. 
(1) a” pour ne N en la définition 1.200. 
(2) a” pour ne Z en la définition 12.388. 


18. Jordan, théorème 9.289. 
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(3) a!" pour ne Z en la définition 12.391. 

(4) a? pour q € À en la définition 12.391. 

(5) {x en la définition 12.393. 

(6) La fonction g, est Cauchy-continue sur Q, c’est la proposition 12.405. 

(7) a* pour a > 0etxeR en la définition 12.407. 
(8) a° pour a > 0et ze C en la définition 18.5. 

Quelques propriétés (1) Pour tout ge Q, il y a un ./q dans R, proposition 1.457. 
(2) Pour a > 0 et x,y€ R nous avons a*a* = a**Ÿ, proposition 12.408. 
(3) Sia>0etx,yeR nous avons (a°)” = (a”)* = a*Ÿ par la proposition 12.418. 
(4) Si a > 0, alors x + x* est strictement croissante pour x > 0, proposition 12.413. 
(5) La formule a-* = 1/a” est la proposition 12.408(3). 
(6) La fonction puissance g,(x) = a” est continue, proposition 12.408. 


Croissance (1) La fonction puissance f,(x) = x°® est strictement croissante pour les x > O, 
proposition 12.413 


(2) La fonction puissance g,(x) = a” est strictement croissante, proposition 12.408. 

(3) lims-_,0 2° = ©, proposition 12.419. 
Continuité, Dérivation Comme toutes les choses sur la fonction puissance, les preuves sont 

assez différentes selon que l’on parle de a° ou de x“. 

(1) La fonction f,(x) = x° est continue, proposition 12.417. 
(2) La fonction a” est dérivable et sa dérivée vérifie g, (x) = g(x)g, (0), proposition 12.435. 
(3) La formule de dérivation pour x + x1 avec q € Q est la proposition 12.445. 
(4) 


La dérivation de x + x* avec à € R est la proposition 14.271. Si elle est tellement loin, 
c’est parce qu’elle nécessite de permuter une limite de fonctions avec une dérivée. 


(5) Pour la formule générale de dérivation de x + a” demande de savoir les logarithmes 
(proposition 15.93). 


L’équation fonctionnelle L’exponentielle et plus généralement la fonction puissance ga(x) = a” 
peut être introduite au moyen d’une équation fonctionnelle au lieu de l’équation différentielle 
usuelle. Cette fameuse équation fonctionnelle est 


f(x + y) = f(x) f(y) (-2.4) 
en la définition 12.437. 


(1) L'équivalence entre l’équation fonctionnelle et l’équation différentielle est donnée par la 
proposition 12.443. 


(2) La fonction g(x) = a* vérifie l'équation fonctionnelle ga(x + y) = Ja(t)ga(y) et les 
conséquences. C’est la définition 12.437 et les choses qui suivent. 


(3) L'équation fonctionnelle pour une fonction continue f: IR — S! est traitée dans la 
proposition 12.447. 
Une définition alternative de la fonction puissance serait de poser directement 


a? = e? In(a) | 


De là les propriétés se déduisent facilement. Dans cette approche, les choses se mettent dans l’ordre 
suivant : 
— Définir exp(x) par sa série pour tout x. 


— Démontrer que exp(q) = exp(1)? pour tout rationnel q (première partie de la proposition 
15.78). 


— Définir e = exp(1). 
— Définir, pour x irrationnel, a° = exp(x In(a)). 


— Prouver que e* = exp(x) pour tout x. 
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THEMEooMKLBoGHGECaR 


Thème 52 : sommation finie et infinie La définition du symbole ÿ,,, se fait en trois étapes 
et deux demi, chacune se basant sur la précédente. 


(1) Si (A, +) est un ensemble avec une loi de composition interne, Y 7, &i est en 1.84. 
(2) Si I est fini et si est à valeur dans un groupe commutatif, D, f(i) est 1.302. 


(3) Enfin si Z est un ensemble quelconque, la définition 11.99 introduit la notion de famille 
sommable dans un espace vectoriel normé. 


(4) Si (ay) est une suite dans un espace vectoriel normé, la somme YF, ax est avec les sommes 
partielles dans la définition 11.78. 


(5) La somme au sens de Cesàro est la somme des moyennes partielles, définition 11.128. 


Notez que » ax n’est pas un cas particulier de Ÿ;-n ax. Une différence de taille entre les deux 
est que pour que D 0 ax existe, il suffit que les ax puissent être sommés dans cet ordre. À l'inverse 
pour que den @& existe, il faut que l’ordre de sommation puisse être arbitraire. 


Si vous voulez sommer des séries encore moins convergentes, vous pouvez avoir envie d'utiliser 
la supersomme|2|. 


THTOC53 
Thème 53 : polynôme de Taylor 


Énoncés Il existe de nombreux énoncés du théorème de Taylor, et en particulier beaucoup de 
formules pour le reste. 
(1) Énoncé : théorème 12.455. 
(2) Une majoration du reste est dans le théorème 15.53 
(3) De classe C? sur R”, proposition 12.462. 
(4) Avec un reste donné par un point dans |x, a[, proposition 12.466. 
(5) Avec reste intégral, proposition 20.147 et théorème 20.144 pour le cas simple R — R. 


(6) Le polynôme de Taylor généralise à l’utilisation de toutes les dérivées disponibles le 
résultat de développement limité donné par la proposition 12.172. 


(7) Pour les fonctions holomorphes, il y a le théorème 26.76 qui donne une série de Taylor 
sur un disque de convergence. 


Utilisation Des polynômes de Taylor sont utilisés pour démontrer des théorèmes par-ci par-là. 


(1) Il est utilisé pour justifier la méthode de Newton autour de l'équation (34.95). 


(2) On utilise pas mal de Taylor dans les résultats liant extrémum et différentielle/hessienne. 
Par exemple la proposition 17.73. 


Quelques développements Voici quelques développements limités à savoir. [ls sont calculables 
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en utilisant la formule de Taylor-Young (proposition 12.471). 


k 
é = . _. + x'a(x) ordre n, proposition 15.95 
k=0 
D 2p+1 
cos(x) = >. EI + zPtla(x) ordre 2p + 1, proposition 18.75 
k=0 : 
(=D) rer _——. 
sin(x) = + 2 PT a(x ordre 2p + 1, proposition 18.75 
(x) di Er+ mi (x) p + 1,prop 
(=D à : . 
n(1+x) = > Ne md: a(x)x ordre n, proposition 15.98 
k=1 
à (1) 
m(1 + x) = > + exact proposition 15.100 
k=1 
8 (1j 
In(2) = », pe — exact proposition 15.100 
k=1 
fi 
(1+ x) = . é af exact si | est entier. 
k=0 
A (1)... (—k+1 
(+zx) =1+ . A a ) + z'a(x) ordre n. 
— k! 


Dans toutes ces formules, la fonction a: R — R vérifie lims_,0 a(t) = 0. 
Le développement limité en 0 d’une fonction paire ne contient que les puissances de x d’ex- 
posant pair. Voir comme exemple le développement de la fonction cosinus. 


INTERNooXFNTO&NW8U0zB 
Thème 54 : formule des accroïissements finis Il en existe plusieurs formes : 


(1) Une version adaptée aux espaces normés de dimension finie, avec hypothèse de différentiabi- 
lité, est le théorème 12.325. La formule | f(b) — f(a)|n < Supseta,g dx lc Rr,Rr)|0 — am. 


(2) Une version pour les dérivées partielles est dans le lemme 12.250. Pour rappel, la définition 
de la dérivation partielle est 12.231. 


(3) La formule f(a + ee;) = f(a) + e(@;f)(a) + ea(e), proposition 12.251. 


(4) L'existence de c € Ja, b[ tel que 


ro = 100 (26) 


est le théorème des accroissements finis proprement dit. C’est le théorème 12.195. 


(5) Il existe un c entre a et b tel que 
F(b) = f(a) +(b—a)(d8f)(c) (-2.7) 


où B = b— a est la proposition 12.249. 
(6) La formule f(a+h) = f(a)+hf'(a) +a(h) pour une fonction R — R en le théorème 12.172. 
(7) Une généralisation pour les intervalles non bornés : théorème 12.196. 
(8) Espaces vectoriels normés, théorème 11.254 


THTOC55 
Thème 55 : dérivation 


(1) Définition de la dérivée, définition 12.164. 
(2) 
(3) Dérivée partielle de fonction composée, théorème 12.313. 
(4) f(Ax) = Xf'(x), lemme 12.178. 


Dérivée de fonction composée, proposition 12.184 dans le cas réel. 
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THTOC56 
Thème 56 : différentielle 


Généralités (1) La différentielle est définie en général pour des espaces vectoriels normés par la 
proposition 11.226 


(2) Différentielle d’une application linéaire, lemme 11.234. 


(3) Nous parlons de différentielle en dimension finie et donnons une interprétation géomé- 
trique en 12.22.1. 


(4) La recherche d’extrémums d’une fonction sur IR” passe par la seconde différentielle, 
proposition 17.73. 


(5) Lien entre différentielle seconde (hessienne) et convexité en la proposition 17.100 et le 
corolaire 17.101. 


(6) La différentielle est liée aux dérivées partielles par les formules données au lemme 12.268 


of d RE 
dat) = 0 = fa +H)) = Due 


(a) = Via) - ü. (-2.8) 
2 

Je ne vous cache pas que cette suite d’égalités est une de mes préférées. 
Différentielle et dérivées partielles À propos de fonctions de classe C*, définition 11.227. 


(1) Une fonction est de classe C1 si et seulement si ses dérivées partielles sont continues, 
théorème 12.306. 


(2) Une fonction est C” si et seulement si ses dérivées partielles sont C1, c’est le théorème 
12.341. 


(3) Différentiabilité en un seul point si les dérivées partielles sont continues en ce point : 
proposition 12.304. 


Fonctions composées À propos de la formule d{f o g)a = d9f(a) © dfa; il Y à deux théorèmes très 
semblables. 


(1) Le théorème 11.241 insiste sur des hypothèses locales. 


(2) Le théorème 11.242 fait des hypothèses plus globales pour s’alléger l'esprit, mais fait 
une récurrence pour dire que f © g est de classe C7 si f et g le sont. 


(3) Dans le cas d’espaces vectoriels normés de dimension finie, proposition 11.245. 
(4) Composée avec une application linéaire, propositions 11.244 et 11.243. 


Applications à valeurs dans les endomorphismes (1) A: U — End(V,W) est C? si ses 
composantes le sont, proposition 12.345. 


(2) A: U — End(V, W) est CP si sr A(s)v est CP pour tout v, proposition 12.345 
THTOC57 


Thème 57 : équations différentielles L'utilisation des théorèmes de point fixe pour l’existence 
de solutions à des équations différentielles est fait dans le chapitre sur les points fixes. 


(1) Le théorème de Schauder a pour conséquence le théorème de Cauchy-Arzela 20.31 pour les 
équations différentielles. 


(2) Le théorème de Schauder 20.30 permet de démontrer une version du théorème de Cauchy- 
Lipschitz (théorème 17.42) sans la condition Lipschitz 


(3) Le théorème de Cauchy-Lipschitz 17.42 est utilisé à plusieurs endroits : 
_— Pour calculer la transformée de Fourier de e*”/? dans le lemme 29.22. 
Théorème de stabilité de Lyapunov 32.43. 
Le système proie-prédateur de Lotka-Volterra 32.44 
Équation de Schrüdinger, théorème 32.51. 
L’équation (x — xo)*u = 0 pour u € Ÿ'(R), théorème 30.52. 
La proposition 32.46 donne un résultat sur y”/+qy = 0 à partir d’une hypothèse de croissance. 


Équation de Hill y” + qy = 0, proposition 32.48. 
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THTOC58 
Thème 58 : convexité 


Fonctions convexes L’essentiel des résultats sur les fonctions convexes sont dans la section 17.11. 
On a surtout : 


(1) Définition des fonctions convexes : 17.79 et 17.97 en dimension supérieure. 


(2) En termes de différentielles, 17.98 pour la différentielle première et 17.101 pour la hes- 


sienne. 

(3) Une courbe paramétrée convexe est la définition 21.90. 

(4) L’enveloppe convexe d’une courbe fermée simple et convexe : 21.92. 

(5) Courbure et convexité d’une courbe paramétrée : section 21.13.4. 

(6) Une courbe paramétrée convexe est localement le graphe d’une fonction convexe par le 
lemme 21.91. 

(7) La convexité est utilisée dans la méthode du gradient à pas optimal de la proposi- 
tion 17.117. 


(8) La fonction t + t? est strictement convexe sur les positifs dans le lemme 17.90. 


(9) Une inégalité sympa : a" + b" < (a + b)" < 27—(a" + b") pour a,b > 0 et r > 1, lemme 
21:138: 


En termes de parties convexes, on à : 


Parties convexes (1) Définition 7.146 d’une partie convexe d’un espace vectoriel. 
(2) Une boule est convexe, proposition 8.28. 


(3) Un polygone convexe est défini en 18.168, et les racines de l’unité forment un polygone 
convexe par la proposition 18.169. 


THTOC59 
Thème 59 : espaces de Hilbert, base hilbertienne Beacoup de choses concerant les espaces 
L?, et en particulier la base trigonométrique sont dans le thème 45. 


(1) Toute partie orthonormale d’un espace de Hilbert est libre, proposition 25.24. 
(2) Tout espace de Hilbert possède une base hilbertienne, proposition 25.37. 


(3) Unicité de la décomposition dans une base hilbertienne, proposition 25.38. 


THTOC60 
Thème 60 : analyse complexe, fonctions holomorphes 
(1) Le lien entre différentielle et dérivée complexe est donné par les équations 
dfz0(2) = F(z0)7 = (0:f)(20)z (2.9) 


par (12.860) et la proposition 26.4. Cela se résume par la formulation lapidaire f' = 0, f. 
(2) Série de Laurent f(2) = D,,67 an2", théorème 28.26. 


THEMEo00 JGEHOGNEQRET 
Thème 61 : permuter des limites 


Permuter des dérivées partielles Si une fonction est de classe C?, le théorème de Schwarz 
12.354 dit que 
OA = Arf. (-2.10) 


Fonctions définies par une intégrale Les théorèmes sur les fonctions définies par une inté- 
grale, section 17.4. Nous avons entre autres 
(1) {2 f = (3 0if, avec B compact, proposition 17.27. 


(2) Si f est majorée par une fonction ne dépendant pas de +, nous avons le théorème 17.15 
pour la continuité de x = {,, f(x,w)du(w). 
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(3) Pour la fonction F(x) = {, f(x,w)du(w), nous avons la dérivation sous l'intégrale par 
la formule de a. 


_ Ï CT (a w)du(u) (-2.11) 
Q 


démontrée en le théorème 17.19. 


Des variations avec des dérivées partielles et des différentielles sont dans 17.27 et dans 
17:28: 


(4) Si f:C x A — C est holomorphe (pour C), alors F est holomorphe et 
© 
F'(2) = [ pa (2.19) 
Q Oz 
(5) Pour des dérivées partielles multiples, nous avons la formule 


(@*F)(x) = Leztodts (213) 


dans la proposition 17.21. 


(6) Si l'intégrale est  . convergente, nous avons le théorème 17.16 qui donne la 
continuité de F(x) = {, f(x,w)du(w). 

(7) Pour dériver (, g : z)dt avec B compact dans R et g: IR x € — ©, il faut aller voir la 
proposition 26.64. 


(8) En ce qui concerne e x dans la borne, le théorème 14.262 lie primitive et intégrale en 
montrant que F(x = f(t)dt est une primitive de f (sous certaines conditions). Le 
théorème ue de l’analyse 14.263 en est une conséquence. 


(9) Si T est une distribution, alors nous avons 
T(a + (0%6)(æ,v0)) = GT (x — é(x, n)) (-2.14) 
C’est la proposition 30.56. 
Limite et intégrale (1) Théorème de la convergence monotone, théorème 14.173. 
2) F5, fn = > fn dans le corolaire 14.176. 

Fubini Le théorème de Fubini permet non seulement de permuter des intégrales, mais également 
des sommes parce que ces dernières peuvent être vues comme des intégrales sur N muni 
de la tribu des parties et de la mesure de comptage !”. Nous utilisons cette technique pour 
permuter une somme et une intégrale dans l'équation (26.297). 

L'utilisation de Fubini pour permuter des intégrales (sur deux variables différentes) ou deux 
sommes est expliquée dans 14.298. 
C’est par exemple utilisé pour permuter deux sommes dans le cadre des chaines de Markov 
en 38.8. 
— le théorème de Fubini-Tonelli 14.294 demande que la fonction soit mesurable et positive : 
— le théorème de Fubini 14.297 demande que la fonction soit intégrable (mais pas spécia- 
lement positive) ; 
— le corolaire 14.296 demande l’intégrabilité de la valeur absolue des intégrales partielles 
pour déduire que la fonction elle-même est intégrable. 
Limite et dérivées, différentielle (1) Permuter limite et dérivée dans le cas R — R, théorème 
12.384. 
(2) Permuter limite et dérivées partielles, théorème 12.387. 


(3) Permuter limite et différentielle, théorème 15.9. 
Quelques remarques sur les techniques de démonstration. 


19. Mesure de comptage, définition 14.255. 
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(1) Le résultat fondamental 12.384 est démontré sans recourir à des intégrales. Une preuve 
alternative, plus courte, avec des intégrales est donnée en 14.270. 


(2) Permuter limite et dérivée partielle, théorème 12.387. 
(3) Permuter série et différentielle, théorème 15.9. 
Somme et dérivée Permuter somme et différentielle, théorème 15.9. 


Limite et mesure Une mesure n’est pas toujours une limite, mais la définition d’une mesure 
positive sur un espace mesurable parle de permuter limite et mesure : définition 14.18(2). 


THTOC62 
Thème 62 : déduire la nullité d’une fonction depuis son intégrale Des résultats qui 
disent que si | f = 0 c’est que f = 0 dans un sens ou dans un autre. 


(1) Il y a le lemme 14.192 qui dit ça. 

Un lemme du genre dans L? existe aussi pour Ÿ fg = 0 pour tout w. C’est le lemme 27.66. 
Et encore un pour L? dans la proposition 27.174. 

Si { fx = 0 pour tout x à support compact alors f = 0 presque partout, proposition 30.1. 


En utilisant le théorème de représentation de Riesz, on peut prouver que 5 fx = 0 implique 
J = 0 pour tout f € LP, proposition 27.174. 


(6) La proposition 27.21 donne f = 0 dans L? lorsque ( fg = 0 pour tout ge LA. 


(7) Une fonction h e C?(1) admet une primitive dans C#(1) si et seulement si [, h = 0. Théo- 
rème 17.2. 


Dans le même ordre d'idées, si f > 0 et si u(X) > 0 alors le f > 0 par le lemme 14.194. 


THTOC63 
Thème 63 : inversion locale, fonction implicite 


(1) Théorème d’inversion locale dans un Banach : théorème 17.50. 
(2) Fonction implicite dans un Banach : théorème 17.51. 


(3) Utilisé pour montrer que le flot d’une équation différentielle est un C?-difféomorphisme local, 
voir 32.36. 


(4) Pour le théorème de Von Neumann 17.64. 


THEMEooWAYJoGHSNfiH4 
Thème 64 : points fixes 
(1) Il y a plusieurs théorèmes de points fixes. 
Théorème de Picard 17.37 donne un point fixe comme limite d’itérés d’une fonction 
Lipschitz. Il aura pour conséquence le théorème de Cauchy-Lipschitz 17.42, l'équation 


de Fredholm, théorème 17.41 et le théorème d’inversion locale dans le cas des espaces 
de Banach 17.50. 


Théorème de Brouwer qui donne un point fixe pour une application d’une boule vers 
elle-même. Nous allons donner plusieurs versions et preuves. 


(1a) Dans R’” en version C® via le théorème de Stokes, proposition 27.73. 


(1b) Dans R” en version continue, en s’appuyant sur le cas C'? et en faisant un passage 
à la limite, théorème 27.74. 


(1c) Dans R? via l’homotopie, théorème 26.66. Oui, c’est très loin. Et c’est normal parce 


que ça va utiliser la formule de l’indice qui est de l’analyse complexe ?°. 


Théorème de Markov-Kakutani 20.33 qui donne un point fixe à une application continue 
d’un convexe fermé borné dans lui-même. 


Théorème de Schauder C’est une version valable en dimension infinie du théorème de 
Brouwer. Théorème 20.30 


20. On aime bien parce que ça ne demande pas Stokes, mais quand même hein, c’est pas gratos non plus. 
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(2) Pour les équations différentielles 

(2a) Le théorème de Schauder a pour conséquence le théorème de Cauchy-Arzela 20.31 pour 
les équations différentielles. 

(2b) Le théorème de Schauder 20.30 permet de démontrer une version du théorème de 
Cauchy-Lipschitz (théorème 17.42) sans la condition Lipschitz, mais alors sans uni- 
cité de la solution. Notons que de ce point de vue nous sommes dans la même situation 
que la différence entre le théorème de Brouwer et celui de Picard : hors hypothèse de 
type « contraction », point d’unicité. 

(3) En calcul numérique 
— La convergence d’une méthode de point fixe est donnée par la proposition 34.48. 
— La convergence quadratique de la méthode de Newton est donnée par le théorème 34.54. 
— En calcul numérique, section 34.5 
— Méthode de Newton comme méthode de point fixe, sous-section 34.6.2. 
(4) D’autres utilisations de points fixes. 
— Processus de Galton-Watson, théorème 38.59. 
— Dans le théorème de Max-Milgram 25.61, le théorème de Picard est utilisé. 
THTOC65 
Thème 65 : changement de variables Il n’existe rien en mathémaiïitque qui s'appelle « chan- 
gement de variables ». Il n'existe que des compositions de fonctions. Ce snobisme terminologique 
étant, voici un certain nombre de résultats de changement de variables. 
(1) Dans des intégrales, théorème 14.290. 
(2) Dans des limites, le lemme 7.168 donne lim,_,, f(æ) = lim,_,# f(æ + a — b) si la limite existe. 
(3) Dans une équation aux dérivées partielles, exemple 33.132. 
(4) Limite de fonction composée lim,_,,(f o g), propositions 7.169 et 7.170. 
THEMEooLTCIo®BDUE6E 

Thème 66 : techniques de calcul Il y en a pour tous les gouts. 

Primitives et intégrales Toute la section 18.2 donne des trucs et astuces pour trouver des pri- 
mitives et des intégrales. 

Limite à deux variables Les exemples de limites à plusieurs variables font souvent intervenir 
des coordonnées polaires (du théorème 18.227) ou autres fonctions trigonométriques. Ils sont 
donc placés beaucoup plus bas que la théorie. 

— Méthode du développement asymptotique, sous-section 18.14.2. 
— Méthode des coordonnées polaires, sous-section 18.14.1. 
— Utilisation du théorème de la fonction implicite, dans l’exemple 18.229. 


THTOC67 
Thème 67 : méthodes de calcul 
(1) Théorème de Rothstein-Trager 20.94. 
(2) Algorithme des facteurs invariants 4.113. 
(3) Méthode de Newton, théorème 34.63 
(4) Calcul d’intégrale par suite équirépartie 28.10. 
THTOC68 


Thème 68 : méthode de Newton 

(1) Nous parlons un petit peu de méthode de Newton en dimension 1 dans 34.6. 
La méthode de Newton fonctionne bien avec les fonctions convexes par la proposition 34.56. 
La méthode de Newton en dimension n est le théorème 34.63. 
Un intervalle de convergence autour de a s'obtient par majoration de |[g/|, proposition 34.48. 
Un intervalle de convergence quadratique s’obtient par majoration de |g”|, théorème 34.54. 
En calcul numérique, section 34.6. 
Méthode de Newton pour calculer YA, exemple 34.57. 
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THTOC69 


Thème 69 : prolongement d’applications 


(1) 
(2) 
(3) 
(4) 


(1) 
(2) 
(3) 


Prolongement de fonction définie sur une partie dense, théorème 17.131 
Lemme de Borel 15.164. 
Prolongement méromorphe de la fonction L' d’Euler. 


Le théorème de Tietze prolonge des fonction continues définies sur un fermé. Prolongement 
continu dans le cas métrique, théorème 27.163. Dans le cas d’un espace normal, théorème 
26.21. 


THTOC70 
Thème 70 : opérations sur les distributions 
Convolution d’une distribution par une fonction, définition par l'équation (30.229). 
Dérivation d’une distribution, proposition-définition 30.38. 
Produit d’une distribution par une fonction, définition 30.37. 
THTOC71 


Thème 71 : convolution 


Définition 27.55, et principales propriétés sur L!(IR) dans le théorème 27.56. 
Inégalité de normes : si f € LP et ge L!, alors | f « gl, < | fl,|gl1, proposition 27.60. 
pe LI(R) et ve. (R), alors v + Ye .S(R), proposition 27.230. 

Les suites régularisantes : lim,_, fn * f = f dans la proposition 29.18. 

Convolution d’une distribution par une fonction, définition par l'équation (30.229). 
Nous avons (f x g) = f x g', proposition 27.61. 

Si fe L'(Rd) et ge C(RÉ), alors f x ge C®, corolaire 27.62. 

Somme de variables aléatoires : fr+y = fx * fy, proposition 36.28. 


THMooHWEBoGHMDE Ye 


Thème 72 : séries de Fourier 


Le système trigonométrique est donné en la définition 27.76. 

Les coefficients de Fourier de c,(f) sont donnés par 27.78. 

Formule sommatoire de Poisson, proposition 29.15. 

Inégalité isopérimétrique, théorème 28.23. 

Fonction continue et périodique dont la série de Fourier ne converge pas, proposition 28.21. 
inx 


Nous allons montrer la convergence de Ÿ 47 cx(f}e"* vers f(x) dans divers cas : 


(1) Si f est continue et périodique, convergence au sens de Cesàro, théorème de Fejér 28.7. 
(2) Convergence au sens L? (10, 2r]) dans le théorème 27.125. 


ul ? 
(3) Si f est continue, périodique et si sa série de Fourier converge uniformément, théorème 
28.15. 


(4) Si f est périodique et la série des coefficients converge absolument pour tout x, propo- 
sition 28.16. 


(5) Si f est périodique et de classe C'!, théorème 28.17. 
(6) Unicité des coefficients de Fourier, corolaire 28.18. 


Il est cependant faux de croire que la continuité et la périodicité suffisent à obtenir une 
convergence, comme le montre la proposition 28.21. 
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THTOC73 
Thème 73 : transformée de Fourier 
(1) Définition sur L!, définition 29.1. 
(2) La transformée de Fourier d’une fonction L'(R) est continue, proposition 29.11. 


(3) L'espace de Schwartz?! est stable par transformée de Fourier. L'application F:.7(R‘) — 
S(R1) est continue. Proposition 29.20 


(4) L'application F: .7(R1) — .7(R°) est une bijection. Formule d’inversion, proposition 29.26. 


THTOC74 
Thème 74 : gaussienne 


(1) Le calcul de l’intégrale 
J e% dx = VT 
R 


est fait de deux façons dans l’exemple 14.300. Dans les deux cas, le théorème de Fubini 14.297 
est utilisé. 


—elx|? 


(2) Le lemme 29.22 calcule la transformée de Fourier de g.(x) = e qui donne ÿe(£) = 


(2)? e—lél?/4e. 
(3) Le lemme 29.23 donne une suite régularisante à base de gaussienne. 


(4) Elle est utilisée pour régulariser une intégrale dans la preuve de la formule d’inversion de 
Fourier 29.26 


THEMEooJRETOGHEGNURS 


Thème 75 : lemme de transfert Il y a deux résultats qui portent ce nom. Le premier est dans 
la théorie de Fourier, le résultat f! = ié f. 


(1) Lemme 29.19 sur .7(R4) 
(2) Lemme 31.10 pour L2. 


L'autre lemme de transfert est en théorie des tribus, le résultat o(f71(C)) = f-!(o(C)) du 
lemme 14.45. Celui-ci est d’ailleurs plutôt nommé « lemme de transport ». 
Il existe aussi un théorème de transfert 36.83 qui parle de variables aléatoires : 


E(°Xx)= | 


Q 


(A) 4P(e) = ||, FdPx (a) (2.15) 


THTOC76 
Thème 76 : invariants de similitude 


(1) Théorème 9.286. 


(2) Pour prouver que la similitude d’applications linéaires résiste à l'extension du corps de base, 
théorème 9.300. 


(3) Pour prouver que la dimension du commutant d’un endomorphisme de E est de dimension 
au moins dim(Æ), lemme 9.297. 


(4) Nous verrons dans la remarque 9.287 à propos des invariants de similitude que toute matrice 
est semblable ?? à la matrice bloc-diagonale constituées des matrices compagnon (défini- 
tion 9.281) de la suite des polynômes minimaux. 


21. Définition 27.218. 
22. Définition 4.110. 
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THMooVUCLoGHFABx 
Thème 77 : isométries Il y a (R”,|.|) et (R", d). 

Les isométries de |.] sont linéaires, tandis que les isométries de la distance contiennent aussi 
les translations et les rotations de centre différent de l’origine. 

Ne pas confondre une isométrie d’un espace affine avec une isométrie d’un espace euclidien ?°. 
Les isométries d’un espace euclidien préservent le produit scalaire et fixent donc l’origine (lemme 11.15). 
Les isométries des espaces affines par contre conservent les distances (définition 8.64) et peuvent 
donc déplacer l’origine de l’espace vectoriel sur lequel il est modelé ; typiquement les translations 
sont des isométries de l’espace affine mais pas de l’espace euclidien. 

Parfois, lorsqu'on coupe les cheveux en quatre, il faut faire attention en parlant de R” : soit on 
en parle comme d’un espace métrique (muni de la distance), soit on en parle comme d’un espace 
normé (muni de la norme ou du produit scalaire). 


Général Quelques résultats généraux et en vrac à propos d’isométries. 


(1) Définition d’une isométrie pour une forme bilinéaire, 9.153. Pour une forme quadratique : 
définition 9.152. 


(2) Définition du groupe orthogonal 9.41, et le spécial orthogonal SO(n) en la définition 9.44. 
Le groupe SO(2) est le groupe des rotations, par corolaire 18.138. 


(3) La rotation R1(0) d'un angle 0 autour du point À € R? est donnée par la définition 
18.127. 


(4) La proposition 18.139 donne à toute rotation Ro(0) une matrice de la forme connue. 
C’est autour de cela que nous définissons les angles, définition 18.157. 


(5) Le groupe orthogonal est le groupe des isométries de R”, proposition 9.43. 
(6) Les isométries de l’espace euclidien sont affines, 9.155. 


(7) Les isométries de l’espace euclidien comme produit semi-direct : Isom(R”?) = T{(n) x, 
On), théorème 18.79. 


(8) Isométries du cube, section 5.7. 
(9) Nous parlons des isométries affines du tétraèdre régulier dans la proposition 18.195. 


Groupe diédral Le groupe diédral est un peu central dans la théorie des isométries de (R?, d) 
parce que beaucoup de sous-groupes finis des isométries de (IR?, d) sont en fait isomorphes 
au groupe diédral. 


(1) Générateurs du groupe diédral, proposition 18.175. 


(2) Un sous-groupe fini des isométries de (IR?,d) contenant au moins une réflexion est 
isomorphe au groupe diédral par le théorème 18.200. 


(3) Le théorème 18.202 dit que le groupe des isométries propres d’une partie quelconque de 
(R?, d) est soit cyclique soit isomorphe au groupe diédral. 


Isométries et réflexions Dans un espace euclidien, toute isométrie peut être décomposée en 
réflexions autour d’hyperplans. Voici quelques énoncés à ce propos. 


(1) Définition d’une réflexion dans IR? 18.121. 


(2) La caractérisation en termes de projection orthogonale est le lemme 18.106; en termes 
de médiatrice c’est le lemme 18.112. 


(3) Définition d’un hyperplan 9.301. 


(4) En dimension 2, une rotation est définie comme composée de deux réflexions en la 
définition 18.118. 


(5) En dimension 2, les réflexions ont un déterminant —1 par le lemme 18.131. 


(6) Les isométries du plan (IR?, d) sont données dans le théorème 18.191, et sont au plus 3 
réflexions par le théorème 18.189. 


23. Définition 9.168. 
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(7) Décomposition des isométries de R’ en réflexions par le lemme 18.87. 
(8) En particulier, les éléments de SO(3) sont des compositions de deux réflexions par le 
corolaire 18.89. 


(9) Une isométrie de R” préserve l'orientation si et seulement si elle est la composition d’un 
nombre pair de réflexions. C’est le théorème 18.95. 


Sous-groupe fini (1) Les sous-groupes finis des isométries de (IR?, d) sont cycliques, théorème 
18.200. 


(2) Les sous-groupes finis de SO(3) sont listés dans 18.224. 
(3) Les sous-groupes finis de SO(2) sont cycliques, lemme 18.142. 
THTOC78 
Thème 78 : enveloppes 
(1) L’ellipse de John-Loewner donne un ellipsoïde de volume minimum autour d’un compact 
dans R”, théorème 17.125. 
(2) Le cercle circonscrit à une courbe donne un cercle de rayon minimal contenant une courbe 
fermée simple, proposition 21.89. 
(3) Enveloppe convexe du groupe orthogonal 13.38. 
(4) Enveloppe convexe d’une courbe fermée plane comme intersection des demi-plans tangents, 
proposition 21.95. 
THTOC79 
Thème 79 : intégration sur des variétés Définition d’une variété : 20.1. 
orientation La notion d'orientation commence avec l'orientation des bases d’un espace vectoriel 
et continue jusqu’à orienter des variétés à partir de ses cartes. 
(1) Classe d'orientation sur les bases d’un espace vectoriel, définition 9.26. 
(2) Orientation sur une surface, définition 20.57. 
(3) Variété orientable, définition 20.16. 


Intégrale Nous définissons d’abord l’intégrale sur une carte, et ensuite sur une variété. En ce 
qui concerne les formes différentielles, nous n’intégrons que des n-formes sur des variétés de 
dimension n. 


(1) Intégrale d’une fonction sur une carte, définition 20.9. 
théorème de Stokes, théorème de Green et compagnie Tous ces théorèmes sont des consé- 
quences plus ou moins directes de celui de Stokes, et des généralisations du théorème fonda- 
mental de l’analyse. 
(1) Forme générale, théorème 20.68. 
(2) Rotationnel et circulation, théorème 24.8. 
Le théorème de Stokes peut être utilisé pour montrer le théorème de Brouwer, proposi- 
tion 27.73. 
THTOC80 
Thème 80 : dénombrements 
— Coloriage de roulette (18.10.15.1) et composition de colliers (18.10.15.2). 
— Nombres de Bell, théorème 15.166. 
— Le dénombrement des solutions de l’équation ain1 +... apnp = n utilise des séries entières 
et des décompositions de fractions en éléments simples ?{, théorème 26.99. 
THTOC81 
Thème 81 : caractérisation de distributions en probabilités 
(1) La probabilité conjointe est la définition 36.19. 
(2) La fonction de répartition est la définition 36.73. 


(3) La fonction caractéristique est la définition 36.76. 


24. Éléments simples, lemme 19.13. 
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THTOC82 
Thème 82 : théorème central limite 


(1) Pour les processus de Poisson ?, théorème 40.13. 


THTOC83 
Thème 83 : indépendance d'événements et de variables aléatoires 


(1) Événements indépendants, définition 36.6. 
(2) Variables aléatoires indépendantes, définition 36.10. 


(3) Espérance de variables aléatoires indépendantes : E(X3 --- X,) = E(X1)...E(X,), proposi- 
tion 36.23. 


(4) Densité de variables aléatoires indépendantes : fx(x1,...,%n) = fx,(x1)...fx,(&n), propo- 
sition 36.21. 
THTOC84 
Thème 84 : probabilités et espérances conditionnelles Les deux définitions de base, sur 
lesquelles se basent toutes les choses conditionnelles sont : 


— L'espérance conditionnelle d’une variable aléatoire sachant une tribu : E(X|F) de la défini- 
tion 36.49. 


Les autres sont listées ci-dessous. 
Probabilité conditionnelle . 
Plusieurs probabilités conditionnelles. 
— D'un événement en sachant un autre : la définition 36.41 donne 
P(AnB) 


PAIE) = © 5 


Cela est la définition de base. L'autre est une définition dérivée. 


— D'un événement vis-à-vis d’une variable aléatoire discrète. C’est par la définition 36.67 
qui définit la variable aléatoire 


P(AIX)(&) = P(AIX = X(w)). 
Dans le cas continu, c’est la définition 36.68 : 
P(AÏX) = P(Alo(X)) = E(Lalo(X)). 
— D'un événement par rapport à une tribu. C’est la variable aléatoire 
P(AF) = E(141F). 
Espérances conditionnelles Plusieurs espérances conditionnelles. 


— D'une variable aléatoire par rapport à un événement, définition 36.61 : 


E(X14) 
E(X |A) = ——. -2.16 
(AA = TE (2.16) 
— d’une variable aléatoire par rapport à une tribu. La variable aléatoire E(X|F) est la 
variable aléatoire F-mesurable telle que 


[ren -[x 


pour tout X e F. Si X € L?(Q, A, P) alors E(X|F) = projx(X) où K est le sous- 
ensemble de L?(Q,. A, P) des fonctions F-mesurables (théorème 36.49). Cela au sens des 
projections orthogonales. 


25. Définition 40.9. 


-2.1. CONVENTIONS SUR LES MATRICES ET CHANGEMENT DE BASES 41 


— d’une variable aléatoire par rapport à une autre. La définition 36.51 est une variation 
sur le même thème : 


E(XIY) = E(X|o(Y)), 


Notons que partout, si X est une variable aléatoire, la notation « sachant X » est un raccourci 
pour dire « sachant la tribu engendrée par X ». 
Quelque formules. 


(1) Pour l'espérance conditionnelle d’une variable aléatoire prenant seulement une quantité dé- 
nombrable de valeurs : E(X|A) = Yo uk P(X = yxl A) par le lemme 36.62. 


(2) La probabilité conditionnelle se factorise par rapport à l'union disjointe par le lemme 36.45 : 
P(Uio Ai|B) = Xio P(AilB). 
THTOC85 
Thème 85 : chaine de Markov 


(1) Construction d’une chaine de Markov dont la matrice de transition est donnée, lemme 38.42. 

(2) Principales propriétés d’une chaine de Markov homogène, proposition 38.39. 

(3) Si la chaine de Markov est irréductible, alors il y a unicité de l’état stationnaire, proposi- 
tion 38.16. Mais attention : cela ne veut pas encore dire que la chaine converge effectivement 
vers cet état. 


(4) Si la chaine est irréductible et apériodique, alors il y a convergence en loi vers l’unique loi 
invariante, théorème 38.37. 


(5) État absorbant, définition 38.44. 


-2.1 Conventions sur les matrices et changement de bases 
SECooBTTTooZZABWA 


-2.1.1 Matrices et applications linéaires 
SUBSECooAFPDooUzXdGz 


Le lien entre matrice et application linéaire est donné par la définition 4.67. L'application d’une 
matrice à un vecteur est (4.84). Le lien le plus simple entre l’application linéaire et les éléments de 
matrice est donné par la proposition 4.70. Voici les relations : 


Toi = P(els (-2.17a) 
T(e:) = > 1 (-2.17b) 
T(x) = D Tai fa (-2.17c) 

T(t)a = à (-2.17d) 


De la même manière nous utiliserons (rarement) la notation suivante (définition 10.104) si 
zeR'"etTeMi(nxn): 
le > TiTijej. (2.18) 
ij 
À partir de là, il est possible de parler de vecteur propre à gauche lorsque xT = Àx. 
Cela définit une application d: M(n x m,K) — £L(E, F) qui a plein de propriétés. 
l 
2 


C’est une bijection, proposition 4.70(4). 


C’est un isomorphisme d’algèbre, proposition 4.73. 


4 
5) 


(1) 
(2) 
(3) C’est un isomorphisme d'espaces vectoriels, proposition 4.71. 
(4) Isomorphisme d’algèbres et d’anneaux, proposition 4.73. 

(5) 


Isomorphisme d’espaces topologiques, proposition 4.73. 
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Lorsque nous avons une base orthonormée “ nous avons aussi les propositions 9.180 et 9.180 


qui donnent des formules avec produit scalaire : 
(D'Tisé, Te) 
(2) x + Ay = Du AxTkU. 

où le point est le produit scalaire usuel de R?. 


-2.1.2 Le changement de base 


Soit un espace vectoriel V muni de deux bases (e;);=1...n €t (fa)a=1,.n- Le lemme 4.114 donne 
le lien entre les vecteurs de base : 


(1) fa = } Qiati 
(2) ei = Xo Qu fa 
La proposition 4.115 donne un certain nombre de formules pour les coordonnées des vecteurs : 


(1) ya = Qui 


(2 ) =D, QiaYa: 
(3) x = 2. 
(4) x = 


La . de la matrice d’une application linéaire lors d’un changement de base est la 
proposition 4.118. Soit une application linéaire T': V — V de matrices À et B dans les bases {e;} 
et {fa}. Si les bases sont liées par fa = D}; Qines, alors les matrices À et B sont liées par 


B = Q7!AQ. (-2.19) 


En ce qui concerne la base duale, si €; = »,, Aije:, alors 
dr. (-2.20) 
j 
proposition 4.131. 


-2.1.3 Changement de base : matrice d’une forme bilinéaire 


La proposition 9.149 fait le changement de matrice d’une forme bilinéaire lors d’un changement 
de base. Si la matrice de q dans la base {e;} est À et celle dans la base {f,} est B, alors 


B = Q'AQ. (-2.21) 


Pour comparaison avec la loi de transformation des matrices des applications linéaires, voir la 
remarque 9.150. 

Plus généralement, si d est une application linéaire, la matrice de qo @ est p'q@, proposition 
9.148. 


-2.2 Multiindice et liste d’indices 

NORMooRRZCooMOKAZzY 
-2.1. 
Je crois qu’il y a quelques incohérences de notations/dénominations dans le texte. En principe 
quand on parle de R”, un multiindice [3] est une vecteur d’entiers positifs à n composantes. Si 
a = (2,1) alors nous avons la notation 


de 


26. Définition 9.166. 
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Cette notation pose problème lorsque, par exemple, 0709 f # 010201 f. 

Elle pose également problème lorsque l’on veut faire une récurrence sur l’ordre de dérivation 
en ajoutant une seule dérivation à la fois. 

C’est pourquoi nous introduisons le concept de liste d’indices. En parlant de R”, une liste 
d'indices est un vecteur arbitrairement long (mais fini) d’entiers dans {1,...,n}. Si, dans R?, 
a = (1,3,1,5), alors 

Of = 030105 f. (-2.23) 


Si «à est une liste d'indices de longueur p, une queue de a est une liste d’indices de longueur 
0 <k< p de la forme (@_#+1, Ap-k+2, ...; Gp). 
Voir aussi la définition 30.12 pour a! et <++> 


-2.3 Anglicismes 
SECooPBZVooCVInFT 
Voici quelques anglicismes dont je ne me souviens jamais. 


(1) Une 0-algèbre est une tribu, définition 14.1. 
(2) Le « uniform boundedness principle » est le théorème de Banach-Steinhaus 11.138. 


(3) Un anneau est ce qu’on appelle « ring » en anglais. Un corps est en anglais « field ». De 
plus le mot « field » comprend la commutativité. Donc certains utilisent le mot « corps » 
pour dire « corps commutatif » et parlent alors d’anneau à division pour parler de corps non 
commutatifs. 
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fondamental d’une action, 277 
dominé 
modèle statistique, 2622 
dominée 
convergence (Lebesgue), 1265 
mesure, 1273 
dominée par le dessus, 569 
dominée par une seminorme, 569 
droite 
dans la sphère de Riemann, 1945 
projective, 1921 
droite affine, 607, 969 
droite réelle achevée, 762 
droite vectorielle, 969 
droites parallèles, 969 
droites perpendiculaires, 969 
dual 
d’un espace de Hilbert, 1997 
de M{n,K), 681 
de LP(Q), 2202 
de ZP, 2196 
dual algébrique, 372 
dual topologique, 901, 1989 
Dunford 
décomposition, 709 
dyadique, 1295 
développement, 251 
écart-type, 2538 
échantillon, 2616, 2618 


effectif 

empirique, 2648 
effectif 

empirique, 2648 
efficacité 

courbe, 2644 

d’une méthode itérative, 2461 
élément 

de surface, 1771 

de torsion, 282 
élément 

inversible 

dans un anneau, 180 

élément de surface, 1748 
élément maximal, 119 
élément minimal, 119 
élément premier, 179 
élément régulier, 130 
élément régulier à gauche, 130 
élémentaire 

polynôme symétrique, 476 
ellipsoïde, 733 
elliptique 

équation aux dérivées partielles, 2419 
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endomorphisme, 337 
cyclique, 652 
décomposition 

polaire, 1168 


diagonalisable, 732, 1165, 2387 


Dunford, 709 
diagonalisation, 691 
nilpotent 

Dunford, 709 


préservant une forme quadratique, 1177 


sous-espace stable, 709, 2387 
endomorphisme direct, 628 


endomorphisme préserve l’orientation, 628 


engendré, 184 
X-système, 1188 
corps, extension, 444 
idéal dans un anneau, 184 
sous-espace affine, 596 
sous-groupe, 216 
ensemble 
archimédien, 137 
de Cantor, 1246 
différence symétrique, 122 
infini, 153 
ensemble connexe, 497 
ensemble des mots, 2715 
ensemble fini, 153 
ensemble ordonné, 119 
ensemble quotient, 124 


ensembles 

disjoints, 117 
entier, 149 
entrelacement, 1430 
enveloppe 

convexe, 600 
équation 

différentielle 


linéaire, 2348 
ordinaire d’ordre 1, 2345 
variables séparées, 2350 
générale de degré n, 480 
équation 
aux variations, 2368 
de Riccati, 2389 
des classes, 277 
des orbites, 277 
différentielle 
étude qualitative, 2387 
Hill, 2386 
homogène, 2389 
système, 2387 
diophantienne, 295, 312, 314 
Fredholm, 1465 


orbite-stabilisateur, 276 
équation de droite, 975 
équation différentielle 


linéaire du premier ordre, 2399 
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linéaire du premier ordre, homogène, 2399 


linéaire du second ordre, 2402 


linéaire du second ordre, homogène, 2402 


premier ordre, 2394 
second ordre, 2395 
variables séparables, 2397 
équation exponentielle, 1121 
équation fonctionnelle, 1121 
équation homogène associée, 2399 
équi-intégrable, 2689 
équicontinu, 567 
équipotent, 152 
équivalence 
arcs paramétrés, 1871 
chemin, 1864 
classe de fonctions, 2090 
de représentations, 1430 
de suites, 746 
homotopie, 2045 
suite de composition, 271 


équivalence de forme quadratiques, 703 


équivalence de normes, 797 
erreur, 2467, 2497 
assignation, 2432 
de consistance, 2520 
discrétisation, 2521 
quadratique, 2470 
troncature, 2432 
erreur relative, 2432 
escalier, 1228 
espace 
I? 
Sobolev, 2332 
LP, 2093 
de Baire, 588 
de Bergman, 2230 
de fonctions 
LP, 2111 
Sobolev H!, 2332 
de Hilbert 
espace de Sobolev H!, 2332 
de probabilité, 2529 
de Schwartz, 2225, 2315 
de Sobolev, 2329, 2336 
euclidien, 792 
mesurable, 1179 
mesuré, 1184 
complété, 1203 
métrique, 508 
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base de topologie, 512 
projectif, 1921 
propre, 645 
séparé, 494 
topologique 
métrisable, 558 
vectoriel, 219 
dimension, 614 
vectoriel topologique 
métrisable, 543 
espace de Banach, 545 
espace de Sobolev, 2334 
espace tangent, 1744 
espace topologique, 481 
espace topologique normal, 1910 
espace vectoriel 
topologique, 519 
espace vectoriel normé, 517 
espérance, 2534 
conditionnelle, 2543, 2544 
événement, 2544 
variable aléatoire, 2549 
estimateur, 2623 
biais, 2624 
consistant, 2623 
de fonction de répartition, 2628 
maximum de vraisemblance, 2626 
estimateur convergeant, 2623 
estimation 
des grands écarts, 2596 
étagée 
fonction, 1228 
état 
apériodique, 2667 
récurrent, 2660 
récurrent positif, 2660 
transitoire, 2660 
Éther, 2722 
étoile de Kleene, 2717 
étranger 
dans leur ensemble, 317 
étrangers 
polynômes, 317 
Euclide 
algorithme étendu, 284 
lemme, 288 


euclidien 
anneau, 194 
espace, 673 

évaluation 


polynôme plusieurs variables, 300 
événement, 2529 
Evénement, 2727 


exact 
intervalle de confiance, 2632 
excès 
intervalle de confiance, 2632 
exhaustive (suite de compacts), 562 
exponentielle, 1375 
convergence, 829 
de matrice, 900, 1395, 1396, 1408 
utilisation, 1484 
existence, 1369 
rapide, 1698 
unicité, 1122 
exposant, 388, 732 
d’un groupe, 201 
extension 
corps de base, 711 
de corps, 434, 478 
algébrique, 447 
finie, 1717 
simple, 444 
utilisation, 1735 
isométrie, 1532 
séparable, 472 
extension algébrique, 438 
extension algébriquement clos, 438 
extrapolation, 2466 
extrémité 
d’un intervalle, 752 
extrémum, 1837 
lié, 1490 
local 
relatif, 1490 
extrémum local, 1485 
extrémums, 1487 
volume d’un ellipsoïde, 1525 


facteur 

intégrant, 2390 
facteur 

intégrant, 2390 
factoriel 

anneau, 302 
factorisation 

de polynôme, 322, 451 
faisceau de droites, 1943 
famille 

sommable, 819 
famille trigonométrique 

sur S1, 2143 
Fatou, 1255 
Fejér 

noyau, 2236 
fermé, 482, 635 
fermeture séquentielle, 542 
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86 INDEX 


filtration, 2685 quadratique, 1520, 1522, 1837 
fine groupe orthogonal, 1177 
subdivision, 1855 forme bilinéaire symétrique, 659 
fixateur, 274 forme canonique 
flot, 2362, 2410 fonction simple, 1228 
flux matrice de transition, 2677 
d’un champ de vecteur, 1775 forme linéaire, 372, 613 
flux d’un champ de vecteurs, 1773 forme multilinéaire alternée, 613 
fonction, 737 forme quadratique, 659 
T d’Euler, 2075 formle multilinéaire antisymétrique, 613 
à décroissance rapide, 2225 formule 
borélienne, 1197 Bayes, 2540 
caractéristique, 1827 Burnside, 278 
d’une variable aléatoire, 2561 d'expulsion (produit vectoriel), 790 
continue de Cauchy, 2049 
égales, 543 Hadamard, 1343 
convexe, 1492, 1499 inversion Môbius, 1727 
croissante, 738 probabilité totales, 2540 
de Dirichlet, 2242 sommatoire de Poisson, 2264 
de Môbius, 1726 Taylor 


de répartition, 2561 reste intégral, 1821 


décroissante. 738 utilisation, 2452 


définie par une intégrale, 1414, 1452, 1458, Formule de Leïbnitz, 2406 
2081 formule de Stirling, 1843 


T d’Euler, 2075 formule des classes, 276 
utilisation, 2584 Fourier, 2264 


en escalier intégrable, 1825 un 

étagée, 2116 utilisation, 2249 
nn transformée 

génératrice, 2563 : 

holomorphe, 1063, 2081 groupe abélien fini, 1425 
théorème de Montel, 2229 fraction 

image, 737 rationnelle 

le intégration, 1791 


fraction dyadique, 251, 1913 
fraction rationnelle, 1817 
fractions 

rationnelles, 229 
fractions (corps), 231 


T d’Euler, 2075 
monotone, 738 
valeurs vectorielles, 1142 
fonction continue en un point, 489 
fonction dérivée, 983 


a Fredholm 
fonction périodique, 993 équation, 1465 
fonctionnelle Frenet | 
POSTES 2018 formules, 1885 
fonctionnelle de Minkowski, 570 fréquence 
fonctions équivalentes, 495 empirique, 2648, 2658 
fondamental Fresnel | | 
domaine d’une action, 277 intégrale, 2079 
forme Frobenius 
bilinéaire, 659 morphisme, 224 
non dégénérée, 660 frontière, 487, 510, 639 
différentielle, 1025 Fubini 
exacte, 1784 théorème 
fermée, 1784 dans R”, 1329 
linéaire 


différentielle, 1490 Galton-Watson 
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sous-critique, 2683 
sur-critique, 2683 
Galton-Watson 
sous-critique, 2683 
sur-critique, 2683 
Gauss 
lemme 
polynômes, 431 
somme de, 1710 
générateur, 218 
génératrice 
partie d’un module, 222 
géométrie 
avec des groupes, 1616, 1964 
avec nombres complexes, 1616, 1964 
géométrique 
avec des nombres complexes, 2249 
Gershgorin 
disque, 2500 
gradient, 1033, 1041, 1053 
Gram (déterminant), 622 
Gram-Schmidt, 792 
graphe, 738, 985 
de transition (chaine de Markov), 2658 
fonction, 1002 
fonction de deux variables, 1004 
Grônwall (lemme), 2345, 2346 
groupe, 125 
GL(n, R), 1522 
p-groupe, 381 
action, 1964 
utilisation, 1177 
agissant sur un ensemble 
diédral, 1615 
alterné, 397 
circulaire, 1961 
de Galois, 480 
de permutation, 1687 
de permutations, 1622 
caractères de S41, 1438 
de torsion, 282 
dérivé, 265 
de GL(n, K), 1161 
de SL(n, K), 1161 
du groupe alterné, 400 
du groupe symétrique, 399 
des isométries 
espace métrique, 540 
des symétries, 1634 
diédral, 1615, 1622 
générateurs (preuve), 1616 
générateurs (utilisation), 1687 
en géométrie, 1615 
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et géométrie, 614, 1622, 1964 
isométries du cube, 406 
fini, 383, 391, 1622, 1696, 1704, 1708 
alterné, 399 
diédral, 1615 
Wedderburn, 1704 
linéaire, 1172 
décomposition polaire, 1168 
enveloppe convexe de Q{n), 1171 
hyperplan, 682 
sous-groupes compacts, 1174 
modulaire, 1964 
orthogonal, 631 
d’une forme quadratique, 1177 
partie génératrice, 399, 1696, 1964 
permutation, 614, 621, 1172, 1696 
diédral, 1615 
projectif, 1928 
quotient, 269 
simple, 176 
spécial orthogonal, 632 
symétrique, 202 
action sur un triangle, 1427 
groupe abélien, 125 
groupe commutatif, 125 
groupe cyclique, 218 
groupe de pavage, 1638 
groupe dérivé 
de GL{n, C), 1155 
groupe ordonné, 175 
groupe résoluble, 273 
groupe simple, 176 


Hadamard 
conditions, 2420 
formule, 1343 
Hadamard 
conditions, 2420 
formule, 1343 
Hardy-Littlewood (théorème), 1445 
Hausdorff, 494 
Heine (théorème), 943 
hermitienne, 675 
hessienne, 1079 
Hilbert 
espace, 1991 
holomorphe, 1063, 2083 
sur un compact, 1063 
homéomorphisme, 490 
homogène 
chaine de Markov, 2653 
homographie, 1927, 1964 
sur € L {æw}, 1950 
homotopie, 1776 
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homotopie à extrémité fixées, 1776 
hyperbolique 
équation aux dérivées partielles, 2419 
hyperplan, 728, 1581 
de Mn, K), 682 
sépare 
au sens strict, 2180 
séparer 
au sens large, 2180 
hypothèse 
alternative, 2643 
composite, 2643 
multiple, 2643 
nulle, 2643 
simple, 2643 


idéal 
bilatère, 177 
dans un anneau, 177 
principal 
à droite, 188 
à gauche, 188 
idéal 
bilatère, 177 
dans un anneau, 177 
principal 
à droite, 188 
à gauche, 188 
idéal à droite, 177 
idéal maximal, 186 
identifiable, 2622 
identité de polarisation, 664 
image, 737 
incompressible 
champ de vecteur, 1150 
indécomposable 
module, 222 
indépendance 
affine, 604 
algébrique, 480 
événements, 2530 
utilisation, 2609, 2692 
projective, 1929 
sous tribus, 2530 
variables aléatoires, 2531 
indicatrice d’'Euler, 393 
indice, 268 
d’une courbe dans C, 2042 
de rotation, 1894 
indice d’inertie, 671 
inductif, 121 
induite 
topologie, 636 
tribu, 1181 


INDEX 


inégalité 
arithmético-géométrique, 1508 
Bessel, 2000 
Cauchy-Schwarz, 777, 1991 
de Khintchine, 2593 
de la moyenne, 1066 
des pentes, 1493 
Hôlder, 2099 
utilisation, 2537, 2611 
isopérimétrique, 2249 
Jensen, 1507 
espérance conditionnelle, 2561 
pour une somme, 1507 
version intégrale, 2098 
Kantorovitch, 1508 
Markov, 2573 
Minkowski, 2101 
triangulaire, 508, 517 
inférence statistique, 2615 
infimum, 256 
injection, 118, 530 
intégrable, 1258 
fonction à valeurs vectorielles, 1261 
fonction non en escalier, 1832 
fonction positive, 1836 
intégrale 
calcul, 2239 
convergente, 1309, 1790 
d’une fonction sur une carte, 1749 
d’une fonction sur une variété, 2132 
d’une forme différentielle, 1761 
fonction en escalier, 1825 
Fresnel, 2079 
impropre, 1308, 1309 
sur un chemin, 1759 
intégrale d’une fonction, 1250 
intégrale d’une forme différentielle, 1761 
intégrale de Dirichlet, 1854 
intégrale sur une carte, 1745 
intégration 
fraction rationnelle, 1791 
intéressante, 113 
intérieur, 485 
d’un ensemble, 634 
point, 634 
interpolation, 2466 
intervalle, 120, 737, 757 
longueur, 1236 
Intervalle, 2727 
intervalle de confiance 
asymptotique, 2636 
invariance cyclique 
trace, 346 
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invariant 

de similitude, 719 
invariante 

mesure 

pour une chaine de Markov, 2678 

inverse 

dans un groupe, 174 
inverse généralisé, 2600 
inversion, 1916 

dans le groupe symétrique, 208 
inversion dans € LU {oo}, 1948 
involution, 689 
irrationalité 

V2, 239 
irréductible 

chaine de Markov, 2656 

dans un anneau, 179 

module, 222 

représentation, 1428 
isobarycentre, 598 
isométrie 

de forme quadratique, 668 

de l’espace euclidien R?, 1616 

espace euclidien 

isométries du cube, 406 

groupe, 540 
isométrie (forme bilinéaire), 669 
isométrie d'espaces métriques, 540 
isométrie positive, 1585 
isomorphisme, 844 

(Z/p2})* = Z/(p — 1)Z, 1708 

d’anneaux, 176 

de corps, 211 

espace affine, 595 

espace vectoriel normé, 883 

espaces vectoriels, 337 
isomorphisme d’espace topologique, 490 
isotrope 

cône, 666 

sous espace, 666 

totalement, 666 

vecteur, 666 


jacobien, 1053, 1147 
jacobien, 1053, 1147 
Jordan 

réduction, 721 
Jordan-Hôülder, 270 


Kronecker 
symbole, 332 

Kronecker 
symbole, 332 


lacet, 1776 
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lacet, 1776 
lacet de Jordan, 1776 
Lagrange 
multiplicateur, 1490 
polynôme, 680 
théorème, 269 
lagrangien, 1490 
langage, 2716 
itéré, 2717 
itéré strict, 2717 
unité, 2716 
vide, 2716 
Laplace 
transformée, 2563 
laplacien, 1985 
Legendre 
symbole, 1709 
Leibnitz, 987 
applications entre espaces vectoriels normés, 
896 
lemme 
Borel, 1417 
d’'Euclide, 288 
de Borel-Cantelli, 2571 
de Gauss 
contenu de polynôme, 1717 
pour des entiers, 288 
de Morse, 1837 
de Schreider, 271 
de Slutsky, 2570 
de transport, 1194 
de Zorn, 121 
des noyaux, 647 
Fatou, 1255 
Gauss 
dans un anneau principal, 305 
polynômes, 431 
Grôünwall, 2345, 2346 
Hadamard, 1460 
Schur complexe, 953 
Schur réel, 690 
lemme de regroupement, 2533 
lettres, 2715 
Levi-Civita, 1980 
libre 
action, 280 
partie, 327 
partie d’un module, 222 
librement engendré, 335 
Ligne d’univers, 2722 
limite, 705 
d’ensembles, 1187 
d’une fonction, 507 
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de fonctions holomorphes, 2081 
de suite 
espace topologique, 484 
inférieure, 749 
inversion, 1419, 1445, 2081, 2093 
permutation 
utilisation, 2563 
suite dans R??, 539 
suite numérique, 744 
supérieure, 749 
unicité, 508 
limite à droite, 926 
limite de suite, 484 
limite épointée, 914 
limite inductive, 2286 
limite inférieure, 749 
limite pointée, 914 
linéaire 
application, 336 
linéairement indépendant 
module, 219 
Lipschitz, 1463 
localement, 1068 
Lipschitzienne, 1067 
liste d'indices, 43 
localement 
intégrable, 1308 
log-concave, 1499 
logarithme 
complexe, 2033 
dans C, 2030 
de matrice, 1409 
sur les réels positifs, 1371 
logarithme d’une application, 2040 
loi 
x?, 2594 
binomiale 


comportement asymptotique, 2596 


conjointe, 2533 

de Poisson, 2581 

des grands nombres 
forte, 2573 


pour les chaines de Markov, 2680 


processus de Poisson, 2709 
utilisation, 2596, 2609 
marginale, 2533 
normale 
vecteur gaussien, 2588 
parente, 2615, 2616 
parente d’un échantillon, 2618 
réciprocité quadratique, 1712 
sans mémoire, 2583 
Student, 2594 


loi d’une variable aléatoire, 2564 
loi exponentielle, 2582 
loi stationnaire, 2656 
longueur 
arc géométrique, 1872 


d’un arc paramétré compact, 1856 


d’un intervalle, 1236 

d’une arrête, 1823 

élément de, 1867 
longueur d’arc, 1858 
Lotka-Volterra, 2380 


M-matrice, 2505 
M-matrice, 2505 
maigre, 1199 
maigre (ensemble), 568 
majorant, 119, 256 
essentiel, 2095 
Markov 
inégalité, 2573, 2621 
martingale, 2685 
bornée dans Z?(Q), 2686 
matrice, 345, 1172, 1964 
compagnon, 717 
creuse, 2475 
cyclique, 652 
d’une application linéaire, 348 
de dilatation, 363 
de permutation, 363 
de similitude, 1063 
de Sylvester, 623 
de transvection, 362 
dense, 2475 
équivalence, 365 
dans le groupe linéaire, 1177 
hermitienne 
racine carrée, 1165 
jacobienne, 1041, 1053 
normale, 953 
orthogonale, 361, 631 
permutation 
élémentaire, 2483 
racine carrée, 1165 
réductible, 2499 
semblable, 1165 
semblables, 1522 
symétrique, 1522 
réelle, 1520 
trigonalisable, 952 
matrice d’une forme bilinéaire, 667 
matrice de transition, 2654 
matrice positive, 770 
matrice primitive, 770 
matrice stochastique, 2655 


INDEX 


INDEX 


matrice-colonne, 345 
matrice-ligne, 345 
matrices 
similitude, 365 
matrices équivalentes, 682 
matrices semblables, 682 
maximale 
partie orthonormale, 2001 
maximum, 119, 136 
global, 1485 
local, 1485 
maximum local, 1485 
méromorphe, 2067 
mesurable 
application, 1187 
au sens de m*, 1193 
ensemble, 1185 
fonction, 1194 
Lebesgue, 1822 
mesure 
o-finie, 1184 
angle entre vecteurs, 1607 
complexe, 1288 
dans une carte, 1748 
de Borel, 1218 
de comptage, 1301, 1329 
de Lebesgue, 1239 
de Radon, 1218, 2062 
extérieure, 1181 
externe, 1822 
finie, 1184 
image, 1212 
positive, 1184 
probabilité, 2529 
produit, 1293 
régulière, 1218 
extérieure, 1218 
intérieure, 1218 
sur un ensemble de parties, 1181 
mesure o-finie, 1182 
mesure à densité, 1268 
mesure absolument continue, 1273 
mesure finie, 1182 
mesure signée, 1184 
mesures mutuellement singulières, 1273 
Méthode 
de Newton, 2446 
méthode 
des chemins, 1014 
Newton, 2452 
cas convexe, 2448 
métrisable 
espace vectoriel topologique, 543 
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minimum, 136 
ensemble ordonné, 119 
minimum local, 1485 
minorant, 119, 256 
modèle 
échantillonnage, 2616, 2618 
paramétrique, 2616 
modèle statistique, 2615 
modulaire (groupe), 1964 
module 
à gauche, 218 
de continuité, 903 
indécomposable, 222 
irréductible, 222 
simple, 222 
module d’un nombre complexe, 767 
module produit, 219 
moment, 2535 
fonction génératrice, 2563 
monogène, 218 
extension de corps, 444 
monoïde, 417 
monôme, 316 
monotone par morceaux, 1232 
monotonie, 2385 
morphisme 
d’algèbres, 223 
d’anneaux, 126 
de corps, 211 
espace vectoriel normé, 883 
Frobenius, 224 
morphisme de groupes, 125 
morphisme de modules, 218 
morphisme de produits tensoriels, 844 
mot, 2715 
longueur d’un mot, 2715 
mot vide, 2715 
nombre d’occurrences, 2715 
mot non vide, 2715 
moyenne 
de Cesàro, 831 
empirique, 2538 
empirique d’un échantillon, 2618 
quadratique, 2538 
multiindice, 42, 2285 
multiplicateur 
de Lagrange, 1490 
multiplication, 138 
multiplicité 
racine d’un polynôme, 321 
racine de f(x) = 0, 2445 
valeur propre 
algébrique, 951 
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géométrique, 951 


nabla, 1049 
nabla, 1049 
négatif, 248 
négligeable 
partie d’un espace mesuré, 1201 
neutre 
dans un groupe, 174 
Newton 
méthode, 2452 
nilpotent, 180 
niveau de confiance, 2632 
nombre 
complexe 
norme 1, 1704 
de Fermat, 1735 
dénormalisé, 2430 
normal, 2608 
normalisé, 2430 


premier, 391, 417, 1389, 1696, 1704, 1708 


dans leur ensemble, 197 
théorème des deux carrés, 419 
tours d’une courbe plane, 1892 
nombre premier 
décomposition, 288 
polynôme cyclotomique, 1701 
nombres complexes, 262 
non dénombrable, 159 
normal 
arc paramétré, 1873 
endomorphisme, 953 
nombre, 2608 
sous-groupe, 175 
normal extérieur 
vecteur, 1775 
normale 
loi réduite, 2587 
principale, 1883 
normalisateur, 175 
norme, 216 
d’algèbre, 803 
d'application linéaire, 801 
d’une application linéaire, 801 
euclidienne 
dans R"?, 781 
supremum, 795 
sur Z[iV5], 308 
normé 
espace vectoriel, 518 
norme maximum, 746 
norme quotient, 285 
norme suprémum, 1085 
normes équivalentes, 797 


noyau 
application vers un groupe, 266 
d’une forme bilinéaire, 666 
Dirichlet, 2236 
Fejér, 2236 
vers un espace vectoriel, 338 
noyau d’une forme bilinéaire, 661 
nulle part dense, 568 


observation, 2529 
observation, 2529 
opérateur 

défini positif, 692 
opérateur hermitien, 675 
opérateur unitaire, 675 
opérateurs 

compatibles, 2013 
opposés 

chemins, 1864 
orbite 

d’un point sous une action, 274 
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orbite d’un élément sous une permutation, 202 


ordre, 119 
bon ordre, 120 
d’un élément, 200 
d’un polynôme, 320 
d’une matrice carrée, 345 
dans un corps, 231 


de convergence d’un schéma, 2521 


distribution, 2300 
partiel, 119 
sur un anneau factoriel, 303 
total, 119 
ordre d’un groupe, 199 
orientation, 627, 1750, 1769 
orientation affine, 629 
origine 
abscisse curviligne, 1873 
repère affine, 605 
orthogonal, 673, 1996 
coordonnées curviligne, 1978 
famille de projecteurs, 222 
matrice, 631 
opérateur, 631 
sous-espace, 374 


orthogonal pour une forme bilinéaire, 661 


orthonormé, 781 
système, 1998 
oscillation 
d’une fonction, 938 
d’une fonction en un point, 938 
osculateur (cercle), 1888 
ouvert, 481, 635 
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parabolique 
équation aux dérivées partielles, 2419 
parabolique 
équation aux dérivées partielles, 2419 
parallèle 
sous-espaces affines, 596 
parallélogramme, 1753 
paramétrage, 1864 
normale, 1873 
paramétrages 
admissible, 1872 
Parseval, 2006 
partie 
génératrice, 218, 327 
régulière, 1134 
totale, 1998 
partie absolument convexe, 523 
partie absorbante, 523 
partie convexe, 516 
partie entière, 262 
partie équilibrée, 523 
partie fractionnaire, 262 
partie inductive, 742 
partie libre 
module, 219 
partie linéaire, 593 
partie négative, 1275 
partie nulle, 1275 
partie positive, 1275 
partie symétrique, 523 
partition 
dénombrable mesurable, 1224 
partition de l’unité, 2126 
passage aux classes, 492 
pavable, 1823 
pavage du plan, 1638 
pavé, 1822 
Pearson 
théorème, 2648 
peigne de Dirac, 2322 
période, 993 
permutation, 202 
matrice, 363 
permutation impaire, 208 
permutation paire, 208 
permuter 
dérivée et intégrale 
R”, 1458 
dans R, 1454 
dans R avec les bornes, 1457 
dérivée et limite, 1094 
différentielle et intégrale 
R?, 1459 


intégrale 
et série, 1329 
limite et intégrale 
convergence dominée, 1265 
convergence monotone, 1254 
espace mesuré, 1452, 1453 
série entière et dérivation, 1353 
série entière et intégration, 1356 
somme et intégrale, 1255, 1331 
permuter limite et intégrale, 1452 
petit théorème de Fermat, 413 
pacd 
calcul effectif, 285 
dans un anneau intègre, 179 
polynômes, 433 
pivotale, 2634 
plan 
projectif, 1921 
tangent, 1053, 1142 
plan affine, 969 
plan médiateur, 974 
plan vectoriel, 969 
Plancherel, 2006 
plongement, 1532 
Poincaré (demi-plan), 1964 
point 
d'équilibre 
stable, 2376 
pondéré, 598 
point adhérent, 486 
point critique 
définition, 1838 
point d’accumulation, 488 
point d'équilibre, 2376 
point extrémal dans un convexe, 1170 
point fixe, 2683 
attractif, 1462 
Brouwer, 2130 
Picard, 1463 
Schauder, 1755 
point intérieur, 485 
point isolé, 488 
Poisson 
formule sommatoire, 2264 
processus, 2708 
polaire 
nombre complexes, 1571 
pôle, 1657, 2065 
polydisque, 2083 
polygone, 1613 
polygone convexe, 1614 
polynôme 
à plusieurs indéterminées, 626, 1715 
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alterné, 476 
annulateur, 646, 650 
caractéristique, 656, 959 
contenu, 318 
cyclotomique, 1699 
irréductibilité, 1701 
propriétés, 1700 
d’endomorphisme, 1165 
décomposition de Dunford, 709 
de Bernstein, 2610 
irréductible 
sur F,, 1727 
minimal, 440 
d’un élément d’une extension, 436 
ponctuel, 650 
racines, 478 
semi-symétrique, 476 
symétrique, 476, 478, 621, 626, 1715 
élémentaire, 476, 479 
trigonométrique, 2133 
polynôme de Lagrange, 680 
polynôme de plusieurs variables, 300 
polynôme de Taylor, 1127 
polynôme dérivé, 467 
polynôme irréductible, 179 
polynôme primitif, 318 
polynôme scindé, 427 
polynôme séparable, 471 
polynôme trigonométrique, 2144 
polynômes, 225 
portée 
mesure, 1275 
positif, 248 
potentiel, 1766, 1798 
ppem 
dans un anneau intègre, 179 
prébase, 483 
précision 
simple, 2429, 2430 
préhilbertien, 1991 
premier 
corps, 411 
deux éléments d’un anneau principal, 197 
deux polynômes entre eux, 318 
idéal, 189 
premier type 
région solide, 1834 
préserve l'orientation, 629, 1585 
presque 
nulle, 282 
partout, 1187 
surjective, 2185 
primitif 
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élément d’un corps, 1708 
élément d’une extension de corps, 444 
racine, 1721 
triplet pythagoricien, 313 
primitive, 982, 1796 
de fonction continue, 1119 
et intégrale, 1310 
fonction, 1001 
primitive et intégrale, 1304 
principal 
anneau, 188 
idéal, 188 
principe 
prolongement analytique, 1539 
zéros isolés, 1538 
Principe de correspondance, 2737 
probabilité 
conditionnelle, 2539 
problème 
aux limites d'évolution, 2420 
aux limites stationnaires, 2419 
bien posé, 2420 
limite de Dirichlet, 2419 
limite de Von Neumann, 2419 
problème de Cauchy, 2395 
processus 
adapté à une filtration, 2685 
arrêté, 2690 
croissant prévisible, 2690 
Galton-Watson, 2681 
Poisson, 2708 
sans mémoire, 2583 
processus de comptage, 2701 
processus de Poisson, 2701 
produit, 138 
d’une mesure par une fonction, 1268 
de convolution, 2120 
et Fourier, 2261 
de langages, 2716 
de mots, 2715 
distribution et fonction, 2298 
espaces mesurés, 1294 
mixte, 789, 791 
scalaire 
en général, 672 
sur M(n,R), 965 
semi-direct, 281 
tensoriel 
de représentations, 1437 
vectoriel, 788 
produit de Cauchy, 1347, 1349 
produit extérieur, 862 
produit hermitien, 675 
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produit intérieur, 873 
produit pseudo-scalaire, 673 
produit remarquable, 2057 
produit scalaire sur IR”, 673 
produit tensoriel, 844, 846 
projecteur 
dans un module, 222 
projectif 
complétion, 1924 
droite, 1921, 1922 
espace, 1921 
groupe, 1928 
hyperplan, 1922 
plan, 1921 
repère, 1929 
sous-espace, 1921 
projection 
orthogonale, 1995 
projection normale, 2160 
projection orthogonale, 1590 
prolongement 
analytique, 1539 
utilisation, 2230 
de fonctions, 1531 
lemme de Borel, 1417 
méromorphe de la fonction L, 2075 
par continuité, 929 
dans H1(1), 2332 
par densité, 1531 
théorème de Hahn, 1210 


prolongement de fonctionnelle linéaire, 2183 


propriété d’intersection finie, 507 
propriété d’intersection non vide, 501 
propriété universelle, 844 
pseudo-dimension, 2217 
puissance 

d’un langage, 2717 

d’un mot, 2716 

d’un point, 1915 

d’un test, 2644 

d’une inversion, 1948 
pull back, 876 


quasi-compact, 500 

quasi-compact, 500 

quaternion, 474 

queue de liste d’indices, 43 

quotient, 186, 317 
dans une suite de composition, 270 
de groupe, 269 
de groupes, 390 

quotient d’un chemin, 2206 

quotient d’un espace vectoriel, 843 


racine 


carré 
de matrice hermitienne, 1165 
carré de matrice 
hermitienne positive, 1165 
d’un polynôme, 320 
de l’unité, 732, 1616, 1701, 1704, 1964 
primitive, 1693 
utilisation, 1700 
de polynôme, 451 
multiple, 2445 
primitive, 1721 
simple, 2445 


racine 


carré 
de matrice hermitienne, 1165 
carré de matrice 
hermitienne positive, 1165 
d’un polynôme, 320 
de l’unité, 732, 1616, 1701, 1704, 1964 
primitive, 1693 
utilisation, 1700 
de polynôme, 451 
multiple, 2445 
primitive, 1721 
simple, 2445 


racine carrée, 767 
racine de l’unité, 1691 
racine multiple, 321 
racine simple, 321 
raffinement, 1855 


subdivision d’un pavé, 1824 


rang, 340, 614, 702 


classe d'équivalence, 365 
diagonalisation, 691 
différentielle, 1490 
utilisation, 1997 


rang d’une forme quadratique, 671 
rang d’une matrice, 363 

rare, 1199 

rationnels, 234 

rayon 


de convergence, 1339 
de courbure, 1883 
de torsion, 1884 
spectral, 803, 1113 


réciproque 


dérivabilité, 996 


recouvrement, 500 
rectangle 


produit de tribus, 1233 


rectifiable, 1856 


arc géométrique, 1872 
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96 


récurrent 
état, 2660 
nul, 2660 
point d’un système dynamique, 1220 
positif, 2660 


réduction 
d’endomorphisme, 709 
Jordan, 721 

réduction de Frobenius, 719 

réel, 244 


réflexif, 2191 
réflexion, 1626 
dans R?, 1590 
glissée, 1623 
par rapport à un hyperplan, 1581 
région 
critique, 2643 
de confiance exacte, 2634 
de rejet, 2643 
règle du produit nul, 180 
régularité 
d’une mesure, 1218 


extérieure de la mesure de Lebesgue, 1242 
intérieure de la mesure de Lebesgue, 1245 


régulier 

arc, 1870 

point d’un arc, 1870 
régulier à droite, 179 
régulière 

surface, 1766 
rejet 


région dans une prise de décision, 2643 


relation anormale, 2462 
relation binaire, 119 
relation d'équivalence, 124 
relations 
coefficient-racines, 479 
de Chasles, 589, 1810 
relativement compact, 501 
relèvement, 1893 
repère 
affine, 605 
cartésien 
espace affine, 590 
de Frenet, 1884 
projectif, 1929 
représentation, 375 
de groupe fini 
caractères de S41, 1438 
fidèle, 375 
groupe diédral, 1687 
irréductible, 1428 
produit tensoriel, 1437 


régulière gauche, 1433 

virgule fixe, 2429 
Représentation 

virgule flottante normalisée, 2429 
répulsif 

point fixe, 1462 
résidu 

méthode itérative, 2497 
résolvante, 2356 
reste, 186, 317 

d’un développement limité, 1134 
restriction d’une distribution, 2306 
résultant, 623 

utilisation, 626, 1791 
Riemann 

fonction, 1386 
risque 

première espèce, 2644 

quadratique, 2623 

seconde espèce, 2644 
rotation 

en dimension 2, 1594 
rotation d’angle 0, 1598 
rotation-homothétie, 1947 
rupture 

corps, 452 


schéma 
consistant, 2520 
schéma 
consistant, 2520 
schéma discret convergent, 2521 
schéma numérique, 2520 
Schrôdinger, 2391 
Schur (théorème), 1431 
section, 1017 
de graphe, 1002 
propriété des, 1290 
segment 
dans IR?, 752 
dans un espace affine, 598 
semi-défini positif, 692 
semi-simple 
endomorphisme, 653 
semi-symétrique 
polynôme, 476 
seminorme, 269 
seminorme quotient, 585 
seminormes séparantes, 582 
séparable, 1998 
élément d’une extension, 472 
espace topologique, 494 
extension de corps, 472 
polynôme non constant, 471 
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sépare 

les points, 1115 
séquentiellement fermé, 542 
série 


dans un espace vectoriel normé, 811 


de Fourier, 2243, 2264 
utilisation, 2249 
de puissance, 1339 
donnant (1— A)-!, 898 
entière, 1339, 1419, 2264 
Abel angulaire, 1786 
processus de Markov, 2683 
utilisation, 2563 
fonctions, 1445, 2264 
génératrice d’une suite, 1399 
géométrique, 828 
nombres, 1445 
numérique, 1389, 1419 
Riemann, 829 
Taylor, 1400 
série convergente, 811 
série de Laurent, 2253 
série de Taylor, 1127 
série divergente, 811 
série entière 
fonctions holomorphes, 2049 
série harmonique, 828 
sesquilinéaire, 674 
signature, 208 
forme quadratique, 671 
similitude, 1063 
simple 
extension de corps, 444 
fonction, 1228 
module, 222 
singularité, 2065 
singularité effaçable, 2065 
singularité isolée, 2065 
sinus, 1541 
hyperbolique, 1391 
sinus cardinal, 1556, 1845 
solfège, 1692 
solution 
générale, 2394 
particulière, 2394 
somme 
inférieure, 1828 
partielle, 811 
supérieure, 1828 
somme directe, 376 


somme directe (de représentations), 1427 


somme directe topologique, 520 
somme partielles 


Abel angulaire, 1786 
sommet, 1908 
Sophie Germain, 413 
sous arc, 1855 
sous-additivité 

sur algèbre de parties, 1182 
sous-anneau, 184 
sous-Corps premier, 411 
sous-espace 


affine engendré par une partie, 596 


caractéristique, 706 
sous-groupe 

caractéristique, 175 

distingué, 391 

dans le groupe alterné, 399 

engendré, 216 

normal, 269, 390 
sous-groupe distingué, 175 
sous-martingale, 2685 
sous-module, 222 
sous-module engendré, 219 
spectre 

matrice hermitienne, 785 

matrice symétrique réelle, 691 
spectre d’un endomorphisme, 645 
sphère, 511 

de Riemann, 1944 
stabilisateur, 274 
stabilité 

d’un point d'équilibre, 2376 

Lyapunov, 2376 
stable, 2437 

schéma numérique, 2523 
stathme 

sur Z[i], 416 
stathme euclidien, 194 
stationnaire 

chaine de Markov, 2678 
statistique, 2623 
statistiques 

descriptives, 2615 
strictement 

convexe 

sur R”, 1502 

strictement convexe, 1492 
structure 

complexe, 1890 


structure d’anneau canonique, 177 


structure réelle, 377 

Student, 2594, 2636 

subdivision, 1824 
associée à une fonction, 1824 
d’un intervalle, 1855 
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subordonnée 
norme, 801 
subpotent, 152 
suite, 282 
arithmético-géométrique, 829 
de Cauchy, 544 
dans un corps, 232 
de fonctions, 2093 
théorème de Montel, 2229 
de fonctions intégrables, 1452, 2081 
de Jordan-Hôülder, 270 
définie par itération, 2452 
équirépartie, 2239 
critère de Weyl, 2239 
exacte, 280 
régularisante, 2266 
suite de composition, 269 
suite de variables aléatoires de Bernoulli, 2681 
suites adjacentes, 748 
support, 1825 
d’une permutation, 202 
distribution, 2300 
famille d'éléments, 282 
supremum, 256 
d’une suite d’ensembles, 1179 
sur-martingale, 2685 
surface paramétrée, 1766 
surjection, 118, 530 
surpotent, 152 
Sylow 
p-Sylow, 382 
Sylvester (matrice), 623 
symbole 
de Legendre, 1709 
symbole principal, 2409 
symétrique 
polynôme, 476 
système 
fondamental, 2353 
orthonormé, 1998 
trigonométrique, 1999, 2132 
système trigonométrique, 2155 


tangent 

vecteur unitaire, 1883 
tangent 

vecteur unitaire, 1883 
tangente, 1559, 1878 
Tangente hyperbolique, 2731 
tangente hyperbolique, 1393 
taubérien, 1444 
taux d’accroissement, 1493 
Taylor 

série entière, 1399 
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Taylor avec reste intégral, 1821 
temps d'arrêt, 2688 
temps de première atteinte, 2659 
temps de retour, 2659 
tenseur, 851 
tenseur alterné, 858 
tenseur symétrique, 858 
terminée 
martingale, 2689 
test, 2643 
bilatéral, 2644 
unilatéral, 2644 
tétraèdre régulier, 975 
théorème 
accroissements finis, 894 
dans KR, 997 
forme générale, 1066 
Ascoli, 2086 
Banach-Steinhaus, 837 
avec seminormes, 2086 
base incomplète, 332 
Beppo-Levi, 1254 
Bézout 
polynômes, 430 
utilisation, 624 
Bolzano-Weierstrass, 513 
Borel-Cantelli, 2529 
Borel-Lebesgue, 743 
Brouwer, 2131 
dimension 2, 2052 
Carathéodory, 602 
Cauchy 
groupe, 292 
Cauchy-Arzela, 1756 
Cauchy-Lipschitz, 1465 
Cayley-Hamilton, 658, 1164 
central limite, 2575 
processus de Poisson, 2710 
Chevalley-Warning, 1715 
chinois, 422 
anneau principal, 194 
Cochran, 2620 
Cochrane, 2621 
convergence 
dominée de Lebesgue, 1265 
monotone, 1254 
de Baire, 588 
de Jordan, 2219 
de représentation de Riesz, 1997 
décomposition des noyaux 
et exponentielle de matrice, 1412 
des deux carrés, 419 
version faible, 417 
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Dini, 1087 
Dirichlet, 2236 

forme faible, 1704 
Doob, 2689 
du rang, 341 
élément primitif, 1717 
élément primitif, 473, 1718 
extension d’isométrie, 1532 
Fejér, 2238 
fonction implicite dans IR, 1478 
fonction implicite dans Banach, 1477 
Fubini 

dans R’", 1329 

espace mesuré, 1324 

version compacte dans IR?, 1800 
Fubini-Tonelli, 1322 
fuite des compacts, 2359 
Gauss 

polynômes, 431 
Gauss-Wantzel, 1735 
Glivenko-Cantelli, 2628 
Hahn-Banach, 2177 
Hardy-Littlewood, 1445 
Heiïine, 943 
incidence, 1922 
inversion locale, 1475 

utilisation, 1490, 1837 
isomorphisme 

second, 266 

troisième, 267 
isomorphisme de Banach, 2085 
Kronecker, 626 
Lagrange, 269 
Lie-Kolchin, 956 
Lotka-Volterra, 2380 
Markov-Takutani, 1757 
Montel, 2229 
Pappus 

affine, 1926 

projectif, 1927 
Pearson, 2648 
petit de Fermat, 413 
Picard, 1463 
point fixe 

Brouwer, 2052 
projection 

cas vectoriel, 1995 

partie fermée convexe, 1993 
prolongement de Hahn, 1210 
prolongement de Riemann, 2066 
Radon-Nikodym, 1281 

complexe, 1288 
Rolle, 996 


Rothstein-Trager, 1791 
Runge, 2055 
Schauder, 1755 
Schur, 1431 
spectral, 707 
autoadjoint, 780 
matrice symétrique, 691 
matrices normales, 953 
stabilité de Lyapunov, 2376 


Stone-Weierstrass, 1116, 1118, 1119 


Sylvester, 702 
taubérien, 1444 
taubérien faible, 1788 
transfert, 2565 
Tykhonov, 564 
dénombrable, 566 
fini, 566 
valeurs intermédiaires, 766 
Von Neumann, 1484 
Wedderburn, 1704 
Weierstrass, 514 
théorème de Baire, 568 
théorème de Cartan-Dieudonné, 1583 
théorème des extrémums liés, 1490 
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théorème fondamental du calcul intégral, 1304 


topologie, 481, 636 

+-faible, 586, 2297 

p-adique, 906 

discrète, 483 

engendrée par une famille, 483 

forte, 803 

grossière, 483 

métrique, 509 

sur Z(Q) , 2287 

sur Z(K) , 2287 

sur GP(Q) , 2287 

sur dual topologique, 586 

usuelle sur R?, 636 
topologie des seminormes, 576 
topologie faible, 2219 
topologie induite, 487 
topologie initiale, 490 
topologie produit, 485 
topologie quotient, 492 
torsion, 1884 

d’un groupe, 282 
totale, 1998 
trace, 2338 

dual de M(n, K), 681 

endomorphisme, 684 

matrice, 684 

produit scalaire sur M(n,R), 965 


unicité pour la propriété de trace, 681 
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transcendant, 437 
transformation 
Fourier, 2264 
gaussienne, 2477 
transformée 
de Cauchy, 2062 
de Fourier, 2259, 2562 
continuité, 2262 
groupe abélien fini, 1425 
Fourier 
distribution tempérée, 2318 
Laplace, 2563 
transient 
état, 2660 
transition 
probabilité, 2653 
transitoire 
état, 2660 
transposé, 630 
transposée, 678 
transposition, 207 
transvection, 1156 
transvection (matrice), 362 
transversale, 277 
tribu, 1179 
borélienne, 1195 
de Baire, 1199 
de Lebesgue, 1239 
induite, 1181 
produit, 1233 
tribu de Lebesgue sur S1, 1575 
tribu engendrée, 1180 


tribu engendrée par une application, 1180 


trigonalisation 


et polynôme caractéristique, 952 


simultanée, 956 
triplet 
pythagoricien, 313 
triplet naturel, 126 
type 
fini 
en algèbre, 474 
espace vectoriel, 330 


unicité 

des mesures, 1190 
unicité 

des mesures, 1190 
uniformément continue, 568 
uniformément convexe, 2159 
unipotent, 180 
unitaire 

normale principale, 1883 


valeur 
principale (distribution), 2316 
propre, 645 
valeur 
principale (distribution), 2316 
propre, 645 
valeur absolue, 262 
p-adique, 906 
valeur principale, 2031 
valeur propre 
d’une forme quadratique, 704 
forme quadratique, 703 
valeur singulière, 710 
valuation 
p-adique, 906 
valuation d’un polynôme, 225 
Vandermonde (déterminant), 620 
variable 
de décision, 2644 
variable aléatoire, 2530 
absolument continue, 2530 
Bernoulli 
marche aléatoire, 2668 
utilisation, 2611 
binomiale 
utilisation, 2692 
centrée, 2537 
de Bernoulli 
utilisation, 2692 
de Rademacher, 2593 
variance, 2538 
empirique, 2538, 2619 
empirique corrigée, 2619 
vecteur gaussien, 2588 


variation des constantes, 2349, 2354 


variété, 1490, 1741 
variété 
orientée, 1751 
variété orientable, 1751 
vecteur 
cyclique, 652 
gaussien, 2588 
propre, 645 
unitaire normal, 1883 
unitaire tangent, 1878 
vecteur propre à gauche, 770 
Vitali (ensemble), 1246 
vitesse d’un chemin, 1855 


vitesse de convergence de suites, 1388 


voisinage, 482, 636 

volume 
d’une région solide, 1835 
région bornée dans R°, 1833 
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volume dans IR, 1752 
vraisemblance, 2626 


Weiner 

constante, 2759 
Weiner 

constante, 2759 
Wronskien, 2383 
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Liste des notations 


Algèbre 

[L : K] degré d’une extension de corps, page 435 

(p) idéal engendré par p, page 184 

L(E,F) Ensemble des applications linéaires de E dans F, page 336 
F, lorsque p est premier, page 411 

Fr corps fini à p” éléments, page 1706 

( 


A) corps contenant K et À, page 444 
[A] anneau contenant K et À, page 444 


K 
K 
Frac(A) Le corps des fractions de l’anneau À, page 231 

Fun(X, Y) les applications de X vers Ÿ, page 177 
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Chapitre 0 


Introduction 


0.1 Auteurs, contributeurs, sources et remerciements 


Les remerciements, dans chaque catégorie, sont mis dans l’ordre chronologique approximatif. 


0.1.1 Ceux qui ont travaillé sur le Frido 
(1) Carlotta Donadello pour l’ensemble du cours de CTU de géométrie analytique 2010-2011. 
Une grosse partie de « analyse réelle » vient de là. 


(2) Les étudiants de géométrie analytique en CTU 2010-2011 ont détecté d'innombrables co- 
quilles. Les étudiants du cours présentiel de géométrie analytique 2011-2012 ont signalé un 
certain nombre d’incorrections dans les exercices et les corrigés. Les agrégatifs de Besançon 
2011-2012 pour leurs plans et leurs développements. 


(3) Lilian Besson pour m'avoir signalé un paquet de fautes, et quelques points pas clairs en 
statistiques. 


(4) Plouf qui m’a signalé une coquille dans le fil la-selection-scientifique-de-la-semaine-numero- 
106. 


(5) Benjamin de Block pour des coquilles et une mise au point sur les conventions à propos de 
R* et (R*)*. 
(6) Olivier Garet pour avoir répondu à plein de questions de probabilités. 


(7) François Gannaz pour de la relecture et une version plus claire de la preuve (et de l'énoncé) 
de la proposition 19.8. 


(8) Danarmk pour des réponses à des questions dans les commentaires (allongement pour éviter 
un Overfull hbox) http://linuxfr.org/nodes/110155/comments/1675589. Et aussi pour 
une discussion à propos de la topologie sur Z(Q). 


(9) Cédric Boutilier pour des réponses à des questions de probabilité statistique. https:// 
github.com/LaurentClaessens/mazhe/issues/16 


(10) Remsirems pour des réponses à des questions d’analyse ! 


(11) Bertrand Desmons pour plusieurs patchs rendant plus clairs de nombreux passages sur les 
suites de Cauchy dans Q. 


(12) Anthony Ollivier pour m'avoir fait remarquer qu’il n’est pas vrai que A[X] est euclidien 
lorsque À est intègre (contre-exemple : À = Z). Ça fait une faute de moins dans le Frido. 


(13) ybailly pour avoir détecté un bon nombre de coquilles dans la partie sur les ensembles de 
nombres. 


(14) Éric Guirbal pour le remplacement de frenchb par french. 


1. http://linuxfr.org/nodes/110155/comments/1675813 
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(15) cdrcprds pour une réponse à une question d’algèbre, démonstration à l’appui à propos de 
pgcd. Également pour sa relecture sans pitié de la partie sur la cardinalité (en particulier 
A % A\B) et pour avoir pointé l'utilité du théorème de comparabilité cardinale. 


(16) Antoine Bensalah pour avoir répondu à une question sur Lax-Milgram tout en même temps 
que pointé une erreur dans la démonstration et fourni l’exemple 25.62 sur l’optimalité de 
l'inégalité. 

(17) Guillaume Deschamps pour ses remarques à propos du fait que le chapitre « constructions 
des ensembles » est très ardu. 

(18) Guillaume Barriere pour sa relecture attentive jusqu'aux corps. 

(19) Samy Clementz pour avoir découvert une faute dans la définition de mesure positive sur un 

espace mesurable. 

Sylvain Rousseau pour avoir clarifié une construction dans le théorème de Bower version C®. 

Maxmax pour des typos dans l’index thématique. 

Laurent Choulette pour une typo dans les propriétés du neutre d’un groupe. 


Pierre Lairez pour la démonstration du théorème d’inversion de limite et de dérivée 12.384 
sans passer par les intégrales (et les lemmes correspondants à propos du module de conti- 
nuité). 

(24) Gregory Berhuy pour des réponses d’algèbres dans les catégories facile, moyen et difficile. 


(25) Benoît Tran pour avoir signalé un paquet de typos dans la démonstration de l’ellipsoïde de 
John-Loewner et ses dépendances. 


(26) Provatiscus pour avoir signalé un paquet de choses pas claires, et surtout pour avoir trouvé 
une faute dans la démonstration du fait qu’une fonction continue sur Q se prolonge en 
une fonction continue sur R. Et pour cause : cet énoncé est faux. https://github.com/ 
LaurentClaessens/mazhe/issues/124 


(27) William pour l’environnement example qui gère correctement le triangle. 

(28) Colin Pitrat pour de nombreuses remarques, typos et relecture de théorèmes. 

(29) Bruno Turgeon pour une très belle moisson de fautes de frappe (euphémisme pour dire « mon 
ignorance crasse de l’orthographe »). 

(30) Sacha Dhénin pour une belle quantité de fautes de frappes et pour avoir soulevé quelques 
points pas clairs (par exemple la définition du sous-groupe engendré dans le cas de la partie 
vide). 

(31) Patrice Goyer pour m'avoir signalé quelques fautes et pas mal de points pas clairs dans les 
polynômes et dans la théorie généraliste des ensembles. Et pour m'avoir fait remarquer (deux 
fois) que mon script de déploiement ne marchait pas. 

(32) Alain Vigne pour une quantité (presque) indénombrable de fautes d'orthographe et de mau- 
vaises tournures de phrase dans les espaces vectoriels, la construction de nombres, la théorie 
des groupes et les anneaux. Il m’a également pointé quelques fautes et points vraiment pas 
clairs dans des démonstrations dont la correction a permis de bien améliorer la qualité du 
texte. 


(33) Quentin Guyot pour une quantité de typos proche du nombre de Graham dont beaucoup 
me semblent impossible à détecter sans une lecture attentive; (au moins) huit entrées dans 
l’erratum lui sont dues (au sens où c’est lui qui les a trouvées, pas qu'il les a causées). 


(34) Jean Abou Samra pour la démonstration de la connextité par ares C1. 


(35) jperon pour le classement de l’index en comptant les é comme des é. Voir [4]. 


0.1.2 Aide directe, mais pas volontairement sur le Frido 


(1) Plein de monde pour diverses contributions à des énoncés d’exercices. Pierre Bieliavsky pour 
les énoncés d’analyse numérique (MAT1151 à Louvain la Neuve 2009-2010). Jonathan Di 
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Cosmo pour certaines corrections de MAT1151. François Lemeux, exercices sur les normes 
de matrices et correction de coquilles. Martin Meyer et Mustapha Mokhtar-Kharroubi pour 
certains exercices du cours Outils mathématiques (surtout ceux des DS et examens). 


(2) Nicolas Richard et Ivik Swan pour les parties des exercices et rappels de calcul différentiel 
et intégral (Université libre de Bruxelles, 2003-2004) qui leurs reviennent. 


(3) Carlotta Donadello pour la partie géométrie analytique : topologie dans R”, courbes, inté- 
grales, limites. (Université de Franche-Comté 2010-2012) 


(4) Le forum usenet de math, en particulier pour la construction des corps fini dans le fil « Vérifier 
qu’un polynôme est primitif » initié le 20 décembre 2011. 


(5) Mihai Bostan nous a donné ses notes manuscrites de son cours présentiel de géométrie ana- 
lytique 2009-2010. (Presque) Toute la structure du cours de géométrie analytique lui est due 
(qui est maintenant fondue un peu partout dans les chapitres d’analyse). 


0.1.3 Des gens qui ont fait un travail qui m’a bien servi 


(1) Arnaud Girand pour avoir mis ses développements bien faits en ligne. Une bonne vingtaine 
de résultats un peu partout dans ces notes viennent de lui. 


(2) Le site http://www.les-mathematiques.net m’a donné les preuves de nombreux résultats. 


(3) Pierre Monmarché pour son document en ligne tout plein de développements, et des réponses 
à des questions. 


(4) Tous les contributeurs du Wikipédia francophone (et aussi un peu l’anglophone) doivent être 
remerciés. J'en ai pompé des quantités astronomiques ; des articles utilisés sont cités à divers 
endroits du texte, mais ce n’est absolument pas exhaustif. 


(5) Les intervenants du fil « Antisymétrisation, alterné, déterminant et caractéristique » sur 
les-mathematiques.net m'ont bien aidé pour la section sur les déterminants 9.1 (bien qu’ils 
ne le savent pas). 


(6) Xavier Mauquoy pour l’énoncé et la preuve du théorème 3.36. 


(7) David Revoy pour les dessins de Pepper&Carrot de la couverture. 


J’ai souvent donné entre parenthèses à côté des mots « théorème », « lemme » ou « proposition » 
une ou plusieurs références vers les sources de la preuve que je donne. Ce sont parfois des liens vers 
la bibliographie ; parfois aussi des liens hypertextes vers des sites, des blogs, etc. Tous ces gens ont 
fait du bon boulot. Sans toute cette « communauté », l'internet serait mort ?. 


0.2 Originalité 


Ces notes ne sont pas originales par leur contenu : ce sont toutes des choses qu’on trouve 
facilement sur internet ; je crois que la bibliographie est éloquente à ce sujet. Ce cours se distingue 
des autres sur les points suivants. 


La longueur J’ai décidé de ne pas me soucier de la taille du fichier. Il fera cinq mille pages s’il le 
faut, mais il restera en un bloc. Étant donné qu’il n’existe qu’une seule mathématique, il ne 
m'a pas semblé intéressant de produire une division artificielle entre l’analyse, la géométrie 
ou l'algèbre. Tous les résultats d’une branche peuvent (et sont) être utilisés dans toutes les 
autres branches. 
Dans cette optique, je me suis évertué à ne créer que des références « vers le haut ». À moins 
d’oubli de ma part ?, il n’y a aucun endroit du texte qui dépend d’un lemme démontré plus 
bas. Le fait qu'un théorème B soit plus bas qu’un théorème À signifie qu’on peut démontrer 
À sans savoir B. 


2. Cette dernière phrase doit être comprise comme un appel à ne pas utiliser Moodle et autres iCampus pour 
diffuser vos cours de math, ou en tout cas pas comme moyen exclusif. 
3. Par exemple pour les théorèmes pour lesquels je n’ai pas lu ni a fortiori écrit de preuves. 
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La licence Ce document est publié sous une licence libre. Elle vous donne explicitement le droit 
de copier, modifier et redistribuer. 


Les mises à jour Ce document est régulièrement mis à jour. Des fautes d'orthographe sont corri- 
gées (presque) chaque jour. Si vous me signalez une faute de mathématique, elle sera corrigée. 


Transparence Je ne fais pas semblant que ces notes soient parfaites. Les points sur lesquels je ne 
suis pas sûr, les preuves que j'ai inventées moi-même sont clairement indiqués pour inciter le 
lecteur à redoubler de prudence. Une liste de questions à résoudre est inclue en la section 0.7. 
Voir 0.3 pour plus de détails. 


0.3 Les choses qui doivent vous faire tiquer 
SECooWVHBooCaYoXxP 
Un cours de math doit toujours être lu attentivement, surtout si vous avez l'intention de 
resservir à un jury le fruit de vos lectures. Dans ce livre, trois éléments doivent vous faire redoubler 
de prudence. 


La référence [1] D'abord les références à [1] indiquent qu’une bonne partie de ce qui suit est de 
l’invention personnelle de l’auteur. Cela ne veut évidemment pas dire que c'est moi qui ai 
découvert le résultat. Ça veut dire que je n’ai pas trouvé le résultat ou certaines parties de 
la preuve. 


Les notes en bas de page Certaines notes en bas de page sont écrites dans une fonte spéciale {. 
Elles indiquent des points sur lesquels je doute ou des étapes de calculs que je ne parviens 
pas à reproduire en suivant mes sources. Lorsque vous voyez une telle note, redoublez de 
prudence, allez voir la source, et écrivez-moi si vous pouvez résoudre le problème. 


Les environnements dédiés Et enfin certains problèmes sont indiqués plus longuement dans 
un environnement dédié en petits caractères comme ceci : 


ii Avertissement/question au lecteur !! 0.1 

Les choses écrites comme ceci sont des questions ou des éléments sur lesquels j'ai un doute. 
Lisez-les attentivement. Ces notes mentionnent des points que personnellement je n’oserais 
pas affirmer plein d’aplomb à un jury d’agrégation. 


0.4 Quelques choix qui peuvent provoquer des quiproquos 


Comme tout cours de mathématique, ce cours fait des choix qui sont parfois discutables. Voici 
quelques points sur lesquels les choix faits ici ne sont peut-être pas ceux fait par tout le monde. 
Ce sont donc des points sur lesquels vous devez faire attention pour éviter les quiproquos lors par 
exemple d’un oral dans un concours. 


(1) Nous utilisons la définition « épointée » de limite d’une fonction en un point. Elle diffère 
de celle donnée par le ministère de l’enseignement en France. Si votre but est de passer 
un concours d'enseignement en France, vous devriez lire 12.2; dans tous les autres cas, la 
définition prise ici est celle qu’il vous faut. 

(2) Un compact est une partie d’un espace topologique pour lequel tout recouvrement par des 
ouverts admet un sous-recouvrement fini. Le fait d’être séparable n’est pas inclus dans la 
définition de compact. De nombreux textes français incluent la séparabilité dans la compacité. 

(3) Le logarithme sur C est une application In: C* — C définie partout sauf en zéro. Elle n’est 
donc pas continue sur la fameuse demi-droite. À ne pas confondre avec une détermination 
du logarithme qui est par définition continue et donc non définie sur la demi-droite. 

Cela est un choix très discutable. La raison de donner à la notation « In » cette signification 
est simplement de suivre l’usage de Sage. Pour Sage, In(—1) existe et vaut ir. 
Voir les remarques 26.41. 


4. Les notes comme celle-ci signifient qu'il y a certaines choses dont je ne suis pas sûr. 
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(4) Le mot « corps » n'implique pas la commutativité bien que tous les corps du Frido soient 
commutatifs, et nous n’utilisons pas la terminologie « anneau à division ». Voir la section -2.3 
et la discussion 6.1. 


0.5 Autres choix pas spécialement standards 


Nous listons ici quelques choix qui n’induisent pas de différences ou d’incompatibilité avec les 
autres cours, mais qui doivent être compris et justifiés. 


(1) Nous n'utilisons pas les notations o(x) ou autres O(N?). D'abord parce que je n’ai jamais 
très bien compris comment elles fonctionnent, et ensuite (surtout) parce que ces notations 
induisent en erreur. Ce sont des notations qui cachent, sous des notations a peu près intuitive, 
l’utilisation de théorèmes pas simples. 


Écrire 

f(x) = P(x) + o(x?), (0.1) 
c’est un peu comme quand on écrit (horreur !) 

Fax) = fred + C. (0.2) 


Où est le x à droite ? Quel est le statut de C'? 
Même chose pour la notation f(x) = P(x)+o(x?). Le x de o(x?) est-il le x qu’on a à gauche ? 
Si g(x) = Q(x) + o(x?), est-ce le même o que celui de f ? 

(2) Nous allons être plus calme avec la notation A[X] pour les polynômes sur l’anneau À, et 
encore moins A[X:,...,X,] pour les polynômes de n variables. Au lieu de cela nous utilisons 
P(A) et Ph(A). 

Est-ce que vous diriez que A[X] = A[Y]? Quelle est exactement la nature de X dans 
P = X? +1 ou dans P(X) = X? +17? Si P e A[X] vaut P(X) = X? et si Q € A[Y] vaut 
Q(Y) = Y?, est-ce que vous oseriez écrire P = Q7? 


0.5.1 Mathématique intéressante 
DEFooDABVooKdDyBiw 


Définition 0.2. 
Une notion mathématique est intéressante si elle permet de répondre à une question que l’on 
peut se poser sans connaître la notion. 


Exemple 0.3. 
Étant donné un segment dans le plan, quels sont les triangles rectangles dont ce segment est 
l’hypoténuse ? 

Nous n'avons pas besoin de cercles pour poser cette question. Mais nous avons besoin de 
connaissances sur les cercles pour y répondre. Donc l’étude des cercles est intéressante. PA 


Exemple 0.4. 
Comment fonctionne la gravitation ? 

Cette question peut être posée sans connaitre de calcul tensoriel, d'équations différentielles ou 
d’intégrales. Et pourtant, tous ces concepts sont utiles pour y répondre. A 


0.6 Sage est là pour vous aider 


Il existe de nombreux logiciels de mathématique. Notre préféré est Sage pour une raison très 
précise : Sage est (en simplifiant) un module pour python. Donc quand on travaille en Sage, on 
dispose de tout Python. La syntaxe et la structure de Sage ne sont pas ad hoc pour faire des maths, 
et ce qu’on apprend en Sage peut être recyclé pour faire n'importe quoi : navigateur web, script 
de manipulation de texte, traitement d'image, réseau neuronaux, ... 

Sage est un logiciel disponible pour l'épreuve de modélisation de l’agrégation de mathématique ; 
il y a donc de bonnes chances que vous en ayez l’usage. 
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0.6.1 Lancez-vous dans Sage 


(1) Aller sur http://www.sagemath.org, 
(2) créer un compte, 


(3) créer des feuilles de calcul et s’amuser !! 


Il y a beaucoup de documentation sur le site officiel ”, et nous vous conseillons particulièrement 
le livre [5]. 

Si vous comptez utiliser régulièrement ce logiciel, je vous recommande chaudement de l'installer 
sur votre ordinateur. 


0.6.2 Exemples de ce que Sage peut faire pour vous 


Ce livre est émaillé de petits bouts de code en Sage montrant ses différentes fonctionnalités là 
où nous en avons besoin. Voici une liste (non exhaustive) de ce que Sage peut faire pour vous. 


(1) Calculer des limites de fonctions, exemples 43.1 et 43.2. 

(2) Tracer des graphes de fonctions, exemple 43.2. 

(3) Tracer des courbes en trois dimensions, voir exemple 12.210. Notez que pour cela vous devez 
installer aussi le logiciel Jmol. Pour Ubuntu, c'est dans le paquet icedtea6-plugin. 

(4) Calculer des dérivées partielles de fonctions à plusieurs variables, voir exemple 43.3. 

(5) Résoudre des systèmes d'équations linéaires. Voir les exemples 43.4 et 43.5. Lire aussi la 
documentation. 

(6) Tout savoir d’une forme quadratique, voir exemple 43.6. 

(7) Calculer la matrice hessienne de fonctions de deux variables, déterminer les points critiques, 
déterminer le genre de la matrice hessienne aux points critiques et écrire les extrémums de la 


fonctions (sous réserve d’être capable de résoudre certaines équations), voir les exemples 43.7 
et 43.8. 


(8) Indiquer une infinité de solutions à une équation en utilisant des paramètres. L'exemple 43.9 
montre ça avec une équation algébrique. Un exemple concernant des fonctions trigonomé- 
triques : 


sage: solve(sin(x)/cos(x)==1,x,to_poly_solve=True) 

[x == 1/4xpi + pixz1] 

sage: solve(sin(x)*x*2==cos(x)*xx2,x,to_poly_solve=True) 

[sin(x) == cos(x), x == -1/4xpi + 2*pixz86, x == 3/4xpi + 2*xpixz84] 


Notez l'option to_poly_solve=true dans solve. 
(9) Calculer des dérivées symboliquement, voir exemple 43.10. 
(10) Calculer des approximations numériques comme dans l'exemple 43.11. 


(11) Calculer dans un corps de polynômes modulo comme F,[X]/P où P est un polynôme à 
coefficients dans F,. Voir l’exemple 19.62. 


Sage peut en général faire tout ce que vous êtes capable de faire à l’entrée en master et 
probablement bien plus, à la notable exception des limites à deux variables. 


Remarque 0.5. 

Sage peut toutefois vous induire en erreur si vous n’y prenez pas garde parce qu’il sait des choses 
en mathématique que vous ne savez pas. Par conséquent il peut parfois vous donner des réponses 
(mathématiquement exactes) auxquelles vous ne vous attendez pas. Voir par exemple 15.144 pour 
le logarithme de nombres négatifs. Et aussi ceci : 


5. http://www.sagemath.org 
6. Soit un vrai besoin comme tracer un graphique en 3D, soit de la paresse comme calculer une grosse dérivée. 


) 
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SageMath version 7.3, Release Date: 2016-08-04 
Type "notebook()" for the browser -based notebook interface. 
Type "help()" for help. 


sage: limit (1/x,x=0) 


Infinity 


sage: limit (1/x*xx2 ,x=0) 
+infinity 


tex/sage/sageSnip017.sage 


Sage fait une différence entre Infinity et +Infinity et donne 


1 
lim — = © (0.3) 
zæ—0 TZ 
ainsi que 
. 1 


Voir aussi la compactification en un point d’Alexandroff 7.98. 


0.7 Comment contribuer et aider ? 
SecooCKWWooBFgnea 


0.7.1 Des preuves qui manquent 


Vous trouverez un peu partout des énoncés sans preuves. Certaines sont surement très faciles, 
et d’autres probablement assez compliquées. N'hésitez pas à rédiger une preuve et me l’envoyer. 

Vous pouvez m'envoyer vos preuves sous forme de « c’est bien fait dans tel cours », avec une 
URL. 

Ne me dites juste pas « c’est bien fait dans tel livre ». Je ne travaille pas à l’université, et je n’ai 
pas accès à une bibliothèque universitaire ; je n’ai donc pas réellement accès à ces fameux « livres » 
dont tout le monde parle. 


0.7.2 Du texte qui manque 


Vous remarquerez que de nombreuses pages du Frido sont des enchainements de théorèmes et 
démonstrations sans articulations. Autrement dit, il manque ce qu’à l’agrégation on dirait à l’oral 
quand on présente le plan. Si vous avez des idées de choses à ajouter ici où là, faites le moi savoir. 


0.7.3 Des exemples qui manquent 


Si vous connaissez de bons exemples, faites-le moi savoir. 


0.7.4 Trucs de programmation et de ETEX 


(1) Comment faire en sorte que les mots commençant par « é » soient avec les « e » dans l’index, 
et non avant les « a » ? Il me faudrait un mécanisme plus automatique que faire machin@truc. 
Une fonction en python qui prend en entrée le fichier bbl sous forme de string et qui ressort 
sous forme de string le fichier bbl modifié me convient. 


(2) Il y a des problèmes dans la table des matières. « Table des matières », « Index », et « Liste 
des notations » ne pointent pas vers la bonne page. 


(3) Écrire un script (en python ou autre) qui prend en argument deux numéros ou noms de 
chapitres et qui retourne l’ensemble des lignes du premier qui contient des ref ou eqgref 
dont le label correspondant est dans le second. 
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Attention : il faut tenir compte de input de façon récursive. 


Bonus : calculer le hash shal de chaque ligne du résultat et ne pas l’afficher si il se trouve 
dans la liste du fichier commons .py. 


0.8 Les politiques éditoriales 


Certaines parties de ce texte ne respectent pas les politiques éditoriales. Ce sont des erreurs de 
jeunesse, et j’en suis le premier triste. 


0.8.1 Licence libre 


Je crois que c’est clair. 


0.8.2 pdflatex 
Tout est compilable avec pdfÂTEX. Pas de pstricks, de psfrag ou de ps<quoiquecesoit>. 


0.8.3 utf8 


Je crois que c’est clair. 


0.8.4 Notations 


On essaie d’être cohérent dans les notations et les conventions. Pour la transformée de Fourier 
par exemple, je crois que la définition du produit scalaire dans L?, des coefficients de Fourier, de 
la transformation et de la transformation inverse sont cohérents. Cela demande, lorsqu'on suit un 
livre qui ne suit pas les conventions utilisées ici, de convertir parfois massivement. 


0.8.5 De la bibliographie 


On évite d'écrire en haut de chapitre « les références pour ce chapitre sont ... ». Il est mieux 
d'écrire au niveau des théorèmes, entre parenthèses, les références. 

Lorsqu'on écrit l’énoncé d’un théorème sans retranscrire la démonstration, il faut mettre une 
référence vers un document en ligne qui en contient la preuve. Il est vraiment fastidieux de chercher 
une preuve sur internet et de tomber sur des dizaines de documents qui donnent l'énoncé mais pas 
la preuve. 


0.8.6 Faire des références à tout 


Lorsqu'un utilise le théorème des accroissements finis, il ne faut pas écrire « d’après le théorème 
des accroissements finis, blablabla ». [ faut écrire un \ref explicite vers le résultat. Cela alourdit 
un peu le texte, mais lorsqu'on joue avec un texte de plus de 2000 pages, il est parfois laborieux 
de trouver le résultat qu’on cherche (surtout si il existe plusieurs versions d’un résultat et que l’on 
veut faire référence à une version particulière). 


0.8.7 Des listes de liens internes 


Le début du Frido contient une espèce d’index thématique. Il serait bon de l’étoffer. 


0.8.8 Pas de références vers le futur 


Dans le Frido, aucune preuve ne peut faire une référence vers un résultat prouvé plus bas. On 
n'utilise pas le théorème 10 dans la démonstration du théorème 7. Cela est une contrainte forte 
sur le découpage en chapitres et sur l’ordre de présentation des matières. 

Il est bien entendu accepté et même encouragé de mettre des notes du type « Nous verrons 
plus loin un théorème qui ... ». Tant que ce théorème n’est pas utilisé, ça va. 


Chapitre 1 


Construction des ensembles de 
nombres 


1.1 Quelques éléments sur les ensembles 


1.1.1 Petit mot d’introduction 


Le Frido n’est pas supposé être lu dans l’ordre de la première à la dernière page ; les matières 
y sont présentées dans l’ordre logique mathématique, et non dans l’ordre logique pédagogique, et 
encore moins par ordre de difficulté croissante. 


1.1 (On saute la théorie des ensembles). 
En mathématique, si on lit une démonstration et que l’on veut vraiment tout justifier, et justifier 
toutes les étapes de tous les résultats utilisés, on tombe forcément un jour sur les axiomes. 

Or l’axiomatique est un sujet particulièrement difficile. Nous n’allons donc pas « tout justifier » 
jusque là. Nous n’allons même pas préciser quel système d’axiome est utilisé. En particulier nous 
n’allons pas donner l’axiomatique des ensembles : nous allons supposer connus les ensembles et 
leurs principales propriétés. 

Bref. Nous supposons avoir une théorie des ensembles qui tient la route. En particulier nous 
supposons connues les notions suivantes : 


(1) ensemble vide, 

(2) ensemble, appartenance, intersection, union, 

(3) application entre deux ensembles, notation f(x) pour désigner l’image de x par f, 
(4) produit cartésien de plusieurs ensembles. 


Ce sont toutes des choses dont la construction à partir des axiomes n’est en aucun cas évidente. En 
particulier, des « définitions » comme « l’intersection de deux ensembles est l’ensemble contenant 
exactement les éléments communs aux deux ensembles » ne sont pas correctes parce qu’elles passent 
à côté de l’existence et de l’unicité d’un tel ensemble. 


1.2 (On saute la grammaire). 
Nous n’allons pas non plus formaliser la grammaire des expressions mathématiques !. Nous sup- 
posons que vous êtes capables de lire des expressions comme 


zEeN—= {a> x} est infini. (1.1) 


Tout cela pour dire que le Frido ne traitera que de la partie facile de la mathématique. 
DefEnsemblesDisjoints 


Définition 1.3. 
Deux ensembles À et B sont disjoints si leur intersection est vide? ; en d’autres termes, si il 
n'existe aucun élément commun à À et B. 


1. J’utilise ici des mots que je ne comprends pas, juste pour me donner l’air malin. 
2. Remarquez que les mots « intersection » et « vide » sont de ceux que nous avons décidé de ne pas définir. 
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1.4. 

Remarquez par exemple que la première phrase de l’article de Wikipédia sur la construction de IN 
est « Partant de la théorie des ensembles, on identifie 0 à l’ensemble vide, puis on construit ... ». 
Il est bien précisé que l’on part d’une théorie des ensembles. 


1.5. 
La suite de ce chapitre sera essentiellement sans exemple parce qu'avant d’avoir construit les 
ensembles de nombres, je ne sais pas très bien quels exemples on peut donner de quoi que ce soit. 


1.1.2 Injection, surjection, bijection 


Définition 1.6. 
Soient deux ensembles E et F. Une application f : E — F' est 


(1) surjective si pour tout yE F, il existe x € E tel que y = f(x) ; 
(2) injective si pour tout y € F, il existe au plus un x € E tel que y = f(x) ; 


(3) bijective si elle est à la fois injective et surjective. 


La méthode la plus courante pour démontrer qu’une application f: E — Fest injective est 
de considérer x,y € E tels que f(x) = f(y), et de prouver à partir de là que x = y. Ou alors de 
supposer x £ y et d'obtenir une contradiction. 

La technique de la contradiction est évidemment la plus courante lorsque l'égalité f(x) = g(x) 
implique une équation faisant intervenir 1/(x — y). 

LEMooWBYSooFqyqQP 
Lemme 1.7. 
Soient deux ensembles À et B ainsi qu'une application f : À — B. Nous supposons qu'il existe une 
application g: B — À telle que f o g = Idg et go f = Id4. 

Alors f est une bijection. 


Démonstration. En deux parties. 


(1) Injection Supposons que f(a) = f(b). Alors en appliquant g des deux côtés, et en utilisant 
le fait que go f = Id14, nous trouvons a = b. 


(2) Surjection Soit x € B. Posons a = g(x). Alors, en utilisant le fait que f o g = Idg nous 
avons 


fa) = (Fo g)(x) = x. (12) 


Donc x est dans l’image de f et f est surjective. 


PROPooBXVSooZXmwKC 
Proposition 1.8 ([1]|). 
Si f: A — B est injective, et si X et Y sont des parties de À, alors f(X NY) = f(X)n f(Y). 


Démonstration. En deux inclusions. 


(1) Première inclusion Si£e f(X NY), alors il existe se X NY tel que £ = f(s). Étant donné 
que s € X, nous avons € = f(s) € f(X). Et comme 5 € Ÿ nous avons aussi £ = f(s) € f(Y). 
Au final £ = f(x) € f(X) n f(Y). 

(2) Deuxième inclusion Si£e f(X) n f(Y), il existe x € X et y € Ÿ tels que € = f(x) et 
£ = f(y). Par injectivité de f, nous avons x = yet doncé € f(X n Y). 


1.1.3 Ensemble ordonné — 
NORooLMBYooYjUoju 


1.9. 

L'axiome du choix que nous acceptons peut s’énoncer comme ceci[6] : Étant donné un ensemble 
X d’ensembles non vides, il existe une fonction définie sur X, appelée fonction de choix, qui à 
chacun d’entre eux associe un de ses éléments. 
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DEFOoRFVTooUUuFuE 
Définition 1.10 ([7|). 
Une relation binaire d’un ensemble E vers un ensemble F est une partie de E x F. 
Si G est une relation binaire entre E et F, nous notons xRay et nous disons que x est en 


relation avec y. 
DefooFLYUooRaGYRk 


Définition 1.11. 
Une relation d’ordre sur un ensemble E est une relation binaire * (notée <) sur E telle que pour 
tous t,y,2€ E, 


réflexivité : x < x 
antisymétrie : x < y et y < x implique x = y 
transitivité : x < y et y < z implique x K z. 


Pour suivre les notations de la définition 1.10, la partie G de E x E est une relation d’ordre 
lorsque 


(1) (x,x) € G pour tout x € G, 
(2) Si (x,y) € G et (y,x) € G, alors x = y, 
(3) Si (x,y) € G et (y,2) € G, alors (x,2) € G. 
Dans la suite nous n’allons plus écrire de relations binaires en détaillant l’ensemble sous-jacent. 


Lorsque nous avons un ensemble E et une relation d'ordre < sur E, nous disons que le couple 


(E,<) est un ensemble ordonné. 
DEFooVGYQooUhUZGr 


Définition 1.12. 
Un ensemble ordonné est totalement ordonné si deux éléments sont toujours comparables : si 
xæ,y€ E alors nous avons soût x < y soit y < x. Si les éléments ne sont pas tous comparables, nous 


disons que l’ordre est partiel. 
q D 
DEFooBZNRooYRPGme 


Définition 1.13 ([8]). 
Soit un ensemble ordonné (E,<). Un élément M € E est un élément maximal de E si pour tout 
xe E tel que M < x, nous avons M < x = x = M. 

Nous disons que m € E est un élément minimal si pour tout x € E, nous avons x < m = 


LT = M. 
DEFooDNWRooTiMAzK 


Définition 1.14. 
Soit un ensemble ordonné (E,<) et une partie À de E. Nous disons que m € À est un minimum 
de À si pour tout x € À, l'élément m est comparable à x et m < x. 
Un élément p € E est un minorant de À si pour tout a € À, les éléments p et a sont comparables 
et p<a. 
Les notions de maximum et de majorant sont définies de façon analogue. 
LEMooPCRFooXRGrUr 


Lemme 1.15. 
Si E est un ensemble ordonné et si À est une partie finie totalement ordonnée de E, alors À 


possède un unique minimum et un unique Marimum. 
NORMooVHIBooJAUsou 


1.16. 
Notons qu'il n’est pas demandé à un élément maximal { d’être comparable à tous les autres élé- 
ments. Si (E,<) n’est pas totalement ordonné, un élément maximal peut ne majorer qu’une partie 
de Æ. 
Un élément maximal est plus grand que tous les éléments avec lesquels il est comparable. 
Dans un ensemble totalement ordonné, les notions d’élément maximal de Æ et de maximum 
de Æ coïncident ; dans le cas d’un ordre partiel, ces notions sont distinctes. 


5 


3. Définition 1.10. 
4. Définition 1.13 
5. Définition 1.14. 
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Il se peut que nous parlions d’un « maximum » ou « élément maximum » au lieu d’un « élément 
maximal », en particulier en utilisant le lemme de Zorn. Si vous voyez de telles choses, n’hésitez 
pas à me le dire. 

Par exemple, quand on applique le lemme de Zorn pour démontrer l’existence d’une base dans 
un espace vectoriel de dimension infinie, on obtient une famille libre qui est maximale, c’est-à-dire 
qui est un élément maximal dans l’ensemble, ordonné par inclusion, des familles libres de l’espace 
vectoriel. C’est un élément maximal, et non un maximum, car l’ensemble des familles libres d’un 
espace vectoriel non réduit à {0} n’admet pas de maximum (pour l'inclusion). Voir 4.24 et 4.25. 


Lorsqu'une partie possède un minimum, ce dernier est nommé le « plus petit élément » de la 
partie. Attention : il n’en existe pas toujours. D’innombrables exemples pourront être vus lorsque 
nous aurons construit Q et R. Typiquement les intervalles du type Ja, b|. 


Exemple 1.17 ([1]}). 
Soit un ensemble E ainsi que a Æ b dans E. Nous considérons les parties 


A={PCEtelquaeP,béP} (1.3a) 
B={PCEtel quebe P,aé P}. (1.3b) 


Et enfin nous considérons l’ensemble F = A 0 B, c'est-à-dire l’ensemble des parties de E qui 
contiennent soit a soit b mais pas les deux. Nous ordonnons partiellement F par l'inclusion. 


Dans (F,C), l'élément E\{b} est un élément maximal, mais pas un majorant. AN 
DEFooLJEAooBLGsis 
Définition 1.18. 


Un ensemble ordonné est bien ordonné si toute partie non vide possède un plus petit élément. 


Autrement dit, l’ensemble ordonné Æ est bien ordonné si pour toute partie non vide À, il existe 
x € À tel que x < y pour tout y € À. 


1.19. 
Quelques remarques. 


(1) L'inégalité stricte (définie par : x < y si et seulement si x < yet x Æ y) n’est pas une relation 
d'ordre parce qu’elle n’est pas réflexive. 


(2) Nous verrons dans la remarque 1.425 que l'intervalle [—1,1] dans R n’est pas bien ordonné. 


(3) Un ensemble bien ordonné est forcément totalement ordonné parce que toutes les parties de 
la forme {x,y} possèdent un minimum. Par conséquent x et y doivent être comparables : 
ZT < YOU Y < LX. 


Exemple 1.20. 
Si E est un ensemble, l'inclusion est un ordre sur l’ensemble des parties de E, mais pas un ordre 


total parce que si X, Ÿ sont des parties de E,, alors nous n’avons pas automatiquement soit X € Y 
soit Y € X. VAN 


La notion d'ordre permet d'introduire la notion d’intervalle. 
DefEYAooMYYTz 
Définition 1.21. 
Soit un ensemble totalement ordonné (E,<). Un intervalle de E est une partie I telle que tout 
élément compris entre deux éléments de I soit dans 1. En language mathématique, la partie I de 
E est un intervalle si 


Va,bel,(a<r<b)=zxel. 


1.1.4 Lemme de Zorn 


Nous admettons l’axiome du choix qui s’énonce de la façon suivante|[9] : 
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Pour tout ensemble X d’ensembles non vides, il existe une fonction définie sur X, 
appelée fonction de choix, qui à chaque ensemble À appartenant à X associe un élément 
de cet ensemble À. 


DefGHDfyyz 
Définition 1.22 (Ensemble inductif[10]). 
Un ensemble est inductif si toute partie totalement ordonnée admet un majorant. 
LemUEG;jJBc 
Lemme 1.23 (Lemme de Zorn|11]). 
Tout ensemble ordonné inductif non vide admet au moins un élément maximal. 
PROPooFOETooWYLOeq 


Proposition 1.24 (|12]). 
Soient un ensemble inductif (E,<) etbe E. Il existe un élément marimal® me E tel que b < m. 


Démonstration. En plusieurs parties. 


(1) Un ensemble Nous considérons 
Ej = {re E tel que b < x}. (1.4) 


(2) F4 est inductif Soit une partie non vide totalement ordonnée À de F4. Puisque E est 
inductif, la partie À admet un majorant m € E. 


Comme À est non vide, nous pouvons considérer x € A. Nous avons b < x parce que 
xe ÀAC FE. Mais comme m est un majorant de À, x < m. Bref, nous avons les inégalités 


b<x<m. (1.5) 
Donc m € E}. Nous avons prouvé que m est un majorant de À contenu dans E}. Donc E, est 


inductif. 


(3) Zorn Puisque (F,<) est inductif, le lemme de Zorn 1.23 nous indique que Æ, a un élément 
maximal. Nous le notons m. 


(4) m est maximal dans Æ Supposons avoir un élément a € E tel que m < a. Nous avons 


b<m< a, (1.6) 


et donc a € F4. Mais m est maximal dans Æ}, donc a = m. 


1.1.5 Complémentaire 
AppComplement 


Définition 1.25. 
Soit E, un ensemble et À, une partie de E (c’est-à-dire un sous-ensemble de E). Le complémen- 
taire de l’ensemble À, dans E, noté CA est l’ensemble des éléments de E qui ne font pas partie de 
A 

CA=E\A={xeE tel que x é À}. (1.7) 


Nous allons aussi régulièrement noter le complémentaire de À par A°. 


1.1.6 Quelques relations ensemblistes 


LEMooHRKAooRskzQL 
Lemme 1.26 (Quelques relations ensemblistes). 
Soient À, B,C € X. Nous avons 
(4) X\(An B) = (X\4) L (X\B). ITEMooQCGUooKnWfBo 


(2) X\(AU B) = (X\4) 0 (X\B). 


6. Définition 1.153. 
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ITEMooXWKCooUASxlh 
(3) An(B\C)=(AnB)\C. 
LEMooHPUNooPmViwi 
Lemme 1.27 ([13]). 
Pour tout ensembles À, B, C' nous avons 
(1) AV(BAC)=(AVB)n(AUO) ITEMooSIDWooNrD joU 


(2) An(BUC)=(AnB)0(AnC) 
LemPropsComplement 
Lemme 1.28. 
Quelques propriétés à propos des complémentaires. Si E est un ensemble et si À et B sont des 
sous-ensembles de E, nous avons ITEMooWIYBooKMLVnZ 


(1) CCA = À, en d’autres termes, E\(E\A) = À, 
(2) A\B = AntB. 

(3) (A\BY° = AU B. 

(4) A\B° = B\A. 


ItemLemPropComplementiii 
ITEMooNHDUooWtURqQ 


ITEMooTBWKooTChOmC 


Démonstration. Plusieurs points. 
(1) Pour (1) 
(2) Pour (2) 
(3) Pour (3) Il faut le faire en deux inclusions. 
(3a) (A\B)Y° € A0 B Supposons que x € (A\B)°. Si x € A°, c’est bon. Supposons que x 
n'est pas dans À°, et montrons que x € B. Le fait que x ne soit pas dans À° signifie 


que x € À. Si x n’était pas dans B, alors x serait dans A\B, ce qui est contraire à 
l'hypothèse. Donc x € B. 


(3b) AU BCE(A\B) Supposons d’abord que x € A°. Comme A\B € À, si x € A°, alors 
x € (A\B)°. 
Sixe B, alors x n’est pas dans A\B et donc x est dans (A\B)°. 


(4) Pour (4) Pour cette égalité, nous séparons 4 cas suivant que x est dans À ou B ou non. 
Bref, nous écrivons la table de vérité : 


A ]1]11010 
B |1101110 
A4B|010 1110 te 
B\A |010 1.0 


Les deux dernières lignes étant égales, nous avons l'égalité d’ensembles annoncée. 


DefBMLooVj15G 
Définition 1.29 (différence symétrique). 
Si À et B sont des ensembles, l’ensemble AAB est la différence symétrique d’ensembles : 


AAB = (AU B)\(AnB). (1.9) 


C’est l’ensemble des éléments étant soit dans À soit dans B mais pas dans les deux, ni dans 
aucun des deux. La table de vérité de AAB est intéressante : 


À 1111010 
loi 0 Eoo0JBDooKkEtyn 
AAB|01!11]1110 


La deuxième colonne signifie que six e Aet x e B°, alors x € AAB. 
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LemCUVoohKpWB 
Lemme 1.30 ([14]). 
Si À et B sont des parties d’un ensemble, nous avons 
E MWTNooKXfF 

AAB = (A\B) u (B\4), Root 
et aussi ItemVUCooHAztC 
(1) AAB° = AAB. ItemVUCooHAztCii 
(2) (AAB)AB = A. ITEMooSPZXooPTgisP 
(3) (AAB) = (An B°) 0 (An B). ITEMooSMXWooYcisRC 


(4) Associativité : AA(BAC) = (AAB)AC. 
Démonstration. Pour (1.11), il suffit de voir que la table de vérité de (A\B) U (B\A) est la même 


que (1.10). 
Et pour le reste, c’est parti. 


(1) Pour (1) Nous rappelons l'égalité X\Y° = Y\X du lemme 1.28(4). De là nous écrivons 
AAB° = (AU B°)\(Af An B°) = (An B\(A 0 BB = (AU B)\(An B) = AAB. (1.12) 
(2) Pour (2) Ici, il faut remarquer que (AAB) 0 B = AU B et que (AAB) n B = B\A, donc 
(AAB)AB = (AU B)\(B\A) = A. (1.13) 


(3) Pour (3) Il s’agit d'utiliser le lemme 1.28(3) : 


(4AB) = ((Au B)\(A4n B)) (1.14a) 
= (AU B) U(4AnB) (1.14b) 
= (An B)U(AnB). (1.140) 


(4) Pour l’associativité (4) Nous écrivons les tables de vérités selon que x est dans À, B, C 
ou non. D'abord 


A 111|1|1/0101/010 
B 111101011100 
C 110/1|0)1101/110 (1.15) 
BAC  |0|1|1|0{0111110 
AA(BAC)|1|0101110|11110 


La quatrième ligne s'écrit sur le modèle de (1.10) en regardant les deuxièmes et troisièmes 
lignes. La dernière ligne se fait avec la première et la quatrième. 


L'autre table de vérité se fait de la même manière : 


A 11111|1/0101/010 
B 111101011100 
C 110/1|0)1101110 (1.16) 
AAB -.lolol11t|111 00 
(AAB)JAC |1|0{01110111110 


Puisque les lignes pour AA(BAC") et pour (AAB)AC sont identiques, nous avons égalité. 
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1.1.7 Relations d’équivalence 
appEqDéfHègzaMp 


Définition 1.31. 
Si E est un ensemble, une relation d’équivalence sur E est une relation binaire! < qui est à la 
fois 
réflexive x — x pour tout x € E, 
symétrique x = y si et seulement si y — x; 
transitive si x — y ety - 2, alors x — z. 
DEFooRHPSooHKBZX1 

Définition 1.32. 
Si E est un ensemble et si — est une relation d'équivalence sur E, alors nous notons E/ — 
l’ensemble quotient, c’est-à-dire l’ensemble des classes d'équivalence dans E. Un élément de 
E/ - est de la forme 

[al = {re E tel que x — a}. (1.17) 


Lemme 1.33. 
Soit un ensemble E et une relation d'équivalence <. Pour a,b € E, nous avons [a] = [b] si et 
seulement si a — b. 


Démonstration. En deux parties. 


(1) = Nous supposons que [a] = [b]. Par réflexivité, a — a et nous avons a € [a] = [b]. Mais 
a € [b] signifie a + b, ce qu’il fallait. 

(2) = Nous supposons que a + b, et nous démontrons que [a] € [b] (pour l'inclusion inverse, 
vous devriez vous en sortir tout seul). Si x € [a], alors x + a. Mais a + b. Donc x — a — b, 
ce qui implique x + b par transitivité. Or dire x + b implique x € [b|. 


EXooYDRVooHsAN1C 
Exemple 1.34. 
Sur l’ensemble de tous les polygones du plan, la relation « a le même nombre de côtés » est une 
relation d'équivalence. Plus précisément, si P et Q sont deux polygones, nous disons que P + Q 
si et seulement si P et Q ont le même nombre de côtés. C’est une relation d'équivalence : 
— un polygone P a toujours le même nombre de côtés que lui-même : P - P; 
— si P a le même nombre de côtés que Q (P — Q), alors Q a le même nombre de côtés que P 
(Q-P); 
— si P a le même nombre de côtés que Q (P + Q) et que Q a le même nombre de côtés que R 
(Q — R), alors P a le même nombre de côtés que R (P - R). 
A 


Exemple 1.35. 
Soit f une application entre deux ensembles Æ et F. Nous définissons une relation d'équivalence 
sur E par 


Toys f(x) = f(y). (1:18) 
Nous notons par x: E — E/ - la projection canonique. L'application 
gE/--—F 
[ele f(x) 


est bien définie et injective. Elle n’est pas surjective tant que f ne l’est pas. La décomposition 
canonique de f est 


(1.19) 


f=go. (1.20) 
À 


7. Définition 1.10. 
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1.2 Quelques structures algébriques 


Nous collectons ici les définitions des principales structures algébriques. 


DEFOoBMUZooLAfbeM 
Définition 1.36 (Groupe). 
Un groupe est un ensemble G muni d’une opération interne - : G x G — G telle que 
(1) pour tous g,h,keG,g'°{(h-k)=(g"h)"Kk, 
(2) il existe un élément e € G tel que e -g=g"e= g pour tout gE G, 


(3) pour tout g € G, il existe un élément h € G tel que g ‘h=h:g=e. 


Un groupe est commutatif ou abélien sig : h=h : g pour tout g,he G. 


Notons que nous avons écrit g : het non : (g,h) comme une notation purement fonctionnelle 
nous l’aurait suggéré. Dans les exemples concrets, selon les cas, la loi de groupe appliquée à g et h 


sera notée tantôt g + h, tantôt g : h ou, le plus souvent pour un groupe générique, simplement gh. 
DEFOoBEHTooMeCOTX 


Définition 1.37 (morphisme, automorphisme). 
Soient deux groupes G et H. Un morphisme entre G et H est une application a: G — H telle 
que pour tout g,h € G nous ayons a(gh) = a(g)a(h). 

Comme d'habitude, un isomorphisme est un morphisme biüectif. 

Un automorphisme de G est un isomorphisme de G vers G lui-même. L'ensemble des auto- 


morphismes de G est noté Aut(G). 
PROPooJHHPooïIpciPA 


Proposition 1.38. 


Si a: G — H est un morphisme de groupes, alors a(G) est un sous-groupe de H. 
LEMooKJMWooQelwgF 


Lemme 1.39. 
Si G est un groupe, alors Aut(G) est un groupe pour la composition. 


Démonstration. Soient a et 6 des automorphismes de G. Alors nous prouvons que & 0 $ est un 
automorphisme de G : 


(ao 8)(gh) = a(8(9)8(h)) = a(8(g))a(8(h)) = (ao B)(g)(a 0 B)(h). (1:21) 


LEMooDPISooRoAFmt 
Lemme 1.40. 
Si G et H sont des groupes isomorphes, alors les groupes Aut(G) et Aut(H) sont isomorphes. 


Démonstration. Soit un isomorphisme f: G — H. D'abord pour tout à € Aut(G), l'application 
foao fl est un automorphisme de H. Cela est rapidement vérifié parce que f, a et f—! sont 
des bijections et des morphismes. 

Nous pouvons donc considérer l’application 


: Aut(G) — Aut(H 
a 


(1) Ÿ est un morphisme Soient à,/5 € Aut(G). Vu que f est une bijection, nous pouvons 
introduire flo f partout où ça nous plaît : 


W(aB) = foaoBof "= foaof"ofoBof "= 4w(a)ow(8). (1:23) 


(2) Ÿ est injective Si af € Aut(G) sont tels que d(a) = #(5), alors 


foaoft=fopof”1. (1.24) 


Comme f est une bijection, cela implique que & = f£. 
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(3) Ÿ est surjective Si a: H — H est un automorphisme, alors o = #(f-!0o oo f) où il est 
facile de vérifier que f loco f € Aut(G). 


DefHXJUooKoovob 
Définition 1.41 (Anneaul[15]). 
Un anneau? est un triplet (A,+, : ) avec les conditions 
(1) (A,+) est un groupe” commutatif. Nous notons 0 le neutre. 
(2) La multiplication est associative et nous notons 1 le neutre. ITEMooGMNÜOOSTCi Xw 


(3) La multiplication est distributive par rapport à l’addition. 


L'anneau (A,+, - ) est commutatif si pour tout a,bE À nous avons a * b= b : a. 
DEFooSPHPooCwjzuz 


Définition 1.42 (Morphisme d’anneaux{[16]). 
Si (A,+, :) et (B,+, : ) sont des anneaux, un morphisme d’anneaux est une application 
J: À — B telle que 


(1) f(a+b) = (a) + f(b) 
(2) f(a *b) = f(a) : f(b) 
(3) FA) = 1. 


Étant bien entendu que les significations de 1, + et : sont différentes à gauche et à droite. 


1.3 Les naturels 
BEEooBJBWooNYBIÂg 


Définition 1.43 ([17]). 
Un triplet naturel est un triplet (N,0,s) où N est un ensemble, o est un élément de N et s est 
une application s: N — N satisfaisant les propriétés suivantes : 


(1) s est injective, 
(2) sW) = N\{o} 
(3) Si AC N est tel que 0€ À et s(A) € À, alors A = N. 


ITEMooQAKJooGKdJsM 


ITEMooXPYEooFajywh 


Le théorème suivant est typiquement de ceux qui vont demander de gratter la théorie axioma- 


tique des ensembles avec une certaine précision !. 
THOoo0UXMHooXYgMqb 


Théorème 1.44. 
Il existe un !! triplet naturel. 


1.45 (Définition de N). 
Pour la suite, nous considérons un triplet naturel (W,0,s) et nous notons N = W. Donc la nature 
de tous les objets que nous allons considérer à partir de maintenant dépend du choix de triplet 
naturel que nous faisons à présent. Le théorème 1.82 nous assurera que peu de choses devraient 
réellement dépendre de ce choix. 

Nous notons 0 l'élément o et 1 l'élément s(0). C’est tout ce dont nous avons besoin dans 
l'immédiat. 


8. Nous faisons le choix qu’un anneau admet toujours un neutre pour la multiplication. Certains ouvrages parlent 
dans ce cas d’anneau unitaire. 

9. Groupe, définition 1.36. 

10. Ou alors il y a quelque chose qui m'échappe. Écrivez-moi si vous connaissez une construction « simple ». 

11. Nous verrons plus tard que toute partie infinie d’un triplet naturel fournit un nouveau triplet naturel; il en 
existe donc plusieurs. 
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1.3.1 Applications définies par récurrence 


PROPooXTRCooKwrWkq 
Proposition 1.46 (Récurrence{[17|). 
Soit un triplet naturel (N,0,s) et une application P: N — {0,1} vérifiant !? 
(1) P(o) = 1, 
(2) pour tout ae N, si P(a) = 1, alors P(s(a)) = 1. 
Alors P(x) = 1 pour tout x eN. 
Démonstration. Nous posons 
A = {xeN tel que P(x) = 1}. (1.25) 
Cet ensemble vérifie la propriété 1.43(3). Donc À = W. 
THOo0EJPYooZFVnez 


Théorème 1.47 ([12, 18]). 
Soient E un ensemble, g une application de E dans E et b un élément de E. Alors il existe une 
unique application f : N — E telle que : 


(1) F(0) =b 
(2) f(s(n)) = g(f(n)) pour tout n e N\{0}. 
Démonstration. Nous commençons par l’unicité. Soient f1 et f2 deux telles applications. Nous 


posons 
A=f{ne N tel que fi(n) = fo(n)}. (1.26) 


Nous avons 0 € À parce que f1(0) = f2(0) = b. 
Supposons que f1(k) = f2(k). Alors nous avons 


fi(s(R)) = g(f1(#)) = g(f2(k)) = f2(s(k)). (1:27) 


Nous en déduisons que s(k) € A. Autrement dit s(A) € A. La définition 1.43(3) nous indique alors 
que À = N, c’est-à-dire que f1 = f2. 
Nous montrons à présent l’existence en plusieurs étapes. 


(1) L’ensemble est assez grand Nous considérons l’ensemble À des parties À € N x E telles 
que 


(la) (0,b) € À 
(1b) (n,x)e A = (s(n),g(x)) € À. 


L'ensemble À est non vide parce que N x E € A. 


(2) Le plus petit Nous posons 


G= [A (1.28) 


AEA 


et nous prouvons que G € À. D'abord (0,b) € G parce que cet élément est dans chacun 
des À € G. Ensuite si (n,x) € G, alors pour tout À € À nous avons (n,x) € À et donc 
(s(n), g(x)) € A. Par conséquent (s(n), g(x)) € [4e 4 À = G. 
Pour n € N nous posons 

Gn = {re E tel que (n,x) e G}. (1.29) 


Nous avons en particulier que b € Go parce que (0,b) € G. 


12. Les plus pointilleuses diront que 1 n’est pas encore défini. Bon j'avoue. Ce qui est important est que P prenne 
ses valeurs dans un ensemble contenant deux éléments distincts. Si maintenant vous râlez parce que « deux » est 
encore moins défini, prenez un ensemble quelconque À et dites que P prend ses valeurs dans { A, P(A)}. Mais êtes-vous 
bien certaine que P(A) # A? 
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(3) G contient un (n,x) pour tout n Nous prouvons que pour tout n € N,il existe € E 


— 


— 


tel que (n,x) € G. Nous faisons ça avec la proposition 1.46 en posant 


P:N — {0,1} 
1 sGh£<Q (1.30) 
n 
0 sinon. 


Puisque (0,b) € G nous avons P(0) = 1. Supposons que P(k) = 1 et montrons que P(s(k)) = 
1. Comme P(k) = 1, il existe x € E tel que (k,x) € G. De ce fait, (s(k),g(x)) € G, ce qui 
donne Gr) À D et P(s(k)) = 1]. 

G, est un singleton Nous avons vu que G; n’est jamais vide. Nous allons montrer que 
G, est un singleton pour tout n. Pour cela nous posons 


P:N — {0,1} 
1 si G, est un singleton (1.31) 
nr 
O0 sinon. 


Nous prouvons par récurrence que P(n) = 1 pour tout n. 

(4a) P(0) = 1 Nous commençons par prouver que P(0) = 1. Nous savons que (0,b) € Go. 
Supposons a £ b tel que (0, a) € Go. Alors en posant G’ = G\{(0, a)} nous avons G’ € À. 
En effet (0,b) € G” parce que (0,b) e Get (0,b) Æ (0,a). De plus si (n,x) € G”, 
alors (s(n), g(x)) € G. Mais comme s(n) # 0 nous avons (s(n),g(x)) # (0,a) et donc 
(s(n), g(x)) € G'. 

L'ensemble G” serait un élément de À strictement inclus dans G. Impossible. Donc Go 
est un singleton. 

(4b) Récurrence Supposons que P(k) = 1, c’est-à-dire que G% est un singleton. Soit e 
l'unique élément de G% : (k,e) € G. Nous avons alors aussi que (s(k), g(e)) € G. Nous 
devons prouver que si y € G,(x), alors y = g(e). 

Supposons donc y £ g(e) soit dans G;(,). Nous posons 


G' = GK(s(E),2)}. (1.32) 


Nous prouvons que G € A. D'abord (0,b) € G’ parce que s(k) Æ 0. Soit ensuite 
(m,z) € G’. Si m = k, alors z = e (parce que par hypothèse G}% est un singleton) et 
nous savons que (s(m),g(e)) € G’. Si par contre m # k, comme s est injective, nous 
avons aussi s(m) Æ s(k). Donc (s(m),g(z)) Æ (s(k),y) et (s(m),g(z)) € G’. Donc 
G'e A et est strictement plus petit que G. Contradiction. 
Nous concluons que G,{}) est un singleton, c’est-à-dire que P(s(k)) = 1. 

(4c) Conclusion Nous avons prouvé que G, est un singleton pour tout n. 

Et enfin 

Nous définissons f(n) comme étant l’unique élément de GA. Puisque (0,b) € G nous avons 

Go = {b} et donc g(0) = b. 

Par définition de f, nous avons (Hs Î (n)) € G. Parce que G € À nous avons alors 


(s(n),g(f(n))) € G. (1.33) 
Autrement dit, Gi(ny = {g(f(n))}. Cela montre que 
f(s(n)) = g(f(n)), (1:34) 


et donc que f vérifie les propriétés demandées. 
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NORMooLNXMooWIblPf 

1.48 ([1]). 
Le théorème 1.47 nous permet de définir une suite (x, )AeN par récurrence en posant par exemple 
En (1.35a) 
A (1.35b) 


Parfois nous pouvons avoir envie de définir une suite par récurrence de telle sorte que chaque 
nouveau terme dépende de tous les précédents : 


z1 = bd (1.36a) 
ni = trees C1) (1.36b) 
Pour ce faire, il faut un peu adapter. 
Posons E’ = EU(EXE)L(EXEXxE)0... Nous supposons avoir une application g: E" — E' 
qui ne prend ses valeurs que dans Æ : g(E") € E. De plus nous considérons l’application 
a:N—E 
nes (F(0),…., f(n)). 


Le théorème 1.47 appliqué à goa nous donne l'existence et l’unicité d’une application f : N — E' 
telle que 


(1.37) 


J(0) = b (1.38a) 
{ J(n+1 = g(f(0),..., f(n)). (1.38b) 
CORooVNHKooRkKtXf 


Corolaire 1.49 ([12]). 
Soient deux ensembles X,Y, une application a: X — YŸ et une application B: Y — Y. Alors il 
existe une unique application H : X x N — Y telle que 


(1) H(x,0) = a(x) pour tout élément x € X ; 
(2) H(x,n+1) = S(H(x,n)) pour tout élément x € X et pour tout ne N. 


Démonstration. Pour faire le lien avec les notations du théorème 1.47, nous notons E = Fun(X, Y), 
b=aerkzet 


: EE 
. (1.39) 
s- Bos. 
Le théorème 1.47 donne alors l’existence d’une application f : N — Æ telle que 
(1) f(0) =b 
(2) f(r +1) = g(f(n)). 
Nous définissons alors 
H:XXxN—-Y (1.40) 
(æ,n)e f(n)z, | 
et nous vérifions qu'elle satisfait aux exigences. 
(1) D'abord nous avons 
H(x,0) = f(0)x = b(x) = a(x). (1.41) 
(2) Ensuite, pour x € X et ne IN nous avons : 

H(z,n+1)= f(x +1l)x (1.42a) 
= g(f(n))x (1.42b) 
= g( fn) (1.42c) 
= (Bo f(n))x (1.424) 
= B(f(n)x (1.42e) 
= f(H{x,n)) (1.42f) 


Et voilà. 
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1.3.2 Addition sur les naturels 
DEFooIJIEooZaAdSs 


Définition 1.50 (élément régulier[19]). 
Soit un ensemble E muni d’une opération x: E x E — E. Un élément s € E est régulier à gauche 
si pour tout x,ye E nous avons 

SXT=S*XY—>X—=Y. (1.43) 


L'élément s est régulier à droite si pour tout x,y € E nous avons 


TXS=YXS—>T—=Y. (1.44) 

Il est régulier si il est régulier à gauche et à droite. 

PROPooVFOXooXmwpFh 

Proposition-Définition 1.51 ([17, 1]). 

Il existe une unique fonction f : N x N — N vérifiant ITEMooILZSooNYIkYR 
(1) f(a,0) = a pour tout a € N ITEMooZWHQooBAjZyE 
(2) f(a,s(b)) = s(f(a.b)) pour tout a,be N. 

Pour a,bE N nous notons f(a,b) = a + b. 

LEMooMJMTooUtUuJT 

Lemme 1.52 ([17]). 

Pour tout a € N nous avons s(a) = a + 1. 

Démonstration. Nous avons : 

SUBE MNBL 0 
s(a) = s(a + 0) _ PA) 
SUBEQooAGUS 1)YG] 
= a + 5(0) Roo GEO ATET 
ne SUBEQooUzQDoo} NEO 

Justifications. 

(1) Pour (1.45a) c’est dans la définition 1.51(1) de la somme. 
(2) Pour (1.45b), c’est dans la définition 1.51(2) de la somme. 
(3) Pour (1.45c). Le symbole « 1 » désigne l’élément s(0) dans N. 
PROPooTLTSO0oGNMTmV 

Proposition 1.53 ([17]). 

En ce qui concerne la somme dans N. ITEMooIFFPooXfftfG 
(1) La somme est associative et commutative. LTEMooSGRVooPAVFYK 
(2) L'élément 0 est neutre. LTEMooNUTHoo JWWZGv 


(3) Tous les éléments de N sont réguliers !* par rapport à l'addition. 


Démonstration. En plusieurs parties. 

(1) Associative Nous devons prouver que (a + b) +c= a+(b+c) pour tout a, b,ce N. Pour 
ce faire, nous fixons a, b € IN et nous prouvons l’égalité demandée par récurrence sur c. 
Pour c = 0, nous avons (a+b)+c = a+bet a+(b+c) = a+b. Donc nous sommes d’accord !. 
Nous vérifions avec s(c) : 


(a + b) + s(c) = s((a +b) +c) a 
= s(a+(b+c)) HS) 
= a+ s(b + c) (1.46c) 
= a+ (b+s(c)). (1.464) 


Justifications. 


13. Élément régulier pour une opération, définition 1.50. 
14. Notez que nous n’avons pas utilisé le fait que 0 était neutre des deux côtés — chose que nous n’avons pas encore 
démontré. Nous avons seulement utilisé a + 0 = a, qui est dans la définition de la somme. 
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(2) 


— Pour (1.46b). C’est l'hypothèse de récurrence. À ce stade, je vous conseille d’être capable 
de rédiger complètement la récurrence et l’appel au théorème 1.47. 
Neutre La définition de l’addition contient déjà a + 0 = a. Nous prouvons par récurrence 
que 0 + a = a pour tout a € N. 
Pour a = 0, l'égalité demandé est correcte : 040 = 0 parce que pour tout x dans N, 0+x = x. 
Pour s(a) nous avons 
0 + s(a) = s(0 + a) = s(a). (1.47) 
La dernière égalité est l’hypothèse de récurrence. 
Nous posons 
A={ae N tel que 0+a= a}. (1.48) 
Nous avons prouvé que 0 € À et que s(A) € A. Le théorème 1.47 nous assure alors que 
A=N. 


Commutativité Nous fixons a € N et nous prouvons par récurrence sur b que a+b = b+a 
pour tout be N. Cela va être décomposé en plusieurs étapes. 


)a+0=0+a Pour b= 0 c’est correct, car b +0 = 0 + b = b parce que 0 est neutre. 


a+l—=1+a Nous démontrons par récurrence sur a que a + 1 = 1 + a. Avec a = 0 c’est 
déjà fait. Pour les autres, 


s(a)+1=(a+1)+1 lemme 1.52 (1.49a) 
= (1+a)+1 hypothèse récurrence (1.49b) 
= 1+(a+1) associativité (1.49c) 
= 1 +s(a). (1.494) 


a+b=b+a Nous y voici. Nous fixons a et nous prouvons par récurrence que a +b = b+a. 
Pour b = 0 c’est déjà fait. Pour les autres, 


a+ s(b) =a+(b+1) (1.50a) 
= (a+b) +1 (1.50b) 
= (b+a)+1 hypothèse récurrence (1.50c) 
= b+(a+1) (1.50d) 
=b+(1+a) commutativité avec 1 (1.50e) 
= (b+1)+a associativité (1.50f) 
= s(b) + a. (1.50g) 


Récurrence terminée. 


Régularité Nous devons prouver que, pour tout a,x,y € N, si a+x= a+ 7 alors x = y. 
Nous allons procéder par récurrence en posant 


A = {ae N tel que Vr,yeN,a+r=a+y—=x= y}. (1.51) 


Puisque 0 +x = x et 0+y = y, nous avons 0 € À. Supposons à présent que a € À et montrons 
que s(a) € À. Soient x,y € NN tels que a + x = a + y. Nous avons : 


s(a) + x = s(a) +y (1.52a) 
SUBEQooNJHZo0o 1 SD) 
SUBEQooWDJLoo PES 
SUBEQooTLYZoo Ya 


= s(a+x) = s(a +4y) 
> Oa+T=a+y 


+ = 


Justifications. 


— Pour (1.52b). En utilisant la définition de l’addition et la commutativité, nous avons 
s(a) + x = s(a+ x). 
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— Pour (1.52c). Parce que s est injective ; c’est dans la définition 1.43 d’un triplet naturel. 
— Pour (1.52d). Parce que a € À. 


Nous avons prouvé que s(À) € À, et donc que À = N. 


LEMooCOMSooEWrumL 
Lemme 1.54. 
Nous avons 0 Æ 1. 


Démonstration. Par définition 1 = s(0). Comme s est à valeurs dans N\{0}, nous ne pouvons pas 
avoir 8(0) = 0. 


LEMooQBHFooCuCusQ 
Lemme 1.55 ([1]|). 
Si a + b = 0, alors a = b = 0. 


Démonstration. Soient a, b € N tels que a+b = 0, et supposons que b £ 0. Par la définition 1.43(2), 
nous avons b = s(c) pour un certain ce N. 

Dans ce cas nous avons a + b = a + s(c) = s(a + c) Æ 0 parce que l’image de s ne contient 
pas 0. Hélas, par hypothèse nous avons a + b = 0. Nous avons obtenu une contradiction, et nous 
déduisons que b = 0. 

Maintenant que nous savons que b = O, il reste 0 = a + b = a +0 = a. 


1.3.3 Ordre sur les naturels 


DEFooAXZSooTEMj1V 
Définition 1.56 ([17]). 
Pour a,be N, nous notons a < b si il existe x € NN tel que a + x = b. 

Nous notons également a < b sia <b et a £ b. 

LEMooWMYPooLTMyWb 
Lemme 1.57. 
Nous avons a < s(a) pour tout a € N. 
Démonstration. Cela est une conséquence du lemme 1.52 : s(a) = a +1. 

PROPooVXBBooZcghrA 


Proposition 1.58. 
La relation < est une relation d’ordre compatible avec l’addition. 
Démonstration. Plusieurs choses à vérifier. 

(1) Réflexive Nous avons a < a parce que a + 0 = a. 


(2) Antisymétrique Soient a, be N tels que a < b et b < a. Il existe x, y € N tels que 


b=a+xzx (1.53a) 
a =b+y. (1.53b) 
En substituant la seconde équation dans la première, b = (b + y) + x que nous récrivons, en 


utilisant l’associativité !, 
0+b=b+(x+7y). (1.54) 


En utilisant la régularité, 0 = x + y et donc x = y = 0 par le lemme 1.55. Cela donne alors 
a = b. 


(3) Transitive Si a <bet b < c, nous avons n,p € N tels que b=a+n et c = b + p. Donc 
c=(a+n)+p=a+(n+p), (1:55) 


ce qui signifie que a & c. Notez l’utilisation de l’associativité de la somme, démontrée en la 
proposition 1.53(1). 


15. Proposition 1.53(1). 
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(4) Compatibilité Soient a, b,n € N tels que a < b. Nous devons montrer que a +n <b+n. 
Puisque a < b, il existe x € NN tel que b = a + x. Par conséquent, 


b+tn=a+zr+t+n={(a+n)+x, (1.56) 


qui signifie bien que a+ n <b+n. 


LEMooPVRQooXPMKTE 

Lemme 1.59. 
À propos d'ordre et de stricte inégalité. ITEMooGWWFo0YGPCZi 
(1) Six <a etbÆ0, alors x <a +b. ITEMooRWGWooAfkrri 
(2) Six < a, alors x < s(a). ITEMooWCOIooMWrCag 


(3) Six < a, alors s(x) < a. 


Démonstration. En plusieurs parties. 


(1) Pour (1) Six< a, il existe de N tel que x + d = a. Nous avons alors aussi 
z+d+b=a+b, (157) 


ce qui signifie que x < a + b. Mais si x était égal à a + b, nous aurions d + b = O0, ce qui 
impliquerait 6 d = b = 0, alors que l’hypothèse stipule que b # 0. Donc x # a + b. 


(2) Pour (2) Il s’agit seulement d'utiliser le point (1) avec b = 1 et le fait que s(a) = a +1 par 
le lemme 1.52. 


(3) Pour (3) Par hypothèse, il existe b Æ£ 0 tel que x + b = a. Puisque b 0, il existe c € N tel 
que b = s(c) et donc, tel que 
x + s(c) = a. (1.58) 


En utilisant le fait que s(c) = c+ 1 ainsi que l’associativité et la commutativité de l’addition 
(proposition 1.53(1)) nous avons 


a=æ+s(c) = s(x)+c, (1.59) 


ce qui prouve que s(x) < à. 


LEMooCSIXooHeuWEd 
Lemme 1.60. 
L'élément 0 est l’unique plus petit élément de N. 


Démonstration. Puisque 0 est neutre pour l’addition !”, nous avons a + 0 = a pour tout ae N et 


donc 0 < a pour tout a. Cela veut dire que 0 est plus petit que tout élément de N. 

En ce qui concerne l’unicité, soit z € NN tel que z < a pour tout a € N. Si z £ 0, il existe x € IN 
tel que z = s(x). Nous avons donc z > x en même temps que x < z. Cela implique z = x (parce 
qu’une relation d'ordre est symétrique) et donc z = z + 1. En utilisant la régularité de z pour 
l’addition nous en déduisons que 0 = 1, ce qui est impossible par le lemme 1.54. 

LEMooJRZKooUMhOkH 


Lemme 1.61. 
Sia<betb< a, alors a = b. 


Démonstration. L’inégalité a < b dit qu'il existe x € NN tel que a + x = b. En mettant cela dans 
l'inégalité b < a nous trouvons a + x < a qui donne, via la proposition 1.58 : x < 0. Nous en 
déduisons que x = 0 parce que zéro est l’unique minimum de N par le lemme 1.60. 


16. Par le lemme 1.55. 
17. Proposition 1.53(2). 
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PROPooGCCRooFBYrlo 
Proposition 1.62. 
Le couple (N, <) est totalement ordonné ®. 


Démonstration. Soit a € N. Nous devons prouver que pour tout x € IN nous avons x < a ou a < x 
(non exclusifs). Nous posons 


A={xe N tel que x < a} (1.60a) 
B={xeNtelquea< x}, (1.60b) 


et nous prouvons que À L B = N en montrant que 0 € À LU B et que s(A LU B) € AU B. 

Nous avons 0€ AC AU B par le lemme 1.60. 

Pour étudier s(A LU B), nous considérons x € À U B et nous subdivisons en deux cas selon que 
ze Aouxe B. 


(1) SizxeB Sixe B, alors a < x < s(x) parce que x < s(x) par le lemme 1.57. Donc 
s(t)e BE AUB. 

(2) Size À Sixe À, il y a deux possibilités : x = a et x # a. Si x = a, alors a < s(x) et donc 
s(x)e AC AU B. 


Si x £ a, alors le lemme 1.59(3) nous indique que s(x) < a et donc s(x)e AC AU B. 


Nous avons donc prouvé que s(A Ü B) € AU B, et donc que AU B = N. 


PROPooMZOWooHmsXzI 

Proposition 1.63 ([17,1]). 

L'ensemble ordonné (N,<) vérifie les propriétés suivantes. NS en 
(1) L'élément 0 est l’unique minimum de N. ITEMooYAJTooEFnOpB 
(2) Toute partie non vide a un unique plus petit élément. ITEMooSRGOoONYŸ JJHY 
(3) L'ensemble N n'a pas de plus grand élément. HTEMooETÜZoDRTCAx 


(4) Toute partie non vide majorée a un unique plus grand élément. 


Démonstration. Point par point. 
(1) Pour (1) C'est le lemme 1.60. 
(2) Pour (2) Soit une partie À non vide dans N. Si 0 € À, nous avons fini. 


(2a) L’ensemble B Nous supposons donc que À ne contient pas zéro et nous définissons 


B = {ne N\A tel que n < a,Va € A}. (1.61) 


(2b) Un élément particulier dans B L'ensemble B vérifie : 


— 0EeB 


— B Z N parce que À est non vide. 


La contraposée de la condition (3) de la définition 1.43 d’un triplet naturel implique 
que s(B) d B. Autrement dit, il existe be B tel que s(b) é B. 


(2c) Deux fonctions sur À Puisque b € B, nous avons une application c: À — NN telle 
que b + c(a) = a. Nous avons c(a) £ 0 parce que c(a) = 0 signifierait b = a, ce qui est 
impossible parce que a € À et bE B. 


Comme pour tout a € À, l’élément c(a) est non nul, il existe une fonction d: À — N 
telle que c(a) = d(a) + 1. 


18. Définition 1.12. 
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(24) s(b)e A Supposons que s(b) # A. Alors il existe a € A tel que s(b) < a est faux. 
Puisque l’ordre est total (proposition 1.62), nous avons 


ee . EnooYQSFooPS PH 


Comme b € B nous avons aussi 


ten. ee 


Et enfin nous avons EQooWFHRooGDSBF 
7. de 


parce que ae Aetbe B. 

Les conditions (1.63) et (1.64) se résument en b < a. Le lemme 1.59(3) nous indique 
alors que s(b) < a. Cela mis à côté de (1.62) conclut que a = s(b), et donc que s(b) est 
dans À. Contradiction. Nous en concluons que s(b) € A. 


(2e) s(b) est un minimum de À En utilisant la commutativité et l’associativité de la 
somme nous avons, pour tout a € À : 


a =b+ ca) = b+ (d(a) +1) = (b+ 1) + d(a) = s(b) + d(a). (1.65) 


Donc s(b) < a pour tout a € À. Mais comme s(b) € À, l'élément s(b) est bien un 
minimum de À. 


(2f) Unicité Si a et a’ sont des minimums de À, alors a < a” et a’ < a. Nous en déduisons 
que a = d/. 


Pour (3) Si M € IN majore tous les éléments de N, alors en particulier M > s(M). 
Mais le lemme 1.57 nous indique que M < s(M). Nous avons donc s(M) = M, c’est-à-dire 
M = M +1. En utilisant la régularité de M !°, nous trouvons 0 = 1, ce qui est impossible 
par le lemme 1.54. 


Pour (4) Soit À une partie non vide et majorée de N. 


(4a) L’ensemble B Nous posons 


B={ne N\A tel que a < n,VaE€ A}. (1.66) 


(4b) B est non vide Soit un majorant M de À : pour tout a € A nous avons a < M. Nous 
avons s(M) # À, parce que si s(M) était dans À, ce serait un élément de À strictement 
plus grand que tout a € A. Donc B est non vide parce qu’il contient s(M). 


Minimum Puisque B est non vide, il possède un plus petit élément que nous notons b. 
Nous savons que b 0 parce que sinon À serait vide. Il existe donc c € N tel que b = s(c). 


a < c pour tout ae À Comme s(c) € B nous avons a < s(c) pour tout a € À. Donc, par 
le lemme 1.59(3) nous avons s(a) < s(c), c’est-à-dire a +1 < c+1. Par régularité nous avons 
a <C. 


Nous avons prouvé que a < c pour tout a € À. 


ce À Sic n'est pas dans À, alors il est dans B et il contredit la minimalité de b. Donc c est 
dans À. 


Conclusion L'élément c est dans À tout en étant plus petit que tout élément de À. 


Unicité Si x est un élément minium de À, alors nous avons x < c parce que x est minimum 
et c< x parce que cest minimum, et donc x = c. 


LEMooKUWUooPLWelf 


Lemme 1.64. 
Toute partie finie non vide de N est majorée et minorée. 


19. Dit plus simplement : en simplifiant par M. 
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LEMoo0UEJ0o0o0gaxzi 
Lemme-Définition 1.65. 
Si À est une partie de N, il existe un unique élément m € N tel que 
m < aVa € À. (1.67b) 
Cet élément est noté min(A) et nommé minimum de A. 
Si À est majoré, il existe un unique élément M € N tel que 
MEeA (1.68a) 
M > aVaE€ A. (1.68b) 


Cet élément est noté max(A) et nommé maximum de A. 


Nous verrons dans le lemme 1.73 qu’une partie de N admet un maximum si et seulement si elle 
est finie. 


LEMooYMRJooYIAhBb 

Lemme 1.66 ([1]|). 
Quelques affirmations sur l’ordre dans N. ITEMooTLOTooTWNtod 
(1) I n'existe pas de n € N tel que n < 0. ITEMooP JKQooGf LCUM 


(2) Sia,be N vérifient a > b, alors il n'existe pas de x dans N tel que a + x = b. 


Démonstration. En deux parties. 
(1) Pour (1) Nous savons par la proposition 1.63(1) que 0 est l’unique minimum de N. Nous 
avons donc forcément 0 < n. Si n vérifie de plus n < 0 alors nous avons n = 0 par symétrie 
de la relation d’ordre . Il n’est donc pas possible d’avoir n Æ 0. 


SR 
ND 
nr 


Pour (2) Sib< a il existe ce N tel que b + c = a. Et comme a £ b, c n’est pas nul et il 
existe y € NN tel que c = s(y). Bref, nous avons 


b+ sy) = a. (1.69) 
Si de plus il existe x € NN tel que a + x = b nous aurions 
a+x+s(y) = a. (1.70) 
Comme a est régulier pour l’addition 2°, nous avons 


x + s(y) = 0, (1.71) 


ce qui signifie, par le lemme 1.55 que x = s(y) = 0. Puisque s prend ses valeurs dans N\{0}, 
cela est impossible. 


DEFooKBUFooLvMHrf 
Définition 1.67. 
Soient a,b € N tels que a < b. Nous notons par {a,...,b} l’ensemble 
{zeNtelquea<x< b}. (1.72) 
PROPooFYMJooWihvhk 


Proposition 1.68. 
Toute application N — N strictement croissante est injective. 


Démonstration. Soit une application strictement croissante f : IN — IN. Soient a,b € IN tels que 
f(a) = f(b). Puisque l’ordre est total ?!, nous supposons que a & b. Si a = b nous avons terminé. 
Nous supposons donc que a # b, c’est-à-dire que a < b. Par stricte croissance nous avons alors 
f(a) < f(b) qui signifie f(a) < f(b) et f(a) À f(b). Contradiction. Il n’existe donc pas de a Æ b 
tels que f(a) = f(b). L'application f est donc injective. 


20. Proposition 1.53(3). 
21. Proposition 1.62. 
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LEMooFKLPooPrmeUU 
Lemme 1.69 ([1]). 
Si S n'est pas majoré dans N, alors il existe une bijection N — S. 
Démonstration. Nous considérons l’application suivante : 
LS —S 
4 (1.73) 


nr min{x e S tel que x > n}. 


Cette application est bien définie parce que tout partie non vide de N a un plus petit élément ??. 
Maintenant nous définissons f : IN — S par 
f(0) = min(S) (1.74a) 
Ce (1.74b) 
C’est le théorème 1.47 qui nous permet de le faire. Nous montrons que f est bijective. 


(1) Injective Nous avons 
fin+lefresS tel que x > f(n)}. (1.75) 


Donc f est strictement croissante. Elle est donc injective. 


(2) Surjective Soit a € S. Nous allons voir que a est dans l’image de f. Pour cela nous posons 
A={xe N tel que f(x) < a}. (1.76) 


Cet ensemble est majoré par a. En effet si x € À nous avons x < f(x) < a. La partie À de N 

possède un maximum. Nous notons M = max(A). Ce M a deux propriétés intéressantes. 

(2a) D'abord Puisque M € À, nous avons f(M) < a. Une autre façon de dire cela est de 
dire que 

ae{xesS tel que x > f(M)}. (Tr) 

Or f(M +1) = min{zeS tel que x > f(M)}. Donc f(M +1) < a. 

(2b) Ensuite Puisque M est le maximum de À, M+1 majore À, c’est-à-dire que f(M+1) > 
a. 

(2c) Les deux ensemble Nous avons prouvé que f(M + 1) < a et f(M +1) > a. Nous 
en déduisons, par le lemme 1.61, que f(M +1) = a. 


NORMooQXASooMXqhjl 
1.70. 
Durant la preuve du lemme 1.69, nous n’avons pas été loin de prouver que 
(min(S), 5, g) (1.78) 
est un triplet naturel. 
Toute partie non bornée de N donne lieu à un triplet naturel. 
DEFooAZAYooV;jNzmy 


Définition 1.71 ([1]). 
Soit un ensemble muni d’une loi de composition interne (A,+). Soit n € N'eta € A. Nous 
définissons n x À par 


a. (1.79a) 
(n+1l)xa=nxa+a. 1.79b) 
DEFooLCWLooYrToFv 


Définition 1.72. 
Un ensemble totalement ordonné muni d'une loi de composition interne (A, +, <) est archimédien 


si pour tout x,y € À avec x > 0, ü existe n € N tel que n x x > y (voir la définition 1.71). 
LEMooGQUWooYJQfJB 


Lemme 1.73. 
Une partie de N admet un maximum. si et seulement si elle est finie. 


22. Proposition 1.63(2). 
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1.3.4 Multiplication dans les naturels 


PROPooBBQPooRgP0;jf 

Proposition-Définition 1.74. 
Îl existe une unique fonction f : N x N — N telle que ITEMooNTUUooDAUVSV 
(1) f(a,0) = 0 pour tout a € N ITEMooPPZZooQQabwn 


(2) f(a,s(b)) = f(a,b) + a pour tout a,be N. 
Cette fonction est la multiplication et nous notons f(a,b) = a x b, voire ab quand il n’y a pas 
d’ambigüité. Le nombre a x b est nommé le produit de a par b. 
Démonstration. En deux parties. 


(1) Fonctions définies par récurrence Soit 4 € N, Par le théorème 1.47, il existe une unique 
ET FRRPONC SOS Ü 
application f,: IN — N telle que 


Ja(0) = 0 (1.80a) 
fa(s(b)) = fa(b) + a (1.80b) 


(2) Existence Nous considérons, pour chaque a € N la fonction f, définie par les conditions 
(1.80). En posant f(a,b) = fA(b), nous avons une application qui vérifie toutes les conditions. 


(3) Unicité Soient des applications f et g vérifiant les propriétés demandées. Soit a € N. Nous 
pouvons définir fa: N—Net g:N—N par f(n) = f(a,b) et ga(b) = g(a,b). 
Les applications f, et g vérifient toutes deux les conditions (1.80), et sont donc égales : 
fa = ga pour tout a. Donc f = g. 


1.75. 
Nous supposons que le lecteur connait déjà la priorité des opérations. Il saura donc interpréter des 
expressions comme a x b + c comme voulant dire (a x b) + c sans que nous ayons à ajouter des 


parenthèses. 

PROPooGHDOooFYRmon 

Proposition 1.76 ([17,1]). 

La multiplication a les propriétés suivantes. ITEMOOHFWRooDCEp j j 
(HD) nx1=n pour tout ne N. ITEMooRSYMooSUrRs1 
(2) 1xn=n pour tout ne N. ITEMooW JPO0oRUY jQ 
(3) La multiplication est commutative. ITEMooNBYKooXnCRrf 
(4) 0x n = 0 pour tout n € N ITEMooLJQBooVpUxUv 
(5) L'élément 1 est neutre pour la multiplication. TTEMOEDYLTOSETIGEL., 
(6) La multiplication est distributive par rapport à l’addition. ITEMooQBFSooWGDQYX 


(7) La multiplication est associative. 


Démonstration. Point par point. 
(1) Pour (1) Nous avons n x 1=n x s(0)=(nx0)+n=0+n=n.Doncnxl=n. 


(2) Pour (2) Nous le faisons par récurrence. Par définition c’est vrai pour n = 0. En ce qui 
concerne la récurrence, nous supposons que 1 x n = n, et nous prouvons que 1 x s(n) = s(n) : 


1x s(n)=(1xn)+1=n+1=s(n). (1.81) 


(3) Pour (3) Soit a € N. Nous prouvons par récurrence sur b € N que a x b = b x a. Pour 
b = 0 c’est bon. Pour la récurrence, nous supposons que a x b = b x a et nous prouvons que 
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a x s(b) = s(b) x a : 


ax s(b)=axb+a (1.82a) 

=bxa+a récurrence (1.82b) 

= (bxa)+(1xa) par (2) (1.82c) 

= (b+1)xa distributivité (1.824) 

oi (1.820) 

(4) Pour (4) C’est vrai pour n = 0 par la définition 1.74(1). En ce qui concerne s(n), nous 


avons 
0 x s(n) = (0 x n) +0 = 0. (1.83) 
(5) Pour (5) C’est la combinaison de (1) et (2). 


(6) Pour (6) Soient a,be N. Nous prouvons par récurrence sur ce N que 


(a+b)xc=axc+bxe. (1.84) 


Pour c = 0, nous avons (a + b) x 0 = 0 ainsi que a x 0 = b x 0 = 0 en vertu des points 
précédents sur la multiplication par zéro. Pour la récurrence nous utilisons associativité et 
commutativité de la somme : 


(a + b) x s(c) = (a + b) x c+(a+b) 
=axc+bxc+a+b 
= (axc+a)+(b x c+b) 


= (a x s(c)) + (b x s(c)). 


(7) Pour (7) Soient a,b € N. Nous démontrons par récurrence sur c € N que (a x b) x € = 
x (b x c). Pour c = 0 l'égalité est triviale. Nous supposons que l’égalité est correcte pour €, 
et nous la prouvons pour s(c) : 


(a x b) x = ((axb) xc) +axb (1.86a) 
= (a x (b x c)) + a x b récurrence (1.86b) 
= ((b x c) . +bxa commutativité (1.86c) 
= (bxc+b) x distributivité (1.864) 

= (bx s(c)) x définition 1.74(2) (1.86e) 
= 4x 6 “ x(6) commutativité. (1.86) 


Lemme 1.77 ([1]). 
La multiplication est compatible avec l’ordre : 


<b=axn<bxn (1.87) 
pour tout n E N. 


Démonstration. Par la définition 1.56 de l’ordre, si a < b, il existe c € N tel que b = a + c. En 
utilisant la distributivité , nous avons 


bxn=(a+c)xn=axn+cexn. (1.88) 


Nous en déduisons que a x n <b x n parce que cxneN. 


23. Nous n’écrivons pas toutes les parenthèses parce que les règles de priorité des opérations sont supposées 
connues. J’invite cependant le lecteur à remarquer qu’une formalisation de ces règles n’est probablement pas facile. 
Pour que tout soit rigoureux, il faudrait un algorithme qui parcourt une suite de caractères et l’interprète en ajoutant 
correctement les parenthèses. 

24. Proposition 1.76(6). 
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LEMooFHYEooLDudfn 


Lemme 1.78. 
Si a x b= 0, alors a = 0 ou b = 0 (ou les deux). 


Démonstration. Supposons que a # 0. Alors il existe c € N tel que a = s(c). Nous avons 


0O=axb=s(c)xb=cxb+b. (1.89) 


Le lemme 1.55 nous dit alors que c x b = b = 0. 


LEMooGUXGooBcKJdS 


Lemme 1.79 ([1|). 
Sia<bet sin Æ0, alors 


axn<bxn. (1.90) 


Démonstration. L'hypothèse a < b implique qu’il existe c € N tel que a + c = b. De plus c # 0 
parce que a £ b. En utilisant la distributivité 2°, nous avons 


bxn=(a+c)xn=(axn)+(cxn). (1.91) 


Cela prouve que a x n < b x n. Et comme cet n ne sont pas nuls, nous avons même © c x n # 0 
et doncaxn<bxn. 


Üne version dans Z sera le lemme 1.107. 
LEMooSFUKooBNAple 


Lemme 1.80 ([1]|). 
Soient a Æ 0 etb > 1 dans N. Alors 


ab > a. (1.92) 


Démonstration. Il s’agit d’une application du lemme 1.79 en partant de l’inégalité 1 < b et en la 


« multipliant » par a. 


Proposition 1.81 ([1]). 
Tous les naturels non nuls sont réguliers par rapport à la multiplication. Autrement dit, si a Æ 0, 
alors nous avons 


GXT=AXy—T—Y. (1.93) 


Démonstration. Soit a £ 0 dans N. Nous supposons que a X x = a x y. Puisque l’ordre sur N est 
total (proposition 1.62), nous pouvons supposer que y > x; sinon il suffit de permuter les rôles de 
x et y dans tout ce qui suit. 

Il existe de NN tel que y = x + d. En utilisant l’hypothèse a x y = a x x et la distributivité??, 


axz=axy=ax(x+d)=(axzx)+(a x d). (1.94) 


28 nous en déduisons que 


Puisque (a x x) est régulier pour la somme 
0 = a x d. (1.95) 


Le lemme 1.78 dit alors que a = 0 ou que d = 0. Étant donné que a # 0 par hypothèse, nous 
déduisons que d = 0, c’est-à-dire que x = y. 


25. Proposition 1.76(6). 
26. Lemme 1.78. 

27. Proposition 1.76(6). 
28. Proposition 1.53(3). 
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1.3.5 Presque unicité des triplets naturels 


Il existe de nombreux triplets naturels ; l’existence d’un triplet naturel est un théorème de la 
théorie des ensembles que nous avons accepté. Nous avons déjà à peu près montré que toute partie 
non bornée de N donne lieu à un nouveau triplet naturel. Voir 1.70. 


Nous voyons maintenant que tous les triplets naturels sont équivalents au moins pour l’ordre. 
THOooFUXMooJuigHK 


Théorème 1.82 ([1]). 
Soient des triplets naturels (Ni,01,51) et (N2,02,52). Alors 


(1) il existe une unique application f : Ni — N° telle que 
(1a) f(o1) = 02 
(1b) fosi=s20f. 


(2) Une telle application est une bijection croissante. 


Démonstration. En plusieurs points. 


(1) Existence Nous voyons (Wi,01,31) comme un triplet naturel, et V2 comme un simple 
ensemble. Nous pouvons appliquer le théorème 1.47 à (W,01,s1). L'élément o1 va jouer le 
rôle de 0 alors que o2 va jouer le rôle de b. L'application g est 52. Bref, il existe une unique 
application f: Ni — N2 telle que 


(la) f(o1) = 02 
(1b) f(s1(n)) = s2(f(n)) 
pour tout n e Ni. 


(2) Unicité Le théorème 1.47 donne déjà l’unicité. Nous la faisons quand même, juste pour 
vous faire plaisir. Soit g, une autre application vérifiant les mêmes conditions. Pour faire la 
récurrence de façon très explicite, nous posons 


P: MN — {0,1} 
—. 1 si g(x) = f(x) (1.96) 
O0 sinon. 


Notre but est de prouver que P(x) = 1 pour tout x € N\, en utilisant la récurrence telle que 
décrite dans la proposition 1.46. 

Nous avons f(o1) = 02 = g(o1). Donc P(o;) = 1. Nous supposons que, pour un certain 
a € Ni, nous ayons P(a) = 1, et nous prouvons que P(si(a)) =; 1; 


Nous avons g(a) = f(a), et nous prenons s2 des deux côtés, nous avons succéssivement 


(s2 0 g)(a) = (s2 0 f)(a) (1.97a) 
(go s1)(a) = (fo s1)(a) (1.97b) 
g(si(a)) = f(s1(a)). (1.97c) 


La dernière égalité signifie que P(si(a)) — 1. La proposition 1.46 implique que P(x) = 1 
pour tout x € Ni. 
(3) Bijection, définir l’inverse Nous allons trouver un inverse et le lemme 1.7 nous dit que 


c’est suffisant. La partie « existence », en inversant les rôles de Ni et N2 nous donne une 
application g: N2 — Ni telle que 


(3a) g(02) = o1 
(3b) gos2=s10g. 


Nous allons prouver que g est un inverse de f. 
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(4) fog=Id Nous posons À = {x € N, tel que (f o g)(x) = x}. Nous avons 


F(g(o2)) = f(o1) = 02, (1.98) 
et donc 02 € À. 

Supposons que x € À. Alors 

(fo g)(s2(x)) = (fo go s2)(x) (L.99a) 
8109 
= (fo 81 og)(x) (1.99b) 
=s20f 

= (820 fo g)(x) (L.99c) 
= s2((f © g)(x)) (1.994) 
= s2(x) (1.99e) 


Donc s2(x) € À. Nous en déduisons que À = N2 par le point (3) de la définition 1.43 d’un 
triplet naturel. 


(5) go f=Id J'imagine que c’est la même chose que dans l’autre sens (ci-dessus) ?°. 


PROPooCCVNooYUYcqG 
Proposition 1.83. 
L'ensemble structuré (IN, +, x,<) est archimédien®. En d’autres termes, pour tout a,b e N\{0}, 
il existe n € N tel que 
b<nxa. (1.100) 


Démonstration. Soient a, b € N avec a £ 0. 

Si a > b, nous avons le résultat avec n = 1. 

Si a = b, en prenant n = s(1) nous avons le résultat. En effet s(1) x a = a + a. Puisque a # 0, 
nous avons a+a>aeta+aza, donc s(1) x a > a. 

La vraie vie est avec a < b. Nous posons 


X ={xeNtelquel<zxa<b} (1.101) 


et 
B = {x x a tel que x € X}. (1.102) 


L'ensemble X est non vide parce que 1 € X. L'ensemble B est alors également non vide, et majoré 
par b. La proposition 1.63(4) nous indique alors que B possède un plus grand élément que nous 
allons noter to x a (x0 € À). 

Nous posons n = s(x0), et nous avons 


TOXA<TXAa+a=s(To) Xa=nx a. (1.103) 


Nous en déduisons que n x a n’est pas dans B parce que x9 * a est le plus grand élément de B. 
Donc xo n’est pas dans X ; nous n’avons donc pas les inégalités 


1<nxa<b. (1.104) 


Laquelle des deux inégalités est fausse ? Puisque n = s(x9) > 1 et que a > 1, nous avons 1 < n x a. 
Donc c’est la seconde inégalité qui est fausse. Nous avons donc n x a > b. 


29. Je n'ai pas fait les calculs ; écrivez-moi si ça pose un problème. 
30. Définition 1.72. 
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DEFOoNEVNooJlimJOC 
Proposition-Définition 1.84. 
Soit À bl j d’une loi d tion interne! notée +. 5j licati 
oit À un ensemble muni d’une loi de composition interne ®” notée + LUE UOTE UT) Rplication 
a: N — À, alors il existe une unique application f : N — À telle quel 


J(0) = a(0) (1.105a) 
FCk) = f(k — 1) + a(k). (1.105b) 


La valeur de f(k) est notée 2: ai). 


Démonstration. Application du théorème 1.47. 


1.85. 
Les équations de définition (1.105) signifient que nous définissons la notation . o «(i) par récur- 
rence par les conditions suivantes : 


ITEMooIPDTooEhUxea 
0 ; 
(1) Di-o ai) = a(0), 
k k—1 /: 
(2) Do a(i) = Xi a(i) + a(k). 
PROPooXXGHooLafGsI 
Proposition 1.86 (La multiplication est une somme itérée[17]). 
Pour tout a,be N, nous avons 
nm 
Dore (1.106) 
i=1 


Démonstration. Nous le faisons par récurrence en partant de n = 1. Avec n = 1 nous avons 
1 
ja =a,et a x 1 = a. Donc c’est bon. 
Pour la récurrence nous avons : 


n+1 


n s(n) 
axs(n)=axn+a= a+ta= da) a. (1.107) 
i=1 i=1 i=1 


LEMooIETGooMyrilW 
Lemme 1.87. 
Soit a > 1 dans N. Pour tout n > 1 nous avons na < a”. 


Démonstration. Par récurrence. Avec n = 1 nous avons bien a < a; pas de problème. Supposons 
que na < a”, et montrons le pas de récurrence. Nous avons : 


(n + 1)a = na + a (1.108a) 
£na+na parce que a < na (1.108b) 
= 2na (1.108c) 
< 2a” récurrence (1.108d) 
< a parce que a > 2 (1.108e) 
= (1.108f) 


Proposition 1.88 ([17]). 
Soit a > 1. Alors 


(1) l’application n — a” est strictement croissante ; 


(2) l’ensemble {a” tel que n € N} n’est pas majoré. 


31. Peut-être un anneau, mais comme nous avons l'intention, dans les propositions 1.86 et suivantes, de faire des 
sommes vers (N,+), plutôt un monoïde. 
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Démonstration. Nous avons 


atlzatxa (1.109a) 
> a" xl lemme 1.80 (1.109b) 
= jf (1.109c) 


Cela prouve le premier point. 
Pour le second point, soit me N. Nous devons trouver N € N tel que a > m. Puisque N est 


archimédien *?, nous pouvons considérer N tel que Na > m. Le lemme 1.55 nous assure alors que 
m< Na< a". (1.110) 
THOo0oKDJVooRIJRHP 


Théorème 1.89 (division euclidienne [17]). 
Pour tout a € N, pour tout be N\{0}, il existe un unique couple (q,r) € IN? tel que a = bg +r avec 
0<r<b. 

Sir = 0, nous disons que a est divisible par b. 


Démonstration. Existence puis unicité. 


(1) Existence 


Nous posons 
A = {bx tel que x € N, bx < a}. (1.111) 


L'ensemble À contient 0 (avec x = 0) et est majoré par a. Donc il possède un plus grand 
élément que nous notons bg. Puisque bq € À, nous avons bq < a et donc il existe r € IN tel 


Ar EQooIUIC 
bg+r= a. nd 


Il reste à montrer que r < b. Supposons que r > b. Il existerait alors un x tel que b+x=r. 
En mettant ça dans (1.112), 
bg+b+zx=a, (1.113) 


c’est-à-dire b(q + 1) + x = à, qui signifierait b(q + 1) < a, ce qui est faux parce que bg est le 
plus grand élément de À. 


(2) Unicité Supposons que nous ayons 
a=bq+r=bg +7 (1.114) 


avec 0 <r <bet 0 < r’ < b. Il y a trois possibilités : q < q, g = qet g > q. 


(2a) Si g <q Alors il existe x € N tel que g' + x = q, et nous avons 
bd +zx)+r=bg +bx+r, (1.115) 


ce qui, après distribution et simplification, donne r” = bx+r. Puisque nous avons x > 1, 


il vient 
! 


r'=bt+r>b+rzb. (1.116) 


Cela n’est pas possible parce que r” < b. Le cas g' < q n’est pas possible. 
(2b) Si qg = aq Nous avons alors immédiatement bq + r = bq + r” et donc r = r’. Unicité. 


(2c) Si g > q En posant q + x = q nous trouvons la même impossibilité que dans le cas 
! 
q <q. 


32. Proposition 1.83. 
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1.3.6 Écriture d’un naturel dans une base 


1.90. 
Nous avons déjà donné la notation 1 = s(0). Nous continuons avec 2 = s(1), 3 = s(2), 4 = s(3), 
5 = s(4), 6 = 5(5), 7 = 5(6), 8 = s(7) et 9 = s(8). 


Nous allons maintenant voir comment écrire des nombres plus grands. 
Sib>1et NE N sont donnés, nous notons 
Cin = {ue {0,...,b— 1} +1 tel que uw 0}. (1.117) 


où les u; sont numérotés à partir de 0; donc dire un Æ 0 revient à dire que le dernier est non nul, 
et non l’avant dernier. Nous définissons *° 


PN: ChN — N 
N 
ur + uib!. 
i=0 


Cette application 4, n sera encore bien étudiée pour la partie décimale d’un réel. Voir la définition 
11:345; 


EQooWWTUo ETS) 


LEMooJUGKooGsbrhi 
Lemme 1.91 ([17]). 
Soient b > 1, N > 0 ainsi que u E Ci, N. Alors 
E YHTL 
DV < @,n(u) < bV+T, PE lo) 
Démonstration. En séparant la somme nous avons 
N=1 
pon(u) = und" + ÿ wb!. (1.120) 
i=0 
Puisque un > 1 nous avons bN < unb", et donc 
DV < unb" < pp n(u). (1.121) 


Voilà qui prouve la première inégalité de (1.119). 
Pour prouver que 44,.n(u) < bV+1, nous faisons une récurrence sur N. 
(1) Pour N =0 Nous devons prouver que wyo(u) < b. Par définition 44,.n(u) = uob°. Puisque 
u € {0,...,b—1}N+1, nous avons u0 & b— 1 < b. 
(2) Récurrence Nous supposons que pour tout u € Ci,N nous avons @, nN(u) < bN+1, Et nous 
devons montrer que pour tout v € Ci,n+1 nous avons @nN+1(v) < De 


Nous posons u = (vo,...,Un); nous avons alors 
N 
Po N+1(v) = UN+10N +1 + > vb! (1.122a) 
i=0 
= 0N+10 TT + y, n(u) (1.122b) 
< ana FE GNT récurrence (1.122c) 
= (on + 13801 (1.122d) 
SphtTe parce que Uny+r1 <b—1 (1.122e) 
pe (1.122) 


33. Le symbole de sommation est défini par 1.84. 
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LEMooKDKJooSkhcJS 
Lemme 1.92 ([1]|). 
Soient x E N ainsi que b > 2. Nous posons 


N = max{ke N tel que À < x}. (1.123) 
Alors 


(1) Sin > N alors vpn(u) > x pour tout u € Cyn- 
(2) Sin < N alors phn(u) < x pour tout u E Cyn. 


Démonstration. En deux parties. 
(1) Sin > N Nous avons, par définition de C,n que un # 0, de telle sorte que 
Prato) Ua STE (1.124) 


La dernière inégalité est due au fait que n # {ke IN tel que bf < r}. 


(2) Sin <N Nous avons 
x > ON > hn(u). (1.125) 


Le seconde inégalité est une conséquence du lemme 1.91. 


Théorème 1.93 ([17]). 
Soit b>2. SixeN, alors il existe un unique N € N et un unique ue CyN tels que 


z = Pi N(U). (1.126) 


Démonstration. Nous commençons par x < b. Dans ce cas, N = 0 parce que si uyx # 0 avec k Z 0, 
nous avons 


N 
> usb > ut >b> x. (1.127) 
i=0 


Donc x = xob° = uo. Bref, dans le cas x < b nous avons obligatoirement N = 0 et uo = x. 
Nous étudions à présent le cas x > b que nous subdivisons en plusieurs étapes. 
4) N>1 SiN = 0, alors o(u) = uo < b < x. Donc N > 1. 
Notons incidemment que nous pouvons parler de N — 1 à partir de maintenant. 
(2) Unicité, préambule Le lemme 1.92 nous indique que si x = y n(u) pour un certain 
NEN et un certain ue CyN, alors 


N = max{k € N tel que b* < x}. (1.128) 
Nous posons 
N 
= un à (1.129) 
i=k 
et nous allons montrer que le couple (X4:1,ux) est le résultat de la division euclidienne ** de 
X% par b. 
D'abord, uy < b, donc ça a bien la tête d’un reste. Ensuite, pour le quotient, 
N 
DXp11 + ug = b >, usb (+1) + UE (1.130a) 
i=k+1 
N 
= Ù wub +ux (1.130b) 
i=k+1 
N 
= > mb (1.130c) 
i=k 
= X4. (1.130d) 


34. Théorème 1.89. 
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(3) Unicité En quoi cela fait-il avancer la choucroute? Supposons que pi n(u) = gr m(v). 
Alors nous avons déjà prouvé que 


M = N = max{ke N tel que bÀ < r}. (1.131) 


Ensuite nous devons montrer que u = v. Nous posons Xy = ss L'uibtTE et Yy = ss" sub À. 
Notez que 
Xo= =. (1.132) 


Si Xy = Y4, alors par unicité de la division euclidienne nous avons Xy11 = Yy11 et ux = Ux. 
Par récurrence nous avons X} = Ÿ4 et uy = vx pour tout k. 


(4) Existence Soit x € N. Nous posons Y = # et 
Uk = byr+1 + Ur (1.133) 


avec uy < b. Vus l’unicité dans la division euclidienne et le théorème * 1.47 permettant la 
définition par récurrence, ces conditions définissent deux suites (uz) et (yx) dans N. 


Montrons qu’il existe un N € N tel que y, = 0 pour tout n > N +1. Nous avons : 


DYrr1 parce que b > 2 (1.134a) 
Uk pcq byr+1 + Ux = Ur. (1.134b) 


2Yrk+1 


Bref : 2yr41 < yr. Par récurrence °° 


nous trouvons que 
Fe < x (1.135) 
parce que Yo = æ. Par le lemme 1.87, si k& est assez grand, 


2kyr < y < x. (1.136) 


Puisque N est archimédien *’, nous pouvons considérer s € N tel que 2s > x. À ce moment 
nous avons 


Yn = 0 (1.137) 
pour tout n > s. Nous posons 
N = max{k tel que w # 0}. (1.138) 
Prouvons par récurrence sur ! que 
> : EQooZBKQoo 
gui D, mbU TON, 19853) 
i=N-I 


Notez quei+{>zN-1+1=N, donc (i+1) — N a un sens. 


(4a) Pour 1=0 Avec ! = 0 nous avons D 4j ubOTON 2 wxy. Il faut donc voir que 


yn = un. Nous avons 


YN = bYyN+1 + UN. (1.140) 


En se rappelant que yny+1 = 0, nous avons le résultat. 


35. Nous ne citerons pas toujours ce théorème à chaque fois que nous définissons quelque chose par récurrence. 
36. Faut-il citer la proposition 1.46 et donner explicitement la fonction P ? 
37. Proposition 1.83. 
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(4b) Pour [+1 Pour la récurrence nous avons le calcul suivant : 
YN IA = OYN I + UNI: (1.141a) 


N 

D RENTE (1.141b) 
i=N-| 

N 

> ubETD-N +1 + UN_1-1 (1.141c) 
i=N-I 

N 
=, D, Pr (1.141d) 

i=N-i-1 


La récurrence est prouvée. L'égalité (1.139) est validée pour tout lL. 


En posant { = N dans (1.139) nous trouvons 


N 
yo = D wb. (1.142) 
i=0 
Mais la définition de la suite (y) contient yo = x. Donc nous avons prouvé que 


N 
= D ub = pi n(u). (1.143) 
i=0 


Exemple 1.94. 
Comment écrire le nombre b en base b? Nous devons trouver un N et une suite (u;) tels que 


N 
b= D wb. (1.144) 
i=0 


Il est facile de voir que le choix N = 1 et u = (0,1) fonctionne bien : b = 1 x b! + 0. Nous avons 
donc 
b = w1(1,0). (1.145) 


Nous écrivons cela plus sobrement b = 10. A 


1.95. 
À part des cas très exceptionnels, nous utilisons toujours la base b = (9) = s°(0). Nous nous 
permettons donc d'écrire « 64 » le nombre 4,(9),2(6,4). Vous saviez que tout groupe simple d'ordre 
Ps(9,2(6; 0) est isomorphe au groupe alterné À, nt ? C’est la proposition 5.54. 

La proposition suivante dit que le nombre qui a le plus de chiffres est le plus grand. 
Proposition 1.96 ([17]). 
Siue C,n etve Cm avec M > N alors pin(u) < pr, m(v). 


Démonstration. Le lemme 1.91 nous dit que 
bù € pyn(u) < bVT1 (1.146) 


et 


BE € parle) TE, (1.147) 


Puisque M > N nous avons bN+1 < DM et donc 


pon(u) < TTL D € op m(v). (1.148) 


1.4. LES ENTIERS 
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La proposition suivante dit que si deux nombres s’écrivent avec le même nombre de chiffres, le 
plus grand est celui dont le premier chiffre différent est le plus grand. Autrement dit, les nombres 


en écriture de position se classent par ordre lexicographique. 


Proposition 1.97. 


Soient u,v e Ci nN tels que uw; = vw; pouri=r+1,...,N. Siu, > vw alors pyn(u) > pe, N(v). 


Démonstration. En découpant les sommes nous avons 


N r—1 
p,N(u) = ÿ ui0° + urb" + 2 u;b° 
i=r+1 i=0 
et 
N r—1 
pr,N(v) = , UD + vb" + >. vid". 
i=r+1 i=0 


Puisque db" > Le, u;b! (lemme 1.91), nous avons aussi 


(1.149) 


(1.150) 


r—1 r—1 
: E TZPB 
+ Sub > Yu bi 
i=0 i=0 
Et le calcul final : 
N r—1 
Pb,N(v) < > vb" + 07 + DT + > u;b° pcq (1.151) (1.152a) 
i=r+1 i=0 
N r—1 | 
= D wbi+ (ue +1)8 + D wub (1.152b) 
i=r+1 i=0 
N : r—1 
< >, uib° + ur b" + ; uib PCA Ur > Vr +1 (1.152c) 
i=r+1 i=0 
N . 
= Sub (1.152) 
i=0 
= pp, N(u). (1.152e) 
Et voilà. 
1.4 Les entiers 
PROPooFIKUooVHlvTt 


Proposition-Définition 1.98 ([17]). 


Soient a, b,a’,b € N. Nous disons que (a,b) — (a',b!) si et seulement si 


a+b=b+a 
(1) — est une relation d'équivalence sur N°. 
(2) Si(a,b) + (a’,b') et (x,y) + (x’,y°) alors 
(a+x,b+y) = (a +x,0 +). 


L'ensemble des entiers est 
Z=(NXN)/-, 


et nous notons à, b € Z la classe de (a,b) € N x N. 


Démonstration. En plusieurs points. 


(1.153) 


ITEMooZQSHooSDfdvK 


(1.154) 


(1.155) 
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(1) Symétrie C’est la commutativité de la somme dans N, proposition 1.53(1). 


(2) Réflexive Immédiat. 


(3) Transitive Nous supposons que (a, b) + (u,v) et que (u,v) — (x, y). Alors nous avons 


a+v=u+b 
U+Y=U+T. 


En additionnant membre à membre, 


a+v+u+y=u+b+v+x. 


(1.156a) 
(1.156b) 


(1.157) 


La commutativité nous permet de mettre u et v à droite dans chacun des deux membres. 
Ensuite la proposition 1.53(3) nous permet de simplifier par u + v. Il reste a + y = b+%x, qui 


signifie (a,b) + (x, y). 
(4) Pour (2) L'hypothèse donne les égalités 


a+b=b+a/ 
T+Yy =y+x 


En sommant, et en utilisant l’associativité, 
(a+2)+ (+) = b+y)+ (a+). 


Cela signifie bien que (a + x,b + y) = (a +x/,b + y). 


Lemme 1.99. 
Soient a,bE N. Nous avons (a,b) + (0,0) si et seulement si a = b. 


(1.158a) 
(1.158b) 


(1.159) 


Démonstration. Dire que (a,b) — (0,0) est équivalent à dire que a + 0 = b +0, ou encore que 


a = b. 


Proposition-Définition 1.100 ([17]). 
Soient a, b,x,y€ IN. L'application 


f: (ab) x (x,y) —Z 
((a’, b'), (x',y)) _ (a! + A b + y) 


est constante. 


Nous nommons sa valeur (a, b) + (x, y). 
Démonstration. Cela est une conséquence de la proposition 1.98(2). 


Proposition 1.101. 
La paire (Z,+) est un groupe commutatif. 


Démonstration. En plusieurs points. 


(1) Neutre Le neutre est e = (0,0). En effet, 


(a, b) + (0,0) = (a + 0,b + 0) = (a, b). 


De même e + (a, b) = (a,b) par commutativité de la somme dans N. 


(2) Inverse Il est facile de vérifier que (b, a) est l'inverse de (a, b). 


(3) Associativité Calcul direct en utilisant l’associativité dans N. 


(1.160) 


(1.161) 
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Proposition 1.102. 
L'application 


c: N—Z 
(1.162) 
nt (n,0) 
est un morphisme ® injectif. 
Démonstration. Le fait que ce soit un morphisme est le calcul 
(a + b) = (a + b,0) = (a, 0) + (b,0) = (a) + (bd). (1.163) 


Pour l’injectivité, supposons que c(a) = &(b). Alors (a, 0) = (b,0), c’est-à-dire a + 0 = b +0. 
Donc a = b. 


1.4.1 Opposé 


LEMooSABNooZZDIes 
Lemme 1.103. 
Tout élément de Z a un représentant de la forme (a, 0) ou (0,b). 
Démonstration. Soient a, b € N. Si b < a, alors nous avons 
(a,b) + (a — b,0) (1.164) 


où la différence est calculée dans N et a un sens parce que nous avons supposé b < a. Si par contre 
a < b alors 
(a,b) — (0,b— a). (1.165) 


Puisque l’ordre sur IN est total”, tous les cas sont couverts. 


Lemme-Définition 1.104. 
Soit ze Z. L'application“ 
fiz—Z 


1.166 
(a, b) > (b, a) ) 


est constante. 
Nous nommons —z sa valeur. 


Démonstration. Soient (a, b) et (x,y) dans 2. Nous avons successivement : 
— (ab) + (y). 
— a+y=b+x. 
— (ba) + (y,x) 
— (6,a) = (y,x) 
— f(a,b) = f(x, y). 


D'où la constance de f. 


Lemme 1.105. 
Nous avons ITEMooSQFGooQPgIMu 
(1) Z = u(N) L —u(N) 


(2) uN) n —u{N) = {0}. 


ITEMooHQUOQooJeqULl 


38. Certes IN n’est pas un groupe, donc le mot « morphisme » est un peu abusé, mais vous voyez ce que je veux 
dire. 

39. Proposition 1.62. 

40. Pour rappel, z est une classe d'équivalence dans N x IN, c’est-à-dire une partie de N x N. Ça à un sens de 
prendre z comme ensemble sur lequel on définit une fonction. 
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Démonstration. Nous avons 


Montrons à présent les deux points. 


(n,0) tel que n € N} 
(0,n) tel que n € N}. 


FPT 
RC 


(1) Pour (1) Nous savons par le lemme 1.103 que tous les éléments de Z sont de la forme 


(1.167a) ou (1.167b). 


(2) Pour (2) Si z e «(N) n —u(N), il existe n,m € NN tels que (n,0) = (0,m), ce qui signifie 
en particulier que (n,0) + (0,m) ou encore que n + m = 0. Le lemme 1.55 dit alors que 


n=m= 0. 


Nous avons donc z = (0,0) = 0. 


1.4.2 Ordre sur Z 


Si z € Z, nous disons que z € N lorsque z € L(IN). C’est un abus de notation qu’il est difficile 


de ne pas faire. 


Proposition-Définition 1.106 (Relation d’ordre [17] ). 


Nous disons que x < y si et seulement si y —- x Ee N. 
L'ensemble (Z, <) est totalement ordonné. 


Une version dans R sera le lemme 1.418. 


Lemme 1.107. 
Soient a > 0 et b > 1 dans Z. Nous avons 


ab > a. 


Lemme 1.108. 
Toute partie bornée de Z possède un plus grand élément. 


Proposition 1.109. 
Soit a,bE Z tels que a divise b. Alors [a] < |b|. 


Lemme 1.110. 
L'ensemble Z est infini dénombrable. 


1.5 Quelques résultats de cardinalité 


1.5.1 Équipotence, surpotence, subpotence 


PROPooMYYDooOUABOdB 


LEMooSVDDooWsyxNP 


(1.168) 
LEMooMYEIooNFwNVI 


PROPooYJBMooZrzkNX 


LEMooJNXIooBmdOVi 


Les notions d’équipotence, surpotence et de subpotence permettent de comparer les « tailles » 
des ensembles sans avoir besoin de la théorie des ordinaux. Tout ceci ne sera pas très souvent utile 
par la suite. Un exemple d'utilisation de ces notions est le théorème de Steinitz 6.134 qui démontre 


l'existence de clôture algébrique pour tout corps. 


Définition 1.111 ([20, 21]). 
Soient deux ensembles À et B. 


DEFooXGXZoo!gcBCg 


(1) Les ensembles A et B sont équipotents si il existe une bijection entre À et B. Nous notons 


A & B. 


(2) L'ensemble À est surpotent à B si il existe une surjection de À vers B. Nous notons À > B. 


(3) L'ensemble À est subpotent à B si il existe une injection de À vers B. Nous notons À < B. 
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Nous disons également « strictement » surpotent quand il y a surpotence mais pas équipotence, et 


de même pour la subpotence. Les symboles > et < sont alors utilisés. 
PROPooWSXTooMQPcNG 


Proposition 1.112 ([1, 12|). 
L'ensemble À est subpotent à B si et seulement si B est surpotent à A. 


Démonstration. En deux parties. 


(1) = Nous supposons que À est subpotent à B. Il existe une injection w: À — B. Nous 
définissons f: B — À par 


fe) Lun ie (1.169) 


a sinon 


où a est un élément quelconque de A. Cette application est bien définie parce que @ est 
injective, de telle sorte que w—! est bien définie. Puisque w est définie sur tout À, l'application 
jf est une surjection. 

(2) = Nous supposons que B est surpotent à À. Il existe donc une surjection w: B — A. Pour 
chaque x € À nous considérons un élément b, € 5-1! (x), qui existe parce que y est surjective. 
Nous considérons ensuite l'application 


f:A—B 


T+ by. 


(1.170) 


Nous prouvons que f est une injection. Supposons que +, y € À soient tels que f(x) = f(y). 
Nous avons b,; = b,. Donc 


2 = (br) = p(by) = y. (1171) 


Nous avons prouvé que x = y, et donc que f est injective. 


Vu que l’ensemble des ensembles n'existe pas !, nous n’allons pas énoncer le fait que ces notions 
donnent une relation d’ordre sur les ensembles ; il faudrait parler de classes et nous ne nous en 
sortirions pas. Nous allons toutefois énoncer quelques résultats qui vont dans ce sens. Pour en 
savoir plus, vous pouvez lire les différentes pages de Wikipédia sur les nombres cardinaux. 


1.5.2 Un peu d’infinité 
DefE0UZLooUMCzZR 


Définition 1.113 (ensemble Dedekind infini). 
Un ensemble est infini si il peut être mis en bijection avec un de ses sous-ensembles propres 
(c'est-à-dire différent de lui-même). 

Un ensemble est fini si il n’est pas infini. 


1.114. 
Nous adoptons les notions d’ensembles finis et infinis au sens de Dedekind. De nombreuses sources 
(dont wikipédia [22, 23]) définissent un ensemble fini comme étant un ensemble en bijection avec 
une partie de N de la forme {0,...,N}. Alors un ensemble est infini si il n’est pas fini. 
Cependant, d’une part les deux définitions d’ensembles infinis ne sont pas équivalentes, mais 
d'autre part, elles sont équivalentes si on accepte l’axiome du choix . Or le Frido accepte l’axiome 
du choix sans vergogne et sous toutes ses formes. Nous démontrerons donc, en utilisant le lemme 
de Zorn, qu’un ensemble À est fini (définition 1.113) si et seulement si il existe une bijection 


{0,...,N} — À pour un certain N € N. Ce sera le théorème 1.122. 
LEMooTUIROOEX j fDY 


Lemme 1.115. 
Toute partie d’un ensemble fini est finie. 


41. Voir le corolaire 1.147. 
42. Et même seulement l’axiome du choix dénombrable; si vous voulez en savoir plus, lisez la page wikipédia [24]. 
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Démonstration. Nous allons prouver la contraposée : si un ensemble contient une partie infinie, 
alors il est infini. Soit À € B où À est infini. Nous allons prouver que B est infini. En vertu de la 
définition 1.113, il existe une partie 4’ © À et une bijection o: 4’ — A. 

Nous considérons la partie B’ = AU (B\A), qui est une partie stricte de B. Puisque 4’ An 
(B\A) = D, nous pouvons définir 


w: B'—B 
o(x) sixe À’ (1.172) 
TT 
x si x € B\A. 


Montrons que 4 est une bijection. 
(1) Surjectif Nous avons (4) = À et w(B\A) = B\A. Donc 


p(B") = p(4) LU p(B\A4) = AU (B\A) = B. (1.173) 


(2) Injectif Si p(x) = (y), nous avons 4 possibilités suivant que x et y sont dans 4’ ou B\A. 
Si æ,y € À, alors w(x) = (y) implique o(x) = o(y) et donc x = y parce que © est injective. 
Sixe A'et ye B\A alors (x) = o(x) € À et p(y) = yEe B\A. Ce cas n’est pas possible. Le 
cas x € B\A et y € A’ n’est pas possible non plus. 

Si x,y € B\A, alors y(x) = (y) implique immédiatement x = y. 
Nous avons une bijection entre B' et B alors que B’ est un sous-ensemble strict de B. Donc B est 
infini. 


PROPooVOKDooUStPzU 
Proposition 1.116 ([1, 12]). 
Si À est fini et siw fé À, alors À L {w} est fini. 


Démonstration. Supposons que À Ü {w} est infini. Il existe un sous-ensemble strict de À L {w} en 
bijection avec À LU {w}. Soient donc B& A 0 {w} et o: B — A 0 {w} une bijection. 
Il y a deux possibilités : soit w est dans B, soit non. 


(1) wéB Alors BC A, et il existe x € B tel que o(x) = w. Considérons B' = B\{x}; cela est 
une partie propre de À. Ensuite nous définissons 
p: B\{x} — À 


ar a(a). 


(1.174) 


C’est injectif parce que © est injective, et c’est surjectif parce que 


p(B\{x}) = o(B)\o({w}) = o(B)\{w} = (AU {w})\{w} = À. (1.175) 
Pour la dernière égalité nous avons utilisé le fait que w n’est pas dans À. 
(2) Siwe B Plusieurs choses à dire. 
(2a) o(w) £ w 
Si w € B, nous commençons par prouver que o(w) # w. En effet si o(w) = w, alors nous 
pouvons poser 
g': B\{w} — À 
Kw) (1.176) 
ze o(x). 
Ce a’ est une bijection entre À et la partie propre B\{A}. Cela est impossible parce que 
nous avons supposé que À est fini. 
(2b) Definition de & Puisque B est une partie propre de À LU {w}, il existe x € A\B. Nous 
considérons B’ = (B\{w}) L {x} et nous définissons 


w: B'— A 


rt sib£r (1.177) 
o(w) sib=#. 


Nous montrons à présent que & est une bijection. 
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(2c) Injectif Soient u, ve B tels que vu) = y(v). Il y a 4 possibilités suivant que u ou v 

est égal à x. 

— Siu=v=xonest bon. 

— Siu=xetv# x. D'une part q(u) = p(v) = o(v) parce que v £ x. Mais d'autre 
part g(u) = (x) = o(w). Donc o(v) = o(w) et v = w par injectivité de o&. Or cela 
est impossible parce que v € B' alors que w & B’. Ici nous utilisons le fait que w ne 
peut pas être égal à x parce que x € À alors que w est hors de A. 


Bref, ce cas est impossible. 
— Siu £zxetv= 7x, alors c’est le même cas que le précédent avec quelque adaptations. 
— Siuzzxet v£ x, alors p(u) = ou) et y(v) = o(v), de telle sorte que o(u) = a(v) 
et donc u = v par injectivité de . 
(24) Surjective Soit y € À. Vu que o: B — AU {w} est surjective, il existe be B tel que 
o(b) = y. Notez que b £ x parce que x € A\B. 
Si b £ w alors be B\{w} c B'. Nous pouvons calculer 4(b). Étant donné que b Z x, 
nous avons @(b) = o(b) = y. 
Si au contraire b = w, alors w(x) = o(w) = y. Dans les deux cas, y est dans l’image de 
D. 
Dans tous les cas nous avons construit une bijection entre une partie propre B’ & A et À, ce qui 
est absurde parce que À est un ensemble fini. 


La proposition suivante est à peu près prise comme définition d’un ensemble fini dans [25] qui 
donne également une preuve de l’équivalence avec notre définition. 


PROPooBYKCooGDk£Wy 
Proposition 1.117. 
L'ensemble N est infini. 
Démonstration. Nous considérons la partie propre 
A={ne N tel que n > 1}. (1.178) 
Ensuite nous posons 
o:N — À 
(1.179) 
ze s(x). 


Le fait que o prenne ses valeurs dans À est parce que s prend ses valeurs dans N\{0} = A. 
(1) o est injective Parce que s l’est. 


(2) o est surjective C’est dans la définition 1.43(2) 


Nous avons donc une bijection entre N et un sous-ensemble strict. 


LEMooYIWDoo!IQFSad 
Lemme 1.118. 
Soit N EN. La partie {0,...,N} est finie. 


Démonstration. Par récurrence sur N. Avec N = 0, la partie {0} est finie parce que son seul 

sous-ensemble propre est @ qui n’est pas en bijection avec {0}. 
Supposons que {0,...,N} est fini. Alors {0,...,N} 0 {N +1} est fini par le lemme 1.116. 
LEMooJDGOooHdyJnu 


Lemme 1.119. 
Si p £ q, alors i n'existe pas de bijection entre {0,...,p} et {0,...,q}. 


43. Définition 1.113. 

44. Le fait que ce soit une partie propre est dû au fait que 0 n’est pas dedans d’une part parce que le lemme 1.57 
dit que 0 < 1, et d’autre part parce que le lemme 1.55 donne 0 Z 1. 

45. Pour rappel, la définition de {0,...,N} est 1.67. 
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Démonstration. Supposons pour fixer les idées que p < q. Dans ce cas {0,...,p} est une partie 
stricte de {0,...,q}. Vu que {0,...,q} est fini (lemme 1.118), il n’y a pas de bijection avec ses 
parties strictes. 


PROPooWKSIooHcfYPN 
Proposition 1.120 ([1]). 
Si À est infini et si o: À — B est injective, alors B est infini. 


Démonstration. Nous allons prouver que o(A) est une partie infinie de B. Puisque À est infini, 
nous pouvons considérer une partie 4’ & À et une bijection w1: 4 — A. Nous définissons 


gB: o(4) — o(4) 


y cvs (a 1{y))). Vo 


Cette définition a un sens parce que si y € o(4’), alors il existe un unique x € À’ tel que o(x) = y 
parce que © est injective. De là, w4(x) € À et nous pouvons lui appliquer . 
Nous montrons que 8 est une bijection. 


(1) Injective Supposons que wg(a) = wg8(b), c’est-à-dire que 
(oogwaoa lj(a) = (oopaoa t)(b). (1.181) 


Étant donné que o et 14 sont injectives, nous avons ol (a) = o-!(b). En appliquant © des 
deux côtés, nous trouvons a = b. 


(2) surjective Soit ye o(A). En prenant x € (oo! o a !)(y) nous avons wg(x) = y. 


Donc B contient une partie infinie (o(A)). Le lemme 1.115 conclut que B est infini. 
LEMooPGPVooZz1Fvf 


Lemme 1.121. 


À propos d'applications entre ensembles finis. ITEMooNCCUooBGrtän 
(1) Sio: A — B est une application quelconque et si À est fini, alors o(A) est une partie finie 
de B. ITEMooKQMFooSzmXrd 


(2) Si ao: A — B est surjective et si À est fini, alors B est fini. 
Démonstration. Nous allons utiliser le lemme de Zorn. Nous considérons l’ensemble 
A = {X C À tel que o: À — o(À) est injective} (1.182) 


que nous ordonnons (partiellement) par l'inclusion. 


(1) À est inductif Soit une partie totalement ordonnée F de A. Nous considérons Y — 
X, et nous prouvons que Ÿ est un majorant de F. 
XEF 


Pour cela nous commençons par prouver que Ÿ € À. Soient a,b € Y tels que o(a) = o(b). Il 
existe X1, X2 € F tels que a € X1 et bE X2. Supposons pour fixer les idées que X1 < X2 (F 
étant totalement ordonné nous avons toujours X1 < X2 ou X2 < X1). Puisque l’ordre est 
l'inclusion, cela signifie que X1 € X2. Nous avons donc a,b € X2, alors que © est injective 
sur X2. Donc o(a) = o(b) implique a = b, et o est injective sur Y. Nous avons donc prouvé 
que Ÿ € À. 

Puisque pour tout X € F nous avons X € Ÿ, nous avons X < Y (dans À) pour tout Xe F. 
Bref, ŸY est un majorant de F dans A. 


Toute partie totalement ordonnée de A est majorée. Cela signifie que À est inductif #6. 


(2) Zorn L'ensemble À étant inductif et non vide (les singletons dans À sont dans À), il possède 


un élément maximal * par le lemme de Zorn 1.23. Nous nommons 4/ un élément maximal 


dans A. 


46. Plus précisément c’est l’ensemble ordonné (A,c) qui est inductif. 
47. Définition 1.13; voir aussi 1.16. 
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(3) Bijective L'application o: 4’ — o(A) est injective parce que 4’ € À. Nous devons prouver 
qu'elle est surjective. 

Supposons que y € o(A)\o(4'). Alors il existe a € A\’ tel que o(a) = y. Dans ce cas, la 
partie 4’ LU {a} est un majorant de 4’ dans À, ce qui est impossible. 
Donc o: 4’ — o(A) est bijective. 

(4) Conclusion L'ensemble 4’ est fini en tant que partie de l’ensemble fini À (lemme 1.115). 
L'application o étant injective, la proposition 1.120 conclut que o(4’) est fini. Et comme 
o(4') n’est autre que o(A) nous avons fini. 

La partie (1) est prouvée. La partie (2) est maintenant facile. La partie (1) dit que o(A) est une 
partie finie de B, mais si o est surjective, alors o(A) = B. 


PROPooJLGKooDCcnWi 

Proposition-Définition 1.122 (Cardinal d’un ensemble fini[1]). 
Soit un ensemble non vide I. ITEMooMNMTooE0I jdo 
(1) L'ensemble I est fini si et seulement si il existe une bijection entre I et {0,...,N} pour 
un certain Ne N. ITEMooZJFUooSNUSIk 


(2) SiT est fini, il existe un unique N € N tel que T soit en bijection avec {0,...,N}. 


Dans ce cas, le nombre N +1 est le cardinal de T, et est noté Card(T). Pour l’ensemble vide, 
nous définissons Card(@) = 0. 


Démonstration. En plusieurs parties. 
() = 
Soit un ensemble À en bijection avec {0,...,N}. Nous avons vu que {0,...,N} est fini dans 
le lemme 1.118. Le lemme 1.121(2) conclut que À est fini. 
(2) (1)= Le vrai sport est de faire l'implication inverse. Nous supposons que À est un ensemble 
fini, et nous allons prouver qu’il est en bijection avec {0,...,N} pour un N bien choisi. Nous 
allons utiliser le lemme de Zorn. Soit 


À = {(N, 4) tel que w: {0,...,N} — À est injective}. (1.183) 
Nous mettons sur À la relation d'ordre donnée par (M1,41) < (N2, 42) lorsque 
(2a) M <M 
(2b) 2 étend w1, c’est-à-dire que 42 = 41 sur {0,...,N}. 


(2a) À est inductif Soit une partie F totalement ordonnée de A. Nous considérons la 
partie suivante de NN : 


S=f{ne N tel que 4 tel que (n,v)e F}. (1.184) 


Si S est majoré, alors il a un maximum (proposition 1.63(4)). Si M est le maximum de 
S, le (M,4) de F qui correspond à ce maximum est un majorant de F. 

Supposons -pour l’absurde- que F n’est pas majoré dans À; en particulier S n’est pas 
majoré dans n. Pour chaque n € S, il existe une application w, telle que (n,@n) € F. 
Cela nous permet de définir 


p: S — À 
ne Pn(n). 
Montrons que @ est injective. Si p(m) = p(n), alors @m(m) = pn(n). Supposons pour 
fixer les idées que n < m. Vu que (n,w») et (M, 4m) sont dans F qui est ordonné, mn 
prolonge %, ; en particulier @n(n) = mn). Mais comme 4» est injective, m = n. 


(1.185) 


Nous avons donc une injection @: S — À. Mais S est non borné et donc infini *. La 
proposition 1.120 conclut que À est infini, ce qui est contraire aux hypothèses. 
Donc F a un majorant et À est inductif. 


48. Ensemble fini, définition 1.113. 
49. Le lemme 1.69 dit qu’il existe une bijection entre S et IN. De là nous concluons que $ est infini parce qu’un 
ensemble en bijection avec un ensemble infini est infini par la proposition 1.120. 
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(2b) Lemme de Zorn Le lemme de Zorn dit que À a un élément maximal. 


(2c) Conclusion Soit (N,4) un élément maximal de À. Nous allons prouver que w: {0,...,N} — 
A est une bijection. Que 4 soit injective est une conséquence du fait que (N,4) est dans 
A. 


Pour prouver que est surjective, nous supposons qu’elle ne l’est pas. Soit a € À qui 
n’est pas dans l’image de &. En posant 


HE sit£N+I1 (1.186) 
Tr 


le couple (N +1,49) majore strictement (N,4). Ce qui est une contradiction. 


(3) (2) existence L'existence est ce que nous venons de montrer ci-dessus. 


(4) (2) unicité Supposons que J soit en bijection avec {0,..., M} et avec {0,...,N}. Il existe 
donc une bijection entre {0,...,M} et {0,...,N}. Par le lemme 1.119, cela implique que 
M = N. 


Nous ne définissons pas ce qu'est le cardinal d’un ensemble infini; c’est très compliqué et ça ne 


nous servira pas. 
LEMooRWUDooTgoRXH 


Lemme 1.123. 
Si À est une partie infinie de N, alors pour tout n, la partie A\{0,...,n} est non vide. 


Démonstration. Si A\{0,...,n} était vide, cela signifierait que À est une partie de {0,...,n}. Or 


nous savons que {0,...,n} est fini (lemme 1.118), et que toute partie d’un ensemble fini est finie 
(lemme 1.115). Donc nous aurions que À est fini, ce qui est contraire à l'hypothèse. 
LEMooVFPNooVmdUXY 


Lemme 1.124 ([1|). 
Union d’ensembles finis. 


ITEMooBUCZooYLCule 
(1) Si A et B sont des ensembles finis disjoints, alors A 0 B est fini et 
Card(A L B) = Card(A) + Card(B). (1.187) 
ITEMooCCWOooYwgGBp 
(2) Si À et B sont des ensembles finis, alors À L B est fini. ITEMooY JSZo0XQXkOX 
(3) Si À est fini et si B € À alors 
Card(A\B) = Card(A) — Card(B). (1.188) 
ITEMooSWJCooEpBVkG 
(4) Si À et B sont des ensembles quelconques, alors 
Card(A L B) = Card(A) + Card(B) — Card(A n B). (1.189) 
ITEMooJDUUooVMvAOn 
(5) Si les {A;};-1..n sont des ensembles deux à deux disjoints, alors 
Card (| J Ai) = Ÿ Card(A:). (1.190) 
i=1 i=1 
ITEMooNMFSooBvsNyq 


(6) SiT ou J est infini, alors I L J est infini. 


Démonstration. Point par point. 


1.5. QUELQUES RÉSULTATS DE CARDINALITÉ 159 


(1) Pour (1) Puisque À et B sont finis, la proposition 1.122 nous dit qu’il existe des naturels 
N et M ainsi que des bijections w4: {0,...,N} — A et 6: {0,...,M} — B. Maintenant 
l'application 

p:{0,...,M+N+1}-AUB 


nr 
ppin—-N-1) sin>N 
est une bijection. Le fait que À et B soient disjoints est important pour l’injectivité. La 


proposition 1.122 nous dit qu’alors AU B est fini. De plus, par définition le cardinal de AL B 
est N + M. 


(2) Pour (2) Nous ne supposons plus que À et B sont disjoints. Nous posons 1 = A et J = B\A. 
Avec ça, I et J sont disjoints et finis (comme parties des ensembles finis, lemme 1.115), et 
vérifient 1 LU J = AU B. Le point (1) indique que I L J est fini. 

(3) Pour (3) 

L'ensemble À peut être écrit sous la forme d’une union disjointe : À = B L (A\B). Les 
ensembles B et A\B étant disjoints, nous avons 


Card(A) = Card(B) + Card(A\B). (1.192) 


(4) Pour (4) Nous utilisons quelques égalités d’ensembles pour ramener À LU B à des cas déjà 
traités : een 
AU B = AU(B\A)= Au (B\(AnB)). Se et 
Nous avons en particulier utilisé B\A = B\(A ñn B). La chose intéressante dans (1.193) est 
que l’union est disjointe et que À n B € B. Nous pouvons donc écrire 


Card(AU B) = Card(A) + Card (B\(An B)) = Card(A)+Card(B) -Card(An B). (1.194) 


(5) Pour (5) Récurrence en utilisant le point (4). 


(6) Pour (6) Toute partie d’un ensemble fini est finie (lemme 1.115). Donc si 7 L J était fini, 
T'et J devraient l’être. 


DefEnsembleDenombrable 
Définition 1.125. 
Un ensemble est dénombrable si il peut être mis en bijection avec N. Il est non dénombrable 
si il est infini et ne peut pas être mis en bijection avec N. 


Une chose vraiment amusante avec cette définition que l’on met en rapport avec la défini- 
tion 1.113, c'est qu’un ensemble fini n’est ni dénombrable ni non dénombrable °°. 


LEMooDTAEo0o!IBdHyo 
Lemme 1.126. 
Si À est dénombrable et si il existe une surjection f: À — B, alors B est fini ou dénombrable. 
LEMooSRZWooASgEf y 
Lemme 1.127. 


Si À est un ensemble fini ou dénombrable, alors il existe une surjection N — A. 


1.5.3 Dénombrabilité et ensemble des naturels 
PROPooUBKMooWEGCvM 


Proposition 1.128 ([1, 12]). 
Toute partie infinie de N est dénombrable. 


Démonstration. Soit À, une partie infinie de N. 


50. Beaucoup de sources disent qu’un ensemble est dénombrable lorsqu'il est en bijection avec une partie de N. 
Cela laisse la porte ouverte aux ensembles finis. Par exemple Wikipédia[26]. 
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(1) Définition de & Nous voulons construire une application o: N — À telle que 


— 


— 


— 


SUBEQooETEMooZcTOWT 


o(0) = min(A) 
o(k +1) = min (A\o (40, TT #})) 


(1.195a) 
PHBEMSONNOES SEE 195b) 


Les lâches, par prudence, diront juste que c’est défini par récurrence et n'’insisteront pas. 
Nous, nous insistons. 


Nous allons définir o(n) à l’aide du théorème 1.47. Pour cela nous posons £ = P(A), b= 


et 
gE—E 


14 siZ=A (1.196) 
Z'L{min(A\Z)} sinon. 
Notons que la proposition 1.63(2) nous indique que toute partie non vide de N possède un 


minimum ; la définition de g a donc un sens. Le théorème 1.47 donne alors une application 
J:N— E telle que 


(la) (0) =b-9g 
(1b) f(n +1) = g(f(n)) pour tout n > 0. 


Prouvons par récurrence que f(n) est un ensemble fini pour tout n. D'abord f(0) = . 
Ensuite, si n > 0 est tel que f(n) est fini, alors en particulier f(n) £ À et nous avons 


fn +1) = g(f(n)) = f(n) à {min (A\/(m))}. (1197) 
Dans ce cas, f(n + 1) est également fini comme union de deux ensembles finis. 


o(n) = min (A\f(n)). FASO Re 


Avec n = 0, nous avons &(0) = min (A\S) = min(A). La condition (1.195a) est donc déjà 
satisfaite. 


Nous posons 


Nous devons encore prouver (1.195b). Pour tout n, la relation entre f(n) et o(n) est donnée 
par 


f(0) = (1.199a) 
fn +1) = fn) L o(n). (1.199b) 


Par récurrence nous avons alors 
n—1 
fn) = (J{o(R)} = 0({0,...,n—1}) FRE) 
k=0 


pour tout n > 1. Nous avons alors la condition 1.195b en substituant (1.200) dans la définition 
(1.198) écrite avec n + 1 : 


o(n +1) = min (A\f(n + 1)) = min (AS (L0, ” n})). (1.201) 
œ est strictement croissante Vu que A\o{0,...,k} € A\o{0,...,k — 1}, le minimum 


est plus grand ou égal : o(k + 1) > o(k). Mais o(k + 1) est sélectionné dans l’ensemble 
A\c{0,...,k}, qui ne contient justement pas o(k). Donc o(k + 1) Æ a(k). 


o est définie sur N Il faut montrer que pour tout k, l’ensemble A\0{0,...,k} est non vide. 
Si il l'était, cela signifierait que À € 0{0,...,k}. Par le lemme 1.121(1), la partie o{0,...,k} 
est finie dans N. Le lemme 1.115 dit alors qu’en tant que partie de &{0,...,k}, l’ensemble À 
est fini. Mais comme les hypothèses disent que À est infini, nous avons une contradiction et 
nous concluons que © est bien définie sur tout N. 


o est injective Une application N — N strictement croissante est injective par la propo- 
sition 1.68. 
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(5) o est surjective Soit a € À. Vu que © est strictement croissante et que o(0) > 0, nous 
avons o(a) > a. Si o(a) = a nous avons terminé. Supposons o(a) > a. Alors 


min (A\c{0,...,a}) > a. FAN SRCRR TE) 


Si o({0,...,a}) ne contenait pas a, alors A\o({0,...,a}) le contiendrait et nous n’aurions 
pas l'inégalité (1.202). Donc a € o({0, ue ,a}) et a est bien dans l’image de oc. 


1.129. 
La proposition 1.128 pourrait être prouvée plus facilement en acceptant le théorème de Cantor- 
Schrôder-Bernstein 1.142. Il existe une injection À — N parce que À est une partie de N. Mais 
puisque À est infini, il possède une partie dénombrable. Cela donne une surjection À — N et donc 
une injection N — À. Le théorème de Cantor-Schrôder-Bernstein conclut. 

Cela dit, une telle preuve demanderait des outils plus complexes. 


1.130. 

La proposition suivante donne une bijection explicite entre N et IN x N. Elle n’a rien de trans- 
cendante, mais je ne résiste pas à la donner ici parce qu’elle est utilisée dans l’article Un peu 
de programmation transfinie de David Madore °!. Son utilité est de pouvoir créer un langage de 
programmation pouvant traiter des paires d’entiers rien qu’en traitant des entiers. 


PROPooLPKUooA1sYJg 
Proposition 1.131 (Une bijection N x N — N). 
La fonction 
J:NxXN—N 
y +x six <y (1.203) 
(ou) 4", , 
LT +L+Y Sy<AX. 


est une bijection. 


Démonstration. Il s’agit de prouver qu’elle est injective et surjective. Dans la suite, tous les nombres 
sont des entiers positifs. 


(1) f est injective 


Pour k € N donné, nous allons prouver que 

(1a) l'équation f(x, y) = k possède au maximum une solution avec x < y, 

(1b) l'équation f(x, y) = k possède au maximum une solution avec y < x, 

(ic) si & = y? + x avec x < y alors il est impossible que k& = x/? + x’ + y avec y < x’. 
On y va. 


(la) Nous supposons y? +x = t? +2 avec x < yet z < t. Pour fixer les idées, nous supposons 
t > yet nous posons { = y +s (s > 1). En substituant, et en isolant z, 


z = x—2sy — s? (1.204a) 
< æ—25y (1.204b) 
< x —2sx (1.204c) 
= x(1 — 2s) (1.204d) 
< 0. (1.204e) 


Impossible parce que z > 0. 


(1b) De même nous supposons 2? + x + y = 2? + 2 +t avec y < x et t < z. Nous posons 
z = x+5s,et nous déballons le même genre de calculs en isolant t. 


51. Et comme j'aime beaucoup cet article, il me fallait une excuse pour le placer ici. 
http://www.madore.org/-david/weblog/d.2017-08-18.2460.html. 
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(ic) Enfin nous supposons y? + x = 2? + 2 ++ avec x < y et t < z. Les plus courageux 
diviseront en trois cas : y < 2, y = z et y > z et feront les calculs. Par exemple, pour le 
cas y > z nous posons y = z + s et nous substituons : 


(y+s) +z=2+2+t (1.205) 


qui donne 


m—z+tt- 226 87 <92- 0925 &7 — Q2(1— 5) — 5? < —s <0 (1.206) 


parce que s > 1, donc 1 —s < 0. 


(2) f est surjective 


Nous devons prouver que tous les éléments de IN sont dans l’image de N x N par f. En 
premier lieu, 0 = f(0,0). C’est un bon début. Soit a € IN non nul; nous montrons que tous 
les nombres de a? à (a+ 1)? sont des images de f. D'abord a? = f(0, a), ensuite les nombres 


f(L,a),f(2,a),...,f(a—1,a) (1.207) 


prennent les valeurs a? +1, ..., a? + a — 1. Enfin nous avons f(a, 0) = a? + a et les nombres 
f(a,1),..., f(a, a) prennent les valeurs de a? + a + 1 à a? + 2a = (a + 1)? — 1. 


Sachez que cette fonction s'étend aux ordinaux (mais là ce n’est plus pour rigoler). 
CORooNRPIooZPSmqa 


Corolaire 1.132. 
Il existe des parties {Ni}ien telles que | J;:n Ni = N et que chaque N; soit en bijection avec N 


Démonstration. Nous considérons la bijection f : N — N x N donnée par (l'inverse de celle donnée) 
par la proposition 1.131, et nous posons 


N; = f li, N). (1.208) 


L'application 
FN — {(i,k)}ken (1.209) 


est une bijection. Or l’ensemble {(4, k)}ren est évidemment en bijection avec N. Par composition 
nous avons le résultat. 


LEMooDLWFooNAJbbq 
Lemme 1.133 ([1]). 
Si il existe une surjection N — À, alors À est fini ou dénombrable. 
Démonstration. Pour chaque a € À, l’ensemble f—{(a) est une partie de N. 
(1) Une application La proposition 1.63(2) nous permet de poser 
o: AN 
(1.210) 


a min (fl (a)). 


(2) © est injective Supposons que o(a) = o(b). Nous appelons x ce nombre : 


S=min(f (4) = (b)). (1.211) 


Nous avons x € f-l(a) n f-1(b), ce qui implique que f(x) = a et que f(x) = b; donc a = b. 
Donc © est une injection. 
(3) À est infini Si À est fini, le lemme est prouvé. Donc à partir de maintenant nous supposons 


que À est infini. Le but est de prouver qu’il est dénombrable, c’est-à-dire de construire une 
bijection 4 — N. 
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(4) o(A) est dénombrable Puisque o: À — N est injective et que À est infini, la proposition 
1.120 dit que o(À) est infini dans N. La proposition 1.128 nous dit alors que o(A) est 
dénombrable. 


Soit une bijection 4: o(A) — N. 


(5) La candidate bijection Nous posons 


f=vo0o:A—N (1.212) 


et nous allons prouver que c’est une bijection. 
(6) Injective Puisque 4 et o sont injectives, l'égalité (wo)(a) = (wo)(b) implique immédiate- 
ment a = b. 


(7) Surjective Soit k € IN. Puisque @ et o sont des injections, nous pouvons poser a = 
(ol 1)(k). Il est alors immédiat que f(a) = k. 


PROPOooENTPooSPpmhY 
Proposition 1.134 ([1, 26|). 
Une union dénombrable d’ensembles finis ou dénombrables est finie ou dénombrable. 


Démonstration. Soient À; des ensembles finis ou dénombrables. Nous posons À = [J,.ù A:, et nous 
considérons les parties N; du corolaire 1.132. Puisque À; est dénombrable ou fini et que N; est 
dénombrable, il existe une surjection 4: N; — A;. 

Nous définissons s: N — N parne N,;(,), et nous posons enfin 


p:N—A 
(1.213) 


Nous prouvons que 4 est surjective. 
Soit a € À;. Il existe n € N; tel que a = v;(n). Mais comme n € N;, nous avons s(n) = à. Donc 


a = qin) = Ps(n)(n) = v(n). (1.214) 


Donc :N — À est surjective. 
Le lemme 1.133 conclut que À est fini ou dénombrable. 


LEMooKFBAooHxgÜsg 
Lemme 1.135 ([1]). 


Si À est dénombrable, alors l’ensemble des parties finies de À est dénombrable. 
LEMooRXSRooBUWOyb 


Lemme 1.136 ([1]). 
Si N est un ensemble dénombrable, alors il existe une bijection g: {1,2} x N — N. 


Démonstration. D'abord nous définissons une bijection @: {0,1} x N — N par 


p: {0,1}xN —N 


1.215 
(n,k)r- 2k+n. 


Ensuite si f: N — N est une bijection, il suffit de poser g(n, k) = f(o(n, k)). 


PROPooDMZHooXouDrQ 
Proposition 1.137 ([26]). 
Si N est un ensemble dénombrable, alors pour tout n € N, l’ensemble N° est dénombrable. 


Les ensembles dénombrables sont les plus petits ensembles infinis possibles, comme en témoigne 


la proposition suivante. 
PROPooUIPAooCUEFme 


Proposition 1.138. 
Tout ensemble infini contient une partie en bijection avec N. 
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Démonstration. Soient un ensemble infini ÆQ et une partie propre E1 en bijection avec Eo. Nous 
notons w: E6 — E une bijection. 
Soit xo € Eo\E1 (axiome du choix et tout ça). Nous définissons 


:N — {f(x 
Ÿ Le (xo)} (1.216) 
ne p"(xo) 
et nous allons prouver que c’est une bijection. Que ce soit surjectif est immédiat. Pour l’injectivité, 
soit &*(x0) = w!(xo) avec k Z L. Supposons pour fixer les notations que k > 1. Alors, vu que 4 est 
inversible nous pouvons écrire 


20 = P°"(xo) = p(p*T TT (x0)) (1.217) 


où il est entendu que g°(x0) = x0. Cela signifie que ro est dans l’image de w, c’est-à-dire dans 
Ej, ce que nous avons exclu par choix de x0 dans Æ6\E1. Donc en réalité v"*(x0) # g!(x0) dès que 
k Z l. 


PropQEPoozLqUQ 
Proposition 1.139. 
Toute partie d’un ensemble fini est finie, et toute partie d’un ensemble dénombrable est finie ou 
dénombrable. 


Démonstration. Soient un ensemble Æ ainsi qu’une partie infinie À € E. Nous notons w: À — 4’ 
une bijection entre À et une partie propre À’ de À. Dans ce cas, l’application 


D: E — (E\A) U 4! 
& six e E\A (1.218) 
p(x) sixeA 


est une bijection entre Æ et une partie propre de E. Donc E est infini. 

Par contraposée nous déduisons que toute partie d’un ensemble fini est finie. 

En ce qui concerne les parties d’ensembles dénombrables, soit une partie À d’un ensemble 
dénombrable Æ. Nous avons une bijection tp: E — IN. La restriction w: À — (A) est une 
bijection entre À est une partie de N. 


— Si p(E) est infinie, elle est dénombrable (proposition 1.128). Dans ce cas A est en bijection 
avec un ensemble dénombrable. Il est donc dénombrable. 


— Si p(E) est fini, alors le lemme 1.121(2) nous dit que À est fini. 


[] 


LEMooGTOTooFbpvzU 
Lemme 1.140. 
Soit un ensemble E non dénombrable ainsi qu’une application f: E — F où F est un ensemble 
quelconque. Si f(E) est dénombrable (ou fini), alors il existe y € f(E) tel que f (y) est indénom- 
brable. 


Démonstration. Nous avons 


B= |)". (1.219) 


yeF 


Si tous les f—!l(y) sont dénombrables, alors E est une union dénombrable (F est dénombrable) 
d’ensembles dénombrables. Il serait donc dénombrable (proposition 1.134), ce qui est contraire à 
l'hypothèse. 
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1.5.4 Théorème de Cantor-Schrôder-Bernstein 


Lemme 1.141 ([27)). 
Soient un ensemble À et une partie B de À. Si il existe une injection f : À — B alors il existe une 
bijection a: À — B. 


LEMooTNMHooBpdzab 


Nous donnons deux preuves de ce lemme. 


Première preuve de 1.1/1. Nous posons Y = A\B et nous décomposons la preuve en étapes. 


(1) 


(6) 


Les f*(Y) sont disjoints Vu que f prend ses valeurs dans B, nous avons f*(Y) c B pour 
tout k. Et vu que Ÿ = A\B, nous avons 


f#) AY =@ NES n 


pour tout k. L'application f étant injective, elle vérifie f(C n D) = f(C) n f(D). Nous 
appliquons f”” des deux côtés de (1.220) : 


PMP) 0 FN) = (1.221) 


pour tout k,m € N. 


Une décomposition Nous posons 


X={(Jf#@)=Yu Ü FF P). (1.222) 
k=1 


keN 


Vu que f(X) € B nous avons l'égalité 
B=f(X)u(B\f(XK)). (1.223) 


A\X = B\f(X) Supposons x € A\X. Vu que Ÿ = A\B est dans X, l'élément x n’est pas 
dans A\B et donc est dans B parce qu’il est dans A. Mais x n’est pas dans X et en particulier 
pas dans f(X) parce que f(X) € X. Donc x est dans B\f(X). 

Dans l’autre sens, nous supposons que x € B\f(X). Vu que B € À nous avons x € À. 
Comme x est hors de f(X), il est hors des f*(Y) pour k > 1. Mais x € B, donc x est hors 
de A\B = f(Y). Donc x est hors de f*(Y) pour tout 4 > 0. Donc x est hors de X. 


La bijection Nous considérons l'application 


a: ÀA— B 


f(x) size X (1.224) 
: z si x E A\X. 


Nous démontrons dans les points suivants que « est bijective. 

Injective Nous supposons a(x) = a(y). Il y a 4 possibilités suivant que x et y soient dans 
X ou A\X. 

Si x,ye X alors f(x) = f(y) et donc x = y parce que f est injective. 

Sixe X et ye A\X, alors f(x) = y. Mais f(x) € f(X) et y € A\X = B\f(X). Donc 
l'élément f(x) = y est dans f(X) n (B\f(X)) = @. Il n’est donc pas possible d’avoir 
a(x) = a(y) avec x € X et ye A\X. 

Sixe A\X et ye X, c’est la même chose. 


Si x,y€e A\X, alors x = a(x) = a(y) = y. 


Surjective Soit y € B. Il y a deux possibilités : y € X et y € A\X. La première se divise 
en deux :yeY et yelJ#, ff(Y). On y va. 


(6a) yeY Ce cas n’est pas possible parce que y € B alors que Y = A\B. 
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(6b) ye f*(Y) avec k > 1 Nous avons 


ye (FF (M) € F(X) € a(A). (1.225) 


(6c) ye A\X Alors y = (y). 


Deuxième preuve de 1.1/1/12]. Nous posons Y = A\B et 
M = {M © À tel que Y LU f(M) € M}. (1.226) 


Nous allons dire de nombreuses choses à propos de ce M. 
(1) M est non vide Nous avons À € M parce que Y et f(A) sont dans À. 
(2) Si M e M alors Y € M C'est dans la définition de M. 


(3) Encore un ensemble Vu que M est non vide, nous pouvons poser 


x=(\m (1.227) 
MEM 


sans nous poser trop de questions. Cela étant fait, nous pouvons passer aux choses sérieuses. 


(4) f(X) € M pour tout ME M Soit M € M. Nous avons 


f(X) = f(M) RPÉENO OR RNERNEEER 
cYu/f(M) (1.228b) 


nn: PARMOGE NES ER 


Justifications. 
— Pour (1.228a). Parce que X € M. 
— Pour (1.228c). Parce que M € M. 


(5) XEM Vu que Y € M pour tout M dans M, nous avons Y € (yen M = X. Nous 
devons prouver f(X) € X. Nous venons de prouver que f(X) € M pour tout M € M, donc 


FA) Se (\ M=x. (1.229) 
MEM 
L'ensemble X est le plus petit élément de M pour l'inclusion. 


(6) YU fF(X)E X Ca fait partie de X € M. Mais c’est bien de le dire explicitement parce que 
nous allons l'utiliser quelques fois dans la suite. 


(7) YU F(X)EM Vu que X € M, nous savons déjà que Y LU f(X) € X. En appliquant f des 
deux côtés, 


fY Lu f(X) € FX). (1.230) 


En ajoutant Y des deux côtés, 
YUf(FUf(X) cs Yu f(X), (1.231) 


et donc Y LU f(X) e M. 


(8) Y LU f(X) = X Nous savons déjà que Y LU f(X) € M. Vu que X est le plus petit élément 
de M, nous avons 
Le) (1.232) 


L’inclusion inverse étant déjà faite, nous avons l'égalité. 
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(9) B\f(X) = A\X Nous avons : 


A\X = A\(Y u f(X)) (1.233a) 
: (AY) _ (A\F(X)) SHARE 
. ( A > ( X)) SUBEQooUATVo pret 
- (B à A\F(X) SUBEQooKWVWo DobEX, 


- B\f(X). SUBENoONTIS 08 TESES S 


Justifications : 
— Pour (1.233b). 
— Pour (1.233€ 
— Pour (2554 
— Pour (1.233e 
(10) Notre bijection Nous voulons définir 


Complémentaire de réunion, lemme 1.26(2). 
Parce que A\Y = B du fait que Y = A\B. 

. Lemme 1.26(3). 

. Parce que B € À. 


Sr Er er RE 


a: ÀA— B 


f(x) sixeX (1.234) 
: F si x € A\X. 


Pour y parvenir, nous devons prouver que & prend effectivement ses valeurs dans B. Ensuite 
nous prouverons que @ est une bijection. 

(11) a prend ses valeurs dans B Si x € X nous avons a(x) = f(x) € B. Si au contraire 
x € A\X nous avons 


ar) =xeA\X = B\f(X)e B. (1.235) 
(12) a est injective Soient x,y € À tels que a(x) = (y). Il y à quatre possibilités suivant que 
x et y sont dans X ou dans A\X. 
(12a) xeX,yeX Alors f(x) = a(x) = a(y) = f(y). Vu que f est injective, nous trouvons 
que x = y. 
(12b) ze X,ye A\X Nous avons a(x) = f(x) € f(X) et a(y) = y € A\X = B\f(X). Il 
n’est donc pas possible d’avoir a(x) = a(y) dans ce cas. 
(12c) ze A\X,ye X Idem. 
(12d) ze A\X,ye A\X Dans ce cas nous avons a(x) = x et a(y) = y. Donc x = y. 
(13) a est surjective Soit be B. Il y a deux possibilités : be f(X) ou bé f(X). 
(13a) Sibe f(X) Soit re X tel que f(x) = b. Alors a(x) = f(x) = b. 
(13b) Sibé f(X) Alors be B\f(X) = A\X, et donc «(b) = b. 


THOooRYZJooQcjlcl 
Théorème 1.142 (Cantor-Schrôder-Bernstein). 
Soient deux ensembles À et B pour lesquels il existe des injections f: À — B et g: B — A. Alors 
il existe une bijection entre À et B. 


Démonstration. La composée g o f: À — À est injective et prend ses valeurs dans g(f(A)) = 
g(B) € A. Bref, l’application g o f: À — g(B) est injective. Le lemme 1.141 donne alors une 
bijection w: À — g(B). 


Nous montrons que g”_! 


o0w: À — B est une bijection. 


(1) Injective Nous supposons x, y € À tels que 


9" (v(x)) = 97" (v(y)). (1.236) 
Nous appliquons g des deux côtés : w(x) = w(y). Puisque w est une bijection, cela entraîne 
x = y. 
(2) Surjective Soit be B. En posant a = @!(g(b)) nous avons bien (g”!o &)(a) = b. 
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1.5.5 Comparabilité cardinale 


Le théorème de comparabilité cardinale énonce que si À et B sont des ensemble, alors nous 


avons toujours À > B ou À < B (ou les deux; dans ce cas À & B par Cantor-Schrüder-Bernstein). 
THOooCBSKooCmzfUf 


Théorème 1.143 (Théorème de comparabilité cardinale[1, 28, 29]). 
Entre deux ensembles, il existe forcément une injection de l’un dans l’autre. 


Démonstration. Nous allons montrer que le graphe d’une injection de À dans B ou de B dans A 
est donné par un élément maximal (au sens de l’inclusion) de l’ensemble (inductif) des graphes 
d’injections d’une partie de À dans une partie de B. 

Nous allons utiliser le lemme de Zorn 1.23 à l’ensemble °” 


XcA 


À {x Y,w) tel que {Y CB } (1.237) 
w: X — Y est injective. 


que nous ordonnons par l'inclusion, c’est-à-dire par (X1, Y1,w1) < (X2, Y2,w2) lorsque X1 € X2, 
V1 € Y2 et polx; = p1. 

Nous passons rapidement sur le fait que cet ensemble est inductif, et nous considérons tout de 
suite un élément maximal (X, Y,@). Il y a deux possibilités : soit w(X) = B, soit w(X) # B. 


(1) Si o(X) = B Dans ce cas, 5: X — B est une surjection. L'ensemble À est donc surpotent 
à B. La proposition 1.112 conclut que B est subpotent à À. 


(2) Si o(X) £ B Nous subdivisons en deux nouveaux cas : soit X = À, soit X # À. 
(2a) Si X = À Alors nous avons une injection w: À — B, et c’est bon. 


(2b) Si X Z À Nous sommes dans le cas X Æ À et &(X) Æ B. Soient a € A\X etbe 
B\y(X). Nous considérons l'application 


d: X LU{a} — Y L {b} 
(ee sireX (1.238) 


b SiT = a. 


C’est une application injective. Donc le triplet (X LU {a}, Y LU {b},#) majore (X, Y, @). 
Nous avons une contradiction et ce cas n’est pas possible. 


1.144. 

Le théorème de comparabilité cardinale couplé au théorème de Cantor-Schrüder-Bernstein nous 
indique que pour tout ensembles À et B, nous avons soit À < B, soit B < À. Et si À < B < À, 
alors À = B. 

Nous ne sommes pas loin de dire que la relation < donne un ordre total sur l’ensemble des 
ensembles. C’est très beau sauf que l’ensemble des ensembles n'existe pas ®. Il faudrait parler de 
classe des ensembles, mais ça nous mènerait trop loin. Toujours est-il que ces deux théorèmes 
montrent qu’on n’est pas loin d’avoir un ordre sur les ensembles, et que cela est une des bases 
possibles pour développer les nombres cardinaux. 


1.5.6 Théorème de Cantor, ensemble des ensembles 
THOooJPNFooWSxUhd 


Théorème 1.145 (Cantor[30]). 
Un ensemble est toujours strictement subpotent à son ensemble des parties. 


52. Attention : dans le Frido, la notation f: À — B, signifie que f est définie sur tout l’ensemble À, mais pas 
qu’elle est surjective sur B. 
53. Corolaire 1.147. 
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Démonstration. Soit un ensemble Æ et son ensemble des parties P(E). Nous commençons par 
prouver qu'il n’existe pas de surjection E — P(E). Soit en effet une application f: E — P(E). 
Nous posons 

D={xeE tel que x é f(x)}. (1.239) 


Nous prouvons que D ne peut pas être dans l’image de f. Supposons que y € E soit tel que 
Ï(y) = D. 
(1) Siye D Alors par définition de D, nous avons y # f(y) = D. Contradiction. 


(2) SiyéD Alors ye f(y) = D, contradiction. 


Donc aucune surjection f: E — P(E) n'existe. En particulier pas de bijections. 
Par ailleurs, l'application g: P(E) — E qui fait g({a}) = a (et n'importe quoi d’autre sur les 

autres éléments de P(E)) est une surjection P(E) — E. 
Donc P(E) est toujours strictement surpotent à E. 


1.146. 

Le théorème de Cantor implique en particulier qu’il existe (au moins) une infinité dénombrable 
d’ensembles infinis de cardinalité différentes (plus évidemment une infinité dénombrable d’en- 
sembles finis de cardinalité différentes). 


Pour tout ensemble À, il est donc possible de dire « soit Æ, un ensemble strictement surpotent 


à À ». 
CORooZMAOooPfJosM 


Corolaire 1.147. 
Il n'existe pas d'ensemble contenant tous les ensembles. 


Démonstration. Si E était un tel ensemble, nous aurions P(E) € E parce que les éléments de 
P(E) sont des ensembles. Or cela donnerait une surjection E — P(E) alors que cela est impossible 
par le théorème de Cantor 1.145. 


1.5.7 Ajouter ou soustraire des cardinalités 


Nous allons prouver une série de résultats que nous pourrions résumer en « ajouter ou retrancher 


des parties de cardinalité plus petite ne change pas la cardinalité ». 
LEMooUFCAooSyZtZ; 


Lemme 1.148 (|1]). 
Si À est infini et B est fini, alors À L B & A. 


Démonstration. Nous supposons que À et B sont disjoints °*. La proposition 1.122 nous permet 


de considérer une bijection #: {1,...,n} — B. 
Puisque À est infini, la proposition 1.138 nous permet de considérer N € À et une bijection 
p:N—N. 


Maintenant, il s’agit seulement d’insérer B dans À en le mettant « au début » de N et en 
décalant les autres éléments. La bijection est 


f: AL B-— A 
& si x e A\N (1.240) 
tr 4p(p l(x)+n) sixveN 
p(Y" (x) sire B. 
LEMooXMVDooIWLWis 


Lemme 1.149. 
Si À est infini et si À est surpotent à B, alors A & AU B. 


54. Adaptez la démonstration au cas où l’intersection n’est pas vide. 
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Démonstration. Il existe évidemment une injection À — À LU B. Donc le théorème de Cantor- 
Schrôder-Bernstein 1.142 nous indique que trouver une injection À Ü B — À suffira pour la peine. 
Nous allons utiliser le lemme de Zorn 1.23 avec l’ensemble 


XcCB 
A = {(x, x) tel que L .— } (1.241) 
px: AU X — À est injective. 


muni de l’ordre de l'inclusion : (X,wx) < (Y,wy)si X € Y et wy(x) = wx(x) pour tout x e AUX. 


(1) À est inductif Soit une famille F = {(X;,w;)}ier complètement ordonnée indexée par 
l’ensemble 1. En posant X = UJ,_, X; et p(x) = pi(x) dès que x € À L X;, l'élément (X,4) 
majore F. 


(2) Un maximum Le lemme de Zorn nous assure que À possède (au moins) un élément maxi- 
mal. Soit un tel élément maximum (X, 4). 


(3) À & B Ah oui, vous auriez aimé avoir X = B. Mais non; il n’y à pas de garantie. Nous 
allons montrer que X & B, et ça suffira. 
Vu que À € B, si X n’est pas équipotent à B, il est strictement inclus dans B. Nous pouvons 
donc considérer 


be B\X (1.242a) 
a € A\p(X). (1.242b) 
Nous considérons alors l’élément (Y,#) € À défini par 
Y = X L {b} (1.243a) 
=D 
Y(x) = | 0 (1.243b) 
(x) sinon. 


Cet élément majore (X, 4). 
Donc X & B. 

(4) Résumé de la situation Nous avons À & A 0 X ainsi qu'une injection w: AU X — A et 
une bijection d: B — X. 


(5) Conclusion si À est disjoint de B Si A et B sont disjoints, nous avons une bijection 


l: ALB—A 


: _. site À (1.244) 
p(y(x)) sixreB. 


(6) Conclusion si À n’est pas disjoint de B Il suffit de poser C = B\A et nous avons 
AUB=[AU(ARBILUC. (1.245) 


Cette union est disjointe, AU(AN B) est surpotent à À et C'est subpotent à B. La conclusion 
est donc encore valable. 


La proposition suivante sera utilisée en théorie de la mesure, dans l’exemple 14.70. 
PropVCSooMzmIX 


Proposition 1.150 ([31, 12]). 
Si S est un ensemble infini alors il existe une bijection w: {0,1} x S —S. 


Démonstration. Nous posons À = {0} x S et B = {1} x S. L'ensemble À est infini et surpotent à 
B (pas strictement, mais quand même). 
Donc À est idempotent à À LU B par le lemme 1.149. Mais À est idempotent à S, donc 


SRkA&AUB={0,1}xsS. (1.246) 
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CORooJCSIooUeUICJ 
Corolaire 1.151. 
Si À est un ensemble infini, alors À possède deux sous-ensembles disjoints A; et A2 qui sont tous 
deux en bijection avec À. 


Démonstration. La proposition 1.150 donne une bijection w: {1,2} x À — A. Il suffit de poser 
A1 = y(1, À) et A2 = w(2, À). 


Maintenant que nous pouvons mettre dans À deux copies disjointes de À, il n’est pas très 
étonnant que nous puissions en mettre une infinité dénombrable. C’est en substance ce que signifie 


la proposition suivante. 
PROPooFKBEooKXqu jV 


Proposition 1.152. 
Si À est infini, alors À x N = A. 


Démonstration. La démonstration se base sur le fait qu’à l’intérieur de À, nous pouvons construire 
autant de copies de À deux à deux disjointes que nous le voulons. La Æ° « copie » sera naturellement 
Pimage de k x À. 

Voyons tout cela en détail. 


(1) Ce que nous allons faire Nous allons construire, pour tout à > 1 des parties À;, B; € A 
telles que 


— Ain B; =, 
— Ai,B;c B; à, 
—— À; & PB; & À, 
nr AinA;j=Ssiizj 
(2) La construction Nous commençons à zéro en utilisant le corolaire 1.151 pour construire 
des parties disjointes Ao et Bo de À telles que 40 & Bo & À. 


Ensuite, puisque Bo & À, il existe A1 et B;1 dans Bo tels que A1 n B1 = Get Ai = Bi & 
Bo & À. Cela est notre construction pour à = 1. 

Pour la récurrence, puisque À; & B; & À, nous considérons À;.:: et B;,:1 dans B; tels que 
Ain Bin = Set A;11 & B;11 & B; & À. C’est encore le corolaire 1.151 qui fait le travail. 


(3) Les propriétés Nous avons À; Nn À;}1 = @ parce que À; N A;41 € An B; = G. 


Nous devons encore montrer que À; n A; = @ dès que à Æ j. Supposons que j > à. Nous 
avons les inclusions 


A B; 1< B; 2C...C B;. (1.247) 
Donc A;jnA;c B;n À; = G. 


(4) Une injection Nous pouvons à présent écrire une injection qui termine presque la preuve. 
Pour cela nous considérons pour tout ?, une bijection #;: À — À;. Ensuite nous posons 


p: AXN—A 


Si) Neo 


. L'élément vx(a) est donc dans A4 n Aj; ce n’est 


Si v(a,k) = y(b,1), alors vx(a) = v1(b) 
:(b). Cette dernière égalité n’est possible que si a = b 


possible que si k =. Donc dy(a) = Ÿ 
parce que 4} est une bijection. 
Donc 4 est une injection, et nous avons prouvé que À x N < À. 

(5) La bijection Nous venons de prouver que À x N < A. La surpotence À x N > À étant 
évidente, le théorème de Cantor-Schrôder-Bernstein 1.142 conclut que À x N & A. 


LEMooDHWSooFqhano 
Lemme 1.153 ([1]). 
Soit un ensemble À muni de deux sous-ensembles B et B' équipotents et disjoints. Alors A\B est 
équipotent à A\B. 
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Démonstration. Soit une bijection #: B' — B. L'application 


p: A\B — A\B' 
x six é B (1.249) 
Tr 
Y(x) sixe B' 
est la bijection cherchée. 
LEMooIVCBooHWQiZB 
Lemme 1.154 ([32]). 
Si À est un ensemble infini et si B < À, alors À & A\B. 
Démonstration. Nous pouvons écrire 
A=(A\B) 0 B. (1.250) 


Le théorème de comparabilité cardinale 1.143 nous indique que soit A\B < B, soit A\B > B. 
Nous allons étudier les deux cas. 
(1) Si AB>B Dans ce cas, (A\B) LU B & A\B par le lemme 1.149. Alors, notre résultat est 
prouvé parce que À = (A\B) L B & A\B. 


(2) Si A\B <B Dans ce cas, le lemme 1.149 nous indique que À = (A\B) LU B & B. Mais 
À = B est exclu par l’hypothèse. Ce cas est donc impossible. 


LEMooMRVQooUZSSyL 
Lemme 1.155 ([1]). 
Si À est infini et si B est une partie strictement subpotente de À, alors il existe U € À disjoint 
de B et équipotent à B. 


Démonstration. Le lemme 1.154 nous donne une bijection w: À — A\B. Il suffit alors de poser 
U = y(B). Cette partie est disjointe de B parce que 4 prend ses valeurs dans A\B. 


Lemme 1.156 ([33]). 
Soit un ensemble infini À ainsi qu’un sous-ensemble B € A. Nous supposons l'existence d’une 
fonction surjective f: B — B x B. 

Alors B<BxB<B<A. 


Démonstration. La première est l'hypothèse sur f. La seconde est l'existence (évidente) d’une 
surjection B x B — B. La troisième est le fait que B soit inclus dans A. 


LEMooPOEFooXaifhT 
Lemme 1.157 ([33]). 
Soit un ensemble infini À ainsi qu'un sous-ensemble strictement subpotent B € A. Nous supposons 
l’existence d’une fonction surjective f: B — B x B. 
Alors f peut être étendue en une injection f: D — D x D où D € À contient strictement B. 


Démonstration. Par le lemme 1.155, nous considérons une partie U € À disjointe de B et équipo- 
tente à B. Nous pouvons écrire le développement 


(BUuU)k(BUU)=(BXB)uiBxU)uIUS Bju(l x U). (1.251) 


Nous savons que B est surpotent à U (il est même équipotent) ; donc le lemme 1.149 nous dit que 
B UU & B. De plus il existe une bijection B — U, donc 


UrsBeBxB&BxURUxB&eUXxU. (1.252) 


Chacun des ensembles U x B, BxU et U xU est équipotent à U. Leur union est donc équipotente °° 
à U et nous avons une bijection 


pU—UxBLU(BxU)LU(U xU). (1.253) 


55. Lemme 1.149. 
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Et enfin nous définissons 
g: BUU_—(BxU)x(BUU) 


He site B (1.254) 
px) sixeU. 


Cette définition est bonne parce que U et B sont disjoints, et g est injective. 


Le théorème suivant est une généralisation de la proposition 1.150. Elle implique, entre autres 
choses, qu’il existe une bijection entre R et IR x IR. Pour le cas de N x N & NN, il y a la proposition 


1.131 qui donne une bijection explicite et donc sans axiome du choix et sans lemme de Zorn. 
THOo0DGOVooRdURVi 


Théorème 1.158. 
Si À est infini, alors À & À x À. 


Démonstration. Une fois de plus, ce sera le lemme de Zorn qui va s’y coller. Soit l’ensemble 


XcCA } 


 . (1.255) 
p: À — X x X est surjective. 


A = {(&,) tel que 
Cet ensemble est non vide parce que À est infini; il contient donc une partie dénombrable N, et 
nous connaissons la surjection N — IN x IN du lemme 1.131. 

Nous ordonnons À par l'inclusion : (X,4) < (Y, 6) lorsque X € Y et px = y. La tambouille 
usuelle montre que À est un ensemble inductif et le lemme de Zorn 1.23 donne l'existence d’un 
élément maximal que nous notons (B, @). 

Puisque B est subpotent à À (parce qu’il est inclus), soit il est strictement subpotent, soit il 
est équipotent. Nous commençons par montrer que B ne peut pas être strictement subpotent à A. 

En effet, si nous avions une surjection B — B x B, alors que B est strictement subpotent à 
A. Le lemme 1.157 nous dit alors que w peut être étendue, ce qui contredirait la maximalité de 
(B,). 

Donc la partie B est équipotente à À : il existe une bijection g: À — B. Mais nous avons une 
surjection B — B x B et donc aussi une injection B x B — B. Vu que nous avons par ailleurs une 
injection B — B x B, le théorème de Cantor-Schrôder-Bernstein 1.142 nous donne une bijection 
p: B x B — B. Avec ça, l'application 


J:'AxA—A 


(a,b) ++ 6(g(a), 9(8) ou 
est une bijection. Donc les ensembles À et À x À sont équipotents. 
LEMooNKKDooUvSYP0O 
Lemme 1.159. 
Si À est infini, et si pour tout i € N nous avons À; & À, alors 
[4 = 4. (1.257) 


ieN 
Démonstration. Pour chaque À € N nous avons une bijection w;: À; — A. Nous posons 


be] 
p: AxXN — U 4 EnooCHJACORpHYRN 


i= 
(a,i) > pi(a). 
Cette application est surjective mais peut-être pas injective parce que les À; peuvent avoir des 
intersections non vides. Nous avons alors le calcul 


A AXN A 
co 

- Fe MS 
i=0 

: À SHÉRAGOF RESTE 


Justifications : 
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— Pour (1.259a), c’est la proposition 1.152. 
— Pour (1.259b), c’est la surjection (1.258). 
— Pour (1.259c), c’est le fait que seulement A5 possède déjà une surjection vers À. 


Donc U), A; est à la fois surpotent et subpotent à A. Il est donc équipotent par le théorème 
1.142. 


1.6 Groupes 


1.6.1 Définition, unicité du neutre 


La définition d’un groupe est la définition 1.36. 
LEMooECDMooCKkWxXf 


Lemme-Définition 1.160 (Unicités). 
Dans un groupe, l'inverse et le neutre sont uniques. Plus précisément, si G est un groupe nous 
avons : 


(1) il existe un unique élément e € G tel que eg = ge = g pour tout ge G, ITEMooOLWTO0YamMPP 


(2) pour tout g € G, il existe un unique élément h € G tel que gh = hg = e. 


Le e ainsi défini est nommé neutre de G. Le h tel que gh = hg = e est nommé l'inverse de g et 


est noté g”7 |. 


Démonstration. Chaque point séparément. 

(1) Supposons que e: et e2 vérifient la propriété. Nous avons pour tout g € G : eg = ges = g. En 
particulier pour g = e2 nous écrivons eje2 = e2e = e2. Mais en partant dans l’autre sens : 
E29 = ge2 = q avec g = € nous avons e2€1 = €162 = €1. En égalant ces deux valeurs de e2e: 
nous avons €1 = €2. 
Pour la suite de la preuve nous écrivons e l’unique neutre de G. 

(2) Supposons que k1 et k2 soient deux inverses de g. On considère alors le produit k1gk2. Puisque 
k1g = e, on a k1gk2 = ek2 = k2; mais, comme gk2 = €, on a aussi k1gk2 — kie — k1. Le 
produit est donc à la fois égal à k: et à k2, et donc k1 = ko. 


LEMooWYLRooNOdZnp 
Lemme 1.161. 
Soient deux groupes G et H. Si a: G — H est un morphisme de groupes Ÿ, alors 
(1) (ec) = ex. 
(2) à(g7) = «(g) 


LEMooBIBFooBHxFYC 
Lemme 1.162. 
Si G est un groupe et si h € G, alors les applications 
L:G—G 
d (1.260) 
g hg 
et 
R,:G—G 
: (1.261) 
g+ gh 


sont des bijections. 


Démonstration. D'abord si Ln(g1) = La(g2), alors hgi = hg2 et en multipliant à gauche par h-! 
nous avons g, — g2; donc Z, est injective. Ensuite L} est surjective parce que si g € G, alors 
g = Li(h 9). 

Pour l’application R}?, la preuve est une simple adaptation. 


56. Définition 1.37. 
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1.6.2 Groupe ordonné 
DEFOooEUHFooYvhnLQ 


Définition 1.163 ([34]). 
Soient un groupe (G, +), ainsi qu’une relation d'ordre < sur G. Nous disons que la relation d'ordre 
est compatible avec la structure de groupe si pour tout x,y,2€ G, six < y alors x +2 <y+z et 
z+x<z+y. Dans ce cas, le triple (G,+,<) est un groupe ordonné. 

Si(G,<) est totalement ordonné, nous disons que le groupe est totalement ordonné. 


1.6.3 Classes de conjugaison 
DEFooULXPooWelsZV 


Définition 1.164 (classe de conjugaison). 
Soit un groupe G et un élément g € G. La classe de conjugaison de g est la partie 


Cy = {kgk”! tel que k € G}. (1.262) 
LEMooQYBJooYwMwGM 
Lemme 1.165. 
Un groupe est commutatif si et seulement si ses classes de conjugaison sont des singletons. 


Démonstration. Supposons que G soit commutatif. Alors 
Cy = {kgk”! tel que k € G} = {g}. (1.263) 


Donc les classes de conjugaison sont des singletons. 
Dans l’autre sens, si les classes sont des singletons, on a £gk=! = g pour tous k,g € G. Cela 
signifie immédiatement que G est commutatif. 


defGroupeCentre 
Définition 1.166 (centralisateur|[35]). 
Soient un groupe G, un sous-groupe H et un élément h € H. Le centralisateur de h dans G est 
l’ensemble des éléments de G qui commutent avec h : 


Zah) = {ze G tel que hz = zh}. (1.264) 


Le centralisateur de H dans G est l’ensemble des éléments de G qui commutent avec tous les 
éléments de H : 
Za(H) = [) Za(h). (1.265) 
heH 


Le centre d’un groupe G est l’ensemble des éléments de G qui commutent avec tous les autres : 


Za = Za(G) = {2e G tel que gz = 2g,Vg € G}. (1.266) 
DEFooZTSMooBislly 
Définition 1.167 (normalisateur|[35]). 
Soient un groupe G et un sous-groupe H. Le normalisateur de H dans G est 


NG(A) = {ge G tel que gH = Hg}. (1.267) 
DEFooNIIMooFkZgvXx 
Définition 1.168 (Sous-groupe normal). 
Un sous-groupe N de G est normal ou distingué si pour tout g € G et pour tout n € N, 
gng | e N. Autrement dit lorsque gNg-! © N. 


Lorsque N est normal dans G il est parfois noté N 4G. 
DEFooUXXTooCCLmQe 


Définition 1.169. 
Un sous-groupe H de G est un sous-groupe caractéristique si a(H) € H pour tout automor- 
phisme®T à de G. 


Lemme 1.170 ([36]). 
Si H est un sous-groupe caractéristique de @, alors a(H) = H pour tout automorphisme a de G. 


57. Automorphisme de groupe, définition 1.37. 
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Démonstration. Si a est un automorphisme de G, alors al est encore un automorphisme de G. 
En particulier a !{(H) € H. 
Soit h € H. Nous devons prouver que h € a(H). Pour cela : 


h = a(a”l(h)) e a(a-!(H)) € a(H). (1.268) 


DefGroupeSimple 
Définition 1.171 (Groupe simple). 
Un groupe est dit simple si il est non trivial et si les seuls sous-groupes normaux qu'il admet sont 
lui-même et le sous-groupe réduit à l’élément neutre. 


1.7 Anneaux 
DEFooKWKGoo!IOwGTA 


Définition 1.172. 
Un isomorphisme d’anneaux est un morphisme d’anneaux*, bijectif. 


La distributivité de la partie (3) de la définition 1.41 ne traite que de l’addition; pas de la 


soustraction. Voici une lemme qui dit que ça fonctionne quand même. 
LEMooVPYUooRzexke 


Lemme 1.173 ([12]). 
Soient un anneau À ainsi que a,b,ce A. Alors 


a(b— c) = ab — ac. (1.269) 


Démonstration. Nous avons le calcul suivant : 


a(b— c) + ac = a((b— c) +c) dE 1.37 0a) 
. RARES 


Justifications : 
— Pour 1.270a. Distributivité. 
— Pour 1.270b. Parce que (b — c) + c = b. 


Nous avons donc a(b—c)+ac = ab et donc l’égalité demandée en ajoutant —ac des deux côtés. 
LEMooVUSMooWisQpD 


Lemme 1.174. 
Pour tout élément a d’un anneau nous avons a : 0 = 0. 


Démonstration. L'élément 0 est le neutre de l’addition. Il peut être écrit 1 — 1, et en utilisant la 
distributivité sous la forme du lemme 1.173, 


a°:0=a:(1-1)=a-a=0. (1.271) 


Notons que la dernière égalité s’écrit en détail a—a = a+(—a) qui donne le neutre de l’addition. 
PROPooNCCGooXjVyVt 


Proposition 1.175. 
Dans un anneau °° non nul, le neutre pour l'addition est distinct du neutre pour la multiplication. 


Démonstration. Supposons par contraposée que dans un anneau À, nous ayons 1 = 0. Alors, pour 
tout ae A,onaa=la=0a=(1-1)a=a—a=0,a= 0. Autrement dit a = 0 pour tout a € À 
et l’anneau est nul. 


LEMooLTERooVKgqjn 
Lemme 1.176 ([1]). 
Un peu d’arithmétique. Soit un anneau À et un élément a € À. 


58. Définition 1.42. 
59. Définition 1.41. 
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ITEMooUGHCooUPgoeR 
GRENIER F ITEMooJMBSooVevVug 
(2) (-Dxa= —a. ITEMooXJGMooKNL1HU 
ue ITEMooYMRKooHVYYKU 


(4) (D x (1) = 1. 
Démonstration. En plusieurs parties. 


(1) Pour (1) La définition de 1 est que 1 x a = a pour tout a. En particulier pour a = 1 nous 
avons le résultat. 


(2) Pour (2) Nous avons 
(-1)xa+a=ax((-1)+1)=ax0=0. (1.272) 


Nous avons utilisé le fait que la multiplication était distributive et que le zéro était absorbant 
(lemme 1.174). 


(3) Pour (3) Nous avons —a+a = 0 par définition de la notation —a. Donc a est bien l'inverse 
de —a pour l’addition. 


(4) Pour (4) En utilisant les points (2) et (3) nous avons 
(—1) x (—1) = —-(—-1) = 1. (1.273) 


Soit X un ensemble et un anneau (A,+, x). Nous considérons Fun(X, À) l’ensemble des appli- 
cations À — À. Cet ensemble devient un anneau avec les définitions 


(F + g)(x) = f(x) + g(x) (1:274a) 
(fg)(x) = f(x)g(x). (1:274b) 
C’est la structure canonique d’anneau sur Fun(X, À). 


Définition 1.177. 
Le centralisateur de x € À dans À est l’ensemble 


{y € À tel que xy = y}, (1.275) 

le centre de À est 
{y € À tel que xy = yr,Vx € A}. (1.276) 
DefooQULAooREUIU 


Définition 1.178 (Idéal dans un anneau). 
Un sous-ensemble TI € À est un idéal à gauche si 


(1) Test un sous-groupe pour l'addition, 
(2) pour tout a € A, al cel. 


De même nous disons que I € À est une idéal à droite lorsque I est un sous-groupe pour l’addition 
et Ta € T pour tout a € À. 
Lorsqu'un ensemble est idéal à gauche et à droite, nous disons que c’est un idéal bilatère. 


Lorsque nous parlons d’idéal sans précision, nous parlons d’idéal bilatère. 
LEMooMAHXooXSowdn 


Lemme 1.179. 
Les seuls idéaux d’un corps sont {0} et le corps lui-même. 


Démonstration. Soient un corps K et un idéal 7 dans À. Si I = {0}, c’est un idéal, pas de problèmes. 
Si I Z {0}, alors 0 € Z parce qu’un idéal doit contenir le neutre de l’addition. 

Soit x # 0 dans /. Alors pour tout a € K nous avons ax € I. En particulier avec a = x! nous 
voyons que 1 € 1. De là, 1 = K parce que si x € K, nous avons x =x:1exlclI. 
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PROPooGXMRooTcUGbi 
Proposition-Définition 1.180. 
Soit À, un anneau, I un idéal bilatère ® de A. Nous considérons la relation d'équivalence x — y si 
et seulement si x — ye I. Sur le quotient! 


A/ == A/I, (1.277) 
nous mettons les opérations 
(1) [el] + [y] = [x + y] 
(2) Telly] = [xyl. 
Nous avons alors les résultats suivants : ITEMooEJPEooRKAqmS 
(1) Les opérations sont bien définies, ITEMooYBEGooT1HgNz 


(2) l’ensemble A/T, muni de ces opérations, est un anneau. Le neutre pour l’addition est [0], 
l’inverse de [a] est [—-a] que nous noterons —[a]. ITEMooLNRLooMkoWXZ 


(3) la surjection canonique x: À —+ A/T est un morphisme. 


Cet anneau est appelé anneau quotient. 


Démonstration. En plusieurs parties. 


(1) Pour (1) Nous savons que, par définition, 
x ={xr+itel queiel}. (1.278) 
Calculons le produit de représentants génériques de x et de ÿ : 
(x + à1)(y + 42) = vy + rio + yir + 162. (1.279) 
Puisque 1 est un idéal, nous avons xi2 + yii + t1i9 € I et donc bien 


(x + 1)(y + i2) € Ty. (1.280) 


TS 
ND 
a 


Pour (2) Ils’agit de vérifier les conditions de la définition 1.41. 


D'abord A/T est un groupe de neutre [0]. En effet, vu que (A, +) est un groupe commutatif 
de neutre 0, nous avons 


(2a) Neutre : [a] + [0] = [a + 0] = [a]. 
(2b) Associativité : [a] +([b]+[c]) = [a]+[b+c] = [a+b+c] = [a+b]+[c] = ([a]+[b]) +[c]. 
(2c) Inversibilité : l'inverse de [a] est [—-a] parce que [a] + [—a] = [a — a] = [0]. 


Nous pouvons noter —[a] l'élément [—a]. Le groupe A/I est commutatif : 
[a] + [b] = [a + b] = [b+ a] = [b] +[al. (1.281) 


Donc (A/1,+) est un groupe commutatif de neutre [0]. 
L’associativité de À donne l’associativité dans A/T : 


(lell1) [el = fablfel = [abc] = [alle] = [al((éItc}). (1.282) 
Et enfin pour la distributivité, 
[a](Lo] + [e]) = [a]fb + c] = [a(b + c)] = [ab + ac] = [ab] + [ac] = [a][b] + [al[c]. (1.283) 


Nous avons prouvé que A/I est un anneau de neutre [0] et d’unité [1]. 


RS 
Co 
nr 


Pour (3) Nous devons vérifier les trois conditions de la définition 1.42. Cela est immédiat 
parce que n(x) = [x]. 


60. Définition 1.178. 
61. Définition 1.32. 
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1.7.1 Diviseurs . 
DiviseursAnneau 


Définition 1.181 (Diviseurs dans un anneau). 
Soient a,b € À. On dit que a divise b, ou que a est un diviseur (à gauche) de b si il existe c € A 
tel que ac = b. On dit que c’est un diviseur de b à droite si ca = b pour un certain c € À. 


Un cas particulier est le cas des diviseurs de zéro. L’absence de tels diviseurs dans un anneau 
est une propriété intéressante : on dit dans ce cas que l’anneau est intègre. Définition 1.193. 
Un élément a € À est régulier à droite si ba = 0 implique b = 0. Il est régulier à gauche si 
ab = 0 implique b = 0. 
DefrYwbct 
Définition 1.182. 
Soient À un anneau commutatif et S € A. Nous disons que Ô € À est un PGCD de S si 


. + 62 212 
(1) Ô divise®* tous les éléments de S. ITEMooVCKGooWDXZ0j 


(2) si d divise également tous les éléments de S, alors d divise 6. 


Nous disons que 1 € À est un PPCM de S si 


(A) Sy, 
(2) si S | m, alors u | m. 


Si P et Q sont des polynômes, ce que nous notons pgcd(P, Q) est l’unique polynôme unitaire dans 
pgcd GP Q}). Voir 6.53. 


Remarque 1.183. 
Au sens de la définition 1.182, le pgcd n’est pas unique. Dans Z par exemple les nombres 4 et —4 
sont tous deux pgcd de {4, 16}. 
Dans Z cependant, nous modifions implicitement la définition et nous n’acceptons que les 
positifs, de telle sorte que l’unique pgcd soit effectivement le plus grand pour l’ordre usuel sur Z. 
Pour l’unicité dans Z, voir 3.19. 


1.7.2 Élément irréductible et premier 


DEFooZCRQooWXRalw 
Définition 1.184 ([37]|). 
Soit un anneau commutatif A. Un élément p € À est premier si il est 
(1) non nul, 
(2) non inversible, ITEMooPMTTooCVHPIm 
(3) si p divise un produit ab, alors i divise soit a soit b (ou les deux). 
DeirredBDhQfA 


Définition 1.185 (Élément irréductible[38]). 
Un élément d’un anneau commutatif est irréductible si il n’est ni inversible, ni le produit de deux 
éléments non inversibles. 


1.186. 
Nous allons voir dans la section 3.6 que le concept d’élément irréductible n’est vraiment utile que 
dans le cas des anneaux intègres. 


Exemple 1.187. 

Un corps n’a pas d’élément irréductible parce qu’à part zéro, tous les éléments sont inversibles. 

Mais 0 n’est pas irréductible parce qu’il peut être écrit comme produit d'éléments non inversibles : 

0=0:0. A 
LEMooJBUJooScsiGc 

Lemme 1.188 ([1]). 

Si p est irréductible et si u est inversible, alors pu est irréductible. 


62. Définition 1.181. 
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Démonstration. D'abord pu n’est pas inversible parce que p ne l’est pas. 
Ensuite supposons que pu = ab. Vu que u est inversible, nous avons p = a(bu!). Comme p est 
irréductible, soit a, soit bu! est inversible. 
Si c’est a, c’est gagnée. Sinon, soit k un inverse de bu! : bulk = 1. Nous voyons que uk 
est un inverse de b. Donc b est inversible. 


PROPooKDWQooTtScrN 
Proposition 1.189. 


Les éléments irréductibles de l’anneau Z sont les nombres premiers. 


Démonstration. Les seuls inversibles de Z sont +1. 
Si p est premier et p = ab avec à, b € Z, alors nous avons soit a = +1 soit b = +1. Donc p n’est 
pas le produit de deux éléments non inversibles. 
Dans le sens inverse, supposons que p soit irréductible dans Z. D'abord p ne peut pas être +1 
parce que +1 sont inversibles. Ensuite supposons que p = ab. Vu que p est irréductible, nous avons 
a = +1 où b = +1. Autrement dit, dans p = ab, soit a soit b est un inversible. 


1.7.3 Anneau intègre 
DEFooHRRYo0TmbUTH 


Définition 1.190 (Éléments nilpotents, unipotents). 
On dit que a € À est nilpotent si il existe n € N tel que a" = 0. Il est dit unipotent si a — 1 est 
nilpotent, c’est-à-dire si (a — 1)" = 0 pour un certain n € N. 
DEFooCIHVooAhp]Jxy 

Définition 1.191 (Éléments inversibles). 
Un élément a € À est dit inversible si il existe b € À tel que ab = 1. 

L'ensemble U(A) des éléments inversibles de À est un groupe pour la multiplication. Nous 
notons A* = A\{0}. 


Conformément à la définition 1.181 de diviseur, nous posons la définition suivante pour les 


diviseurs de zéro. 
DEFooCIYLooFkhVOc 


Définition 1.192 (diviseur de zéro[39]). 
Un élément a Z 0 est un diviseur de zéro à gauche si il existe x Z# 0 tel que ax = 0. L'élément 
a est un diviseur de zéro à droite si il existe y Æ 0 tel que ya = 0. 

Nous disons que a est un diviseur de zéro si il est un diviseur de zéro à gauche ou à droite. 


DEFooTAOUPooWDPYmd 
Proposition-Définition 1.193 (Anneau intègre[1|). 
Soit À un anneau non réduit à {0}. Les assertions suivantes sont équivalentes rem oMxMKooXMYpN 
N . sr 64 
(1) À ne possède pas de diviseurs de zéro °*. ITEMooLA JCooFuxXrV 


(2) La règle du produit nul s'applique dans À : pour tous a,b € À, si ab = 0, alors a = 0 ou 
b=—0. ITEMooQNTFooSRrVPK 

(3) On peut simplifier par un même élément non-nul, deux expressions produit dans À qui sont 
égales : pour tous a,b,ce À avec a Æ 0, si ab = ac, alors b=c. 


Un anneau non réduit à {0} qui vérifie ces propriétés est dit intègre. 


Démonstration. En trois implications. 


(1) (1) implique (2) 
Si ab = 0 avec b Æ 0 alors a est un diviseur de zéro. Vu que nous supposons que À n’a pas 
de diviseurs de zéros, a est nul. De même, si a # 0 b devrait être nul. 

(2) (2) implique (3) 
Si ab = ac, alors a(b — c) = 0 et l'hypothèse dit que soit a = 0, soit b— c = 0. Donc si a £ 0, 
alors b— c= 0. 


63. Nombre premier, définition 1.184. 
64. Définition 1.192. 
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(3) 


(3) implique (1) Si À = {0}, le point (3) n’est pas applicable. 


Si a £ 0 et ax = 0, alors nous avons aussi ax = a x 0. Par propriété de simplification, x = 0. 
Donc a n’est pas un diviseur de zéro à gauche. Nous prouvons de la même façon qu’il n’y a 
pas de diviseurs de zéro à droite. 


LEMooIKNMooMfvQnu 


Lemme 1.194. 
Un corps est un anneau intègre. 


Démonstration. Nous vérifions la définition 1.193, et nous nommons K le corps considéré. 


(1) 
(2) 
(3) 


1 


Pour (1) Soit a € K. Si ax = 0 avec x # 0 alors en multipliant par x * nous trouvons 


a = 0. Donc a n’est pas un diviseur de zéro non nul. 


Pour (2) Idem à ce que nous venons de faire. Si dans ab = 0 l’un des deux est non nul, en 
multipliant par son inverse, nous trouvons que l’autre est nul. 


Pour (3) Si ab = ac avec a Z 0, alors il suffit de multiplier à gauche par a! (qui existe 
parce que nous sommes dans un corps) pour obtenir b= c. 


Conséquence : dans un corps nous avons toujours la règle du produit nul, et l’élément nul n’est 
jamais inversible. 


PROPooZBTIooRhAhvg 

Proposition 1.195 ([40]). 
Soit un anneau unitaire et intègre À. Soit p € A. ITEMoo JMRYooHndNpV 
(1) p est premier si et seulement si l'idéal pA est premier. ITEMooGHGCOoRkJi 1g 


(2) p est irréductible si et seulement si il n'existe pas d’idéal principal I tel que pASGSTS A. 


Démonstration. En plusieurs parties. 


(1) 


(4) 


()= 
Supposons que p est premier. Soient a, b € À tels que ab € pA. En particulier p | ab, et p 
étant premier %, nous avons soit p | a soit p | b. Supposons que p | a. Il existe k € À tel que 
pk = a, et donc 

a = pk € pA. (1.284) 
De même si p | b nous avons b € pA. 
()= 
Nous supposons que l'idéal pA est premier, et nous prouvons que p est premier. Soient a, b € A 
tels que p | ab. Il existe k € À tel que pk = ab. Donc ab € pA. L'idéal pA étant premier, nus 
avons soit a € pA soit b € pA. Donc soit a | a soit b | p. 
(2)= 
Supposons que p est irréductible. Soit un idéal principal Z vérifiant pA € 1. Nous allons 


montrer que soit {À = pA soit 1 = A. Vu que J est principal, il existe a € À tel que 1 = aA. 
Nous avons pA © aA, et en particulier p € aA. Notons b € À un élément tel que ab = p. 


Vu que p est irréductible, il n’est pas le produit de deux non inversibles. Donc soit a soit b 
est inversible. 


Si a est inversible, alors 1 = À. 

Si b est inversible, alors a = pb”! de telle sorte que a € pA. De ce fait I = pA. 

(2)= 

Enfin, nous supposons qu’il n’existe pas d’idéal principal 7 tel que pA & 1 € À, et nous 
montrons que p est irréductible. Soient a, be À tels que p = ab. 


65. Définition 1.193. 
66. Définition 1.184. 
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Nous avons p € aÀ et donc pA € aA. Donc soit aAÀ = pA soit aA = À. 

Si aÀ = pA, alors il existe k € À tel que pk = a. En multipliant l'égalité ab = p par k 
nous trouvons abk = pk = a. Vu que À est intègre, nous pouvons simplifier par a et trouver 
bk = 1, de telle sorte que b soit inversible. 


Si aÀ = À, alors a est inversible parce que 1 € À = aA. 


LEMooSFHMooQoKsPV 
Lemme 1.196 ([1]). 
Soient un anneau intègre À, et une partie S & À. Si un des pgcd de S est inversible$", alors ils le 
sont tous. 


Démonstration. Pour rappel, les pgcd d’une partie de À sont définis dans 1.182. Soit un pgcd 
inversible de $, ainsi qu’un autre pgcd que nous nommons 6’. Vu que 0’ divise tous les éléments 
de S, il est divisé par 6 : 6 | 0’. Réciproquement, 6’ | 6. 

Soient x et y définis par 0 = xd’ et 0’ = yô. Nous avons 


Ê = #0 — EU0. (1.285) 


Comme l’anneau À est intègre, nous pouvons simplifier par 6 et voir xy = 1, ce qui signifie que x 
et y sont inversibles. Donc si 6 est inversible, alors 0’ = y6 est inversible. 


LEMooMHZQoo!IcSNSf 
Lemme 1.197 ([1, 41)). 


Soient un anneau intègre, À, une partie S & À et un élément a € À. Nous avons © 


pgcd(aS) = a pgcd(S). (1.286) 


Démonstration. Deux inclusions à prouver. 


(1) pgcd(aS) € apgcd(S) Soit un pgcd 6 de aS$. Nous devons trouver un 6’ € pgcd(S) tel que 
ô = a’. En termes de notations, nous notons S = {s;};er. Pour chaque à nous avons 0 | as; : 
il existe x; € À tel que 


ÜT+ = 84. (1.287) 


Vu que a divise tous les éléments de @S, il divise n’importe quel pgcd de aS$, et en particulier 
a | Ô : il existe d’ € À tel que 0 = aô’. Nous montrons que 0’ € pgcd(S). 
Nous savons que ôx; = as;. En remplaçant 6 par ad’, aô'x; = as;. Vu que nous sommes dans 
un anneau intègre, nous pouvons simplifier par a (définition 1.193(3)) : 


Ô'x; — $;; (1.288) 


Donc 6’ divise tous les éléments de $, et vérifie la première condition pour être un pgcd de S$. 
Pour la seconde condition, nous supposons que d divise tous les éléments de $. Nous avons 
d | $, donc ad | aS. Et comme 6 est un pgcd de aS$, nous déduisons que ad divise 6. Il existe 
y € À tel que 

ady = Ô. (1.289) 
Nous remplaçons Ô par sa valeur a’ : ady = aô'. Encore une fois nous simplifions par a et 
nous trouvons dy = 6”, c’est-à-dire que Ô divise 6’. 
apgcd(S) € pgcd(asS) 
Soit un pgcd Ô de $. Nous voulons que aô € pgcd(aS). Vu que Ô € pgcd(S) nous avons 


0x; = 5; pour tout 1, et donc aussi aôx; = as;, de telle sorte que aô divise tous les éléments 
de aS. 


Soit maintenant de À divisant tous les éléments de aS. Nous devons prouver que d | aô. 


SR 
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67. Définition 1.191. 
68. Définition du pgcd : 1.182. 
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(2a) Travail préliminaire 


Nous considérons 4’ € pgcd(aS). Vu que Ô | s pour tout s € S, nous avons aussi aô | as 
pour tout se S. Comme 6’ est un est un pgcd de a$,, nous avons donc 


aô | 6. (1.290) 
Soit u € À tel que 0’ = aôu. 
En utilisant la première partie de la preuve, nous avons 
de pgcd(aS) € apged(S). (1.291) 
Donc il existe 01 € pgcd(S) tel que 0” = ad1. En écrivant l'égalité 8’ = aôu avec cette 
! 
valeur de 6’, nous trouvons _—_ EnooHSSoopé VU 
et donc 0, = ôu parce que À est intègre. Vu que 01 € pgcd(S), nous avons aussi 


ôu € pgcd(S). En particulier ôu divise tous les éléments de S, et donc divise Ô qui 
est un pgcd de S' : êu | 6. En multipliant par a, 


0! = aôu | aô. (1.293) 


(2b) Résumé Nous avons considéré à € pgcd(S) et nous sommes en train de prouver que 
aô € pgcd(aS). Nous avons déjà prouvé que si 0’ € pgcd(aS), alors nous avons 6’ | a. 
Nous posons y € À tel que d'y = a. 

(2c) Et enfin Soit d divisant tous les éléments de aô. Donc d | 6’ : il existe x € À tel que 
dx = 0’. En multipliant par y, 

dry = d'y = aô. (1.294) 


Nous avons montré que d divise aô, ce qu’il nous fallait. 


LEMooZSUNooUmYmgt 
Lemme 1.198 ([12|). 
Soient un anneau intègre À et une partie S € À. Si 0 E pgcd(S), alors pgcd(S/6) ne contient que 
des inversibles. 


Démonstration. En utilisant le lemme 1.197, nous avons 
pgcd(S) = pgcd (ô(5/6)) = 6 pgcd(S/6). (1.295) 
Soit de pgcd(S/6). Notre but est de montrer que d est inversible. D'abord 
Ôd € Ô pgcd(S/6) = pgcd(S). (1.296) 


Donc 6d divise tous les éléments de S. Étant donné que 6 est un pgcd de S$, la définition 1.182(2) 
nous dit que ôd divise 6. Il existe donc d’ € À tel que dd’ = 6, c’est à dire 


ô(dd' — 1) = 0. (1.297) 


Étant donné que 6 # 0 et que À est intègre nous avons dd’ — 1 = 0 (définition 1.193(2)), c'est à 


dire dd’ = 1. Cela montre que d’ est un inverse de d, et donc que d est inversible. 
LEMooZKASooKstTuk 


Lemme 1.199 ([1]). 
Soit un anneau intègre À. Si d € pgcd(S) et si u € À est inversible, alors Ôu € pgcd(S). 


Démonstration. Soit s € S. Si ôx = s, alors uô(u-!x) = s. Donc u6 divise tous les éléments de S. 
De plus si d | S, alors d | Ô. Dans ce cas il existe y tel que dy = ô. Nous avons alors aussi 


du = du, (1.298) 


de telle sorte que d divise Ou. 
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1.7.4 Fonction puissance 


Voici une première définition de la fonction puissance. Il y en aura d’autres, de plus en plus 
générales. Voir le thème 51. 


DEFooGVSFooFVLtNo 
Définition 1.200. 
Si À est un anneau, si a € À et sine IN, nous définissons a” par récurrence : 
0 — , 17 . . . 
(1) a = 1 (l'unité pour la multiplication dans A), ITEMooOUIPo0G j AgQb 


(2) ag af, 


Le lemme suivant dit que le point (2) de la définition 1.200 aurait pu être écrit a* - a au lieu 
de a : ax. 
LEMooWPARooYLZlzr 
Lemme 1.201 ([1|). 


Si À est un anneau, sia€e À etsineN, alors 
a=a-atl=att.a. (1.299) 
Démonstration. Cela se prouve par récurrence. Pour n = 1 c’est l'égalité a = a°a qui est correcte 


parce que par définition a° = 1. 
Supposons que le résultat soit bon pour n et voyons ce que ça donne pour n + 1 : 


atl = aa" Définition de a”"*! (1.300a) 
= a(a*-la) hypothèse de récurrence pour a” (1.300b) 
= (aa la associativité (1.300c) 
= ao Définition de a”. (1.300d) 
1.8 Idéal dans un anneau 
La définition d’un idéal dans un anneau est la définition 1.178. 
DefTMNooKXHUd 


Définition 1.202 ([43|). 
Un corps est un anneau? (A, +, x) dans lequel tout élément non nul est inversible pour l'opération 
X (pour l'opération +, tous les éléments sont inversibles parce que (A,+) est un groupe). 


1.208. 
Dans le Frido, nous ne parlons que de corps commutatifs ; nous ne le répéterons pas toujours. 


1.204. 


Pour savoir ce qu'est un « ring » ou « field » en anglais, voir -2.8. 
DefSKToo0UTauAR 


Définition 1.205 (Idéal engendré par un élément). 
Si p est un élément d’un anneau À alors nous notons (p) l'idéal dans À engendré par p, c’est-à- 


dire pA. 
DefAJVTPxb 


Définition 1.206. 
Un sous-ensemble B € À d’un anneau est un sous anneau si 


(1) 1eB 
(2) B est un sous-groupe pour l'addition 


(3) B est stable pour la multiplication. 


69. Définition 1.41. 
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Remarque 1.207. 
Un idéal n’est pas toujours un anneau parce que l'identité pourrait manquer. Un idéal qui contient 


l'identité est l’anneau complet. 
LEMooQAYSooCYJXKkC 


Lemme 1.208. 
L'ensemble 2Z est un idéal!® de Z. On peut aussi le noter (2). 
PROPooJALPOoHFIObB 

Proposition 1.209 (Premier théorème d’isomorphisme pour les anneaux). 
Soient À et B des anneaux et un homomorphisme f: À — B. Nous considérons l'injection ca- 
nonique j: f(A) — B et la surjection canonique o: À — A/ker f. Alors il existe un unique 
isomorphisme 

f: A/ker f — f(A) (1.301) 


tel que f = j0 f o @. 
A B (1.302) 


4 4 


 ) c B 


ProplJJIdsousphi 
Proposition 1.210. 
Soient I un idéal de À et la projection canonique 
p: A— A/I. (1.303) 
C’est une bijection entre les idéaux de À contenant I et les idéaux de A/I. 
Dit de façon imagée : 
E 
{idéaux de À contenant I} = {idéaux de A/T}. PAT 


Démonstration. Si I € J et si J est un idéal de À, alors @(J) est un idéal dans 4/1. En effet un 
élément de 6(J) est de la forme @(j) et un élément de A/I est de la forme @(i). Leur produit vaut 


P(i)(5) = d(is) € (JT). (1.305) 


Soit maintenant X un idéal dans A/I et soit J = 6-!(K). Étant donné qu’un idéal doit contenir 
0 (parce qu'un idéal est un groupe pour l'addition), [0] € K et par conséquent 1 € D !(K). 


PROPoâtfiCEnpaGAEXk 

Proposition 1.211 ([1]}). 
Si À est un anneau, nous avons les équivalences a 
(1) A est un corps. ITEMooDGZIo0RopYGx 
(2) À est non nul et ses seuls"? idéaux à gauche sont {0} et A. ITEMooL.PWHooD JpTbR 


(3) A est non nul et ses seuls idéaux à droite sont {0} et À. 


Démonstration. Nous allons montrer que le point (1) est équivalent aux deux autres. 


(1) (1) implique (2) Si Z est un idéal à gauche différent de {0}, alors il contient un certain 


a # 0. Puisque À est un corps, il contient un inverse a-!, et comme J est un idéal, a-!1c I. 
En particulier a-la € I. Donc 1e Jet I = A. 


70. Idéal, définition 1.178. 
71. Définition 1.202. 
72. Je vous laisse vous poser de grandes questions sur le fait que le vide est un idéal ou non. 
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(2) (2) implique (1) Supposons que les seuls idéaux de À soient {0} et À. Soit a € A. Si a 
est non nul, alors aA est un idéal de a. Vu qu’il contient a Æ 0, nous avons aA = A (par 
hypothèse, un idéal qui n’est pas {1} est À). En particulier, 1 € aA, c’est-à-dire qu’il existe 
be À tel que ab = 1. L'élément a est donc inversible. 


(3) (1) implique (3) Comme pour (1) implique (2). 


(4) (3) implique (1) Comme pour (2) implique (1). 


Notez que je n’ai pas vérifié les deux derniers points. Donc vous devriez le vérifier et m'écrire si il 
y à un problème. 


DEFIdealMax 
Définition 1.212 ([44|). 
Soit un anneau À. Un idéal I Æ À est dit idéal maximal si il n'existe pas d’idéal J Æ A contenant 


strictement I. 
PROPooSHHWooCyZPPw 


Proposition 1.213 (Thème 18). 
Un idéal 1 dans un anneau À est maximum si et seulement si A/I est un corps. 


Démonstration. Soit un idéal maximum 7 € À. Alors les idéaux contenant 1 sont A et 1. L’appli- 
cation @ de la proposition 1.210 est une bijection, donc l’ensemble des idéaux de A/I ne contient 
que deux éléments. Les seuls idéaux de A/T sont donc {0} et A/T; donc A/T est un corps par la 
proposition 1.211. 

Dans l’autre sens, c’est la même chose : si A/T est un corps, il possède exactement deux idéaux, 


donc À ne contient que deux idéaux contenant 1. Donc 1 est un idéal maximum. 
THOooFWYLooUofaPa 


Théorème 1.214 (Théorème de Krull[45]). 
Pour tout idéal propre T1 d’un anneau commutatif À, il existe au moins un idéal maximal de À 
contenant I. 


1.8.1 Division euclidienne 
ThoDivisEuclide 


Théorème-Définition 1.215 (Division euclidienne[46]). 
Soient a € Z et bE N*. Il existe un unique couple (q,r) € Z x N, avec 0 < r < b, tel que 


a=bq+r. (1.306) 


L'opération (a,b) > (q,r) ainsi définie est la division euclidienne. Le nombre q est le quotient 
et r est le reste de la division de a par b. 


Démonstration. Remarquons que r = a — bg, et donc, une fois l’existence et l’unicité de qg établie, 
celle de r suivra. 


(1) Unicité Nous supposons avoir (q,r) € Z x N tels que 


0<r<b (1.307a) 
a = qb+r. (1.307b) 
Ce système implique que 

0 < a — gb < b. (1.308) 


En ajoutant qb dans les trois membres de cette inégalité, 
gb <a < (q+1)b. (1.309) 


Cela implique que 
qg = max{k € Z tel que kb < a}. (1.310) 


Donc gq est unique et la relation a = bq + r implique que r est également unique. 
Soit 
E = {ge Z]|bq < a}. 
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La partie E est non vide (parce qu’elle contient —|a|) et admet un majorant : l’élément |a|. 
Elle admet donc un maximum q par le lemme 1.108. Ce maximum vérifie 


bq < a < b(q + 1). (1.311) 


Cela donne 0 < a — bq < b et le résultat, en posant r = a — gb. 


Le lemme suivant est souvent pris pour la définition d’un nombre premier lorsqu'on parle de 
N ou Z. 


Lemme 1.216 ([47, 1]). 
Dans N, un nombre est premier si et seulement si il admet exactement deux diviseurs entiers 
distincts. 


Démonstration. En deux parties. 


(1) 


= Soit un élément premier p € N. Il y à trois possibilités : p = 0, p = 1 et p > 1. 
Le nombre p = 0 n’est pas premier parce qu’il est nul. Le nombre p = 1 n’est pas premier 
parce qu'il est inversible. Donc nous savons que si p est premier, alors p > 1. 


Un élément p > 1 dans N a toujours au moins deux diviseurs distincts : 1 et p. Soit un 
diviseur k de p. Il existe / € IN tel que p = kl. Vu que p est premier et divise le produit kl, il 
divise k ou !. Disons que p divise k. De cette façon p divise k et k divise p. 


Il existe donc n € N tel que k = np. En y substituant p = kl, on trouve k = np = nkl. En 
simplifiant par k, il vient 

1 = ni, (1.312) 
ce qui prouve que n = | = 1 et donc que k = p et donc que p n’a pas d’autres diviseurs que 
1 et p. 
= Nous supposons que p € N ait exactement deux diviseurs entiers distincts. Nous vérifions 
que p vérifie les trois conditions de la définition 1.184. 
(2a) p 0 parce que 0 à nettement plus que deux diviseurs distincts. 
(2b) p £ 1 parce que 1 à exactement un diviseur. Donc p n’est pas inversible dans N. 


(2c) Soit p admettant exactement deux diviseurs distincts. Soit p divisant le produit ab’ pour 
certains a et b’ dans N. Nous supposons que p ne divise pas a, et nous allons prouver 
que p divise b’ en supposant d’abord que p ne divise pas b/. 


(2c.iüi) Un ensemble Pour cela nous posons 
E = {xe N tel que p | ax,p { x}. (1.313) 
Nous posons b = min(Æ). Nous avons pour hypothèse que E est non vide; en 


particulier 0 < b. 


(2c.iüi) b<p On vérifie que sip+kEe E alors k€ E. Donc b ne peut pas être plus grand 
que p. Vu que p lui-même n’est pas dans Æ, nous avons b < p. 


(2c.iüi) Division euclidienne Nous effectuons la division euclidienne du théorème 1.215 : 


p=mb+r. (1.314) 


En multipliant par a, ar = ap — mab. Vu que ab est un multiple de p ap — mab est 
un multiple de p. En particulier ar est divisible en p. 


(2c.iüi) La contradiction Nous avons donc r € E, alors que r < b. Impossible. 
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PROPooWMNPooZdvOBt 
Proposition 1.217 ([18]). 
Dans un anneau intègre ® tout élément premier est irréductible "*. 


Démonstration. Soit p, un élément premier dans un anneau intègre À. 


(1) p n’est pas inversible Cela fait partie de la définition d’un élément premier. 


(2) p n’est pas un produit d’inversibles Soient a, b € À tels que p = ab. Par le point (3) de 
la définition 1.184, p divise soit a soit b. Supposons que p divise a. Alors il existe x € À tel 
que a = pt. En remettant dans p = ab nous avons : 


p = prb. de) 


Mais l’anneau est intègre et permet donc des simplifications par tout élément non nul. La 
relation 1.315 donne donc 


1 = xb, (1.316) 


ce qui signifie que b est inversible. 


Un travail similaire montre que a est inversible si p divise b. 


Exemple 1.218. 
Si nous avons l'égalité 7 = ab dans Z, alors soit a soit b vaut 1. Mettons a = 1. Dans ce cas, b = 7 
et n’est donc pas inversible. A 


Sur un anneau non intègre, la notion d’élément premier n’est pas aussi intéressante que sur un 


anneau intègre. Par exemple la proposition 1.217 devient fausse. 
EX00EIUE00CZCPMC 


Exemple 1.219. 
Soit l’anneau Z?. L'élément (1,0) est premier mais pas irréductible. 


(1) (1,0) est premier L'élément (1,0) est non nul; ça c’est pas cher. Pour qu’il soit inversible, 
il faudrait (1,0)(x,y) = (1,1). Entre autres, 0 x y = 1, ce qui est impossible. Donc il n’est 
pas inversible. 


Supposons que (1,0) divise le produit (a,b)(c,d) = (ac,bd). Alors il existe (x,y) tel que 
(1,0)(x,y) = (ac, bd). Cela signifie que x = ac et 0 x y = bd. En particulier, soit b = 0 soit 
d = 0. Si b = 0, nous avons (a,b) = (a, 0) et effectivement, (1,0) le divise. 

(2) (1,0) n’est pas irréductible Nous avons (1,0) = (1,0)(1,0). Donc l'élément (1,0) est le 
produit de deux éléments non inversibles. 


A 


1.9 Anneau principal et idéal premier 

DEFooMZRKooBPLAWH 
Définition 1.220. 
Un idéal" I dans À est principal à gauche si il existe a € I tel que I = Aa. Il est principal à 
droite si il existe a € I tel que I = aA. Nous disons qu'il est principal si il est principal à gauche 


et à droîte. 
DEFooGW0OZooXzU1hK 


Définition 1.221. 
Un anneau est principal si 


(1) ü est commutatif et intègre 


(2) tous ses idéaux sont principaux". 


73. Si pas intègre, voir l'exemple 1.219. 
74. Toutes les définitions dans le thème 6. 
75. Idéal, définition 1.178. 

76. Définition 1.220. 


1.9. ANNEAU PRINCIPAL ET IDÉAL PREMIER 189 


Souvent pour prouver qu’un anneau est principal, nous prouvons qu’il est euclidien (défini- 
tion 1.244) et nous utilisons la proposition 1.247 qui dit qu’un anneau euclidien est principal. 
Une manière de prouver qu’un anneau n’est pas principal est de prouver qu'il n’est pas factoriel, 


théorème 3.77. 
DEFooAQSZooVhvQWv 


Définition 1.222. 
Nous disons qu’un idéal I dans À est premier si I est strictement inclus dans À et si pour tout 


a,bE À tels que ab € I nous avons ae Tl'oube I. 
LEMooYRPBooYxXXsi 


Lemme 1.223. 
L'idéal nul (réduit à {0}) est premier si et seulement si À est intègre. 
Démonstration. En deux sens. 


(1) Si {0} est premier Alors À # {0} parce que 7 = {0} est propre (définition d’idéal premier). 


De plus, si ab = 0, alors ab € 1 qui est un idéal premier. Donc soit a soit b est dans 1, 
c’est-à-dire que soit a soit b est nul. Donc À est intègre. 


(2) Si À est intègre Alors À Z {0} et l'idéal 7 = {0} est strictement inclus dans À. Si abe I, 
alors ab = 0 et comme À est intègre, soit a soit b est nul, c’est-à-dire appartient à J. 


PROPooRUQKoo!IfbnQXx 

Proposition 1.224 ([44)). 
Soit un anneau commutatif"" et un idéal I dans À. ITEMooUGBTo00GrnWl 
(1) I est un idéal premier © si et seulement si A/I est un anneau intègre. ITEMooGLXSooU INR 
(2) I est un idéal maximal” si et seulement si A/I est un corps. ITEMooTFFQooOUa jFu 


(3) Tout idéal maximal propre est premier. 


Démonstration. En plein d'étapes. 


(1) (1), =  Évacuons le cas trivial pour être sûr. Si Z = {0} alors À est intègre par le lemme 
1.223. Donc A/I = A/{0} = À est intègre également. 
Soient a,b € A tels que [a][b] = [0]. Donc [ab] = [0], c'est-à-dire ab € I. Puisque Z est un 
idéal premier nous avons a € 1 ou bE I, c’est-à-dire [a] = 0 ou [b] = 0; nous en déduisons 
que A/T est un anneau intègre. 


(2) (), = 
Soit ab € I. Alors [ab] = 0, ce qui signifie que [a][b] = 0 donc que [a] = 0 ou que [b] = 0 
parce que À/T est intègre. Mais la condition [a] = 0 signifie a € I, et [b] = 0 signifie be I. 
Nous avons donc prouvé que soit a soit b est dans 1, c’est-à-dire que Z est premier. 


(3) (2), = 

Nous devons montrer que tout élément non nul de A/I est inversible. Un élément non nul de 
A/T est [x] avec x € A\]. 

Nous considérons J = Ax + 1, qui est un idéal parce que pour tout a € À, aAx+al e Ax+lI. 
Mais comme 1 est maximal, J = 1 ou J = A. 


Si J = 1, nous aurions que pour tout a € À et pour tout i € 1, ax+ie I. En particulier pour 
a = 1 et à = 0 nous aurions x € 1, ce qui est contraire à l'hypothèse faite sur x. 

Donc J = À. En particulier, 1 € J, c’est-à-dire qu’il existe a € A et i € I tels que ax +i = 1. 
En passant aux classes, [ax] = 1, c’est-à-dire [a/[x] = 1 qui signifie que [a] est un inverse de 
[x] dans A/I. 


Nous avons prouvé que A/I est un corps. 


77. Tous les anneaux du Frido sont commutatifs 
78. Idéal premier, définition 1.222. 
79. Idéal maximal, définition 1.212 
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(4) (2), = Sixe A\, il faut prouver que tout idéal contenant J et x est A. 
Un idéal contenant 1 et x doit contenir l'idéal J = Ax +1. Comme x é 1, nous avons [x] # 0 
dans A/I. Donc [x] est inversible et il existe a € À tel que [ax] = [1]. C'est-à-dire que 
ax — 1E 1. Nous avons alors 
1=ax+(1-ax). (1.317) 


———/ 
el 


C'est-à-dire que 1 € Ax + I et donc Ax + I = À. 


Enfin nous prouvons que tout idéal maximal propre est premier. 

Si I est maximal, A/I est un corps par le point (2), et vu que I est propre, le corps A/T n’est 
pas réduit à {0}. Donc le lemme 1.194 dit que A/I est un anneau intègre. Le point (1) dit alors 
que J est un idéal premier. 


Remarque 1.225. 
Puisqu’un corps peut être réduit à {0}, dans (2), l’idéal peut être A. Mais pas dans (3), parce 


qu'un idéal premier est propre, ça fait partie de la définition 1.222. 
PROPooHABIooBZZQM; 


Proposition 1.226 ([19]). 
Si À est un anneau commutatif intègre, alors un idéal T dans A est premier si et seulement si A/T 
est intègre. 


Démonstration. Supposons que 7 soit un idéal premier. Si [a], [b] € A/T sont tels que [a][b] = 0, 
alors [ab] = 0, ce qui signifie que ab € I. Mais alors, puisque J est premier, soit a soit b est dans 1. 
Cela signifie que soit [a] soit [b] est nul dans 4/1. Cela prouve que A/I est un anneau intègre. 
Dans l’autre sens, nous supposons que A/I est intègre. Cela implique immédiatement que 1 Æ A 
parce que A/A n’est pas un anneau intègre (tout le monde est évidemment diviseur de zéro). 
Soient donc a,b € À tels que ab € I. Alors [a][b] = [ab] = 0 dans A/I, mais comme A/I est 


intègre, cela implique que soit [a] soit [b] est nul. Autrement dit, soit a soit b est dans J. 
PROPooSGLNooBYKNyo 


Proposition 1.227. 
Dans un idéal principal, les conditions suivantes sont équivalentes : 


(1) L'élément p est premier. 
(2) L'élément p est irréductible. 
(3) L'idéal pA est un idéal maximal. 


1.10 Anneau intègre 
SECAnneauxIntegres 


1.10.1 Sous-groupes de (Z, +) D a ain 
ropSsgpZestn 


Proposition 1.228 (liste des sous groupes de Z). 
À propos de sous-groupes de Z. 


(1) Une partie H du groupe (Z, +) est un sous-groupe si et seulement si il existe n € N tel que 
H = nZ. ITEMooOWNZooUsYRok 
(2) Si H est un sous-groupe de (Z, +), il existe un unique n tel que H = nZ. 


Démonstration. Soit H ZÆ {0} un sous-groupe de Z. L'ensemble H À N* contient un élément 
minimum que nous notons n. Nous avons certainement nZ € H parce que H est un groupe (donc 
n+net —n sont dans Æ dès que n est dans A). Nous devons prouver que H € nZ. 

Si x € H, par le théorème de division euclidienne 1.215, il existe q € Z et r € N, uniques, tels 
que x = ng+ret 0 <7r < n. Nous savons déjà que ng € H, donc r = x — nq € H. Le nombre r est 
donc un élément de H strictement plus petit que n. Mais nous avions décidé que n serait le plus 
petit élément de H n N*. Par conséquent r = 0 et x = nq € nZ. 

En ce qui concerne lunicité, supposons que nZ = mZ. Le nombre n divise m (parce que 
m € mZ € nZ) et le nombre m divise n parce que n € mZ. Par conséquent n = m. 
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1.10.2 Théorème de Bézout 


Théorème 1.229 (Théorème de Bézout [50], thème 3). 
Deux entiers non nuls a,be Z* sont premiers entre eux si et seulement si il existe u, v € Z tels que 


ThoBuNjam 


au + bu = 1 (1.318) 


Démonstration. Soit d = pgcd(a, b) et des nombres u, v tels que au + bu = 1. Le PGCD d divise à 
la fois a et b, et donc divise au + bu. Nous en déduisons que d divise 1 et est par conséquent égal 
à 1. 

Nous supposons maintenant que pgcd(a, b) = 1 et nous considérons l’ensemble 


E = {au + bv tel que u,v € Z} n N*. (1.319) 


C'est-à-dire l’ensemble des nombres strictement positifs pouvant s’écrire sous la forme au + bu. Cet 
ensemble est non vide parce qu’il contient par exemple soit a soit —a. Soit m le plus petit élément 


de E et écrivons 
m = au + bu. FPS 50) 


Par le théorème de division euclidienne %! (avec a et m), il existe des entiers uniques q et r tels que 


a=mq+r (1.321) 
avec 0 < r < m. En remplaçant m par sa valeur (1.320), a = (au + bu1)q +r et 
r = a(1 — u1q) — bug, (1.322) 


c’est-à-dire que r € Za + Zb en même temps que 0 < r < m. Si r était strictement positif, il serait 
dans Æ. Mais cela est impossible par minimalité de m. Donc r = 0 et a est divisible par m. 

De la même façon nous prouvons que b est divisible par m. Puisque m divise à la fois a et b 
nous avons m = 1. 


Une généralisation de Bézout 1.229 à plus de 2 variables. 
PROPooWSMTooMdfqse 


Proposition 1.230. 
Si {ai}i=1,..n sont des entiers tels que pgcd(ai,...,an) = 1, alors il existe des entiers {ui}i=1,..N 
tels que 
D œiw = 1. (1.323) 
t 


CorgEMtL; 
Corolaire 1.231. 
Soient p et q deux entiers premiers entre eux. Alors 


pZ + qZ = 7; (1.324) 
en particulier, pour tout x € 7%, il existe ur, vx entiers tels que UxP + Ur = x. 


Démonstration. Soit x € Z. Le théorème de Bézout nous donne k et { tels que kp + lq = 1. Alors, 
(zk)p + (xl)q = &. 


Notons que l’application pZ + qZ vers Z n’est évidemment pas injective : les u, et v, ne sont 


pas uniques à x fixé, car si ap + Bq = x, alors (a + kq)p + (B — kp)q = x pour tout ke Z. 
CORooLINXooB1UKPG 


Corolaire 1.232. 
Les quotients de Z sont Z/nZ. 


80. Il y a une super application ici : https://perso.univ-rennes1.fr/matthieu.romagny/agreg/dvt/mauvais_ 
prix.pdf. 
81. Théorème 1.215. 
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Démonstration. Tous les idéaux de Z sont de la forme nZ. En effet en vertu de la proposition 1.228, 
les seuls sous-groupes de Z (en tant que groupe additif) sont les nZ. Tous les idéaux sont donc 
de cette forme. De plus les nZ sont effectivement tous des idéaux *? : si a € nZ et si k e Z alors 
ak € nZ. 


PropZpintssiprempUzn 
Proposition 1.233. 
Soient n > 2 un entier et D: Z — Z/nZ la surjection canonique. Nous noterons à = (a). Alors 
l’ensemble des inversibles de Z/nZ est donné par 


U(Z/nZ) = (Ph) = {x tel que 0 < x < n tel que pgcd(x,n) = 1}. (1.325) 


où Pn est l’ensemble Ph = {x € {0,...,n —1} tel que pgcd(x,n) = 1}. 
De plus, 
Card (U(Z/nZ)) = p(n). (1.326) 


3 u,ve Z tels que ur + un — 


Démonstration. Soit 0 < x < n tel que pgcd(x,n) = 1. Il existe donc ° 
1. En passant aux classes, 


ur = 1, (1.327) 


donc & est l’inverse de 7. Cela prouve que 6(P,) € U(Z/nZ). 
Nous prouvons maintenant l’inclusion inverse. Soient 7 et 7 inverses l’un de l’autre : 77 = 1. Il 
existe donc q € Z tel que xy — qgn = 1, ce qui prouve °* que pgcd(x,n) = 1. 


LEMooZSMEooUmSXWZ 
Lemme 1.234. 
Un corps® est un anneau intègre. 


Démonstration. En effet, soient un corps K et deux éléments x,y € K tels que xy = 0. Si y est 
inversible, alors nous pouvons multiplier par y! pour trouver x = 0. Cela prouve que K est un 
anneau intègre. 


Exemple 1.235. 
L'anneau Z/6Z n’est pas intègre parce que 3 : 2 = 0 alors que ni 3 ni 2 ne sont nuls. A 


Nous verrons au théorème 3.101 que l’anneau À est intègre si et seulement si A[X |] est intègre. 
8 8 
CorZnInternprem 


Corolaire 1.236. 
L'anneau Z/nZ est intègre si et seulement si n est premier. 


Démonstration. Supposons que n soit premier. La proposition 1.233 donne les inversibles de Z/nZ 
par 
U(Z/nZ) = {7 tel que 0 < x < n tel que pgcd(x,n) = 1}. (1.328) 


Mais comme n est premier, pgcd(x,n) = 1 pour tout x, et donc tous les éléments de Z/nZ sont 
inversibles. Donc Z/nZ est intègre. 
Si n n’est pas premier, alors n = pq avec 1 < p < q < n. Alors 


[pln[qln = [pqln = [0]n- (1.329) 


Donc lorsque n n’est pas premier, l’anneau Z/nZ possède des diviseurs de zéro et n’est alors pas 
intègre. 


PropomgqcGe 
Proposition 1.237 (Thème 18, [1]). 
Soit À un anneau principal qui n’est pas un corps. Pour un idéal propre I de À, les conditions 
suivantes sont équivalentes : 


82. Définition 1.178. 

83. Théorème de Bézout 1.229 

84. À nouveau avec le Théorème de Bézout. 
85. Définition 1.202. 

86. Définition 1.221. 
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ITEMooNOVFooEHtcwE 
. É . 87 : 
(1) Test un idéal maximal®" ; ITEMooMQWVooNocVEU 
17 . 88 : 
(2) T est un idéal premier non nul” ; ITEMoo JBXCo0EISNul 


(3) il existe p irréductible*” dans A tel que I = (p). 


Démonstration. En plusieurs implications. 


(1) (1) implique (2) Par hypothèse, I est un idéal propre, de plus il n’est pas égal à {0}, parce 


que lorsque À et {0} sont les seuls idéaux, nous avons un corps (proposition 1.211). Étant 
donné que 7 est un idéal maximal, le quotient A/I est un corps par la proposition 1.213. 

Soient maintenant, pour entrer dans le vif du sujet, des éléments a, be À tels que ab € I. Dans 
le corps A/1 nous avons [ab] = 0, et par définition du produit dans le quotient, [a][b] = 0. 
Par intégrité de l’anneau A/I (un corps est un anneau intègre, lemme 1.234) nous avons soit 
[a] = 0, soit [b] = 0, soit les deux en même temps. Dans tous les cas, soit a soit b est dans J. 


(2) (2) implique (3) Maintenant J est un idéal premier non réduit à {0}. Puisque À est un 

anneau principal, il existe x € À tel que I = (x). Nous devons prouver que x peut être 
choisi irréductible ; et nous allons faire plus : nous allons prouver que x ne peut être que 
irréductible °°, 
Supposons que æ ne soit pas irréductible. Alors il existe a,b € À non inversibles tels que 
x = ab. Si a € (x) alors il existe k € À tel que a = xk, et en particulier, a = abk, c’est-à-dire 
1 = bk (parce que À est principal et donc intègre). Cela signifie que b est inversible alors que 
nous avions dit qu’il ne l’était pas. Nous en déduisons que a n’est pas dans (x). On montre 
de manière similaire que b n’est pas dans (x) non plus. 


Nous nous retrouvons donc avec à, b € À tel que ab € 1 sans que ni a ni b ne soient dans 1. 
Cela contredit le fait que 7 soit un idéal premier. En conclusion, x est irréductible. 


(3) (3) implique (1) Nous avons 1 = (p) avec p irréductible dans À. Supposons que J est un 
idéal différent de A contenant 7. Comme À est principal, il existe y € À tel que J = (y). En 
particulier p € J, donc p = ay pour un certain à € À. Mais p est irréductible, donc soit a 
est inversible, soit y est inversible. Si y est inversible, alors J = À, ce qui est exclu. Si a est 
inversible, alors (y) = (p), et I = J. 


1.238. 

Dans la proposition 1.237, l'hypothèse d’idéal propre est importante. En effet dans le cas 1 = À, 
nous avons évidemment que Z est un idéal maximum. Mais À n’est d’abord pas un idéal premier 
parce qu’un idéal premier doit être strictement inclus dans l’anneau. Et ensuite, À est en général 


loin d’être garanti d’être égal à (p) pour un de ses éléments p. 
PropoTMMXCx 


Proposition 1.239. 
Soit À un anneau principal, et soit p € À un élément irréductible. Alors 


(1) (p) est un idéal maximum. ITEMooKP JQooWuPZXS 
(2) A/(p) est un corps. 


Démonstration. Nous notons 7 = (p). Soit un idéal J contenant 1. Comme À est principal, J est 
monogène : J = (q). Mais comme p est dans 7 qui est dans J, il existe a € À tel que p = qa. 

Puisque p est irréductible, soit q, soit a est inversible. Si q est inversible, alors J = A. Si a est 
inversible, alors nous avons p = qa, donc q = pa |, ce qui signifie que q € (p) et donc que J = I. 
Cela prouve que (p) est un idéal maximum. 


Le fait que A/(p) soit un corps est maintenant la proposition 1.213. 


87. Définition 1.212. 
88. Définition 1.222. 
89. Définition 1.185. 
90. ça me semble un peu trop facile. Lisez attentivement, et écrivez-moi pour dire si vous êtes d'accord ou pas. 
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Exemple 1.240. 
L’anneau Z est principal parce qu’il est intègre et que ses seuls idéaux sont les nZ qui sont 


principaux : nZ est engendré par n. A 
EXooCJRPooYkWdyr 


Exemple 1.241 (Les idéaux de Z/nZ). 
Les idéaux de Z/nZ sont principaux, mais l’anneau Z/nZ n’est pas principal lorsque n n’est pas 
premier. Nous allons voir ça. 


(1) Les idéaux de Z/nZ sont principaux Soit un idéal S dans Z/nZ. Nous considérons la 
projection canonique 6: Z — Z/n7Z. La proposition 1.210 dit que S = @(J) où J est un idéal 
de Z contenant nZ. Mais le corolaire 1.232 nous dit qu'alors J = mZ pour un certain m. 
Pour que mZ contienne nZ, il faut que m divise n. 


Bref, S = (mZ) avec m | n. Nous montrons maintenant que $ est engendré par [ml|». 
D'abord, l'élément [m], est bien dans (mZ). Ensuite un élément de d(mZ) est de la forme 


Lemlr = kmln € ([mln). (1.330) 


Donc S € ([ml,). Et l'inclusion dans l’autre sens est tout aussi immédiate : un élément de 
([ml:) est de la forme 
k[mlh = [km]s = 4(km) € p(mZ). (1.331) 


(2) Si n n’est pas premier, Z/nZ n’est pas principal Le fait est que lorsque n n’est pas 
premier, Z/nZ n’est pas intègre (corolaire 1.236). 


(3) Moralité Un anneau comme Z/6Z est un anneau dont tous les idéaux sont principaux, 
mais qui n’est pas principal. 


À 


Exemple 1.242. 
Nous verrons dans la proposition 26.68 que l’anneau des fonctions holomorphes sur un compact de 


C est principal. VAN 
ThofPXwiM 


Théorème 1.243. 
Si À est un anneau principal et si p et q sont premiers entre eux dans À, alors on a l’isomorphisme 
d’anneaux 


A/pqA = A/pA x A/qA. (1.332) 


1.11 Anneau euclidien 
DefAXitWRL 


Définition 1.244 (Wikipédia). 

Soit À un anneau intègre °!. Un stathme euclidien sur À est une application a: A\{0} — N tel 

que ITEMooLVJAooLpjgEz 
(1) Va,be A\{0}, à existe q,r € À tel que 


a=qgb+r (1.333) 


et a(r) < a(b). 
(2) Pour tout a,be A\{0}, a(b) < a(ab). 


Un anneau est euclidien si il accepte un stathme euclidien. 


Le stathme est la fonction qui donne le « degré » à utiliser dans la division euclidienne. La 


contrainte est que le degré du reste soit plus petit que le degré du dividende. 
LEMooFUSTooDCcBDb 


Lemme 1.245. 
L'ensemble Z avec les opérations usuelles est un anneau intègre ®. 


91. Défnition 1.193. 
92. Anneau intègre, définition 1.193. 
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ExwqlCwvV 
Exemple 1.246. 
Le stathme de N pour la division euclidienne usuelle est a(n) = n. Si a,b € N nous écrivons 


a=gb+r (1.334) 


où q est l’entier le plus proche inférieur à a/b (on veut que le reste soit positif) et r = a — gb. Nous 
avons donc : 
r—b=a—b(a+1)<a—br =0, (1.335) 


ce qui montre que r < b. A 


Cet exemple ne fonctionne pas avec Z au lieu de N parce que le stathme doit avoir des valeurs 
dans N. Cela ne veut cependant pas dire qu’il n’existe pas de stathme sur Z ; cela veut seulement 
dire que a(x) = x ne fonctionne pas. 

Propkllxnv 
Proposition 1.247 ([51]). 
Tout anneau euclidien® est principal”*. 


Démonstration. Soit À un anneau euclidien et a un stathme sur À. Nous considérons un idéal 1 
non nul de À. Nous devons montrer que 1 est généré par un élément. En l’occurrence nous allons 
montrer qu’un élément a € 1\{0} qui minimise a(a) va générer * 1. 

Soit x € I. Par construction, il existe qg,r € À tels que x = ag + r avec r = 0 ou a(r) < æ(a). 
Étant donné que x,ael,rel.Sir #0, alors r contredirait la minimalité de a(a). Donc r =0 et 
z = aq, Ce qui signifie que 1 est principal. 


PROPooPJGLooQSrJTU 
Proposition 1.248. 
L'’anneau Z est principal et euclidien. 


Démonstration. Nous allons seulement montrer que a(x) = |x| est un stathme euclidien. Ainsi Z 
sera euclidien et donc principal par la proposition 1.247. 

D'abord Z est intègre, c’est le lemme 1.245. 

La condition a(b) < (ab) est immédiate : |a| < |ab| pour tout a, b € Z. 

Soient maintenant a, b € Z. Nous définissons qo, ro € NN tels que 


lal = gold] + ro (1.336) 


avec ro < |b|. Cela existe parce que a(x) = x est un stathme sur N par l'exemple 1.246. 
(1) Sia>0etb>0 
Alors a = qob + ro et le couple (qo, ro) vérifie les conditions de la définition 1.244(1). 
(2) Si a > 0 et b<0 
Alors a = —qob + ro, et le couple (—4o, ro) vérifie les conditions de la définition 1.244(1). 


(3) Sia<0etb>0 Alors a = —qob — ro, et le couple (—4o, —ro) vérifie les conditions de la 
définition 1.244(1) parce que 


a(—ro) = ro < [b] = a(b). (1.337) 


(4) Sia<0et b<O Alors a = qob — ro, et le couple (40, —ro) vérifie les conditions de la 
définition 1.244(1). 


Nous venons de voir que Z est principal; le lemme suivant nous dit que Z[X] n’est lui, pas 
principal. 


93. Euclidien, définition 1.244. 
94. Principal, définition 1.220 
95. Un tel élément existe... 
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LEMooDJSUooJWyxCL 
Lemme 1.249 ([52]). 
Si À est un anneau intègre Ÿ qui n’est pas un corps, alors A[X] n’est pas principal. 


Démonstration. Soit un élément non nul a € À. 


(1) Un idéal principal contenant «a et X est A[X] 


Soit (P) un idéal principal contenant a et X. Puisque a € (P), il existe Q tel que a = QP. 
Donc P divise a dans Z[X]. L'égalité des degrés indique que P est un polynôme constant, 
c’est-à-dire en réalité un élément de À. Soit P = k€ A. 

Comme P divise X, nous avons aussi X = kQ pour un certain Q € Z[X|. L'égalité des degrés 
dit qu'il existe k’ e À tel que Q = k&’X et donc Q = k!'X = k'kQ, ce qui implique que kk! = 1. 
L'idéal engendré par k contient donc en particulier kk' = 1 et donc contient A[X] en entier : 


1=k&ke k&'(P) = (P). (1.338) 
(2) Si (a, X) = A[X] alors a est inversible 


Si (a, X) = A[X |, en particulier, 1 € (a, X), ce qui signifie qu’il existe des polynômes U, V € 
A[X] tels que 


1=UX + Va. (1.339) 


Nous évaluons cette égalité en 0 : comme (UX)(0) = 0, nous avons 1 = V(0)a, ce qui signifie 
que V(0) est un inverse de À. Donc a est inversible. 


(3) Si a n’est pas inversible alors (a, À) n’est pas principal 


Si (a, X) était principal, alors nous aurions, par ce qui est dit plus haut, (a, X) = A[X|. 
Mais cette dernière égalité impliquerait que a soit inversible. 
En conclusion, si À n’est pas un corps, il possède un élément ni nul ni inversible. Dans ce cas, 
l'idéal (a, X) n’est pas principal dans A[X] et nous en déduisons que A[X] n’est pas un anneau 
principal. 


Nous verrons dans le lemme 3.107 que si K est un corps, alors K[X] est principal. 


1.12 Le groupe et anneau des entiers 


Certes (Z, +) est un groupe mais en ajoutant la multiplication, (Z,+, x) devient un anneau °?. 


1.12.1 PGCD, PPCM et Bézout 


Puisque Z est un anneau intègre, nous avons la définition 1.182 de pgcd et de ppem. 
PROPooAVRGooUfhjwF 


Proposition 1.250 (PPCM et PGCD). 
Soient p,q € Z*. 


(1) Le pgcd de p et q est le plus grand diviseur commun de p et q. 
(2) Le ppcm de p et q est leur plus petit multiple commun. 


Démonstration. Démontrons le premier point. Notons Ô le pgcd de p et q. Si d est un diviseur 
commun de p et q, alors d divise 6. Dans Z, d | Ô implique d < Ô (proposition 1.109). 


Lemme 1.251. 
Soient p,q € Z*. Les entiers ppem(p, q) et pgcd(p, q) fournissent les isomorphismes de groupes 
suivants : 


pZ n qZ = ppem(p, q)Z (1.340a) 
pZ + qZ = pgcd(p, q)Z. (1.340b) 


96. Définition 1.193. 
97. Définition 1.41. 
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DEFooXSPFooPumQSy 
Définition 1.252. 
Nous disons que deux éléments d’un anneau principal sont premiers entre eux si leurs divi- 
seurs communs sont inversibles. 


Vu que Z est un anneau principal (proposition 1.248), la définition 1.252 d'éléments premiers 
entre eux s'applique. 


LEMooLKLTooXUdsgB 
Lemme 1.253. 
Dans Z, les nombres p et q sont premiers entre eux si et seulement si pgcd(p, q) = 1. 
DefZHRXooNeWIcB 


Définition 1.254. 
Si nous avons un ensemble d’entiers a;, nous disons qu'ils sont premiers dans leur ensemble si 
1 est le PGCD de tous les a; ensemble. 


Les nombres 2, 4 et 7 ne sont pas premiers deux à deux (à cause de 2 et 4), mais ils sont 
premiers dans leur ensemble parce qu’il n’y a pas de diviseurs communs plus grand que 1, au 
triplet (2,4,7). 

La proposition suivante établit que si x est assez grand, alors il peut même être écrit comme 
une combinaison de p et q à coefficients positifs. Elle sera utilisée pour démontrer que les états 
apériodiques d’une chaine de Markov peuvent être atteints à tout moment (assez grand), voir la 


définition 38.33 et ce qui suit. 
PropLAbRSE 


Proposition 1.255. 
Soient a et b deux éléments de N premiers entre eux. Il existe N > 0 tel que tout x > N appartient 
à aN + bN. 


Démonstration. Soient a et b, premiers entre eux, et x € IN. Disons tout de suite, pour éviter les 
cas triviaux et pénibles, que x, a et b sont strictement positifs. 


(1) Une décomposition pour x 


On applique le théorème 1.215 de division euclidienne à x et a+b : il existe des entiers pz,Tx, 
uniques, tels que 


x = (px — 1)(a + bd) +rx (1.341a) 
D<re <a+b. (1.341b) 


En d’autres termes, p,(a + b) est le premier multiple de a + b supérieur ou égal à x. De plus, 
px est strictement positif car x l’est. Il existe alors des entiers u et v tels que 


E XYSZ Pui 
ua + vb = py(a +b) — x ne. F349) 
par le corolaire 1.231. Ainsi, x peut s’écrire 


x = (px — u)a + (px — v)b. (1.343) 


(2) Des maximums 


Il s’agit maintenant de savoir si nous pouvons être assuré d’avoir p, > u et px > v dès que 
x est assez grand. Pour cela, grâce au corolaire 1.231, nous considérons les nombres u; et v; 
définis par 

ua + vb = À (1.344) 


pouri=1,...,a+b. Nous posons u* = max{u;}, v* = max{vw;}, et p* = max{u*,v*}. Nous 
posons alors N = p*(a + b), et considérons x > N. 


98. Anneau principal, définition 1.221. 
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Nouvelle décomposition pour x 


& = (pr — ux)a + (px — x) Da 


pour un certain k. Cela demande uga + vb = ua + vb = p;(a + b) — x par l’équation (1.342). 
Vu que p;(a+b)—x > 0, les nombres ux et uv, existent : il suffit de prendre k = p,(a+b) — x. 


Nous voulons écrire 


Conclusion 


Avec tous ces choix, nous avons d’abord x > p*(a + b) et donc 
z = (px —1)(a+b) +rx > p'(a +b), (1.346) 


ce qui donne 
(pe — 1)(a + b) > p*(a+b) — re > (p* —1)(a +b). (1.347) 


ou encore p; > p*. Nous avons finalement 
rep =Ù Us (1.348) 


et 
DE D EU > (1.349) 


De ce fait, la décomposition (1.345) est celle que nous voulions. 


1.256. 

Une méthode pour obtenir les entiers naturels u et v qui permettent la décomposition + = au + bv 
est d’abord de choisir uo et vo tels que auo et buo soient les plus proches possibles de x/2, puis de 
décomposer le nombre (relativement petit) x — auo — bvo en aux + bu. Deux nombres u et v qui 
fonctionnent sont alors u = uo + u1 et U = vo + v1. 


Exemple 1.257. 
Écrivons 1000 = uw : 7 + v : 5 avec u,v € N. D'abord 72 : 7 = 504 et 100 + 5 = 500. Nous avons 


donc 


1004 = 72 : 7 +100 : 5. (1.350) 


Ensuite 4 = 25 — 21 = -3 - 7 +5 - 5. Au final, 


1000 = 75 + 7 +95 : 5. (1.351) 


À 


1.13  Sous-groupe normal 


propGroupeNormal 

Proposition 1.258. 

Soit N un sous-groupe de G. Les propriétés suivantes sont équivalentes : ITEMooDYEUooOuKEqQ 
(1) N est normal” dans G. ITEMooPYTEooZhvrUa 
(2) N est une union de classes de conjugaison 0 de G, ITEMoo JWTLooBRmr iQ 
(3) gNg7' € N pour tout g € G, ITEMooVRZIooAorhRY 
(4) gNg7} = N pour tout ge G, ITEMooJGUDooYshOZa 
(5) gN = Ng pour tout ge G, ITEMooMRYRooZifCCe 


(6) Le normalisateur !°! de N est G : N&(N) = G. 


99. Définition 1.168. 
100. Définition 1.164. 
101. Définition 1.167. 


1.15. 
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Démonstration. En plusieurs parties. 


(1) 
(2) 


(7) 


(1) implique (3) C’est la définition de sous-groupe normal. 


(3) implique (4) Soit ge G. Nous avons gNg-! € N, mais aussi (en appliquant l’hypo- 


thèse à g_!) g_INg € N. En combinant nous avons 

Ne g(g INg)g  cgNg !. (1.352) 
Nous avons l’inclusion dans les deux sens. Donc l'égalité. 
(4) implique (5) Soit g € G. Un élément général de gN est de la forme gn avec n € N. 


Nous devons trouver un n’ € N tel que gn = n/g. En posant n/ = gng |! nous avons 


n' = gng ‘egNg CN. (1.353) 


Il est immédiat de prouver que gn = n’g. Cela prouve que gN € N3. 


Le même raisonnement donne Ng € gN. 


1 1 


(5) implique (3) Un élément de gNg= est a = gng_ avec n € N. Nous devons prouver 
que a € N. Puisque gn € gN, par hypothèse il existe n’ tel que gn = n’g. En remplaçant 
dans la définition de a, 


a= gng =ngg !=nEe N. (1.354) 
(5) implique (2) Pour chaque a € G nous notons C, la classe de conjugaison de a dans 
. Ca = {gag ! tel que ge G}. ONOESSS | 
Comme a € C, (prendre g = e dans (1.355).) nous avons forcément 
Ne U Ch: (1.356) 
neN 


Prouvons maintenant l'inclusion inverse. Nous avons déjà prouvé que (5) implique (3). Donc 
sine N, alors gng ! e N. Nous avons alors 


Cn = {gng ! tel que geG}c N. (1.357) 
Donc il est vrai que N = {J,:v Cn. 


(2) implique (1) Nous supposons que N € G est un sous-groupe de la forme 


N=|{JC (1.358) 


a€el 


où JL est une partie de G. Nous devons montrer que pour tout g € G et pour tout n € N nous 
avons gng_! e N. Puisque n € N, il existe a € I tel que n € C, et donc il existe k e G tel 
que n = kak-!. Nous avons donc 


gng”! = g(kak- lg"! = (gkja(gk) te CG EN. (1.359) 


Le lecteur attentif aura remarqué l’utilisation de l’axiome du choix. La prudence l’incitera à 
ne pas le faire remarquer au jury. 


(6) si et seulement si (5) C’est la définition du normalisateur. 


Définition 1.259. 
SoitgeGetneZ. Nous définissons g* par 


(1) g°=e et g" = 9g 
(2) sin < 0, nous posons g" = (g7 


NT sÿ n est positif. 


ni 


L'ordre d’un groupe et l’ordre d’un élément d’un groupe sont deux choses différentes. 


DEFooKWBCooMImpCP 


Définition 1.260 (Ordre d’un groupe). 
Soit un groupe G. 


(1) Si G est un ensemble fini, l’ordre de G est son cardinal!?, et nous le notons |G|. 


102. Définition 1.122. 
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(2) Si l’ensemble G est infini, nous disons que |G|] = © et qu'il est d’ordre infini. 


Oui : nous pourrions simplement toujours dire « cardinalité » et écrire Card(G). Au lieu de ça, 
dans le cas particulier des groupes, d y a une tradition de dire « ordre » et d'écrire |G{|. 


DEFooKSTVooU0bpgC 
Définition 1.261 (Ordre d’un élément). 
L'ordre d’un élément g de G est le naturel 
min{n € N\{0} tel que g" = e}, (1.360) 


si il existe ; dans le cas contraire, nous disons que l’ordre de g est infini. 


1.262. 
Nous verrons que le corolaire 2.14 au théorème de Lagrange dira que l’ordre d’un élément divise 


l’ordre du groupe. 
LemHUkMxp 


Lemme 1.263 ([53, 12]). 
. 103 : ; 
Soient un groupe G et deux sous-groupes normaux ” H et K tels que HA KG DÉS ES ana gr 


(1) Tout élément de H commute avec tout élément de K. 


ITEMooVVBGooZSJqajp 
(2) EEK est un SOUS-gToupe de G. IMTEooPCBZooQoZFOD 
(3) L'application 
@: H X K — HK 
(1.361) 


(h,k) > hk 
est un isomorphisme de groupes. 


Démonstration. Point par point. 


(1) (1) Soient h € H et ke K. Nous voulons montrer que hk = kh. Pour cela nous considérons 
l'élément a = hkh=!k-1, Comme AH est normal dans G, nous avons 


kh-lk leH (1.362) 


et donc a € H. De même X étant normal dans G nous avons hAkh-! e K et donc a € K. Au 
final ae HA K = {e}. Nous avons prouvé que 


hkh lk lee, (1.363) 


et donc que hk = kh. 


(2) (2) Puisque H et X sont des sous-groupes, {e} est dans les deux, de telle sorte que e € HK. 
De plus si h; € H et k; € K,, la commutativité du point (1) donne 


(h1k1)(h2k2) = hihokiko € HK. (1.364) 


Donc le produit de deux éléments de HK est dans HK. 
(3) (3) En trois sous-parties. 


(3a) Morphisme Soient h; e H et k; e K. En utilisant la commutativité du point (1) nous 


1.365d 


e((h1, k1)(h2, k2)) = @(hiho, kiko) (1.365) 
= (h1h2)(k1ko) (1.365b) 
= (h1k1)(hok2) (1.365c) 

( ) 


= (h1,k1)p(ho, ko). 


103. Sous-groupe normal, définition 1.168. 
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(3b) Injectif Si @(h1,k1) = p(h2, k2) nous avons successivement 


h1k1 = hoko (1.366a) 
hikiho! = ko (1.366b) 
hihi tkt = koh (1.366c) 
hiho! = kok;!. (1.366d) 


Le membre de gauche est un élément de H et le membre de droite un élément de K. 
Comme H n K = {e} nous avons hih;* = eet kok; ! = e, c’est-à-dire h1 — h9 et 
k1 = ko. 


(3c) Surjectif Un élément général de HK est hk avec he Hetke K, c’est-à-dire &(h,k). 


DefvtSAyb 
Définition 1.264. 
L’exposant du groupe G est le plus petit entier non nul n tel que g" = e pour tout g € G. S'il 


n'existe pas un tel n, nous disons que l’exposant du groupe est infini. 
PROPooSWHHooUzqWkw 


Proposition 1.265. 


? 
À propos d’exposant de groupe et de ppem. ITEMooFTPBooFÜaPkU 


(1) Si l’ensemble des ordres de tous les éléments d’un groupe est majoré, alors l’exposant du 
groupe est le plus petit commun multiple des ordres des éléments du ITOUREMoOLIREOOYEt cdL, 


(2) Pour un groupe fini, l’exposant est le ppem des ordres des éléments du groupe. 


Démonstration. En deux parties. 


(1) Pour (1) Soit p le ppem des ordres de tous les éléments du groupe. Si g est d'ordre a, il 
existe 4 € IN tel que p = ak. Avec ça nous avons g = (g%)* = el — e. Donc p a bien la 
propriété g? = e pour tout g € G. 

Si q < p, nous montrons que q ne peut pas avoir cette propriété. Il existe un élément g dont 
l’ordre a ne divise pas q. Par la division euclidienne 1.215, nous avons des entiers u et v tels 
que qg = ua + v avec v < a. Nous avons alors 


gt=g"g"=g"#e (1.367) 


parce que v < a et que a est le plus petit n tel que g° = e. 


(2) Pour (2) Même chose. Pour un groupe fini, le ppem existe toujours. 


<++> 
Le théorème de Burnside 9.307 nous donnera un bon paquet d'exemples de groupes d’exposant 
fini dans GL(n, C). 
PropSRMJooIDPBoW 
Proposition 1.266. 
Soit un groupe G. Nous considérons un sous-groupe normal H de G ainsi qu’un morphisme d: G — 
H. Alors 


(1) Y(A) est normal dans (QG) 
(2) Si G/H est abélien alors #(G)/b(H) est abélien. 


Démonstration. Soient h € H et g € G. Alors Y(g)#(h)#(g) ! = w(ghg !) e Y(H). Donc Y(H) 
est normal dans #(G). 
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Pour la seconde partie nous notons [...] les classes par rapport à (H) et... celles par rapport 
à H. Nous avons 


efaire à l’envers 


( 
(1.368h 
= [UG2)Ré (1.368; 


[o(g)1l#(g2)1 = [#(g1)%(92)] (1.368a) 
= [Y(g192)] (1.368b) 
= {Y(g192)Y(h) tel que h € H} (1.368c) 
= {Y(g192h) tel que h € H} (1.368d) 
= {sgh tel que he H}) (1.368e) 
= Y(G1%) (1.368f) 
von 1.368g) 

) 
) 


= à 


Par conséquent #(G)/#(H) est abélien. 


1.13.1 Permutations, groupe symétrique 


Nous donnons ici quelques éléments à propos du groupe symétrique. Beaucoup de choses sup- 


plémentaires sont reportées à la section 5.6. Voir aussi le thème 8. 
DEFooJNPIooMuzIXd 


Définition 1.267. 
Soit un ensemble E. Une permutation de l’ensemble E est une bijection E — E. Le groupe 
symétrique de E est le groupe des bijections E — E ; il est noté Sg. 

Le groupe symétrique S, est le groupe des permutations de l’ensemble {1,...,n}. C’est donc 
l’ensemble des bijections {1,...,n} — {1,...,n}. 

DEFooSupportPermutation 

Définition 1.268. 
Le support d’une permutation © est l’ensemble constitué des éléments modifiés par © : 


suppo = {€ {1,...,n} tel que o(i) #i}. 
DEFooMVFKooMpXMQy 
Définition 1.269 ([53]). 
Soient une permutation © € E ainsi que a € E. La o-orbite de a est l’ensemble 


Q,;(a) = {o"(a) han. (1.369) 
LEMooSGWKooKFIDyT 
Lemme 1.270 ([54)). 
Le groupe symétrique SA est un ensemble fini contenant n! éléments : 


Card(Sh) = n!. (1.370) 
LEMooUPBOÜooWbwMTx 
Lemme 1.271 ([55]). 
Deux résultats. 


(1) Tout groupe est isomorphe à un sous-groupe d’un groupe symétrique. 


(2) Tout groupe fini d'ordre n est isomorphe à un sous-groupe de S. 
Démonstration. Soit, pour g € G& donné, l’application 


ie 


TH gt. 


(1.371) 


Commençons par prouver que cela est une bijection. D’une part, r,(x) = y pour x = g”ly (surjec- 
tion) et, d’autre part, 7j(x) = T{(y) implique gx = gy et donc x = y (injection). 
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Nous avons donc 7, € Sa. L'application 
(1.372) 


est un morphisme de groupe 104 : 


p(gh}x = ghx = w(g)(hx) = e(g)(e(h)x) = (et) ° e(h))æ. (1.373) 


Elle est injective parce que si 7, = 7h alors gx = hx pour tout x. En particulier g = h. Donc 
w: G — Image(y) est un isomorphisme entre G et un sous-groupe de SG (proposition 1.38). 

Un groupe fini de cardinal n est isomorphe à un sous-groupe de SG ; or SG est isomorphe à un 
des Sy. 


1.13.2 Décomposition en cycles 


Définition 1.272 (cycle[53]). 
Soit E un ensemble de cardinal ® n. Soit un entier 1 < k < n. Un élément o € Sy est un k-cycle 


si il ne possède qu’une seule orbite % non réduite à un élément et qu’elle est de cardinal k. 
LEMooADNGooDZpdTb 


Lemme 1.273 ([1]). 
Soient un k-cycle o et a € (. Alors 


Q,(a) = {a,o(a),...,o" l(a)} (1.374) 


et o*(a) = a. 
En particulier, les éléments o(a) avec q = 0,...,k — 1 sont tous distincts. 


Démonstration. Soit 1 le plus grand entier tel que les o*(a) avec 0 < à < 1 soient tous distincts, et 
notons À = {o*(a)};-0...1. Cet ensemble satisfait 


— Card(A) =1+1 
— ACQ,{(a), et donc Card(A) < Card({Q,(a)) = k par le lemme 1.124(3). 
Que vaut o!*l(a)? Par maximalité de {, o!*l(a) est un des o(a) avec à < L. Par injectivité de , 
nous avons donc forcément o!*l(a) = a. 
Donc pour tout à > lil existe j < { tel que o‘(a) = o/(a) (parce que o*(a) = al l(a)). Nous 
en déduisons que 


Q(a) = {o'(a)}ocici = À. (1.375) 
Le cardinal de Q,(a) étant k par hypothèse nous avons k =! +1, et donc | = k—1. 
LEMooANVHooOQiTwY 
Lemme 1.274. 
Si o est une cycle de longueur k, et sibe (a), alors 
(a) = À (b) = {0 (b)}i=0..r-1: (1.376) 


Démonstration. Comme b € (Q,(a), il existe ! < k — 1 tel que b = a!(a). Pour tout à nous avons 
ai(a) = ok +#1(b), et donc Q,(a) € A, (b). 

Mais pour tout à nous avons aussi o°(b) = o!+l(a) et donc Q,,(b) € Q, (a). 

Nous avons donc montré que (a) = (,(b). La seconde égalité est le lemme 1.273 appliqué à 


b. 


LEMooMIHGooQfALbc 
Lemme 1.275 ([1]). 
Soient un ensemble fini E, une permutation o € Sg ainsi que a € E. Sibe Q,(a), alors Q,(b) = 
Gala 
104. Définition 1.37. 


105. Définition 1.122. 
106. Définition 1.269. 
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Lemme 1.276 ([53]). 


Tout k-cycle est d'ordre 97 k. 


Démonstration. Soit le cycle {a,o(a),...,o"-l{a)}. Tous les o'(a) avec à < & — 1 sont distincts et 
o*(a) = a. Donc o* est l'identité, et l’ordre de a est plus petit ou égal à k. 

Sii<k—1, alors o*(a) £ a parce que les éléments du cycle sont distincts. Donc 0° # Id pour 
i < k — 1. Nous en déduisons que l’ordre de © est k. 


LEMooQLSAooBrXDXw 
Lemme 1.277 ([53, 56]). 
Tout élément du groupe symétrique S, peut être décomposé en un nombre fini de cycles de supports 
disjoints. 
Cette décomposition est unique à l’ordre près de l'écriture des cycles. 
Plus précisément, si o est une permutation, alors il existe un unique ensemble fini {wi}ier de 
cycles de supports disjoints tels que !® o = [Lier wi. 


Démonstration. Soit o € Sp. Si les éléments {a,o(a),...a*(a)} sont distincts, alors soit o**l(a) 
est distincts des autres, soit o“*l(a) = a. Il n’est en effet pas possible d’avoir a“ *l(a) = ol(a) avec 
L < k parce que ça contredirait l’injectivité de o. 

Soit donc a € E. Nous considérons le cycle (a, g(a),:2: , *(a)) où k est maximum tel que tous 
les éléments sont distincts. 

Soit ce cycle contient tous les éléments de E,, soit il existe un élément b hors de ce cycle. Dans 
le second cas, nous considérons le cycle commençant par b. 

Et ça continue... 


LEMooWXXLoo!lzrwJT 
Lemme 1.278 ([53]). 
Deux cycles de support disjoint commutent. 
LEMooVVPWooMkR;jyR 
Lemme 1.279 ([57]). 
Tout cycle de longueur r est le produit de r — 1 transpositions. 
Démonstration. Il suffit de vérifier que 
disrsss ou) = (oi, 2)(@u, gra) «4 (oi, 65). (1.377) 
LEMooGGLUooUSzuAx 


Lemme 1.280 (|1]). 
Soit une permutation o € Sp. Soit un cycle c et une permutation s de supports disjoints telles que 


o = soc. Alors LEMooUHWTooFptoZU 
(1) Si a € supp(o), alors pour tout q € N nous avons cl(a) = o4(a). ITEMooHSDLooIAKYZA 


(2) Si a € supp(c), alors 
Q(a) = Qc(a) = supp(c). (1.378) 
(3) Si a € supp(c), alors 


(1.379) 


T sinon. 


— c sixe Q,(a) 


Démonstration. En plusieurs parties. 


(1) Si a € supp(c), alors c(a) = o(a) Soit a € supp(c). Nous savons que c(a) Æ a, et vu que c 


est injective, nous devons aussi avoir c(c(a)) Æ c(a). Donc a et c(a) sont dans supp(c). Étant 
donné que les supports de c et de s sont disjoints, nous déduisons que c(a) n’est pas dans le 
support de s, et donc que 


o(a) = (s0 c)(a) = s(c(a)) = c(a). (1.380) 


107. Définition 1.261. 
108. Ici 7 est un ensemble fini et vu que les supports sont disjoints, le produit est commutatif. 
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(2) ol(a) = cl(a) Juste une récurrence sur le point précédent : si b € supp(a), alors o(b) = 
c(b) € supp(a). 

(3) Si a € supp(c), alors Q,(a) = Aa) Utilisant le point précédent, ainsi que la définition 
1.269 d’une orbite, 


Q(a) = {o(a)} = {M(a)} = Q(a). (1.381) 


(4) supp(c) € Ac(a) Comme toujours, a est un élément de supp(c). Nous considérons b € supp(c) 


et nous montrons que b € (,(a). Étant donné que b € supp(c), nous avons c(b) Z b, de telle 
sorte que (,(b) contienne au moins deux éléments distincts. 
Même chose pour a : l’ensemble (a) contient au moins a et c(a). Vu que c est un cycle, 
il n'existe qu’une seule orbite non triviale. Donc (.(a) = (.(b). En particulier b € Q(b) = 
(a). 

(5) Aa) € supp(c) Soit be (a). Le lemme 1.274 nous permet de dire que (a) = (,(b). 
Comme (,(b) contient au moins deux éléments (parce qu’il est égal à Q.(a) et que a est dans 
le support de c), nous savons que c(b) £ b et donc que b € supp(c). 


(6) La formule pour c(xr) Six e Q,j(a), alors c(x) = o(x) par le point (1). Si x n'est pas 
dans Q.(a) = supp(c), alors x n’est pas dans le support de c et donc c(x) = x. 


Le lemme suivant permet d'extraire le cycle de & associé à un élément de E. 
LEMooFFTBooCZsaFu 


Lemme 1.281 ([1]). 
Soient un ensemble fini E ainsi que o € Sp, etae E tel que o(a) Æ a. Nous posons 


c’E—E 
à Du sixe Q,(a) (1.382) 


Alors 
(1) Sibe (a), nous avons ((b) = (a). 
(2) Sibé D(a), nous avons N(b) = {b}. 
(3) c est un cycle. 


Démonstration. Si be Q,(a), alors o1(b) € Q,(a) pour tout q € N, et donc 
c1(b) = o1(b) e (a) (1.383) 
pour tout q. Donc nous avons 
Qc(b) = {c{(b) tel que q € N} = {0%(b) tel que ge N} = N,(b) = (a). (1.384) 


La dernière égalité est le lemme 1.275. 
Sibé (a), alors c(b) = b et ((b) = {b}. 
Nous avons prouvé que c a une seule orbite de taille plus grands ou égale à 2. Donc c est un 
cycle. 


Théorème 1.282 ([56]). 
Soit un ensemble fini E de cardinal au moins deux. Soit une permutation © € Sxg. 


(1) Il existe des cycles c1,...,Cm à support disjoints tels que o = c19...0 Cm. 


(2) Cette décomposition est unique à l’ordre près. 


Démonstration. Plusieurs points. 
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(1) Existence Nous choisissons des éléments {a;};=1..# tels que les Qj(a;) forment une par- 


— 


tition de Æ en sous-ensembles disjoints. En posant {x = min{r tel que o”(ax) = ax}, nous 
avons 


Q(ar) = {o (ax) }g=1,. 1 (1.385) 
et tous les o%(az;) sont distincts pour q = 1,...,l; —1. 
Posons 
Ck: E—E 
o(x) sixe(,(ar) (1.386) 


- 


Le lemme 1.280 dit que c4 est un cycle. Vu que c(ax) = o(ag), le cycle c est un {4-cycle. 


zx sinon. 


,p} tel que 
(1.387) 


Nous montrons à présent que o = “0... Soit x e E. Il existe un ke {1,... 
med (asl = 0, (as) = 0 60), 


la dernière égalité est parce que x € Q,, (ax). Nous en déduisons que (x) £ x. D'autre part 
sil £ k, alors x n’est pas dans Q,(«), et donc a(x) = x. Au final, 


(cao...@)(x) = (x) = o(x). (1.388) 


Unicité Nous supposons avoir o = € 0...0 & = ÿ1 0% où les c; et les y; sont deux 
ensembles de cycles de supports disjoints. Nous avons 


P 


q 
supp(ci) = (.] supp(i;). 
i=1 j=1 


supp(o) (1.389) 


Montrons que si supp(c)nsupp(7y;) # @, alors supp(c;) = supp(y;). En effet si a € supp(c)n 
supp(7;), alors 

supp(cs) = (a) = Qe(a) = Q,,(a) = supp(as). (1.390) 
Et comme les supp(;) sont disjoints, l’ensemble supp(c;) n’a d’intersection qu'avec un et un 
seul des supp(y;). Cela définit donc une application 


u: {1,...,p} — {1,...,q} 


nr. (1.391) 
ir l’unique j tel quesupp(c;) = supp(;). 
Autrement dit, l'application u permet d’écrire 
supp(c) = supp (yat): (1.392) 
L'application u est injective. En effet si u(i) = u(l), nous avons 
supp(c;) = supp (yuti)) (1.393a) 
supp(a) = supp (ut) (1.393b) 
u(i) = u(l). (1.393c) 


Donc supp(c;) = supp(a). Et comme les supports sont disjoints, à = Î. 

L'application u est surjective. En effet, soit j € {1,...,q}. Soit a e supp(y;). Il existe un 4 tel 
que a € supp(c). Nous avons alors à € supp(y;) N supp(c), autrement dit u(i) = j. 
Maintenant l'application u: {1,...,p} — {1,...,q} est bijective. Nous en déduisons que 
p = q. Concluons en montrant que ©; = y,{ÿ. Soit a € supp(c;) = supp (Yucs)- 

Nous avons 


= Li À x E Do(a) (1.394) 
et | 
if) = 1 . al (1.395) 


et donc c; = 7j. 
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LemmvZFWP 
Lemme 1.283 ([58]). 
Soit o = (i1,...,ix) € Sn, un cycle de longueur k et 0 € S,. Alors 
0007! = (O{i),...,O(ix)). (1.396) 
Tous les cycles de longueur k sont conjugués entre eux. 
PropEAHWXwe 


Proposition 1.284 (Classes de conjugaison et structure en cycles[59]). 

Une classe de conjugaison % dans Sn est formée des permutations ayant une décomposition en 
cycles disjoints de même structure. Autrement dit, deux permutations © et a! sont conjuguées si et 
seulement si le nombre k; de cycles de longueur à dans o est le même que le nombre k! de cycles 
de longueur à dans a’. 


Démonstration. Soit o = c1...Cm la décomposition de o en cycles c; de supports disjoints. Si T 
est une permutation, alors 


o'=ror l=(rcar !)...(remT !), (1.397) 


mais TT! est un cycle de même longueur que c, puisque le lemme 1.283 nous dit que si o — 
(a1,...,ar), alors rer | = (r(a), — ,T(ak)). Notons encore que les cycles rc;77! restent à support 
disjoints. 

Donc tous les éléments de la classe de conjugaison de © sont des permutations de même structure 
que ©. 

Réciproquement, si o/ = c\...c!, est une décomposition de o’ en cycles disjoints tels que la 
longueur des c; est la même que la longueur des c, alors il suffit de construire des permutations 7; 
telles que HGTE = c, à travers le lemme 1.283. Comme les supports des c; et des c/ sont disjoints, 


la permutation T1...Tm Conjugue © et 0’. 


EXooQAXRooBsPURs 
Exemple 1.285. 
Voyons les classes de conjugaison de S3. Étant donné que ce groupe agit par définition sur un 
ensemble à 3 éléments, aucun élément de $3 ne possède un cycle de plus de 3 éléments. Il y a donc 
seulement des cycles de longueur deux ou trois (à part les triviaux). Aucun élément de S3 n’a une 
décomposition en cycles disjoints contenant deux cycles de deux ou un cycle de deux et un de trois. 
En résumé il y a trois classes de conjugaison dans $3. La première est celle contenant seulement 
l'identité. La seconde est celle contenant les cycles de longueur deux et la troisième contient les 
cycles de longueur 3. 
Ce sont donc 


Ci = {Id} (1.398a) 
C2 = {(1,2), (1,3), (2,3)} (1.398b) 
PR (1.398) 
A 

DEFooXNAFooGTbTTJ 


Définition 1.286 (transposition). 
Une transposition est une permutation "0 qui échange deux éléments de E. Plus précisément, 
une bijection o: E — E est une transposition si il existe a,b € E tels que 


a sit =0b 
o(r)=4b sir=a (1.399) 


T sinon. 


109. Définition 1.164. 
110. Une permutation est une bijection, définition 1.267. 
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ExVYZPzub 
Exemple 1.287. 
Les classes de conjugaison de 54. Nous savons que les classes de conjugaison dans $4 sont caracté- 
risées par la structure des décompositions en cycles (proposition 1.284). Le groupe symétrique S4 
possède donc les classes de conjugaison suivantes. 


(1) Le cycle vide qui représente la classe constituée de l'identité seule. 
(2) Les transpositions (de type (a, b)) qui sont au nombre de 6. 


(3) Les 3-cycles. Pour savoir quel est leur nombre nous commençons par remarquer qu’il y à 
4 façons de prendre 3 nombres parmi 4 et ensuite 2 façons de les arranger. Il y a donc 8 
éléments dans cette classe de conjugaison. 


(4) Les 4-cycles. Le premier est arbitraire (parce que c’est cyclique). Pour le second il y a 3 
possibilités, et deux possibilités pour le troisième ; le quatrième est alors automatique. Cette 
classe de conjugaison contient donc 6 éléments. ITEMooGCMYooKZgFHX 


RS 
[SL 
a 


Les doubles transpositions, du type (a, b)(c, d). Dans ce cas, tous les nombres sont permutés, 
et l’image de 1 détermine la double transposition. Il y a 3 images possibles, et donc 3 éléments 
dans cette classe. 
A 
PropPWIJbu 
Proposition 1.288. 
Tout élément de S, peut être écrit sous la forme d’un produit fini de transpositions. 
Si E est un ensemble fini, tout élément de Sp pour être écrit sous forme d’un produit fini de 
transposition de E. 


Démonstration. Un élément de $, se décompose en un nombre fini de cycles par le lemme 1.277 et 
chacun des cycles peut être décomposé en un nombre fini de transpositions par le lemme 1.279. 


Cette décomposition n’est pas à confondre avec celle en cycles de support disjoints. Par exemple 
(1,2,3) = (1,3)(1,2). 
Le théorème suivant, qui donne la notion de parité d’une permutation, est la clef pour savoir 


quelles positions du jeu de taquin sont possibles ou impossibles{60, 61]. 
PROPooKRHEooAxtmRv 


Proposition-Définition 1.289 (parité d’une permutation). 
À propos de décomposition ne permutations. 


(1) Si une permutation peut être écrite sous forme d’un produit d’un nombre pair de transposi- 
tions, alors toute décomposition en transpositions sera en quantité paire. 


(2) Si une permutation peut être écrite sous forme d’un produit d’un nombre impair de transpo- 
sitions, alors toute décomposition en transpositions sera en quantité impaire. 


Une permutation qui se décompose en une quantité paire de transpositions est une permutation 
paire (et impaire sinon). 

DEFooNHXSooQzCPzD 
Définition 1.290. 


La signature est l’application 


€. SE + {—1, 1} 
1 sic est paire (1.400) 
OC 
—1 sio est impaire. 
LEMooWGRXooHWyzLC 
Lemme 1.291. 
Nous disons qu’un élément o € S, est une inversion pour les nombres à < j si o(i) > o(j). Soit 
N, le nombre d’inversions que o € S, possède (c’est le nombre de couples (à, j) avec i < j tels que 


o(i) > a(j)). Nous avons 
e(o) = (—1)% (1.401) 
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où € est la signature!!! dans S,. 


LemhxnkMf 
Lemme 1.292 ([53]). 
Un k-cycle est une permutation impaire si k est pair et paire si k est impair. 

ProphluJrC 
Proposition 1.293 ([58]). 
Soit Sn le groupe symétrique. ITEMooBQKUooFTkvSu 


(1) L'application €: Sy — {1,—1} est l’unique homomorphisme surjectif de S, sur {—1,1}. 
(2) Sis=t1---t4 est le produit de k transpositions, alors e(s) = (—-1)À. 
Démonstration. Soit o,0 € S,. Afin de montrer que e(o0) = e(a)e(0), nous divisons les couples 
(i,j) tels que à < j en 4 groupes suivant que O(i) Z 0(j) et o(@(i)) Z o(@(5)). Nous notons M1, 
No, N3 et NA le nombre de couples dans chacun des quatre groupes : 


(i,3) o(o(i)) < o(0(j)) | o(8(i)) > o(8(5)) 

O(i) < O(j) M M2 

O(i) > O(j) N3 N4 

Nous avons immédiatement Ny = N3 + Na et No = No + Na. Les éléments qui participent à 
N, sont ceux où #(i) et 0(j) sont dans l’ordre inverse de o(4(i)) et «(4(j)) (parce que 0 est une 
bijection). Donc N, = N2 + Na. Par conséquent nous avons 


e(o)e(0) = (—1) TN 1) NN (Net Na 2 (Ne 2 e(050). (1.402) 

Nous avons prouvé que € est un homomorphisme. Pour montrer que € est surjectif sur {—1,1} nous 

devons trouver un élément 7 € 5, tel que e(r) = —1. Si r est la transposition 1 + 2 alors le couple 
(1,2) est le seul à être inversé par 7 et nous avons e(r) = —1. 

Avant de montrer l’unicité, nous montrons que si o = #1...#4 alors e(o) = (—1)*. Pour cela 

il faut montrer que e(r) = —1 dès que 7 est une transposition. Soit 7;;, la transposition (4, j) et 


O=(i,i+1,...,j— 1) alors le lemme 1.283 dit que 
Tiÿ = OT;-1,50 À. (1.403) 
La signature étant un homomorphisme, 
e(ri;) = e(0)e(r;-1,5)e(0) À = efr;_1,5) = —1. (1.404) 


Nous passons maintenant à la partie unicité de la proposition. Soit un homomorphisme surjectif 
®: Sn — {—-1,1} et 7, une transposition telle que w(T) = —1 (qui existe parce que sinon w ne 
serait pas surjectif!l?). Si r/ est une autre transposition, il existe o € Sn tel que 7’ = ora ! 
(lemme 1.283). Dans ce cas, w(r') = @(T) = —1, et si o = (r1...7%K), 


po) = (—1}F = e(o). (1.405) 
CORooZLUKooBOhUPG 
Corolaire 1.294. 
Si o € Sn, alors 
e(o) = e(o 1). (1.406) 


Démonstration. Comme énoncé par la proposition 1.293, € est un homomorphisme, donc 
e(o)e(o”!) = e(oo !) = e(Id) = 1. (1.407) 


Puisque e(a) et (ol) ne peuvent valoir que +1, ils doivent être tous les deux égaux à 1 ou tous 
les deux à —1 pour que le produit soit 1. 


111. Définition 1.290. 
112. Nous utilisons ici le fait que tous les éléments de $, sont des produits de transpositions, proposition 1.288. 
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1.13.3 Permutation un peu ordonnées 
LEMooEOUTGooPs1ULz 


Lemme 1.295 (|1]). 
Deux énoncés. ITEMooQZDRooUY jcgX 
(1) Soit x € Sy satisfaisant r(1) = 1. Nous définissons Tr € Sx_1 par T(i) = r(i +1) —1. 


Alors e(r) = (x). ITEMooBUGZooVCVhKz 


(2) L'application 
p: {re S& tel que r(1) = 1} — Sx-1 


me ro) =r(i+1) 1] Se 


est une bijection. 


Démonstration. Nous nommons 7 la restriction de x à {2,...,k}. Cela est encore une bijection, 
de telle sorte que 7” puisse être écrite sous forme d’un produit de n transpositions de {2,...,k} 
(proposition 1.288) : 

F= 06:06 0h (1.409) 


Les 0; étant des transpositions de {2,...,k}, elles sont des transpositions de {1,...,k}. Tout cela 
pour dire que 7x peut être écrite comme produit de transpositions ne faisant pas intervenir 1. 
Nous introduisons la bijection 


D: {2,...,k} — {1,...,k—1} 


1.410 

ir i-l. 
En termes de w, la définition de 7 s'écrit d(r) = Y ox o #1, et nous avons 

T=#Yormov ! (1.411a) 

= Yooio...oonow | (1.411b) 

= poooÿ lopos2o...opoonow 1. (1.411c) 


Bref, en notant a! = Yo;Y ! nous avons Tr = 01 0...0 a». 

Il suffit maintenant de remarquer que o! est une transposition dans {1,...,k — 1}. On vérifie 
pour cela que si o = (a,b) alors o’ = (#(a),4(b)). En effet, pour à = 1,...,k — 1, il y à trois 
possibilités : soit à = #(a), soit à = #(b) soit 4 n’est ni l’un ni l’autre. 

Si à — (a), alors o'(i) = (boy !)(b(a)) = vo(a) = #(b). Même vérification pour montrer 
que o/(4(b)) = #(a). Si à n’est ni #(a) ni #(b), alors #7 !(i) n’est ni a ni b et dans ce cas 


(bob )(i) = po(b"(i)) = pH) = à. (1.412) 


Donc la décomposition Tr = 0 0...0 0, est une décomposition de 7 en n transpositions. 
Autrement dit le nombre de transpositions est le même pour 7 que pour r. 

En particulier les signatures de 7 et de x sont les mêmes. Cela finit la preuve du point (1). 

Prouvons le point (2). 


(1) Injectif Supposons que w(r) = w(o). Alors pour tout à = 1,...,k — 1 nous avons 
nti+1)—-1=0o{i+1)—1, (1.413) 


c’est-à-dire x(j) = o(j) pour tout j = 2,...,k. Vu que r(1) = o(1) nous avons bien 7 = ©. 


(2) Surjectif Soit 7e Sx_1. En posant 


n(i) = L ie (1.414) 


T(i—1)+1 sinon, 


nous avons bien 7 = w(r). 
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DEFooDFBEooFElghU 
Définition 1.296 ([1, 62]). 
Nous notons 
Sun = {T € Sxu tel que r(1) <...7(k), n(k +1) <... < r(k +1)}, (1.415) 
el 
An = {TE Sun tel que n(1) = 1}. (1.416) 
LEMooCKJAooBIAyVs 


Lemme 1.297 ([1]). 
Deux énoncés. ITEMooCNWMoolbnHnz 


(1) Soit r € A1. En posant T(i) = m(i +1) — 1 nous avons T € S(x_11. ARR CCR 


(2) L'application 


P: An — S(k-11) an 
mes [r() = n(i+ 1) -1] | 


est une bijection. 


(3) En ce qui concerne la signature, e(w(r)) = e(r). 
Démonstration. Pour prouver (1), soit d’abord 1 < à < j < k — 1. Nous avons 
rfi) =r(i+1)-1<r(i+j)—-1=7(j) (1.418) 


parce que à + 1 et j + 1 sont entre 1 et 4. Le même raisonnement tient pour k+1<i<j<k+l. 
Pour (2). Même preuve que la partie correspondante du lemme 1.295. 


1.14 Corps 


La définition d’un corps est 1.202. 


1.14.1 Définitions, morphismes 


La proposition suivante donne une caractérisation d’un corps, en disant un tout petit peu plus 
que la définition 1.202. 


Proposition 1.298. 
L'anneau À est un corps si et seulement si U(A) = A*. 


Démonstration. En deux parties. 
(1) Sens direct Nous supposons que À est un corps. D'une part tous les éléments non nuls 
sont inversibles, c’est-à-dire A* € U(A). 
Pour l'inclusion inverse, nous montrons qu’une élément inversible ne peut pas être nul. Cela 
n’est autre que le lemme 1.174 couplé à la proposition 1.175 : a : 0 = 0 Æ 1 pour tout a. 


(2) Sens inverse Si U(A) = A*, nous avons immédiatement que tous les éléments non nuls 
sont inversibles et donc que À est un corps. 


LEMooJNIBooAURhrt 
Lemme 1.299. 
Si K est un corps et si a € K vérifie a? = 1, alors a = +1. 


Définition 1.300 (Morphisme de corps). 
Un corps étant un anneau sans plus de structure, un morphisme de corps n’est qu’un morphisme 
des anneaux. 


113. Définition 1.42. 
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Le lemme suivant montre que définir un morphisme de corps comme étant simplement un 
morphisme des anneaux est une bonne idée. 


LEMooWBOPooZnsZgQ 
Lemme 1.301. 
Si o: K — K’ est un morphisme de corps, alors 
(1) pour tout a € K nous avons (a!) = (a)! ; 
(2) le morphisme @ est injectif. 
Démonstration. Vu que (1) = 1, nous avons aussi 
1 = (aa) = p(a)p(a”). (1.419) 


14, p(ar1) = (a) 


Pour l’injectivité nous supposons (a) = 4(b). Étant donné que K/’ est un corps, nous pouvons 
multiplier par w(b) 1: 


Donc, par unicité de l’inverse 


p(a)p(b) "= 1. (1.420) 


En utilisant le premier point nous avons 1 = (a)w(b !), puis le morphisme d'anneaux : 1 = 
w(ab”-!), et encore le morphisme d’anneaux nous permet de déduire ab! = 1 et donc a = b. 


1.15 Symbole de sommation 


1.15.1 Somme à valeurs dans un groupe commutatif 


Si S est un ensemble fini, nous savons de la proposition 1.122 qu'il existe un unique N €E N 


pour lequel il existe une bijection w: {0,...,N} — S. Cette bijection n’est à priori pas unique. 
DEFooLNEXooYMQjRo 


Lemme-Définition 1.302 ([1]). 
Soient un groupe commutatif (G,+) ainsi qu’un ensemble fini T contenant n éléments. Soit une 


application f : I — G. Si 01,02: {1,...,n} — I sont deux bijections, alors 15 
n n 
D Foto) = À Foi). (1.421) 
i=1 i=1 


La valeur commune est notée 


DO) (1.422) 


Démonstration. Nous commençons par considérer une transposition o (qui permute k et | avec 
k < 1). Nous avons 


n k—1 l—1 n 
DO = D FE) +/)+ D FO +/0+ > FO (1.423) 
=] i=1l i=k+1 i=l+1 
k—1 1-1 n 
= dE) +0 + D FO +FE) + D FO) (1.423b) 
ii i=k+1 i=l+1 
= Ÿ f(o{i)) (1.423c) 


Il 
En 


Pour cela nous avons utilisé le fait que G est commutatif pour permuter f(l) € Get f(k) € G avec 
F1 
Duhyidhi) € G. 


114. Lemme 1.160 (2). 
115. Pour rappel, le symbole ÿ 7 


i=1 


est défini par 1.84. 
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Une permutation quelconque est un produit de telles transpositions (proposition 1.288). Donc 
pour toute permutation o nous avons 


nm 


D f(oi)) = D, Ft). (1.424) 


i=1 i=1 


La définition 1.302 donne lieu à un certain nombre de remarques. 


(1) Elle donne la somme sur un ensemble fini. Un problème avec les ensembles infinis (outre 
la convergence) est l’ordre de sommation. Si vous voulez sommer sur Z, dans quel ordre le 
faire ? 

(2) Pour aller plus loin, et sommer sur des ensembles infinis, rendez-vous dans le thème 52. 

PROPooJBQVooNqWErk 
Proposition 1.303. 
Soient un groupe commutatif (G,+), un ensemble fini TI, une application f : TI — G et une bijection 
o: [1 — I. Alors 
D SG) = D F(o(i)). (1.425) 
iel iel 


Si nous avons une application L: S$ — S, nous notons 


D f(L(s)) = YF 0 L)(s). (1.496) 


seS seS 


Cette façon d'écrire donne une interprétation pour la notation ec f(Rg) qui arrive dans la 


proposition 1.306. Il s’agit de considérer l'application Ly du lemme 1.162, de considérer !!6 


D /hg) = (fo En)(g) T7) 


geG geG 


et de faire tourner la définition 1.302. La même chose tient pour définir »,,.-G(gh) à l’aide de Ry. 
LEMooGAMAooDAFhrc 

Lemme 1.304 (Changement de variables dans une somme{1|). 

Soient deux ensembles finis 1, J ainsi qu'une bijection w: 1 — J. Soient un groupe abélien G et 

une application f : 1 — G. Alors 


> r0 =>. f(e 6). (1.428) 
icl jeJ 
LEMooNDBYo0oAGEkmvw 
Lemme 1.305. 
Soit un ensemble À fini pouvant être écrit comme une union disjointe A = (JF_, Ax ; nous suppo- 
sons que les A; sont non vides. Soient un groupe commutatif (G,+) et une application f: À — G. 
Alors 


n 


Si@=Y Y fa). (1.429) 


ac À k=1 ae Ag 


Démonstration. Le lemme 1.115 nous indique que les parties Az sont des ensembles finis. Nous 
notons 


(1) No = 0, et Nyx = Card(A;), 
(2) Sx — De Nr. 
(3) pk: {1,..., Nx} — A, une bijection (l’existence est dans la proposition 1.122). 


116. Le fait que Lx soit une bijection n’a pas d'importance ici. 
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Nous avons Card(A) = $, par le lemme 1.124(4). Nous définissons une belle bijection comme il 
faut : 
a: {1,..., Sn} — À 
n} | (1.430) 
ie prri(i — 5x) 
pour € |Sx, Sx+1]. 
(1) a est bien définie Puisque à > Sy et à < Sy11 nous avons à — $4 € {1,..., Nx11}, et donc 


wk+1 S’applique bien à à — 5%. 

(2) a est injective Supposons que a(i) = a(j). Site [Sx, Sx+1] et j € JS, Si41], alors ai) = 
prriti — Sy) € Axrs et a(j) = gy11(9 — Si) € A1. Vu que les À; sont disjoints, nous avons 
k = 1, et donc 


PR+1(E — Sx) = Pr+1(3 — 8x). (1.431) 
Étant donné que wy+1 est injective, nous avons à — Sy = j — Sy, ce qui montre que à = j. 
(3) a est surjective Soit a € À. Il existe k tel que a € A4. Nous avons donc un 8€ {1,..., My} 
tel que a = wg(s). En posant à = s + Sy, nous avons bien a = a(s + Sy) parce que 8 + Sy € 
IL ST Sy]. 


Vu que «a est une bijection, nous avons l'égalité 


Sn 


D f(a)= Ÿ (fo a)(i). (1.432) 
ae À i=1 
Nous avons encore besoin d’introduire une bijection. Nous posons 
: [Sx_1, Sx] — À 
Bi: 18k-1 el . (1.433) 
ir pi — Sx-1). 


C’est une bijection parce que w4 en est une, et que à + à — Sz_: est une bijection de |Sx_1, Sy]. 
Nous pouvons maintenant terminer : 


Sn 
S f(a) = (fo a)(à (14342) 
a A i=1 


NÉS Geoû RPM RAE) 
D | D, Ferté -Sx1)) (1.434c) 


D 23 FE) (1.434) 


= À (S 1°) (1.434e) 


Justifications : 


— Pour (1.434b). Associativité de la somme. 


PROPooWJQQooFINSEcC 
Proposition 1.306 ([1]). 
Soient un groupe fini G et une fonction f : G — À où À est un anneau commutatif. Alors 


Dig) = D F(gh) = D f(hg) (1.435) 


geG geG geG 


pour tout hE G. 
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Démonstration. Nous avons une bijection @: {0,...,N} — G garantie par la proposition 1.122. Sa 
définition est 


N 
D Fa) = D F(el)). (1.436) 


geG i=0 
Par ailleurs, le lemme 1.162 donne une bijection L: G — G et permet de considérer la composée 


p':{0,...,N}—G 


re (1.437) 


La proposition 1.302 nous permet d'utiliser la bijection 4’ au lieu de & pour exprimer la somme 
Dec Ensuite un jeu de notation utilisant (1.427) donne 


N N N 
Di F9) = >, F(e()) = D, F5) = DU 0 En o w)(i) 
geG . i=0 i=0 i=0 (1.438) 
= Do L)(o()) = 3 (F0 Ln)(9) = À f(hg). 
i=0 geG geG 
En ce qui concerne ÿ EG (gh), c’est la même chose, en utilisant R} au lieu de L}. 
LEMooKSVWoolFsfwm 


Lemme 1.307. 
Soit un groupe totalement ordonné (A,+,<). Soient deux suites (a;) et (b;) dans G telles que 
a; < b; pour tout i. Alors pour tout n nous avons 


De db (1.439) 


Tout cela nous permet de définir une somme sympathique et bien connue. 


Lemme 1.308. 
Soit ne N. Nous avons 


5 = ee (1.440) 
k=0 


Démonstration. La preuve est pratiquement immédiate par récurrence. Nous allons donner une 
preuve plus « constructive », qui formalise l’idée classique d'écrire la somme à l’endroit et à l’envers. 
Nous notons $ la somme Y_, k. Le lemme 1.302 dit que si les o;: {0,...,n} — {0,...,n} sont 
des bijections, alors X5_0 f(o1(k)) = X%_0 f(o2(k)). Nous sommes intéressé au cas f(i) = i. 
En prenant o1(k) = k et o2(k) = n — k, nous avons 


S = ne re (1.441) 


Donc 


TC SE (1.442) 


En divisant par deux, nous obtenons le résultat annoncé. 


117. Définition 1.163. 
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1.16 Symbole de produit 

NORMooDBOFooQCwbOY 
1.309. 
Si (G, : ) est un groupe et si H € G, nous notons le produit des éléments de A par 


Ils= > (1.443) 


geH geH 


où à droite, c’est la somme déjà définie. La différence entre ][ et ÿ' est que nous utilisons ]] 
pour les groupes notés « multiplicativement » comme (G, : ) alors que nous utilisons ÿ° lorsque le 
groupe est noté « additivement » comme (G,+). 

Dans le cas d’un anneau (A,+, - ), la distinction est importante pour savoir quelle opération 
est sous-entendue. 

La définition 1.84(1) signifie qu’une somme vide vaut zéro : »,,,4x = 0. Vu que zéro est la 
façon usuelle de noter le neutre pour une opération notée « + », lorsque l’opération est notée 


nous avons 
EQooCSDS £ 
[l=-: RoocsDsoo reg 
ze 
parce que 1 est la façon usuelle de noter le neutre d’une opération notée « + ». 
Notez que (1.444) n’est pas une nouvelle définition ou une nouvelle convention. C’est seule- 
ment l'égalité regie x = 0, avec des notations adaptées à un groupe dont l’opération est notée 


multiplicativement. 
PROPooQMUDooQQVRIe 


Proposition 1.310. 
Si E est un ensemble fini et si G est un groupe commutatif, alors pour toute fonction f: E — G 
et pour toute permutation | o de E, 


II = T[[/(oti) (1.445) 
icE icE 
Démonstration. C’est exactement la proposition 1.302, sauf qu'ici la loi de groupe est notée mul- 
tiplicativement au lieu d’additivement. 


1.16.1 Sous-groupe engendré 
DefooRDRXooEhVxxu 


Définition 1.311 (Sous-groupe engendré). 
Soit À une partie du groupe G. Le sous-groupe engendré par À est l'intersection de tous les 
sous-groupes de G contenant A. Nous notons ce groupe gra(À). 

Lorsque À est fini (disons À = {ai,...,an}), on note aussi le sous-groupe engendré (a, ..., an). 


1.312. 
Un sous-groupe engendré n’est jamais vide parce qu’il contient toujours au moins le neutre (parce 
que c'est un sous-groupe). Si Gest un groupe, le sous-groupe gr&(@) lui-même contient e 1°. 


1.313. 
Dans de nombreux cas, le groupe « ambiant » Gest entendu par le contexte et nous noterons gr(A) 
au lieu de gre(À). 
; . 4 5 . 

Si par exemple À est la matrice È à le groupe gr(À) est à comprendre dans GL(2,R). Il 
faudrait être fou pour avoir en tête un autre groupe que GL(2, R) sans le préciser. 

D'ailleurs, connaissez-vous un groupe contenant la matrice À et n’étant pas un sous-groupe de 
GL(2,C) ? 


Lemme 1.314. 
Si G est un groupe et A une partie de G, alors gr(A) est un sous-groupe de G. 


118. Une permutation est une bijection, définition 1.267. 
119. Demandez-vous si il est possible que gr(@) contienne d’autres éléments que e. 
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Le sous-groupe engendré par À est le plus petit (pour l’inclusion) groupe de G contenant A. 
Plus formellement, nous avons le résultat suivant : 


Lemme 1.315. 
Tout sous-groupe de G contenant À contient gr(A). 


Démonstration. Si H est un sous-groupe de G contenant À, alors gr(A) est l'intersection de H 
avec tous les autres sous-groupes de G contenant À. Il contient donc gr(A). 


LemFUIZooBZTCiy 
Lemme 1.316 ([63]). 
Si À est une partie du groupe G, alors le sous-groupe gr(A) engendré}? par À est l’ensemble de 
tous les produits finis d'éléments de A et de A7! (l'identité est le produit à zéro éléments). 
C'est-à-dire que tout élément de gr(A) peut être écrit sous la forme |?! 


[ls (1.446) 


où a; € Z et g: N — À n’est pas spécialement injective : il peut arriver que gi = g;. 


Démonstration. Puisqu'un produit vide est égal à l'identité l??, le lemme est vrai (un peu trivia- 
lement) dans le cas où À = @. À partir de maintenant, nous supposons que À est non vide. 
Nous nommons gr(A) le groupe engendré par À et A, l’ensemble 


H = {g1...9n tel que ge AU At}. (1.447) 


Nous commençons par prouver que H est un groupe. 
—— Puisque À est non vide, nous considérons a € A. Dans ce cas, e = aa! e H. Doncee H. 
— L'inverse de g1...9n est ÿn!...91 ! qui est également dans H. 
— Le produit de g1...9n par h1...hn, tous éléments de H, est également dans H l#. 


Comme H est un groupe contenant À, nous avons gr(A) € H parce que gr(À) est une intersection 
dont un des éléments est A. 

Par ailleurs tout groupe contenant À doit contenir les inverses et les produits finis, donc H € 
gr(À). 

Au final, H = gr(A), ce qu'il fallait. 


LEMooCFTVooKvmyKN 
Lemme 1.317. 
Soit un groupe G et un sous-groupe H = gr(h1,...,h,). Si ae G, alors 
aHa ! = g(aha !,...,aha ?). (1.448) 
Démonstration. Il s’agit d’une conséquence du lemme 1.316. Un élément de gr(ahia !,...,ah,a !) 


est un produit d'éléments de G de la forme ah;a”! ou (ah;a”1)"1 


_ ah; "at. Or nous avons 
aha lah;ja ! = ahjhja le aHat. (1.449) 


Donc 
gr(aha !,...,aha !)caHa !. (1.450) 


L’inclusion dans l’autre sens est du même tonneau. 


120. Définition 1.311. 

121. Les a; négatifs correspondent aux inverses. Notons que si ge À, iln’y a pas de garanties que g”_! soit également 
dans À. 

122. Voir 1.309. 

123. Et c’est ici qu’on se rend compte que la décomposition n’est probablement que rarement unique. 
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DEFooWMFVooLDqVxR 
Définition 1.318 (Partie génératrice, groupe monogène). 
Soient un groupe G, et une partie À € G. Si gr(A) = G, alors nous disons que À est une partie 
génératrice du groupe G. 


Un groupe est monogène si il a une partie génératrice réduite à un seul élément. 
DefHFJWooFxkzCF 


Définition 1.319 (Groupe cyclique). 
Un élément a € G est un générateur de G si tous les éléments de G& s’écrivent sous la forme a" 
pour un certain n € Z. Un groupe fini et monogène est dit cyclique. 


1.320. 
La différence entre un groupe monogène et un groupe cyclique est qu’un groupe cyclique est fini. 
Dans un groupe cyclique, à force d’itérer le générateur, nous finissons par tourner en rond — d’où 
le nom. 


Exemple 1.321. 
124 


Soit le groupe (Z/ 10Z, +). L'élément [2]10 n’est pas générateur parce que ses puissances * sont 
gr([2/10) = {[2]10, [4]l10, (6/10, [8]10, [0]10}. (1.451) 
Par contre l'élément [3]10 est générateur : ses puissances sont dans l’ordre 
(3110; (6/10; [9]10; (2/10, [5]10: (8/10; [1]10: [4l10, [7]10: [0] 10. (1.452) 
A 
Un exemple presque identique, mais un peu masqué sera l’exemple 18.156. 
LEMooTHBIooJP;jBlp 
Lemme 1.322 (|1]). 
Sin = dr, alors 
(1) rZ/n2 est un groupe. LEMooSAAXooMezYui 
(2) Le groupe r'Z/nZ est cyclique !?°. ITEMooGCCQooIfZULt 
(3) Card(rZ/nZ) = d = n/r. 
1.17 Module sur un anneau 
DEFooHXITooBFvzrR 


Définition 1.323 (module sur un anneau[64]). 
Soit un anneau A. Un module à gauche sur A est la donnée d’un triplet (M,+, : ) où 


(1) + est une loi de composition interne à M, c’est-à-dire +: M x M — M, 

(2) * est une loi de composition externe, c’est-à-dire : : A x M — M 
telles que 

(1) (M,+) est un groupe l*#. 

(2) a -(x+y)=a-x+a y, 

(3) (a+b) :x=a:x+b:x, 

(4) (ab) *x=a:(b:x) 

(lee 
pour tout a,be A etx,ye M. 


Si M et N sont des A-modules, un morphisme de M vers N est une application f: M — N 
qui 


124. Attention aux notations: en général on écrit la loi de groupe de façon multiplicative et on parle des puissances 
d’un élément, mais ici on écrit la loi de groupe additivement, donc les « puissances » sont en réalité les multiples. 

125. Définition 1.319. 

126. Nous verrons dans la proposition 1.324 qu'il est forcément commutatif. 
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(1) est un morphisme de groupes entre (M, +) et (N, +) 
(2) vérifie f(a : x) = a : f(x) pour tout a€ À, xe M. 
L'ensemble des morphismes entre M et N est noté HomA(M, N). Si B est un sous-anneau de À, 
nous parlons de Homg(M, N) pour parler des morphismes de groupes qui ne vérifient f(a : x) = 
a * f(x) que pour a € B. 
PROPooGARGooDiMqtN 
Proposition 1.324. 


Si M est un module sur un anneau, alors (M, +) est un groupe commutatif. 


Démonstration. Il suffit de calculer (1 + 1) : (x + y) de deux façons différentes : 


(+1) -(z+y)=1: (x+y)+1: (c+y)=r+y+Tr+y (1.453) 
d’une part et 
(+1) -(z+y)=(1+D z+(+l) y=r+r+y+y, (1.454) 
d'autre part. En égalant les deux expressions, il vient 
THY+THY=T+T+Y+UY, (1.455) 
qui se simplifie (nous sommes dans un groupe) en y + x = x +. 
DEFooKHWZoo1fxdNc 
Définition 1.325. 
Un espace vectoriel est un module !?7 sur un corps commutatif #. 
DEFooRUKVooLnXxdS 


Définition 1.326 ([65]). 
Soient un A-module M et un ensemble I. Une famille {mi}ier est libre si les m; sont linéairement 
indépendants, c’est-à-dire si pour tout choix d’une partie finie J dans I et d'éléments (a;)jey 
dans À, si nous avons 
DR (1.456) 
jeJ 
alors a; — 0 pour tout j. 
DEFooWBOBooJNyyBF 
Définition 1.327 ([66]). 
Soit S, une partie du A-module M. Le sous-module engendré par S est l’ensemble des éléments 
de M qui sont des combinaisons linéaires finies d'éléments de S, c’est-à-dire de sommes de la 
forme 
XT (1.457) 
teT 
où T est fini dans S et & € À. 


1.17.1 Module produit 
DEFooLCJEooBvVmkV 


Lemme-Définition 1.328 ([65]). 
Soient un anneau À et un ensemble I. Le A-module produit A! est l’ensemble des applications 
I — À. 


En termes de notations, nous écrivons ceci : 
Al = {(as her; dj € A}. (1.458) 
L'ensemble AT devient un module par les définitions, pour x,y € Al eta€ À : 


ax = (aT;)ier PTE 
D +Y = (ri + Yi)ier. Der 11808) 


En d'autres termes, A1 = Fun(I, À). 


127. Définition 1.323. 
128. La condition de commutativité n’est pas indispensable, mais comme nous ne parlerons que de corps commu- 
tatifs..…. 
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Démonstration. Il faut vérifier toutes les conditions de la définition 1.323. En guise d'exemple, 
nous vérifions la distributivité. Soient a e À et x,ye Al. Nous avons 


[a + (æ+v)], = a(x + y (1.459a) (1.460a) 
= a(ti + y) (1.459b) (1.460b) 
= A; + AY distrib. dans À (1.460c) 
= (ax + ay); (1.459b). (1.460d) 


Lemme 1.329. 
Pour chaque i € I nous considérons l'élément e; e Al donné par 


Ci: I — À 
| si j =i (1.461) 
Jr 


O sinon. 


La famille {e;};er est libre l?° dans A1. 


Démonstration. Soient J fini dans Z ainsi que des éléments a; € À (j € J). Nous supposons que 188 


Des aje; = 0. Calculons un peu : 
>, aje; — D (aÿôgi)ier —= o si) ë (1.462) 
jEeJ jEJ jEJ il 

Pour que le tout soit nul dans A? il faut que 


> aj0ji (1.463) 
jeJ 


soit nul pour tout à € I. Si nous fixons à € 7, la somme sur j possède un seul terme non annulé par 
Ôj:, et c’est le terme j = 1. Nous avons donc a; = 0. 


DEFooBMEPooFsCHgb 
Définition 1.330. 
Nous notons AU) le sous-module de A! engendré! par les e;. 


Lemme 1.331 ([1]). 
L'ensemble AU) est l’ensemble des applications I — A de support fini. 
Démonstration. En deux sens. 


(1) Sixe AU) Pour rappel, la définition 1.328 nous dit que x est une application J — A. Vu 
que x est dans le sous-module engendré par les e;, il existe une partie finie J € I telle que 


= . HÉLrE (1.464) 
jeJ 


Pour à € I nous avons 


a 
æ(i) = > Tjdij = É ue (1.465) 


‘ei O0 sinon. 


Donc le support de x est dans J qui est fini. Vu que toute partie d’un ensemble fini est fini 
(lemme 1.115), le support de x est fini. 


129. Définition 1.326. 
130. Pour rappel, les sommes finies sont définies par 1.302. 
131. Définition 1.327. 
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(2) Si x est de support fini Supposons que le support de x: 1 — À soit la partie finie J € I. 
En notant x; = x(j) pour tout j € J, nous avons 


= », Tjej. (1.466) 
jEJ 


THOooPDZCooJnHbOÜd 
Théorème 1.332 (Propriété universelle de A0)[65]). 
Soient un anneau À ainsi qu’un A-module P. Pour o e Hom4(AU), P), nous considérons 


:T— P 
à (1.467) 
ir (ei). 
(1) L'application 
: Homa(AU), P) — Fun(1, P 
nn (1.468) 
pr dlr 
est une bijection. 
(2) L'application inverse est g: Fun(I, P) — Hom4(AU), P) donnée par 
g()( D aje;) = D ads) (1.469) 


jeJ jeJ 
pour tout J fini dans I et choix de a; € À. 


Démonstration. Nous allons montrer que g(f(@)) — et que f(g(w)) — 4 pour tout € 
Hom14(A0), P) et pour tout Ÿ e Fun(I, P). 
Dans un premier sens nous avons : 


g(f(@)) (D ae) = Da; f(8)(5) (1.470a) 
j j 
= V'ajô(e;) FPÉRESIOOENE ASIE 
: S _. ru 
En J T7" ‘ 
j 


Justifications : 
— Pour (1.470b), nous avons utilisé le fait que f(@)(i) = D|r(i) = (ei). 
— Pour (1.470c), nous utilisons le fait que @ est un morphisme de modules. 
Et pour l’autre sens, 
f(g()) (0) = g(p)(ei) = w(i). (1.471) 
Vérifions que cela est suffisant pour que f soit une bijection. 


(1) Surjectif Soit 4 € Fun(J,P). Nous avons f(g(#)) = 4, ce qui prouve que 4 est dans 
l’image de f. 


(2) Injectif Supposons que f(d1) = f(p2). Alors en appliquant g des deux côtés, il vient 
®1 = Do. 
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1.17.2 Sous-module 


Soient M un A-module et x = (x;);er une famille d'éléments de M paramétrée par l’ensemble 
I. Nous considérons l’application 


Lx : AG) — M 
(&)ier > GE (1.472) 
iel 
Ici AU) désigne l’ensemble de toutes les applications ? — A de support fini (définition 1.330). 
DefBasePouyK; 


Définition 1.333. 
À l'instar des espaces vectoriels, les modules ont une notion de partie libre, génératrice et de bases : 


(1) Si u»x est surjective, nous disons que x est une partie génératrice. 
(2) Si u»x est injective, nous disons que la partie x est libre. 


(3) Si ux est bijective, nous disons que la partie x est une base. 


Définition 1.334. 
Un sous-ensemble N € M est un sous-module si (N,+) est un sous-groupe de (M,+) et si 
a :æe N pour tout x e N et pour tout a € À. 


Exemple 1.335. 
Un anneau À est lui-même un A-module et ses sous-modules sont les idéaux. A 


Définition 1.336. 
Soit M un module sur un anneau commutatif À. Un projecteur est une application linéaire 
p: M — M telle que p? = p. 
Une famille (pijier sur M est orthogonale si p; o p;j = 0 pour tout i # j. La famille est 
complète si D. pi = 1. 
ThoProjModpAlsUR 
Théorème 1.337. 
Soient des sous-modules M:,...,M,, du module M tels que M = M @...® M,. Les applications 
pi définies par 
pi(ti +... + En) = % (1.473) 


forment une famille orthogonale de projecteurs et p1 + +: + pn = Id. 
Inversement, si (p1,...,Pn) est une famille orthogonale de projecteurs dans un module € tel 
que D pi = Id, alors 


M = Dri(M). (1.474) 
i=1l 


Définition 1.338. 
Un module est simple ou irréductible si il n’a pas d’autres sous-modules que {0} et lui-même. Un 
module est indécomposable si il ne peut pas être écrit comme somme directe de sous-modules. 


Un module simple est a fortiori indécomposable. L’inverse n’est pas vrai comme le montre 
l'exemple suivant. 


Exemple 1.339. 

Soit £ = C[X]/(X?) vu comme C[X]-module. C’est le C[X]-module des polynômes de la forme 
aX + b avec a,b € C. L'ensemble des polynômes de la forme aX est un sous-module. Le module 
€ n’est donc pas simple. Il est cependant indécomposable parce que {aX} est le seul sous-module 
non trivial. En effet si F est un sous-module de € contenant aX + b avec b Æ 0, alors F contient 


X(aX +b) = bX et donc contient tout €. A 
DefAEbnJql 
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Définition 1.340 (Algèbre[67]|). 
SiK est un corps commutatif *?, une K-algèbre A est un espace vectorie muni d’une opération 
bilinéaire x : À x À — À, c’est-à-dire telle que pour tout x,y,2€ À et pour tout a, Be K, 


1133 


(1) (T+y)xz=rx2+yxz 
(2) xx (y+2:)=rxy+rxz 
(3) (ax) x (By) = (aB)(x x y). 


Si À et B sont deux K-algèbres, une application f : À — B est un morphisme d’algèbres entre 
A et B si pour tout x,y € À et pour tout ae K, 

(1) f(xy) = f(x)f(y) 

(2) f(x + ay) = f(x) + af(y) 
où nous avons noté Ty POUT TX X y. 

LEMooVKLKooSAHmpzZ 

Lemme 1.341 ([1|). 
Soient une algèbre À et une famille (X;);er de sous-algèbres de A (ici T est un ensemble quelconque). 
Alors la partie X = (,-, X; est une sous-algèbre de A. 
Démonstration. Nous devons prouver que si x et y sont dans X et À € K, alors xy, x + y et Àx 
sont dans X. Pour tout à € I nous avons x,y € X,; et donc xy € X;,x +ye X; et Àx € X; (parce 


que X; est une algèbre). Donc xy, x + y et Àx sont dans X; pour tout 1, et donc dans X. 
DefkAXaWY 


Définition 1.342. 
L'algèbre engendrée par X est l'intersection de toutes les sous-algèbres de À contenant X (qui 
est une algèbre par le lemme 1.3/1). 


1.18 Caractéristique d’un anneau 
LEMDEFooVEWZooUrPaDw 
Lemme-Définition 1.343. 
Soit l'application 
u:Z— A 


ne n la 


(1.475) 


où n : LA signifie Dy_1 LA. 
(1) C’est un morphisme d’anneaux. 
(2) Le noyau est un sous-groupe de Z 
(3) Il existe un unique p € Z tel que ker(u) = pZ. 


Ce p est la caractéristique de À. 


Par exemple la caractéristique de À est zéro parce qu'aucun multiple de l'unité n’est nul. 
À propos de diagonalisation en caractéristique 2, voir l’exemple 9.217. 


Lemme 1.344. 
Si À est de caractéristique nulle, alors À est infini. 


Démonstration. En effet, ker u = {0} implique que nl4 Æ# mla dès que n Æ m et par conséquent 
A contient Z11, et est infini. 


LemHmDaYH 
Lemme 1.345. 
Soit un anneau À de caractéristique p. ITEMooPKSEooPKChGM 
(1) Sip > 0, alors nous avons l’isomorphisme d’anneaux 
Z1lA = Z/p7. (1.476) 


132. Définition 1.202 
133. Définition 1.325. 
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ITEMooBTUIooYzOycc 
(2) Si p = 0, alors nous avons l’isomorphisme d’anneaux 


Zla = Z (1.477) 


Démonstration. Pour (1), l’isomorphisme est donné par l'application nl4 + d(n) si est la 
projection canonique Z — Z/p7Z. 
Pour (2), la preuve est encore à faire. Ecrivez-moi. 


PropGExaUK 
Proposition 1.346. 
La caractéristique d’un anneau fini divise son cardinal. 
Démonstration. Si À est un anneau, le groupe Z agit sur À par 
n'a=a+nl. (1.478) 
Chaque orbite de cette action est de la forme 
Où = {a+ nla tel que n =0,...,p—1} (1.479) 


où p est la caractéristique de À. Les orbites ont p éléments et forment une partition de À, donc le 
cardinal de À est un multiple de p. 


LEMooJQIKooQgukqn 
Lemme 1.347 ([68]). 
Un anneau totalement ordonné est de caractéristique nulle. 


Démonstration. Le morphisme u: Z — A,nt n1l41 est strictement croissant, en particulier u{x) # 
u(y) dès que x # y. Donc ker(u) = {0}. 


L'ensemble typique de caractéristique p est F, = Z/pZ. 


PropFrobHAMKTY 
Proposition 1.348. 
Soit À un anneau commutatif unitaire de caractéristique p. L'application 
Frob1: À — À 
. (1.480) 
x x 


est un automorphisme d’anneau unitaire. 


Nous le nommons le morphisme de Frobenius. Nous utiliserons aussi les itérés du morphisme 
à k 
de Frobenius : Frobf: x + 2°”. 


Exemple 1.349. 
Soit à factoriser XP? — 1 dans F,. Grâce au morphisme de Frobenius, nous avons immédiatement 


XP_1=(X-1ÿ. (1.481) 


À 


LemCaractIntergernbrcartpre 
Lemme 1.350. 


La caractéristique !** 


d’un anneau intègre est zéro ou un élément premier 
Démonstration. Si À est intègre, alors Z11 est a fortiori intègre. Notons p la caractéristique de 
A. Si p = 0, la preuve est finie; supposons donc que p # 0. Alors, l'anneau Z/pZ est isomorphe à 
Z1 1, et est donc intègre. Or, la proposition 1.236 dit que Z/pZ est intègre si et seulement si p est 
premier, ce qui conclut la preuve. 


134. Définition 1.343. 
135. Définition 1.184. 
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Exemple 1.351. 

Il existe des corps dont la caractéristique n’est pas égale au cardinal (contrairement à ce que 
laisserait penser l’exemple des Z/pZ). En effet les matrices n x n inversibles sur F3 forment un 
corps qui n’est pas de cardinal trois alors que la caractéristique est 3 : 


CRUE cs 


A 


1.18.1 Caractéristique deux 


Beaucoup de résultats demandent une caractéristique différente de deux. Qu’a donc de parti- 
culier la caractéristique deux ? 

Si K est un corps de caractéristique 2, alors l'égalité x = —x n'implique pas x = 0, puisque 
2x = 0 est vérifiée pour tout x. Cela se répercute sur un certain nombre de résultats. Par exemple, 
en caractéristique deux, une forme antisymétrique n’est pas toujours alternée : voir le lemme 9.6. 


1.19 Polynômes 


1.19.1 Polynômes d’une variable 


Et voilà la définition que tout le monde attendait ; la définition des anneaux de polynômes. 
Pour ne pas taper trop fort du premier coup, nous commençons par les polynômes d’une seule 
variable 16, 

L'ensemble des polynômes sur A sera simplement AN) (notation 1.330). Puisque IN est un 
ensemble bien particulier possédant plein de structure, nous allons pouvoir installer sur AN) une 
structure non seulement de A-module (ça c’est déjà fait), mais en plus d’anneau, ainsi qu’une 
évaluation. 


DEFooFYZRooMikwEL 
Définition 1.352. 
L'ensemble des polynômes en une indéterminée sur l’anneau À est l’anneau 
P(4) = AN) (1.483) 
défini en 1.330. 
1.353. 
En ce qui concerne la notation A[X|, voir 1.19.2. Pour K(X) lorsque K est un corps, voir 6.83. 
DefDegrePoly 


Proposition-Définition 1.354 ([69]). 
Soit P non nul dans P(A). Nous notons a, la valeur !*7 de P enneN : P = (an)neN: 


(1) L'ensemble {n € N tel que a, # 0} est fini dans N. 
(2) Cet ensemble possède un minimum et un maximum. 
Le degré de P est 


deg(P) = max{n € N tel que an Z 0}, (1.484) 
et la valuation de P est 
val(P) = min{n tel que an Æ 0}. (1.485) 
Nous notons EQooAULIooDgo 
Pn(A) = {P € P(A) tel que deg(P) < n}, La PEAR) 


136. Pour les polynômes à plusieurs variables, voir la définition 3.47. 

137. Ici il y à une énorme subtilité de terminologie. Formellement, P est une application IN — À. Cela n’a rien à 
voir avec le fait que P puisse être évalué sur À avec des formule du type P(x) = Y;, ant". D'ailleurs nous n’avons 
pas encore vu cette évaluation. 
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Dans le cas du polynôme nul, l’ensemble {n € N tel que an Æ 0} est vide, et les définitions ne 
s'appliquent pas. Nous convenons que 


val(0) = +00 (1.487a) 
deg(0) = —co. (1.487b) 


Démonstration. Le fait que P soit non nul implique que À = {n € N tel que a, # 0} est non vide. 
De plus cet ensemble est fini parce que P € AN), Toute partie finie non vide de NN étant majorée 
et minorée (lemme 1.64), le lemme 1.65 définit correctement le minimum et le maximum de À. 


Vu que AN) est engendré par les e;, tout polynôme sur À s'écrit P = > He: 
DEFooNXKUooLrGeuh 
Définition 1.355. 
Nous ajoutons deux structures à AN), 


L'évaluation Si ae À et si P e A(N), nous définissons P(a) par 
Ce Un à EQooDJI 
P(a) = (D œei)(a) = Ÿ ao’, es So AR 
i=0 i=0 


étant entendu que a° = 1 dans À. 


Cette définition s'étend immédiatement au cas où B est un anneau qui étend À. Dans ce cas 
nous pouvons définir P(b) pour tout P € AN) etbe B avec la même formule (1.488). 


Le produit C’est ici que la structure particulière de N est utilisée. Nous définissons le produit 
AN x AN) =, A(N) Ge la façon suivante. Si (P£)gen est la suite (presque partout nulle) 
d'éléments de À qui définit P et si (Qx)xen est celle de Q, nous notons 


eo), = 60: EQooTNCSookl LE 


k=0 


et donc PQ = Ÿ,(PQie;. Plus explicitement, 


(Due) be) = > ( : aib; )ex. ee 1 
i=0 j=0 


Notons qu'à droite, la somme sur k est une somme finie. 


PROPooGDQCooHziCPH 
Proposition 1.356. 
Soit un anneau A. À propos de structure sur AN). 
(1) Avec le produit, l’ensemble AN) devient un anneau. 
(2) L'application 
: AIN), À 
À (1.491) 
P+ P(a) 


est un morphisme d’anneaux !®. En particulier, (PQ)(a) = P(a)Q(a). 


Démonstration. En plusieurs points 


(1) Anneau L'identité pour le produit dans AN) est le polynôme donné par ao = 1 et a; = 0 


pour à £ 0. Cela se vérifie en utilisant directement la définition (1.490). La distributivité 


aussi 1, 


138. Définition 1.42. 
139. Je n'ai pas fait les calculs, écrivez-moi pour me dire si ça va facilement. 
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(2) Le morphisme Nous notons P, les éléments de la suite définissant P et Qx ceux de Q. 


Alors nous avons 


(P+Q)(a) = D (Pr + Quai = Ÿ Prof + Ÿ Qrof = P(a) + Q(a). (1.492) 
k k 


k 


Vous aurez noté que la première égalité était la définition (1.459b). De même, 


P(a)Q(o) = (5 Pro")(S Que) = D QD Paa”)of = NS QuPra"tF  (1.493a) 
n k k nm kn 


=} o PQm-1)0" = Ÿ (PQ}ma” = (PQ)(a). (1.493b) 
1=0 


m m 


LEMooWVUXooQlaep0O 
Lemme 1.357. 


Si À est commutatif, alors AN) 


est commutatif. 
Démonstration. Soient P,Q e AN); pour rappel, le produit est donné par la définition 1.489. 
L'application 

gp: {0,...,n} — {0,...,n} 


1.494 
ke=n—k 
est une bijection. Voici maintenant le calcul : 
nm 
(PO= PO (1.495a) 
k=0 
nm 
SUBEQoo1ISTNooLP 
= Bp0 ABB] 
k=0 
nm 
= SP, Qu (1.495c) 
k=0 
L BE A00F 
=> os PAPE M 1004) 
k=0 
= (QP}n. (1.495e) 
Justifications 
— Pour (1.495b). Lemme 1.302 et le fait que y soit une bijection. 
— Pour (1.495d). Commutativité de À. 
1.19.2 La notation A[X] 
SUBSECooLEKVooFBPSJz 


Si À est un anneau, nous avons déjà défini les polynômes en une indéterminée sur À comme 
étant le module AN) qui est devenu un anneau par la proposition 1.356. 
Le polynôme donné par la suite (a,)neN est souvent notée 


ax (1.496) 
k 


Par exemple avec a = (4,2,8) nous avons a = 8X? + 2X + 4. Nous utiliserons souvent cette 
notation, qui est très pratique parce qu’elle s'adapte bien aux règles de multiplication et d’addition, 
en particulier la distributivité. 

Il y à (au moins) deux façons de comprendre ce que signifie réellement « X » dans cette notation. 
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1.19.2.1 Première façon (qui botte en touche) 


La première est de dire qu’il n’a pas de significations, et que X? est un simple abus de notations 
pour écrire (0,0,1,0,---). Avec cette façon de voir, nous notons l’anneau des polynômes sur À par 
& A[X] » où le X n’a pas d’autres raisons d’être que d’avertir le lecteur que nous réservons la lettre 
« X » pour utiliser la notation pratique des polynômes. 


1.19.2.2 Seconde façon (la bonne) 
SUBSURSEMO0OHNBVooBXHHxg 


1.358. 

La seconde façon de voir le « X » est de nous rappeler que A) à une base en tant que module : les 
ex dont nous avons parlé plus haut. Nous posons X = e1, et nous prenons la convention X° = 1. 
Alors nous avons ex; = XF et nous notons A[X] l'anneau AN) exprimé avec X. 

Dans les deux cas, il n’est pas vraiment légitime d’écrire des égalités comme « P(X) = X? + 
2X — 3 », et encore moins de dire « Le polynôme P, évalué en X vaut X? +2X — 3 » : il est plus 
correct d'écrire « P = X?2+2X — 3 ». 

Le lemme suivant montre que ces notations tombent vraiment à point. La véritable difficulté 
de l’énoncé est de comprendre qu’il n’est pas trivial. 

Nous avons vu dans la définition 1.355 que si B est un anneau qui étend A, et si P e A[X|], 
alors nous avons une définition de P(b) pour tout b € B. Nous appliquons cela à B = A[X|, qui 
est un anneau qui étend À. Autrement dit, si P et Q sont des polynômes, ça a un sens d’écrire 
P(Q) et le résultat sera un élément de A[X|. 


Dans le cas particulier Q = X, nous avons une chouette formule. 


LEMooGKWQooVOyeDX 
Lemme 1.359. 
Nous avons 
P(X)=P (1.497) 
pour tout PE AÏX|. 
Démonstration. Si P = (ay)xen alors par définition P(a) = Y},axa* dès que à est dans un 


anneau B qui étend A. Nous considérons le cas particulier B = A[X] et a = X, c’est-à-dire 
Q = (0,1,0,...), l'élément P(X) de A[X] vaut 


» ax k FAGOR CREER, 


qui est exactement P lui-même. 


Mais il faut bien comprendre que si P est le polynôme (—3,2,1,0,...), noté X?+2X —3, écrire 
P(X) = X?+2X —3 est une pirouette de notations que rien ne justifie par rapport à simplement 
écrire P = X?2+2X — 3. 


1.19.3 Action du groupe symétrique 


DefActionGroupe 
Définition 1.360 (Thème 9). 
Une action de groupe G sur un ensemble E est la donnée, pour chaque élément g € G@, d’une 
Jonction @, : E — E, de telle sorte que : 


De(t) = ZX, Vxe FE; 
Pgh(t) = Py(bn(x)), Vag,heG,VreE. 
On dit dans ce cas que G agit sur E. 


Par souci de notations, nous notons P,(A) l’anneau des polynômes de n variables sur A. La 
propriété universelle de P,(A) = AN") du théorème 1.332 nous donne une application 


g: Fun (N°, Pa(A)) — Hom4 ( Pr(A), Pn(A)) (1.499) 
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Avec cela nous pouvons énoncer et démontrer le lemme qui donne l’action de S, #0 sur P, (A). 


LEMooIRVQooHvoNBq 
Lemme 1.361 ([70]). 
Pour © € S, nous définissons 
oc: N° — Pa(A 
9 (a) (1.500) 
mr Ec(m): 
Alors l’application 
: Sn — Hom1(P,(A4), Ph(A 
p à (Pn(4), Pa(A)) —. 


gt g(pa) 


est une action 11. 


Démonstration. Nous commençons par donner une expression à notre p. Un élément de P, (A) est 
de la forme Yen Am@m, et nous avons 1? 


p(o)( D Re) = D ambo(m) = Joe (1.502) 


meN? 


Nous avons tout de suite p(Id) = Id. 
En ce qui concerne la composition, nous avons d’une part 


p(o102)(D | amêm) = 9(Bc102)( D ,Amêm) = D, AmEv1o2(m): (1.503) 

et d'autre part, | L L 
p{o1)p(02)( D amêm) = P(01)( D AmEga(m)) (1.504a) 
no E ange) PERTE 


_ > Dors t(m)Co1(m) (1.504c) 


_ “ _——— A NOR PRG ES 


La proposition 1.303 est utilisée pour (1.504b) et pour (1.504d). 


1.19.4 Corps des fractions 
DEFooGJYXoo0UiJQvP 


Définition 1.362 ([71]|). 
Soit un anneau commutatif et intègre! A. Nous posons E = A x A\{0}, et nous définissons les 
deux opérations suivantes sur E : ITEMooWBWHooYsXFkO 


(1) (a,b) + (c,d) = (ad + cb, bd) ; ITEMooG00100CHqLR1 
(2) (a,b)(c,d) = (ac, bd). 
Et aussi la relation d'équivalence (a,b) + (c,d) si et seulement si ad = bc. 
Le corps des fractions de À est le quotient 


Frac(A) = (A x A\{0})/—. (1.505) 


Nous notons a/b la classe de (a, b). 
Lorsque À est un anneau de polynômes “*, alors les éléments de Frac(A) sont des fractions 
rationnelles. 


140. Définition du groupe symétrique S, en 1.267. 

141. Définition 1.360. 

142. La somme est définie par 1.302, et ça va être important. Ah oui, en réalité partout, les sommes sont finies 
parce que les am (m € IN") sont presque tous nuls. Il faudrait écrire sur la somme sur {m € IN? tel que am # 0}, 
mais vous vous imaginez la complication dans la notation. 

143. Définition 1.193. 

144. Définition 1.352. 
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Le fait que À soit intègre est important pour être certain que bd Æ 0 sous l’hypothèse que 
b,d # 0. 
La proposition suivante montre encore que le corps des fractions est le plus petit corps que l’on 


puisse imaginer à partir d’un anneau. 
PROPoo1JBEooDjsoHr 


Proposition 1.363 ([12, 1]). 
Soit un anneau commutatif A. Tout corps commutatif contenant un sous-anneau isomorphe | à 
A contient un sous-corps isomorphe à Frac(A). 


Démonstration. Soit un corps K contenant un sous-anneau À’ isomorphe à A. Nous notons o: 4! — 
À un isomorphisme d’anneaux entre À’ et A. 


(1) Une partie bien choisie 


Nous considérons la partie suivante de K : 
= {ab ! tel que a,be A'}. (1.506) 


(2) S est un corps Deux éléments arbitraires de S sont ab! et xy !. Nous devons prouver 
plusieurs choses. 


(2a) Neutres En prenant a = b = 1 nous avons ab! = 1€ S. En prenant a = 0 et b=1 
nous avons ab l=0ES. 


(2b) Somme Il faut remarquer que ab! + xy ! = (ay + xb)(by) !. En effet, 


(ay + xb)(by) ? = (ay + xb)y lb! (1.507a) 
Lan ah RETRAIT 
L ab1 F un FER RETe 


Justifications : 
— Pour (1.507b). Distributivité. 
— Pour (1.507c). Commutativité dans À. 


(2c) Produit Il s’agit du même genre de calculs en utilisant les mêmes propriétés. Nous 
avons 


(ab 1)(ay 7) = (ax)(by) (1.508) 


(3) Ce qui va être notre isomorphisme 


Ensuite nous montrons que l’application 
gæ: S — Frac(A) 


ab + o(a)/o(b) 00) 


est bien définie et est un isomorphisme de corps. 


(4) Bien définie 
Si ab! = xy | alors ay = rb. Puisque a est un isomorphisme nous avons aussi o(a)o(y) — 


o(x)o(b) et donc o(a)/o(b) = o(x)/o(y) par définition des classes de Frac(A). 


(5) Morphisme Deux éléments arbitraires de S sont ab! et xy-!. Calculons un peu : 


o((ab-)(2y"1)) = p{axy . SUBEQooRONTo eFUTRez 
. p((ax)( F SUBEQooNOTAo #10) 

= (1.510c) 

= (o(a)/a (b)) (o(x)/o(y)) ane says 

= p(ab")p(xy"). (1.510e) 


Justifications : 


145. Morphisme d’anneaux, définition 1.42. 
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— Pour (1.510a). Commutativité dans À. 
— Pour (1.510b). Associativité dans À. 
— Pour (1.510d). Définition 1.362(2) de la multiplication de fractions. 
(6) Surjectif 
Tout élément de Frac(A) est de la forme a//b' avec a/,b' € À, et donc de la forme o(a)/o(b) 
avec a,b € A’. Un tel élément est l’image par @ de ab le S. 
(7) 
g(ab-!) = p(xy !) alors o(a)/o(b) = o(x)/o(y), et par définition des classes nous avons 


. ) = o(b)o (a ). De 1à nous avons o(ay) = o(bx) et donc ay = bx (parce que o est un 


isomorphisme). Nous en déduisons que ab! = xy”!. 


1.364. 
Soit un anneau À et son anneau des polynômes P(A). Si & € À, nous avons la définition 1.355 qui 
donne l'évaluation P(a). 

Si par contre P et Q sont des polynômes sur À, nous n’avons pas encore défini ce que serait 


l'évaluation de la fraction rationnelle P/Q en a. Nous comblons à présent ce manque. 
DEFooLBIWooCPCasSY 


Définition 1.365 (Évaluation d’une fraction rationnelle). 
Soit un corps K contenant l’anneau A. Si R = P/Q € Frac(A) et si a € K nous définissons 


R(a) = (P/Q)(a) = P(a)Q7"(a). (1.511) 


Dans cette formule, les polynômes, l’inverse et le produit sont calculés dans K et non dans A. 
ThogbhWgo 


146 


Théorème-Définition 1.366. 
Soit À un anneau commutatif intègre. 


(1) Il existe un couple (K,e) où K est un corps commutatif et e: À — K est un morphisme 
injectif d’anneaux tels que pour tout XE K, il existe (a,b) € À x A* tels que 


À = e(a)(e(b)) * (1.512) 


(2) Si(K',e) est un autre couple qui vérifie la propriété, les corps K et K’ sont isomorphes. 
Le corps K associé à l’anneau À est le corps des fractions de À, et sera noté Frac(A). 


(3) Nous posons 


og: Ax AK 
(1.513) 
(a,b) + e(a)(e(b)) 
Nous avons 
o(xa, xb) = o(a, b) (1.514) 
pour tout a, b,x € A. 
1.19.5 Corps totalement ordonné 
DefKCGBooLRNdJf 
Définition 1.367. 
Ordre et choses reliées dans un corps. ITEMoo000VooJWwIQr 


(1) Un corps K est totalement ordonné si il existe une relation d'ordre tq{hoo 24 BÉinene ; 


(la) x < y implique x + z < y + z pour tout x,y,z2E K CONDooBYYDo0E1XgP0 


(1b) x >0 et y > 0 implique xy > 0. 


146. Les fractions rationnelles, définition 1.362. 
147. Définition 1.12. 
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ItemooWUGSooRSRvYC 
(2) Si K est un corps totalement ordonné, nous y définissons la valeur absolue par 


el _ : six >0 + PET) 
—T zx < 0. 


si x 
ItemVX0ZooTYpcYN 


(3) La suite (x») dans le corps totalement ordonné K est de Cauchy si pour tout € € K*, ül 


| | . ne 
existe N € N tel que si p,q > N alors |x, — tal < € ITEMooDERQooLmJwFR 


(4) La suite (xn) dans le corps totalement ordonné K est convergente si il existe q € K tel que 


pour tout e€ K*, il existe N tel que sik > N alors xx — ql <e. ITEMooKZZYooDaidCU 
(5) Un corps totalement ordonné est complet si toute suite de Cauchy y est ER YARIS SE ZRVyn 


(6) Sia,ee K avec € > 0 alors nous définissons la boule ouverte de centre a et de rayon € par 
B(a,e) = {xe K tel que |a — x| <e}, (1.516) 

et la boule fermée par 
B(a,e) = {xe K tel que |a — x| < €}. (1.517) 


Lemme 1.368. 
Une suite (xx) converge vers q si et seulement si pour tout € > 0, il existe N > 0 tel que xx € B(q,e) 
pour tout k > N. 


Démonstration. I s’agit de mettre côte à côte les points (4) et (6) de la définition 1.367. 


1.369. 
Ces boules prendront une nouvelle force avec le super-théorème 7.109. 


Parmi ces définitions, celles de suite convergente, de Cauchy et de corps complet seront utili- 
sées dans le cas de Q (et de R pour la complétude). Elles seront prouvées être équivalentes aux 
définitions topologiques dans le cas particulier de R et À lorsque la topologie métrique sera définie. 
Dans cet état d'esprit nous n’allons pas démontrer tout de suite que R est un corps complet. Nous 
allons directement démontrer que c’est un espace topologique complet. 


LEMooXJTAooZauchx 
Lemme 1.370 (Règle des signes|72]). 
Soit un corps totalement ordonné K ainsi que x,y € K. Nous avons : 
(1) Six <0 et y < 0 alors xy > 0. 
(2) Six <0 et y > 0 alors xy < 0. 
(3) Six 20 et y <0 alors xy < 0. ITEMooRGYAooCUIfss 
(4) 0<1. ITEMooMRNHooLglPKn 
(5) Si x > 0 alors x! > 0. 
LemooANTJooYxQZDw 


Lemme 1.371 (Propriétés de la valeur absolue). 


Soit K un corps totalement ordonné. Si x, y € K alors !* ItemooNVDIooSuiSoB 
(1) Six > 0 alors —x < 0. ITEMooVNAZooSxmtuH 
(2) Six <0 alors —x 2 0. ITEMooSDNHooDnjScE 
(3) x] 2 0 ITEMooLQLTOoOT JTPVM 
(4) {xl = 0 si et seulement si x = 0 ITEMooVJAEOODEatzY 
(5) |— xl = xl. 


148. La « valeur absolue » est définie en (1.367)(2). 
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ItemooUMKNooRlanvk 
(6) 1x +yl <lxl + lyl. ITEMooEFMLooYVCuHD 
(7) Ixyl = |x||yl 


Démonstration. Point par point 


(1) (1) Nous partons de x > 0 et nous ajoutons —x des deux côtés en profitant de la définition 
d’un corps totalement ordonné : x — x > —x et donc 0 > —x, c’est-à-dire —x < 0. 


(2) (2) Nous partons de x < 0 et nous ajoutons —x des deux côtés. 
(3) (3) Six > 0 alors c’est vrai. Sinon, x < 0 et |x| — > 0 par le point (1). 


(4) (4) Six = 0 alors x = —x et [x] = 0. Au contraire si x Æ 0 alors —x Z 0 et que x soit 
positif ou négatif, nous aurons toujours +x # 0. 

(5) (5) Il faut décomposer en deux cas selon que x > 0 et x < 0. Supposons x > 0. Alors d’une 
part |x| = x. D'autre part —x < 0 par le point (1), de telle sorte que 


[— x = —(-x) = x. (1.518) 


Nous avons donc |x| = | — x| = x. 
Le même raisonnement tient avec x < (0. 


(6) (6) Nous supposons que x < y et nous distinguons divers cas suivant la positivité de x et 


(6a) Si x,y > 0. Dans ce cas, x + y > y > 0, donc |x + y] = x + y = |x| + |y|. 
(6b) Si x,y < 0. Dans ce cas, x + y < 0 et nous avons |x + y] = —x — y = |x| +|y|. 


(6c) Si x < 0 et y > 0. Nous subdivisons encore en deux cas suivant que x + y est positif ou 
négatif. Si x + y > 0, alors nous écrivons successivement 


x <0 (1.519a) 
z+y<y<y+lrl = x] +|yl (1.519b) 


et donc [x +yl = x +y< x] + |yl. 
Nous supposons à présent que x < 0, y > 0 et x + y < 0. Dans ce cas il suffit d'écrire 
Ix + y] = |[(—-x) + (—y)| pour retomber dans le cas précédent à inversion près de # et y. 
(7) Pour (7) Il suffit de prendre les 4 cas suivant les signes de x et y, et d’utiliser les règles de 
signes du lemme 1.370 dans la définition 1.515. 


RemooJCAUooKkuglXx 
Remarque 1.372. 
La partie (6) est très importante parce que c’est elle qui fera presque toutes les majorations dont 
nous aurons besoin en analyse. En effet elle donne l'inégalité triangulaire de la façon suivante : si 
æ,y,z € K nous avons 
I —yl=|(x-2)+(2- y) < ir -21+12- 71. (1.520) 
LEMooQXDCooPEABBm 
Lemme 1.373 (À propos de boules). 
Soient un corps totalement ordonné K et des éléments x,y € IK. Soit aussi € > O0 dans K. Nous 
avons : ITEMooXJGVooSebiip 


(1) ye B(x,e) si et seulement six —-e<y<x+e. ITEMooRUBBooRay iMs 


(2) Siye B(x,e) alors y € B(x,€) pour tout € > €. 


Démonstration. Pour rappel, 


— iT— 0 
s-u- du ‘ (1.521) 


> 
Y—T SiT—-Y< 


Nous pouvons maintenant démontrer nos assertions. 


234 CHAPITRE 1. CONSTRUCTION DES ENSEMBLES DE NOMBRES 


(1) (1) En deux parties. 
(1a) = Nous supposons que |x — y] < €. 
Si x —y > 0 alors l'hypothèse signifie x — y < €, ce qui donne y > x —e. Mais l’inégalité 
x — y > 0 donne également x > y et donc x +e > y +e > y. Notez le jeu de l'inégalité 
non stricte qui se change en inégalité stricte. 


Si x — y < Ü nous pouvons faire le même raisonnement. 


(1b) = Des inégalités x — € < y et y < x + € nous tirons æ — y <e et y—x <e. Donc quel 
que soit le signe de x — y nous avons toujours [x — y| < €. 


(2) (2) 


C’est immédiat parce que 


x —yl <e<é. (1.522) 


LEMooVZNCooRJatKK 
Lemme 1.374. 
Tout corps totalement ordonné est de caractéristique nulle. 


1.20 Les rationnels 


Note : pour l'existence et l’unicité de l'écriture q = k/d, il faut voir le théorème 3.33. 
Une construction très explicite est faite dans [17]. Ici nous allons prendre plus court : 


Définition 1.375. 


Le corps des fractions de Z, (définition 1.362) est noté À et ses éléments sont les rationnels. 
PROPooUULNooKbwuEw 


Proposition 1.376. 
L'application 
: 7 — 
j u (1.523) 
2H 2/1 


est une injection. 


Démonstration. Supposons que f(a) = f(b), c'est-à-dire que a/1 = b/1. En vertu de la relation 
d'équivalence donnée en 1.362, nous avons al = b1, c’est-à-dire a = b. 


1.377. 
À partir de maintenant, nous allons identifier la partie f(Z) à Z. Nous nous autorisons donc à dire 
que 4 € À ou que —7 € À, et même que 0 € Q. 

PROPooDHIAooZysvNs 
Proposition 1.378. 


L'ensemble des rationnels est infini dénombrable *?. 


150 et la proposition 1.376 donne une injection f: Z — Q. 


Démonstration. L'ensemble Z est infini 
Donc f(Z) est infini. 
L'ensemble À contient une partie infinie. Il est donc infini par le lemme 1.115. 
L'application 
g:Z —Q 


1.524 
a,b+ a/b ) 


est surjective alors que Z? est dénombrable. Le lemme 1.126 dit alors que Q est fini ou dénombrable. 
Vu que nous avons déjà prouvé que À était infini, nous déduisons que À est infini dénombrable. [1] 


149. Ouais, je sais, dans les définitions prises ici, un ensemble dénombrable est toujours infini. Mais l’excès de 
précision ne tue pas, loin s’en faut. 
150. Lemme 1.110. 
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LEMooBJRCoo1lZnaid 
Lemme 1.379. 
Soient a,b,x,y e Z. Nous avons ay = xb dans Z si et seulement si nous avons ab! = xy-! dans 


Q. 


1.20.1 Relation d’ordre 


DEFooZEXXooUtOhqB 
Proposition-Définition 1.380. 
Pour a, b,c,de % nous disons que 
& _ C 
F > . (1.525) 
si et seulement si ad > bc dans Z. 
Avec cette définition, (Q,>) est un ensemble totalement ordonné. 
LEMooEBTIooGMoHsj 
Lemme 1.381. 
Tout rationnel est majoré par un naturel. 
PROPooBTCCooVVvaeL 
Proposition 1.382. 
Si q < 1 dans Q, alors gx < x pour tout x € Q*. 
PROPooMXGPooDUKkOuv 
Proposition 1.383. 
Le corps Q est archimédien !°". 
LEMooMUYAooDLgDcf 
Lemme 1.384. 
Si qE À, alors il existe k € NN tel que kq € Z. 
1.20.2 Caractéristique 
LEMooYCPUooNxEPhB 


Lemme 1.385. 
Le corps Q est de caractéristique !°? nulle. 


1.21 Suite de Cauchy dans un corps totalement ordonné 
LEMooLTBlooSZnvsQ 

Lemme 1.386 ([68, 1]). 

Tout corps commutatif de caractéristique nulle contient un sous-corps isomorphe à Q. 


Démonstration. Soit un corps K de caractéristique nulle. Nous savons du lemme 1.343 que 


L: Z—K 


(1.526) 
ne nlx 


est un morphisme d’anneaux vérifiant ker(u) = {0}. Nous posons Z = u(Z). L'application y: Z — 
Z est un isomorphisme d’anneaux. Prouvons cela : 


(1) Morphisme L'application y: est un morphisme par le lemme 1.343. 

(2) Surjectif Par définition les éléments de Z sont dans l’image de Z. 

(3) Injectif Si x,ye Z vérifient u(x) = u(y), alors (x — y) = 0 parce que y est un morphisme. 
Mais K est de caractéristique nulle, c’est-à-dire ker(u) = {0}. Donc x — y = 0. 


Le corps K contient donc un sous-anneau isomorphe à Z. Puisque Z et IK sont commutatifs, la 
proposition 1.363 s'applique et K contient un sous-corps isomorphe à Frac(Z) = Q. 


La proposition suivante donne des précisions à propos du lemme 1.386. 


151. Définition 1.72. 
152. Définition 1.343. 
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PROPooKNROooFdgleQ 
Proposition 1.387 ([1]). 
Soit un corps totalement ordonné K. Nous considérons l'application 
:Z—K 
F (1.527) 
ne n° lx 
et ensuite 
o: À — K 
u r (1.528) 
a/be p(a)u(b)". 
Alors 


(1) L'application © est bien définie. 
(2) L'application © est un morphisme de corps. 
(3) Si q <q! dans Q, alors a(q) < o(q/). 


Démonstration. En plusieurs morceaux. 


(1) o est bien définie Montrons que o est bien définie. Pour cela nous considérons a, b,x,y € Z 
tels que a/b = x/y dans Q. Par définition des classes (définition 1.362 du corps des fractions), 
nous avons ay = bx dans Q. Vu que uw est un morphisme nous avons alors 


u(a)u(y) = a(b)u(x) (1.529) 


, c’est-à-dire o(a/b) = o(x/y). L'application © est donc bien 


—1 1 


et donc u(a)u(b)— = u{x)u(y) 


définie. 


(2) Morphisme pour la somme 


L'application 4 est un morphisme d’anneaux, comme déjà dit depuis le lemme 1.343. Notons 
aussi que, parce que K est commutatif, 


Lu(y) 2. (1.530) 


En utilisant la définition 1.362(1) de la somme nous avons 


(qu) = aq)” 


1.531a 
1.531b 
1.531c 
1.531d 
1.531e 


o(p/a + x/y) = a((py + ax)/qy) 

= [u(py) + (gx) ]u(qy)* 

= (py)(qy) + H(gx)(qy) 
pu(g) "+ a(x)n(y) * 
p/q) + o(x/y). 


2 TR RAR TR PR 
ZX TO TO 


RS 
Co 
ne 


Morphisme pour le produit Même genre de calculs que pour la somme. 


TR 
Æ 
LA 


Croissante 
Nous savons aussi par le lemme 1.370(4) que 1 > 0. Puisque y est un morphisme d’anneaux, 


un +1) = un) + 4(1) = un) +1 (1.532) 


La définition 1.367(1a) dit alors que u{n) > 0 pour tout n € N. Nous avons pour la même 
raison que si m > n dans N, alors (m) > u(n) dans K. 
Soient maintenant p,q € N, et prouvons que o(p/q) > 0. D'abord 


o(p/q) = H(p)u(a) * (1.533) 


où u(p) > 0 et u(q) > 0. Ensuite le lemme 1.370(5) nous indique que u(q)-! > 0. Enfin la 
condition 1.367(1b) nous permet de conclure que o(p/q) > 0. 
Finalement, si g, > g> dans Q, alors q1 — g2 > 0, et nous avons 

o(q) = o(g2 + qi — g2) = o(q2) + o(q — g2) > o(q2) (1.534) 
par la condition 1.367(1a). 
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NORMooJRRZo0TwTVYG 
1.388. 
Si K est un corps totalement ordonné, la proposition 1.387 nous donne un morphisme de corps 
o: À — K qui respecte l’ordre. Pour qg € À et k € K nous notons 


nb EQooERFI oo pZVEs 


Nous pourrons donc écrire £ pour o(1/2)k. 


Le lemme suivant explique que la notation (1.535) n’est pas complètement idiote. 
LEMooWIONooGTKfcJ 


Lemme 1.389. 
Soit un corps commutatif totalement ordonné K. Soit ke K. Nous avons 


k+ k = 2k. (1.536) 


Démonstration. Vu que o: Q — K est un morphisme, il vérifie o(1) = 1, donc 


k+k= o(1)k + o(1)k (1.537a) 
= (o(1) +o(1))k (1.537b) 
=p(2)k (1587e) 
= 2k. (1.537d) 


PROPooTFVOooFoSHPg 
Proposition 1.390. 
Toute suite convergente dans un corps totalement ordonné est de Cauchy. 


Démonstration. Soit un corps totalement ordonné K et une suite zh Æ, ». Soit € > 0. Il est 
important de se rendre compte que € € K et que l'inégalité est au sens de l’ordre dans K ; en 
particulier ce n’est pas e€ R ni ee Q. D'ailleurs nous n’avons pas encore défini R. 

Vu que (x) converge vers x, il existe N € N tel que pour tout & > N, 


xx — x] <e. (1.538) 


Soient p,q > N. Alors en utilisant la majoration du lemme 1.371(6), 
E MQYG 
— z| = | (x — 24)| < lp — 2] + x — ral < 2e. is °0HPESN) 


En analyse en général, on s'arrête là et on dit que (x,) est de Cauchy parce qu’il n’y a pas vraiment 
de différence entre réaliser une majoration avec € ou avec 2e. Détaillons toutefois comment ça se 
passe dans le cas où € est un élément d’un corps totalement ordonné. 

Le 2e arrivant à la fin de (1.539) est en réalité € + € = o(2)e en vertu de ce qui est raconté en 
1.388 et en vertu du lemme 1.389. 

Considérons € = &(1/2)e, que nous pouvons noter € = €/2. Vu que € > 0, il existe un N' tel 
que pour tout p,q > N' nous ayons 


[tp — Tal < 2€ = o(2)o(1/2)e = o(1)e = €. (1.540) 


Ce dernier € étant bien celui fixé au début de la preuve, nous en déduisons que (x,) est de 
Cauchy. 
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1.21.1 Suites de Cauchy dans les rationnels 


PropFFDJooAapQlP 

Proposition 1.391 ([17]). 
Principales propriétés des suites de Cauchy dans Q. IterRKCIooJguHdji 
(1) Toute suite convergente est de Cauchy”. ItenRKCTooJguHdjii 
(2) Toute suite de Cauchy est bornée. ItemRKCTooJguHdjiii 


(3) 
(4) 
(5) 


(6) 


Si tn — 0 et si (yn) est bornée, alors tnÿn — 0 


Si (tn) et (Un) sont de Cauchy alors (tn +Yn), (Xn —Yn) Et (XnYn) sont Comeneerh te GREEN 


Si il existe a,b € Q tels que xn — à et Yn — b alors Zn + Yn — a +0, Tn — Yn — a — db et 
TnYn — ab. ItemRKCIooJguHdjvi 
Soit (xn) une suite de Cauchy qui ne converge pas vers zéro. Alors il existe no tel que la suite 
(+) soit de Cauchy. 

n>n0 


Ln 


Démonstration. Point par point. 


(1) 
(2) 


C’est la proposition 1.390. 


Soit (x,) une suite de Cauchy dans Q. Avec € = 1 dans la définition, si g > N, nous avons 
[Ta — Zn] < 1. (1.541) 
Et donc pour tout q plus grand que N, æù — 1 < x, < xn + 1, ou encore, pour tout n : 
tn] < max{|z1l,|x2l,...,[xnl,|xn +1]}. (1.542) 


La suite est donc bornée. 


Soit € > 0. Les hypothèses disent qu'il existe un N tel que |x,| < € dès que n > N. Et 
il existe aussi M > 0 tel que |[y,| < M pour tout n. Du coup, lorsque n > N nous avons 
TnYnl < Me. 


En ce qui concerne la somme, 
EqDCNBoo i 
(Cp + Up — La — Yal < (2, = 2] + le = ul: (FEB) 


Soit N; tel que si p,q > Ni alors |x, — x,| < e et N2 de même pour la suite (y). En prenant 
N = max{N;, N}, la somme (1.543) est plus petite que 2e dès que p,q > N. 

Passons à la démonstration du fait que le produit de deux suites de Cauchy est de Cauchy. 
Les suites (x,) et (y,) sont bornées et quitte à prendre le maximum, nous disons qu’elles sont 
toutes les deux bornées par le nombre M : pour tout n nous avons [x,| < M et [y,| < M. 
Nous avons : 


lTpUp s TaYal < |TpYp — TqUp| + lTaYp — TaYal < [YpllTp ls ITallYp — Yal- (1.544) 


Puisque (x,) et (y,) sont de Cauchy, si p et q sont assez grands, les deux différences sont 
majorées par € et nous avons 


[TpYp — TaYal < Me + Me = 2Me, (1.545) 


ce qui prouve que (Ænÿn) est de Cauchy. 
En ce qui concerne la somme, nous pouvons tout de suite calculer 
ln Et (a +b)|< rx a] + lus 01. (1.546) 


Il existe une valeur de n à partir de laquelle le premier terme est plus petit que € et une à 
partir de laquelle le second terme est plus petit que €. En prenant le maximum des deux, la 
somme est plus petite que 2e. 


153. Et non la réciproque, qui sera justement la grande innovation des nombres réels. 
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En ce qui concerne le produit, 
TnYn — ab] < [XnYn — AYnl + [aYn — ab < |Ynlltn — a] + al] yn — b!. (1.547) 


Les suites |x, — al et |y, — b| convergent vers zéro; la suite (y,) est bornée parce que conver- 
gente (combinaison des points (1) et (2)) et a (la suite constante) est également bornée. Donc 
par le point (3), nous avons 

Yn|En — à] + alYn — b| — 0. (1.548) 


Au passage nous avons également utilisé la propriété de la somme que nous venons de dé- 
montrer. 


(6) Soit (x,) une suite de Cauchy dans Q ne convergeant pas vers zéro : il existe à > 0 tel que 
pour tout N € N, il existe n > N tel que |x,| > a. Mais notre suite est de Cauchy, donc il 
existe no € N tel que si p,gq > no alors 


IR 


eme (1.549) 
En fixant N = no, on obtient un naturel n > no tel que |[x,| > a. De plus, comme la suite est 
de Cauchy, si p > n nous avons aussi |, — ,| < $. Cela implique |x,| > $ et en particulier 
Tp F 0. 

Nous venons de prouver que la suite ne s’annule plus à partir de l'indice n, et même que 
Ixx| > a/2 pour tout k > n. La suite (1/xx)x>n est donc bien définie. 

Soit € > 0. Soit no tel que |x, — x] < € pour tout p,q > no. Soit X plus grand que no et que 
n. En prenant p,q > K, nous avons |x,| > $ et |x,| > $. Nous en déduisons que 


sta = El < SE (1.550) 


Tp Tq 


Donc (+) est de Cauchy. 


1.22 Insuffisance des rationnels 


Nous allons voir qu’il n'existe pas de nombres rationnels x tels que æ? = 2, mais que pourtant 


il existe une infinité de suites de rationnels (x,) tels que æ2 — 2. 
LemJPIUooWFHaFM 


Lemme 1.392. 
Un entier x est pair si et seulement si l’entier x? est pair. 


Démonstration. Si x est un nombre pair, alors il existe un entier a tel que x = 2a alors x? = 4a°? 
est pair. 
Inversement, si x est impair alors il existe un entier a tel que æ = 2a + 1 et alors x? — 


4a? + 4a + 1 = 2(2a? + 2a) + 1 est impair. 


Le théorème 3.36 nous dira que tous les 4/n sont irrationnels dès que n n’est pas un carré 


parfait. Voici déjà le résultat pour n = 2. Le fait que V2 existe dans R sera la proposition 1.457. 
PropooRJMSooPrdeJb 


Proposition 1.393 (Irrationalité de 42). 
Il n'existe pas de fractions d’entiers dont le carré soit égal à 2. 


Démonstration. Nous supposons que la fraction d’entiers a/b est telle que a?/b? = 2, et nous allons 
construire une suite d’entiers strictement décroissante et strictement positive, ce qui est impossible. 
Grâce au lemme 1.392 nous avons successivement les affirmations suivantes : 


… 9 = 2 avec a # D et b# 0. 
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— a? = 2b?, donc a? est pair. 
— aest alors pair et a? est divisible par 4. Soit a? = 4k. 
— 4k/b? = 2, donc 4k = 2b?, donc b? = 2k et b? est pair. 


— Nous déduisons que b est pair. 


La fraction 3 est alors une nouvelle fraction d’entiers dont le carré vaut 2. En procédant de la 


même façon, en remplaçant a par a/2 et b par b/2, on obtient que la fraction d’entiers _ a la 
même propriété. 

En particulier, tous les nombres de la forme a/2” sont des entiers. Ils forment une suite stric- 
tement décroissante d’entiers strictement positifs. Impossible, me diriez-vous ? Et vous auriez bien 
raison : toute partie non vide de N admet un plus petit élément !°{. Il n’y a donc pas de fractions 
d’entiers dont le carré vaut 2. 


LEMooUTVUoolmvusn 
Lemme 1.394 (Série géométrique). 
Si q Æ 1 dans Q et pe N nous avons 


(1.551) 


p 1 
1— + 
= Y = 1 (1.552) 
k=0 V8 
Proposition 1.395. 
La suite donnée par 
1 1 
T=l+pte+e (1,553) 
est de Cauchy et ne converge pas dans Q. 
Démonstration. Si p > q > 0 nous avons 
| 
mm Ÿ, : (1.554a) 
k=q+1 
p 
1 1 SUBEQooAXILooE 
< LS8AD 
D (a+ 1)1 (+ 1)#24 Esp, 
=q+1 
1 1 BE NDPT de 
en SUBEQoONDET OH PERTE] 
(q +1)! p— re (g +1) 
1 1 SUBEQooEMHJooSnÇUi 
 . ra ofagt 
ares 
1 l 
ge (1.554) 
(a+1)! q 
1 
< —. (1.554f) 
qq 


Justifications : 
— Pour (1.554b), il s'agit de remplacer dans k! tous les facteurs plus grands que (q + 1) par 
q + 1. Cela rend le dénominateur plus petit. 
— Pour (1.554c), il y a une inégalité parce que la suite p + 3_,1/(q + 1)* est une suite 
strictement croissante. 


154. Voir [17], et attention : ce n’est pas tout à fait évident. 
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— Pour (1.554d), le lemme 1.394 donne la valeur de la somme finie. En ce qui concerne la limite, 
nous avons demandé p > q > 0 et donc q + 1 > 1. Dans ce cas la limite fonctionne. 


Cette inégalité une fois établie nous permet de prouver les assertions. La suite (x,) est de 
Cauchy car, pour tout € € Q s'écrivant € = Ÿ avec a,b € N, en prenant p,q > b, nous avons 


1 1 a 
La EE (1.555) 


Montrons par l’absurde que cette suite ne converge pas dans Q. Pour cela, nous supposons que 
lmMy_00 Zn = % € Q. Pour tout p > q nous avons établi 


Dé, = (1.556) 


Fo 
gg: 


Prenons la limite p — ©; par stricte croissance de la suite, les inégalités restent strictes : 
a 1 EqQLCT 
Ds -eme— an °00E057) 


Si n > b alors nous pouvons écrire 


(1.558) 


avec à € Z parce que le dénominateur commun entre ? et x, est dans n!. En prenant donc q > n 
dans (1.557) nous pouvons écrire 


1 
0 < : i (1.559) 


c’est-à-dire 0 < a < ce qui est impossible pour à € Z. 


LEMooDTXYooKwmlZh 
Lemme 1.396. 
Soit À > 0 dans Q. Il existe un rationnel q > 0 tel que q? < A. 


Démonstration. Vu que Q est archimédien (proposition 1.383), il existe n € IN tel que 1 < nA. 
Pour ce n, nous avons 


) £ L < À. (1.560) 


La proposition suivante donne une suite de rationnels qui convergerait dans R vers VA (non 
encore défini à ce stade). Il est expliqué dans [73] que la suite peut être vue comme une forme 
de méthode de Newton 34.54; voir l’exemple 34.57. Si vous aimez les dessins et les approches 
géométriques, il y a une explication sur Wikipédia[74]. 

PROPooSTQXo0oH1IGV£ 
Proposition 1.397 ([73]). 
Soient À > 0 dans Q et 0 € Q. La suite (xx) définie par 


1 À E OUIV 
Tk+1 = 9 (a + £) ses bé A 
k 


a les propriétés suivantes : 
1) La suite yx = x? converge dans Q vers A. 
k 
(2) La suite (xx) est de Cauchy dans Q. 


(3) La suite (xx) ne converge pas dans Q dans le cas de À = 2. 


Démonstration. En plusieurs points. 
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La suite 5, En posant y, — rs nous calculons que 


yr — A)? 
Yk41 — À = ( à. L. (1.562) 
Autrement dit, la suite sx = y; — À vérifie 
% 
8x1 = Aa) (1.563) 
Quelle que soit la valeur de s9 = 14 — À, nous avons 
2 2 2 2 2 
cu 2. 50) Le A) _… D ee) 
Donc à partir de 51, tous les éléments sont positifs. Vu que À > 0 nous avons aussi 
Le sk 
Sk+1 < RÉ (1.565) 


et donc sx < 50/4. Donc 5; — 0. 

La suite (y;) Nous venons de prouver que si y, = À + 54, alors 84 — 0. Autrement dit, la 
suite y, converge vers À dans Q. 

La suite (yx) est donc de Cauchy par la proposition 1.391(1). 


La suite (x;) est de Cauchy Soit € > 0 dans Q. Puisque (yx) est de Cauchy, il existe 
no € NN tel que 


lr? —x2| <e (1.566) 
pour tout r,s > no. 
Soit par ailleurs g £ 0 dans Q tel que q? < À, assuré par le lemme 1.396. Quitte à augmenter 


la valeur de no, nous supposons que x,,x., > q, et en particulier que x, +, # 0. Cela permet 


d'écrire d’abord 
222? = (x, +æ,)(xr — x) (1.567) 


et ensuite de prendre la valeur absolue et de diviser par |x, + x] : 


_Im-#l Le 


(1.568) 


Tr — X . 
Fe « [tr + Tel 2q 


Donc (xx) est une suite de Cauchy. 

Pas de convergence pour À =2 Supposons que x} — à € Q. Dans ce cas nous aurions 
rs — a = À = 2 (proposition 1.391(5)). Mais nous savons par la proposition 1.393 que 
a? = 2 est impossible dans Q. 


Notons que cette proposition ne présume en rien de l’existence ou de la non-existence dans Q 
d’un élément qui pourrait décemment être nommé A. Il se fait que le théorème 3.36 dira que /n 
est soit entier, soit irrationnel. 


1.398. 
Un petit programme en python pour explorer la suite de la proposition 1.397. 


1l#!l/usr/bin/python3 


:| def 


rec(A,x): 
return ((xx*x2+A)/x)/2 
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= 3 # Compute square root of 3 
x = 1000 # Initial guess: 1000 


for i in range (1,100): 
print(i, x, x*x*x2, x*xx2-A) 
x = rec(A, x) 


tex/frido/codeSnip_4.py 


1.23 Les réels 


Une construction des réels via les coupures de Dedekind est donnée dans [75]. 
NormooHRDZooRGGtCd 


1.399. 

La construction des réels va nécessiter un petit « bootstrap » au niveau de la topologie. En effet 
la notion de suite de Cauchy est une notion topologique (définition 7.250) alors que la topologie 
métrique (celle entre autres de Q) ne sera définie que par le théorème 7.109. Nous avons donc dû 
définir en la définition 1.367 ex nihilo les notions de 


— suite de Cauchy 
— suite convergente 
— complétude 


Nous allons ensuite construire IR comme ensemble de classes d'équivalence de suites de Cauchy 
dans Q. Ce ne sera que plus tard, après avoir défini la notion d'espace métrique que nous allons 
voir que sur R, ces trois notions coïncident avec celles topologiques °°. Et par conséquent que R 
sera un espace métrique complet 16, 

Dans cette optique, il est intéressant de lire ce que dit Wikipédia à propos des suites de Cauchy 


dans l’article consacré à la construction des nombres réels[76]. 


1.23.1 L'ensemble 


Soit € l’ensemble des suites de Cauchy !?’ dans Q. Soit aussi l’ensemble € constituée des suites 
qui convergent vers zéro LÀ, 
En posant 


T+Yy= (En + Un) (1.569) 


et 
Ty = (ZnYn), (1.570) 


159 commutatif dont le neutre de l’addition est la suite constante 


l’ensemble € devient un anneau 


Zn = 0 et le neutre pour la multiplication est la suite constante x, = 1. 
PROPooNUQVooAAkicK 


Proposition 1.400. 
La partie £g est un idéal'S de l'anneau €. 


Démonstration. Nous savons par la proposition 1.391(1) que les suites convergentes sont de Cau- 
chy ; par conséquent € € €. 


155. Proposition 7.258. 

156. Théorème 1.439 pour la complétude en tant que corps et théorème 1.390 pour la complétude en tant que espace 
métrique. 

157. Définition 1.367(3) 

158. Nous rappelons qu’à ce niveau nous n’avons pas encore prouvé que toutes les suites de Cauchy convergent. 
159. Définition 1.41. 

160. Définition 1.178. 
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L'ensemble structuré (£o,+) est un sous-groupe de € par les propriétés de la proposition 1.391 
(il s’agit du fait que la somme de deux suites convergeant vers zéro est une suite convergente vers 
zéro). 

En ce qui concerne la propriété fondamentale des idéaux, si x € € et y € € nous devons prouver 
que xy € €o. Puisque (£o, * ) est commutatif, cela suffira pour être un idéal bilatère. Vu que y est 
une suite de Cauchy, elle est bornée; et étant donné que x — 0 nous avons alors æy — 0 (par la 
proposition 1.391(3)). 


DefooFKYKooUngSCB 
Théorème-Définition 1.401 (L'’anneau des réels[17]). 
Sur l’ensemble quotient £/Eo, les opérations 


(1) üu+oü=u+u 

(2) à - 3 = uv 
sont bien définies et donnent à £/£o une structure de corps commutatif appelé corps des réels et 
noté R 


Démonstration. Nous divisons la preuve en plusieurs parties. 


(1) Les opérations sont bien définies La partie € est un idéal par la proposition 1.400. Le 
quotient est donc bien défini et est un anneau par la proposition 1.180(2). 


(2) Caractérisation des classes Soit q € Q et une suite x convergente vers qg. Cette suite est 


de Cauchy comme toute suite convergente. Montrons que 
x = {suites qui convergent vers g}. (1.571) 


Si yE x alors y = x + h avec h € Eo, et comme h, — 0, on à yy — q. Réciproquement, si 
Yn — q alors pour chaque n nous avons 


Un = Tn + (Un En} (1.572) 


mais Yn — Xn — 0. Donc la suite y — x € Eo ce qui signifie que y € &. 


(3) Neutre et unité Il est vite vérifié que O, la classe de la suite constante égale à zéro est 


neutre pour l’addition. De même, 1, est un neutre pour la multiplication. 


(4) Corps Nous devons prouver que tout élément non nul est inversible. C'est-à-dire que si 
x € € ne converge pas vers zéro lfl alors il existe y e € tel que xye I. 


Nous savons par la proposition 1.391(6) que x étant une suite de Cauchy dans Q, il existe 


no € NN tel que (2) est une suite de Cauchy. Nous posons alors 
 /n>no 
0 sin <no 
Un = à l (1.574) 
Zn Si n > no. 


Nous avons alors 


0 sin < 
(ue (1.574) 
1 Sin >n 


et donc xyE€ 1. 


NORMooWBYNooBQaPPk 
1.402 (Quelques notations entre Q et R). 
Sik x4 est une suite, nous notons (x4) avec des parenthèses la suite elle-même. Le k dans (x) 
est un indice muet, et dans les cas où il peut y avoir une ambiguïté, nous pouvons noter (xx)Ken. 
Cette dernière notation est plus lourde, mais plus exacte. 


161. x e € peut soit ne pas converger du tout, soit converger vers autre chose que zéro. 
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Le mieux est d'écrire simplement x la suite, mais alors il faut être prudent et ne pas noter x la 
limite. Nous éviterons donc d'écrire zx — x. 

Si (xx) est une suite de Cauchy dans Q, nous notons x l’élément de R qui lui correspond. En 
fait x = (x7) : x est la suite-elle même, mais pour nous souvenir de l’origine nous allons adopter 
cette notation. 

D'autre part nous définissons 


p:QR—R 
a (1.575) 
ge ke dl, 
c'est-à-dire que w(q) est la classe de la suite constante xx = q. 
PropooEPFCooMtDOfP 
Proposition 1.403. 
Soit l’application 
:Q—R 
FR (1.576) 
gr q. 
où par q nous entendons la classe de la suite constante égale à q (qui est de Cauchy). 
(1) C’est un homomorphisme de corps injectif. 
(2) Image(w) est un sous-corps de R 
(3) v: Q — Image(y) est un isomorphisme de corps. 
Démonstration. Le fait que ce soit un homomorphisme est simplement 
— p(a+gd)=q+g=3+ 
— p(ad) = gg = ag’. 
En ce qui concerne l’injectivité, si q est tel que w(q) = Ü = &o, c’est que 
w(q) = {suites de Cauchy qui convergent vers zéro} (1.577) 
Mais nous savons aussi que !6? 
w(q) = q = {suites de Cauchy qui convergent vers q} (1.578) 


Nous en déduisons que qg = 0. 


Lorsque dans la suite nous parlerons d’un élément de À comme étant un réel, nous aurons en 
tête l’image de cet élément par @. 
LEMooYLQBooFistHs 


Lemme 1.404. : 
Soient q,le À tels que g = 1. Alors q = l dans Q. 


Démonstration. La suite constante x, = q est un représentant de q, et la suite constante y, = | 
est représentant de {. Dire que { = q signifie qu’il existe une suite z € € tel que 


T=Y+2. (1.579) 
Pour tout n nous avons donc %y = Yn + Zn, OU encore 
= q—i (1.580) 


pour tout n. Puisque z est une suite constante, elle ne peut appartenir à € que si elle est la suite 
constante nulle, c’est-à-dire si q = L. 


162. Voir dans la démonstration du théorème 1.401. 
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1.23.2 Relation d’ordre 


Définition 1.405. 
Nous définissons les parties ET et £ de £ par 
(1) xe ET si et seulement si pour tout € > 0 (e est dans Q), il existe Ne tel que n > Ne implique 
Ln > —E€. 
(2) x e ET si et seulement si pour tout € > 0, il existe Ne tel que n > Ne implique tn < €. 


Nous notons aussi ET = EŸ\E. 


Dans le lemme suivant, le point (2) peut sembler perturbant. Il s’agit de dire que si x est la 


classe de la suite constante 0, alors il est le neutre pour l’addition dans KR. 
LEMooJOYQooCD1hHW 


Lemme 1.406 (À propos du zéro). 
Nous avons ITEMooKRBYooZGhhch 
(EVA ET = 10h 


ITEMooRCIZooHUIymE 
(2) Si x = 0 alors x = 0. 
LEMooSWYXooMKMLYI 
Lemme 1.407. 
Les parties EŸ* et £ partitionnent € de la façon suivante : 
(1) ETNET —Eo ITEMooZRVXooANHspZ 


(2) EVE 2E 


Démonstration. On prouve d’abord que £* n £7 € €o, l'inclusion inverse est évidente. Soit e > 0 
etre ET nET.Ilexiste un N € N tel que æn > —e et x < € pour tout n > N. Par conséquent, 
Itn| < € pour tout n > N et la suite x converge vers zéro, c’est-à-dire x € €. 

Pour prouver le second point, soit x € €\£, et prouvons que x € €. La condition x & €7 
donne qu’il existe un a > 0 (dans Q) tel que pour tout n, il existe p > n avec x, > a. Mais x est 
une suite de Cauchy, donc nous avons un nQ tel que si n,p > no alors |x, —x,| < $. En particulier, 
sin > no, et si p > n est tel que x, > à, on obtient 


Zn > 5 > 0 (1.581) 


Par conséquent x € €* parce que x € € et les x, sont tous positifs à partir d’un certain rang. 
LEMooXNWSooHbNcAV 


Lemme 1.408 ([1]). 
Si x € E*+, alors il existe N tel que xn > 0 pour tout n > N. 


Démonstration. La suite x ne tend pas vers zéro. Donc il existe Ô > 0 tel que pour tout N > Oil 
existe n > N vérifiant ty > 6. 

Mais la suite x est également de Cauchy. Écrivons cette condition pour 0/2. Il existe N2 > 0 
tel que p,g > N2 implique |x, — xl < ô/2. 

Nous fixons n > N: tel que z, > ô. Alors pour tout p > N: nous avons aussi 


ô 
(rs Gnl < 5 (1.582) 


Cela implique que x, > 6/2 > 0 pour tout p > AN. 


La proposition suivante est une version plus précise du lemme 1.408. 


Proposition 1.409 ([12]). 
Soit x € ET*. Il existe r E Q*\{0} et NE N tel que xn > r pour tout n > N. 


Démonstration. Fixons € € Q*\{0}, et procédons par l'absurde. Du coup nous savons trois choses 
sur la suite (x). 
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ITEMooTNZDooHKZdBe 
(1) Hypothèse absurde : pour tout qg € Q*\{0} et pour tout N € N, il existe p > N vérifiant 
ARS 
(2) Vu que re Et CET, il existe P, € N tel que æ, > —e pour tout n > P1. 
(3) La suite x est de Cauchy. Donc il existe P2 € N tel que si m,n > P, nous avons [ty — zh] < 
e/2. 
Nous considérons P > max{P\, P2} et nous prenons q = €/2, N = P dans la propriété (1). Il existe 
donc p > P tel que x} < €/2. 
Prenons aussi n > p et écrivons les deux autres propriétés : 
(1) %n > —e parce quen >p> P > Pi. 
(2) [tn — xp] < €/2 parce que n,p > P > Pe. 
Du coup nous avons ; 
En <Tp+5<6 (1.583) 


et donc —€ < Zn < €. 
Au final, nous avons prouvé que pour tout € € QŸ\{0}, il existe P tel que n > P implique 


Itn| < €. Cela signifie que 
Q 


En — 0, (1.584) 
c’est-à-dire x € £o, ce qui est contraire à l’hypothèse. 
LEMooRKSXooFsIohe 
Lemme 1.410 ([17]). 
Quelques propriétés du partitionnement. ITEMooRQVKooCnwWOY 
(1) re ET siet seulement si (—-x) e ET ITEMooJUPOo00BubqA 
(2) xe ET etye ET implique x +ye Et ITEMooDQLJooPViuVC 


(3) xe ET etye ET implique xy € EŸ 
(4) Six,ye € sont tels que x — y € Eo alors soit x,y € ET soit x,y € ET. 


Démonstration. Point par point. 

(1) Définition de €Ÿ et ET. 

(2) Pour n > N.y2 nous avons x, > —e/2 et yn > —e/2. Donc Ty + Yn > —€. 

(3) Si x ou y est dans € alors xy € € et c’est bon. Si par contre x, y € € ** alors le lemme 1.408 
nous indique que pour n suffisamment grand, x, > 0 et y, > 0. Et dans ce cas, (xy)n > O, 
c'est-à-dire ry € E*. 


(4) Supposons que x — y € € avec x € ET et prouvons qu’alors y € ET. Soit donc € > 0; il existe 
n tel que x, > —$ dès que n > n1. Mais x — y € €o, donc il existe n2 tel que |ry — ya] < $ 
dès que n > n2. En prenant n plus grand que n1 et n2, nous avons en même temps 


En > (1.585a) 


€ 
= nl € (1.585b) 


Cela implique que y, > —e et donc que y e E*. 
Nous pouvons de même prouver que si x € £7 alors y € ET. 


DefooLMQIooTgzZXd 
Définition 1.411 (Positivité dans R). 
Vocabulaire et notations. 


(1) Nous notons R = €/£o. 
(2) Nous notons R* = E*. 
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(3) Nous notons R- = ET. 


(4) Un élément de R est positif si il est la classe d’une suite de Cauchy appartenant à ET. 


(5) Un élément de R est négatif si il est la classe d’une suite de Cauchy appartenant à €. 


(6) Lorsque nous parlons de nombres réels, le symbole « 0 » signifie £o ou plus précisément la 


classe d’un élément de £o modulo €. 
REMoo0UCXLooKQrDoq 


1.412. 
Avec les conventions de la définition 1.411, et en anticipant sur nos connaissances à propos des 
réels, 
(1) zéro est positif et négatif. 
(2) L’intersection entre R* et IR est le singleton {0}. 
(3) L'ensemble des nombres strictement positifs est noté (R*)* ou R*\{0}. 
(4) 


4) Le mot « positif » signifie « positif ou nul » ; le mot « négatif » signifie « négatif ou nul ». Ce 


sont des conventions qui sont également celles de Wikipédia[77]. 
DEFooBXHJooUEYPRI 


Définition 1.413 (Ordre sur R). 


Si x,ye R nous notons x < y si et seulement si y—xe ET. 
PROPooYMJVooNAsXae 


Proposition 1.414. 


Le couple (R, <) est un corps totalement ordonné! 


Démonstration. Il s’agit de vérifier, dans l’ordre, les définitions 1.11, 1.12 et 1.367(1). Pour la suite 
nous considérons æ,y,z € R et des suites de Cauchy a,b,c représentant x,y,2, c'est-à-dire telles 
que x =a,y=betz=c. 
(1) Réflexivité Pour savoir si x > æ, nous devons nous demander si x — x € €+. Nous avons 
x—r=a-a-0-0. 


(2) antisymétrie Nous supposons que x > y et y > x. Du côté des suites de Cauchy, cela 
signifie que a — b € ET et b— a € E*. Le lemme 1.410(1) nous indique alors que a — b — 
—(b— a) € €. Donc 

a—beEtnET = {0}. (1.586) 
Donc le réel x — y est la classe de la suite constante 0. Le lemme 1.406(2) dit alors que 
x — y = 0 ou encore que x = y. 
transitivité Nous supposons que x < y et y < z. L'hypothèse x < y signifie y — x e £* ou 
encore que b— ae £*. Même chose pour y < z qui signifie que c — be E*. Nous avons alors 


RS 
Co 
LA 


c—a=c-b+b-a (1.587a) 
= (c—b)+(b—a) (1.587b) 
e£t+Et (1.587c) 
cet (1.587d) 


0. 


> 
(4) Ordre total Nous devons prouver que pour x#,y € R nous avons toujours æ < y où y < x. 
Supposons que nous n’ayons pas æ < y, c’est-à-dire b — a # EŸ. Vu le lemme 1.407(2) nous 
avons b — a € €, ce qui donne, par le lemme 1.410(1) que a — be ET, c’est-à-dire y < x. 


où nous avons utilisé le lemme 1.410(2). Puisque c — a € EŸ, nous avons z2—x=c—a 


(5) Corps ordonné Enfin nous devons vérifier les deux conditions de la définition 1.367(1). 


Pour la première condition, nous supposons x < y, c’est-à-dire b — a e E*. Nous avons donc 


(b+c)—(a+c)=b+r-a-c=b-aeE£*, (1.588) 


donc a+c<b+c, c'est-à-dire x + z < y +2. 
Pour la seconde condition, c’est le lemme 1.410(3). 


163. Corps totalement ordonné, définition 1.367. 
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Définition 1.415. 
Puisque R est un corps totalement ordonné (proposition 1./1/), si x € KR, nous définissons |x| 


conformément à 1.367(2). 
LEMooTJAXooKEqPCG 


Lemme 1.416. 
L'application 
p:QR—R 


u (1.589) 
q— Q 


dont nous avons déjà parlé dans la proposition 1.403 est strictement croissante. 


Démonstration. Nous supposons q < l dans Q. Nous devons montrer que q < ! dans R, c’est-à-dire 
que g <let q Æ l. 
Considérons la suite constante x, = | — q € À. Pour tout € > 0 dans Q nous avons 


En =l-g>0>—e, (1.590) 

et donc x € €. Donc { — q > 0. Cela signifie q < l. 
D'autre part le lemme 1.404 dit que q = l uniquement si q = |, ce qui est exclu parce que q < L. 
Donc q Æ l. 


LEMooNHMTooEdtBnQ 
Lemme 1.417. 
Sia,be R* satisfont a + b = 0, alors a = b = 0. 

Voici une version dans R du lemme 1.107. 

LEMooKAXFooIPyzJC 
Lemme 1.418. 
Soient a > 0 et b > 1 dans R. Nous avons 

ab > a. (1.591) 


Remarque 1.419. 
Comme déjà mentionné plus haut, à chaque fois que nous parlerons d’un élément de À comme 
étant un élément de R, nous considérons la classe de la suite constante. 


LemooYNOVooUwoRwD 
Lemme 1.420. 
Si x,y,2€R avec x > 0 sont tels que z > y/x alors zx > y. 
Démonstration. Nous savons que 
See Niete (1.592) 
x 
Puisque x € €**, multiplier par x fait rester dans €Ÿ* : 
zx -2leett. (1.593) 
x 
Un représentant de x? est la suite n = x,%#% = 4. Donc x? = y. Cela signifie que 2x — y e EŸT 
et donc que 2x > y. 
LemooMWOUooVligaEi 


Lemme 1.421. 
Pour tout a € R, il existe p € N tel que p > a. 


Démonstration. Nous allons donner deux preuves différentes de ce lemme. 
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(1) Première façon 


L'élément a de R admet un représentant (a,) qui est une suite de Cauchy dans Q. C’est 
donc une suite bornée, c’est-à-dire qu’il existe m,q € N tels que |a,| < m/q pour tout n 
(proposition 1.391(2)). Soit M un naturel strictement plus grand que m/q 1. 

La suite de Cauchy (M — an)nen est constituée de rationnels positifs et est donc dans €*. 
La classe de M — a est donc un réel positif 5%. Par définition de la relation d'ordre, M > a. 


(2) Seconde façon 


La suite (ah) est majorée par 7 donc on a dans Q et pour tout n : 


an <= =M<qM. (1.594) 
q 


L'application 6: Q — R est croissante, donc 


P((an)) < p(aM). (1.595) 
En corolaire, nous avons 
LEMooMWOUooVWgbFi 
Lemme 1.422. 
Pour tout x € R, il existe q € Z tel que q < x. 
Démonstration. Utilisation du lemme précédent avec a = —x : on prend q = —p. 
ThoooKJTTooCaxEny 


Théorème 1.423 ([17]). 
Le corps R est archimédien 56. 


Démonstration. La proposition 1.414 dit que R est totalement ordonné. Soient x, y € R avec x > 0: 
posons a = Ÿ. Le lemme 1.421 nous donne un p € NN tel que p > a. Nous concluons alors avec le 
lemme 1.420 : 

PS … = y (1.596) 


Le lemme suivant n’est pas loin de dire que Q est dense dans R, à part que nous n’avons pas 


encore donné de topologie sur R. 
LemooHLHTooTyCZYL 


Lemme 1.424. 
À propos de rationnels entre des réels. ITEMooGVTMooQsoTCi 


(1) Six,yeR sont tels que x < y, alors il existe s € Q tel que x < 8 < y. ITEMooCVDSo0A j imCL 
(2) Sie> 0 dans R, il existe ne N tel que À <e. 


Démonstration. Nous avons par hypothèse que y — x > 0 et donc le fait que R soit archimédien 
(théorème 1.423) nous donne q € N tel que q(y — x) > 1. Soit 


E ={neZ tel que : Si (1.597) 


Cet ensemble n’est pas vide à cause du lemme 1.422; de plus, comme |x|q < no pour un certain 
no (à cause du lemme 1.421), l’ensemble Æ est majoré par no. Donc E possède un plus grand 
élément !67 p qui vérifie 
p+l 
< —. 
q 


E<z (1.598) 
q 


164. Lemme 1.381. 

165. Et nous allons d’ailleurs arrêter de toujours préciser « la classe de » lorsque ce n’est pas nécessaire. 
166. Définition 1.72. 

167. Lemme 1.108. 
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De plus (p + 1)/q < y parce que 
1 

LT+-<T+y—-T=7Yy (1.599) 
q 


où nous avons utilisé l’inégalité stricte y — x > _ 
Nous avons donc 


1 
PRE 2e (1.600) 
q 


et le nombre (p + 1)/q convient comme s. Le point (1) est prouvé. 
Pour le point (2), par le point (1) nous considérons s € À tel que 0 < s < €. Si s = p/q avec 
p,q€ N nous avons 


Le (1.601) 


REMooX010o0HjwMvA 
Remarque 1.425. 
Le lemme 1.424 a également pour conséquence que des ensembles comme [—1,1] ne sont pas bien 
ordonnés (définition 1.12). En effet la partie ]0, 1[ ne possède pas de minimum parce que si x € [0,1 
alors 0 < x et il existe s € Q (a fortiori s € R)) tel que 0 < s < x, c’est-à-dire que x n’est pas un 
minimum de ]0,1{. 


Tant que nous y sommes dans les encadrements de réels... 


1.426. 
Soit go € À tel que 0 < go < 1. On définit alors di € {0,1} comme valant 1 si 2qo > 1 et 0 sinon. 
Puis on pose q1 = 2qo — di. 

Poursuivant de la sorte, on crée une suite (d;)1>1 : c’est le développement dyadique de 4. 

LEMooRSLIooVrZMxM 

Lemme 1.427 (|1]). 
Soit q, q deux rationnels tels que 0 < q < q! < 1. Il existe deux entiers naturels a et N tels que 
RE DCE 


Démonstration. On crée les développements dyadiques de q et g/', que l’on note respectivement 
(dn)n>1 et (d,)n>1. Notons 
E={ne N tel que dy # d,}. (1.602) 


Comme q # g/, les développements dyadiques sont différents l%, l’ensemble Æ est non-vide, et il 
admet un plus petit élément N. Or, q < q', et donc nécessairement dx < d'y. On construit alors 

N i 
a — Fr d;2 . 


CorDensiteDyadiques 
Corolaire 1.428. 
Pour tous réels x, y tels que 0 < x < y < 1, il existe un nombre de la forme d = a/2”, avec ne N 
etaenN, a <2”, tel que x < d < y. 
La partie 


D= 5 tel que ae Z,be N} (1.603) 


est dense dans R. 
Ce D est nommé l’ensemble des fractions dyadiques. 


LEMooEGYLooCGrDr1 
Lemme 1.429 ([1]). 
Soient des réels a, b,x,y tels que 
a<x<b (1.604) 
el 
GSY< b, (1.605) 


alors |x — y| <[b— a|. 


168. À vérifier tout de même... 
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LEMooTPLUooXiCZHJ 
Lemme 1.430. 
Soient deux réels a,b tels que 
(1) a>0, 
(2) b=0 
(3) a+b=0. 
Alors a = 0 etb=0. 
LEMooNLGSooSGdvAo 
Lemme 1.431. 
SiaeR, alors a > 0 et a? = 0 si et seulement si a = 0. 
LEMooVXAXooNhxtSU 
Lemme 1.432. 
Soit un réel strictement positif a. Si b > 1, alors ab > a. 
LEMooFQMVooDNaTDT 
Lemme 1.433. 
Soient a,b,xEeR tels que a + x = b+x. Alors a = b. 
PROPooVID]JooSzXPLP 
Proposition 1.434. 
Si a > b dans R, alors 
= 1.606) 
rh (1. 


1.23.3 Complétude 


Le théorème 17.138 donne une complétion de tout espace métrique en un espace complet. Il 
serait tentant de l'utiliser ici pour définir R à partir de Q. Cette méthode ne fonctionne cependant 


pas parce que la démonstration de 17.138 utilise le fait que R est complet. 
LEMooXCVRooOSZYWv 


Lemme 1.435. 
Nous avons 


lp(a)l = w(lal) (1.607) 


pour tout q € Q. 


Démonstration. Soit q € Q. Si q > 0 alors nous avons d’une part |q| = q dans Q, et d’autre part 
#(q) > 0 dans R. Donc au final 


le(g)l = (a) = v(lal). (1.608) 

Supposons au contraire que q < 0. Alors |q| = —q dans Q, mais aussi w(q) < 0. Donc 
lp(a)l = —p(a) = pa) = p(lal). (1.609) 
LemooRTGFooYVstws 


Lemme 1.436 ([17, 1]). 
Toute suite de Cauchy dans Q converge dans R vers le réel qu’elle représente. 

Plus précisément, en suivant les notations de 1./02, si (xx) est une suite de Cauchy dans Q, 
alors 


(1) (xx) est une suite de Cauchy dans R. 
R 
(2) (xx) — &. 
Ici x est la classe de la suite x. C’est donc un élément de R. 
Démonstration. Soit (x,) une suite de Cauchy de Q, c’est-à-dire que xx € À pour tout k et qu’elle 


est de Cauchy. Elle représente un réel x € R, et nous voulons prouver que pour la topologie de R 
nous avons limy-_,0 P(Tn) = Z. 
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(1) v(xx) est de Cauchy 


Soit e > 0 dans R. Nous considérons € € Q tel que 0 < €’ < €. Plus précisément tel que 


O<yp(é)<e. (1.610) 


Soit N > O0 tel que |x, — x] < €’ pour tout p,q > N. Cela existe parce que (x4) est dans 
Cauchy dans Q. Nous avons alors 


(tp) — pra)l = lp(tp — Ta)| (1.611a) 
_ e(len : T4) SUBEQooZPTIo Mt) 
< €. (1.611d) 


Justifications : 


Pour (1.611b). C’est le lemme 1.435. 
Pour (1.611c). L'application 4 est croissante, lemme 1.416. 


Donc la suite 4(x4) est de Cauchy. 


(2) v(xx) KE, 3 Nous devons prouver que pour tout e € R, il existe N tel que n > N implique 


P(Tn 


(2a) 


(2b) 


)E B{Z, €). Nous allons faire ça en deux parties. D’abord € € À et ensuite € € R. 
Avec EE À Soit ee À. Puisque x est une suite de Cauchy dans Q, il existe N tel que 


i > N 
sip,n nous avons EQooJURNoo 7 
Tp — € < En < Lp + €. L. | 


Ces inégalités sont dans Q. Nous fixons p et nous commençons par écrire plus en détail 
la première inéquation : 
Tp — E— En < 0. (1.613) 


Autrement dit, pour tout n nous avons 
(Tp — Ebn < En: (1.614) 
Pour rappel, la suite x, — € est la suite constante dans Q. La suite 
Ne Tn — (Tp — En (1.615) 
est dans €*. Donc, en vertu de la définition 1.413 nous avons 
2-7 -e>0. (1.616) 
Nous pouvons aussi bien écrire 
z > p(rp) — p(e). (1.617) 
En prenant l’autre inégalité de (1.612) nous trouvons de la même manière que 
T < E(tp) + p(e). (1.618) 
Ces deux inégalités ensemble montrent que 
p(rp) € B(&,v(e)). (1.619) 


Avec ee R Nous considérons e€ R et é € Q tel que y(e) < €. Par le point précédent, 
il existe N tel que p > N implique 


p(xp) € B(x,v(e')). (1.620) 
Étant donné que g(e/) < € nous avons 


pr?) € B(&,v(e)) «€ B(x,e). (1.621) 
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PROPooZSQYooWRKNGY 
Proposition 1.437. 


Soit une suite convergente xx , q. Alors 


px) > p(q) (1.622) 


où & est la fonction qui à un rationnel fait correspondre la classe de la suite constante correspon- 
dante 169. 


Démonstration. Le fait d’avoir une convergence 4 — q dans Q implique que la suite (xx) est de 
Cauchy, par la proposition 1.391(1). 

Le lemme 1.436 nous indique que w(x4) est une suite dans R qui converge vers q, la classe de 
la suite (xx). 

À prouver : (x) = q. Autrement dit, nous devons prouver que la classe de la suite constante 
ax = q et la classe de la suite x sont les mêmes. 

La suite (xx — q) est de Cauchy dans Q et converge vers zéro par hypothèse. Donc les suites x 
et (q) sont dans la même classe. 


PROPooFGBÜooHiZqbs 
Proposition 1.438 ([1]). 
Deux choses à propos de suites de rationnels convergeant vers un réel. ITEMooMAVYo0KFtqlx 


(1) Soit un réel x. Il existe une suite de rationnels strictement croissante JU TENLTEAR LEE cc 


(2) Si de plus x > 0, alors la suite (toujours strictement croissante) peut être choisie parmi les 
rationnels strictement positifs. 


Démonstration. Le lemme 1.424 nous sera d’une grande aide. Soit x € KR. Il existe go € À tel 
que æ — 1 < go < x. Ensuite nous construisons la suite par récurrence : gx est choisi tel que 
qr-1 < gx < æ. Cela règle le point (1). 

Pour (2). Il suffit de faire la même chose, en partant de 0 < qo < x. 


THOooUFVJooYJlieh 
Théorème 1.439 (Complétude de R, critère de Cauchy[17]). 
Nous avons : 
(1) Le corps R est un corps complet (définition 1.367(5)) 


(2) Une suite dans R est convergente (définition 1.367(1)) si et seulement si elle est de Cauchy 
(définition 1.367(3)). 


Notez la grande similitude entre ce théorème et le théorème 7.272. Ils ne sont pas équivalents, 
ne parlent pas exactement du même objet « R », ni des mêmes notions de suites de Cauchy et de 
complétude. 


Démonstration. Soit (x,) une suite de Cauchy dans R. Pour chaque n, il existe par le lemme 1.424 
un Yn € À tel que 
1 1 
Tn — — <'Yn < En + —. (1.623) 
n n 
(1) (yn) est une suite de Cauchy dans Q Nous prouvons que (y) est une suite de Cauchy 


dans Q (définition 1.367(3)). Vu que (x,) est de Cauchy pour le corps R, si € > 0 dans R 
est donné, il existe n. tel que si p,q > ne, alors [tp — tal < €. 


Nous avons : j j 
[Up — Yal < [Up sn Tp] + Es _ Tal + [Ta Yal < p TET+ q' (1.624) 


En choisissant Ne: > max{n,, 1} (ce qui est possible par le lemme 1.421), et en prenant 
p,q > N4, nous avons 
Up — Val < 3, (1.625) 


169. Voir les notations en 1.402. 
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ce qui prouve que (7,) est une suite de Cauchy dans Q, pour la notion de suite de Cauchy 


dans Q. 


Le réel représenté 


Puisque (y,) est de Cauchy dans Q, elle représente un réel que nous notons ÿ. 


Convergence de (z») 


R - 
Nous prouvons que Zn — ÿ. 
Nous savons qu’une suite de Cauchy de rationnels converge dans R vers le réel qu’elle re- 


présente, c’est-à-dire : y» En y où chaque yn € À est vu comme la suite constante (cela 
est le lemme 1.436). Autrement dit, pour € > 0, il existe un Ne € N tel que si p > Ne alors 
[ÿ — ypl < €. Pour un tel p nous avons 


- = l 
D — To < 19 — Vol + [Up — Lol re (1.626) 
Donc dès que p est plus grand que max{N, 1}, nous avons |y — x)| < 2e, ce qui signifie que 


la suite (x,) converge vers y dans R. 
Ceci achève de prouver que R est un corps complet. 


En ce qui concerne l’équivalence entre les suites convergentes et de Cauchy, nous venons de 
prouver que toute suite de Cauchy dans R est convergente. La réciproque est la proposition 1.390. 


Nous avons terminé avec la construction des réels. Les propriétés topologiques arrivent en la 
section 10.3. En particulier le théorème 7.272 pour la complétude de R en tant qu’espace métrique. 


1.23.4 Intervalles 


Nous avons déjà défini la notion d'intervalle pour un espace totalement ordonné en 1.21. Nous 
posons quelques notations dans R. 


DEFooAQBUooKLChOW 


Définition 1.440. 
Soient a Æ b dans R. Nous définissons les parties suivantes de R : 


(1) 
(2) 
(3) 


(7) 
(8) 


la, b[ = {xeR tel que a < x < b} 
a,b[={xeR tel que a < x < b} 
a,b|={xeR tel que a < x < b} 
a,b|={xeR tel que a <x< b} 


œo,al={xeR tel que x < a} 


a,@[={xeR tel que x > a} 


[ 
] 
[ 
]-w,a]={xenR tel que x < a} 
= 
] 
[ 


a,@[={xeR tel que x > a}. 


La proposition 1.449 nous dira que tous les intervalles de R sont d’une de ces formes. 


1.23.5 Maximum, supremum et compagnie 


Ce n’est un secret pour personne que R est un ensemble totalement ordonné !"° : il y a des 
éléments plus grands que d’autres, et mieux : à chaque fois que je prends deux éléments différents 
dans R, il y en a un des deux qui est plus grand que l’autre. Il n’y a pas d’ex æquo dans R. 


La définition du maximum d’une partie est la définition 1.14. 


170. Proposition 1.414. 
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Proposition 1.441. 
Soient x1,...,æg € IR. Alors nous avons 


HG Cor (=) (1.627) 


Démonstration. En effet notons y = min(x;). Nous avons alors 1/x; < 1/y pour tout 1. 


Définition 1.442. 
Soit À, une partie de R. 


(1) Un nombre M est un majorant de À si M est plus grand que tous les éléments de À : pour 
tout x € À, M > x. 


(2) Un nombre m est un minorant de À si m est plus petit que tous les éléments de À : pour 
toutxEe A,m< x. 


Nous parlons de majorant ou de minorants stricts lorsque les inégalités sont strictes. 
Nous insistons sur le fait que l'inégalité n’est pas stricte. Ainsi, 1 est un majorant de [0,1]. Dès 


qu’un ensemble a un majorant, il en a plein. Si s majore l’ensemble À, alors s +1, s +4, et s + 5 
majorent également À. 


Exemple 1.443. 

Une petite galerie d'exemples de majorants. 
— L’intervalle fermé [4,8] admet entre autres 8 et 130 comme majorants, 
— l'intervalle ouvert |4,8[ admet également 8 et 130 comme majorants, 
— 7 n’est pas un majorant de [1,5]0]8, 32], 
— 10/10 majore les notes qu’on peut obtenir à un devoir. 
— l'intervalle [4,0[ n’a pas de majorant. 


A 
DefSupeA 


Proposition-Définition 1.444 (Least-upper-bound property|[78]). 
Soit À une partie majorée de R. Il existe un unique élément M ER tel que 

(1) M > x pour tout x € À, 

(2) pour tout €, le nombre M —E n’est pas un majorant de A, c’est-à-dire qu'il existe un élément 

x € À tel que x > M —E€. 
Cet élément est nommé supremum de À et est noté sup(A). De la même façon, l’infimum 

de À, noté inf À est l’unique réel m € R vérifiant 

(1) m < x pour tout x € À, 


(2) pour tout € > 0, le nombre m + € n’est pas un minorant. 


Par convention, si la partie n’est pas bornée vers le haut, nous dirons que son supremum n'existe 
pas, ou bien qu’il est égal à +00, suivant les contextes. Pour votre culture générale, sachez toutefois 
que © € R. 


Démonstration. Nous faisons la preuve pour l’infimum. 


(1) Unicité 
En ce qui concerne l’unicité, soient m1 et m2, deux infimums de À. Supposons m1 > m2. 
Alors il existe € > 0 tel que m2 < m2+€ < m1 (c'est le lemme 1.424). Cela prouve que m2 +€ 
est un minorant de À et donc que m2 n’est pas un infimum. 

(2) Existence 


Soit À, une partie de R. Nous allons trouver son infimum en suivant une méthode de di- 
chotomie. Pour cela nous allons construire trois suites en même temps de la façon suivante. 
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D'abord nous choisissons un point x0 de À et un point æ1 qui minore À (qui existe par 
hypothèse) : 
xo est un élément de À, 


x1 est un minorant de À, 


ao = T0 (1.628) 
bo = x1 
bi = x1. 


Ensuite, nous faisons la récurrence suivante : 


An + On 
Fan 
An Si Tn+1 minore À 
An+1 — : 
Tn+1 Sinon, (1.629) 
Tn+i1 Si Xn+1 Minore À 
bn+1 — 


bn sinon. 


Nous allons montrer que (a,) et (b,) sont des suites convergentes de même limite et que cette 
limite est l’infimum de À. 

Soit n € N; il y a deux possibilités. Soit ay = an-1 et bn = Zn, Soit an = Xn €t bn = bn_1. 
Supposons que nous soyons dans le premier cas (le second se traite de façon similaire). Alors 
nous avons 


[an bn] = ei ga] 
_ 0-0 
ns 9 (1.630) 
1 
— 5lan-1 — by; 


ce qui prouve que |an — bn| — 0. Nous montrons maintenant que la suite (a,) est de Cauchy. 
En effet nous avons 
0 1 

lan — an-1| = faut < = (1.631) 
Il en est de même pour la suite (b,). Ce sont deux suites de Cauchy (donc convergentes par 
la proposition 1.390) qui convergent vers la même limite. Soit £ cette limite. 
Le nombre { minore À. En effet si a € À est plus petit que /, les éléments b, tels que 
[bn — €] < |a — {| ne peuvent pas minorer A. D'autre part, pour tout €, le nombre { +e ne 
peut pas minorer À. En effet, { est la limite de la suite décroissante (a,), donc il existe a» 
entre £ et {+e. Mais a, ne minore pas À, donc £ + e ne minore pas non plus À. 
Nous avons prouvé que toute partie minorée de R possède un infimum. 


La preuve que toute partie majorée possède un supremum se fait de la même façon. 
LEMooSSVKooDPhSkq 


Lemme 1.445. 
Soit une partie À de R. Si M est un majorant de À, alors M > sup(AÀ). 


Démonstration. Si M < sup(A), alors en posant € = sup(A) — M, le nombre sup(À) — € est encore 
un majorant de À, ce qui est impossible par définition d’un supremum. 


LEMooSSENooDDXNrp 
Lemme 1.446. 
Si À est une partie de R, alors 
sup(A) = — inf(—À). (1.632) 
LEMooTRJZooSTuHWs 


Lemme 1.447. 
Soit une partie bornée À dans R. Si (x) est une suite dans À convergente vers sup(A), alors il 
existe une sous-suite croissante qui converge également vers sup(A). 
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1.23.5.1 Intervalles 
LEMooRMUCooMKiTGr 


Lemme 1.448 (|1]). 
Soit une partie À de R. ITEMooIQECooF j JFKz 


(1) Nous supposons que À admette un supremum qui n’est pas dans À. Si x est un élément de 
A strictement plus petit que sup(A), alors il existe y € À tel que x < y < sup(À). 


(2) Nous supposons que À admette un infimum qui n’est pas dans À. Six est un élément de À 
strictement plus grand que inf(A), alors il existe y € A tel que inf(A) < y < x. 


Démonstration. Soit € > 0. Par définition 1.444 d’un supremum, le nombre sup(A) — € n’est pas 
un majorant de À. Autrement dit, il existe y € À tel que y > sup(A) — €. Vu que sup(À) est plus 
grand que tous les éléments de À et qu’il n’est pas lui-même dans À, nous avons aussi sup(A) > y. 
En mettant bout à bout : 

x < Sup(AÀ) — € < y < sup(À). (1.633) 


PROPooHPMWooQJXCAS 
Proposition 1.449 ([1]). 
Tous les intervalles!" de R sont d’une des formes listées dans la définition 1.4/0. 


Démonstration. Il y a beaucoup de cas, et nous ne les feront pas tous !7?. 


(1) Si Z est borné vers le haut et vers le bas Il y à 4 possibilités suivant que inf(1) et 


sup(]) soient ou non dans 1. 
(2) Siinf(1)e I et sup(1) € I Nous prouvons que 7 = [inf(7),sup(J)]. 
(2a) Dans un sens Si x € I nous avons inf(]) < x < sup(J) parce que inf(1) est un 
minorant de toute élément de 1 alors que sup(J) est un majorant de tout élément de 1. 
Donc x € [inf(7),sup(1)]. 
(2b) Dans l’autre sens Soit inf(1) < x < sup(1). Vu que 1 est un intervalle et que sup(J) 
et inf(7) sont deux éléments de 1, nous avons x € I. 


(3) inf(1) e I et sup(1) I Nous allons démontrer que 7 = [inf(1),sup(17). 
(3a) Dans un sens Soit x € I. Nous savons (par définition de l’infimum et du supremum) 


que inf(1) < x < sup(x). Mais nous sommes dans un cas où sup(1) Æ x parce que 
sup(1) n’est pas dans 7. Donc 


inf(1) < x < sup(1), (1.634) 


ce qui montre que 1 € [inf(1),sup(1)[. 

(3b) Dans l’autre sens Soit x € [inf(7),sup(J)[. Nous utilisons le lemme 1.448(1) : il 
existe y € I tel que inf(7) < x < y < sup(]). Vu que inf(J) € I, que y € I et que I est 
un intervalle, nous avons aussi x € Z et donc 7 € [inf(7),sup(1)[. 


(4) inf(1) # I et sup(1) ET C’est le même raisonnement, mais en utilisant l’autre partie du 


lemme. 
(5) inf(J) é I et sup(1) TI Nous prouvons que 7 = Jinf(1),sup(7). 


(5a) Dans un sens Nous avons 


TIC {xeR tel que inf(1) < x < sup(1)}. (1.635) 


Mais comme inf(7) et sup(/) ne sont pas dans 7, nous pouvons les enlever dans le 
membre de droite : 


IC {xeR tel que inf(1) < x < sup(1)} = Jinf(7),sup(1)[. (1.636) 


171. Définition 1.21. 
172. Si vous avez un doute, écrivez-moi. 
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(5b) Dans l’autre sens Si x € 1, nous avons inf(1) < x < sup(1). En utilisant les deux 
parties du lemme, nous avons y; et y2 dans 1 tels que 


inf(l) < y < x < ya < sup(I). (1.637) 


Vu que J est un intervalle, nous en déduisons que x € 1. 
(6) inf(7) = —o, sup(1) e TI Nous prouvons que 7 = [—-,sup(7)|. 


(6a) Dans un sens L’inclusion 7 € {x € R tel que x < sup(7)} est automatique : sup(1) 
majore tous les éléments de J. 

(6b) Dans l’autre sens Soit x < sup(1). Vu que Z n’a pas d’infimum, il existe y € I tel 
que y < x < sup(1). Comme J est un intervalle nous déduisons que x € I. 


Je vous laisse voir les autres cas. 


1.23.5.2 Quelques exemples 


En matière de notations, le maximum de l’ensemble À est noté max À, le supremum est noté 
sup À. Le minimum et l’infimum sont notés min À et inf À. 


Exemple 1.450. 
Exemples de différence entre majorant, supremum et maximum. 


— Le nombre 10 est un supremum, majorant et maximum de l'intervalle fermé [0, 10], 


— Le nombre 10 est un majorant et un supremum, mais pas un maximum de l'intervalle ouvert 


10, 10, 
— Le nombre 136 est un majorant, mais ni un maximum ni un supremum de l'intervalle [0, 10]. 
A 
En utilisant les notations concises, ces différents cas s’écrivent ainsi : 
10 = max{0, 10] = sup[0,10] 10 = sup[0, 10[ (1.638) 


Exemple 1.451. 

Si on dit qu’un pont s'effondre à partir d’une charge de 10 tonnes, alors 10 tonnes est un supremum 
des charges que le pont peut supporter : si on met 9, 999999 tonnes dessus, il tient encore le coup, 
mais si on ajoute un gramme, alors il s'effondre (on sort de l’ensemble des charges acceptables). A 


Exemple 1.452. 
Si on dit qu’un pont résiste jusqu’à 10 tonnes, alors 10 tonnes est un maximum de la charge 
acceptable. Sur ce pont-ci, on peut ajouter le dernier gramme. Mais à partir de là, le moindre truc 


qu'on ajoute, il s’effondre. A 
LEMooWCUXooFqTwDK 


Lemme 1.453. 

À propos de bornes d’un intervalle dans KR. 
(1) La borne inférieure | d’un intervalle est son infimum, 
(2) la borne supérieure est le supremum. 


(3) Si de plus l'intervalle est fermé, l’infimum est un minimum et le supremum est un maximum. 


Démonstration. Soit 1 un des intervalles [a,b], [a,b[, ]a,b], |a,b[. Nous allons montrer que dans 
tous ces cas, a est l’infimum de 1. 

Nous allons prouver que dans tous ces cas, a = ((1) en vérifiant les deux conditions de la 
définition 1.444. D'abord par définition d’un intervalle, pour tout t € 1 nous avons t > a. Première 
condition vérifiée. Ensuite, nous prenons € > 0. Si a + € > b, alors n'importe quel élément de J est 
plus petit que a +e. Si a + € < b, alors nous avons 


a<a+e<b. (1.639) 


173. Ici par « borne inférieure » nous entendons le a dans les intervalles du type ]a,b|, [a,b], etc. 
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Dans ce cas, le lemme 1.424 donne un réel t tel que a <t < a+e< b. Doncte I et a+e n’est pas 
un minorant de 1. 


Exemple 1.454. 
Quelques exemples dans les intervalles. 


(1) À = [1,2]. Tous les nombres plus petits ou égaux à 1 sont minorants, 1 est infimum et 
minimum. Le nombre 2 est un majorant, le maximum et le supremum. 


(2) B = ]3,7[. Le nombre 7 est le supremum et est un majorant, mais n’est pas le maximum 
(parce que 7 # B). L'ensemble B n’a pas de maximum. Bien entendu, —1000 est un minorant. 


Dans les deux cas, le nombre 53 est un majorant. PA 
Il existe évidemment de nombreux exemples plus vicieux. 


Exemple 1.455. 

Prenons E — {1 tel que n € No}, dont les premiers points sont indiqués sur la figure 1.1. Cet 
ensemble est constitué des nombres 1, i, À, ..Le plus grand d’entre eux est 1 parce que tous les 
nombres de la forme L avec n > 1 sont plus petits ou égaux à 1. Le nombre 1 est donc maximum 
de E. 

L'ensemble Æ n’a par contre pas de minimum parce que tout élément de Æ s'écrit L pour un 
certain n et est plus grand que ns qui est également dans E. 

Prouvons que zéro est l’infimum de E. D'abord, tous les éléments de E sont strictement positifs, 
donc zéro est certainement un minorant de Æ. Ensuite, nous savons que pour tout € > O, il existe 
un n tel que L est plus petit que €. L'ensemble Æ possède donc un élément plus petit que 0 +Ee, 
et zéro est bien l’infimum. A 


. LA d 1/6 1/7 1e 1/9 1/10 


> 


FIGURE 1.1: Les premiers points du type Zn = 1/n. Labe1FigSuiteUnSurn 


L'exemple suivant est une source classique d’erreurs en ce qui concerne l’infimum. 


Exemple 1.456. 
Les premiers points de l’ensemble F = (a tel que n € No} sont représentés à la figure 1.2. Bien 
que (comme nous le verrons plus tard) la limite de la suite x» = (—1)"/n soit zéro, il n’est pas 
correct de dire que zéro est l’infimum de l’ensemble F'. Le dessin, au contraire, montre bien que 
—1 est le minium (aucun point est plus bas que —1), tandis que le maximum est 1/2. 

Nous reviendrons avec cet exemple dans la suite. Pour l’instant, ayez bien en tête que zéro 
n’est rien de spécial pour l’ensemble F en ce qui concerne les notions de maximum, minimum et 
compagnie. A 


1.23.6 Racines 
SUBSECooMBCNooËg)jjTY 


Dans cette section, nous définissons 4/x pour x € QT. Vous notez que c’est fait de façon assez 
algébrique !’#, ou en tout cas, en restant proche des définitions. Des définitions plus technologiques 
utilisant la continuité de x + x” et qui prouvent que l’application est bijective sur un domaine 


174. Discutable parce que des limites sont utilisées. 
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FIGURE 1.2: Les quelques premiers points du typebaihifhiternversealterne 


choisi avec prudence existent (voir la définition 12.391). Il est même expliqué dans [73] que la 
méthode décrite ici permet de définir {/x pour tout n entier, et pas seulement pour n = 2. 


PROPooUHKFooVKmpte 


Proposition 1.457. 
Soit qe Q+. Il existe un unique r € R tel que r? = q. 

Plus précisément, en termes des notations de 1./02, pour tout q € Q*, il existe un unique 
re R* tel que r? = w(q). 


Démonstration. En deux parties : d’abord l'existence et ensuite l’unicité. 


(1) 


Existence Si q = O0, c’est r = 0. Nous supposons q > 0. La suite (+4) de la proposition 
1.397 a la propriété d’être de Cauchy dans Q. Donc il existe un réel r qui est la classe de 
cette suite. Nous posons donc 

r=&. (1.640) 


En ce qui concerne r?, nous avons, par définition du produit dans R, 


0e ), OO RE) 


c’est la classe de la suite de Cauchy donnée par les x?. Posons y; = x? ; la relation (1.641) 
s'écrit 


r=% 


r = ÿ. (1.642) 


La proposition 1.397 nous dit également que y est une suite de Cauchy et que 


Uk =, q (1.643) 


La proposition 1.437 donne alors y = q, et finalement 


r? = q = p(a). (1.644) 


Ici tout n’est pas encore terminé avec l'existence parce qu'il faut nous assurer que r > 0. Ce 
n’est pas très compliqué : si r < 0, alors nous pouvons faire le choix —r qui convient tout 


aussi bien : (—r)? = r?. 


Unicité Supposons r1,r2 € R tels que r? = r?. La proposition 1.414 dit que R est totale- 
ment ordonné ; disons pour fixer les idées que r1 < r2. Cela signifie, par définition de l’ordre 
sur R, que r2 — r1 > 0. En posant 5 = r2 — r1 nous avons r2 = r1 + s. Passons au carré: la 
distribution dans le calcul suivant provient du fait que R est un corps : 


r = (r1 + s)? = r? + Qrys + 52. (1.645) 
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Vu que r? = q = rà, nous avons 2r1s + s? = Ü ou encore 


s(2r1 + s) = 0. (1.646) 


Puisque R est un corps, c’est un anneau intègre |" et la règle du produit nul s'applique : soit 


5 = 0, soit 2r2 + s = 0. Puisque r2 > 0 et que s > 0, nous avons 2r2 + s > 0 et donc s = 0. 
Nous en déduisons que r1 = r2. 


1.23.7 Corps valué 
DEFooBWXXo0AKBBRS 


Définition 1.458 (Valeur absolue, corps valué[79, 80]). 
Soit un corps K. Une valeur absolue sur K est une application |.|: K — R* telle que 


(1) |xl = 0 si et seulement si x = 0, 
(2) le + ul < xl + lyl 
(3) leyl < lrllyl. 


Un corps muni d’une valeur absolue est un corps valué. 


Un corps valué sera un espace topologique métrique dans la définition 7.173. Dans le cas d’un 
corps totalement ordonné, nous avons une valeur absolue donnée par 1.367(2) et les principales 
propriétés dans le lemme 1.371. 


1.23.8 Partie entière, partie fractionnaire 
LEMooLEXTooGAQxGB 


Lemme-Définition 1.459 ([81]). 
Pour tout réel x, il existe un unique entier n vérifiant 


n<tr<n+il (1.647) 


Dans ce cas nous avons x —n € [0,1{. 

Le nombre n ainsi défini est la partie entière de x, et il sera noté int(x). Le nombre x —-int(x) 
est la partie fractionnaire de x que nous notons frac(x). 

Il est toutefois à noter que la partie fractionnaire de x n’est pas garantie d’être une fraction ; 


cette dénomination est donc un peu trompeuse. 
LEMooMMSAooFiRkQd 


Lemme 1.460. 
SiÂER n’est pas un entier, alors int(À) +2 > À. 


1.24 Les complexes 


La notion de module d’un nombre complexe |z| sera donnée beaucoup plus tard, dans le lemme 
10.95. La raison est que le module demande la racine carrée. 


Définition 1.461 (Nombres complexes|[82]|). 
L'ensemble des nombres complexes C est l’ensemble R? muni des opérations suivantes : 
(1) 
Xc:CxC—C ERSSENOseRr RES 
(Ce, 9), (,9)) = (œa' — yy ay + ya’) | 
(2) 
+ CxC—-C 


(G,v),(&, 9) (x +x/,y +) (1.649) 


175. Lemme 1.194. 
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(4) 
-:RxC—-C 


(À, (x, y)) + (x, y). (1.650) 


Lemme 1.462. 
Le triplet (C, +, *Xc) est un anneau 
neutre pour la multiplication est (1,0). 


176 commutatif dont le neutre pour l'addition est (0,0) et le 


Démonstration. Ce ne sont que des calculs. Juste pour vous montrer, voici la première partie pour 
l’associativité : 


((a, 6) w))(5, 0) = (ar — by ay + ba)(s, 0) (1.651a) 
= (axs — bys — ayt — bxt, art — byt + ays + bæs). (1.651b) 


Nous avons utilisé la distributivité sur LR, provenant du fait que R est un corps par le théorème 
1.401. 


Lemme 1.463. 
L'’anneau © est un corps. 


Démonstration. 1 suffit de trouver un inverse pour chaque élément non nul. Soit un élément non 
nul (a,b) € C. En combinant les lemmes 1.430 et 1.431 nous savons que a? +b? > 0. En particulier, 
cet élément est inversible dans KR, et nous pouvons considérer l'élément suivant de € : 


a b 


_ Ge +P) * 
Prouver que z(a,b) = (1,0) est maintenant juste un calcul. 
Lemme 1.464. 
L'application 
PAS ne (1.653) 
xt (x,0) 
est un morphisme d’anneaux!"T. 
Démonstration. Simples calculs. Par exemple 
p(zz") = (zx’,0) = (x,0)(x’,0) = w(x)p(x"). (1.654) 


1.465. 
Admirez ... 


— Un nombre complexe est un couple de réels. 


n réel est une classe d'équivalence de suites de Cauchy de rationnels. 


ne suite de Cauchy de rationnels est une application N — Q vérifiant certaines propriétés. 


n élément de Z est une classe d'équivalence de couples de naturels. 


U 
U 

— Un rationnel est une classe d’équivalences d’éléments de Z. 
U 
U 


n naturel sera ...là c’est plus compliqué. Une construction vraiment rigoureuse des naturels 
risque d’être en dehors du cadre du Frido. 


Bref, les objets que nous manipulons sont d’une effroyable complexité. 


1.466. 
À partir de maintenant, lorsque nous parlons de R, nous parlons en réalité de w(R) € ©. 


176. Définition 1.41. 
177. Définition 1.42. 
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Lemme 1.467. 
Nous avons (0,1)? = (—1,0). Nous notons i = (0,1). 


Démonstration. Calcul direct à partir de la définition 1.648. 


La proposition suivante donne la forme cartésienne des nombres complexes. Pour la forme 


trigonométrique, il faudra attendre la proposition 18.62. 
PROPooKQHLooMFxNLe 
Proposition 1.468 ([1]). 
L'application 
"Rs 0 
Ï | (1.655) 
(a,b) — ag(1) + bi 


est un isomorphisme de R-module !"®. 
Cette proposition permet d'écrire tout nombre complexe sous la forme a + bi pour des réels a 


et b. 
DEFooQDDVooRYDsAJ 


Définition 1.469. 
Si z = a+ bi est un nombre complexe (avec a,b € R), son complexe conjugué est le nombre 
a — bi. 


L'étude de la série géométrique est reportée à (beaucoup) plus tard, à la proposition 11.122. 


Dans l’immédiat il nous est possible de calculer la somme partielle. 
LEMooAFSCooWEVlvp 
Lemme 1.470 (Somme partielle de la série géométrique). 
Soit qe C. Nous avons 
N Le 1 qNHi 
2 9” | (1.656) 
n=0 Clg = À 


. Nous avons évidemment Sw — gSv = 1—gq"*let 


+" 
êee res Eu 


Démonstration. Posons Sx = 1 + q +. 
donc 


lg. 


178. Module, définition 1.323. 


Chapitre 2 


Théorie des groupes 


Pour rappel, la notion de groupe est définie en 1.36. 


2.1 Groupe dérivé 

DEFooVHZAooUgmesE 
Définition 2.1. 
Si Gest un groupe et si g,he G, nous notons [g,h] = ghg th! le commutateur de g et h. 


L'élément neutre est toujours un commutateur : pour g = h, [g,g] = ggg-‘g-!=e. 
DEFooBNLPooShKYXa 


Définition 2.2. 
Le groupe dérivé de G est le sous-groupe noté D(G) ou [G,G] engendré! par les commutateurs. 


Autrement dit, D(G') est l'intersection de tous les sous-groupes de G contenant tous les com- 
mutateurs. Le groupe D(G) contient toujours au moins le neutre parce que c’est un groupe. 

En vertu du lemme 1.316, le groupe dérivé de Gest l’ensemble des produits finis de commuta- 
teurs. C'est-à-dire que si 5,, est l’ensemble des produits de m commutateurs, alors 


D(G) = Ü Ce (2.1) 


LemMMOCooDJJJhy 
Lemme 2.8. 
Le groupe dérivé est un sous-groupe caractéristique?, et un sous-groupe normal*. 


Démonstration. Il est évident que si a € Aut(G@) alors 


a([g, A) = [a(g),a(h)], (22) 


c’est-à-dire que D(G) est un sous-groupe caractéristique. En particulier si c est un commutateur, 


alors æcx | en est encore un, ce qui montre que D(G) est normal dans G. Plus spécifiquement, 
t(ghg th Da 2 (xgx M(xhx !(xg x N(xh 1x1 (2.3a) 
= (292 (zh leger 1) Hxhæ DE. (2.3b) 
PropAPRGooHBkELf 


Proposition 2.4. 
Le groupe quotient G/D(G) est abélien. 


1. Définition 1.311. 
2. Définition 1.169. 
3. Définition 1.168. 
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Démonstration. En ce qui concerne le fait que G/D(G) soit abélien, nous savons que pour tout 
g,h € G nous avons h lg lhge D(G) et donc 


[g]TA] = [gh] = [ghh "9 'hg] = [hg] = [AI(o]. (2.4) 


Le groupe quotient G/D(G') est appelé l’abélianisé de G et est parfois noté G. 

Si f: G — A est un morphisme entre le groupe G et un groupe abélien À, alors f (D(G)) = {0} 
Du coup f passe au quotient de G par D(G), et il existe une unique application f: G/D(G) — A 
telle que f = for où x: G — G/D(G') est la projection canonique. 


2.2 Théorèmes d’isomorphismes 

DEFooWBIYooGNRYOp 
Définition 2.5. 
Soient un groupe G, un ensemble X et une application f: X — G. Le noyau de f est la partie 


ker(f) = {re X tel que f(x) = e} (2.5) 
où e est l’élément neutre de G. 


Si G est un groupe et si N est un sous-groupe normal, alors l’ensemble G/N à une structure 


de groupe et la projection canonique x: G — G/N est un morphisme surjectif de noyau N. 
ThoPremierthoisomo 


Théorème 2.6 (Premier théorème d’isomorphisme). 
Soit 0: G — H un morphisme de groupe. Alors 


(1) ker(@) est normal dans G, 


(2) Image 0 est un sous-groupe de H TtentLCLdk 


(3) nous avons un isomorphisme 


+ Image 0 (2.6) 


Démonstration. Point par point. 
(1) Le fait que ker(0) soit un sous-groupe de Gest clair; montrons qu’il est normal. Si ge Get 
u € ker(@), alors 0(g-lug) = 0(g-!)O(u)0(g) = (4(g)) ‘@(g) = 1x, et donc g_lug € ker(0). 
(2) Il suffit de remarquer que si hk = 0(g) et h! = 0(g'), alors h-1h! = 0(g-!g/). 
(3) Si [g] représente la classe de g dans G/ker(0), l’isomorphisme est donné par w([g]) = 4(g). 


THOooURXUooQJvkjx 
Théorème 2.7 (Deuxième théorème d’isomorphisme). 
Soient H et N deux sous-groupes de G et supposons que N soit normal”. Alors 


(1) NH = HN est un sous-groupe. 
(2) Le groupe N est normal dans NH. 


(3) Le groupe N n H est normal dans H. ItemjRPajc 
(4) Nous avons l’isomorphisme 
HN H 


a 


N HON 


(2.7) 


Démonstration. Point par point. 


4. Si N n’est pas normal, il y aura la proposition 2.8. 
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(1) I est clair que 1G € NH. Soient nh et n’h' deux éléments de NH ; alors en tenant compte 
du fait que N est normal, 
nhn'h = nhnh hh e NH. (2.8) 
en — 
EN 
Cela prouve que NH est un groupe. 
De la même façon, nous prouvons que HN est un groupe par 


hnh'n' = hh! nn! n'e HN (2.9) 
eN 


Nous devons encore prouver que HN = NH. Pour cela, nh € HN, car nh = hh=-!nh, les 
trois derniers facteurs formant un élément de N par normalité ; de même hkn € NH, montrant 
que NH = HN. Enfin, comme (nh) ! = h-ln 1, les inverses de NH sont dans HN = NH. 
(2) N est normal dans G, a fortiori dans l’un de ses sous-groupes. 
(3) Il suffit de voir que, sihe Hetne NN H, alors hnh-l e N n H. Or, hnh-! € H puisque 
H est un sous-groupe; et Anh! e N car N est un sous-groupe normal de G. 


(4) I faut d’abord remarquer que H et N étant des groupes et le produit NH étant un groupe, 
nous avons NH = HN. Soit le morphisme injectif 


jj: H — HN 
° (2.10) 
hr h 
et la surjection canonique 
oc: HN — HN/N (2.11) 
Nous considérons ensuite l’application composée 
: H — HN/N 
Ï / (2.12) 
hr AN. 


(4a) f est surjective L'application f est surjective parce que l’élément hnN € HN/N est 
l’image de h, étant donné que knN = AN. 
(4b) ker(f)= HAN Siae HAN, nous avons f(a) = aN = N,et donc HAN EC ker(f). 


D'autre part, si h € H vérifie h € ker(f), alors f(h) = ÀN = N, ce qui est uniquement 
possible lorsque h € N. 


Le premier théorème d’isomorphisme * implique alors que H/ker(f) + Image f, c’est-à-dire 


HINNnH=HN/N. (2.13) 


PROPooVBGMooPTlyLF 
Proposition 2.8 (Deuxième théorème d’isomorphisme (suite)). 
Soient N et H des sous-groupes de G. Si H normalise N, c’est-à-dire si kNh=! e N pour tout 
h € H, alors nous avons l’isomorphisme 


HN H 


N HAN 


(2.14) 


ThoezgBep 
Théorème 2.9 (Troisième théorème d’isomorphisme). 
Soient N et M deux sous-groupes normaux de G avec M € N. Alors N/M est normal dans G/M 
el 
(G/M)/(N/M) = G/N. (2.15) 


5. Théorème 2.6. 
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Démonstration. Afin de montrer que N/M est normal dans G/M, nous considérons ge G,nM € 
N/M et nous calculons 


gnMg ! = gng ‘gMg ! = gng Me N/M. (2.16) 
——— — 
=M eN 


Pour prouver l’isomorphisme nous considérons le morphisme 


p: G/M — G/N 


. (2.17) 


Ce morphisme est surjectif et son noyau est N/M, parce que w(gM) = N uniquement si g € N. 
Nous pouvons appliquer le premier théorème d’isomorphisme à & en écrivant 


(G/M)/ker(o) = Imagew, (2.18) 


c’est-à-dire 
(G/M)/(N/M) = G/N. (2.19) 


2.3 Indice d’un sous-groupe et ordre des éléments 

LEMooFNVRooRCKkjLc 
Lemme 2.10. 
Lorsque H est normal dans @, alors la définition 


EQooEUESo00S 
[a] : [b] = [ab] (20) 
définit une loi de groupe sur l’ensemble G/H. 


Démonstration. Le neutre est [e] et l’associativité ne pose pas plus de problème que l'existence d’un 
inverse. Le point à vérifier est que la formule (2.20) est une bonne définition : [ah] : [bh’| = [ab] 
pour tout h,h! € H. Nous avons : 


[ah] + [bh’] = [ahbh'] = [ahb|. (21) 
Pour montrer que c’est [ab], l'astuce est d'introduire bb! à côté du a : 


[ahb] = [abb_ *hb] = [ab] (2.22) 


parce que b-lhb e H du fait que H soit normal dans G. 
EXooFNIKooHxePSs 


Exemple 2.11 ([83]). 
Il ne faudrait pas croire que le groupe quotient G/H est forcément un sous-groupe de G. Par 
exemple le quotient Z/2Z est l’ensemble {0,1} muni de l’addition. En particulier 1 + 1 = 0, ce qui 
est évidemment faux dans Z. Le groupe (Z, +) ne possède aucun élément d’ordre 2. 

Il n’en est pas moins vrai que l’application 


:G—G/H 
Î / (2.23) 
gr [9] 
est un morphisme de groupes. A 
DEFooMPIAooïleZNaR 


Définition 2.12. 
Si H est un sous-groupe d’un groupe fini, l’indice de H dans G est le nombre |G|/|H|, souvent 
noté |G : H|. 


Le théorème de Lagrange dira en particulier que l’indice est toujours un nombre entier. C’est 
à ne pas confondre avec le degré d’une extension de corps (définition 6.61). 
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ThoLagrange 
Théorème 2.13 (Théorème de Lagrange). 
Soit H un sous-groupe du groupe fini G. Alors ITEMooDPKSooNpOusd 
(1) L'ordre de H divise l’ordre de G. 
(2) Les trois nombres suivants sont égaux : 
— le nombre de classes de H à gauche, 
— le nombre de classes de H à droite, 
— l'indice de H dans G. 
En particulier si H est distingué dans G, nous avons 
1G] 


|G/H| = (Al (2.24) 


Démonstration. Nous commençons par montrer que les classes de H ont toutes le même nombre 
d'éléments que H. En effet pour chaque g € G nous avons la bijection 


o: H — 9H 


2.25 
he gh. ) 


L’injectivité de w est le fait que gh = gh' implique h = h/. La surjectivité est par définition de la 
classe. 

Les classes à gauche formant une partition de G, le cardinal de G est le produit de la taille des 
classes par le nombre de classes : 


|G| = |H| : nombre de classes. (2.26) 


En particulier nous voyons que |H| divise |G!. 
La dernière formule exprime simplement que G/H est par définition le nombre de classes de H 
à gauche (ou à droite) dans G. 


CorpZItFXx 
Corolaire 2.14. 


L'ordre d’un élément d’un groupe fini divise l’ordre du groupe. En particulier dans un groupe 
d'ordre n tous les éléments vérifient g” = e. 


Démonstration. Soit G un groupe fini et considérons, à g € G fixé, le sous-groupe 
H = {gf tel que ke N}. (2.27) 


Par le théorème de Lagrange 2.13, l’ordre de H divise |[G|, mais l’ordre de ÆH est le plus petit k tel 
que g* = e, c’est-à-dire l’ordre de g. 


D'autres résultats à propos d'ordres et d'indices de groupes finis dans la proposition 3.30 et le 
lemme 3.32. En particulier le théorème de Cauchy 3.26 qui dit : si le groupe est cyclique et si p 
divise l’ordre du groupe G, alors G contient au moins un élément d'ordre p. 


2.4 Suite de composition 

DefJWZSooNcntfK 
Définition 2.15 (Suite de composition). 
Soit un groupe G. 


(1) Une suite de composition dans G est une suite finie de sous-groupes (Gi);=0...n telle que 


(et = GE Ga 1S..CGCECG=G (2.28) 


et telle que G;41 est normal! dans Gi. 


6. Ordre d’un élément, définition 1.261. 
7. Nous rappelons au cas où, que « normal » signifie « distingué ». 
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(2) Les groupes G;/G;+1 sont les quotients de la suite de composition. 


(3) Une suite de Jordan-Hôlder est une suite de composition dont tous les quotients sont 
simples. 


L'objet de nos prochaines pérégrinations mathématiques est de montrer que tout groupe fini 
admet une suite de Jordan-Hülder (théorème 2.21). 
LemsKpXCG 
Lemme 2.16 (du papillon ou de Zassenhaus|[84]). 
Soient G un groupe et des sous-groupes À et B. Soient À’ normal dans À et B' normal dans B. 
Alors 


(1) A'(ANn B') est normal dans A'(An B) 
(2) (A! n B)B' est normal dans (An B)B' 
(3) Nous avons les isomorphismes de groupes 


A(AnB) _(AnB)B_ B(AnB) 
A(ANB) (AnB)  B(AnB) 


(2.29) 


Démonstration. Nous n’allons pas démontrer chacun des points ; pour plus de détails, nous dirons 
simplement que « la preuve est très similaire dans les autres cas ». 
Commençons par montrer que 4’(A n B') est un groupe. Si a,be A'et x,ye An B, 


axby = xx laxbx x (2.30) 


En utilisant la normalité, x _lax € A’, donc xx laxbx | € A! et donc le tout est dans 4'(A An B). 
L'ensemble 4’(A à B') est également stable pour l'inverse parce que 


æ la t=x la xx t (2.31) 
LS, —7 
EA' 


Nous montrons maintenant que 4’(A n B') est normal dans 4'(A n B). Soient a,b € À, 
xeAnB'et fe An B. Alors 


(OF) '(ax)(bf) = (of) (agbx x f) (2.32a) 
=ce A! 
= f- lb lacxf (2.32b) 
= f_ lb lacf {af (2.32c) 
=yeAnB! 
= f7 6 acfy (2.324) 
EA! 
e A(An B'). (2.32e) 


Pour prouver l’isomorphisme 


A'(AnB) _ (AnB)B' 
A(ANB) (An B)B" 


(2.33) 


nous allons utiliser le deuxième théorème d’isomorphisme (2.8) que nous appliquons à H = An B 
et N = A'(An B). La vérification que À normalise N est usuelle. Nous commençons par écrire 


A'(AnB'\(AnB) AnB EqgkphNs 
A'(An B!) : AnBnA(AnB!) PR 


Pour simplifier un peu cette expression nous prouvons d’abord que 


(AnB)n A(AnB'}= (An BY(AnB'). Faut 
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L’inclusion > est facile. Pour l’autre sens, étant donné que A4’(A n B') € À nous avons 
AnBnA(AnB)=BnA(AnB). “ie EE) 


Un élément de B n 4'(A n B) est un élément de B qui s’écrit sous la forme s = ax avec a € A’ 
etre An B. Nous avons alors a = sx! avec se Bet x! e An B. Par conséquent a e B et 
donc a € An B. Donc un élément de B n A'(A n B) s'écrit sous la forme ax avec a € An B et 
x € An B. Autrement dit 

BnA(AnB)c(4'n B)(AnB) (2.37) 
et nous avons 


(An B)nA'(AnB)=BnA(AnB)ce(A'nBj(AnB), (2.38) 


et donc légalité (2.35). Toujours dans l’idée de simplifier (2.34) nous remarquons que À n B’ est 
un sous-ensemble de À A B, donc 4’(A A B')(A An B) = A'(Añn B). Il reste donc 


A(ANB) AnB (2.39) 
A(ANnB!') (4nB)(AnB') ‘ 


Étant donné que les hypothèses sur À et B sont symétriques, le membre de droite peut aussi 
s’écrire en inversant À et B. Nous en sommes à 
B'(AnB) A'(AnB) 
B'(A'nB) A'(AnB') 


(2.40) 


Nous devons encore justifier B'(A n B) = (An B)B' et B'(4' n B) = (4' n B)B'. Vérifions la 
première égalité, et laissons la seconde au lecteur. Si be B'etre An B, alors 


bx=xx ‘bxe(AnB)B!. (2.41) 
= — 
eB! 
PROPooUIXNooJdKuAs 


Proposition 2.17. 
Si G est un groupe fini et si (G;) est une suite de composition pour G, alors l’ordre de G est le 
produit des ordres de ses quotients. 


Démonstration. Étant donné que G;41 est toujours normal dans G;, le théorème de Lagrange 2.13 
s'applique et, à chaque pas de la suite de composition, nous avons : 
_ Gil 

|Gi+| 


| # (2.42) 


Gin 


Il suffit maintenant d'écrire |G| de façon télescopique : 


IG= TJ] (Gil (2.43) 


0<i<n—1 IGixl 


DEFooSZZSooCrgDyo 
Définition 2.18. 
Nous disons que les deux suites de composition (Gi)o<isr et (Hj)o<j<s sont équivalentes sir = 5 
et si il existe une permutation o € S,_ 1 telle que 


(2.44) 


Proposition 2.19 (Schreider). 
Deux suites de composition d’un même groupe admettent des raffinements équivalents. 
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Démonstration. Soient les suites de composition 


{e}=GnS...cG1SGo=6G (2.45a) 
te = He EE H=6 (2.45b) 


Nous raffinons la suite (G;) en ajoutant, entre G;+1 et G;, les sous-groupes 
Gi — Gi (G; ON H,,) = Gi+i(Gi ON H,,-) E x;3 Gi+1i(Gi ON Ho) = G;, (2.46) 


et de même pour (H;). Le groupe Gi41(G;n H4) est normal dans Gi1(Gin Hy-1) parce que Gi: 
étant normal dans G;, et Hy% dans Hy_:, le lemme 2.16 s'applique. Nous avons donc bien défini un 
raffinement. 

Nous devons maintenant prouver que les deux raffinements ainsi construits sont des suites de 
composition équivalentes. D’abord elles ont la même longueur mn parce que chacun des m éléments 
de la suite (G;) a été remplacé par n éléments et inversement, chacun des n éléments de la suite 
(H;) a été remplacé par m éléments. 

Par ailleurs, les quotients du raffinement de (G;) sont de la forme 


Gini(Gi 0 x) © He+i(Hr 0 Gi) EqPAYTGE 
GaitG D Hu) Her 0 Gi) | 


en vertu du lemme du papillon (2.16). Le membre de droite de (2.17) est un des quotients du 
raffinement de (H;). 


LemBSicRJ 
Lemme 2.20 (Schreider strictement décroissant). 
Soient 1 et Yo, deux suites de composition strictement décroissantes du groupe G. Alors elles 
admettent des raffinements équivalents strictement décroissants. 


Démonstration. Par hypothèse, Z1 et Z2 n’ont pas de répétitions. Soient X/ et 7, des raffinements 
équivalents donnés par le lemme de Schreider. Étant donné que ce sont des suites de composition 
équivalentes, elles ont le même nombre de quotients réduits à {e}, c’est-à-dire le même nombre de 
répétitions. 

Les suites Y} et Z}, obtenues en retirant les répétitions de X7 et Y% sont des raffinements 
équivalents de Y3 et X2 et strictement décroissants. 


ThoLgxWIC 
Théorème 2.21 (Jordan-Hôlder). 
À propos de suites de Jordan-Hôlder dans un groupe fini. 
ITEMooRSDDooNHKFYO 
(1) Tout groupe fini admet une suite de Jordan-Hôlder. ITEMooGBOCooBAgnyt 


(2) Toutes les suites de Jordan-Hôlder dans un groupe fini sont équivalentes. 


Démonstration. En deux parties. 
(1) Pour (1) 
(2) Pour (2) 
Par définition, une suite de Jordan-Hôlder n’a pas de raffinement strictement décroissant (à 
part elle-même) parce que G;}1 est normal maximum dans G;. Si 1 et Z2 sont des suites de 
Jordan-Hôülder nous pouvons considérer les raffinements équivalents strictement décroissants 


! et X° du lemme de Schreider 2.20. Nous avons Z} + Yf, mais par ce que nous venons de 
dire à propos de la maximalité, Z1 = X1 et 5 = X2. D'où le résultat. 
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2.5 Groupes résolubles 


DefOSYNooTROIKSs 
Définition 2.22 (Groupe résoluble[85, 86]). 
Le groupe G est résoluble si il existe une suite finie de sous-groupes G; 
{el = GcGc...cGr1CGn=G (2.48) 


avec G; normal dans Gi+1 et G;+1/G abélien. 


Il s’agit d’un groupe qui admet une suite de composition ® dont les quotients sont abéliens. 
LemOARMooYhYmbH 


Lemme 2.23 ([87|). 
Soit G un groupe et H un sous-groupe normal. Le groupe G/H est abélien si et seulement si° 
D(G) € H. 
Démonstration. Les propositions suivantes sont équivalentes : 
— Le groupe G/H est abélien 
— pour tout x,y€ G, [x][y] = [y][x] 
— Eye y 1 = le] 
— [eya y] = [e] 
— [x,y] € A, voir la définition 2.1. 
— D(G) € H. 


PropRWYZooTarnmm 
Proposition 2.24 ([87]). 
Un groupe est résoluble si et seulement si sa suite dérivée termine sur {e}. 


Démonstration. Grâce au lemme 2.3 et à la proposition 2.4, si la suite dérivée termine sur {e} alors 
la suite dérivée est une suite qui répond aux conditions de la définition 2.22 de groupe résoluble. 

Il faut donc encore montrer le sens direct. Nous supposons que G est un groupe résoluble et 
nous étudions sa suite dérivée. Nous avons une suite 


{el = GecGc...c GC Gn=G (2.49) 


avec G; normal dans G;:1 et G;:1/G; abélien. Nous allons prouver par récurrence que D°(G) € 
Gn-i. 

Pour à = 0 nous avons bien G € Gy. 

Notre hypothèse de récurrence est : 


D'(G) € Gus. EaEAQEoOEAg TE 
Vu que Gn-i/Gn-:i-1 est abélien, le lemme 2.23 dit que 
D(Gn_) € Gp. EqEDJXooL AA gr 
En dérivant (2.50) et en tenant compte de (2.51), 


D(G) € D(Gn-5) € Gn-i1. (2.52) 


Nous avons donc bien D'(G) € Gn-; pour tout à. En particulier pour à = n, nous trouvons 
D"(G) € Go = fe}. 


8. Voir définition 2.15. 
9. Ici D(G) est le groupe dérivé de G, voir 2.2. 
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PropBNEZooJMDFIB 
Proposition 2.25. 
Soient des groupes G et H. Nous supposons que G est résoluble !° et nous considérons un morphisme 
D: G— H. Alors Y(G) est résoluble. 


Démonstration. Puisque G est résoluble, il existe une suite de sous-groupes G; tels que 


réi=mete..eGrieGr=6G (2.53) 


avec G; normal dans G;41 et G;+1/G3 abélien. Nous posons #(G); = #(G;) et nous avons Y(G)o = 
y({e}) = {e} ainsi que #(G)o = #(G) ; donc 


{e} = V(G)o € Y(Gh1 €... € V(Ghu-1 € V(G)a = Y(G). (2.54) 


La proposition 1.266 nous indique que #(G); est normal dans #(G);41, et que d(G;+1/0(G); 
est abélien. 


2.6 Action de groupes 


Le concept d’action d’un groupe est donné par la définition 1.360 
Lemme 2.26. 
Pour tout ge G, 
(1) L'application p,: E — E est injective, 
(2) Pour l'inverse : (bg)! = dy-1. 


Démonstration. Si x,y € E sont tels que D,(x) = d,(y) alors en appliquant 6,-1 aux deux membres 
nous trouvons 


(Dg-10g)(x) = (D9-109)(y), (2.55) 


ce qui donne x = y parce que ®,-199 = Dg-19 = e = Id. 
Les trois dernières égalités écrites disent que @,-1 est l'inverse 1 de dy. 


Pour alléger les notations, on convient d'écrire g - x, voire plus simplement gx au lieu de @,(x). 


Le deuxième axiome d'action de groupe dit que la notation ghx ne souffre d’aucune ambiguïté. 
DEFooMZXFooXbwGj; 


Définition 2.27 (Orbite). 
Si G agit sur un ensemble E, nous notons G - x l’orbite de x € E sous l’action de G : 


G x = {gx tel que gE G}. 
DEFooMDYGooLrOERP 
Définition 2.28 (Stabilisateur). 
Si G est un groupe agissant sur l’ensemble E, et six € E, nous notons G; ou Stab(x) le stabili- 
sateur de x : 
Stab(x) = Gr = {g € G tel que g * x = x}. (2.56) 


Définition 2.29 (Fixateur). 
Si G est un groupe agissant sur l’ensemble E, et si g € G, nous notons enfin Fix(g) le fixateur 
de g : 
Fix(g) = {ze E tel que g x = x}. (2.57) 
DefuyYJRh 
Définition 2.30. 
L'action de G sur E est fidèle si l’élément neutre est le seul élément de G à fixer tous les points 
de E, c’est-à-dire si 
(g=r VreE)=g=e. (2.58) 


10. Définition 2.22. 
11. Si vous décidez de dire ça à un jury dans un concours, soyez prêts à préciser les domaines. 
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Un exemple d’action fidèle tout à fait non trivial sera donné avec l’action du groupe modulaire 
sur le plan de Poincaré dans le théorème 23.95. 
Le groupe G agit toujours sur lui même à gauche et à droite. L'action à gauche est g + h = gh; 
celle à droite est g : À = hg”!. 
DEFooCORTooEeOLPT 


1 


Définition 2.31. 
L'action adjointe définie par g * h = ghg est une manière pour un groupe d’agir sur lui-même 
1 


par automorphismes. Cela est souvent noté Ad(g)h = ghg——. 


En effet pour tout g € G, l'application Ad(g): G — Gest un automorphisme de G. 

Si H est un sous-groupe de G, nous notons G/H le quotient de G par la relation g — gh pour 
tout h € H. Lorsque la distinction est importante, nous noterons (G/H), pour les classes à gauche 
et (G/H)a pour les classes à droite. 

Nous avons une relation d'équivalence à gauche et une à droite. D’abord 


TrgYyeth=y (2.59) 


pour un certain h € H. Ensuite 
ZT qay S hRT=Y (2.60) 


pour un certain h € H. 
Le lemme suivant est une généralisation du théorème de Lagrange 2.13. 


Lemme 2.32. 
L'ensemble (G/H), est fini si et seulement si l’ensemble (G/H)4 est fini. Si il en est ainsi, alors 
(G/H), et (G/H)a ont même cardinal, qui vaut l'indice de H dans G. 


Démonstration. L'application 


f: (G/H)3 — (G/H)a 


2.61 
of FN 


est une bijection bien définie. En effet si x +, y, nous avons h € H tel que y !h = x !, c’est-à-dire 


que xl = y let f est bien définie. Le fait que f soit surjective est évident. Pour l’injectivité, 
soient x,y € G tels que 
F(Lrlo) = Flo). (2.62) 


1 1 


Alors æ71 +4 y"!, ce qui implique l'existence de h € H tel que kx-! = y}, ou encore que rh! = y, 


ce qui signifie que æ +4 y. 
Pour l’énoncé à propos de l’indice, nous procédons en plusieurs étapes simples. 


(1) Les classes (les éléments de (G/H),) forment une partition de G. 


(2) Toutes les classes ont le même nombre d'éléments par la bijection 


 É [rl — [yl9 


2.63 
zh yh. 
(3) Le nombre d’éléments dans une classe est égal à | H| par la bijection 
c — H 
9: Leo (2.64) 
zh R. 
Par conséquent 
|G} = |A] : nombre de classes = [H| + Card ((G/H),), (2.65) 
et nous avons bien . 
Card ((G/H)3) = 61 2 IG: H|. (2.66) 


ri 
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Propszymilr 
Proposition 2.33 (Orbite-stabilisateur[58]|). 
Soient G un groupe agissant sur un ensemble E etxeE,. 
(1) Les ensembles G : x et G/Gx sont équipotents. ITEMooCWUCooCOFHYK 
(2) L'orbite de x est finie si et seulement si Stab(x) est d'indice fini dans G. Dans ce cas nous 
avons 
Eqn£LC 
Card(G : x) = |G : Stab(x)|, Le 67) 
et 


IG = |Stab(x)||O, I. FaCeg ET) 


La formule (2.67) est nommée formule des classes/88]. 


Démonstration. En deux points. 
(1) Soit l'application 
:G:x—G/G 
Ÿ /Ga (2.69) 
ax {al. 
Cette application est bien définie parce que si a : x = b - x, alors il existe h € G, tel que 
b = ah, et par conséquent [a] = [b]. Cette application est une bijection et par conséquent 
G : x est équipotent à G/Gy%. 
(2) Soit ye O4 et À, = {ge G tel que g : x = y}. Nous avons 


Ày = sStab(x). (2.70) 


En effet, si a € À,,, alors a : x = yet s- la: æ= 5"! : y = x. Par conséquent sta e Stab(r). 
Dans l’autre sens, supposons a € s Stab(x). Soit g € Stab(x) tel que a = sg. Alors nous avons 
a'æ=sg x=s"zx=7y.DoncaeAÀ,. 

Nous venons de prouver que la partie À, est une classe à gauche de Stab(x), par conséquent 


[Ay| = |Stab(x)| pour tout y € O4. Les À, pour différents y sont disjoints et nous avons de 
plus 
LU] 4 =&. (2.71) 
YEOx> 
Les ensembles À, divisent donc G en |O,| paquets de | Stab(x)| éléments. D'où la formule 
(2.68). 
CORooRRVHooTyCj2Z 
Corolaire 2.34. 
Soit C, la classe de conjugaison d’un élément g du groupe fini G. Alors 
Card(C;) = |G : Za(g)| (2.72) 


où Za(g) est le centralisateur de g dans G!? de G. 


Démonstration. C’est une application de la proposition 2.33 (formule (2.67)) dans le cas de l’action 
adjointe de G sur lui-même. 
En effet, si nous considérons l’action adjointe, l'orbite est la classe de conjugaison : C, = G : g. 
Et le stabilisateur de g pour l’action adjointe n’est autre que le centralisateur de g : 
Fix(g) = {he G tel que À : g = 9} 
= {he G tel que Agh | = g} 
— {he G tel que gh = hg} (2.73c 
to), (2.73d 
Donc la formule Card(G -+ g) = |G : G,| devient, dans le cas de l’action adjointe de G sur 
lui-même : Card(C,) = |G: Za(g)|. 
12. Définition 1.166. 
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Lemme 2.35. 
Soit G un groupe agissant sur l’ensemble E. On définit x < x’ si et seulement si il existe g € G tel 
que g x = x’. Alors 
(1) la relation — est une relation d'équivalence. 
(2) la classe [x] est l'orbite O, de x sous G. 
CorARFVMP 
Corolaire 2.36 (Equation des orbites). 
Soient G un groupe agissant sur l’ensemble E et O1,...,0O% la liste des orbites (distinctes). Alors 
(1) E =), O;, l'union est disjointe, 
(2) Card(E) = ÿ,; Card(O;). 
DefcSuYxz 
Définition 2.37. 
Soit G un groupe agissant sur l’ensemble E. Un domaine fondamental ou une transversale 
est une partie de E contenant un et un seul élément de chaque orbite. 


Autrement dit, les images des éléments d’un domaine fondamental F' forment une partition de 


l’ensemble : 
E=|1|3(F) (2.74) 
geG 


où g(F) 


= (EF = = {@4(x) tel que x € F}. L'union est disjointe, c’est-à-dire que si g Æ g', alors 
g(F)ng(F) = 9 


PropUyLPdp 
Proposition 2.38 (Equation des classes[89]). 
Soit G, un groupe fini opérant sur un ensemble E. Si E" est un ensemble contenant exactement 
un élément de chaque orbite dans E\FixG(£E), alors 
Eqo 
IG = |Fixc(E) + Y oRyFES 


xeE" IFixa(æ)| HG 


Si de plus G est un p-groupe, alors 
Eqb 
JE] = |Fixe(E)| mod p. DEEE) 


Démonstration. Par le corolaire 2.36, nous avons |[G| = Ÿ,,-# [Ox| où E’ est une transversale. En 
séparant la somme entre les orbites à un élément et les autres, 
E 
|[G| = Card(Fixc(E + > ER Es, 
xeE" 
Ybh 
FR OUS avons utilisé le fait que |G| = |Fixc(x)||O;|. 
Si Gest un p-groupe alors si x € E", Fixa(x) est un sous-groupe propre de G et donc | Fixc(x)| 
est un diviseur propre de |G|. Du coup la fraction |[G|/| Fixc(x)| est une puissance non nulle de p 
et l’équation (2.75) devient immédiatement (2.76). 


[Fixe(x)| a 


Corolaire 2.39 (Équation des classes). 


Soient G un groupe, et Ci,..., C1 la liste de ses classes de conjugaison contenant plus d’un élément. 
Alors 
Card(G EqkgG 
Card(G) = Card G: Zl = Card (Z 8 
ard(G) ard (Z( QI | ar D) +E (re) e (G) Ë 
si gi € Ci. 


Démonstration. Étant donné que les classes de conjugaison sont disjointes, le cardinal de G est 
bien la somme des cardinaux de ses classes. Les classes ne contenant qu’un seul élément sont celles 
des éléments de Z(G). En ce qui concerne les autres orbites, Card(C,,) = |[G : Z,,| par le théorème 
orbite-stabilisateur (proposition 2.33). 
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THO00EFDMooDfosOw 
Théorème 2.40 (Formule de Burnside). 
Si G est un groupe fini agissant sur l’ensemble fini E et si Q est l’ensemble des orbites, alors 


Card(Q) = a > Card (Fix(g)). FaTH by 


geG 


Démonstration. Nous considérons l’ensemble 
A={(9,x)eG x E tel que gr = x}, (2.80) 


et nous en calculons le cardinal de deux façons. D'abord 


Card(A) = » Card{g € G tel que gx = x} (2.81a) 

xeE 

= Ÿ Card(Fix(x)) (2.81b) 
xeE 

= ND Card(Fix(x)) (2.81c) 
WE TEW 

L IG] EquVky 

De BYE) 

= |G|. (2.81e) 


Pour obtenir (2.81d) nous avons utilisé l'équation des classes (2.68). L'autre façon de calculer 
Card(A) est de regrouper ainsi : 


Card(A) = à Card{x € E tel que gx = x} = >, Card(Fix(g)). (2.82) 
geG geG 


En égalisant les deux expressions de Card(A) nous trouvons 


|G|Card(Q) = Ÿ° Card(Fix(g)). (2.83) 
geG 


PROPooMYKKooLetZlWi 
Proposition 2.41. 
Soient G un groupe, et H, un sous-groupe du centre de G. 


(1) H est normal dans G. 
(2) Si G/H est monogène, alors G est abélien. 


PROPooWPQTooECUPLK 
Proposition 2.42 ([90]). 
L'indice du centre d’un groupe n’est jamais un nombre premier. 
LEMooZJGVooRYrujB 
Lemme 2.43 ([91]). 
Soient un groupe cyclique G et un sous groupe H. ITEMooUNOE00Z0E1YL 
(1) Il existe r,n € N tels que r | n et H = rZ/nZ. TTEMooMUSS00BnNXEd 
(2) Card(H) = n/r ITEMooVPEKooKdPibk 


(3) H est cyclique. 


En particulier, tout sous-groupe d’un groupe cyclique est cyclique. 


Démonstration. En plusieurs parties. 
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(1) Pour (1) Soit un générateur a de G!. L'application 


f:Z2-—G 


| (2.84) 


ke a 
est un morphisme de groupe surjectif. 
La partie f-!(H) est un sous-groupe de Z. La proposition 1.228(2) dit qu’il existe r € IN tel 
que f_!(H) = rZ. De même ker(f) est un sous-groupe de Z, de telle sorte qu’il existe n € N 
tel que ker(f) = nZ. 
Nous avons 
nZ = ker(f) = f l(e) € f {(H) = rZ. (2.85) 


Étant donné que nZ © r’Z, il existe de NN tel que n = dr. 


Nous considérons maintenant 
g:72 — H 
(2.86) 


ke af, 


qui est encore un morphisme de groupes. En utilisant le premier théorème d’isomorphismes 
2.6(3), nous avons 


TZ 
en = Image(g). (2.87) 


Mais ker(g) = nZ et Image(g) = H. Donc nous avons bien H = rZ/nZ. 


(2) Pour (2) En ce qui concerne le cardinal, vu que nous avons un isompshisme, 
Card(H) = Card(rZ/nZ) = n/r (2.88) 


par le lemme 1.322(3). 
(3) Pour (3) Le fait que H soit cyclique est le lemme 1.322(2). 


THOooRGSToo!lWyhqt 
Théorème 2.44 (Sous-groupe d’un groupe cyclique[91]). 
Soit G un groupe cyclique  d’ordre n. Pour chaque de N nous posons 
Ha = {xe G tel que x° = e}. (2.89) 
(1) Ces Ha sont des sous-groupes de G. 
(2) Caxd(Ha) = d. ITEMooMJCXooCIWSmK 
(3) L'ensemble des sous-groupes de G est {Hy tel que d | n}. ITEMoo TEGUooPQUEep 


(4) Si g est un générateur de G, alors Hay peut être décrit des façons suivantes : 
Ha={xeG tel que xd = e} = gr(g”4). (2.90) 


Démonstration. Point par point. 


EMooYAM VtbCrsS 
(1) y est un sous-groupe St ah E 4 alors (gh)Ÿ = géhd = ee = e. De plus (g- 


(g-l=et=e. 
TEMooXEXFoo!IrFOTi 
(2) Tout sous-groupe est un Hy avec d|n Ge tn SOUS-BTOUpe H de G. Nous notons Card(H) 


d. Le lemme 2.43(3) nous indique que H est cyclique. Soit un générateur a € H ; son ordre 
est le cardinal de A : ord(a) = Card(H) = d. 

Tout élément de H vérifie x°"d(a) = (4k)ord(a) = [gord(a))k = €, Donc H € Hy. En particulier 
Card(H) < Card(Ha). 


oi = 


13. Définition 1.319. 
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Tout sous-groupe de Gest cyclique. En particulier H} est cyclique, et nous pouvons considérer 
un générateur : il existe a € Hy tel que ord(a) = Card(Hy). Étant donné que a € H4, il vérifie 
al=e, et donc 

ord(a) | d. (2.91) 
Vu que ord(a) = Card(Ha) et que d = Card(H), nous avons Card(Ha) | Card(H) et en 
particulier Card(H3) < Card(H). Donc Card(H) = Card(H3) et au final H = Hy. 


Nous avons prouvé au passage que Card(H}) = d. Vu que le cardinal d’un sous-groupe divise 
le cardinal du groupe l#, nous avons d | n. 


un 
Co 
nr 


Card(Ha) = d C’est contenu dans ce que nous avons fait dans la partie (2). 


TR 
Æ 
nr 


Si d | n alors H} est un sous-groupe de G& C’est un cas particulier de la partie (1). 


ns 
Qt 
SEA 


Note Le point (3) est prouvé. Cela ne contredit pas le fait que H} soit un sous-groupe de G 
pour tout d, et pas seulement pour les d qui divisent n. En effet si d ne divise pas n, il existe 
d’ divisant n tel que Hy = Hy. Pas besoin de chercher une preuve de ce fait : la preuve est 
déjà faite. Il s’agit de dire que A, est un sous-groupe de G pour tout d (partie (1)), et que 
tous les sous-groupes de G sont de la forme H} avec d | n. 


vd € H4 parce que (g"”/4)1 = 


ns 
(e» 
nr 


Pour (4) Soit un générateur g de G. Nous avons d’une part g 
g" = e. D'autre part, les éléments 


pe grue _. OU gi = & (2.92) 


kn/d In/d n/d 


sont distincts. En effet si g = q avec 0 < 1 < k < d, alors g%-Dw/d = €, Comme 
k— 1 < d, nous avons (k — 1}n/d < n et donc g%-Dn/d 4 e parce que g est générateur. 


Bref, les g*"/d avec k = 1,...,d sont d éléments distincts, tous dans Hy dont le cardinal est 
d. Donc 

Hé (oh à (2.93) 

DEFooQDHPooCfDEuL 


Définition 2.45. 
Soit G un groupe agissant sur un ensemble E. Nous disons que l’action est transitive si elle 
possède une seule orbite. L'action est libre si g : x = g' : x implique g = g'. 


2.7 Produit semi-direct de groupes 


Définition 2.46. 
Une suite exacte est une suite d'applications comme suit : 


es (2.94) 


où pour chaque i, les applications f; et f;+1 vérifient ker(fi:1) = Image(f;). Lorsque les ensembles 
À; sont des groupes, alors nous demandons de plus que les f; soient des morphismes. 


Très souvent nous sommes confrontés à des suites exactes de la forme 


J 


RE RU RS (2.95) 


où G, A et B sont des groupes, 1 est l'identité. La première flèche est l’application {1} — A qui 
à 1 fait correspondre 1. La dernière est l'application B — 1 qui à tous les éléments de B fait 
correspondre 1. Le noyau de f étant l’image de la première flèche (c’est-à-dire {1}), l'application f 
est injective. L'image de g étant le noyau de la dernière flèche (c’est-à-dire B en entier), Papplication 
g est surjective. 


14. Théorème de Lagrange 2.13(1). 
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DEFooKWEHooISNQzi 
Définition 2.47. 
Soient N et H deux groupes et un morphisme de groupes D: H — Aut(N). Le produit semi- 
direct de N et H relativement à ®, noté N x, H est l’ensemble N x H muni de la loi (que l’on 
vérifiera être de groupe) 


Gin) + Ur = Onda) AR): FaPRSDe) 


Attention à l’ordre quelque peu contre-intuitif. Lorsque nous notons N x,,H, c’est bien o: H — 
Aut(N), c'est-à-dire H qui agit sur N et non le contraire. 

Lorsque N et H sont des sous-groupes d’un même groupe, le plus souvent ® est l’action adjointe 
définie en 2.31. 


Le théorème suivant permet de reconnaitre un produit semi-direct lorsqu'on en voit un. 
THOooZNYTooPhnldE 


Théorème 2.48 ([10]). 
Soit une suite exacte de groupes 


l—sN pp. si (2.97) 
Si il existe un sous-groupe À de G à partir duquel s est un isomorphisme, alors 
G=iN) x, À (2.98) 
où o est l’action adjointe ® de À sur i(N). 


Démonstration. Nous posons N — i(N) et nous allons subdiviser la preuve en petits pas. 

(1) N est normal dans G. En effet étant donné que la suite est exacte nous avons N = ker(s). 
Le noyau d’un morphisme est toujours un sous-groupe normal. 

(2) NE = {e}. L'application s étant un isomorphisme depuis À, il n’y a pas d'éléments de À 
dans ker(s) autre que e. ItemzlaXGM 

(3) G = NA. Nous considérons g e Get he À tel que s(g) = s(h). L'existence d’un tel h est 
assurée par le fait que s est surjective depuis H. Du coup nous avons e = s(gh-!), c'est-à-dire 
gh_l'e ker(s) = N. Nous avons donc bien la décomposition g = (gh=!)h, et donc ve He 

(4) L'écriture g = nh avec n e N et h e À est unique. Si nh = n'h', alors n = n'h'h=!, ce qui 
signifierait que h'h-l e N. Mais étant donné que H n N = {e}, nous obtenons À = h/ et par 


suite n = n’. ItemUZlrKo 
(5) L'application _ 
:G—NXxH 
ie (2.99) 
nhe (n,h) 
est une bijection. C’est une conséquence des points (3) et (4). 
(6) Si sur N x À nous mettons le produit 
(n,hk) : (n',h) = (noxnn/,hh') (2.100) 


où o est l’action adjointe du groupe sur lui-même, c’est-à-dire o,(y) = æyx !, alors d est un 
isomorphisme. Si g,g! € G s’écrivent (de façon unique par le point (5)) g = nh et g = n'h! 


alors 
é(nhn'h!) = (nhn'h 1! hh/!) (2.101a) 
EN 
= p((nhn'h T)(hh")) (2.101b) 
= (nhn'h° 1, hh!) (2.101c) 
= (n,h) : (n°, À) (2.101d) 
= d(nh)g(n'h"). (2.101e) 


15. Le fait que H agisse sur 4(N) fait partie du théorème. 
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CoroGoh0Z 
Corolaire 2.49. 
Soit G un groupe, et N,H des sous-groupes de G tels que 


(1) H normalise N (c’est-à-dire que oj(n) = hknh=! e N pour tout he H etne N{), 
(2) HAN = {e}, 
(3) HN =G. 


Alors l’application 
v'NxX H—+G 


ue” (2.102) 


est un isomorphisme de groupes. 


Démonstration. En plusieurs parties. 
(1) 4 est un morphisme Simple calcul en utilisant la formule (2.96) du produit dans N x, H : 


D(n,h)(n',R)) = b(non(n'),hh') (2.103a) 
= nhn'h 1hh/! (2.103b) 
= nhn'h/ (2.103c) 
= p(n,h)p(n",h"). (2.103d) 

(2) Ÿ est injective Supposons que d(n,h) = Y(n’,h'). Alors nh = n’h' et 
n=nRhh (2.104) 
En multipliant par (n/)-1 nous trouvons 
h'h l=(n) ne. (2.105) 


Donc h'h-le HAN = {fe}. Nous en déduisons que À = h/ et donc que n = n/. 
(3) Ÿ est surjective Nous savons que HN = G. Soit g € G. I existe he Het ne N tel que 
g =h 1n t. Avec ces éléments nous avons 


g = nh = Y(n,h). (2.106) 


Dans les hypothèses, l’ordre entre N et H est important lorsqu'on dit que c’est N qui agit sur 
H ; mais l'hypothèse NH = G est équivalente à HN = G (passer à l’inverse pour s’en assurer). 
Insistons encore un peu sur la notation : dans N x, H, c’est H qui agit sur N par o. 


2.8 Groupe de torsion 


Soit G un groupe. Un élément g € G est un élément de torsion si il est d’ordre fini. La 
torsion de G est l’ensemble de ses éléments de torsion. Nous disons qu’un groupe est un groupe 
de torsion si tous ses éléments sont de torsion. 


Exemple 2.50. 
Le groupe additif Q/Z est un groupe de torsion parce que si [x] = [p/q|, alors q{[x] = [p] = [0]. A 


2.9 Famille presque nulle 


Soit (G,+) un groupe abélien et F = {gi};er une famille d'éléments de G indicés par un 
ensemble 1. Le support de F est l’ensemble {i € I tel que g; Æ 0}. La famille est dite presque 
nulle si le support est fini. 

Nous disons que F est une suite si / = N. 


16. Ou encore que À agit sur N par automorphismes internes. 


Chapitre 3 


Anneaux 


Attention aux conventions. Dans le Frido, un corps peut être réduit à {0} et un idéal premier 
ne peut pas être {0}. Ces conventions ont une série de conséquences un peu partout, par exemple 
dans la proposition 1.224 où nous parlons d’idéal maximum propre. Comparez par exemple avec 
[44]. Soyez attentif. 

En cas de doutes, nous suivons les conventions de Wikipédia. 


3.1 Inversibles et nilpotents 


Le concept d’anneau est la définition 1.41. 
LEMooUYZEooLivKWI 


Lemme 3.1. 
Si a et b commutent, nous avons, pour tout re N et r > 0, la formule 


FLAN die (a — b) p st) | Eqarpuraihk 
k=0 


Démonstration. Démontrons cela par récurrence. Le cas r = 0 est évident. Pour un r donné, si 
(3.1) est vraie, alors 


r+2 pr+2 … a tla a't1b “ie a "lb … br+ib 


_ Fu de …: b) + di _ DFE 


= a"*l(a — b) + (a — b) D et) b 
k=0 


a 


= (a — b) ( + D en) ) 
k=0 
= (a _ b) fe + . st) 
k=0 
r+1 
= (a —b) ( + + rt | 
k!'=1 
r+1 
= (a …: b) (> a AK) | 
k!=0 


Proposition 3.2. 
Si a est un élément nilpotent de l’anneau À, alors 1 — a est inversible. Si a est nilpotent non nul, 
alors il est diviseur de zéro. 
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Démonstration. Soit n le minimum tel que a” = 0. En vertu de la formule (3.1) nous avons 


1=1-at={1-a)(+a+-..+a"t)=(1+a+...+a"1{1 — a). (3.2) 


La somme 1+a+:.:+a""1lest donc un inverse de (1 — a). 


3.2 PGCD, PPCM et éléments inversibles 


La définition de pgcd et ppem dans un anneau commutatif est la définition 1.182. Dans la 
plus grande tradition, elle a été introduite sans motivation, et utilisée par-ci par-là. Nous revenons 
maintenant dessus. 


Commençons par donner une autre vision de la divisibilité dans les anneaux intègres. 
PropDiviseurIdeaux 


Proposition 3.3. 
Dans un anneau intègre! A, on a l’équivalence suivante concernant deux éléments a, be À : 


a|bæ(b)c (a). (3.3) 


Donc la divisibilité devient en réalité une relation d'ordre dont nous pouvons chercher un 
maximum et un minimum. Si S est une partie de À, nous notons a | $ pour exprimer que a | x 
pour tout x € S'; de la même façon, S | b signifie que x | b pour tout x € S. 

Nous rappelons également la définition 1.42 de morphisme d’anneaux. Remarquons que si f 
est un morphisme, nous avons f(0) = 0 et f(x) ! = f(x !). 


Lemme 3.4 ([92]). 
Les éléments inversibles d’un anneau sont diviseurs de tous les éléments. 


Démonstration. Soit k inversible d’inverse k' : kk' = 1; soit aussi a € A. Alors a = k(k'a), ce qui 
montre que k divise a. 


Lemme 3.5 ([92]). 
Dans un anneau, 1 est un pgcd de a et b si et seulement si les seuls diviseurs communs sont les 
inversibles. 


Démonstration. Supposons pour commencer que 1 est un pgcd de a et b. Un diviseur commun de 
a et b doit donc diviser 1. Or un diviseur de 1 est forcément inversible. 

Dans l’autre sens, les diviseurs communs de a et b sont tous inversibles et donc diviseurs de 1. 
Donc 1 est un pgcd de a et b. 


3.2.1 Calcul effectif du PGCD et théorème de Bézout 
subSecIpmnh0O 


Soient a et b, deux entiers que nous allons prendre positifs. Nous allons voir maintenant l’al- 
gorithme de Euclide étendu qui est capable, pour a et b donnés, de calculer le PGCD de a et b, 
et un couple de Bézout (u,v) tel que ua + vb = pgcd(a, b). Ce calcul est indispensable si on veut 
implémenter RSA (19.2). 


Cela se base sur le lemme suivant. 
LemiVqita 


Lemme 3.6. 
Soient a,bE N et des nombres q et r tels que a = gb +r. Alors pgcd(a, b) = pgcd(r, b). 


Démonstration. Il suffit de voir que les diviseurs communs de a et b sont diviseurs de r et que les 
diviseurs communs de r et b divisent a. 
Si s divise a et b, alors dans l’équation 


1. Définition 1.193. 
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les termes a/s et qgb/s sont entiers, donc r/s est aussi entier, et s divise r. 
Inversement, si s divise r et b, alors il divise qb + r et donc a. 


Remarque 3.7. 
Ce lemme est surtout intéressant lorsque a = qgb+ r est la division euclidienne de a par b : en effet, 
dans ce cas r < b, et le calcul du PGCD de deux nombres (a et b) est ramené à un calcul de PGCD 
de deux nombres plus petits (b et r). 

L’algorithme pour calculer pgcd(a, b) consiste à écrire des divisions euclidiennes successives de 
la manière suivante : 


a = qob + ra ro <b (3.4a) 
b — q372 + T3 T3 < T2 (3.4b) 
(3.4c) 


en remarquant que pgcd(a,b) = pgcd(b,r2) = pgcd(r2,r3). Étant donné que les inégalités ro < b 
et r3 < r2 sont strictes, en continuant ainsi nous finissons sur zéro, c’est-à-dire qu'il existera un n 
pour lequel r»+1 = 0; et donc 

Tn-1 — An+1Tn; 


et à ce moment nous avons pgcd(a, b) = pgcd(r»_1,7n) = Tn: 


38.2.1.1 Algorithme d’Euclide pour le PGCD 
SUBSECooAEBLooFGJRkg 


Écrivons l’algorithme[93] en détail (parce que Bézout, ça va être la même chose en cinq fois 
plus compliqué). On pose 


To = & (3.5a) 
T1 — b (3.5b) 


(ce qui explique que nous n’ayons pas utilisé ro et r1 précédemment). Ensuite on écrit la division 
euclidienne a = q2b + r2, c’est-à-dire ro = g2r1 + r2. Cela donne r2 et q> en termes de ro et r1 : 


Ta = To — q271. (3.6) 
Ensuite, sachant r2 nous pouvons continuer : 

T1 = 379 + T3 (air) 
donne q3 et r3 = r1 — g3r2. On continue avec r2 = qarz + ra. Tout cela pour poser la suite 


To — à 


SUBEQooDYUEo0YN 
_—. Qoo 00 (88) 
Tk = Qk+27k+1 + Tk+2 


où la troisième équation définit rz:2 et g::2 en fonction de r4 et rx11, à l’aide du théorème de la 
division euclidienne. La suite (r;) ainsi construite est strictement décroissante et à chaque étape 
le lemme 3.6 et le principe de l’algorithme d’Euclide nous donnent 


pecd(rz,rk+1) = pacd(rk+1,Tx+2) = pgcd(a, b) (3.9a) 
O0 < Tr+1 <Tk. (3.9b) 


La suite étant strictement décroissante, nous prenons r,, le dernier non nul : ry11 = 0. Dans ce 
cas, en prenant k = n — 1 dans la la dernière équation (3.8) devient : 


Tn—1 — Qn+1Tn (3.10) 


Aves pgcd(a, b) — pacd(r», fa) = Tn. 


286 CHAPITRE 3. ANNEAUX 


Exemple 3.8. 
Calculons le PGCD de 18 et 231. Pour cela nous écrivons les divisions euclidiennes en chaine : 
231 = 18 : 12 +15 (3.11a) 
18=1:15+3 (3.11b) 
15=5:5+0. (3.11c) 
Donc le PGCD est 3 (le dernier reste non nul). A 


3.2.1.2 Algorithme étendu : calcul effectif des coefficients de Bézout 
SUBSECooRHSQooEuBWbd 


La difficulté est de construire la suite qui donne des coefficients de Bézout. Elle va être construite 
à l’envers. Nous supposons déjà connaitre la liste complète des r; jusqu’à r, = pgcd(a, b), ainsi 
que la liste complète des divisions euclidiennes 


Th = Qk+27k+H1 À Th+2. (3:12) 
Nous voulons trouver les couples (uz, vx) de telle façon à avoir à chaque étape 
Pa = URTR + URTR 1. (3.13) 


Notons que c’est à chaque fois r, que nous construisons. La première équation de type Bézout à 
résoudre est 
Ta = Unln + Unln—1; (3.14) 


sachant que Tn-1 = Gn+17n. On pose un = 0 et u, = 1 et c’est bon. Pour la récurrence, supposons 
les coefficients ux et v, connus, et déterminons les coefficients ux_1 et vx_1. Pour ce faire, nous 
égalons les deux expressions pour 7; : 


Ta = UgTk + Vkrk1 = Ug-17k-1 + Vk-17k—2; (3.15) 


dans laquelle nous substituons r£_9 = qurp_1 +Tk : 


URTRÉE Ver dir Ur (QT 1 EE TÈ) (3.16) 
= (ug_1 + QRUp 1) 1 + Uk ITR 3.17) 


et nous égalons les coefficients de r4 et r,_1 pour obtenir 


{ Vk_1 = Uk (3.18a) 
Uk_1 = Uk — Vk_14k- (3.18b) 


Dès que ux et vx ainsi que gx sont connus, on peut calculer ux_1 et Ug_1. 
La dernière équation, celle avec k = 1, est 


Tan = WT1 + U1T0, (3.19) 


c’est-à-dire papes 
pgcd(a, b) = u1b + via. 7 SL 1850) 


Nous avons ainsi trouvé des coefficients de Bézout pour a et b. 


3.2.2 Générateurs 


3.9. 
Les éléments de Z/nZ ne sont pas des éléments de Z ; ce sont des parties de Z. Pour rappel : 


[aln = {a + kn tel que k € Z}. (3.21) 
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Pour écrire les éléments de Z/nZ, nous pouvons écrire 


{Léa }i=1,n (3.22) 


ou 
{[iln tel que 1<i<n}. (3.23) 


Mais attention : l’ensemble 


Un (3.24) 


i=1 
est très différent. Ce dernier ensemble est Z. 
PROPooEWREooUDSMsE 
Proposition 3.10 ([94)). 
Soit n > 2. 
(1) L'ensemble quotient Z/nZ contient n éléments ITEMooHTRHooDIgX1k 
(2) Nous avons Z/nZ = {[k]n}r=0...n-1: 
Démonstration. Nous montrons que 
: {1,...,n} — Z/nZ 
p:{L..,n} —2/ _— 


est une bijection. 


(1) Injective Supposons que w(k) = (il) pour k,1 € {1,...,n}. Il existe t € Z tel que / = [+tn. 
Si t > 0, alors nous avons 
l+in>1l+n>n, (3.26) 
ce qui est impossible parce que 4 € {0,...,n}. Nous montrons de même que t < 0 est 
impossible. Nous en déduisons que t = 0 et donc que k = [. 
(2) Surjective Soit { e Z. Nous allons montrer que [{|, est dans l’image de 4. Par la division 


euclidienne 1.215, il existe q € Z et r < n (dans N) tels que ! = qn + r. Nous venons de 
prouver que [{], = [r]h = w(r). 


Pour le point (2), c’est juste l’image de 4. 


PROPooMTWGooEMbvDi 

Proposition 3.11 ([94])). 
Soit n >2 etme Z. Nous avons équivalence entre ITEMooMCI JooltgSHc 
(1) pacd(n, m) = 1, ITEMooMNKCooPnpyye 
(2) [ml»x engendre le groupe (Z/n2Z, +) ITEMooBPULooFLdJfr 


(3) [mln est inversible dans ((Z/nZ)*, : ). 


Démonstration. En trois parties. 


(1) (1) implique (2) 
Si pgcd(m,n) = 1, le théorème de Bézout 1.229 donne des u, v € Z tels que um + un = 1, 
autrement dit u[ml» = [1]n. Si k est quelconque, nous avons 


[kln = uk[mln, (3.27) 


ce qui signifie que [k], est bien un multiple de [m|, qui est donc générateur. 
(2) (2) implique (3) 
Si [mlh engendre (Z/n2Z, +), il existe en particulier un multiple de [m], qui vaut [1], : il 
existe k € Z tel que k[m]n = [1]n. 
Nous voyons que [k], est un inverse de [m]» dans ((Z/nZ)*, : ). 
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(3) (3) implique (1) 
Nous supposons que [m], est inversible dans ((Z/nZ)*, : ). C’est à dire qu'il existe ke Z 
tel que [kl,[m], = [1],. Cela signifie qu’il existe { € Z tel que 


km = 1+ In. (3.28) 


Par le théorème de Bézout (pris dans l’autre sens), cela signifie que pgcd(m,n) = 1. 


3.2.3 Décomposition en facteurs premiers 
LemPRuUrsD 


Lemme 3.12 (Lemme de Gauss). 
Soient a, b,ce Z tels que a divise bc. Si a est premier avec c, alors a divise b. 


Démonstration. Puisque a est premier avec c, nous avons pgcd(a,c) = 1 et le théorème de Bé- 
zout 1.229 nous donne donc s,t € Z tels que sa + tc = 1. En multipliant par b, nous avons 
sab + tbc = b. Mais les deux termes du membre de gauche sont multiples de a parce que a divise 


bc. Par conséquent b est somme de deux multiples de a et donc est multiple de a. 
LemAXINooUeuMJZ 


Lemme 3.13 (Lemme d’Euclide[95]). 
Soient a, be Z. Si le nombre premier p divise le produit ab, alors p divise a ou b. 


Démonstration. Comme p est premier, si il ne divise pas a c’est que pgcd(a, p) = 1. Dans ce cas le 
lemme de Gauss 3.12 implique que p divise b. 


LEMooSRFMooHgEMv j 
Lemme 3.14. 
Soient a,be N tels que a divise b et b divise a. Alors a = b. 


Le théorème fondamental de l’arithmétique permet de décomposer des nombres en facteurs 


premiers. 
ThoAJFJooAveRvY 


Théorème 3.15 (Décomposition en facteurs premiers[96]). 
Tout entier strictement positif peut être écrit comme un produit de nombres premiers d’une unique 
façon, à l’ordre près des facteurs. 

En d’autres termes, pour tout entier n > 1, il existe une unique suite finie unique (p1, k1),...(pr, kr) 
telle que : 


(1) les p; sont des nombres premiers tels que, si i < j, alors pi < p; ; 


(2) les k; sont des entiers naturels non nuls ; 


(3) n = [ur 


Démonstration. Soit n un entier positif. Nous prouvons l'existence d’une décomposition en facteurs 
premiers par récurrence. Le nombre n = 1 est le produit d’une famille finie de nombres premiers : 
la famille vide ?. 

Supposons que tout entier strictement inférieur à un certain entier n > 1 est produit de nombres 
premiers. Deux possibilités apparaissent pour n : il est premier ou non. Si n est premier, et donc 
produit d’un unique entier premier, à savoir lui-même, le résultat est vrai. Si n n’est pas premier, 
il se décompose sous la forme kl avec k et ! strictement inférieurs à n. Dans ce cas, l’hypothèse de 
récurrence implique que les entiers k et { peuvent s’écrire comme produits de nombres premiers. 
Leur produit aussi, ce qui fournit une décomposition de n en produit de nombres premiers. Par 
application du principe de récurrence, tous les entiers naturels peuvent s’écrire comme produit de 
nombres premiers. 


2. Voir 1.309. 
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Nous prouvons maintenant l’unicité. Prenons deux produits de nombres premiers qui sont 
égaux. Prenons n’importe quel nombre premier p du premier produit. Il divise le premier produit, 
et, de là, aussi le second. Par le lemme d’Euclide 3.13, p doit alors diviser au moins un facteur dans 
le second produit. Mais les facteurs sont tous des nombres premiers eux-mêmes, donc p doit être 
égal à un des facteurs du second produit. Nous pouvons donc simplifier par p les deux produits. En 
continuant de cette manière, nous voyons que les facteurs premiers des deux produits coïncident 
précisément. 


LEMooDTQQooYoJABt 
Lemme 3.16 ([1]|). 
Nous notons P l’ensemble des nombres premiers dans N. Soient des suites finies (ap)pep et (bp)peP : 


Nous posons 
a=[[p® et b=T[Tp. (3.29) 
pEeP pEeP 


Alors a | b si et seulement si a, < by pour tout p. 


Démonstration. Dire que a | b signifie qu’il existe s € N tel que as = b; le théorème 3.15 nous 
permet de décomposer 5 en s = [ler p*. Puisque le produit dans N est commutatif et associatif, 


b= as = [Ir (3.30) 
pEP 


Par unicité de la décomposition de b (toujours le théorème 3.15), nous en déduisons que b, = 
Sp + Ap À Ap. 

Dans l’autre sens, l'hypothèse a, < b, implique l’existence de s, Z 0 tels que b, = a, + s,. En 
posant 5 — [ler pr, nous avons 


as = [Ir = REX = (3.31) 


pEeP pEP 


Donc a | b. 
LEMooGLZHooUcRNgu 

Lemme 3.17. 

Soient un nombre premier q ainsi que a € Z. Soit un entier n > 1. Le nombre q divise a si et 

seulement si il divise a”. 


Démonstration. Nous numérotons les nombres premiers p; pour que p1 soit q. La décomposition 
en nombre premiers du théorème 3.15 nous dit que 


a=g"] ]of (3-32) 
#1 
et 


ag" [Ir (3:33) 
ii 


Nous avons équivalence entre les énoncés suivants : 
— q divise a 
— a #0 
— na # 0 (parce que n £ 0) 


— q divise a”. 


CORooWBSQooQ0UEmaC 
Corolaire 3.18. 
Sin e IN n’est pas une puissance d’un nombre premier, alors il existe a, b € N tels que pgcd(a, b) = 1 
et nn = ab. 
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Démonstration. Si n n’est pas une puissance d’un nombre premier, alors le théorème 3.15 de 
décomposition en nombres premiers dit que 


T 
n = [Ir (3.34) 
i=1 


avec au moins r = 2, et les k; non nuls. En prenant a — pi &b= ][ pi nous avons bien 
n = ab. Montrons que a et b n’ont pas de diviseurs communs. Soit, par l’absurde, q un diviseur 
premier commun à a et b. 
Vu que q divise pi, le nombre q divise p1 par le lemme 3.17. Étant donné que q divise Te pi, 
il divise au moins un des facteurs (lemme d’Euclide 3.13). Disons que q divise ph. Dans ce cas q 
divise p;. 
Donc q divise p; et p1 et donc q = 1 parce que p; et p1 sont des nombres premiers distincts. 
LEMooBJVJooFyuFeN 


Lemme 3.19 ([1|). 
Dans N, le pgcd® et le ppcm sont uniques. 


Démonstration. Supposons que ô1 et 2 soient des pgcd de la partie S. Puisque 01 | $, nous avons 
01 | 62 parce que 02 est un pgcd. Le même raisonnement, inversant 01 et 062 montre que 02 | 61. 
Si (a) sont les éléments de la décomposition de 01 et (b,) ceux de 02, alors le lemme 3.16 nous 
indique que a, < b, et b, < ap, Ce qui implique que a, = b,. 


La démonstration pour le ppem s'effectue selon le même principe. 


LEMooJIGRooARiIPC 
Lemme 3.20. 
Soit une partie S de N. 


(1) Le pgcd de S est le plus grand élément de N divisant tous les éléments de S. 
(2) Le ppcm de S est le plus petit élément de N que tous les éléments de S divisent. 
LEMooEVIZooPAKQZW 
Lemme 3.21 ([1|). 


Soient a,beZ etke N tels que ab = q* et pgcd(a, b) = 1. Alors il existe à, B e Z tels que a = a 
et b= BF. 


k 


Démonstration. Nous décomposons a, b et q en facteurs premiers suivant le théorème 3.15 : 


: = [I Re 
b= [| p} (3.35b) 
i 
g= |] |r# (3.35c) 
i 
D'un part, en utilisant la commutativité et l’associativité du produit, 


de ||er"e (3.36) 


D'autre part, puisque ab = q*, nous avons 
ik kq: 
ab=([[r#)" =] T[pri". (3.37) 
i i 


En vertu de l’unicité de la décomposition en facteurs premiers, pour chaque à nous avons 


ai + bi = Kqi. (3.38) 


3. Le pgcd et ppem sont définis dans 1.182. 
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Comme a et b sont premiers entre eux, si a; Æ 0 alors b; = 0 et inversement. Prenons un à tel que 
a; Æ 0. Alors b; = 0 et nous avons a; = kq;. Idem pour les b;. 
Donc tous les a; et les b; qui sont non nuls sont des multiples de k. Nous posons a; = ks; et 


nous reportons dans (3.35a) : 
a= ES = (| 1e), (3.39) 
ï 


de telle sorte que a soit une puissance k°. La même chose tient pour b. 


PROPooNQBÜooHWaTvs 
TT ena=][[,.pp® etb=TT], p'e. En posant 
Mp = Min{ap; bp} (3.40a) 
M, = max{ay, bp}, (3.40b) 
nous avons 
pgcd(a, b) =] [pr (3.41a) 
pEP 
ppem(a, b) =][][r". (3.41b) 
pEP 


Pour rappel, la définition de pgcd et ppcm sont dans 1.182. 
Démonstration. Nous commençons par le pgcd. Nous notons Ô — [ler p'? et nous prouvons que 
6 est un pgcd de {a,b}. Il y a deux propriétés à vérifier. 


(1) à divise a et b Puisque m, = min{a,, b,}, nous avons m, < a» et mp < b,. Le lemme 3.16 
nous dit alors que Ô | a et à | b. 


(2) Si s divise a et b De même, si s | aet s | b, nous avons 5, < a, et sy < b), ce qui montre 
que 8 < My et donc que s | 6. 
Pour le ppem, nous posons 4 = [ [ep pV», et nous prouvons que y est un ppem de {a, b}. 


(1) a et b divisent u Pour tout p, nous avons M, > a,. Le lemme 3.16 implique que a | y. 
Idem pour b, donc tous les éléments de {a,b} divisent u. 


(2) Si a et b divisent r Supposons que a et b divisent un certain nombre r. Alors a, < r» et 
b, <r). Donc r, > max{a», bp} = M,. Nous en déduisons que y | r. 


Puisque les pgcd et ppem sont uniques (lemme 3.19), nous avons prouvé que 6 et x sont les 
nombres recherchés. 


CORooQIMHooUZzLUJY 
Corolaire 3.23. 
Soit un nombre premier p. Un élément m € Z* vérifie pgcd(m, p”) Æ 1 si et seulement si m = qp 
pour un certain q. 


Démonstration. Nous considérons les décompositions en facteurs premiers m = [[.ep s*° et p" = 
sts, Par la partie unicité du théorème 3.15, nous savons que db, = 0 pour s £pet b, = n. 
seP P 
Nous prenons ensuite l'expression du pgcd donné par la proposition 3.22 : 


pgcd(m, p") =]] gmin{as,bs}, (3.42) 
seP 


Le minimum est toujours zéro lorsque s Æ p, donc pgcd(m, p") = printasn}, 
Nous avons donc pgcd(m, p") Æ 1 si et seulement si a, # 0. Mais a, # 0 si et seulement si m 
est un multiple de p. 


LemheKdsa 
Lemme 3.24. 
Un entier n > 1 se décompose de façon unique en produit de la forme n = gm? où q est un entier 
sans facteurs carrés et m, un entier. 
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Démonstration. Pour n = 1, c’est évident. Nous supposons n > 2. 
En ce qui concerne l'existence, nous décomposons n en facteurs premiers * et nous séparons les 
puissances paires des puissances impaires : 


T S 
n = Le FER (3.43a) 
i=1 j=1 
T S S 

— (Tree f1é) Llée (3.43b) 

i=1 j=1 j=1 

= — 
m? q 


Nous passons à l’unicité. Supposons que n = qymi = qem3 avec qi et q2 sans facteurs carrés 
(dans leur décomposition en facteurs premiers). Soit d = pged(m:,m2) et k1, k2 définis par m1 = 
dk1, m2 = dk2. Par construction, pgcd(k1,k2) = 1. Etant donné que 


n = qdk? = qok?, Fa pH) 


nous avons q1k? — qokè et donc k? divise g2k$. Mais k1 et ko n’ont pas de facteurs premiers en 
commun, donc k? divise go, ce qui n’est possible que si k1 = 1 (parce que k? n’a que des facteurs 
premiers alors que qg2 n’en a pas). Dans ce cas, d = mx et m1 divise m2. Si m2 = Im alors 


l'équation (3.44) se réduit à n = qumi = q2l?m? et donc 


qi = ga”, (3.45) 


ce qui signifie { = 1 et donc m1 = m2. 


Les nombres premiers ne sont pas si rares que ça dans N. Nous allons voir dans 15.118 que 
la somme des inverses des nombres premiers diverge. Pour comparaison, la somme des inverses 
des carrés converge par la proposition 11.123. Il y a donc, dans un certains sens, plus de nombres 
premiers que de carrés; dans un autre sens, il y en a autant : une infinité dénombrable. 


3.2.4 Ordre d’un élément dans un groupe fini 


Voir plus d'informations dans la partie 5.2 sur les groupes monogènes. 
LEMooRFKQooWTdYcr 


Lemme 3.25 ([1|). 


Si g est un élément d'ordre s, et si g” = e, alors s | r. 
THOooSUWKoo!ICbzqM 


Théorème 3.26 (Théorème de Cauchy|[97, 98]). 
Soit G&, un groupe cyclique d’ordre n. Si d divise n, alors G possède un unique sous-groupe d'ordre 
d. 


En particulier, G possède des éléments de tous les ordres divisant n. 


Démonstration. En plusieurs parties. 


(1) Existence L'hypothèse est que G est un groupe cyclique. Donc nous pouvons considérer 
une générateur g de G. Nous considérons H3 — gr(g"/ d), et nous prouvons que H4 est un 
sous-groupe d'ordre d. 

D'abord nous avons (gd) = g" = e. Donc |H4| < d. Pour prouver que |H4| > d, nous 
supposons par l'absurde qu'il existe k < d tel que (g/4)F = e. Nous aurions alors g"*/d = e 
avec nk/d < n, ce qui contredirait que g est générateur d’un groupe d'ordre n. 


(2) Unicité Soit H, un sous-groupe de G d’ordre d. Nous allons prouver que H = gr(g"/4). Vu 
que H et H} ont le même cardinal, il suffira de montrer que H € H} pour avoir H = H4. 


4. Théorème 3.15. 
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Vu que {e} est l’unique sous-groupe d’ordre 1, nous supposons que d > 1. Soit h £ e dans 
H. Vu que g est générateur de G, il existe k € IN* tel que g* = h. Vu que A est d’ordre d, 
nous avons Ad = e (corolaire 2.14). Donc 


gi = e. (3.46) 


Le lemme 3.25 dit alors que n | kd. Soit t € N* tel que nt = kd; nous pouvons écrire k = tn/d 
et récrire g* = h avec cette valeur de k : 


h= ge (9) era”): (3.47) 


Vu que h à été pris arbitrairement dans H, nous en déduisons que H € gr(g"/d). 


Le lemme suivant indique que sous hypothèse de commutativité, l’ordre d’un élément est une 
notion multiplicative. 
LemyETtdy 


Lemme 3.27 ([99]). 
Soit G un groupe et a,b € G tels que ab = ba d'ordres respectivement r et s, deux nombres premiers 
entre eux. Alors l’élément ab est d’ordre rs. 


Démonstration. Etant donné que (ab)"$ = a’"b"$ = 1, l’ordre de ab divise rs. Et comme r et s sont 
premiers entre eux, l’ordre de ab s'écrit sous la forme r151 avec r1 | r et s1 | s. Nous avons 


Et (3.48) 
que nous élevons à la puissance r2 où r2 est défini en posant r = r1r2 : 
ar#1p"#1 = 1, (3.49) 


Et comme a’! = 1, nous concluons que b"°1 = 1. Donc 5 | rs1. Par le lemme de Gauss 3.12, nous 
avons en fait s | 51. Puisqu’on a aussi 51 | 5, nous avons 5 = 51. 
Le même type d’argument donne r = r1, et finalement l’ordre de ab est r151 = rs. 


LemSk100G 
Lemme 3.28 ([58]|). 
Un sous-groupe d'indice 2 est un sous-groupe normal. 


Démonstration. Si H est un tel sous-groupe d’un groupe @, alors G& possède exactement deux 
classes à gauche par rapport à H (théorème de Lagrange 2.13) et se partitionne donc en deux 
parties : G = H L x H avec x & H. De même pour les classes à droite : G = H L Hx. Puisque la 


classe à droite Hx n’est pas H, on a x H = Hx,et H est normal dans G par la proposition 1.258. 
PropubeiGX 


Lemme 3.29 ([100]). 
Soit H, un sous-groupe normal d'indice m de G. Alors pour tout a € G nous avons a” € H. 


Démonstration. Par définition de l’indice, le groupe G/H est d'ordre m. Donc si [a] € G/H, nous 
avons [a] = [e], ce qui signifie [a”’] = [e], ou encore a” € H. 


PROPooVWVIooQzuAlA 
Proposition 3.30 ([100]). 
Soit un groupe fini G et H, un sous-groupe normal d'ordre n et d'indice m avec m et n premiers 
entre eux. Alors H est l’unique sous-groupe de G à être d’ordre n. 


Démonstration. Soit H” un sous-groupe d'ordre n. Si h e H' alors h" = 1 et h"" € H par le lemme 
3.29. Étant donné que m et n sont premiers entre eux, par le théorème de Bézout 1.229, il existe 
a, be Z tels que 


am + bn = 1. (3.50) 
Et donc, h = h! = (h”)2(h")0, En tenant compte du fait que h" = 1 et h"' e H, nous avons h € H. 
Ce que nous venons de prouver est que H' € H et donc que H = H' parce que |[H’| = |H| = 


IG|/m. 
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3.31. 
Notons que cette proposition ne dit pas qu’il existe un sous-groupe d’ordre n et d'indice m. Il dit 


juste que si il y en à un et si il est normal, alors il n’y en a pas d’autre. 
LemqAUBYn 


Lemme 3.32. 
L'ensemble des ordres d’un groupe commutatif est stable par PPCM. 

Autrement dit, six € G est d’ordre r et si y € G est d’ordre s, alors il existe un élément d'ordre 
ppem(r, s). 


Démonstration. Soit m = ppem(r,s). Afin d'écrire m sous une forme pratique, nous considérons 
les décompositions en facteurs premiers de r et 5 : 


r= [5 (3.51a) 


k 
s=[[n (3.51b) 
=] 


où {pi}i=1,..xr est l’ensemble des nombres premiers arrivant dans les décompositions de r et de s. 
Si nous posons 


k 
= |] | 2 (3.52a) 
= 
> Bi 
k 
= Jr (3.52b) 
abs 


alors ppem(r, s) = r’s! et r' et s/ sont premiers entre eux. L'élément x”/"” est d’ordre r’ et l'élément 
y*/5" est d'ordre s/. Maintenant nous utilisons le fait que G soit commutatif et le lemme 3.27 pour 
conclure que l’ordre de x’/""y°/5" est rs! = m. 


3.2.5 Écriture des fractions 


Théorème 3.33 ([101]). 
Tout élément de Q*Ÿ s'écrit de façon unique comme quotient de deux entiers premiers entre eux. 


THOooWYQVooRBaAAM 


Démonstration. En deux parties © 


(1) Unicité Supposons avoir # = % avec pgcd(a, b) = pgcd(c, d) = 1. Nous avons 


ad = bc (3.53) 


donc 

(1a) a divise bc mais est premier avec b donc a divise c par le lemme de Gauss 3.12. 
(1b) c divise ad mais est premier avec d donc c divise a par le lemme de Gauss 3.12. 
En conclusion a divise c et c divise a, ergo” a = c. L'égalité b = d est alors immédiate. 


(2) Existence Soit le quotient ?. Nous avons 


a  a/pgcd(a, 


b) 
D" (3.54) 


qui est encore un quotient d’entiers parce que pgcd(a,b) divise aussi bien a que b. Il faut 
montrer que les nombres a/pgcd(a,b) et b/pgcd(a,b) sont premiers entre eux. Pour cela 


5. Définition 1.182. 
6. Définitions des pgcd et ppem en 1.182. 
7. Lemme 3.14. 
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nous supposons que k est un diviseur commun. En particulier, les nombres a/k pgcd(a, b) et 
b/k pgcd(a, b) sont des entiers, ce qui fait que k pgcd(a, b) est un diviseur commun de a et b. 
Étant donné que pgcd(a, b) est le plus grand tel diviseur, nous devons avoir k pgcd(a, b) = 
pgcd(a, b) c’est-à-dire que k = 1. Donc les nombres a/ pgcd(a, b) et b/pgcd(a, b) sont premiers 
entre eux. 


PROPooWBFJooWissZXx 
Proposition 3.34 ([1]). 
Soient l,l,d1,d2 € N tels que 


ee (3.55) 


avec pgcd(k, di) = 1. 
Alors 


(1) di < d2 


_ d, 
(2) d = pecd(d2) * 
PROPooRZDDooLJabov 
Proposition 3.35. 


Les entiers p et q sont premiers entre eur® 


si et seulement si p° et q° sont premiers entre eux. 


Démonstration. En deux parties. 


(1) = Nous supposons que p? et q° ne sont pas premiers entre eux. Donc il existe Ô divisant 
p? et q°. Si 0’ est un facteur premier de 6, alors 6’ divise 6 et donc aussi p? et g?. Le lemme 
3.17 implique que 6 divise p et q. Donc p et q ne sont pas premiers entre eux. 


(2) = Si p? et q? sont premiers entre eux, par le théorème de Bézout 1.229 il existe a,b € Z 
tels que 
ap? + bg? = 1 (3.56) 


Dans ce cas, (ap)p + (bq)q = 1, ce qui montre (par encore Bézout, mais l’autre sens) que p 
et q sont premiers entre eux. 


Une des conséquences de ces résultats sera le fait que 4/n est irrationnelle dès que n n’est pas 
un carré parfait, théorème 3.36. 
Nous avons déjà vu dans la proposition 1.393 que V2 était irrationnel. En fait le théorème 
suivant va nous montrer que le nombre 4/n est soit entier, soit irrationnel. 
THOooYXJIooWcbnbm 
Théorème 3.36. 
Soit ne N. Le nombre \/n est rationnel si et seulement si n est un carré parfait. 


Démonstration. Supposons que 4/n soit rationnel. Le théorème 3.33 nous donne p, q € N premiers 
entre eux tels que 4/n = p/q. La proposition 3.35 nous enseigne de plus que p° et q° sont premiers 
entre eux. Nous avons 

p? = nq°. (3:57) 


Le nombre q est alors un diviseur commun de q? et de p. Donc q = 1 et n = p? est un carré 
parfait. 


3.2.6 Equation diophantienne linéaire à deux inconnues 
subsecZVKNooXNjPSf 


Soient a, b et c des entiers naturels donnés. Nous considérons l’équation 
EqTOVSooJ 
ax + by = c À " ES 


à résoudre[102] pour (x, y) € IN?. 


8. Premiers entre eux, définition 1.252. 
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Si a ou b est nul, c’est facile; nous supposons donc que a et b sont tous deux non nuls. Nous 
commençons par simplifier l’équation en cherchant les diviseurs communs. Soit d = pgcd(a,b) et 
notons a = da’, b = db'. Nous avons déjà l’équation 


d(a’x + b'y) = c, (3.59) 


et donc si c n’est pas un multiple de d, il n’y a pas de solution”. Si par contre c est un multiple de 
d alors nous écrivons c = cd et l'équation devient 


ax+by=c (3.60) 


C’est maintenant que nous utilisons le théorème de Bézout 1.229 : puisque a/ et b’ sont premiers 
entre eux, nous avons la relation a/u + blu = 1 pour certains { nombres entiers u et v. Nous 
récrivons notre équation sous la forme a/x + b'y = c'(a'u + blu) et rassemblons les termes : 


a'(æ — d'u) = b'(cv — y). (3.61) 


C'est-à-dire que si (x,y) est une solution, alors a’ divise b'(c'v — y). Mais comme a’ et b’ sont 
premiers entre eux, le nombre a/ doit forcément !! diviser cv — y. Disons cu — y = ka’. Alors 
a'(x — c'u) = b'ka’ et donc 

z=bk+cu. (3.62) 


Nous trouvons alors une expression pour y en injectant ce résultat dans a/x+b'y = c! et en utilisant 


le théorème de Bézout: & ca Un (1 — bu). Au final nous avons prouvé que toutes les solutions 
sont de la forme | ? É 

{ z=bk+cu (3.63a) 

y=vc ak (3.63b) 


avec k € Z. Si nous ne voulons réellement que les solutions dans N et non dans Z, il faut seulement 
un peu restreindre les valeurs de k. Il en reste un nombre fini parce que l’équation pour x borne k 
vers le bas tandis que celle pour y borne k vers le haut. 

Par ailleurs, il est très vite vérifié que tous les couples (x, y) de la forme (3.63) sont solutions. 


Exemple 3.37. 
Résoudre l'équation 2x + 6y = 52. 
Nous pouvons factoriser 2 dans le membre de gauche et simplifier alors toute l’équation par 2 : 


x + 3y = 26. (3.64) 


Nous cherchons une relation de Bézout pour u+3v = 1. Ce n’est heureusement pas très compliqué : 
u = —5, v = 2. Nous pouvons alors écrire 


x +3y = 26 x (—-5+3x2), (3.65) 
et donc x +5 x 26 = —3(y — 26 x 2), et en posant k = y — 26 x 2 nous avons 
x = —3k — 130. (3.66) 
En injectant nous trouvons l’équation 3y — 3k — 130 = 26 et donc 
y=52+Kk. (3.67) 


À 


9. Exemple : 8x + 2y = 9. Le membre de gauche est certainement un nombre pair et il n’y a donc pas de solution. 
10. Nous avons décrit un algorithme pour les trouver en démontrant l’équation 3.20. 
11. C’est Gauss 3.12 qui le dit, et vous savez que lorsque Gauss dit, c’est forcément vrai. 
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3.2.7 Quotients 


Nous écrivons a = b mod p essentiellement si il existe k € Z tel que b + kp = a. Plus générale- 
ment nous notons [a], = {a + kplk € Z} et l'écriture «& a = n mod p » peut tout autant signifier 
a = [b|, que a € [b],. La différence entre les deux est subtile mais peut de temps en temps valoir 
son pesant d’or. 


Proposition 3.38. 
Soit n € N. Le groupe (Z/nZ, +) est monogène. Si n £ 0, il est cyclique d'ordre n. 


Démonstration. Nous considérons la surjection canonique y: Z — Z/nZ. Si a € Z, alors p(a) = 
au(1). Par conséquent Z/nZ = gr(u(1)) parce que tout groupe contenant y(1) contient tous les 
multiples de (1), et par conséquent contient u1(Z) = Z/nZ. 
Soit x € Z/nZ et considérons x, le plus petit naturel représentant x. Nous notons x = [xo|]. 
Le théorème de la division euclidienne 1.215 donne l’existence de g et r avec 0 < r < n et qg > 0 
tels que 
To =nQ +7. (3.68) 


Nous avons [10] = [r] = u(r) parce que x0—r est un multiple de n. Nous avons donc [xo] € H(Nh-1). 
Par conséquent 
Z/n2 = p(Z) = H(Nn à). (3.69) 


La restriction 4: N,-1 — Z/nZ est donc surjective. Montrons qu’elle est également injective. Si 
(to) = u(x1), alors +1 = xo + kn. Si nous supposons que +1 > +0, alors k > 0 et si x0 € Nh-1, 
alors 41 >n—1. 

L'ordre de Z/nZ est donc le même que le cardinal de N,-_1, c’est-à-dire n. Le groupe Z/nZ est 
donc fini, d’ordre n et monogène parce que Z/nZ = gr(u(1)). Il est donc cyclique. 


Lemme 3.39 ([103]). 
Soit qe N avec q > 2. Soient n,de N tels que g® — 1 | g* —1. Alors d | n. 


Démonstration. Par le théorème de division euclidienne 1.215, il existe a, b € Z tels que n = ad +b 
avec 0 < b < d. En remarquant que q7 e [1] gl—1 NOUS avons 


q" = (ga)? e [1lea_19 = [q?loë_1. (3.70) 


Pour cela nous avons utilisé d’abord le fait que si a € [z]x, alors a” € [2]; et ensuite le fait que 
[ile = [x]x. D'autre part l'hypothèse qd — 1 | q° — 1 implique 


qg" € [1lyd_1 371) 
Par conséquent le nombre g"” est à la fois dans [q?],«_, et dans [1],a_. Cela implique que 


[qa_1 — [a a_1, (3.72) 


ou encore que q° € [1]44_1 ou encore que = Var 
Étant donné que b < d et que g > 2, nous avons que g? — 1 < g — 1: donc pour que gŸ — 1 
divise q? — 1, il faut que q? — 1 soit zéro, c’est-à-dire b = 0. 
Mais dire b = 0 revient à dire que d | n, ce qu’il fallait démontrer. 


3.3 Binôme de Newton et morphisme de Frobenius 
DEFooHXNFooUBKgqD 

Définition 3.40 (Coefficient binomial). 

Soient des entiers n et k avec k < n. Nous définissons coefficients binomiaux par 


() => n! EN60JTNpeeREnEAs 


k l(n — k)! 


Lorsque a est un multiindice, la factorielle a! et les coefficients binomiaux sont définis en 30.12. 
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LEMooHWMNooIINsxu 
Lemme 3.41. 
Un formule pour les coefficients binomiaux : 


() L (a - ) | e k (3.74) 


Démonstration. Simple mise au même dénominateur : 


n! ” n! _n(n—-k+1)+nlk  nl(n+1) (3.75) 
kl(n —k)! (k—1)!(n—-k+1)! kl(n — k +1)! kl(n +1—Kk)! ‘ 
LEMooUTDTooXAmvdF 
Lemme 3.42 ([1]|). 
Nous considérons ces deux ensembles : 
A À = azestu)l tel que l SL ss: € RC) (3.76a) 
C = {parties de cardinal k dans {1,... n}}. (3.76b) 


Îl existe une bijection entre À et C. 


Nous avons de plus !? 
Card(A) = Card(C) = () FN 0e 


PropBinomFExOiL 
Proposition 3.43 ([104]). 
Pour tout x, yeRetneN, nous avons 


CA — se PALUE Tai EQNE 9% 
(x + y) 20 y E7 


où les coefficients binomiaux sont donnés dans le lemme 3.22. 


Démonstration. La preuve se fait par récurrence. La vérification pour n = 0 et n = 1 se fait 
aisément pour peu que l’on se rappelle que x° = 1 et que 0! = 1, ce qui donne entre autres fo = 1. 
Supposons que la formule (3.78) soit vraie pour n > 1, et prouvons la pour n + 1. Nous avons 


= AR) nt NN ak ht EqBi 

QD au 
n n—1l 

D n+l M n—k+1, k M n—k, k+1 n+1 

= x +2 (is y + QE D'ADEEE ULS 


k=1 


La seconde grande somme peut être transformée en posant à = k +1: 


n—1 n 
PR on-k,k+1 _ n n—(i—1), i—1+1 
> QE y » ( _ ,}r y . (3.80) 


k=0 i=1 


dans lequel nous pouvons immédiatement renommer à par k. En remplaçant dans la dernière 
expression de (3.79), nous trouvons 


(x ” (ie _ ati ". por JL >, 1 (5) 4 ° " ) RE (3.81) 


k=1 


La thèse découle maintenant de la formule du lemme 3.41. 


12. Pour le coefficient binomial, définition 3.40. 
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LEMooLPCXooYIzJsD 


Lemme 3.44 ([1]|). 
Si n > k nous avons 
n! nË-1 


< 
kl(n=#)l El 


(3.82) 


Démonstration. Nous décomposons le produit définissant n! en les facteurs entre 1 et n— k et ceux 
entren—k+1letn: 


n=(n-k)l [[ i<nËt(n-x)l. (3.83) 
i=n—k+1 
Donc 
n! 7: is 
84 
HA à BE) 


Tant que nous sommes à démontrer des égalités, en voici une. 


LEMooLPOQoo1ICJYdv 
Lemme 3.45 ([105]). 
Pour a, bER etne N nous avons 
n—1 
a+ (LE = (a+ 6) D (1) ar EE, (3.85) 
k=0 
Démonstration. C’est un simple calcul : 
n—1 n—1 n—1l 
(a +86) D (—1)a EE = Ÿ (—1)far EE + (—1)fan pt (3.86a) 
k=0 k=0 k=0 
n—1 n—2 
= a+ Dati + V1) tot FERRER Po EEE 
k=1 k=0 


a + ( = ) n—1 pa ii 


Justifications. 


— Pour (3.86b). Dans la première somme, nous avons séparé le terme k = 0 et dans la seconde 
nous avons séparé le terme k = n —1 


— Pour (3.86c). Dans la seconde somme, décaler les termes pour sommer de 1 à n — 1 et 
remarquer que ce qu’on obtient annule la première somme. 


Propqarrdem 
Proposition 3.46. 
Soit A un anneau commutatif de caractéristique première p. Alors o(x) = x? est un automorphisme 
de l’anneau A. Nous avons la formule 


(a + b}P = a? + bP (3.87) 


pour tout a, bE A. 


Démonstration. Nous utilisons la formule du binôme de la proposition 3.43 et le fait que les coef- 
ficients binomiaux non extrêmes sont divisibles par p et donc nuls. 


300 CHAPITRE 3. ANNEAUX 


3.4 Polynômes de plusieurs variables 
DEFooZNH0OooCruuwlI 
Définition 3.47. 
L'ensemble des polynôme de n variables sur l’anneau A est AN), c’est-à-dire l’ensemble des 
suites indexées par N' et dont seulement une quantité finie de coefficients sont non nuls. 
Le produit sur A[X:,...,X,] est défini par 


(PQ)(k, es kn) = + A RE (3.88) 
(ln), (mai,mn)eN" XIN? 
litmi=k; 
3.48. 
Dans A[X:,...,X,|, la multiplication n’est pas la multiplication de fonctions N° — K, parce que 


le but est d’obtenir la multiplication usuelle au niveau des évaluations. 


Définition 3.49. 


Si P est un polynôme de n variables sur À, et si (x1,...,æ») € A", l’évaluation de P sur 
Cris) est 
Passe D sr (3.89) 
(k1,..,kn )EN" 


Notez que la somme, bien que sur N°, est une somme finie. 


3.50. 
Comme dans le cas des polynômes d’une seule variable, les X; dans la notation A[X:,...,X,] sont 
à prendre à la légère. L’anneau des polynômes de n variables sur À aurait mieux fait d’être noté 
par exemple par P;(A). 

Le fait est que nous avons les polynômes élémentaires définis par 


1 si(k1,...,kn) =(1,0...,0) 


0 sinon. 


X1(k1,..., &n) = (3.90) 


et que l’anneau des polynômes peut être vu comme À (les polynômes constants) étendus par les 
Xi. 

Quoi qu’il en soit, les X; dans la notation A[X:,...,X,] sont des indices muets. L’anneau 
A[X1,...,Xh] est exactement le même que AÎT:,...,T;|. 


3.4.1 Divisibilité et classes d’association 
DivisibiliteAnneauRéftäEHies 


Définition 3.51. 
On dit de deux éléments a,b € À qu'ils sont associés si il existe un inversible u € À tel que a = ub. 


La classe d’association d’un élément a € A est l’ensemble des éléments qui lui sont associés. 
LemRmVTRq 


Lemme 3.52. 
Si À est un anneau intègre et si a,b € À sont deux éléments vérifiant a | b et b | a, alors ils sont 
associés, c’est-à-dire qu'il existe un inversible u € À tel que a = ub. 


Démonstration. Les hypothèses à propos de la divisibilité nous indiquent que a = xb et b = ya 
pour certains æ,y € À. Alors, 
b(1 — yx) = 0. (3.91) 


Étant donné que À est intègre, cela montre que b = 0 ou 1 — yx = 0. Si b = 0 nous avons 
immédiatement a = 0 et le lemme est prouvé. Si au contraire yx = 1, c’est que y et x sont 
inversibles et inverses l’un de l’autre. 


LEMooJBOXooYkMRrz 
Lemme 3.53. 
Si A est un anneau et si a € À, la classe d'association de a est aU(A) où U(A) est l’ensemble des 
éléments inversibles de À. 
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Exemple 3.54. 
Dans Z{i|, les inversibles sont +1 et +1. Donc les éléments associés à z sont z, —z, iz et —iz. 
Notons au passage que la notion de divisibilité dans Z{i] n’est pas immédiatement intuitive. En 
effet bien que 7 ne soit pas divisible par 2 (ni dans Z ni dans Z{i]), le nombre 7 + 64 est divisible 
par 2 + à dans Z{[i]. En effet : 
(2 + i)(4 + à) = 7 + 61. (3.92) 


A 


Exemple 3.55. 
Si K est un corps, l'élément XY de K[X,Y] n’est pas premier parce que XY | X?Y? alors que 
XY ne divise ni X? ni Y?. A 


ii Avertissement /question au lecteur !! 3.56 
Est-ce que quelqu'un connaît un anneau contenant Z dans lequel 7 est divisible en 2 ? 
Peut-être Z étendu par tous les 1/2" ? 


3.4.2 PGCD et PPCM 


Pour le théorème de Bézout et autres opérations avec des modulo, voir le thème 3. Le pgcd et 


le ppem sont définis en 1.182. 
LEMooGWKMooLEepxz 


Lemme 3.57. 
Soient À un anneau intègre et S € À. Si 0 est un PGCD de $, alors l’ensemble des PGCD de S 
est la classe d’association de 6. 

De la même façon si a est un PPCM de S, alors l’ensemble des PPCM de S est la classe 
d'association de ui. 


Démonstration. Soient Ô un PGCD de $ et u un inversible dans À. Si x € S nous avons Ô | x et 
donc x = aô. Par conséquent x = au-luô et donc u6 divise x. De la même manière, si d divise x 
pour tout x € S, alors d divise 6 et donc Ô = ad et uô = aud, ce qui signifie que d divise ud. 

Dans l’autre sens nous devons prouver que si 6’ est un autre PGCD de S$, alors il existe un 
inversible u € À tel que 0’ = uô. Comme 6’ divise x pour tout x € S$, nous avons 0’ | 6, et 
symétriquement nous trouvons ô | 4’. Par conséquent (lemme 3.52), il existe un inversible u tel 
que Ô = ud’. 


Le même type de raisonnement tient pour le PPCM. 


Si 0 est un PGCD de S, nous dirons par abus de langage que 6 est le PGCD de S, gardant en 
tête qu’en réalité toute sa classe d'association est PGCD. Nous noterons aussi, toujours par abus 
que 0 = pgcd(S). 


Remarque 3.58. 
La classe d'association d’un élément n’est pas toujours très grande. Les inversibles dans Z étant 
seulement +1, nous pouvons obtenir l’unicité du PGCD et du PPCM en imposant qu'ils soient 
positifs. 

Pour les polynômes, nous obtenons l’unicité en demandant que le PGCD soit unitaire. 

Dans les cas pratiques, il y a donc en réalité peu d’ambiguïté à parler du PGCD ou du PPCM 
d’un ensemble. 


3.4.3 Anneaux intègres et corps 


Le fait d’être intègre pour un anneau n’assure pas le fait d’être un corps. Nous avons cependant 
ce résultat pour les anneaux finis. 
PropanfinintimpCorp 
Proposition 3.59. 
Un anneau fini intègre est un corps. 
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Démonstration. Soit À un tel anneau. Soit a # 0. Les applications 


h:tz+ art (3.93a) 
Ta: Tr Ta (3.93b) 


sont injectives. En tant que applications injectives entre ensembles finis, elles sont surjectives. Il 
existe donc b et c tels que 1 = ba = ac. Nous trouvons que b et c sont égaux parce que !? 


b = b(ac) = (ba)c = c. (3.94) 


Par conséquent b est un inverse de a. 


PropzhFgeNJ 
Proposition 3.60. 
Soit n € N*. Les conditions suivantes sont équivalentes : 


(1) n est premier. 
(2) Z/nZ est un anneau intègre. 
(3) Z/nZ est un corps. 


Démonstration. L’équivalence entre les deux premiers points est le contenu du corolaire 1.236. Le 
fait que Z/nZ soit un corps lorsque Z/nZ est intègre est la proposition 3.59. Le fait que Z/nZ soit 
intègre lorsque Z/nZ est un corps est une propriété générale des corps : ce sont en particulier des 
anneaux intègres (lemme 1.194). 


3.5 Anneau factoriel 
DEFooVCATooPJGWKq 


Définition 3.61 (Anneau factoriel). 
Un anneau commutatif À est factoriel si il vérifie les propriétés suivantes. 


(1) L'anneau À est intègre *. 
(2) Si ae À est non nul et non inversible, alors il admet une décomposition en facteurs irréduc- 
tibles : a = p1...px où les p; sont irréductibles *. ITEMooKVDBooTASwVO 


(3) Si a = q1...Qm est une autre décomposition de a en irréductibles, alors m = k et il existe 


une permutation ® o € Sy telle que p; et do(iy Soient associés |". 


Un anneau factoriel permet de caractériser le pgcd et le ppem de nombres. 
LEMooLVKMooSLuzao 


Lemme 3.62 ([106]). 
Soit un anneau factoriel À et un élément irréductible p € A. Si plxy, alors p divise x ou y ou les 
deux. 


Démonstration. Comme nous sommes dans un anneau factoriel, nous pouvons écrire q, x et y 
comme produits d’irréductibles, et profiter de la plus ou moins unicité de ces décompositions (la 
propriété 3.61(3)). Nous notons q = q1...Qk, T = T1...Æm et y = Y1...Yy. L'égalité pq = xy 
devient : 

PQ ...Qh = T1... LmYi... Yi. (3.95) 


Il existe un des x; ou y; qui est associé à p. Fixons un À et disons que c’est x; (si c’est un des y;, 
adaptez) : il existe un inversible u tel que x; = pu. Nous avons alors !? 


T = DUT... Li_1Tii1... Tme (3.96) 


13. Il faut être un peu souple avec les notations communément employées dans les ouvrages mathématiques, et 
que nous reprenons telles quelles. Dans l’équation qui suit, b(ac) est le produit de b par l’élément ac, et non quelque 
chose comme le produit de b avec l’idéal (ac) par exemple. 

14. Anneau intègre, définition 1.193. 

15. Élément irréductible, définition 1.185. 

16. Définition 1.267. 

17. Définition 3.51. 

18. Le fait que À soit commutatif est utilisé partout. 
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Donc p divise x et fin de l’histoire. 


PROPooUQSXooYidPQv 
Proposition 3.63 ([106]). 
Dans un anneau factoriel, tout élément irréductible est premier |”. 


Démonstration. Soit un anneau factoriel À et un élément irréductible p dans A. Nous devons 
prouver qu’il est premier. 


(1) p est non nul Si p = 0, nous avons p = 0 x 0. Comme 0 n’est pas inversible (un anneau 
factoriel est par définition intègre), p serait un produit de deux non inversibles. 


(2) Non inversible L'élément p est non inversible parce que c’est dans la définition d’un 
élément irréductible. 


(3) Sip|zxy Si p divise xy, alors il divise x ou y; c’est le lemme 3.62. 


LEMooGKOSooRKtfDJ 
Lemme 3.64 ([1]|). 
Si À est un anneau factoriel, et si p est irréductible dans À, alors : 


(1) L'idéal pA est premier. 
(2) L'anneau A/pA est intègre. 


Démonstration. En deux parties. 


(1) pA est premier D'abord pA est strictement inclus dans À parce que p n’étant pas inver- 
sible, l'élément 1 n’est pas dans pA. 


Soient a, b € À tels que ab € pA. Cela signifie qu’il existe x € À tel que px = ab, ou encore 
que p divise ab. Le lemme 3.62 dit alors que p divise a ou b. Supposons pour fixer les idées 
que p | a. Il existe y tel que a = py € pA. 


(2) L’anneau A/pA est intègre C’est la proposition 1.224. 


PROPooUXQMooVEz1yG 
Proposition 3.65. 
Soit une famille {an} d'éléments de À qui se décomposent en irréductibles comme 
= | |p" (3.97) 
k 


Alors | 
pacd{an} = NÉ (3.98) 
k 


De plus le PGCD est : 
(1) Un multiple de tous les diviseurs communs des a;. 


(2) Unique pour cette propriété à multiple près par un inversible?. 


De la même manière, 
ppem{an} = | [ppt (3.99) 
k 


Un anneau factoriel a une relation de préordre partiel donnée par a < b si a divise b. En termes 
d’idéaux, cela donne l’ordre inverse de celui de l'inclusion ?! : a < b si et seulement si (b) € (a). 


19. Élément premier, définition 1.184. 

20. Soyez prudent avec cette affirmation : je n'en n'ai pas de démonstrations sous la main et ne suis pas certain que ce 
soit vrai. 

21. Voir proposition 3.3. 
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EXooCWJUooCDJqkr 
Exemple 3.66. 
L'’anneau Z[iv3] n’est pas factoriel parce que 4 a au moins deux décompositions distinctes en 
irréductibles : 
4=2:2, (3.100) 
et 
4 = (1+4iV3)(1— iv3). (3.101) 
A 


Nous allons voir dans l'exemple 3.85 que Z[iv2] est factoriel parce qu’il sera euclidien. 


3.5.1 Autour du théorème de Bézout 


Rappel de notations : si À est un anneau et si p € À, nous notons (p) l'idéal engendré par p, 


c’est-à-dire pA. C’est la définition 1.205. 
LEMooARNUooXqrJGa 


Lemme 3.67 ([107]). 
Soient un anneau principal" À ainsi que à,b € À. 


(1) d est PGCD de {a,b} si et seulement si (d) = (a) + (b). 
(2) m est PPCM de {a,b} si et seulement si (m) = (a) n (b). 


122 


Théorème 3.68 ([108, 107]). 
Soient un anneau principal et S € À non vide. 


(1) d est un PGCD de S si et seulement si il génère l'idéal engendré par S. 
(2) m est PPCM de S si et seulement si (m) = (es(s). 
Toute partie d’un anneau principal admet un PGCD et un PPCM”*. 


ii Avertissement /question au lecteur !! 3.69 
La preuve est à revoir. 


Démonstration. Puisque l’anneau À est principal, tous ses idéaux sont principaux et donc engen- 
drés par un seul élément. En particulier il existe 0, u € À tels que 


(6) = D (s) (3.102a) 


ses 


(u) = [Î(s) (3.102b) 


ses 


(1) PGCD Montrons ce que à est un PGCD de $. Pour tout x € S, nous avons (x) € (6), et 
donc 6 | x. Par ailleurs si d | x pour tout x € $, nous avons (x) € (d) et donc 


S'(æ) € (d), (3.103) 
xesS 
puis (6) € (d) et finalement d | 6. 


(2) PPCM Size S nous avons (y) 
xæE S, alors (m) € (x) et donc (m) 


(x) et donc x | u. D'autre part si x | m pour tout 


= 
€ (u), finalement y | m. 


CorimHyXy 
Corolaire 3.70 (Théorème de Bézout[108]). 
Soit un anneau principal A. Deux éléments a,b € À sont premiers entre eux si et seulement si il 
existe un couple (u,v) € A? tel que 
ua + vb = 1. (3.104) 


À la place de 1 on aurait pu écrire n’importe quel inversible. 


22. Définition 1.221. 
23. Ce n’est pas aussi trivial que ça parce qu’il faut encore qu’il existe des éléments vérifiant les formules données. 
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Démonstration. Pour cette preuve, nous allons écrire pged(a,b) l’ensemble de PGCD de a et b, 
c’est-à-dire la classe d'association d’un PGCD. 
Si a et b sont premiers entre eux, alors 


1e pgcd(a,b) = Ÿ (x) = (a) + (b). (3.105) 


æ=@,b 


À l'inverse, si nous avons ua + vb = 1, alors 1 € (a) + (b), mais puisque (a) + (b) est un idéal 
principal, (1) = (a) + (b) et donc 1 € pgcd(a, b). 


Le lemme de Gauss est une application immédiate du théorème de Bézout. Il y aura aussi un 
lemme de Gauss à propos de polynômes (lemme 6.51), et une généralisation directe au théorème 


de Gauss, théorème 6.50. 
LemSdnZNX 


Lemme 3.71 (Lemme de Gauss[109]). 
Soit À un anneau principal et a, b,ce À tels que a divise bc. Si a est premier avec c, alors a divise 


b. 


Démonstration. Comme a est premier avec c, nous avons pgcd(a,c) = 1 et Bézout (1.229) nous 
donne donc s,t € À tels que sa + tc = 1. En multipliant par b, 


sab + tbc = b. (3.106) 


Mais les deux termes du membre de gauche sont multiples de a parce que a divise bc. Par conséquent 
b est somme de deux multiples de a et donc est multiple de a. 


LEMooQJGTooEtVny)j 
Lemme 3.72 ([10]). 
Soit un anneau principal À. Soient a, b,c € À tels que 


(1) pecd(a,b) = 1 
(2) pgcd(a, c) = 1. 
Alors pgcd(a, bc) = 1. 


Démonstration. Le théorème de Bézout 3.70 donne des éléments u, v,x,y € À tels que ua + vb = 1 
et xa + yc = 1. En multipliant ces équations l’une avec l’autre, 


(ua + vb)(xa + yc) = 1. (3.107) 
En développant, nous trouvons 


(uax + uc + vbx)a + (vy)bc = 1. (3.108) 


Donc le théorème de Bézout (dans l’autre sens) nous indique que pged(a, bc) = 1. 


3.5.2 Idéal premier 
PROPooZICGooNmblhl 


Proposition 3.73 ([110, 1], thème 6). 
Soit un anneau principal À et un élément p Æ 0 dans A. Nous avons équivalene@ml BrrAooW1FUTX 


(1) (p) est un idéal premier, ITEMooKQRMooBNPDMX 


(2) p est un élément premier, ITEMooZYY JooCWBhL, 


(3) p est un élément irréductible, ITEMOOHPATo0YoQzaD 


(4) (p) est un idéal maximum propre ?*. 


24. Ce « propre » n'est pas dans l'énoncé sur Wikipédia. Je ne comprends pas pourquoi, et j'ai posé la question sur la 
page de discussion. 
https://fr.wikipedia.org/wiki/Discussion:Idéal_ premier 
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Démonstration. En plusieurs implications. 


(1) (1) implique (2) En plusieurs points. 


— La condition p £ 0 est dans les hypothèses de la proposition. 
— Si p était inversible, nous aurions (p) = À et donc pas que (p) est un idéal premier. 


— Soient a,b € À tels que p | ab. En particulier, (ab) € (p). Mais comme (p) est un idéal 
premier, cela implique soit a € (p) soit be (p). Donc soit p divise a soit p divise b. 


(2) (2) implique (3) Un anneau principal est intègre ; c’est dans la définition 1.221. Dans un 
anneau intègre, tout élément premier est irréductible, c’est la proposition 1.217. 


(3 


— 


(3) implique (4) Soit un idéal 7 contenant (p). Puisque À est principal, 1 est engendré 
par un seul élément ; soit 7 = (a). Vu que p € I, l'élément a divise p. Mais comme p est un 
élément premier, a | p implique a = p ou a = 1. Dans le premier cas, 1 = (a) = (p), et dans 
le second cas, 7 = (a) = (1) = À. Donc (p) est bien un idéal maximum. 


De plus l’idéal (p) est propre. En effet avoir (p) = À dirait en particulier que 1 € (p), 
c’est-à-dire qu'il existe x € À tel que xp = 1. Or p étant irréductible, il est non inversible. 


(4) (4) implique (1) C’est la proposition 1.224(3). 


Un exemple d’élément premier non irréductible est [4]6 dans l’anneau non principal Z/6Z. Voir 
3.83 et le lemme 3.84. 


3.5.3 Anneau noethérien 
DEFooPWMHooCnrQuJ 


Définition 3.74. 
Un anneau est dit noethérien si toute suite croissante d’idéaux est stationnaire (à partir d’un 
certain rang). 


Montrer que tout anneau principal est noethérien est le premier pas pour montrer que tout 


anneau principal est factoriel. 
LEMooHQPVooT£fkhRV 


Lemme 3.75. 


Tout anneau principal?” 


est noethérien. 

Démonstration. Soit (J,) une suite croissante d’idéaux et J la réunion. L'ensemble J est encore 
un idéal parce que les J; sont emboités. Etant donné que l’idéal est principal nous pouvons prendre 
a € J tel que J = (a). Il existe N tel que a € Jn. Alors pour tout n > N nous avons 


Jelener (3.109) 


La première inclusion est le fait que J = (a) et a € Jn. La seconde est la croissance des idéaux et la 
troisième est le fait que J est une union. Par conséquent pour tout n > N nous avons Jy = Jh = J. 
La suite est par conséquent stationnaire. 


Exemple 3.76. 
Il y a moyen d’avoir un anneau noetherien non principal. C’est le cas de Z/6Z dont nous parlerons 


dans 3.84. A 
THOooANCAooBChmwp 


Théorème 3.77 ([111, 40]). 
Tout anneau principal est factoriel. 


Démonstration. Soit un anneau principal À. Nous devons prouver les trois points de la définition 
3.61. D’abord À est intègre parce que ça fait partie de la définition 1.221 d’un anneau principal. 
Le gros morceau est l’existence et l’unicité d’une décomposition en irréductibles. 


25. Définition 1.221. 
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mini lemme 


Nous prouvons que si a est ni nul ni inversible, il est divisible par un irréductible. 

Soit a € À que nous supposons être ni nul ni inversible. L'idéal aA ne contient pas tout À parce 
que a n’est pas inversible ; par le théorème de Krull 1.214 il existe un idéal maximal M contenant 
aA. Tous les idéaux étant principaux dans À, l’idéal M est principal. 

Par définition d’idéal principal, il existe p € À tel que M = pA. Résumé : 


aeaAG M = pA. (3.110) 


Comme l’idéal pA est maximal, la proposition 1.195 dit que p est irréductible. Et donc p | a avec 
p est irréductible. 


Existence 


Nous définissons des suites (an) et (ph) par récurrence. D'abord ao = a, et en suite, si an est 
défini nous définissons a+1 et Pn+1 de la façon suivante. 


(1) Si a, est inversible, nous nous arrêtons et la suite est finie. 


(2) Si a, n’est pas inversible, nous définissons a»+1 et ph+1 par la relation donnée par le mini- 
lemme : 


An — Pn+14n+1 (3.111) 
avec Pn-1 irréductible. 


Pour tout n assez petit pour que la suite ne soit pas finie, nous avons 
a = Gp = Pia = P1P202 =... = Pi... Pnûn (3.112) 


où les p; sont irréductibles. 

Nous montrons à présent que la suite des (a,) est finie. Considérons les idéaux 1, = a, A, et 
montrons qu'ils sont croissants en montrant que a,+1 n’est pas dans 1,. 

En effet supposons que an+1 € În = anA. Il existerait k € À tel que ank = an+1, c’est-à-dire 
Pn+-14n+1# = An+1. Vu que l’anneau est intègre et que les a; sont non nums, nous simplifions par 
An+1 : Pn+1k = 1. Cela n’est pas possible parce que p,+1 n’est pas inversible. Bref, nous avons uns 
suite strictement croissante d’idéaux. 

L’anneau À est principal et donc noetherien (lemme 3.75). Donc toute suite croissante d’idéaux 
est stationnaire. Oh mais ça c’est pas possible si la suite des (a,) est infinie parce que nous venons 
de prouver qu’elle est toujours strictement croissante. 

Bon. Ben c’est que la suite des (a,) est finie. Il existe donc un N tel que an est inversible. 
Pour ce N nous avons 


a = Qp = Pia = P1P202 = ... = P]...PNAN. (3.113) 


Il nous reste à prouver que pan est irréductible. 

D'abord p\an est non ivnersible parce que pn n’est pas inversible et an est inversible. Ensuite 
supposons que pnan = st avec 5,t € A. Nous allons prouver qu’au moins s ou t est inversible. 
Nous avons 

px = s(tax). (3.114) 


Vu que pn est irréductible, il n’est pas le produit de deux non-inversibles. Soit s est inversible 
(alors on à gagné), soit tas est inversible, et alors { est inversible parce que ra est inversible. 


Unicité 


Soient des irréductibles p1,...,PDk, Q1,...,Qm tels Que à = p1...PDx = q1...Qm. Nous utilisons 
le lemme 3.72 : si p1 était premier avec tous chacun des q;, il serait premier avec le produit, ce qui 
serait absurde parce que le produit est a et p1 divise a. Bref, il y a un des q; qui n’est pas premier 
avec p1. 
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Nous considérons o1 € S1 tel que p1 n’est pas premier avec q,(1. Au passage, nous notons 
qi = G,(k)- Soit un diviseur commun d non inversible entre p1 et qd. Nous avons des éléments 
u,v tels que 

pi = du qi = dv. (3.115) 
Vu que p1 et qd sont irréductibles, ils ne peuvent pas être produit de deux non inversibles. Donc 


é : — 1 
u et v sont inversibles. Nous pouvons écrire d = a y let donc 


pi = duv (3.116) 
Nous récrivons p1...Dx = q1:..Qm avec ces valeurs : 
1 
dupo ... pk = dog .….qù). (3.117) 
Nous simplifions par d et nous avons 


(upa)ps ….pr = (vg$”)gf” gt). (3.118) 


Par récurrence nous construisons les o; et les a! ), 


PROPooPVFOooJvWRIh 
Proposition 3.78. 
Un corps est un anneau principal et un anneau factoriel. 


Démonstration. Un anneau est principal quant : 

— Commutatif 

— intègre 

— tous les idéaux sont principaux. 
Un corps est toujours commutatif. Un corps est un anneau intègre par le lemme 1.194. Donc un 
corps, les seuls idéaux sont {0} et K. Le premier est principal parce que 0A = {0}. Et le second 
est également principal parce que K = 1K. 

Donc un corps est un anneau principal. 


Le fait qu’un corps soit un anneau factoriel est maintenant le théorème 3.77. 
EXooYCTDooGXAjGC 


Exemple 3.79 (Z[iv5] n’est ni factoriel ni principal). 
Puisque (iV5)? = —5, les éléments de Z[iv5] sont les éléments de € de la forme a + biy5 avec 
a,be Z. Nous définissons la norme sur Z[i5] par ?° 
N:Zliv5] — IN 
ze 22. 


(3.119) 


Le fait que ce soit à valeurs dans N est un simple calcul : 
N(x + iyv5) = (x + iyv5)(x — iy V5) = x° + 5y. (3.120) 


De plus N est multiplicative : N(z122) = N(z)N(22). 
Nous pouvons maintenant déterminer les inversibles de Z[iy5]. Si a est inversible, alors il 
existe B tel que af = 1. Au niveau de la norme, 


N(a)N(8) = 1, (3.121) 


ce qui implique que N(a) = 1. Or l'équation x? + 5y? = 1 dans N donne y = 0, x = +1. 
Au final, les inversibles de Z[i4/5] sont +1. 
L'anneau Z[iV5] n’est alors pas factoriel (définition 3.61) parce que 


2x 3=(1+iV5)(1— iv5). (3.122) 


Cela donne deux décompositions du nombre 6 en produit d'éléments non associés ?" (2 n’est associé 
qu’à 2 et —2) parce que les inversibles sont 1 et —1. 
Le fait que Z[i5] ne soit pas factoriel implique qu’il ne soit pas principal, théorème 3.77. A 


26. C’est le carré de la norme usuelle, mais c’est l’usage dans le milieu. 
27. Définition 3.51. 
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3.6 Anneau 7/67 
SECooSWGKooEeOUZTO 
Nous allons donner quelques propriétés de cet anneau, et en particulier voir que dans cet anneau 
non intègre, la notion d’élément irréductible n’est pas très intéressante. 
Voici pour commencer un calcul de la table de multiplication de À = Z/6Z. Pour les multiples 
de (par exemple) [4]6 nous écrivons 


1 x [4l6 = [46] (3.123) 
et ensuite 
2 x [Ale = [86 = [2]6, (3.124) 
puis 
3 x [4]6 = [2 + 4]6 = [6]6 = [0]6. (3.125) 


et caetera. Le résultat est : 


(3.126) 


[eù 
ee) =) =) 
BI NOR |) © 
WI Of]! ©) © 
DIR ONE) © 
IDR] Co © 


Pour ne pas alourdir, nous n’avons pas écrit [x] partout au lieu de x. 


3.80 (Inversibles). 
Les éléments inversibles de Z/6Z sont ceux qui ont un [1]6 dans leur table de multiplication. Ce 
sont donc 


U(Z/62) = {[1]e, [5l6} (3.127) 
3.81 (Diviseurs de zéro). 
Les diviseurs de zéro sont ceux qui ont un [0]6 dans leur table de multiplication, c’est-à-dire 
{[2l6; (316, [4l6}- (3.128) 


3.82 (Irréductibles). 
Les irréductibles sont ceux qui ne sont ni inversibles ni produit de deux éléments non inversibles. 
Les non inversibles sont : 


{10l6, (216, (316, [4l6}- (3.129) 


Ils sont candidats à être irréductibles. Les produits de ces éléments (on oublie les crochets) sont : 


DNA (3.130a) 
230 (3.130b) 
SNA = (3.130c) 
SR i=S (3.130d) 
Sd 3.130e) 

) 


4x4=4. 


Donc [0]6, [2]6, [3]6 et [4]6e ne sont plus candidats à être irréductible. Bref, il ne reste aucun 
candidats. 


L’anneau Z/6Z n’a aucun élément irréductible. 
NORMooAXOUKooAQMXoB 


3.83 (Éléments premiers). 
Les éléments non nuls et non inversibles sont 2, 3 et 4. 


(1) Pour 2 L'élément [2]6 divise 2, 4 et 0. 
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— Les (a,b) tels que ab = 2 sont : (1,2), (2,4) et (5,4). L'élément 2 divise donc toujours 
a ou b. 
— Les (a,b) tels que ab = 4 sont : (1,4), (2,5) et (4,4). L'élément 2 divise donc toujours 
a ou b. 
— Les (a, b) tels que ab = 0 sont : (0,x), (3,2) et (4,3). L'élément 2 divise donc toujours 
a ou b. En particulier, [2]6 divise [0]6 ; c’est important. 
Donc [2]6 est un élément premier. 
(2) Pour 3 L'élément [3]6 divise 3 et 0. 
— Les (a, b) tels que ab = 3 sont : (1,3) et (3,5). L'élément 3 divise donc toujours a ou b. 
— Les (a, b) tels que ab = 0 sont : (0,x), (3,2) et (4,3). L'élément 3 divise donc toujours 
a ou b. 
Donc [3]6 est un élément premier. L'élément [4]6 divise 4, 2 et 0. 


— Les (a,b) tels que ab = 4 sont : (1,4), (2,5) et (4,4). L'élément 4 divise donc toujours 


a ou b. 

— Les (a,b) tels que ab = 2 sont : (1,2), (2,4) et (5,4). L'élément 4 divise donc toujours 
a où b. 

— Les (a, b) tels que ab = 0 sont : (0,x), (3,2) et (4,3). L'élément 4 divise donc toujours 
a ou b. 


Donc [4]6 est un élément premier. 


Au final, les éléments premiers dans Z/6Z sont 


{L216: [316 [Al6}. (3.131) 


Vous noterez que Z/6Z a des éléments premiers non irréductibles. Cela est un contre-exemple 


à la proposition 3.73 dans le cas d’un anneau non-intègre. 
LEMooZSELooGOFEIz 


Lemme 3.84 ([1|). 
L'anneau Z/6Z est noetherien, mais ni intègre ni principal. 


Démonstration. Comme c’est un anneau fini, toute suite croissante de quoi que ce soit devient 
stationnaire ; donc Z/6Z est noetherien. 

Puisque Z/6Z a des diviseurs de zéro, il n’est pas intègre. Et s’il n’est pas intègre, il n’est pas 
factoriel non plus. 


ExeDufyZI 
Exemple 3.85. 
Prouvons que Z[iv2] est un anneau euclidien. Pour cela nous démontrons que 


N:Z{iv2] - N Eq0ZUooZfl 
a+biv2r a? + 2b° 
est un stathme euclidien. 


Soient z = a + biy/2, t = a! + b'iÿ2. Nous cherchons q et r tels que la division euclidienne 
s’écrive z = qt + r. Soient «à, B € À tels que 


- = a + Biv2. (3.133) 


Nous désignons par a+ € et (3+ €2 les entiers les plus proches de à et 3. Nous avons [e|, [eo] < à. 
Nous posons alors naturellement 


q=(a+e) +(B+e)iv2 (3.134) 


28. Toutes les définitions dans le thème 6. 
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et nous calculons r = z — qt: 
2b'e2 — a'ei + iV2(e0 — a'e2). (3.135) 


Nous trouvons 3 3 
N(r) = ae? + 4b°?e2 + 2a/2e? + 2h72 < LE + 0 (3.136) 


D'autre part N(t) = a’? + 2b/?, et nous avons donc bien N(r) < N(t). 
En ce qui concerne la seconde propriété du stathme, un petit calcul montre que 


N(zt) = (a? + 2b?)(a°? + 2b?), (3139) 
et tant que t £ 0 nous avons bien N(zt) > N(z). A 


Notons en particulier que Z[iv2] est factoriel et principal. 

ExlugIkE 
Exemple 3.86 (Décomposition en facteurs irréductibles dans Z[iy2]). 
Les éléments inversibles de Z[iV2] sont +1, donc deux éléments a et b sont associés (définition 3.51) 
si et seulement si a = +b. 

De plus si p est irréductible ?, alors —p est irréductible. Les éléments irréductibles de Z[iv2] 
arrivent donc par pairs d'éléments associés. Soit {p;} une sélection de un élément irréductible parmi 
chaque paire. Tout élément x de Z[iv2] peut alors être écrit x = +pft...p£r. Cette écriture va 
être pratique pour comparer des décompositions en facteurs irréductibles d'éléments. PA 


Le lemme suivant fait en pratique partie de l’exemple 3.89, mais nous l’isolons pour plus de 


clarté °0, 
LemTScCIv 


Lemme 3.87. 
Si a et b sont deux éléments premiers entre eux de ZliV2], et si il existe y € Z[iv2] tel que ab = y, 
alors a et b sont des cubes (dans Z[iv2]). 


Démonstration. D’après l'exemple 3.86 nous pouvons écrire 


den sir (3.138a) 
en TT (3.138b) 
b= +p}t. pr (3.138c) 


où les p; sont les irréductibles de Z[iy2] « modulo +1 » au sens où la liste des irréductibles est 
{p;} LU {—pi} (union disjointe). Étant donné que a et b sont premiers entre eux, a; et B; ne peuvent 
pas être non nuls en même temps alors que leur somme doit faire 30;. Nous avons donc pour chaque 
i soit à; = 30; soit BB; = 30; (et bien entendu si o; = 0 alors à; = B; = 0). 
Étant donné que +1 sont également deux cubes, a et b sont bien des cubes. 
Notons que nous avons utilisé de façon capitale le fait que Z[iv2] était factoriel. 


3.6.1 Équations diophantiennes 


ExZPVFooPpdKJc 
Exemple 3.88. 
L’équation diophantienne 
x? = 3y° +8 (3.139) 
n’a pas de solution. En effet si nous prenons l’équation modulo 3 nous obtenons 
[x?13 = [3y° + 8] = [8l3 = [2]3. (3.140) 
Or dans Z/3Z, aucun carré n’est égal à deux : 0? = 0 Z# 2, 1? = 1 £ 2 et 2? = 4 = 1 Z 2. PA 


29. Définition 1.185 
30. Merci à Marvoir pour m'avoir souligné le manque. 
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ExmuQisZU 
Exemple 3.89. 
Résolvons l’équation diophantienne 
x? +2 = y. (3.141) 


Une première remarque est que x doit être impair. En effet si x = 2k, nous devons avoir y° 
pair. Mais un cube pair est divisible par 8. Donc y° = 81 pour un certain /. L’équation devient 
4k? +2 = 8l, c'est-à-dire 2k? + 1 = 41. Le membre de gauche est impair tandis que celui de droite 
est pair. Impossible. 

Nous pouvons écrire l'équation sous la forme æ? +2 = (x +iv2)(x — iV2). Et nous considérons 
Z[iv2] muni de son stathme N donné par (3.132). 

L'élément iV2 est irréductible parce que N(iv2) = 2, et si nous avions iV2 = pq, alors nous 
aurions N(p)N(q) = 2, ce qui n’est possible que si N(p) ou N(q) vaut 1. 

Nous prouvons maintenant que les éléments x + iV2 et x — iV2 sont premiers entre eux. 
Supposons que d soit un diviseur commun ; alors il divise aussi la somme et la différence. Donc d 
divise à la fois 2x et 2142. 

Étant donné que i2 est irréductible et que 2i2 = (—iv2}, les diviseurs de 2i12 sont les 
puissances de (—iy2). Alors nous devrions avoir d = (iy2)° et donc 


x = (iV2)q (3.142) 


pour un certain q € Z[iv2]. Dans ce cas nous avons N(x) = 2° N(q), mais nous avons déjà précisé 
que x ne pouvait pas être pair, donc 8 = 0 et nous avons d = 1. 
Comme les nombres x + iÿ2 sont premiers entre eux et que leur produit doit être un cube, ils 


doivent être séparément des cubes (lemme 3.87). Nous devons donc résoudre séparément x +2 = 


y° 


Cherchons les x et y entiers tels que x + iV2 = y°. Si nous posons z = a + biy2, il suffit de 
calculer 2° : 


| Sage Version 4.8, Release Date: 2012-01-20 | 
| Type notebook() for the GUI, and license() for information. | 


sage: z=atl*sqrt(2)*b 
sage: (z**3) .expand() 
3*I*sqrt(2)*a"2*xb - 2*Ixsqrt(2)*b73 + a°73 - 6+*a*b”2 


En identifiant cela à x + i/2 nous trouvons le système 


{ x = a — Gab? (3.143a) 
1 = 3a7b — 2h (3.143b) 


où, nous le rappelons, x, a et b sont des entiers. La seconde équation montre que b doit être 
inversible : b(3a? — 2b?) = 1. Il y a donc les possibilités b = +1. Pour b = 1 l'équation devient 
3a? — 2 = 1, c’est-à-dire a = +1. Pour b — —1 l’équation devient 3a? — 2 = —1, impossible. En 
conclusion les possibilités sont 


(x, 2) = (—5,1 + iV2) (3.144a) 
(x, 2) = (5, —1 + iV2) (3.144b) 
(3.144c) 


Le travail avec x — iV/2 donne les mêmes résultats. 
Les deux solutions de l'équation x? + 2 = y° sont alors (5,3) et (—5,3). A 
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3.6.2 Triplets pythagoriciens et équation de Fermat pour n = 4 


Définition 3.90. 
Les solutions entières (positives) de l'équation x? + y? = 2? sont appelés triplets pythagoriciens. 


Ils donnent toutes les possibilités de triangles rectangles dont les côtés ont des longueurs en- 
tières. 


Définition 3.91. 
On dit qu’un triplet pythagoricien est primitif si les trois nombres sont premiers dans leur en- 
semble}. 


Remarquons que c’est équivalent à montrer que les trois nombres sont premiers deux à deux : 
en effet, si deux parmi x, y et z sont divisibles par un nombre, alors tous les trois sont divisibles 


par ce nombre *?, donc les nombres x, y et z sont premiers deux à deux. 
LemTripletsPythagoriciensPrimitifs 


Lemme 3.92. 
Dans un triplet pythagoricien primitif (x, y, z), on a toujours z impair et : 


— soit x impair et y pair; 


— soit x pair et y impair. 


Démonstration. Remarquons que le fait d’imposer que le triplet soit primitif, interdit aux nombres 
x et y d'être pairs en même temps. En effet, si c'était le cas, alors x? et y? seraient aussi pairs, 
donc leur somme 2? aussi, d'ou z serait pair et les trois nombres ne seraient pas premiers entre 
eux. 

Nous montrons à présent que les nombres x et y ne sont pas tous les deux impairs. Par l’absurde, 
si x = 2a + 1, nous avons x? = 4a? + 4a + 1 € [1]4; de la même manière, y? € [1]4. On en déduit 
alors que 2? = x? + y? € [2]4. Le nombre 2? est donc pair, donc z est pair : disons z = 2c. 
Alors, 2? = 4c? € [0]4. Comme les classes modulo 4 sont disjointes, nous aboutissons à une 


contradiction. 


PropXHMLooRnJKRi 
Proposition 3.93 (Triplets pythagoriciens[112, 113]). 


. % 3 . 2 2 _ 2 . . . + 
Un triplet (x, y, 2) € (N*) Sea oo is 2” si et seulement si il existe de Netu,velN 


* 


premiers entre eux tels que 


x = d(u? — v?) (3.145a) 
y = 2duv (3.145b) 
z = du? + v?) (3.145c) 
SUBEQSooRQKBooCBsqYA 
ou | 
x = 2duv (3.146a) 
y = d(u? — v?) (3.146b) 
z = d(u? + v?) (3.146c) 


La différence entre les deux est seulement d’inverser les rôles de x et y. 


Démonstration. Montrons d’abord que les formules proposées sont bien des solutions ; nous véri- 
fions (3.145) : 
a? + y? = du? — v°)? + Ad u?v? = du? + v°}?, (3.147) 


qui correspond bien au 2? proposé. 

Une vérification du même style fonctionne pour (3.146). 

Nous allons maintenant prouver la réciproque : toute solution est d’une des deux formes propo- 
sées. Déterminer les triplets primitifs suffira parce que si (x,y,z) n’est pas une solution primitive, 


31. Définition 1.254. 
32. Parce que k et k? ont les mêmes facteurs premiers. 
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alors en posant k = pgcd(x, y, 2), le triplet (2, ns 2) est primitif. Connaissant les triplets primitifs, 


nous obtenons tous les autres par simple multiplication. 
Soit donc (x,y,z) un triplet pythagoricien primitif. Sans perte de généralité , grâce au lemme 
3.92, nous pouvons supposer x pair tandis que y et z seront impairs. Comme x? — (z + y)(z — y), 


nous avons 
zx 1 


2 
(5) =se+ne- 9). (3.148) 
Puisque z et y sont premiers entre eux, les nombres z + y et z — y sont également premiers entre 

ux %, Vu que (2+y)(z— y) est divisible par 4, soit z+ y soit (z2— y) est divisible par 4. Pour fixer 
les idées nous supposons que c’est z + y, et nous écrivons 


é) = (+) (2 — y). (3.149) 


Les facteurs premiers (qui arrivent au moins au carré) de (x/2) sont chacun soit dans (2 + y)/4 
soit dans (2 — y). Tout deux sont donc des carrés parfaits. Nous posons 


+ —u, z2—y= 02. (3.150) 


Bien entendu u et v sont non nuls parce que nous avons exclu la possibilité de triplets dont un 
élément serait nul. Avec tout cela nous avons (x/2)? = u?v? et donc x = 2uv puis par somme et 
différence : 


d= uv (3.151a) 
y = v? — vw? (3.151b) 
z = u? + v?, (3.151c) 


ce qu'il fallait. 


Remarque 3.94. 

Les solutions dans lesquelles x, y ou z sont nuls sont faciles à classer. La solution (1,0,1) n’est 
pas dans les formes proposées. En effet elle ne peut pas être de la première forme : avoir y = 0 
demanderait qu’un nombre parmi d, u et v soit nul, ce qui est interdit. La solution (1,0, 1) ne peut 


pas non plus être de la seconde forme parce que x y est pair. 
propFKKKooFYQcxE 


Proposition 3.95 ([112]). 


Les équations x + y* = 2 etr2 + 7e = 34 


n'ont pas de solution dans (N*)°. 


Démonstration. Si la première équation n’a pas de solution, alors la seconde n’en a pas non plus 
parce que z{ est un carré. Nous nous concentrons donc sur l’équation x4+* = 2? et nous supposons 
qu’il existe au moins une solution dans (N*). Nous en choisissons une (x,y,z) avec z minimum 
(les z dans différentes solutions étant dans N, il en existe forcément un minimum *). Du coup, 
les trois nombres x, y et z sont premiers dans leur ensemble parce qu’une division par leur pgcd 
donnerait une nouvelle solution qui contredirait la minimalité de z. 

Nous posons x? = x? et y? = ÿ°. Ils vérifient l'équation #? + ÿ? = z° et par la proposition 3.93, 
il existe u, v e N* premiers entre eux tels que, sans perte de généralité *, on ait 


g—'uv (3.152a) 
FKKKooïFY E1 

SE (3.152b) 
FKKKooïFY 

PE RS D (3.152c) 


33. En échangeant les rôles de x et y ici, nous obtenons à la fin la seconde forme des solutions. 

34. Si z — y = kn et z + y = km, faisant la somme et la différence on voit que y et z sont divisibles par k. 
35. Voir quelque chose comme le lemme 1.139. 

36. En inversant les rôles de x et y au besoin. 
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Si u est pair, alors v est impair (et inversement) parce que pgcd(u, v) = 1 Si u est pair, alors u = 2a 
et vu = 2b + 1, ce qui donne ÿ = 4a? — 4b? — 4b — 1 € [—-1]4. Or nous avons déjà vu qu'un carré est 
dans [0]4 ou dans [1]4. Il faut donc que uw soit impair. Le lemme 3.92 implique alors que v soit 
pair. 

De l'équation 3.152b, nous en déduisons que v? + ÿ = uw? ; de plus u?, v? et ÿ sont premiers 
dans leur ensemble : en effet, u et v sont premiers entre eux, et si l’un parmi w? et v? a un facteur 
commun avec ÿ, alors l’autre doit l’avoir aussi (dans une égalité a + b = c, si deux des nombres 
ont un diviseur commun, le troisième l’a aussi). Comme ÿ = y”, le triplet (v,y,u) est un triplet 
pythagoricien primitif. Nous appliquons de nouveau la proposition 3.93, en se souvenant que v est 


_. ; : eqnFKKKooFYQcxE3 
pair : il existe donc deux nombres r et s premiers entre eux tels que | 


v = 2rs (3.153a) 
y=r —s (3.153b) 
u = r? + s?. (3.153c) 


Avec cela, Z = 2uv = 4rs(r? + s?). Remarquons que les trois nombres r, s et r? + s? sont premiers 
entre eux dans leur ensemble; or, comme x est un carré ces nombres doivent séparément être des 


CaITÉS : 
r = (3.154a) 
s = f? (3.154b) 
r? + 82 = p2. (3.154c) 


En mettant les deux premiers dans la troisième équation, nous avons a*+ 6% = +?. Donc (a?, 2,7) 
est une solution. Nous allons montrer que y < z, ce qui terminera la preuve, puisque z était supposé 
minimal. Nous avons : 


z = uw? +? par 3.152c 
= 7? + 5? + 4r°s? par 3.153 
= y? + 4r?s°? 
np 


et a fortiori y < z. 


3.7 Polynômes à coefficients dans un anneau commutatif 
BEMooXHMBOoMBEEEN 

Lemme 3.96. 

Nous considérons un polynôme P € AÏX1, et le quotient A[X|]/(P). Pour tout polynôme Q € A[X] 

nous avons les égalités 


Q(X) = Q(X) = Q. (3.155) 


Démonstration. Si Q = a; XF, alors par la linéarité de la prise de classes, 
k 
= TE E XQRM 
Q=SuXE. 200XQR oo IAE 
k 


Nous insistons sur le fait que cette égalité n’est rien d’autre que l’itération de la définition de la 
somme dans l’espace quotient : Z + ÿ = x + y ainsi que du produit kx = kx (définition 1.180). 
Toujours par définition du produit appliqué à l'élément X nous avons (X)? — X? ; par récurrence 
XF = XÉ , Et 
Q = a X" = Q(X). (3.157) 
k 


Le fait que Q = Q(X) n’est rien d’autre que le fait que dans A[X] nous avons Q = Q(X), 
comme expliqué dans le lemme 1.359. 
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3.7.1 Monômes 


3.97. 
Les éléments de la forme ÀXŸ avec À € À et ke IN sont des monômes. 
Nous allons aussi considérer 


An[X] = {P € AÏX] tel que deg(P) < n}. (3.158) 


Cet ensemble est un sous-module libre. 


3.7.2 Évaluation 


Soit P e A[X]. À priori, P n’est qu’une suite dans À indexée par N. 
Nous avons déjà défini son évaluation sur un élément « € À dans la définition 1.355 : 


P(a) = D aa. (3.159) 
k 
Cette somme est toujours finie. 
NORMooQFTJooLBcPxl 

3.98. 
L'ensemble A[X] est une algèbre et donc un espace vectoriel. Il possède un unique élément nul 
qui est celui dont tous les coefficients sont nuls; cela est immédiat par la construction en tant que 
suites presque nulles. 


Il n’y a à priori pas équivalence entre le fait d’être un polynôme nul et le fait de s’évaluer à 


zéro sur tous les éléments de À. Cela sera discuté dans le théorème 6.110 et l’exemple 19.34. 
DEFooRFBFooKCXQsv 


Définition 3.99. 
Soient un anneau À et un anneau B qui contient A (comme sous-anneau). Pour à € B nous 
définissons A[a]g comme étant l'intersection de tous les sous-anneaux de B contenant À. 


Comme dit plus haut, nous nous permettons d'écrire A[a] sans préciser B lorsque ce dernier 


sera clair dans le contexte. 
PROPooPMNSoo0UkHOxJ 


Proposition 3.100. 
Soient un anneau À et un anneau B qui contient A (comme sous-anneau). Pour tout à € B nous 
avons 


Ala] = {P(a) tel que PE A[X]} (3.160) 


où encore une fois, P(a) est calculé dans B ; le contexte est clair là-dessus. 


Démonstration. Si 4’ est un sous-anneau de B contenant À et à, alors 4’ contient tous les P(a) 
avec P € A[X|. Nous avons donc 
{P(a) tel que P e A[X]} € Afal]. (3.161) 


Par ailleurs, {P(a) tel que P € A[X]} est un sous-anneau de B contenant À et a. Donc A[al] y est 
inclus. 


3.7.3 Polynômes sur un anneau intègre 
ThoBUEDrJ 


Théorème 3.101. 
L'anneau À est intègre si et seulement si A[X] est intègre. 


Démonstration. Soient P et Q des éléments non nuls de A[X]. Puisque l’anneau À est intègre, 
nous avons 


deg(PQ) = deg(P) + deg(Q) (3.162) 


et le produit ne peut pas être nul. L’anneau A[X] est donc intègre. 
Si A[X] est intègre, À est intègre parce qu’il peut être considéré comme sous-anneau de A[X|. 
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3.102. 
Si À n’est pas intègre, soient «, 5 € À non nuls tels que «8 = 0. Le produit des polynômes X + aX 
et X + Best (aX) : (B) = 0; le degré du produit n’est pas la somme des degrés. 

Les personnes qui ont tout compris jusqu'ici remarqueront que la notation « X + P(X) » 
n'est pas correcte parce que du point de vue que nous adoptons ici, un polynôme n’est pas une 
application. 


Corolaire 3.103. 
Si À est intègre, les inversibles de A[X] sont les éléments inversibles de A. 


Démonstration. Pour que Q soit inversible, il faut un P tel que PQ = 1. Mais l’anneau À étant 
intègre, les degrés s’additionnent. Par conséquent ils doivent être de degré zéro et il faut que 
P,Q € À. Donc Q est un inversible de À. 


3.7.4 Division euclidienne 


Le théorème suivant établit la division euclidienne dans A[X] du polynôme P par un poly- 


nôme D. 
ThodivEuclPsFexf 


Théorème 3.104. 
Soit D # 0 dans A[X] de coefficient dominant inversible dans A. Pour tout P € AÏX|], il existe 
Q,R € A[X\| tels que 

P=QD+R (3-163) 


avec deg(R) < deg(D). 


Les polynômes Q et R sont déterminés de façon univoque par cette condition. 
DefMPZooMmMymG 


Définition 3.105. 

Le polynôme Q est le quotient et R est le reste de la division euclidienne de P par D. Si le reste 
de la division de P par D est nul on dit que D divise P et on note D | P. Autrement dit D divise 
P si il existe Q tel que P = QD.*' 


3.106. 
Le théorème 3.104 nous incite à utiliser le degré comme stathme euclidien sur A[X] dès que À est 
un anneau intègre. Or cela ne fonctionne pas en général, parce que très peu de polynômes ont à 


priori un coefficient dominant inversible. 
LEMooIDSKooQfkeKp 


Lemme 3.107 (Thème 18). 
Si K est un corps ®, alors l'anneau K[X] est euclidien et principal. 


Démonstration. Puisque K est un corps, tous les éléments sont inversibles et le degré donne un 
stathme par le théorème 3.104. L’anneau K[X] est donc euclidien et par conséquent principal 
(proposition 1.247). 


Dans le théorème 6.43 nous donnerons une preuve directe du fait que K[X] est principal en 
montrant que tous ses idéaux sont principaux. Nous y démontrerons donc un peu moins pour un 


peu plus cher, mais avec le plaisir de ne pas devoir passer par un stathme. 
DefDSFooZVbNAX 


Définition 3.108 ([114]). 

Soit un anneau À. Deux polynômes P et Q dans A[X] sont dits étrangers entre eux si 1 est un 
pgcd* de P et Q. Un ensemble de polynômes (P;)ier est étranger dans leur ensemble si 1 est 
un pgcd des P;. 


37. Ceci se rapproche tout naturellement des notions générales de divisibilité dans un anneau intègre, vues en 
sous-section 3.4.1. 

38. Définition 1.202. 

39. Définition 1.182. 
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Les polynômes P et Q sont premiers entre eux si les seuls diviseurs communs de P et Q 
sont les inversibles. 


Les notions de polynômes étrangers entre eux ou de polynômes premiers entre eux ne sont pas 
identiques, comme le montre l’exemple suivant. 


Exemple 3.109 ([1]). 

Soient dans Z[X] les polynômes P(X) = 2X +2 et Q(X) = 2X? +2. Le nombre 2 est diviseur 

commun et n’est pas un diviseur de 1. Donc 1 n’est pas un pgcd de P et Q. Ils ne sont pas étrangers. 
Mais ils sont premiers entre eux parce qu’ils n’ont pas d’autres diviseurs communs que les 

inversibles (1 et —1). Pa 


3.7.5 Polynôme primitif 


DefContenuPolynome 
Définition 3.110. 
Un contenu du polynôme P = Y;;a;X*°Ee K[X1] est un pgcd de ses coefficients : c(P) = pgcd (ar). 
NORo0oQ1ITDooKsTMKm 
3.111. 
Quand il y a unicité du pgcd d’un ensemble, on peut parler du contenu au singulier. 
Le contenu d’un polynôme sera surtout utilisé juste pour savoir si il est inversible ou non. Dans 
un anneau intègre, ça demande un peu d’abus de langage, mais comme le lemme 1.196 dit que 
si un pcgd est inversible, ils le sont tous, au moins discuter de l’inversibilité du contenu dans un 


anneau intègre a un sens et est bien défini. 
DEFooDVOUooKaPZQC 


Définition 3.112 (Polynôme primitif[115]). 
Il existe deux notions de polynômes primitifs. Vu qu'il existe des anneaux unitaires qui sont des 
corps finis, il faut faire attention au contexte. ITEMooCNHAoOVfIYEW 
(1) Si À est un anneau unitaire, P est un polynôme primitif c(P) est inversible“!. 
(2) Si K est un corps fini, un polynôme dans K[X] est primitif si il est le polynôme minimal 
d’un générateur du groupe commutatif du corps. 


3.113. 
Pour rappel, il y a plusieurs façons de périphraser le fait que les coefficients soient premiers entre 
eux. Nous pouvons dire ..…. 


(1) Le pgcd de ses coefficients est 1 parce que c’est la définition 1.252 pour avoir des nombres 
premiers entre eux. 


(2) Le contenu de ses coefficients est 1. Parce que le contenu est précisément le pgcd, défini- 
tion 3.110. 


La notion de polynôme primitif au sens du pgcd est particulière aux polynômes à coefficients 
dans un anneau comme le montre le lemme suivant. 


Lemme 3.114. 
Si K est un corps, tout polynôme unitaire dans K[X] non nul est primitif au sens du pgcd. 


Démonstration. Un polynôme unitaire à un 1 parmi ses coefficients, donc le pgcd est forcément 
1. 


Lemme 3.115 ([116]). 
Soit un anneau factoriel*? A. Soient des polynômes primitifs P, et P> dans A[X]. Soient a, a2 € 
A* tels que 

aP; — a2P2. (3.164) 


40. Je pense à Z/n7Z, mais faites attention, j'ai pas vérifié. Écrivez-moi pour me dire si c'est un bon exemple. 

Al. Pas mal d’auteurs disent que c(P) soit être égal à 1. Mais en général ces auteurs se rétractent bien vite en 
disant que c(P) n’est définit qu’à inversible près. Voir aussi 3.111. 

42. Définition 3.61. Je rappelle qu’un anneau factoriel est toujours commutatif. 
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Alors 
(1) Les éléments ai et a2 sont associés dans À. 


(2) Les polynômes Pi et P2 sont associés dans A[X]. 


Démonstration. Vu que les P; sont primitifs, nous avons c(a;P;) = u;a; où u; est un inversible 
(u; = c(P;)). Les éléments u1ai et u2a2 sont donc deux pgcd du même ensemble : les coefficients 
de a1P; (qui sont les mêmes que ceux de a2P2). Le lemme 3.57 entre en jeu pour dire que ua et 
U2a2 sont associés : il existe un inversible v tel que u1a1 = vu2a2. Au final, a = u, lvupap et nous 
voyons que a1 et a2 sont associés. 

Nous écrivons l'égalité a1 P1 = a2P2 avec la valeur trouvée de a: : u] luuoarP) — a)P>. On 
voudrait simplifier par a2 (surtout que À est commutatif), mais comme a2 n’est pas spécialement 
inversible, il faut le justifier. L’anneau À est intègre; donc l’anneau A[X] l’est aussi (théorème 
3.101). Et comme A[X] est intègre, on peut faire la simplification. 

Au final nous avons u, tvu2P, — P2, et comme u, 'vuy est inversible, P; et P2 sont associés. 

LEMooHJECooTeELgN 


Lemme 3.116 (de Gauss[116]). 


Soit un anneau factoriel A. Soient P,Q € A[X]|. ITEMooISPDooXdRyuE 
(1) Les polynômes P et Q sont primitifs si et seulement si le polynôme PQ MEN É bo LeD1 Fp 


(2) Il existe un inversible u € À tel que (PQ) = uc(P)c(Q). 


Démonstration. En plusieurs parties. 


(1) (1)= Nous supposons que P et Q sont primitifs. Et, par l’absurde, nous supposons que 
PQ n’est pas primitif. Donc c(PQ) n’est pas inversible dans À. Vu que À est factoriel, 
tout élément non inversible est un produit d’irréductibles; c’est le cas de c(PQ). Soit p un 
irréductible entrant dans la décomposition de c(pQ). 


Le lemme 3.64 dit que l’anneau B = A/pA est intègre *. 
Considérons la surjection canonique tm: À — B que nous prolongeons en un morphisme 
d’anneaux 


: A[X] — B[X] 


Notons que p ne divise pas tous les coefficients de P. En effet, sinon c(P) serait un multiple 
de p (proposition 3.65) et ne pourrait pas être inversible. Donc (P) £ 0 dans B[X]. De 
même nous savons que ®(Q) 0. 
L’anneau B est intègre parce que À est intègre (proposition 3.101). Donc 9(P)6(A) 0, et 
comme est un morphisme, (PQ) Æ 0, ce qui signifie que p ne divise pas tous les coefficients 
de PQ, ce qui est contraire à l'hypothèse de l’absurde. 
Nous en déduisons que c(PQ) n’est pas inversible, et donc que PQ est primitif. 

(@) Ge 
Nous supposons que PQ est primitif, et nous montrons que P et Q le sont. En factorisant un 
pgcd des coefficients de P nous pouvons écrire P = c(P)P; avec Pi primitif (lemme 1.198). 
Par la partie précédente nous savons que PQ; est primitif. Nous avons donc l'égalité 


PQ = c(P)c(Q)P1Q: (3.166) 


où à la fois PQ et PP: sont primitifs. Vu que PQ est primitif, c(P)c(Q)P1Q1 est primitif, 
de telle sorte que “* 


c(c(P}(Q)P1Q1) = e(P)e(Qe(P1Qù) (3.167) 


43. Ici, ma source [116] précise que p est premier. C'est vrai par la proposition 3.63, mais ça me semble inutile. 
Écrivez-moi pour me dire si le fait que p soit premier est important. 
44. Utilisation du lemme 1.197. 
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est inversible. Vu que c(P1Q:) est également inversible, nous en déduisons que c(P)c(Q) est 
inversible. Si u € À vérifie c(P)c(Q)u = 1, alors c(Q)u est un inverse de c(P). De même 
uc(P) est un inverse de c(Q). Bref, ils sont inversibles et les polynômes P et Q sont primitifs. 


(3) Pour (2) 
Soient P,Q € A[X]. Nous considérons les polynômes primitifs P1, Q1 et R1 définis par P = 
c(P)P1, Q = «(Q)Q1 et PQ = c(PQ)R:1. Nous avons 


c(P)c(Q)P1Q1 = PQ = c(PQ)R4. (3.168) 

En prenant le contenu des deux côtés nous avons 
c(c{P)(Q)P1Q:) =: c({PQ)R:), (3.169) 

et en tenant compte du lemme 1.197, cela devient 
c(P)c(Q)c(P1Q1) = c(PQ)c(R1) (3.170) 
où les éléments c(P1Q:1) et c(R1) sont inversibles. En posant u = c(P1Q1)-!c(R1), nous avons bien 
cPe(Q) = ul PO). (3.171) 


3.117. 
Dans toute la démonstration, il y a une ambiguïté entre c(P) qui serait le pgcd des coefficients de 
P, c’est-à-dire un ensemble et c(P) qui serait un représentant de cet ensemble. 

Grâce au lemme 1.199, nous savons que si Ô est un pgcd et si u est inversible, alors u est un 
pgcd. Donc à partir de l’équation 


c(P)c(Q) = uc(PQ), (3172) 
en fait nous savons qu’il existe des représentants de c(P), c(Q) et c(PQ) tels que 
c(P)e(Q) = c(PQ). (3.173) 


3.7.6 Racines des polynômes 


Définition 3.118 (Ordre d’un polynôme). 
Soit P un polynôme irréductible® de degré n sur F,[X]. L'ordre de P est 


min{k tel que P | X° — 1}. (3.174) 


Définition 3.119. 
Soient À un anneau et P € AÏX]. On appelle racine un élément a € À tel que P(a) = 0; c’est- 
à-dire que, en remplaçant toutes les occurrences de X par à dans l'expression de P, on obtient 


0. 
PropHSQooASRbeA 


Proposition 3.120. 
Soient À un anneau et P un polynôme non nul dans A[X]. Si a € À est une racine de P alors 
X — a divise P, et réciproquement. 


Démonstration. Nous notons le polynôme u = X — à par analogie avec le polynôme minimal dont 
il sera question dans la très semblable proposition 6.100. Le sens réciproque est clair : si u divise 
P, alors a est racine de P. 

Pour le sens direct, remarquons que si & est racine de P, alors P est de degré au moins égal à 
1, et nous pouvons donc effectuer la division euclidienne * de P par y : il existe des polynômes Q 


et R tels que 
P=QOu+R SR 


45. Définition 1.185. 
46. Théorème 3.104. 
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avec deg(R) < deg(y). Donc R est une constante, élément de À : appelons-le a. En évaluant (3.175) 
en @, il vient 


0 = P(a) = Q(a)u(a) + a, (3.176) 


et nous en déduisons que a = 0, ce qui montre que P = Qu et que u divise P. 


DEFooTGZYooCYiKQa 
Définition 3.121 (Racine simple et multiple d’un polynôme). 
Soit À un anneau ainsi qu’un polynôme P € A[X] et a € A racine de P. La multiplicité de a par 
rapport à P est l’entier h tel que P est divisible par (X — a)" mais pas divisible par (X — a)"+. 
Nous noterons 04(P) la multiplicité de à par rapport à P. 
Si la multiplicité d’une racine est égale à 1, nous disons que c’est une racine simple. Sinon, 
c’est une racine multiple. 


3.122. 
Pour une définition générale d’une racine simple de l’équation f(x) = 0, voir la définition 34.50. 
La proposition 3.120 nous indique que toute racine est de multiplicité au moins égale à 1. 


LEMooZUUVooQgsdXs 
Lemme 3.123. 
Soient un anneau À ainsi que x,r € À. Nous avons 
n—1 
a —r" = (x-7r) > NE (3.177) 
k=0 
Démonstration. Nous effectuons la distribution, et nous calculons un peu : 
n—1 n—1 n—1 
(x—7r) > af k = PME LUE > SA Mn (3.178a) 
k=0 k=0 k=0 
n n—1 
=D arte York (3.178b) 
k=1 k=0 
n—1 
= —7 + .. LR A (3.178c) 
k=1 
pre, (3.178d) 
PROPooQCZSooVokxXQ 


Proposition 3.124 ([117]). 
Soient un anneau À, un polynôme P € A[X] de degré n, ainsi qu’une racine à € À de P. Alors ü 
existe un polynôme Q € A[X] de degré n — 1 tel que P = (X — a)Q. 


Démonstration. D'après le lemme 3.123, pour chaque k, nous avons 2% — rË = (x —r)S;(x) où S4 
est un polynôme de degré k — 1 (ou moins). 
Soit un polynôme P tel que P(a) = 0. Nous pouvons écrire 


P(x) = P(x) — P(a) (3.179a) 
= agr — ÿ aa” (3.179b) 
k=0 k=0 
= > ag(x* — a) (3.179c) 
k=1 
: ; ak(x — a)S}(x) (3.179d) 
k=1 
= (x—a) ÿ aSx(x) (3.179e) 
k=1 


= (x —-a)Q(x) (3.179f) 
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où Q est le polynômde de degré n — 1 donné par Q = YF, ag. 
PropahQQpA 

Proposition 3.125. 

L'élément à € À est une racine de multiplicité" h du polynôme P si et seulement si il existe 

Q € A[X] tel que P = (X — a)}Q avec Q(a) # 0. 

Démonstration. Par définition de la multiplicité de a, le polynôme P est divisible par (X — a)" 


mais pas par (X — a)"*1, Il existe donc un polynôme Q tel que 
P=(X-a)Q. (3.180) 


Si Q(a) était nul, la proposition 3.124 nous dirait que Q = (X — a)S pour un cetain polynôme S. 
Cela ferait P = (X — a)"+1$, ce qui est contraire à l'hypothèse sur la multiplicité. 


LemleLhpc 
Lemme 3.126. 
Soient P et Q des polynômes non nuls de A[XT] et a € À. Alors 
(1) 8a(P + Q) < min{8,(P),604(Q)}, et l'égalité a lieu si 8(P) Æ 8(Q) ; Thentethpéiv 


2) 0a(PQ) > 0,1p) + 0a(Q), et l'égalité a lieu si À est intègre. 
(P) 


Dans le théorème suivant, la partie importante en pratique est le point (2) parce qu’il dit que, 
lorsque nous cherchons les racines d’un polynôme, nous pouvons nous arrêter lorsque nous en avons 
trouvé autant que le degré, multiplicité comprise. 


ThoSVZooMpNANi 
Théorème 3.127. 
Soit À un anneau intègre et PE A[X]\{0}, un polynôme de degré n. 
(1) Si œ,...,a, € À sont des racines deux à deux distinctes de multiplicités k1,...,k,, alors il 
existe Q € A[X], de degré n — D; k;, tel que 
p 
P=Q]I(X-«)"* (3.181) 
i=1 
et Q(a:) # 0 pour tout i. ITEMooWGOBooGApPOo 


(2) La somme des multiplicités des racines de P est au plus deg(P). 


Démonstration. Si p = 1, soit a une racine de multiplicité k de P. La définition de la multiplicité 
d’une racine nous dit que P est divisible par (X — a)" mais pas par (X — aæ)**!. Donc il existe 
Q € A[X] tel que P = Q(X — a)f. Il reste à voir que Q(a) Æ 0. Cela est une conséquence de la 
proposition 3.120 : si Q(a) était nul, on pourrait lui factoriser (X — «) et donc avoir (X — a)*+l 
qui se factorise dans P, ce qui n’est pas possible. 

Nous supposons que p > 2 et nous effectuons une récurrence sur p. Nous considérons donc les 


p—1 premières racines @1,...,@,-1 et un polynôme R € A[X] tel que R(a;) Æ 0 pour à = 1,...,p—1 
et 
P=(X-oœ)"t...(X- ay 1) 71. (3.182) 
SR —— 
S 


Par hypothèse P(a,) = S(ap)R(ap) = 0. L’anneau À étant intègre, S(a,) # 0 parce que à; # @ 
pour à £ p. Par conséquent, R(a») = 0. 

Nous devons encore vérifier que la multiplicité a, est k, par rapport à R. Pour cela nous 
utilisons le point (2) du lemme 3.126 afin de dire que le degré de a, pour P = SR est k,. Par 
conséquent 

R=(X-a,)®T (3.183) 


47. Multiplicité d’une racine, définition 3.121. 
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avec T(a») 0 et enfin 


P- [IG — œ)T. (3.184) 


De plus T(a;) 0, sinon R(a;) serait nul. 


CORooUGJGooBofWLr 
Corolaire 3.128. 
Un polynôme de degré n sur un anneau intègre possède au maximum n racines distinctes. 


Démonstration. Le théorème 3.127(2) dit que la somme des multiplicités des racines de P est au 
maximum n. Mais la proposition 3.120 dit que toutes les racines ont une multiplicité au moins 
égale à un. Donc il ne peut pas y en avoir plus de n. 


Proposition 3.129 ([118, 119]). 
Soit un anneau intègre et n > 0. Les racines n° de l’unité forment un groupe cyclique dont l’ordre 


divise n. 
LEMooHDJIooPTpUCJ 


Lemme 3.130. 
Soit le polynôme P = X? — 1 sur l'anneau intègre À. Si 1 Z 
+1. 


—1%, alors les racines de P sont 


Démonstration. Le fait que +1 sont racines est le lemme 1.176(1)(4). Puisque par hypothèse 1 Æ 
—1, le corolaire 3.128 termine la preuve. 


CORooZCS0o00HQVAOV 
Corolaire 3.131 (Conséquence du lemme de Gauss[120]). 
Soient À un anneau factoriel et Frac(A) son corps des fractions. Un polynôme non constant P € 


A[X1] est irréductible (sur A) si et seulement si il est irréductible et primitif au sens du pgcd°° sur 
Frac(A)[X|. 


Exemple 3.132. 
Il ne faudrait pas croire qu'être irréductible dans un anneau À implique d’être irréductible dans le 
corps des fractions. En effet soit À = Z[45] et P = X? — X — 1. Nous savons que sa factorisation 


est D (s _” (x —S). (3.185) 


Si vous ne le saviez pas, faites juste le calcul pour vous en assurer. 
Ce polynôme est irréductible sur Z[5] mais pas irréductible sur Frac (Z[V5]). A 


3.7.7 Quelques identités 


LemISPooHIKJBU 

Lemme 3.133 ([1, 121]). 
Quelques identités de polynômes. ItenLTBooAcyMEN 
(1) Sin est impair, alors 1 + X divise 1 + X7. ItenLTBooAcyMtNii 
(2) Pour tout n nous avons X"—1=(X —1)(1+X+...+X%-1), a 


CEE ST de 


Démonstration. Plusieurs points. 


48. Définition 1.193. 

49. À mon avis cette hypothèse n'est pas nécessaire. Et d'ailleurs j'ai un peu du mal à voir des exemples exotiques 
d'anneaux intègres dans lesquels 1 = —1. Il y aurait [0,1] modulo 2, certaines de ses parties, comme 7/27. Et quoi 
d'autre ? 


50. Définition 3.112. 
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(1) Pour (1) Nous allons utiliser le lemme 3.1 avec a = 1, b= —X et r =n—1. Notez que n 
étant impair, r = n — 1 est encore positif. En ce qui concerne le membre de gauche de (3.1), 
nous remarquons que (—X})" = (—1)"X® = — X7, Nous avons donc : 
n—1l è 
1H XT = (ab) D a = (14 X)(..). (3.186) 
k=0 


Cela prouve que 1 + X divise 1 + X7. 


(2) Pour (2) Posons P = X +...+ X"-1, Nous avons XP = P — X + X" et donc 


(X-1)1+P)=X+XP-1-P=X+(P-X+X")-1-P=X"-1 (3.187) 


(3) Pour (3) Déjà fait dans (3.1). 


3.7.8 Générateurs pour le groupe multiplicatif 


PROPooKSCRooPyInSv 


Proposition 3.134 ([122]). 
Si p est un nombre premier, tout sous-groupe de ((Z/nZ)*, ; ) est cyclique®?. 


Démonstration. Soit un sous-groupe H d’ordre |H| = n de (Z/nZ)*. Nous prouvons par récurrence 
sur n que À est cyclique. 


(1) n=1 SiH est un sous-groupe d'ordre 1, alors H = {[1],} et c’est cyclique, pas de problèmes. 


(2) Récurrence Nous supposons que tous les sous-groupes de ( (Z/nZ)* d'ordre plus petit que 


n sont cycliques, et nous prouvons que H est également cyclique. 


Nous allons faire deux cas suivant que n est la puissance d’un nombre premier ou non. 


(2a) Si n = qË Nous supposons que n = q* pour un certain nombre premier q. Nous sup- 
posons aussi, par l’absurde que H n’est pas cyclique. Les éléments de H ont un ordre 
qui divise q} (corolaire 2.14), mais pas d'ordre qg*. Donc pour tout x dans H nous avons 
29 = 1. En particulier le polynôme P = XX°7° 1 a au moins gl racines dans Z/pZ : 
les éléments de H. 


1 


Hélas le degré de P étant g*-!, il ne peut pas avoir plus de g*-! racines distinctes par 


3.127. Contradiction. Donc H est cylcique. 
(2b) Cas général 
Nous supposons que |H| n’est pas la puissance d’un nombre premier. 


(2b.ü) Un morphisme Le corolaire 3.18 nous indique que n = ab pour deux nombres 
a, b tels que pgcd(a, b) = 1. Nous considérons l’application 


J:H—H 


tr x. 


(3.188) 


Étant donné que H est abélien, f est un morphisme de groupes. Tout élément x € H 
vérifie f(x)? = x%Ÿ = 1. Donc 


Image(f) c {ye H tel que y = 1}. (3.189) 


(2b.ü) Ordre du noyau et de l’image Par le coup des racines distinctes de polynôme 


XV — 1, nous avons | Image(f)| < b. De même nous avons 


ker(f) = {x € H tel que x° = 1}, (3.190) 


51. Définition 1.319. 
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(2b.ii) 


et donc |ker(f)| < a. 
Le premier théorème d’isomorphisme 2.6 nous indique que 


H 
ker(f) 


et comme tout est abélien, tous les sous groupes sont normaux 
par le théorème de Lagrange 2.13 que 


= Image(f), (3.191) 


. et nous avons, 


ab = |H| = | ker(f)||Image(f)| < ab. (3.192) 
D CR 
<a < 


Le premier membre est égal au dernier. Donc toutes les inégalités sont des égalités. 
Nous avons donc |ker(f)| = a et | Image(f)| = b. 


Hypothèse de récurrence C’est le moment d’utiliser l'hypothèse de récurrence : 
les groupes ker(f) et Image(f) sont cycliques. Soient des générateurs h et h/. Quel 
est l’ordre de hh!? Le lemme 3.27 nous indique que hh/ est d’ordre ab = n. Donc 
hh' est générateur de H qui est donc cyclique. 


52. « distingué » et « normal » sont synonymes. 
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Chapitre 4 


Espaces vectoriels (début) 


4.1 Parties libres, génératrices, bases et dimension 


Nous avons déjà défini (dans 1.325) un espace vectoriel comme étant un module sur un corps 
commutatif. En explicitant un peu, cela donne ceci[123]. 
Un espace vectoriel sur le corps K est un ensemble E muni de deux opérations : 


— une loi de composition interne +: ExXE—E, 
— une loi de composition externe - :KxE—#Æ 
telles que 
(1) (E, +) soit un groupe abélien, 
(2) pour tout u,ve E et pour tout k,k'e K, 
(2a) k(u + v) = (ku) + (kv) 
(2b) (kk')u = k(k!u) 
(2c) (k+ k')u = (ku) + (k'u) 
(2d) lu=u 
où 1 est le neutre de K et où nous avons directement adopté la notation ku pour k : u. 


Siue E, nous notons —u l'inverse de u dans le groupe (E, +). 

DEFooDLHWooAvfhgc 
Définition 4.1 (Partie libre). 
Si E est un espace vectoriel, une partie À de E est libre si pour tout choix d’un nombre fini 
d'éléments {ui}i-1..n de À, l'égalité 


QU + -°: + Anün = Ù (4.1) 
implique a; = 0 pour tout à (ici les a; sont dans le corps de base). 


Remarque 4.2. 
Notons que le vecteur nul n’est dans aucune partie libre, ne fût-ce que parce que a0 = 0 n’implique 
pas a = 0. 


Si À est une partie de l’espace vectoriel E, nous notons Span(A) l’ensemble des combinaisons 
linéaires finies d'éléments de À. Les coefficients de ces combinaisons linéaires sont dans le corps de 
base K. 


Définition 4.3 (Partie génératrice). 
Une partie B d'un espace vectoriel E est génératrice si Span(B) = E. 


Remarque 4.4. 
Ces définitions demandent des commentaires en dimension infinie |. 


1. Nous n’avons pas encore défini le concept de dimension, mais nous nous adressons au lecteur trop pressé. 
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(1) Tout élément peut être écrit comme combinaison linéaire finie d’une partie génératrice. Cela 
ne signifie pas que nous pouvons extraire une partie finie qui convient pour tous les éléments 
à la fois. Lorsque l’espace est de dimension infinie, ceci est particulièrement important. 


(2) La définition séparée de liberté dans le cas des parties infinies a son importance lorsqu'on 
parle d'espaces vectoriels de dimension infinie (en dimension finie, aucune partie infinie n’est 
libre) parce que cela fera une différence entre une base algébrique et une base hilbertienne 


par exemple. 
DEFooNGDSooEDAwTh 


Définition 4.5 (Base). 


Une base de l’espace vectoriel E est une partie à la fois génératrice et libre. 
NORMooJGRNooAKtvWt 


4.6. 

Supposons que la partie {u,u2,u2} soit une base d’un espace vectoriel E. Un ensemble étant 
quelque chose de non ordonné, la partie {u3,u2,u1} est la même, et {u1,u1,u2,u2,u3, ua} est 
encore la même. 

Lorsque l’ordre dans lequel nous numérotons les vecteurs d’une base est important (par exemple 
pour écrire explicitement la matrice d’une application linéaire), nous devrions écrire (u1,u2,u3). 
Nous pourrions définir le concept de base ordonnée en disant qu’une base ordonnée de ÆE est une 
application u: T1 — E où I est un ensemble totalement ordonné et telle que u(1) soit une base de 
E. 

À partir de là, il ne serait plus autorisé de dire « la matrice de f dans une base ». Il faudrait dire 
« la matrice de f dans une base ordonnée ». Dans ce contexte, une matrice pour une application 
linéaire d’un espace réel serait une application Z x 1 — IR. 

Bref, tout ça pour dire qu’il y a clairement des incohérences de notations à ce niveau dans le 
Frido. Il sera souvent écrit {u1,u2} au lieu de (u1,u2) ou, mieux, u: 1 — R, et il sera souvent dit 
« base » au lieu de « base ordonnée ». 


Nous prouvons à présent que tout élément non nul d’un espace vectoriel possédant une base ? 


se décompose de façon unique en combinaison linéaire finie d'éléments d’une base. 
PROPo0oEIQIooXfWDDV 


Proposition 4.7 ([1]). 
Soient un espace vectoriel E sur K muni d’une base {e;};er. Si v € E, alors il existe un unique 
couple (J,c) où 

(1) J est une partie finie de T ; 


(2) c: J — K est une application 


(3) 0 = Dies (5)e5- 
Les éléments c(i) seront notés v; et sont les composantes de v dans la base. Sous-entendu, on 
prolonge c de J vers I par zéro sur 1\J. 


Démonstration. Soit un espace vectoriel Æ et une base {e;};er où 1 est un ensemble à priori 
quelconque. Soit v € E. Puisque E = Span{e;};er, il existe une partie finie J de I et des coefficients 

{v;};je dans K tels que 
v = >. Vjej. (4.2) 

jeJ 

Cela donne l'existence. 

En ce qui concerne l’unicité, soient J et K° des parties finies de J et des coefficients {v;}jez et 
{wr}kex tels que 
E FKNEoo!ICnVP 
UV — > Vjej = » Wkek. N° 5) 
jeJ keK 


2. Nous n’avons pas démontré que tout espace vectoriel possède une base. Donc à notre niveau, il est possible 
que ce théorème soit sans objet pour beaucoup d’espaces. 
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Nous posons L = J Ü K. Remarquez que les unions suivantes sont des unions disjointes : 


L=(JK)V(JNnK)U(K\V) (4.4a) 
J=(JK)V(JnK) (4.4b) 
K=(KnJ)u(K\J). (4.4c) 


Écrivons 0 = v — v en utilisant les expressions de v de (4.3) et en décomposant les sommes : 


0 — 5 vies — 5 wWkEk (4.5a) 


jeJ keK 
>. de: > Des — . Wpek — Wkek (4.5b) 
jeJ\K jEJnK keKnJ keK\J 
= > U;e; + D fu mes — > Wpek- (4.5c) 
jEJ\K JEJOK keK\J 
Là-dessus, nous posons 
U! si le J\K 
u=iu-uw slteJnkK (4.6) 


— si le K\J. 


Nous avons alors EQooCTWRooZK 
>: ae = 0. da) 


EL 


Vu que {e;};er est libre, la partie {e}x1, est également libre. Donc l’équation (4.7) implique que 
a = 0 pour tout LE L. 
Nous devons prouver que 


{j € J tel que v; {0} = {ke K tel que wx À 0} (4.8) 


et que pour ! dans cet ensemble, w = w. 
Soit j € J'; il y a deux possibilités : soit j € J\K, soit j € J n K. Dans le premier cas nous 
avons déjà vu que à; = v; = 0. Dans le second cas, à; = v; — w; = 0, c’est-à-dire v; = w;. 
Donc j € J vérifiant v; Æ 0 implique j € J n K et l'égalité des coefficients. Idem avec k e K 
tel que wx ZÆ 0 implique ke JN K. 


LEMooDJSIooYcsvh0O 
Lemme 4.8 ([1]). 


Soit un espace vectoriel admettant des bases. Un endomorphisme est une bijection si et seulement 
si il change toute base en une base. 


Démonstration. En deux parties. Soit un espace vectoriel E possédant des bases et un endomor- 
phisme f: E — E. 


(1) Si f est bijective Soit une base {v;};er ; nous devons voir que {f(v;)};er est une base. 


(1a) Libre Si J est une partie finie de I et si les À; sont des scalaires tels que 7 À; f(u;) = 


0, alors 
O= D fl) = FD Au). (4.9) 


jeJ jeJ 


Mais comme f est bijective, cela implique que ÿ;, jeJ Àjvj = 0. En retour, parce que {vi} 


est une base, cela implique que À; = 0 pour tout j. 

(1b) Générateur Soit x € E. Puisque f est bijective, il existe un unique y € E tel que 
x = f(y). Comme {w}ier est une base, il existe une partie finie J € I et des scalaires 
{Aj}jez tels que 


U — >», Àjv;. (4.10) 


jeJ 
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Nous avons alors 


z= f(y)= > Xf(), (4.11) 


jEeJ 
qui montre que { f(vwi)}ier est bien génératrice de E 


(2) Si f change les bases en bases Soit un endomorphisme changeant toute base en une 
base. Nous devons prouver qu’il est bijectif. 


(2a) Injective Nous considérons une base {v;};ey. La partie {f(v;)};er est par hypothèse 
également une base. 
Soient x,y € E tels que f(x) = f(y). Il existe J et K finis dans 7 qui permettent de 
décomposer x et y respectivement dans la base {f(v;)}ier. Quitte à poser J' = JU K, 
nous supposons que J suffit. Il existe donc des scalaires {À;};ey et {u;};ey tels que 


T = Djeg Ajf(v;) et y = deg Hjf(v5). 
La relation f(x) = f(y) donne immédiatement, par la linéarité de f, 
DO — H5)f(v5) = 0. (4.12) 
jEeJ 
Du fait que { f(vi)}ier soit une base, nous déduisons que À; — 4; = 0 pour tout j. Donc 
zx = y, et f est injective. 
(2b) Surjective Soit x € E. Puisque { f(wi)};er est une base, il existe des scalaires À; tels 
que 
TX — >, AG CUS) — F0 Xjv). (4.13) 
jEeJ jeJ 


Donc f est surjective. 


LEMooRWQHoo!IxrQek 
Lemme 4.9 ([1]). 


Bases dans R”. ITEMooKWULooCTmOqM 
(1) Siv et w ne sont pas colinéaire dans R?, alors {v,w} est une base de R?. 


(2) Toute partie libre de R" contenant n élément est une base. 


Définition 4.10. 
Un espace vectoriel est de type fini si il contient une partie génératrice finie. 


Nous verrons dans les résultats qui suivent que cette définition est en réalité inutile parce qu’un 


espace vectoriel sera de type fini si et seulement si il est de dimension finie. 
LemytHn1D 


Lemme 4.11. 
Si E a une famille génératrice de cardinal n, alors toute famille de n + 1 éléments est liée. 


Démonstration. Nous procédons par récurrence sur n. Pour n = 1, nous avons E = Span(e) et 
donc si v1,v2 € E nous avons v1 = Àje, vo = 2e pour certains éléments non nuls À1, 2 du corps 
de base. Nous avons donc Aou — Aju2 = 0. Cela prouve que {1,2} est liée. 

Supposons maintenant que le résultat soit vrai pour k < n, c’est-à-dire que pour tout espace 
vectoriel contenant une partie génératrice de cardinal k < n, les parties de k + 1 éléments sont 
liées. Soit maintenant un espace vectoriel muni d’une partie génératrice G = {e1,...,e,} de n 
éléments, et montrons que toute partie V = {vw1,...,v,+1} contenant n + 1 éléments est liée. Dans 
nos notations nous supposons que les e; sont des vecteurs distincts et les v; également. Nous les 
supposons également tous non nuls. Étant donné que {e;} est génératrice nous pouvons définir les 
nombres À;x par 


nm 
Vi = >. Ài,kEk (4.14) 
k=1 


3. Nous utilisons le fait que l’union de deux parties finies d’un ensemble est finie (lemme 1.124(2)). 
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Puisque 
nm 
Un+1 = 5 An+1kek À 0, (4.15) 
k=1 


quitte à changer la numérotation des e;, nous pouvons supposer que An+1n # 0. Nous considérons 
les vecteurs 


WU = AntinVi — AinUn+1: (4.16) 
En calculant un peu, 
nm nm 
WU = Anti D, Àikex — din D, Ân+1,k6k (4.17a) 
k=1 k=1 
n—1l 
= D (ntinik — Minnie) €k (4.17b) 
k=1 
parce que les termes en e, se sont simplifiés. Donc la famille {w1,...,un} est une famille de n 
vecteurs dans l’espace vectoriel Span£e:,...,en-1} ; elle est donc liée par l'hypothèse de récurrence. 
Il existe donc des nombres a1,...,an € IK non tous nuls, tels que 


nm nm nm 
0 — > ŒWi = > GAntinVi — » inUn+1 FaoRf TS) 
| ii = 


Vu que An+tin # 0 et que, parmi les a;, au moins un est non nul, nous avons au moins un des 
produits ajAnyin qui est non nul. Par conséquent (4.18) est une combinaison linéaire nulle non 
triviale des vecteurs de {v1,...,Un+1}. Cette partie est donc liée. 


LemkUfzH1 
Lemme 4.12. 
Soient L une partie libre et G une partie génératrice d’un espace vectoriel E. Si l’ensemble des 
parties libres L! telles que L & L! & G possède un élément maximum“, alors cet élément est une 
base. 


Qu'entend-on par «& maximale » ? La partie B candidate, doit être libre, contenir L, être conte- 
nue dans G et de plus avoir la propriété que Vx € G\B, la partie B L {x} est liée. 


Démonstration. D'abord si G est une base, alors toutes les parties de G sont libres et le maximum 
est B = G. Dans ce cas le résultat est évident. Nous supposons donc que G est liée. 

La partie B = {b1,...,b} est libre parce qu’on l’a prise parmi les libres. Montrons que B est 
génératrice. Soit x € G\B ; par hypothèse de maximalité, B LU {x} est liée, c’est-à-dire qu’il existe 
des nombres À;, À; non tous nuls tels que 


S het Sent) 


Si À; = 0 alors un de À; doit être non nul et l’équation (4.19) devient une combinaison linéaire 
nulle non triviale des b;, ce qui est impossible parce que B est libre. Donc À; # 0 et 


l 
1 
TX —= = > Xb:. (4.20) 
© 1 


Donc tous les éléments de G\B sont des combinaisons linéaires des éléments de B, et par consé- 


quent, G étant génératrice, tous les éléments de £ sont combinaisons linéaires d'éléments de B. 
ThonmnWKs 


Théorème 4.13 (Théorème de la base incomplète). 
Soit E un espace vectoriel de type fini sur le corps K. 


4. Encore une fois, à part quelques cas triviaux, il n’est pas clair à ce point que ce maximum existe. 
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ItemBazxTZ 

(1) Si L est une partie libre et si G est une partie génératrice contenant L, alors il existe une 
base B telle que Le BEG. ITEMooFVJXooGzzpOu 

(2) Toute partie libre peut être étendue en une base. ITEMooFBUAooSSZxgx 
(3) Toutes les bases sont finies et ont même cardinal. ITEMooJI JSo0Gu.JMdt 


(4) Si V est un sous-espace vectoriel de E, et si L est une base de V, alors il existe une base de 
E qui contient L. 


Démonstration. Point par point. 

(1) Comme E est de type fini, il admet une partie génératrice G de cardinal fini n. Donc une 
partie libre est de cardinal au plus n par le lemme 4.11. Soit L, une partie libre contenue 
dans G (ça existe : par exemple L = @). La partie B maximalement libre contenue dans G 
et contenant L est une base par le lemme 4.12. 

(2) Notons que puisque E lui-même est générateur, le point (1) implique que toute partie libre 
peut être étendue en une base. 

(3) Soient B et B’, deux bases. En particulier B est génératrice et B” est libre, donc le lemme 4.11 
indique que Card(B') < Card(B). Par symétrie on a l'inégalité inverse. Donc Card(B) — 
Card(B). 

(4) La partie L étant une base de V, elle est en particulier libre dans Æ. Par le point (2), L peut 
être étendue en une base. 


REMooYGJEooEcZQKa 
Remarque 4.14. 
Le théorème de la base incomplète 4.13(2) est ce qui permet de construire une base d’un espace 
vectoriel en « commençant par » une base d’un sous-espace. En effet si H est un sous-espace de E, 


alors une base de H est une partie libre de Æ et donc, peut être étendue en une base de Æ. 
DEFooWRLKooArTpgh 


Définition 4.15. 
La dimension d’un espace vectoriel de type fini est le cardinal” d’une de ses bases. 


Il existe une infinité de bases de R””*. On peut démontrer que le cardinal de toute base de IR?" 
est m, c’est-à-dire que toute base de R'? possède exactement m éléments. 


Exemple 4.16. 
La base de canonique de R’” est la partie {e:,...,en}, où le vecteur e; est 


0 


Ej — 1 <— j-ème 


0 
La composante numéro j de e; est 1 si i = j et 0 si à À j. Cela s'écrit (e;); = d;,; où Ô est le 
symbole de Kronecker défini par 


1 sii-) 
j=i 7 (4.21) 
0 sit 
Les éléments de la base canonique de IR” peuvent donc être écrits e; = Li CERN AN 


5. Définition 1.122. 
6. Le théorème de la base incomplète 4.13(3) montre que cette définition ne souffre d'aucune ambiguïté. 
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Le théorème suivant est essentiellement une reformulation du théorème 4.13. 
ThoMGQZoo!grXjy 


Théorème 4.17. 


Soit E un espace vectoriel de dimension finie et {e;}ier une partie génératrice de E. 
ITEMooTZUDooFEgymQ 


(1) Il existe J € T tel que {ei}ieg est une base. Autrement dit : de toute partie génératrice nous 


pouvons extraire une base. ITEMooCJQGooXwj sfm 


(2) Soit {f1,...,f1} une partie libre. Alors nous pouvons la compléter en utilisant des éléments 
e;. C’est-à-dire qu'il existe J ET tel que {fx} L £ei}iey soit une base. 
PROPooVEVCooHkrldiw 
Proposition 4.18. 


Si E est un espace vectoriel de dimension finie n, alors ITEMooZNLDooBISkJyBS 


(1) toute partie contenant n + 1 éléments est liée. ITEMooSCGCooQUsuBs 


(2) toute partie libre contenant n éléments est une base, 


(3) toute partie génératrice contenant n éléments est une base. 


Démonstration. Soit une partie M contenant n + 1 éléments. L'espace E possède une partie géné- 
ratrice contenant n éléments (n'importe quelle base). Donc M est liée par le lemme 4.11. 

Une partie libre contenant n éléments peut être étendue en une base; si ladite extension est 
non triviale (c’est-à-dire qu’on ajoute vraiment au moins un élément) une telle base contiendra 
une partie de n + 1 éléments qui serait liée par le lemme 4.11. 

Pour la dernière assertion, soit une partie génératrice {v;};er où 1 contient n éléments. Par le 
théorème 4.17(1) nous pouvons en extraire une base : il existe J € I tel que {v;};ey soit une base. 
Si l'inclusion J € I était stricte, alors la base {v;};ey contiendrait moins de n éléments, ce qui 
serait en contradiction avec le théorème 4.13(3). 


DefCodimension 
Définition 4.19. 
Soit Fun sous-espace vectoriel de l’espace vectoriel E. La codimension de F' dans E est 


codimg(F) = dim(£E/F). (4.22) 
LEMooGNDPooAhvlek 
Lemme 4.20. 
L'ensemble Q" est un Q-espace vectoriel de dimension n. 


4.1.1 Et en dimension infinie 


Dans ZFC, en dimension infinie, il existe aussi une base pour tout espace vectoriel ainsi qu’un 
théorème de la base incomplète. Nous ne parlerons pas de ce qu’il se passe lorsque nous ne consi- 


dérons que ZF ‘. 
LEMooSSRXoo1lyfgNz 


Lemme 4.21 (|124)). 
Soient un K-espace vectoriel E et un sous-espace vectoriel V de E. Soient encore deux sous-espaces 
vectoriels Wi et W2 tels que 


(1) vonwW = {0} ; 
(2) V+W =E. 
Alors il existe un supplémentaire W de V tel qu WE WEWa2. 


Juste une remarque : dans le Frido le symbole « € » ne signifie pas une inclusion stricte. 


Démonstration. Nous utilisons le lemme de Zorn. 


7. Si vous ne savez pas ce que signifient les sigles « ZF » et « ZFC » vous ne devriez pas être en train de lire ceci, 
et encore moins penser à le resservir à un jury d’agrégation. 
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(1) 


(2) 
(3) 
(4) 


(6) 
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Un gros ensemble Soit 


S' est un sous-espace vectoriel de Æ 
À = {s c E tel que 4W cScW2 } (4.23) 
SnV = {0} 


Non vide Puisque W, € À, cet ensemble n’est pas vide. 

Ordre L’ensemble À est partiellement ordonné pour l'inclusion. 

A est inductif Nous prouvons maintenant que A est inductif®. Pour cela, soit une partie 
A’ totalement ordonnée et U = [44 À. 

Alors, la partie U est un sous-espace vectoriel de Æ. En effet si x,y € U, alors il existe 
A1, A2 € A’ tels que x € A; et ye A9. Comme 4’ est totalement ordonné, l’un des ensembles 
parmi À: et À) est inclus dans l’autre. Sans perdre de généralité, disons A1 € 42. Alors 
les opérations s’effectuent dans A2 : nous avons x,y € À», et donc Àx € A2 € Ù ainsi que 
x+ye AcU. 

De plus, U contient WA, et est contenu dans W2. Aïnsi, U € À et majore 4’ pour l'inclusion. 
En bref, À est bien inductif. 

Utilisation de Zorn Le lemme de Zorn 1.23 nous donne alors un élément maximal W de 
A. Cet élément vérifie 

(5a) WnV = {0}, 

(5b) Wi cWe W2, 


(5c) pour tout WE À, nous avons W' € W par maximalité de W. 


Supplémentaire Montrons que ce W est un supplémentaire de V. Soit x € ÆE. Le but 
est de trouver une décomposition de x en somme d’un élément de W et un de V. Comme 
V+W2 = E, nous avons v € V et w2 € Wa tels que 


ZT = V + Wa. (4.24) 


Si wo € W alors c’est fini. Sinon ... 

Soit X = Span{W, uw2}. Vu que X contient strictement W et que W est maximum dans À, 
la partie X n’est pas un élément de À. Comme X est un sous-espace vectoriel de Æ tel que 
W, € X € Wa, la seule possibilité pour que X ne soit pas dans À est que X n V Æ {0}. Soit 
donc y £ 0 dans X AN V. Par définition de X, 


y = w + Xwo ÉqDecomposg, 398 


pour we W, uw e Wa et À € K. Nous avons À £ 0, sinon nous aurions y e W n V et donc 
y = 0 puisque W est dans À. La décomposition (4.25) permet alors d'écrire w2 = (y — w’)/À 
et finalement 


1 1 1 
z=u+ (y w)=v+-y A | (4.26) 
nn — ni — 
A4 eW 


La somme d’espaces vectoriels E = V + W est donc établie. 


Corolaire 4.22. 
Tout sous-espace vectoriel d’un espace vectoriel possède un supplémentaire. 


Démonstration. Soit un espace vectoriel E ainsi qu’un sous-espace vectoriel V. Si V = Æ nous 
sommes O.K. Sinon nous considérons v € E\V et nous posons W, = Kw et W2 = E. 
Vu que V et W: sont des espaces vectoriels, nous avons V À W1 = {0}, et puisque W2 = E, 


nous avons V + W2 = ÆE. Le lemme 4.21 nous donne alors un supplémentaire de V. 


8. Définition 1.22. 
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PROPooHDCEooMhDjPi 
Proposition 4.23 (Base incomplète). 
Tout espace vectoriel (non réduit à {0}) possède une base. 


Démonstration. Soit À l’ensemble des familles libres de Æ. I] n’est pas vide parce que {v} en est 
une dès que v est non nul dans Æ. Rapidement : 

— l’ensemble À est ordonné pour l'inclusion, 

— si 4’ est une partie totalement ordonnée, l’union est un majorant, 

— donc À est inductif, 

— soit un maximum F de A. 


La partie Fest libre parce qu’elle est dans À. Elle est génératrice parce que si v n’est pas dans 
Span(F) alors la partie F LU {v} est encore libre, et majore strictement F pour l'inclusion, ce qui 
n’est pas possible. 

Donc F'est une base de E. 


THOo0UQLQooHqEeDK 
Théorème 4.24 (Base incomplète, dimension quelconque). 
Soit une partie {e;};er génératrice de l’espace vectoriel E (ici, 1 est un ensemble quelconque”). 
Soit In & I tel que {ei}ier, soît libre. 
Alors il existe T1 tel que 10 € Li € T tel que {ei}ier, soit une base de E. 


Note : une telle partie 14 existe en prenant un singleton. Mais l'existence n’est pas le sujet ici. 


Démonstration. Soit À l’ensemble des parties J de TZ telles que 19 € J € TI et telles que {e;}iey 
soit libre. 

Encore une fois, À est inductif pour l’ordre partiel donné par l'inclusion. Soit J un élément 
maximum par le lemme de Zorn 1.23. Puisque J € À, la partie {e;};ey est libre. Mais elle est 
également génératrice parce que si ex n’est pas dedans, J ne serait pas maximum, étant majorée 


par J LU {k}. 
Donc {e;};ez engendre tous les e; avec à € T et donc, tous les éléments de E. 
NORMooREVQooEFJWta 
4.25 ([12]). 


Une preuve alternative du théorème de la base incomplète serait de prouver que l’ensemble des 
parties libres est inductif. De ce fait, la proposition 1.24 permet de dire que toute partie libre peut 
être complétée en une base. 


4.1.2 Espace librement engendré 
DEFooCPNIooNxsYMY 


Définition 4.26 ([125]). 

Soient un ensemble S et un corps K. L'espace vectoriel librement engendré sur S, noté Fx(S) 

est l’ensemble des applications S — K qui sont non-nulles en un nombre fini de points de S. 
Autrement dit, o: S — K est dans Fx(S) si {x e S tel que o(x) Z 0} est fini 10. 


Le lemme suivant donne tout son sens à l’expression « librement » engendré. Il dit que Fx(S) 
possède une base indexée par S lui-même. 


LEMooLOPAooUNQUku 
Lemme 4.27. 
L'ensemble des applications 0, données par 
0: S—K 
’ 1 sit=s (4.27) 
O0 sinon 


9. Un cas d’utilisation intéressant est de poser 1 = E et e; = i. Pensez-y. 
10. Parce que nous l’aimons bien, nous ne résistons pas à faire un renvoi vers la définition 1.113. 
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avec s € S forment une base!! de Fx(S). 


Démonstration. Pour prouver que les 6; sont générateurs, nous considérons g: S$ — IK non nul sur 
la partie finie {s;};er de S. Alors nous avons 


g= D g(s)ôs. (4.28) 
iel 
Pour prouver que les 6, forment une partie libre, nous supposons avoir À; € K tels que 
SeY A0 (4.29) 
iel 


Soit j € 1. Nous avons 
0 = fs) = D x 6s(8;) = À5. 
ieT nn 


(4.30) 


ä, 


Donc les coefficients À; sont tous nuls, et nous avons prouvé que la partie est libre. 


Il est parfois pratique d’écrire les éléments de Fx($S) comme sommes « formelles » d'éléments 
de $. Cela va encore lorsque S est un ensemble n’ayant aucune somme bien définie. 

Mais attention : si S = R, l'élément 4+7 de FR(R) n’est pas 11. L'élément 11 de FR(R) est un 
élément complètement différent. Bref, il n’est pas judicieux d’écrire les éléments de Fx($S) comme 
des combinaisons linéaires d'éléments de $. Pour x € S'il vaut mieux écrire explicitement 6, que 
x. La somme 0, + à, est parfaitement bien définie dans l’ensemble des applications de $ vers K. 


4.2 Applications linéaires 


Le lien entre matrice et applications linéaires est la définition 4.67 et toutes les propriétés qui 
s’en suivent. 


4.2.1 Définition 
DEFooULVAooXJuRmr 


Définition 4.28. 
Soient des espaces vectoriels E et F' sur le corps K. Soit un sous-corps L de K. Une application 
T:E — F est dite L-linéaire si 


— T(x + y) = T(x) + T(y) pour tout x et y dans E, 
— T(Ax) = AT(x) pour tout À dans K et x dans E. 


Nous noterons Li(E, F) l’espace des applications L-linéaires de E vers F. 
Si vous avez bien suivi, les égalités dans la définition 4.28 sont des égalités dans F. 


4.29. 

Le plus souvent, si E est un espace vectoriel sur K, alors nous ne considérerons que les applications 

K-linéaires. Autrement dit, nous écrirons le plus souvent simplement £(E, F') sans préciser le corps. 
Il pourra pourtant arriver que, pour un espace vectoriel sur C, nous considérions les applications 


seulement R-linéaires. Ce sera le cas dans le lemme 27.147. 
DefDQRooVGbzSm 


Lemme-Définition 4.30. 
L'ensemble de toutes les applications linéaires de E vers F est noté L(E, F) et devient un espace 
vectoriel sur IK avec les définitions suivantes : 


(1) (Bi + B)(x) = Dix) + Dix), 
(2) (AT)(x) = AT (x). 


11. Définition 4.5. 
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EXooMAWMooEaNWp1l 
Exemple 4.31. 
Pour tout b dans R la fonction 74(x) = bx est une application linéaire de R dans R. En effet, 
— Ti(x + y) = b(x + y) = bx + by = Ti(x) + Ty), 
— Tilas) = bar) = abr = ali). 
De la même façon on peut montrer que la fonction T\ définie par T\(x) = Àx est une application 


linéaire de R°”* dans IR”? pour tout À dans R et m dans N. A 
ex_affine 


Exemple 4.32. 

Soit m € N. On fixe À dans R et v dans R””. L'application U, de R°”? dans R” définie par 
U;(x) = Àx + v n’est pas une application linéaire lorsque v £ 0, parce que si a est un réel différent 
de 0 et 1, alors av £ v, d’où 


Ux(ax) = X(ax) + v £ a(Ax + v) = aU;(x). 


AS 
exampleT_A 


Exemple 4.33. 
Soit À une matrice fixée de M(m x n,R). La fonction T4: R°* — R” définie par TA(x) = Ax est 
une application linéaire. En effet, 

— Ta(x + y) = A(x + y) = Az + Ay = Tax) + Ta(y), 

— Ta(ax) = A(ax) = a(Ax) = aTA(x). 


AN 
LEMooLGEHooVEEoiU 


Lemme 4.34. 
Si une application linéaire est inversible, alors son inverse est linéaire. 


Démonstration. Soient une application linéaire inversible f: E — F', ainsi que x,y € E. Nous 
avons 


FO) + Fu) = FO) + FO) = + y = FPE + 9). (4.31) 
En prenant f-! des deux côtés, nous trouvons 


Fa) + Fu) = f(x + y). (4.32) 


De même : 
FAST) = AS (FT (x) = Az = F(F (D), (4.33) 


ce qui nous donne Àf_{(x) = f (x). 


DEFooUA0UGooKuJSup 
Définition 4.35 (Quelques ensembles d’applications linéaires). 
Soient E et F des espaces vectoriels. 
— L'ensemble des applications linéaires de E vers F est noté L(E, F), comme déjà dit en 4.30. 


— Une application linéaire E — E est un endomorphisme de E. L'ensemble des endomor- 
phismes de E est noté End(E). 


— Un endomorphisme bijectif est un automorphisme. L'ensemble des automorphismes de E 


est noté Aut(E). 


— Une application linéaire bijective E — F' est un isomorphisme d'espace vectoriel. L’en- 
semble des isomorphismes de E — F est noté!? GL(E,F). C'est un groupe par le lemme 


Pre 


12. Le fait d'utiliser une notation similaire à celle des matrices inversibles n’est pas anodine : le lecteur en est sans 
doute conscient. 
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Remarque 4.36. 

Les ensembles définis en 4.35 concernent la structure d’espace vectoriel seulement. Lorsque nous 
verrons la notion d'espace vectoriel normé, nous demanderons de plus, la continuité, laquelle n’est 
pas automatique en dimension infinie. Voir aussi les définitions 11.237. 


Définition 4.37. 
Si E est un espace vectoriel, si X est un espace vectoriel, et si f: X — E est une application, le 
noyau de f est le noyau de f lorsque E est vu comme un groupe pour l'addition, c’est-à-dire la 
partie 

ker(f) = {x e X tel que f(x) = 0}. (4.34) 

PROPooRLLPooKYzsJp 

Proposition 4.38. 
Le noyau d’une application linéaire est un sous-espace vectoriel. 


Démonstration. Soit une application linéaire f: E — F. Si x,y € ker(f) et si À€ K alors 


f(x +y) = f(x) + f(y) =0+0=0, (4.35) 
donc x + y € ker(f), et 
FOx) = A f(x) = 0, (4.36) 
donc Àx € ker(f). 
LEMooIQJMooJWRbub 


Lemme 4.39 ([1]). 
Soit une application linéaire f: V — W. SibeW etsime f-!(b), alors 


F7 1(b) — m = ker(f). (4.37) 


Démonstration. Si x € f1(b) — m, il existe a € f-!(b) tel que x = à — m. Alors 


(æ) = f(a) — f(m) =b—b=0. (4.38) 


Pour l'inclusion dans l’autre sens, si z € ker(f), alors z = (z + m) — m avec z + m € f-{(b) 
parce que 
fe +m) = f(2) + f(m) =0+b=b=. (4.39) 


Proposition 4.40. 

Si E et F sont des espaces vectoriels de dimension n et si {ei}i=1..n et {fi}i=1...n sont des bases 
respectivement de E et F, alors il existe une unique application linéaire T: E — F' telle que 
T(e;) = fi pour tout i. 


Démonstration. En deux parties. 


(1) Existence Soit vu € E. Vu que {e;} est une base, v se décompose de façon unique en 
v = ÿ vie. Alors la définition 


T(v) = 2 Vi fi (4.40) 


est une bonne définition et satisfait aux exigences. 


(2) Unicité Soient T et U satisfaisant aux exigences. Alors pour tout à nous avons T(e;) = 
U(ei). Sive E s'écrit de la forme v = ÿ we; alors la linéarité impose T{v) = D; v;T(e;) = 
>,œU(é)=U(e). Done. T = UÙ. 


13. Définition 2.5. 
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LEMooJXFIooKDzRWR 
Lemme 4.41 (|1}). 
Soient des espaces vectoriels V et W de dimension finie. Soient des bases {e;} de V et {fa} de W. 
Nous posons 
Pia : V—-w 


(4.41) 
VE Vfa 
où v; est défini par la décomposition (unique) v = Ÿ,; wei. 
Alors : 
(1) La partie {çia} est une base de L(V,W\). ITEMOOPMLWOoNDTy JT 


(2) Au niveau des dimensions : dim (£(V,W)) = dim(V) dim(W). 
Démonstration. Il faut prouver que {4} est libre et générateur. 


(1) Générateur Soit une application linéaire b: V — W/. En décomposant b(v) dans la base 
{ fa}, nous définissons b,: V — K par 


b(u) = D ba(v)fa. (4.42) 
Nous posons bi = bale;). Ainsi, 


b(v) =. > Vibai fa = > babes tue (4.43) 


(2 


Donc b peut être écrit comme combinaison linéaire des ia. 


(2) Libre Supposons que D, Giagia = 0 pour certains coefficients a; € K. Nous avons, pour 
tout ve V : 


0 = D GiaPia(v) = D Giotifos (4.44) 
ia ia 
mais comme les f, forment une base, chaque terme de la somme sur @ est nul : 


dou 0 (4.45) 
i 


Et comme cela est valable pour tout v et donc, pour tout choix de v;, nous avons &;x = 0 
pour tout 4 et pour tout a. 


La formule de dimension est simplement la cardinalité de la base trouvée; c’est la définition 4.15. 


4.2.2 Linéarité et bases 


Proposition 4.42 ([126]). 
Soient deux espaces vectoriels E et F. Une application linéaire? f: E — F est injective si et 
seulement si ker(f) = {0}. 


Démonstration. Nous supposons que f est injective. Si x € ker(f), alors f(x) = 0. Or f est linéaire, 
donc f(0) = 0. Nous avons donc f(x) = f(0) et donc x = 0 parce que f est injective. 

Dans l’autre sens, soient x, y tels que f(x) = f(y). Par linéarité de f nous avons f(x — y) = 0, 
et donc x — y = 0 parce que ker(f) = {0}. Donc x = yet f est injective. 


PROPooZFKZooBGLSex 
Proposition 4.43 ([126]). 


Soit f € L(E,F) où E et F sont deux espaces vectoriels. ITEMooPPMEooTaZqtm 


(1) Si f est injective et si {vi}ier est libre, alors { f(vi)}ier est libre. 


14. Définition 4.28. 
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ITEMoo0UZSPooQBrDGi 
(2) Si f est surjective et si {vi}ier est génératrice, alors {f(vi)}ier est JÉRÉTRRRRE OLEYOOTFdFnv 


(3) Si f est une bijection, alors l’image d’une base par f est une base. 


Démonstration. En trois parties. 


(1) (1) Nous devons montrer que {f(v;)};ez est libre pour tout J fini dans 1. Soit donc une 


partie finie J & I et des scalaires !° tels que De X;f(v;) = 0. La linéarité de f donne !° 


FD Av) = 0. (4.46) 


jeJ 
Par injectivité de f nous avons alors 2, Àjv; = 0. Comme les v; eux-même forment une 
partie libre, nous avons À; = 0 pour tout j € J. 


(2) (2) Soit ye F. Puisque f est surjective, il existe x € E tel que f(x) = y. Étant donné que 
{vihier est générateur, il existe une partie finie J € I et des scalaires À; e K tels que 


ge y (4.47) 
jeJ 


En appliquant f aux deux côtés, et en tenant compte de la linéarité de f, 


y= fa) = à Àf(u), (4.48) 
jEJ 
ce qui prouve que y est une combinaison linéaire des f(v;). 


(3) (3) Une base est à la fois libre et génératrice et une bijection est à la fois injective et 
surjective. Les deux premiers points permettent de conclure. 


CORooXIPKooWThOsr 
Corolaire 4.44 ([1]). 
Si E et F' sont des espaces vectoriels isomorphes de dimensions finies. Alors leurs dimensions sont 
égales. 


Démonstration. Puisque E et F sont isomorphes, il existe une bijection f: E — F'. Par la propo- 
sition 4.43(3), l’image d’une base de Æ est une base de F. Donc les espaces Æ et F ont des bases 
contenant le même nombre d'éléments. 


4.2.3 Rang 


La proposition 4.45 et le théorème 4.46 sont valables également en dimension infinie; ce sera 


une des rares incursions en dimension infinie de ce chapitre. 
DefALUAooSPcmyK 


Proposition-Définition 4.45. 
L'image d’une application linéaire est un espace vectoriel. La dimension de cet espace est le rang 
de ladite application linéaire. 


Démonstration. Soit une application linéaire f: E — F'. Nous considérons v,w dans l’image de f 
ainsi que À dans le corps de base commun à E et F. 

Soient vo € E et wo € E tels que v = f(vo) et w = f(wo). Alors v + w = f(vo + wo) et 
ÀAv = f(Avo). Donc l’image est bien un espace vectoriel. 


15. Des éléments du corps de base K. 
16. Voir les propriétés de la définition 4.28. 
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ThoGkkffA 
Théorème 4.46 (Théorème du rang). 
Soient E et F deux espaces vectoriels (de dimensions finies ou non) et soit f: E — F une appli- 
cation linéaire. 


Si (us)ses est une base de ker(f) et si (f(w)),. est une base de Image(f) alors 


teT 
(us ses U (vt)teT (4.49) 


est une base de E. 
En dimension finie, nous avons en plus la formule suivante : 


rk(f) + dim(ker f) = dim, PONS ENTT 


c’est-à-dire que le rang!" de f est égal à la codimension ® du noyau. 


Démonstration. Nous devons montrer que 


(us)ses U (ve)teT (4.51) 


est libre et générateur. 
Soit x e E. Nous définissons les nombres +4 par la décomposition de f(x) dans la base (f(v+)) : 


J(x) = ze f(ve). (4.52) 


teT 


Ensuite le vecteur x — Ÿ}, sv, est dans le noyau de f, par conséquent nous le décomposons dans 


la base (us) : 
T — > TU = > TsUs. (4.53) 
t sEeS 


Par conséquent 


T = Tsüs + » T4Vt. (4.54) 
s É 
En ce qui concerne la liberté nous écrivons 


>, TU + Tsuüs = 0. (4.55) 
LA S 


En appliquant f nous trouvons que 


D æf(ur) = 0 (4.56) 


et donc que les x4 doivent être nuls. Nous restons avec Ÿ,,xsus = 0 qui à son tour implique que 
xs = (0. 


Un exemple d'utilisation de ce théorème en dimension infinie sera donné dans le cadre du 


théorème de Fréchet-Riesz, théorème 25.18. 
PROPooQCIXooHIyPPq 


Proposition 4.47 ([127)). 
Soit E, un espace vectoriel de dimension finie sur le corps K. Soient V et W des sous-espaces 
vectoriels de E. Alors 


dim(V +W) = dim(V) + dim(W) — dim(V n W). (4.57) 


17. Définition 4.45. 
18. Définition 4.19. 
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Démonstration. Nous considérons l’application 


: VxW+E 
r (4.58) 
(x, y) > x + y. 

C’est une application linéaire dont l’image est V + W. Nous avons donc, pour commencer 

dim(V + W) = dim ( Image(w)). (4.59) 
Nous appliquons à présent le théorème du rang 4.46 à l'application 4 : 

dim(V + W) = dim (Image(w)) (4.60a) 
= dim(V x W) — dim (ker()) (4.60b) 
= dim(V) + dim(W) — dim (ker(w)). (4.60c) 


Nous devons maintenant étudier ker(w). D'abord, (v,w) € VxW appartient à ker(4) si et seulement 
si vu + w = 0. Nous avons donc 


ker(çw) = {(x,—x) telquezreVnW}. (4.61) 
Nous montrons à partir de cela que dim (ker(w)) = dim(V n W) en montrant que l'application 


Di VROW — ker(v) (4.62) 

ze (x, —-t) 
est un isomorphisme d’espaces vectoriels. D'abord + est injective parce que si (x) = Y(y), alors 
(x, —x) = (y, —y) et donc x = y. Ensuite, Ÿ est surjective parce qu’un élément générique de ker(w) 
est (x, —x) = (x) avec x € V n W. L'application 4 étant un isomorphisme d’espaces vectoriels, 
nous avons bien dim (ker(g)) = dim(V n W). 


CORooCCXHooALmxKk 
Corolaire 4.48. 


Soient deux espaces vectoriels E et F de même dimension finie. Pour une application linéaire 
J:E — F, les trois conditions suivantes sont équivalentes : 

(1) f est injective ; 

(2) f est surjective ; 

(3) f est bijective. 


Démonstration. Si f: E — E est surjective, alors rk(f) = dim(Æ), ce qui donne, par le théorème 
du rang 4.46, dim (ker(f)) = 0, c’est-à-dire que f est injectif. 

De la même façon, si f est injective, alors dim ( ker(f)) = 0, ce qui donne rk(f) = dim(Æ) ou 
encore que f est surjective. 


Exemple 4.49. 
Le corolaire 4.48 n’est pas correct en dimension infinie. Par exemple en prenant f(e1) = f(e2) = e1 
et ensuite f(ex) = ex-1 pour tout k > 2. Cette application est surjective mais pas injective. A 


Une conséquence du théorème du rang est que les endomorphismes ont un inverse à gauche et 
à droite égaux (lorsqu'ils existent). En résumé, ce que le corolaire 4.50 dit est que si AB = 1, alors 


BA= I. 
CORooNFJLooJtzFwN 


Corolaire 4.50. 
Soit un endomorphisme f d’un espace vectoriel de dimension finie. Si f admet un inverse à gauche, 
alors 


(1) f est bijective, 


19. Les deux mots sont importants : les dimensions doivent être égales et finies. 
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(2) f admet également un inverse à droite, 

(3) les inverses à gauche et à droite sont égaux. 
Tout cela tient également en remplaçant « gauche » par « droite ». 
Démonstration. Soit g, un inverse à gauche de f : gf = Id. Cela implique que f est injective et 
que g est surjective, et donc qu’elles sont toutes deux bijectives par le corolaire 4.48. Puisque f est 


bijective, elle admet également un inverse à droite, soit h. Nous avons : gf = Id et fh = Id. 
Alors gfh = h parce que gf = Id, mais également gfh = g parce que fh = Id. Donc g = 
20 


h. 


C’est ce corolaire qui nous permet d'écrire fl sans plus de précisions dès que f est une 
bijection. 


Exemple 4.51 (Pas en dimension infinie). 
Tout cela ne fonctionne pas en dimension infinie. Par exemple avec une base {eg}£en nous pouvons 
considérer l’opérateur 


J(ex) = ex+1. (4.63) 
Il est injectif, mais pas surjectif. Si on pose 
e_1 Sik>l 
= 4.64 
g(ek) D pe) (4.64) 
alors nous avons gf = Id, mais pas fg = Id parce que ce (fg)(eo) = 0. A 
LEMooRZDTooEuLTrO 


Lemme 4.52. 
Si E et F sont des espaces vectoriels et si f: E — Fest une application linéaire inversible, alors 
son inverse est également linéaire. 


Démonstration. Nous avons f-1(x + y) = f-l(x) + f-l(y). En effet, 
FAP) + Lu) = FPE) + FT (y) = x + y. (4.65) 


De la même façon, 


FÜFT"(æ)) = Àz, (4.66) 


done f {Ax) = Àf x). 
PROPooHLUYooNsDgbn 
Proposition 4.53. 
Soient un espace vectoriel E de dimension finie, un endomorphisme f: E — E et une partie {v;}ier 
tel que {f(vi)}ier soit une base. 
Alors {v;};ier est une base. 


Démonstration. Soit x € E. Il existe une partie finie J € I et des scalaires À; tels que 
TX — > A; flu) — FO XV), (4.67) 
j j 


ce qui prouve que f est surjective. Le corolaire 4.48 nous dit alors que f est une bijection. L’ap- 
plication inverse est également linéaire par le lemme 4.52. 

Une application linéaire bijective (comme f-!) transforme une base en une base par la propo- 
sition 4.43. Donc 


F7 ({F(u:)}) (4.68) 


est une base. 


20. C’est le même argument que celui employé pour la preuve du lemme 1.160 (2), à ceci près que nous devions 
montrer l'existence de l’inverse à droite. 
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PROPooADESo00ATJSrH 
Proposition 4.54. 
Soit un espace vectoriel E de dimension finie et deux applications linéaires f,g: E — E telles que 
go f = Id. Alors f et g sont bijectives. 


Démonstration. En plusieurs étapes 


(1) f est injective Si f(x) = f(y), alors en appliquant g nous avons 


g(f(x)) = g(f(y)), (4.69) 


ce qui donne æ = y. 


(2) f est surjective C’est maintenant le corolaire 4.48. 


(3) g est surjective Pour tout x € E nous avons g(f(x)) = x. Donc l’image de f(E) par g est 
E. 


(4) g est injective C’est maintenant le corolaire 4.48. 


LEMooDAACooE1DsYb 
Lemme 4.55 ([128]). 


Soit une application linéaire f: E — F. ITEMooEZEWooZGoqsZ 
(1) L'application f est injective si et seulement si il existe g: F — E telle que go f = Idg. 
(2) L'application f est surjective si et seulement si il existe g: F — E telle que fo g=Id|r. 


Démonstration. Nous démontrons séparément les deux affirmations. 


(1) Si f est injective, alors f: E — Image(f) est un isomorphisme. Si V est un supplémentaire de 
Image(f) dans F (c’est-à-dire F = Image(f)®V) alors nous pouvons poser g(x+v) = f-!l(x) 
où æ + v est la décomposition (unique) d’un élément de F en x € Image(f) et v € V. Avec 
cela nous avons bien go f = Id. 

Réciproquement, si il existe g: F — E telle que go f = Id alors f: E — E doit être injective. 
Parce que si f(x) = 0 avec x # 0 alors (go f)(x) = 0 # x. 

(2) Si f est surjective nous pouvons choisir des éléments %1,...,x, dans E tels que {f(x;)} soit 

une base de F'. Ensuite nous définissons 


g:F—-E 
S'axf(x) > Date. (4.70) 
k k 


Cela donne f og = Id|r parce que si ve F alors v = D, vrf(xx) avec vx € K, et nous avons 


(fo g)(o) = Y'a (f 0 g) (Fax) = f ù ns) = Suf(ar) =v (TI) 
k k k 


Réciproquement, si il existe g: F — E tel que f o g = Id alors f doit être surjective, parce 
que 
F = Image(f o g) = f(Image(g)) € Image(f). (4.72) 


4.3 Matrices 


Les matrices et les applications linéaires sont deux choses différentes. Une application linéaire ?! 


est une application d’un espace vectoriel vers un autre, et une matrice est un simple tableau de 
nombres sur lesquels nous définissons des opérations, de telle sorte à fournir une structure d’espace 
vectoriel. Le lien entre ces opérations et les opérations correspondantes sur les applications linéaires 
sera fait plus tard. Voir la définition 4.67 et ce qui s’en suit. 


21. Définition 4.28. 
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4.3.1 Définitions 


Les notions topologiques sur les espaces de matrices sont pour plus tard, à commencer par la 
définition 10.33. 


Définition 4.56. 
Soit un anneau À ainsi que des entiers m, n strictement positifs. L'ensemble M(n x m, A) est 
l’ensemble des applications 

{1,...,n} x {1,...,m} — À, (4.73) 


et est appelé ensemble des matrices n x m sur AÀ. 
Si À est une matrice, nous notons À;,; au lieu de A(4, j) l’image de (i, j) par l'application À. 
Définition 4.57. 
Quelques ensembles de matrices particuliers. 
(1) Sin = m, alors : 
— nous disons que la matrice est carrée, 
— nous notons Mn, À) pour Mn x n, A), 
— n est appelée ordre de la matrice. 
(2) Sin = 1, alors la matrice est appelée matrice-ligne. 
(3) Sim = 1, alors la matrice est appelée matrice-colonne. 
4.58. 


On note les isomorphismes naturels M(1 x m, A) + A7 et M{n x 1, A) = A7. 
LEMooYWTEooQyLxKv 


Lemme-Définition 4.59. 
Nous considérons les opérations suivantes sur M(n x m, À) : 


Somme (A+ Bj;; = Ai,; + Bi;, 
Produit par un scalaire (À - A);; = ÀA;,; pour tout À, B e M{n x m, À) et Xe A. 


Alors (M(n x m,A),+, : ) est un A-module?”. 

LEMooMBZTooKdGvON 
Lemme-Définition 4.60. 
Avec la multiplication 


Min x p, A) x M(p x m, À) — Min x m, A) 


- 4.74 
(A,B) > (AB);,; —= Arbi ( 
1 


l’espace M(n, K) est une K-algèbre **. 


Démonstration. Il faut vérifier les trois formules de la définition 1.340. 
(1) Distribution (1) Nous avons 


((x + y) X 2); _— DE + ui = > (rit + Uikeks) = as + RES (4.75) 
k k 


(2) Distribution (2) Même calcul. 


(3) Multiplication par un scalaire Encore le même genre de calculs, en partant de 


((ax) x (8y)),; = D (axir(By)x5- (4.76) 


k 


22. Définition 1.323 
23. Définition 1.340. 
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Définition 4.61. 

Pour un élément À € M(n x m, À) nous définissons encore 
La transposée A, = A;;, 

La trace Tr(A) = ÿ, A;i. 


Remarque 4.62. 
Quelques remarques directes sur les définitions. 
(1) La motivation de cette définition pour le produit apparaîtra plus loin, mais le Frido n'étant 
pas un livre d'introduction, j'imagine que le lecteur a déjà une idée. 
(2) Nous verrons plus loin en 9.11.3 que la définition de transposée d’une application linéaire 
n’est pas tout à fait évidente; elle sera la définition 9.185. 
Ici nous avons bien défini la transposée d’une matrice, pas d’une application linéaire. 


Remarque 4.63. 
Quelques remarques à propos de structures supplémentaires. 


(1) Nous utiliserons (presque) tout le temps des matrices à coefficients dans un corps. Il est clair 
que, si K est un corps (commutatif), alors M(n x m,K) a une structure d’espace vectoriel 
sur K. 

(2) Par ailleurs, sur les matrices carrées d’ordre n fixé, le produit de deux matrices est bien défini. 
Ainsi, M(n, À) se voit conférer une structure d’anneau, dont le neutre pour la multiplication 
est la matrice carrée 1, (notée aussi 1 lorsqu'il n’y a pas d’ambiguïté sur la taille), donnée 


par 
1 si; 
ls ne (4.77) 
O0 sinon. 
Il est vite vu que si À est une matrice carrée d’ordre n, alors AI = 14 = À. 
LEMooUXDRooWZbMVN 
Lemme 4.64 ([1]|). 
Si À, B et C sont des matrices, nous avons 
t _ ptAt 
(1) (AB) = B'À’, ITEMooXDYQooAlnArd 
(2) Tr(ABC) = Tr(CAB). 
Démonstration. La première est un simple calcul : 
(AB); = (AB)ji = D AjnBri = D Ak5Bix = (B'A'5 (4.78) 
k k 
Pour la seconde : 
Tr(ABC) = D Abri = D CiiAikBrs = D (CAB = Tr(CAB). (4.79) 


ikl ikl l 


4.65. 

La seconde égalité est importante et est nommée invariance cyclique de la trace. Elle sert, entre 
autres nombreuses choses, à prouver que la trace d’une matrice d’une application linéaire ne dépend 
pas de la base choisie. Ce sera la proposition 9.201. 


LEMooLXAHooPRyHaF 
Lemme 4.66. 
Soient des matrices À, B € M(n,K). Si pour tout x,y € K” nous avons 
> Ai jTiYj = D Bi,jtiy; (4.80) 
ij ij 


alors À = B. 
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Démonstration. Il suffit de choisir x; = 0; et y; = 0,1 et d’effectuer les sommes ; par exemple 
D Aion = D Ars. (4.81) 
ij j 


Après avoir effectué toutes les sommes, nous nous retrouvons avec Az = By, ce qui signifie 
A = B. 


4.3.2 Identifier matrices et applications linéaires 


Voir dans l’index thématique, -2.1.1. 
Soient deux espaces vectoriels de dimension finie E, F' sur le corps K. Nous considérons les 


bases ?* {e;} pour E et {fa} pour F. 
DEFooJVOAooUgGKme 


Définition 4.67. 
Nous considérons l'application 


d: M(n x m,K) — L(E,F) ORNE 
At f1 | 


où fA est définie par 


fa(x) _ D 'Aaitife Dr 


si x; sont les coordonnées de x € E dans la base {e:;}. 


4.68. 

Nous allons prouver un certain nombre de résultats montrant que cette application a toutes les 
propriétés imaginables permettant d'identifier les matrices aux applications linéaires : elle est un 
isomorphisme pour toutes les structures que vous pouvez raisonnablement imaginer. 

À cette application 4 il manque cependant une propriété importante : elle n’est pas cano- 
nique. Elle dépend des bases choisies. Autrement dit : nous avons à priori autant d’applications 4 
différentes qu’il y a de choix de bases sur E et F?. 

Nous allons prouver maintenant quelques résultats montrant que les matrices et les applications 
linéaires, dans le cas des espaces vectoriels K” sont deux présentations de la même chose. 

Le fait que Ÿ est continue sera la proposition 12.117. 


4.69. 
Lorsque À € Mn, K) est une matrice et x € K” un vecteur, nous notons Azx l’élément de K” 


(Ax)i = >, Ài,jTj. ARTS ER) 
J 


donné par 


Autrement dit, Ax = fa(x). 


Cette convention et de nombreuses autres à propos de matrice sera rappelée dans -2.1. 
PROPooGXDBooHfKRrv 


Proposition-Définition 4.70. 
Soient deux espaces vectoriels de dimension finie E, F sur le corps K. Nous considérons les bases 
{e;} pour E et {fa} pour F. 

Nous considérons l'application 


dv: M(nxm,K) —£L(E,F) 


ra (4.85) 


24. C’est le théorème 4.13 qui nous permet de considérer des bases. Et ce théorème ne fonctionne que parce que 
nous avons supposé une dimension finie. 

25. Bonne question. Est-ce qu'il y a moyen de construire deux choix de bases donnant la même application 4 ? Écrivez- 
moi si vous savez la réponse. 
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où fA est définie par 


LE = V'Aoiifa PRE 
ia 
si x; sont les coordonnées de x € E dans la base {e;}. 

Alors ITEMooKZYYooZPTkpq 

(1) Nous avons 
JA(ei)a = Aa (4.87) 
ITEMooANXFooGIuxUR 

(2) Nous avons 
ile) = V Aile. ÉaooUKDJoo ere, 
° ITEMooXLLLooKfigfB 


(3) Nous avons 


Fo S A. EooAXRJooU HR; 


ITEMooHSMLooRJZref 
(4) L'application d est une bijection. 


Si f est une application linéaire, alors la matrice #7 !(f) est la matrice associée à f dans les 
bases choisies. 


Remarque : les bases ne sont supposées être canoniques en aucun sens du terme. Les dimensions 
de E et F' ne sont pas non plus supposées identiques. 


Démonstration. En nous rappelant que (e;); = d;,; nous avons 
EQooWGZHooï 
JA(e;) — Aai(ej)ifa a > Ales CPU) 
ia a 


donc fA(ei)a = Aai. Cela prouve la formule du point (1). 

Le point (2) est une simple somme sur a de (1). 

La formule du point (3) est simplement la composante f, de la définition 4.86. 

Prouvons que + est injective. Si fa = fp, nous avons en particulier fA(e;)a = fB(ei)a et donc 
Ai = Bo: 

Prouvons que 4 est surjective. Pour cela nous considérons f € L(E, F) et nous posons A4; = 
f(e;)a. Nous avons alors f = fA parce que 


fa(e) = D Aaitifa = D S(eiatifa = (D itiei)afa =) f(@)afa = f(x) (491) 


La proposition suivante montre que le produit matriciel correspond à la composition d’appli- 


cations linéaires, pourvu que l’on travaille avec les bases canoniques sur K”. 
PROPooIYVQooDiuRhX 


Proposition 4.71 ([1]). 
Soit un corps commutatif K. Nous considérons des espaces vectoriels E et F munis de bases 


Less et Laine 
L'application déjà définie ?° 
dv: M(mxn,K) — L(E,F) (4.92) 


est un isomorphisme d'espaces vectoriels. 


26. Notez la position du n et du m. Sachez noter les bornes des sommes écrites dans la démonstration. 
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Démonstration. Le fait que Ÿ soit une bijection est la proposition 4.70. Nous devons montrer que 
c’est une application linéaire. 
Pour À € K nous avons le calcul 


DUXA)(ex) = faa(ex) = D (AA )ai (ex}i fa = XD Aakfa = XfA(ex). (4.93) 


Donc Y(1A) = Aÿ(A). 
Si ÀA,B E Mn, K) nous avons de la même façon, fa: p = fA + fB. 


PROPooCSJNooEqcmFm 
Proposition 4.72. 
Soient des espaces vectoriels E, F et G de dimensions n, m et p munis de bases? {e;}, {f;} et 
{gi}. Nous considérons les applications 


dv: M(mxn,K)— £L(E,F) (4.94a) 
vd: M(p x m,K) — L(F,G) (4.94b) 
dv: M(p x n,K) — L(E,G). (4.94c) 
Nous avons 
d(A) ° p(B) = (AB) (4.95) 


pour toutes matrices À € M(p x m,K) et BE M(m x n,K). 


Démonstration. Nous considérons les applications linéaires associées à À et B : fa: F — Get 
fB8: E — F'et la composée f410 fp: E — G. Et puis c’est le calcul : 


(Fa o F)(ex) = fa(D Bi5(en)5f) (4.96) 
> BafaU) (4.96b) 
= > Bi D, Ars(f)agr (4.96c) 
É on (4.964) 
- SABhrasr (4.96e) 
= At) (4.96f) 


Donc f10 fp = fAg comme il se doit. 


Nous pouvons particulariser au cas où E = F = G. 
PROPooFMBFooEVCLKA 


Proposition 4.73. 
Si E est un espace vectoriel muni d’une base {e;}, alors l’application 


ÿ: M(n,K) — End(£) (4.97) 


est un isomorphisme d'algèbre ® et d’anneaux°”. 


Démonstration. Le fait que 4 soit un isomorphisme d’algèbre est juste la combinaison entre les 
propositions 4.71 et 4.72. 


27. Avec trois ensembles, nous renonçons à utiliser des alphabets différents pour numéroter les éléments des bases. 
28. Définition 1.340. 
29. Définition 1.42 
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En ce qui concerne l’isomorphisme d’anneaux, il faut en plus identifier les neutres. Le neutre 
pour la composition d’applications linéaires est l'application identité et le neutre pour la multipli- 
cation de matrices est la matrice identité. Nous devons donc montrer que (8) = fs = Id. Juste 
un calcul : 


fs(x) — … di,jTjei — ue — L: (4.98) 
ij À 


Donc oui, fs est l'identité. 


Le fait que Ÿ est continue sera la proposition 12.117. 

Voilà. Soyez bien conscient que l’application Ÿ dont nous avons beaucoup parlé est surtout 
intéressante dans le cas des espaces de la forme K”. Dans ce cas, nous avons une identification 
canonique entre M(n,K) et End(K”) qui est un isomorphisme d’anneaux et d’algèbres. 

Nous verrons que ce 4 respecte encore les inverses *° et les déterminants °!. 


4.74. 
Il convient de ne pas confondre matrice et application linéaire (bien que nous le ferons sans ver- 
gogne). Une matrice est un bête tableau de nombres, tandis qu’une application linéaire est une 
application entre deux espaces vectoriels vérifiant certaines propriétés. 

Cependant si les espaces vectoriels E et F sont munis de bases, alors il y à une application 


D: M(m x n,K) — L(E,F) (4.99) 


qui a toutes les propriétés imaginables *?. 

Cette application dépend des bases choisies. Il n’y a donc pas de trucs comme « la matrice de 
telle application linéaire » ou comme « voici une matrice, nous considérons l’application linéaire 
associée ». 

Cependant, sur des espaces comme IR” ou plus généralement sur K”, nous avons une base cano- 
nique et toute personne raisonnable utilise toujours la base canonique (sauf mention du contraire). 
Dans ces cas il est sans danger de dire « la matrice associée à telle application linéaire » sans 
préciser les bases. 

Mais si un jour vous utilisez une base autre que la base canonique sur R”, précisez-le et plutôt 
deux fois qu’une *. 

4.75. 

Tant que nous sommes à parler de matrice et d'applications linéaires, les plus acharnés anti-abus de 
language ** remarqueront qu’il n’est pas vrai que « étant donné une base, une application linéaire 
a une matrice ». 

En effet, une base est une partie libre et génératrice (définition 4.5). Or une partie d’un ensemble 
n’est pas muni d’un ordre. Toutes les permutations de colonnes de la matrice sont encore possible 
d’après l’ordre que l’on met sur les vecteurs de la base. 

Encore une fois, la base canonique n’a pas de problème parce que les {e;} de R” viennent avec un 
ordre indiscutable. Plus généralement, très souvent, lorsqu'on construit une base, la construction 
suggère un ordre. 


4.3.3 Ensemble des applications linéaires 
PROPooRIFBooGOvsfb 


Proposition 4.76 ([1]). 
Soient deux espaces vectoriels de dimension finie V et W. Soit des bases {e;};er de V et {ei}ieJ 


30. Proposition 4.95. 

31. Proposition 9.14. 

32. Et elle en aura encore plus lorsque nous aurons vu les déterminants. 

33. Au passage, non, les coordonnées polaires ne sont pas une base de IR?. C’est un système de coordonnées, et ce 
n’est pas la même chose. 

34. Dont l’auteur de ces lignes fait partie. 
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de W. Nous considérons les applications 


IDE V—-WwW 
, FAooBMKqooEyRgE, 


. TRE > Lie; 
k 


Nous avons : 


(1) Ces applications sont linéaires. 


(2) Elles forment une base de L(V,W). 
(3) dim(V, W) = dim(V) dim(W). 


ITEMooSEMLooXuxrpk 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 
PROPooPNQNooAZpojm 


Proposition 4.77 ([1]). 
Soient des bases {e;} et {e)} des espaces vectoriels V et W. Soit une application linéaire À € 
End(V,W). Alors 
PR (4.101) 
ij 
où les fi; sont les éléments de bases définis en (4.100) et A; sont les éléments de matrices définis 
par la proposition 4.70. 


Démonstration. Il s’agit d’un calcul. En appliquant à ex, nous avons 


D Afij(ex) = » Aide; = > Ajre;. (4.102) 
ÿ ÿ 3 


En comparant avec la formule de la proposition 4.70(1), nous avons le résultat. 


4.3.4 Déterminant 


Définition 4.78. 
Si AE Min, K) nous définissons le déterminant de À par la formule 


DEFooYCKRooTrajdP 


det(4) = ÿ (—1)°] [ Acc (4.103) 


CES n i=1 


où la somme est effectuée sur tous les éléments du groupe symétrique S, et où (—1)7 représente 
la parité de la permutation ©. 


En se souvenant que |S,| = n!, nous sommes frappés de stupeur devant le fait que le nombre 
de termes dans la somme croît de façon factorielle (c’est plus qu’exponentiel, pour info) en la taille 
de la matrice. Cette formule est donc sans espoir pour une matrice plus grande que 3 x 3 ou à la 
rigueur 4 x 4 à la main. À l'ordinateur, il est possible de monter plus haut, mais pas tellement. 


4.3.5  Déterminant en petite dimension 


En dimension deux, le déterminant de la matrice (° 
c 


a b 
det (° 4) = 


Ce nombre détermine entre autres le nombre de solutions que va avoir le système d’équations 


4) est le nombre 


c d 


a à . EResEre Enr 


linéaires associé à la matrice. 


35. Pour le groupe symétrique, c’est la définition 1.267, le fait que ce soit un groupe fini est le lemme 1.270, et 
pour la somme sur un groupe fini c’est la définition 1.302. 
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Pour une matrice 3 x 3, nous avons le même concept, mais un peu plus compliqué ; nous avons 
la formule 


d@11 12 @13 Q11 12 13 
det | a21 a22 a3]= la a22 à23| = a 
a31 432 433 a31 432 433 


a22 G23 
a32 


@21 @22 


4.105 
. (4.105) 


a2 
+ a13 
3 


4.3.6 Manipulations de lignes et de colonnes 


Nous voudrions savoir ce qu’il se passe avec le déterminant d’une matrice lorsque nous sub- 
stituons à une ligne ou une colonne, une combinaison des autres lignes et colonnes. Lorsqu'une 
matrice est donnée, nous notons C'; sa j° colonne. 


LEMooRSJTooQEoUtN 
Lemme 4.79 ([1]). 
Si À et B sont des matrices, alors 
(AB) = B'Aî. (4.106) 
Démonstration. Il suffit de calculer les éléments de matrice : 
(AB), = (AB);; a LB 2: BirA = (B'A): (4.107) 
LEMooCEQYooYAbctZz 


Lemme 4.80 ([1, 129]). 
Si À est une matrice, alors det(A) = det(At). 


Démonstration. Nous commençons par écrire la définition du déterminant : 


det(4*) = Ÿ ea) [ [(A'ot = Lo) [TA (4.108) 
i=1 î 


oESn 


Pour chaque & séparément, en utilisant la proposition 1.310 pour ré-indexer le produit : 
[Act = [TA0-16. (4.109) 
è i 


Nous profitons du fait que l’application 4: $, — S, donnée par (a) = a! soit une permutation 
de S, pour appliquer la définition 1.302 et faire la somme sur 07! : 


det(A) 2 TA = x (o7?) [ T'Aiocy = det(4) (4.110) 


où nous avons utilisé le fait que e(o_!) = (a) (corolaire 1.294). 


Le fait que det(A) = det(At) permet, dans toutes les propositions du type « ce qui arrive au 
déterminant si on change telle ligne ou colonne » de ne donner qu’une preuve pour la partie « ligne » 


et déduire automatiquement le cas « colonne ». Le lemme suivant donne un exemple d’utilisation. 
LEMooWMQWooGWF1mC 


Lemme 4.81 ([1]|). 
Soit une matrice À. Nous considérons la matrice B obtenue à partir de À par la permutation de 
lignes Lx < Li ainsi que la matrice C' obtenue à partir de A par la permutation de colonnes 
C% > C. 

Alors Ct = B 


Démonstration. Calculons les éléments de matrice de C : 
(At); si J Æ k, £ | A; si 1 Æ k, £ | 
Ci5 = À (Aix sij=1 = 4 Az; sij=l (4.111) 
(Atir si =k dis SJ k 
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Ensuite nous prouvons que C* = B en écrivant les éléments de C* : 
À;,j sii£kizl 
(Ci; = Cji= À Ag sii=l (4.112) 
Ai si 4 = k. 


Cette dernière expression est la matrice À après permutation des lignes Lx < 14, c’est-à-dire la 
matrice B. 


Pour la suite nous écrivons Ô la matrice « identité », c’est-à-dire celle dont les entrées sont 
précisément les 0,4. Nous écrivons également E;; la matrice contenant des zéros partout sauf en 
(i,j) où elle à un 1, c’est-à-dire 

(E;,j}#i —= di kÔ 1 (4.113) 
PROPooFQRDooRPfuxk 
Proposition 4.82 (Permuter des lignes ou des colonnes Lx + L[130, 1]). 


Soient une matrice À € M(n,K), deux entiers k £ l'inférieurs ou égaux à n. ITEMooATHWoOoHXzeys 


(1) Si B est la matrice obtenue à partir de À en permutant deux lignes ou deux colonnes, alors 


det(A) = — det(B). (4.114) 
ITEMooDNHWooOMgmxa 
(2) Si B est la matrice obtenue à partir de À par la permutation de lignes Lx < Ly. Alors 


B=SA (4.115) 
avec S = Ô + Er + Eik — Ex, — Es. 
Autrement dit : la matrice S est une matrice de permutations de lignes. rrEMooSHRQooOQravao 


(3) La matrice S vérifie det(S) = —1 ITEMooQXSE0oMWiKbL 
(4) Nous avons 
det(S A) = det(S) det(A). (4.116) 
Démonstration. Point par point 


(1) (1) pour les colonnes 


Soient k et ! fixés, et considérons la permutation des colonnes C4 et C. Nous notons a@ la 
permutation (k,l) dans $, (groupe symétrique, définition 1.267). Nous avons 


B;j = À; (4.117) 


ou encore : À; ; = B; a(j+ Par définition, 


det(A) = 2 e(o) [ [ Acc (4.118) 
i=1 


oESn 


C’est le moment d'utiliser la proposition 1.306 à propos de somme sur des groupes avec 
G=S»n,h=aet 


f(o) = (0) ] ['Aoi: (4.119) 
Nous savons que e(aæ) = —1 et que € est un morphisme par la proposition 1.293(1), donc 
J(ao) = e(ao) [ T'Aitaoyti = —€(o) [TB (4.120) 


Avec ça, nous concluons : 


det(4) = Ÿ, fo) = D fac) =-— Ÿ, e(o)] [ Bot = — det(B). (4.121) 
i=1 


OESn x OESn 
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(2) (1) pour les lignes Que se passe-t-il si nous permutons les lignes Lx et L,? Si nous notons 
B' la matrice obtenue à partir de À par la permutation de lignes Lx < Ly, et C' celle obtenue 
de A? après permutation de colonnes Cy <> C} alors nous avons C* = B'. Le lemme 4.81 nous 
dit que C* = B'. En utilisant le lemme 4.80 sur le déterminant de la transposée, 


det(B') = det(C*) = det(C) = — det(4') = — det(A4). (4.122) 


Voilà qui prouve le résultat pour les permutation de lignes. 

(3) (2) Sik = 1, il n’y à pas de permutation, et il est vite vu que la matrice S est l'identité 
parce qu’il y a quatre fois le terme Æ;,7. Nous supposons donc que k Æ l; en particulier 
Ôkai = (0. 

Il s’agit surtout d’un beau calcul : 


(SA)i5 = D SimAmj = Aij + D (Okiôtm + OLiôtm — Gkiôkm — Éiôtm) Am; (4:123a) 
= À; j + Ôki Ai, + ui Ak,j — dpi AS — dé A 5: (4.123b) 
Sitzjeti#l, alors (SA); = À;;. Si i = k, alors 


(SA)r,5 = Ax,5 + A5 — Ar,j = Ai: (4.124) 


c’est-à-dire que la Æ° ligne de SA est la [° ligne de À. 


Avec à = | nous obtenons la k* ligne de À. 


Tout cela montre que SA est la matrice À dans laquelle les lignes k et { ont été échangées, 
c'est-à-dire SA = B. 
(4) (3) En utilisant la définition du déterminant, 


det(S) = ÿ « GI Sio(i (4.125a) 
i=1 


OESn 


= D e(o )II (oiotiy + kiôtot) + Obiôkoti) — Oiôk,o(o) — Éd o(i))- (4.125b) 


à 


Nous utilisons l’associativité et la commutativité du produit pour séparer les facteurs à = k 
et à = | des autres : 


det(S) = D e(o) [ [ésot (Orot) + ot) — 60) (OnotD + Éke( — Ébo(t))- (4.126) 
o ik 
ei, 


À cause des facteurs à £ k et à Z L, les o pour lesquels le tout n’est pas nul doivent vérifier 
dot — 1 pour tout à différent de k et {. Les deux seuls sont donc o = Id et la permutation 
o = (k,l). Pour © = Id, nous avons 


LL GGOnx + One — ex) (One + kr — 811) = 0: (4.127) 
i£k 
ifl 

Dernier espoir : o = (k,{). Pour ce terme nous avons e(o) = —1 et 


El ii(Ôki + dr — Ôka)(Ôi,k + Ôkk — Üx) = ]. (4.128) 
i£k 
iZl 
Au final dans det(S), il n’y a que le terme © = (k,{) qui est non nul, et il vaut —1. Donc 
det(S) = -1. (4.129) 
(5) (4) I s’agit de mettre bout à bout les points déjà prouvés : 


det(S' A) = — det(A) = det(S) det(A). (4.130) 
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CORooAZFCooSYINvB1 
Corolaire 4.83 ([130]). 
Soit une matrice À € M(n,K). Si deux lignes ou deux colonnes de A sont égales, alors det(A) = 0. 


Démonstration. Si deux colonnes sont égales, la matrice ne change pas lorsqu'on les permute, alors 
que le déterminant change de signe. La seule possibilité est que det(A) = — det(A), ce qui signifie 
que det(A) = 0. 


Notons que si pour k £ l nous avons C% = AC, alors nous avons aussi det(A) = 0. 
La réciproque n’est pas vraie : il existe des matrices dont le déterminant est nul et dont aucune 
entrée n’est nulle. Par exemple 
1 2 
; 4.131 
2) (4.181) 


PROPooNGZJooHjtMyn 
Proposition 4.84 ([130]). 
Soient À € Min, K), et ve K”. Si B est la matrice A avec la substitution L; — L; + v et C est 
la matrice A avec la substitution L; — v, alors 


det(B) = det(A) + det(C'). (4.132) 


Démonstration. En utilisant l’associativité de la multiplication, 


det(B) = ÿ «( AI] Bio(i) (4.133a) 


OESn 
2e UT Bio(ÿ)Bjo(ÿ (4.133b) 
EX] 

= D e(o (TI À; ) Ag o(j) + da) (4.133c) 
œ i£j 

_ ÿ e(o) TI 4: + Sea II C: ES SUBEQooKATCo A'FR8eY 
(c4 à (c4 14) 

= det(A) + > e(o) El Cac Li 1330) 

(c4 147 
= det(A) + det(C). (4.133f) 


Justifications : 
— 4.133d parce que pour à Æ j nous avons À; (à) = Cio(i) 
— 4.133e parce que w(ÿ) = Cio(j): 


PROPooPYNHooLbeVh;j 
Proposition 4.85 (Combinaison de lignes ou colonnes Lx — Ly + AL[130]). 
Soient une matrice À € M(n,K), deux entiers k £ l inférieurs ou égaux à n. ITEMooJSRDooTggEyO 
(1) SiB est la matrice obtenue à partir de À par la substitution Li — Li + Al où Cr — Cr +ÀC, 
alors 
det(A) = det(B). ee 
ITEMooHKZWooVZDgn 
(2) Si B est la matrice À dans laquelle nous avons opéré la substitution Lx — Ly + AL, alors 
B=UA (4.135) 
avec U = 0 + ÀEyy, c'est-à-dire que U est une matrice de combinaison FABLE JoouTTghT 
(3) La matrice U vérifie det(U) = 1. ITEMooBBEAo0Z JVGNV 


(4) Nous avons 
det(U A) = det(U) det(A). (4.136) 
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Démonstration. Point par point. 


(1) (1) Soit la matrice C obtenue à partir de A par L; — ALy. En considérant le vecteur 
vu = ÀlLy, nous sommes dans la situation de la proposition 4.84. Donc 


det(B) = det(A) + det(C). (4.137) 
Mais dans la matrice C, nous avons Lx = Àly, ce qui implique det(C) = 0 par le corolaire 
4.83. Donc det(A) = det(B) comme il se devait. 
(2) (2) Encore un calcul : 


(DA); = D (dim + X(Ert)im) Am, = A5 + AD Gkiôtm Am; = Ai + XôiAk;. (4.138) 


m 


Cela donne, pour à = k la ligne 
(UA)r,5 = Ak,j + AAïÿ, (4.139) 


ce qui correspond bien à Ly — Ly + AL. 
(3) (3) Nous calculons le déterminant de U = 0+ÀE%, avec k Z I. Nous avons dans un premier 
temps : 
nm 
det(U) = DE s)[ [6 äo(i) + 10 40 o(i )- (4.140) 
CESn = 1 
Puisque nous avons toujours 04 ;0,; = 0, le terme o = Id donne 1. 


Pour les o Æ Id, le facteur À04 0, (5 ne s’annule pas, uniquement si à = k et o(i) = l. Donc 
le seul terme non nul autre que & = Id peut provenir de o = (k,l). Pour ce terme, nous 
isolons les termes à = { et à = k : 


(ôbote) + AÔk,kÜko(k)) (Ont + AËk ko (1): (4.141) 


Le dernier facteur est nul. 


(4) (4) En mettant bout à bout les résultats prouvés, 


det(U À) = det(A) = det(U) det(A). (4.142) 


PROPooXUFKooUaPnna 
Proposition 4.86 (Multiplication par un scalaire d’une ligne ou colonne Lx — ÀLz[130]). 
Soient une matrice À € M(n,K), un entier k < n. Soit la matrice B obtenue à partir de À en 


multipliant la ligne Lx par À € K. ITEMooBKIGooCDQEDt 
(1) det(B) = Adet(A) ITEMooWRRCOOFXKRN\W 


(2) En considérant la matrice T = 5 +(1—1)ÆEyx, nous avons 
B = TA, (4.143) 
c’est-à-dire que la matrice T est une matrice de multiplication de ligne Rqemu RCE uvrzx 


(3) Nous avons det(T) = À. 
(4) Et aussi : det(T A) = det(T) det(AÀ) 


ITEMooIFRVooWQYgkK 


Démonstration. Point par point. 


(1) (1) La matrice B est donnée par les éléments 


A; sii£k 
Be 7 (4.144) 
ÀA;; si ik 


4.3. MATRICES 307 


c'est-à-dire B;; = ill + (À — 1)6;,r) Ài,5- Nous mettons cela dans la définition du déterminant 


de B : 
det(B)= 3 «(0)[ [By = ZIIG+0- Det 7 tb) 


(ll (+ (À — 1ôt,x) Aioti) = II (1+( RAT 9) [TA F0 Le = À[ Tac or (4146) 


En remettant dans (4.145), nous trouvons det(B) = det(A). 
(2) (2) C’est un cas particulier de la proposition 4.85(2) en prenant k = { et en adaptant le À. 


(3) (3) Nous calculons le déterminant de la matrice T = 8 + (À —1)Æxx. La formule du 
déterminant donne 


n 


det(T) = D eo) | [ (doc) + (À — Lékiôp oi): (4.147) 


i=1l 


Si à Æ a(i), alors non seulement 6,,(5 = 0, mais en plus 64 ;ôp, ti — 0. Donc seul o = Id 
reste dans la somme sur © € $,. Il reste donc 


det(T) = [I (1+ (A —1)ô;i) - (1 Ja+a — 1)) = À (4.148) 
i=1 i£k 


où nous avons utilisé encore l’associativité pour isoler le facteur à = k. 
(4) (4) Il faut mettre bout à bout les résultats déjà établis : 


det(T A) = Xdet(A) = det(T) det(A). (4.149) 


4.3.7 Réduction de Gauss 

4.87. 

Nous avons vu les matrices d'opérations élémentaire sur les lignes : 
— Permutation de lignes Lx + L : S(n;k,l) = + Ex + Eig — Epx — Ejr, proposition 4.82. 
— Combinaisons de lignes Ly — Lx + AL : U(n;k,l, À) = 0 + ÀEy3, proposition 4.85. 


NORMooDXYZooFdnztA 


— Multiplication d’une ligne par un scalaire Lx — ÀLz : T(n;k, À) = 5+(1-1)E%%, proposition 
4.86. 
Il existe également des matrices pour faire les mêmes opérations, mais sur les colonnes. Ces 
matrices doivent toutefois multiplier à droite et non à gauche. Par exemple il existe une matrice 
C(n, k, 1) telle que AC (n, k, 1) soit la matrice À, avec les colonnes k et / inversées. 


Ces matrices seront dans la suite, notées G. 


LEMooDXSZooVpbCR; 
Lemme 4.88. 
Si G est une matrice de manipulation de lignes, alors 
E LQTV ] 
det(GA) = det(G) det(A) de 
pour toute matrice À. 
Si H est une matrice de manipulation de colonnes, alors 
det(AH) = det(A) det(H) (4.151) 


pour toute matrice À. 
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PROPooJBTZooNLobpf 
Proposition 4.89 (Réduction de Gauss|[1]). 
Soit une matrice À € M(n,K) de déterminant non nul : det(A) # 0. Alors il existe des matrices 
Gi,...,Gn toutes de type S, U ou T telles que 


é Car (4.152) 


Démonstration. Nous procédons par récurrence sur n. D'abord pour n = 1, la matrice À contient 
un seul élément A1 qui est non nul par hypothèse. Nous pouvons multiplier sa ligne par 1/A11 
pour obtenir le résultat. Plus précisément, nous avons l'égalité 


1 


T(1;1, — 
GLS 


)A = Ô (4.153) 
dans M(1,K). Notons que K est un corps (donc A1 est inversible) commutatif, ce qui permet 
d'écrire 1/A11 sans ambiguïté. 

Supposons le résultat prouvé pour n, et voyons ce qu’il se passe pour n +1. Puisque det(A) # 0, 


aucune de ses colonnes n’est nulle (corolaire 4.83). Il existe donc un k tel que Ag 1 # 0. 
Par la proposition 4.82, la matrice 


B0) = S(n+1;k,1)A (4.154) 


est une matrice telle que = A1 # 0. Ensuite, par la proposition 4.86 la matrice 
1 


A (4.155) 


B® = T(n +1;1, 


vérifie ie = 1. 
Puisque la multiplication par la matrice U(n + 1; k;l; À) réalise, par la proposition 4.85, la 
substitution Lx — Lx + Al, la matrice 


n+1 
8 = [um +181, -80)B0) (156) 
k=2 


a toute sa première colonne nulle à l’exception de B°) = 1. 

Nous n'avons pas donné de nom ni démontré de théorèmes à propos de la substitution Cy — 
Cx + AC. En passant éventuellement par les transposées et en utilisant les lemmes 4.79 et 4.80 
nous obtenons une matrice U’(n + 1; k,1, À) ayant la propriété que la matrice 


n+1l 
B® = [[U'(n+14,1 -B9)B® (4.157) 
k=2 | 
vérifie Bi = sie = 0 pour tout j sauf j = 1. En d’autres termes, la matrice B() est de la forme 
1 0 ... 0 
CES D 
BA =}, ” (4.158) 
0 


où À’ est une matrice de taille n. 
Voyons quelques propriétés de 4’. Nous savons que 


B® =[[G;A (4.159) 
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où les G; sont de type S, T ou U. Puisque det(S A) = det(S) det(A) (et idem pour T et U), nous 
avons 


det(B() EC :) det(A), (4.160) 


et comme aucun des det(G;) n’est nul, nous avons encore det(B(4)) & 0, ce qui implique det(A4’) # 0 
La récurrence peut avoir lieu. Il existe des matrices G! telles que 


GG =0 (4.161) 


où les G’ sont de taille n, ainsi que le 6. En remarquant que 


1 0 0 
S(n+1;k,l) ! S(n;k—1,1-1) | (4.162) 
0 
et pareïllement pour les matrices T et U, nous voyons qu’en prenant 
1 0 0 
G ° (4.163) 
TELE G | 
0 
nous avons 
1 0 0 
M 0 
[IG - Op Ga | (4.164) 
0 
où nous avons mis un indice sur le dernier Ô pour être plus explicite. 
4.3.8 Matrices inversibles 
PROPooMLWRooRWfZXE 
Proposition-Définition 4.90. 
Soit une matrice À € M(n,K). Si les matrices B1 et B2 de M(n, K) vérifient 
AB: = B1A=0 (4.165) 
et 
AB2 = B2A = 6, (4.166) 


alors B; = B2. Dans ce cas, nous disons que À est inversible et nous notons AT! l'unique matrice 
telle que AA! = ATA = 6. 


Démonstration. La preuve est réalisée dans le cas général par le lemme 1.160. Mais si vous en 
voulez une preuve avec les notations d'ici, en voici une. 

Nous avons AB; = AB. En multipliant à gauche par B:, nous trouvons B, AB; = B; AB. En 
remplaçant B;A par Ô des deux côtés, il reste B1 — Bo. 


LEMooGZCTooQigDvC 
Lemme 4.91 ([130]). 
Si AE Mi(n,K), alors il existe au plus une matrice B € Mn, K) telle que AB = 6. 


Démonstration. Soient des matrices B,C' € Min, K) telles que AB = AC = 6. Nous allons montrer 
que B = C. 

Pour cela nous considérons les applications linéaires f1, fp, fc € End(K”) associées par la 
proposition 4.70. Puisque AB = 6, par la proposition 4.72, nous avons f4 0 fg = fAag = Id. La 
proposition 4.54 nous dit alors que f1 et fg sont bijectives. 
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En particulier, comme {e;} est une base, son image par f8 est une base par la proposition 4.43. 
La proposition 4.53 dit alors que {fg(e;)} est une base. Nous décomposons fg(ex) — fo(ez) dans 
cette base : 


fB(ex) — fc(ex) = fe ei) (4.167) 
où les à; dépendent à priori de k. Puisque f4 0 (f — fc) = 0, nous avons 
0 = fa(fa(ex) — fo(ex)) = D (fa o fB)(e;) "À @jej. (4.168) 
j 


Donc les a; sont tous nuls. 
Nous en déduisons que fg(ex) = fc(ex), et donc fp = fc. Cela implique que B = C' par la 
proposition 4.70(4). 


PROPooECIIooVMCIwz 
Proposition 4.92 ([130]). 
Si A, BE M{n,K) vérifient AB = 6, alors BA = 6. 


Démonstration. L’astuce est de poser C = BA — Ô + B et de montrer que € = B. Pour cela, un 
rapide calcul commence par montrer que 


AC = ABA-— A+ AB = AB = 6. (4.169) 


Donc C'est également un inverse à droite de À. Le lemme 4.91 donne alors C = B. 
CORooBQLXo0oTeVfgb 


Corolaire 4.93. 
Soit À € M(n,K). Si il existe B € Mn, K) tel que AB = Ô, alors A est inversible et son inverse 
est B. 


Démonstration. I s’agit d’une paraphrase de la proposition 4.92 et de la définition 4.90. 
LEMooZDNVooArIXzC 


Lemme 4.94. 
Si une matrice À n’est pas inversible, alors le produit AB n’est inversible pour aucune matrice B. 


Démonstration. Soient une matrice non inversible À, ainsi qu’une matrice quelconque B. Suppo- 
sons que AB soit inversible. Alors 
AB(AB) ! = 6. (4.170) 


Donc la matrice B(AB)-! est un inverse de A. Contradiction. 


PROPooNPMCooPmaCwu 
Proposition 4.95. 
Une matrice est inversible si et seulement si son application linéaire associée est inversible. Dans 
ce CAS, NOUS AVONS 


fa = fan. (4.171) 
Démonstration. Dans le sens direct, si À est inversible nous avons AA! = 6. Donc 
E 
JA Oo fai = faai = fs = I re) 


où nous avons utilisé la proposition 4.72 pour la composition et la proposition 4.73 pour l'identité. 
L'égalité (4.172) indique que f4 est inversible et que son inverse est f4-1. 
Dans l’autre sens, l’application Fra existe. Soit B € M(n,K) sa matrice. Alors nous avons 


fs = I = fa0o fp = fAB. (4.173) 


Le fait que l'application #: À — fA soit une bijection * implique que AB = 6, c’est-à-dire que À 
est inversible et que B = A7f. 


36. Proposition 4.70(4). 
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LEMooMCIDooYBHrbq 
Lemme 4.96 ([1]|). 
Soient une matrice inversible À € M(n,R) et r < n. Il existe une permutation o € S, telle que la 
matrice a € M(r,R) donnée par 
Gi,j = À; 


e (4.174) 


soit inversible. 


4.3.9 Inversibilité et déterminant 
PROPooAVIXooMtVCet 


Proposition 4.97. 
Une matrice au déterminant non nul est inversible. 


Démonstration. Si À est une matrice telle que det(A) # 0, alors la proposition 4.89 nous donne 
des matrices G1,...,GN telles que 


GO A (4.175) 


Donc la matrice G1...Gn est un inverse de À par le corolaire 4.93. 


PROPooEUKBooKUROFg 
Proposition 4.98. 
Si une matrice À a une ligne ou une colonne de zéros, alors 


(1) det(A) = 0, 
(2) À n’est pas inversible. 


Démonstration. Par définition, nous avons 
mn 
det(4) = D e(o)] [Act (4.176) 
CESn i=1 


Si la k° ligne est nulle, alors 4;,() = 0 pour tout o. Donc tous les produits contiennent un facteur 
nul. Donc det(A) = 0. 


Pour toute matrice B nous avons 


(AB)kr = D AriBir. (4.177) 
? 


Si la k° ligne de À est nulle nous avons (AB)4x = 0 et donc pas AB = 0. Donc À n’est pas 
inversible. 


4.3.10 Quelques ensembles de matrices particuliers 


Certains ensembles de matrices ont une importance particulière, que nous développerons plus 
tard. 


Définition 4.99 (Groupe linéaire de matrices). 
On note GL(n, À) l’ensemble des matrices carrées d'ordre n à coefficients dans À, qui sont inver- 
sibles. En d’autres termes, GL(n, À) = U(Mi(n, À)). 

DefMatriceOrthogonale 
Définition 4.100 (Groupe orthogonal de matrices). 
On dit qu’une matrice À est orthogonale si son inverse est sa transposée, c’est-à-dire si AT! = 
At. On note O(n, À) l’ensemble des matrices carrées d'ordre n à coefficients dans À, qui sont 
orthogonales. 
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4.3.11 Déterminant et combinaisons de lignes et colonnes 
SUBREHEoOoKMAVooBRHvRH 


Proposition 4.101. 
Soient des matrices À, B € M{n,K) telles que det(A) Z 0 et det(B) Z 0. Alors 


det(AB) = det(A) det(B). (4.178) 


Démonstration. La proposition 4.89 nous donne des matrices de permutations de lignes et de 
, : 37 FRAPONEMEGPEREE 
colonnes G1,...,Gn et G,...,G'N telles que 


G1...GNA=Ô (4.179a) 
GG... GNB = 6. (4.179b) 
Nous avons 
(G...Gv)(G1...GN)AB = 6. (4.180) 
=6 


En prenant le déterminant des deux côtés et en tenant compte de (4.150), 
1 = det(ô) = det (G,...GyG1...GnAB) = det(G...Gn)det(G:...Gn)det(AB). (4.181) 


Mais en même temps, les équations 4.179 donnent 


det(G1...Gn) = det(A) ! (4.182a) 
det(G! ...Gy) = det(B) !. (4.182b) 
Cela pour dire que 
1 = det(A) ! det(B) ! det(AB), (4.183) 
et donc ce qu’il nous fallait. 
PROPooWVJFooTmqoec 


Proposition 4.102. 
Soient des matrices À, B € M{n,K) telles que det(A) = 0 et det(B) Z 0. Alors 


det(AB) = det(BA) = det(A) det(B) = 0. (4.184) 

Démonstration. Il existe des matrices de manipulations de lignes et de colonnes G1,...,GN telles 
que G1...GNB = 6. Donc 

0 = det(A) = det(G1...GnBA) = det(G1...Gn) det(BAÀ). (4.185) 


Donc det(BA) = 0. 
4.3.12 Transvections 
Nous nommons E;,; la matrice remplie de zéros sauf à la case 4, j qui vaut 1. Autrement dit 
(Eis)ri = dinde. (4.186) 


Définition 4.103. 
Une matrice de transvection est une matrice de la forme 


TC) = Id +AÀË;,; (4.187) 


avec à £ j. 


37. Les plus acharnés préciseront que pour avoir le même N des deux côtés, il à fallu compléter avec des matrices 
Ô là où il y en avait le moins. 
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Une matrice de dilatation est une matrice de la forme 
Di(À) = Id +(À — 1) F3. (4.188) 


Ici le (À — 1) sert à avoir À et non 1 + À. C’est donc une matrice qui dilate d’un facteur À la 
direction i, tout en laissant le reste inchangé. 

Si o est une permutation (un élément du groupe symétrique S) alors la matrice de permu- 
tation associée est la matrice d’entrées 


(Poig = bio(s): (4.189) 
LemyrAXQs 
Lemme 4.104. 
La matrice Ti ;(A)A = (1 + ÀE;;)A est la matrice À à qui on a effectué la substitution 


L; — L; + ÀL;. (4.190) 
La matrice AT; ;(À) est la substitution 
C; — C; + ÀC:. (4.191) 


La matrice AP, est la matrice À dans laquelle nous avons permuté les colonnes avec ©. 


La matrice P;A est la matrice À dans laquelle nous avons permuté les lignes avec 971. 


Démonstration. Calculons la composante k,l de la matrice E; ;A : 


(EjA)ri = D (Eiÿ)kmAm (4.192a) 
_ > di 0 m3 Arai (4.192b) 
= dkA;,: (4.192c) 


C'est donc la matrice pleine de zéros, sauf la ligne 4 qui est donnée par la ligne j de À. Donc 
effectivement la matrice 


À + ÀE;,;A (4.193) 


est la matrice À à laquelle on a substitué la ligne à par la ligne + plus À fois la ligne 7j. 
En ce qui concerne l’autre assertion sur les transvections, le calcul est le même et nous obtenons 


(AEi,5) = Aid; (4.194) 
Pour les matrices de permutation, nous avons 
(AP xt = Ap,o(t) (4.195) 


et 
(Pr Aki = ” Ôk,o(m) Ami = >, do 1(k),m Ami = Ào-1(k) 1: (4.196) 


4.3.13 Mineur, rang 


Pour la définition du rang d’une matrice, nous en donnons une qui est clairement inspirée de 


l'application linéaire associée. 
DEFooCSGXo0oFRzLR)j 


Définition 4.105 ([130]). 
Le rang d’une matrice de M(n,K) est la dimension de la partie de K” engendrée par ses colonnes. 


Il est possible d'exprimer le rang d’une matrice de façon plus « intrinsèque » via le concept de 
mineur. 
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Définition 4.106 ([131]). 
Les mineurs d’une matrice sont les déterminants de ses sous-matrices carrées. 


Dans la suite nous désignerons souvent par le mot « mineur » la sous-matrice carrée elle-même 
au lieu de son déterminant. 

Lorsque À est une matrice, nous notons f4 l’application linéaire associée à la matrice À par 
l'application (4.82). 

LEMVecsaRgFixe 

Lemme 4.107. 
Soit K un corps commutatif®. Si A est une matrice carrée d'ordre n et de rang r à coefficients 
dans K, alors il existe des vecteurs (x;);=1..n formant une base de K” tels que 


fA(x:) # 0 (4.197) 


pour i <T et 
fabr:) = 0 (4.198) 


pour i>T. 


Démonstration. Soit V le sous-espace de K” engendré par les colonnes de À. Nous considérons la 
base canonique {e;} de K”, ainsi que v; le vecteur créé par la i° colonne de À. Nous avons 


vi = fa(ei). (4.199) 


Les vecteurs v; engendrent V, donc nous pouvons en extraire une base par le théorème 4.17(1). 
Soit donc {v;}iey une base de V avec JC {1,...,n}. 

La base de K” que nous cherchons commence par les vecteurs {e;};ey. Ces vecteurs vérifient 
fa(e;) = v; 0 parce que des vecteurs d’une base ne sont jamais nuls. 

Pour la suite de la base, nous pourrions penser au théorème de la base incomplète *”, mais les 
vecteurs ainsi complétant la base ne sont pas garantis de s’annuler par f4. Voir l'exemple 4.108. 

L'idée est d'utiliser le noyau de f4 qui est un sous-espace vectoriel par la proposition 4.38. Soit 
une base 1° {24} de ker(f). Les vecteurs {e;};ey forment une base de Image(f4). Puisque les z; 
forment une base de ker(f4), le théorème du rang 4.46 dit alors que {e;}jez L {z} est une base de 
K”. 

Il y a r éléments dans J parce que l’espace engendré par les colonnes de À est de dimension 
r par hypothèse. Donc il y a n — r éléments dans les {z;} pour que le tout ait le bon nombre 
d'éléments. 


EXo0oRKVQooZOGDEf 


r_ È . (4.200) 


Elle est de rang 1. En suivant l'idée de la démonstration, nous commençons la base de R? par le 
vecteur ej qui vérifie 


Exemple 4.108. 
Soit la matrice 


see _ (4.201) 


L'utilisation du théorème de la base incomplète ne permet pas de trouver un second vecteur de 
base vw tel que f4(v) = 0. En effet ce théorème donne juste l’existence d’une completion de la base, 
mais pas de propriétés particulières de la base obtenue. Elle pourrait donner v = e2 comme second 
vecteur de base. Mais alors 


FA(v) = fa(es) = (:) 20 (4.202) 


38. Comme toujours. 
39. Théorème 4.13(2). 
40. Cette base contient n — r éléments, mais ce n’est pas très important pour la suite. 
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1 
Au contraire, le noyau de f4 est donné par le sous-espace engendré par = Une base 


convenable est donc {ei,e1 — e2}. 
PROPOooEGNBooIffJXc 


Proposition 4.109. 
Le rang d’une application linéaire *! est égal au rang de sa matrice“? dans n'importe quelle base. 


4.3.14 Matrices équivalentes et semblables 
DefBLELooTvl1HoB 


Définition 4.110. 


: ie ; 
Deux relations d'équivalence entre les matrices. LtemPFXCooOUbSC+ 


(1) Deux matrices À et B sont équivalentes dans Mn, K) si ü existe P,Q € GL(n, K) telles 
que À = PBQT1. 
(2) Deux matrices sont semblables si il existe une matrice P € GL(n, K) telle que À = PBP”1. 
LemZMxxnfM 
Lemme 4.111. 
Une matrice de rang r dans M(n, K) est équivalente à la matrice par blocs 


= U 1 . (4.203) 


Démonstration. Nous devons prouver que pour toute matrice À € M(n,K) de rang r, il existe 
P,Q € GLi(n, K) telles que QAP = J,. Soit {e;} la base canonique de K”, puis {f;} une base telle 
que Àf; = 0 dès que à > r, qui existe par le lemme 4.107. 

Nous considérons la matrice inversible P telle que Pe; = f;; ses colonnes sont donc précisément 
les f;, si bien que 


0 . 
APe; = Af; = ro (4.204) 
ZÆ0 sinon. 
La matrice AP se présente donc sous la forme 
M 0 
AP = ( . d (4.205) 


où M est une matrice r x r. Nous considérons maintenant une base {g;};-1...n dont les r premiers 
éléments sont les r premières colonnes de AP et une matrice inversible Q telle que Qg; = e;. Alors 


ET, (4.206) 


O0 sinon. 


QAPe; = 


Cela signifie que Q A P est la matrice J,. 


CorGOUYooErfUle 
Corolaire 4.112 (Equivalence et rang). 
Deux matrices sont équivalentes si et seulement si elles sont de même rang. 


Démonstration. D'abord il y a des implicites dans l’énoncé. Puisque nous voulons, soit par hypo- 
thèse, soit par conclusion, que les matrices À et B soient équivalentes, nous supposons qu’elles ont 
même dimension. Soient donc À et B deux matrices carrées d'ordre n. 

Par le lemme 4.111, deux matrices de même rang r sont équivalentes à J/,. Elles sont donc 
équivalentes entre elles. 


41. Définition 4.45. 
42. Définition 4.105. 
43. Définition 4.105. 
44. Définition 4.110(1). 
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Inversement, supposons que À et B soient deux matrices équivalentes  : A = PBQT! avec P 
et Q inversibles. Alors 


Image(PBQ 1) = {PBQ" lv tel que v e K"} (4.207a) 

= PB{Q"{v tel que ve K”} (4.207b) 
ee 

= P(E(R")). (4.207c) 


L'ensemble B(K”) est un sous-espace vectoriel de K”. Comme le rang de P est maximum, la 
dimension de P(B(K”)) est la même que celle de B(K”). Par conséquent 


dim (image(PBQ)) = dim (B(K")) = rk(B). (4.208) 


Le membre de gauche de cela n’est autre que rk(A) = dim (Image(PBQ"1)). 


4.3.15 Algorithme des facteurs invariants 
PropPDfCqee 


Proposition 4.113 (Algorithme des facteurs invariants[103]). 
Soit (À, 0) un anneau euclidien muni de son stathme et U € M(nxm, À). Alors il existe d1,...,d, € 
A et des matrices P € GL(m, À), Q € GLi(n, À) tels que nous ayons 


di 


(Ce, 
I 
© 

© 


(4.209) 


avec d; | dÿ:1 pour tout 1. 


Démonstration. Nous allons donner la preuve plus ou moins sous forme d’algorithme. 
D'abord si U = 0 c’est bon, on a la réponse. Sinon, nous prenons l’élément (40,30) dont le 
stathme est le plus petit et nous l’amenons en (1,1) par les permutations 


C1 + C; 
0 
: (4.210) 
Le L; 
Ensuite nous traitons la première colonne jusqu’à amener des zéros partout en dessous de u1,1 de 
la façon suivante : pour chaque ligne successivement nous calculons la division euclidienne 


Ui1 = QUi1 + Ta (4.211) 


et nous faisons 
L; — L; —= ali, (4.212) 


c’est-à-dire que nous enlevons le maximum possible et il reste seulement r; en u;1. Vu que le but est 
de ne laisser que des zéros dans la première colonne, si le reste n’est pas zéro, nous ne sommes pas 
contents “, Dans ce cas nous permutons Li + L;, ce qui aura pour effet de strictement diminuer 
le stathme de uw; 1 parce qu’on va mettre en u1,1 le nombre r; dont le stathme est strictement plus 
petit que celui de u11. 

En faisant ce jeu de division euclidienne puis échange, on diminue toujours le stathme de u1 1, 
donc ça finit par s'arrêter, c’est-à-dire qu’à un certain moment, la division euclidienne de w;1 par 
Uu1,1 Va donner un reste nul et nous serons contents. 


45. Définition 4.110. 
46. Si il est zéro, nous passons à la ligne suivante 
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Une fois la première colonne ramenée à la forme 
u1,1 
0 
G=| . |, (4.213) 
() 
nous faisons tout le même jeu avec la première ligne, en faisant maintenant des sommes divisions 
et permutations de colonnes. Notons que ce faisant, nous ne changeons plus la première colonne. 


En fin de compte, nous trouvons une matrice {7 
U1,1 0 ... 0 
0 
U = | (4.214) 
: À 
0 


Si l'élément u11 ne divise pas un des éléments de À, disons a;,;, alors nous opérons 
Ci — Ci — Ci. (4.215) 
Cela nous détruit un peu la première colonne, mais ne change pas 1,1. Nous avons maintenant 


U1,1 0 ... 0 


U=| (4.216) 


Et nous refaisons tout le jeu depuis le début. Cependant, lorsque nous allons nous attaquer à 
la ligne 4, u1,1 ne divisera pas u;,;, ce qui donnera lieu à une division euclidienne et un échange 
Li + L;. L'échange consistant à mettre r; à la place de u1,1 et réciproquement, diminuera encore 
strictement le stathme. Encore une fois, nous allons travailler jusqu’à avoir la matrice sous la forme 


U1,1 0 ... 0 


u= |" | EaApEUtE 


- A 
0 
sauf que cette fois, le stathme de u11 est strictement plus petit que la fois précédente. Si u11 ne 
divise toujours pas tous les éléments de À, nous recommençons encore et encore. En fin de compte, 
nous finissons par avoir une matrice de la forme (4.217) avec u11 qui divise tous les éléments de 
A. 
Une fois que cela est fait, il faut continuer en recommençant tout sur la matrice À. Nous avons 
maintenant 
U1,1 0 
U = Uu2,2 Fe (4.218) 
0 B 


Sous cette forme nous avons u11 | u2,2 et u11 divise tous les éléments de B. En effet 11 divisant 
tous les éléments de À, il divise toutes les combinaisons de ces éléments. Or tout l’algorithme ne 
consiste qu’à prendre des combinaisons d'éléments. 

Nous finissons donc bien sur une matrice comme annoncée. De plus, n’ayant effectué que des 
combinaisons de lignes, nous avons seulement multiplié par des matrices inversibles (lemme 4.104). 


47. Nous nommons toujours par la même lettre U la matrice originale et la matrice modifiée, comme il est d’usage 
en informatique. 
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4.4 Changement de base 


Soit un espace vectoriel £ muni de deux bases (e;);=1..n €t (fa)a=1…,n: Les deux bases sont 
liées entre elles par 
EQooFRQRoo 
fa= Y Qiae: 210) 
ï 


Ici Q n’est pas une application linéaire £ — E : Q est seulement un tableau de nombres, donnant 
les coordonnées des vecteurs f, dans la base de e;. Éventuellement Q peut être vu comme une 
application linéaire K” — K7. 

Dans la suite nous nommerons Q-! la matrice inverse de Q. Inverse au sens des bêtes ta- 
bleaux de nombres, sans interprétation en tant qu’application linéaire. De même pour Q* qui est 
la transposée de Q. 


4.4.1 Changement de base : vecteurs de base 
LEMooIHZGoo0ZoYZd 


Lemme 4.114. 
Soit un espace vectoriel E sur K ainsi que deux bases (ej)5=1..n; (fa)a=1,.n de E liées par 


fa = >: Qiae: Alors 
a Vo FANSARER OSSI 


Démonstration. Nous multiplions l'égalité fx = D; Qiae; par le nombre Lu me € K et nous 
sommons sur @ : 


D Qaifa = D (AioQnj)ei = ej. (4.221) 


ia 


4.4.2 Changement de base : coordonnées 
PROPooNYYOooHqHryX 


Proposition 4.115. 
Soit un espace vectoriel E sur K. Soient deux bases (e;)i=1,..n et (fa)a=1,.n liées par fa = 
D Qiaei. Nous considérons un même vecteur dans les deux bases : Ÿ; ie; = Pme ar Sn pp 


(1) Va — D Qim 
(2) Ti — Da ile 


Démonstration. Soit un vecteur x € E. Il peut être écrit dans les deux bases : 


_—_ Ÿ __— 5 7. ARNO EE 


ITEMooKPWTooMwdbPu 


En remplaçant e; par sa valeur (4.220) nous avons l'égalité 


ad . Sade (4.223) 


ia 


Puisque les f, sont linéairement indépendants, l’égalité des sommes donne l'égalité de chacun des 
termes : 


DD ee (4.224) 
i 
En identifiant x € E au vecteur dans K” de ses coordonnées dans la base {e;} nous pouvons écrire 


ta (Q "a (4.225) 


Le point (1) est prouvé. 


48. Attention à la bonne interprétation de ce nombre : on fait bien référence à l’élément situé en (a, j) de la matrice 
Q7!, et pas autre chose. 
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En ce qui concerne le point (2), nous repartons encore de (4.222), mais nous y substituons la 
définition des f, : 


+ TiEi = Ya Qi, ati. (4.226) 
i ai 
Vous voulez des détails ? Allez, une étape de plus que le strict nécessaire : nous écrivons 


à (mi — D YaQio)ei =; (4.227) 


Par linéaire indépendance des e;, nous avons annulation de tous les coefficients, c’est-à-dire 


= D Qiaÿo (4.228) 


comme annoncé. 


4.116. 

Attention à l’ordre des indices dans la dernière égalité : la matrice Q vient avec les indices dans 
l'ordre À, «, tandis que la matrice Q—! vient avec les indices dans l’ordre opposé : @,i. C’est pour 
cela qu'il est intéressant de noter avec des lettres latines les indices se rapportant à la première 
base, et avec des lettres grecques ceux se rapportant à la seconde base. 


NORMooNWKZooPMwYTO 
4.117. 
Les formules de changement de coordonnées de la proposition 4.115 s’écrivent souvent de la façon 
suivante : ITEMooLHQCooBRvS1p 
_ fN-1 
(1) Ya = (QT T)a ITEMooNXUGooJIeoBf 
(2) y=Qx. ITEMooEFILooNENamW 
(3) i = (Qy): ITEMooMOKHooFEJvIW 
(4) x = Qy 


Ces égalités reposent sur un petit paquet d’abus de notations qu’il convient de bien comprendre. 
Ici, x et y sont les éléments de K” donnés par les composantes de x dans les bases {e;} et {fa}, 
et Q est vu comme une matrice, un opérateur linéaire sur K”. Autrement dit, le choix des bases 
permet d'identifier E avec K" et la matrice Q avec l’application linéaire fQ de la proposition 4.70. 


4.4.3 Chan ement de base : matrice d’une a lication linéaire 
A PP 
PROPooNZBEooWyÿCXT\w 


Proposition 4.118. 
Soit une application linéaire t: E — E de matrices À et B dans les bases {e;} et {fa}. Si les bases 
sont liées par 


a = D Qijati; (4.229) 
i 
alors les matrices À et B sont liées par 
B = Q7!AQ. (4.230) 


Démonstration. L'hypothèse sur le fait que À et B sont les matrices de t signifie que pour tout 
ze E, 


_ > Ajitiej = > Ba,8Y8 Ja (4.231) 
— _ 


En remplaçant e; par son expression (4.220) en termes des f, et x; par son expression x; = (Qy)i 
(proposition 4.115), nous avons 


a) A: (00. (4.232a) 
ija 
= = 2@ TA)ai(Qy)ifa (4.232b) 


-5e Q7'AQY)a fa. (4.232c) 
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Puisque les f, forment une base, nous en déduisons Q71AQy = By. Et comme y est un élément 
quelconque de K”, nous en déduisons l'égalité de matrices 


B = Q-'AQ. SONÉTYOOE GET 


Il s’agit bien d’une égalité de matrices ou, à la limite, d'applications linéaires sur K”, et non 
d’une égalité d’application linéaire sur Æ. 


4.5 Espaces de polynômes 
SecEspacePolyÿynomes 
Attention : les polynômes en-soi, font l’objet de la définition 1.352. 
Pour chaque k > 0 donné, nous définissons 


PÈ = {p:R—Rl|p:xr ao + ax + ax? +: + apr, a ER, Vi =0,...,k}. (4.234) 


Il est facile de se convaincre que la somme de deux polynômes de degré inférieur ou égal à k est 
encore un polynôme de degré inférieur ou égal à k. En outre il est clair que la multiplication par 
un scalaire ne peut pas augmenter le degré d’un polynôme. L'ensemble P£ est donc un espace 
vectoriel muni des opérations héritées de Pr. 

La base canonique de l’espace P£ est donnée par les monômes B = {x xŸ|j=0,...,k}. Le 
fait que cela soit une base est vraiment facile à démontrer, et est un exercice très utile si vous ne 
l’avez pas encore vu dans un cours précédent. 

Nous allons maintenant étudier trois applications linéaires de Pk vers d’autres espaces vecto- 
riels. 


L’isomorphisme canonique à : PÈ — R+1 Nous définissons @ par les relations suivantes 
(x?) — Cj+1s Vie (Dire 
k 


Cela veut dire que pour tout p dans pa avec p(x) = ao + 17 + aot? + --- + ay", l’image 


de p par @ est 
k | k 
dj — . ajej+1: 
0 j=0 


®(p) «( 
J 


Exemple 4.119. 
Soit & —=5ona 


—8 
—7 
P(—8 — 7x — 4x? + 4x + 27°) — p (4.235) 
0 
2 
A 


Cette application est clairement bijective et respecte les opérations d’espace vectoriel, donc 
c’est un isomorphisme d’espaces vectoriels. L'existence d’un isomorphisme entre P£ et R+1 
est un cas particulier du théorème qui dit que pour chaque m dans N, fixée, tous les espaces 
vectoriels sur IR de dimension m sont isomorphes à IR”. Vous connaissez peut être déjà ce 
théorème depuis votre cours d’algèbre linéaire. 


La dérivation d: P£ — pie L'application de dérivation d fait exactement ce qu’on attend d’elle 
d(æ°) = d(i)=0,  d{x)= 5x7 1, Vief{1,...,k}. 


Cette application n’est pas injective, parce que l’image de p ne dépend pas de la valeur de 
ao, donc si deux polynômes sont les mêmes à une constante près ils auront la même image 
par d. 
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Exemple 4.120. 
Soit k = 30ona 


d(—8 — 12x + 4x°) = —192(1) + 4(3x?) = —19 + 1272. (4.236) 


Noter que d(—30 — 12x + 4x°) = d(—8 — 12x + 4x). Cela confirme, comme mentionné plus 
haut, que la dérivée n’est pas injective. A 


L'intégration 1 : P£ — Lis Nous pouvons définir une application qui est « à une constante 


près » l'application réciproque de la dérivation. Cette application est définie sur les éléments 
de base par 

aitl 
j+1 
Bien entendu, la raison d’être et la motivation de cette définition apparaîtront lorsque nous 
développerons une théorie générale de l’intégration. 


I(x) = 


(4.237) 


Exemple 4.121. 
Soit &k = 4ona 
2 4 5. 
I(6+2x+7x" +2") =6x+7 Fate (4.238) 
A 


Remarque : étant donné que dans la définition de 1 nous avons décidé d’intégrer entre zéro 
et x, tous les polynômes dans Pie qui sont l’image par 1 d’un polynôme de P£ ont ao = 0. 
Cela veut dire que nous pouvons générer toute l’image de 7 en utilisant un sous-ensemble de 
la base canonique de per en particulier B1 = {x + xi|j =1,...,k} € B nous suffira. Cela 
n’est guère surprenant, parce que l’image par une application linéaire d’un espace vectoriel 
de dimension finie ne peut pas être un espace de dimension supérieure. 
Les applications de dérivation et intégration correspondent évidemment à des applications 
linéaires de Pr dans lui-même. 
L'espace de tous les polynômes étant de dimension infinie, il peut servir de contre-exemple assez 
simple. Dans la sous-section 11.3.2, nous verrons que toutes les normes ne sont pas équivalentes 
sur l’espace des polynômes. 


4.6 Projection et orthogonalité 


PropProjScal 
Proposition 4.122. 


Si nous écrivons projy l'opération de projection sur la droite qui sous-tend Y, alors nous avons 
X :Y 
H'AR 
Démonstration. Les vecteurs X et Y sont des flèches dans l’espace. Nous pouvons choisir un 
système d’axe orthogonal tel que les coordonnées de X et Y soient 


lprojy X| = (4.239) 


z l 
X= {y}, Y=|0 (4.240) 
0 0 


où L est la longueur du vecteur Y. Pour ce faire, il suffit de mettre le premier axe le long de Y, le 
second dans le plan qui contient X et Y, et enfin le troisième axe dans le plan perpendiculaire aux 
deux premiers. 

Un simple calcul montre que X + Y = xl + y: 0 +0: O0 = xl. Par ailleurs, nous avons 
|proj, X| = x. Par conséquent, 
MAY Xe Y 


Iprojy X| = 
d l (PA 


(4.241) 
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Corolaire 4.128. 
Si la norme de Y est 1, alors le nombre X + Y est la longueur de la projection de X sur Y. 


Démonstration. Poser |Y| = 1 dans la proposition 4.122. 


4.7 Dualité 
PropEJBZooTNFPR; 


Proposition 4.124. 
Si À est la matrice d’une application linéaire, alors le rang de cette application linéaire est égal au 


rang de À, c’est-à-dire à la taille de la plus grande matrice carrée de déterminant non nul contenue 


dans À. 
Def JPGSHpn 


Définition 4.125. 
Soit E un espace vectoriel sur K. 

Une forme linéaire sur E est une application linéaire de E sur son corps de base K. 

Le dual algébrique de E, noté E*, est l’ensemble des formes linéaires sur E. Autrement dit : 
E* = £L(E,K). 


Nous verrons les formes multilinéaires en la définition 9.1. 
Nous verrons plus tard qu’en dimension infinie, les applications linéaires ne sont pas toujours 
continues. Nous définirons donc aussi un concept de dual topologique. Voir la proposition 11.62, 


la remarque 11.65 et la définition 25.1. 
DEFooTMSEooZFtsqa 


Lemme-Définition 4.126. 
Si E est un espace vectoriel et si {b;} est une base de E, alors nous définissons 


:E—K 
(4.242) 
bjr dj, 
et sa prolongation par linéarité. Ces éléments du dual E* forment une base appelée base duale. 
En particulier nous avons 


dim(E) = dim(E*). (4.243) 


Notons que si v € E est un vecteur, ça n’a aucun sens à priori de parler de v*. Il s’agit bien de 


définir toute la base {e*} à partir de toute la base {e;}. 
LEMooSVRlooFbxfue 
Lemme 4.127 (Changement de base duale{[1]). 
Soient un espace vectoriel V de dimension finie, une base {e;};=1..n et sa base duale {ai}i=1,..n. 
Soit une bijection linéaire A: V — V. Nous considérons {bi};=1...n la base duale de la base {Ae;}. 
Alors 


=) Aa; (4.244) 
j 


Démonstration. Par définition d’une base duale, il faut B;(Aezx) = 054. Vu que {a;} est une base, 
nous pouvons décomposer 5; de la façon suivante : B; — D B;ja;. Il nous reste à prouver que 
B= A, 

Pour cela nous calculons un peu : 


dk = Bi(Aex) — D Bijas(Aex) — D Bin a;(e) — D BaAx — (BA); (4.245) 
j 1j se 


jl 


Nous avons donc 64, = (BA);4, c’est-à-dire BA = 1 ou encore B = A7. 


LEMooQLiNooYUpGdo 
Lemme 4.128 ([132]|). 
Soit un espace vectoriel E de dimension finie. ITEMOoHHTLooNCig£n 


(1) Si a est une forme linéaire non nulle sur E, alors il existe x € E tel que a(x) = 1. 
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ITEMooBYAAooUWBKDKk 


(2) Six Z 0 dans E, alors il existe une forme linéaire a sur E telle que a(x) = 1. 


Démonstration. En deux parties. 
(1) Pour (1) Puisque a est non nulle, nous pouvons considérer v € E tel que a(v) Æ 0. Alors 
en posant x = a(v) lv, nous avons le résultat. 


(2) Pour (2) Soit un vecteur non nul que nous écrivons sous la forme x = ÿ}_, xie; (pour une 
certaine base {e;};=1...n de E). Supposons que xx # 0. Alors la forme 


a: E— K 
(4.246) 
y yk/Tk 

fait l'affaire. 

LEMooKTREooBrnWVz 
Lemme 4.129. 

Soit un espace vectoriel de dimension finie E sur le corps K. Si {a1,...,a,} est une base de E*, 

alors l’application 

d:E —K" 
(4.247) 
zr (o(x),...,an(x)) 


est un isomorphisme d'espaces vectoriels. 


Démonstration. En deux parties. 


(1) ® est injective Soit z e ker(®). Nous avons @;(z) = 0 pour tout i. Si z Æ 0, alors le lemme 
4.128 dit qu'il existe 8 € E* tel que B(z2) # 0. 
Décomposons un tel 5 dans la base de {a;} : 


i=1 
Alors nous avons . 
OZ B(2) = DB œf2) = 0. (4.249) 


Contradiction. Donc ker(®) = {0} et ® est injective. 


(2) ® est surjective Les espaces vectoriels E, E* et K” ont tout trois, une dimension n. Donc 
® est une application linéaire injective entre deux espaces de même dimension. Elle est donc 


surjective par le corolaire 4.48. 


PROPooDBPGooPagbEB 
Proposition-Définition 4.130 ([132]). 
Soit un espace vectoriel E de dimension finie sur le corps K. Toute base du dual E* est duale 
d’une unique base de E. Cette base est dite préduale. 


Démonstration. Nous considérons une base F = {a1,...,a,} de E*. Nous devons prouver qu’il 
existe une unique base de Æ dont la base duale est F. 
(1) Existence Le lemme 4.129 nous indique que l’application 
d:E — K” (4.250) 
ze (œ(x),...,an(r)) | 


est un isomorphisme d’espaces vectoriels. 
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Soit la base canonique de K” : (e1,...,6,). Puisque ® est un isomorphisme, (D l(e)), 


=i1,:.40 


est une base de Æ. Nous allons montrer qu’elle est préduale de (a;). Nous posons e; = ®{(6;) 
et nous calculons : 


(Pl (e;)) (4.251a) 
_ D(D-!(e;)), Re sris 
= (ci); (4.251c) 


6. RPAOSPNeese, 


œ(e;) 


Justifications : 
— Pour 4.251b, nous remarquons que @;(x) = P(x);. 
— Pour 4251d, nous utilisons le fait que les €; forment la base canonique de K”. 


(2) Unicité Soit une base préduale (e;) de (a;). Nous avons, par définition, que ai(e;) = Ô ;. 
Donc 
(a(e;),...,an(e;)) = €. (4.252) 


Nous appliquons &—! à cette dernière équation pour obtenir ej = D (e;). Donc les e; sont 
déterminés de façon unique à partir des @;. 


4.7.1 Changement de base duale 
PROPooDOEYooDpUbnc 


Proposition 4.131 ([1]). 
Soient deux bases {e;} et {e'j} de l’espace vectoriel V. Nous notons {a} et {al} les bases duales. 
Si €; = »,, Aije, alors 


di =Ù Aya. (4.253) 
k 


Démonstration. Nous posons à; = Y, Brjax et nous appliquons ça à ef. À gauche nous avons 


œ(ei) = 6;;, et à droite, 


2 Baiau(é) — 2: Paian( D) (4.254a) 


= D By Auiôpt (4.254b) 
= D Bi Ai (4.254c) 
= (BtA) (4.254d) 


Nous avons donc montré que B*A = 1, ou encore que Bt = A1, ce qu'il fallait. 


4.7.2  Orthogonal 
DEFooEFQSMooHVzbfz 


Définition 4.132. 
Soit E, un espace vectoriel, et F un sous-espace de E. L’orthogonal de F est la partie FL & E* 
donnée par 


T2 {ae E* tel que Vre F,a(x) = 0}. Fa Bb) 


Cette définition d’orthogonal via le dual n’est pas du pur snobisme. En effet, la définition 
« usuelle » qui ne parle pas de dual, 


Fi ={yeE tel que Vre F,y : x = 0}, (4.256) 
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demande la donnée d’un produit scalaire. Évidemment dans le cas de IR” muni du produit scalaire 
usuel et de l’identification usuelle entre R” et (R”)* via une base, les deux notions d’orthogonal 
coïncident. 

La définition 4.132, au contraire, est intrinsèque : elle ne dépend que de la structure d’espace 
vectoriel. 

Si BC E*, on note B° son orthogonal : 


B°={xe E tel que w(x) = 0,Vwe B}. (4.257) 


Notons qu’on le note B° et non B+ parce qu’on veut un peu s’abstraire du fait que (E*)* = E. 
Du coup on impose que B soit dans un dual, et on prend une notation précise pour dire qu’on 
remonte au pré-dual, et non qu’on va au dual du dual. 


PropXrTDIi 
Proposition 4.133. 
Soient un espace vectoriel E et F', un sous-espace vectoriel de E. Nous avons 
dim F + dim Ft = dim E. (4.258) 
Démonstration. Soit {e1,...,e,} une base de F que nous complétons en une base {e1,...,e,} de 
E par le théorème 4.13. Soit {ef,...,e;} la base duale. Alors nous prouvons que {e5,1,...,e7} est 


une base de Ft. 

D'abord, ce sont des éléments de F+, parce que si à < p et si & > 1, nous avons ep +r (ei) = 0; 
donc oui, Ep+k BE 

Ensuite, en tant que partie d’une base de F*, c’est une partie libre. Il reste à montrer que c’est 
générateur. 

Enfin Ft € Span{e*,k € {p+1,...,n}} parce que si w = 3%_,wre*, alors w(e;) = w;, mais 
nous savons que si w € F+, alors w(e;) = 0 pour à < p. Donc w = PI wper. 


La proposition 9.181 donnera une version plus terre à terre de la proposition 4.133 en disant que 
si nous avons un produit scalaire, alors £ = F@FT où Ft est cette fois défini comme l’orthogonal 
pour le produit scalaire. 


4.8 Représentation de groupe 

DEFooXVMSooXDIfZV 
Définition 4.134 (Représentation). 
Soit un groupe G. Une représentation de G est un couple (E, p) où E est un espace vectoriel et 
p est une application p: G — GL(E) vérifiant 


p(g) © p(h) = p(gh). (4.259) 


pour tout g,hEeG. 


Définition 4.135. 
Une représentation” p: G — GL(E) est fidèle si elle est injective 
La dimension de E est le degré de la représentation (E, p). 


Le fait que la représentation p: G — GL(E) soit fidèle ne dit pas que chacun des p(g) est 
injectif. 
PROPOoHNQUoo$SzeEFG 
Proposition 4.136. 
Soit un corps K. Si G est un groupe dans M{(n,K) (c’est-à-dire un groupe de matrices n x n à 
coefficients dans K), alors l'application 


p: G — GL(K") 


4.260 
A fa (4.260) 


où fA est l’application linéaire associée à À, est une représentation de G. 
49. Définition 4.134. 
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Démonstration. La représentation dont nous parons n’est autre que l’application Ÿ de la définition 
4.67, dont nous connaissons beaucoup de propriétés. La proposition 4.73 dit, entre autres, que 
V(AB) = Y(A)v(B), c'est-à-dire que p(AB) = p(A)p(B), et donc que p est une représentation. 


49 Somme directe d’espaces vectoriels 


Si V et W sont des espaces vectoriels, ce que nous notons V@&W n'est rien d’autre que l’espace 


vectoriel de l’ensemble V x W. 
DEFooJKAWooKkkkwm 


Proposition-Définition 4.137 ([133, 134]). 
Si V et W sont des espaces vectoriels sur le même corps K, alors les définitions 


(1) (v1, wi) + (va, Wa) = (v1 + va, w1 + Wa) 
(2) A(v,w) = (Av, Àw) 


donnent une structure d’espace vectoriel sur V x W. 


Cet espace sera noté V@W et est appelé somme directe de V et W. 
DEFooIJDNooRUDUYF 


Définition 4.138 (Sous-espaces en somme directe[135]). 

Soient un espace vectoriel E sur K ainsi que des sous-espaces vectoriels {Fi}ier (T1 est un ensemble 
fini ou infini). Nous disons que les F; sont en somme directe si pour tout élément u € D... F;, 
il existe un unique ensemble {u;};er de vecteurs tel que 


(A) u= Der ui 
(2) ui € F; pour tout i, 
(3) {je I tel que u; Æ 0} est fini. 


icl 


Si l’espace vectoriel E est un espace vectoriel topologique, nous avons la définition 7.166 qui 


donne des conditions de compatibilité entre les topologies. 
LEMooHWRVooLedAmF 


Lemme 4.139. 
Soit un espace vectoriel E et deux sous-espaces F1, F2 en somme directe : E — F1 @ F2. Alors 
l’application 

d: F X PF — E 


dass (4.261) 


est une bijection. 


Démonstration. L'application est injective parce que si d(x1,72) = Y(y1,y2), alors +1 + æ2 = 
y1 + y2. Nommons uw ce vecteur. Par unicité de l’ensemble {u1,u2} tel que u = u1 + u2, nous avons 
automatiquement {71,272} = {y1,y2} et donc +1 = y et d2 = y. 

En ce qui concerne la surjectivité, si u € E, il existe un ensemble {u;,u2} avec u; € F; tel que 
u = ü1 + u2 = Y(u1, u2). 


LEMooDQMQoo!InVVDY 
Lemme 4.140 ([1, 135]). 
Soient un espace vectoriel E ainsi que des sous-espaces vectoriels F;. Nous avons équivalence entre 
les assertions suivantes. 


(1) Les F; sont en somme directe *. 
(2) Si Der wi = 0 avec u; € F3 et si {j € I tel que u; Æ 0} est fini, alors tous les u; sont nuls. 


(3) Chaque espace F4 est en somme directe avec la somme des précédents, c'est-à-dire que pour 
tout k, 


(5) NF = {0}. (4.262) 
i=1 


50. Définition 4.138. 


4.9. SOMME DIRECTE D'ESPACES VECTORIELS 377 


ITEMooPLXGooCOQgen 
(4) Pour tout k, 
Fr n 5 ñ) = {0}. (4.263) 
i£k 
PROPooCASNooEqisqa 
Proposition 4.141 ([136]). 
Soient E un espace vectoriel de dimension finie, et deux sous-espaces Fi et F2 satisfaisant 
(1) F [A] F . {0}, 
(2) dim(F1) + dim(P2) > dim(E). 
Alors E = F @ F2. 
Démonstration. Soient une base {e;};er de F1 et {fa} de F2. Nous commençons par prouver que 


la partie B = {e;} L {fa} est libre. 
Supposons en effet, avoir des coefficients a; et b, tels que 


D Gies + Ÿ bafa = 0. (4.264) 


Cela implique que D, aie; = — 5, bafa. Or Die; € F1 et — 5, bafa € F2. Donc les éléments 
De et »,, bafa sont dans F1 n F2 = {0}. Nous avons alors les égalités 


D &e; = 0 (4.265) 
À 


et 
ae = v (4.266) 


La première implique a; = 0 pour tout 4 et la seconde implique b, = 0 pour tout a. 

Donc B est une partie libre de Æ contenant dim(FÆ) + dim(F2) > dim(Æ) éléments. La pro- 
position 4.18(1) nous indique alors qu’en réalité dim(Æ1) + dim(Æ2) = dim(Æ). Comme B est une 
partie libre contenant dim(Æ) éléments, c’est une base par la proposition 4.18(2). 


4.9.1 Structure réelle 

Proposition-Définition 4.142 ([137, 134, 1]). 

Soit un espace vectoriel E sur C. Il existe une application o: E — E telle que 
(1) o? = Idg 
(2) Pour tout a,BER, f(ar + By) = ao(x) + Bo(y). 


Une telle application est une structure réelle sur E. 


DEFooCIFSooVmcNtE 


Démonstration. La proposition 4.23 nous permet de considérer une base {e;};er de E. Alors, nous 


définissons : 
o(ÿ Xici) = ” \ei. (4.267) 


icl icl 


Notez que la somme est toujours finie. 


PROPooPZHPooNdarzg 
Proposition 4.148. 
Soit un espace vectoriel E sur C et une structure réelle®! o sur E. Nous posons 


Er = {ve E tel que o(v) = v}. (4.268) 


Alors 


(1) La partie Er est un espace vectoriel réel. 


51. Définition 4.142. 
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(2) Nous avons la décomposition en somme directe °? 
E = Er @OiEr. (4.269) 


Démonstration. En plusieurs parties. 


(1) Espace vectoriel réel Si v,w € Er, alors 


o{v + w) = o(v) + o(w) = v + w, (4.270) 


etsi ER, 
(Ar) = Ac(s) = Àx. (4.271) 
Donc ER est un espace vectoriel réel. 


Première somme directe Nous définissons 


RS 
Le) 
nr 


ET ={ve E tel que a(v) = v}, (4.272a) 
E = {ve E tel que o(v) = —v} (4.272b) 


Nous prouvons que 
D: ET xE —E 


4.273 
(a,b) > a +b ) 
est un isomorphisme d'espaces vectoriels. 
Puisque + est linéaire, il suffit de prouver qu’elle est bijective. 
(2a) Surjectif Sive E, alors en posant v} = L(v + o(v)), U_ — L(v — o(v)), nous avons 
v=uv,+u, veËTt, v_ eET, (4.274) 


et donc v = #(v+,u_). 

(2b) Injectif Supposons Ÿ(a,b) = (a, B). Alors a + b = à + B et donc a — à = 5 — b. 
Comme a— ae E* et B—be E-, nous savons quea—a=8B-beETnE.. Étant 
donné que E* n ET = {0}, nous avons a — a = B—b=0. 

Nous avons donc la somme directe E = ET@E-. 


(3) Conclusion Par définition, E* = Er. Il nous reste à voir que E7 = iE*. Nous prouvons 
les inclusions dans les deux sens. 


(3a) ET CiE*t Soit ve E-. Nous avons iv e E*; en effet 


o(iv) = io(v) = —io(v) = iv. (4.275) 


Donc ive E* pour ve ET. 
(3b) i£T € ET Soit ve E, et voyons que iv € E-. En effet, 


o(iv) = —io(v) = —iv. (4.276) 


4.144. 

Lorsque nous avons une structure réelle o sur un espace vectoriel complexe Æ, nous écrivons 
E = Er @iEr sans préciser dans la notation « Em » que cet ensemble dépend du choix de ©. En 
particulier si F est un sous-espace vectoriel de Æ, nous utiliserons la notation FR relativement à 
la même involution que celle utilisée pour E. 


Lemme 4.145. 
Soit un espace vectoriel complexe E muni d’une structure réelle o. Si Fest un sous-espace de E 
alors FR = ERrNF. 


52. Définition 4.137. 
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Démonstration. Par définition, 
FR = {ve F tel que o(v) = v}. (4.277) 


(1) RC F C’est dans la définition de FR (sous-ensemble de F). 


(2) FRC ER Sive FR, alors o(v) = v. Mais cette égalité est précisément celle qui permet 
d’être dans Em. 


Vous remarquerez que ce lemme ne fonctionne que parce que nous avons choisi la même struc- 
ture réelle sur F que sur E. 
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Chapitre 5 


Classification de certains groupes 


5.1 Théorèmes de Sylow 


Lemme 5.1. 
Soient H et K des sous-groupes finis de G. Alors 
[41 : IK] 
Card(HK) = —————. 5.1 
Attention : dans ce lemme, l’ensemble HK n’est pas spécialement un groupe. Ce serait le cas 
si H normalisait K, c’est-à-dire si nous avions Akh-le K, V(h,k) € H x K. 


ThoCauchyGpFini 
Théorème 5.2 (Théorème de Cauchy|[138]). 
Soit G un groupe fini et p un nombre premier divisant |G|. Alors 
(1) G contient un élément d'ordre p. 
(2) Si G est un p-groupe, il existe un élément central d’ordre p dans G. 
TholfdlEB 


Lemme 5.3 (Théorème de Cayley). 
Si G est un groupe d'ordre n alors il est isomorphe à un sous-groupe du groupe symétrique S,. 


Démonstration. L'action à gauche de G sur lui-même 
p:G—Sh 
p(x)g + xg 


est une permutation des éléments de G. Cela donne un morphisme injectif parce que si (x) = w(y) 
nous avons æg = yg pour tout g et en particulier pour g = e nous trouvons æ = y. 


Pour rappel, lorsque p est premier, nous notons F, = Z/pZ. 
LemaQxjcm 
Lemme 5.4. 
Soit p un diviseur premier de n. Alors il existe un morphisme injectif du groupe symétrique S, 
dans GL(n, F>). 


Démonstration. Soit {e;} la base canonique de IF”. Par exemple e1 = ([1]»,[0],,...,[0],). Nous 
avons le morphisme injectif 6: S, — GL(n,F,) donné par q(o)e; = e(i. 


RemFzxxst 
Remarque 5.5. 
En mettant bout à bout les lemmes 5.3 et 5.4, nous trouvons que si p est un diviseur premier de 


|G|, alors G peut être vu comme un sous-groupe de GL(n, F,). 
DEFooPRCHooVZdwST 


Définition 5.6. 
Soit p un nombre premier. Un p-groupe est un groupe dont tous les éléments sont d'ordre p” pour 
un certain m (dépendant de l'élément). 
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Soit G un groupe fini et p, un diviseur premier de |G|. Un p-Sylow dans G est un p-sous-groupe 
d'ordre p” où p" est la plus grande puissance de p divisant |G|. 


Notons que si p est un nombre premier, alors tout groupe d’ordre p”° est un p-groupe. 


Lemme 5.7. 
Soit G un groupe fini et P, Q des p-sous-groupes. Nous supposons que Q normalise P. Alors PQ 
est un p-sous-groupe de G. 


Si S est un p-Sylow, alors p ne divise pas le nombre |[G : S| = |G|/[S|. 
Propvocmon 
Proposition 5.8. 
Soit le corps fini F, = Z/pZ (p premier). Soit T le sous-ensemble de GL, (F,) formé des matrices 
triangulaires supérieures de rang! n et dont les éléments diagonaux sont 1. Alors T est un p-Sylow 
de GL,(F). 


Démonstration. Nous commençons par étudier le cardinal de GL, (F,). Pour la première colonne, 
la seule contrainte à vérifier est qu’elle ne soit pas nulle. Il y a donc p” — 1 possibilités. Pour la 
seconde, il faut ne pas être multiple de la première. Il y a donc p” — p possibilités (parce qu’il 
y a p multiples possibles de la premières colonne). Pour la k-ième colonne, il faut éviter toutes 
les combinaisons linéaires des (4 — 1) premières colonnes. Il y a pl telles combinaisons et donc 
p" — p"-1 possibilités pour la k-ième colonne. Nous avons donc 


Card (GL(n, F;)) = (p° —1)(p* — p)...(p" — pr) (5.3a) 
pp pi (= D 1) (91) (5.3b) 
2 a (5.30) 


où m est un entier qui ne divise pas p. 
En ce qui concerne le cardinal de T, le calcul est plus simple : pour la première ligne nous 


avons p*-l choix (parce qu’il y a un 1 qui est imposé sur la diagonale), pour la seconde p"?, etc. 
En tout nous avons alors _ 
M=p 7; (54) 


et Test un p-Sylow de GL, (F,). 


Proposition 5.9. 
Soit p un nombre premier. Un groupe fini G est un p-groupe si et seulement l’ordre de G est p” 
pour un certain n. 


Démonstration. Supposons que G est un p-groupe. Soit q un nombre premier divisant |[G|. Par le 
théorème de Cauchy (5.2), le groupe G contient un élément d’ordre gq, soit g un tel élément. Étant 
donné que Gest un p-groupe, g" = g1 = e pour un certain n. Donc g = p” et g = p parce que q 
est premier. Nous venons de prouver que p est le seul nombre premier qui divise [G|. L'ordre de G 
est par conséquent une puissance de p. 

Nous nous intéressons maintenant à l'implication inverse. Nous supposons que |[G| = p” pour 
un certain entier n > 0. Soit g € G; nous notons r l’ordre de G. Le sous-groupe gr(g) est d’ordre 
r, donc r divise |G| (par le théorème 2.13 de Lagrange). Le nombre r est alors une puissance de 


D. 


LemwDYQMg 
Lemme 5.10. 
Soit G, un groupe fini de cardinal |G| = n et p, un diviseur premier de n. Nous notons n = p 
où p ne divise pas r. Soit H un sous-groupe de G et S, un p-Sylow de G. Alors il existe g € G tel 
que 


mr 


gSg ‘NH (5.5) 
soit un p-Sylow de H. 


1. Définition 4.45. 
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Démonstration. Nous considérons l’ensemble G/S sur lequel H agit. Si a € G, le stabilisateur de 
[a] dans G/S est 


Fix ([a]) = {he H tel que [ha] = [a]} (5.6a) 
= {he H tel que a ‘ha € S} (5.6b) 
= aSa ! n H. (5.6c) 


Nous cherchons a € G tel que l’entier 


Card(H) EqZp 
Card (aSa-! N H) Lay 


soit premier avec p. En effet, dans ce cas le groupe Fix([a]) est un p-Sylow de H parce que 
|H : aSa-! n H| ne divise pas p. La formule des orbites (équation (2.68)) nous dit que 


|A] 
— = Card (Or). 5.8 
laSa-! n H| (Ou) ee, 
Supposons que toutes les orbites aient un cardinal divisible par p. Étant donné que G/S est une 
réunion disjointe de ses orbites, nous aurions 
Card(G/S) = él 

p | Dal 2 Sr (5.9) 
alors que S étant un p-Sylow, p ne peut pas diviser |[G|/|S|. Toutes les orbites n’ont donc pas un 
cardinal divisible par p, et il existe un a € G tel que (5.7) soit vérifiée. 


ThoUKkPDXf 
Théorème 5.11 (Théorème de Sylow). 
Soit G un groupe fini et p, un diviseur premier de |G|. Alors ITEMooETYHooX1UMQZ 
(1) G possède au moins un p-Sylow*. 
(2) Tout p-sous-groupe de G est contenu dans un p-Sylow. ItenMzNRVf 
(3) Les p-Sylow de G sont conjugués. TtenkYbuzz 


(4) Sin» est le nombre de p-Sylow de G, alors n, divise |G| et n, € [1]. 


Démonstration. En plusieurs points. 


(1) Nous savons de la remarque 5.5 que G est un sous-groupe de GL, (F,) et que ce dernier a 
un p-Sylow par la proposition 5.8. Par conséquent G possède un p-Sylow par le lemme 5.10. 


(2) Soit H un p-sous-groupe de G et S, un p-Sylow de G (qui existe par le point précédent). Par 
le lemme 5.10 il existe a € G' tel que aSa-! nH soit un p-Sylow de H. Mais H est un p-groupe 
et un p-Sylow dans un p-groupe est automatiquement le groupe entier. Par conséquent, 


H=aSa tr H (5.10) 


et H € aSa-!, ce qui signifie que H est inclus dans un p-Sylow. 


(3) Soit Æ un p-Sylow. Nous venons de voir que si S est un p-Sylow quelconque, alors H est 
inclus au p-Sylow aSa-! pour un certain a € G. Donc H est un p-Sylow inclus dans le p-Sylow 
aSa-!, donc H = aSa !. 


e fait que n, divise n vient du fait que tous les p-Sylow ont le même nombre d’éléments 

4) Le fait p divi ient du fait tous 1 Syl t le mê bre d’élément 
(ils sont conjugués) et sont deux à deux disjoints. Donc ils forment une partition de G et 
|[G| = n,|S| si S est un p-Sylow quelconque. 


2. Définition 5.6. 
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Montrons maintenant que n, est congru à un modulo p. Soit E l’ensemble des p-Sylow de G. 
Le groupe G agit sur Æ par conjugaison. Soit S un p-Sylow et considérons l’ensemble 


Es = {TE E tel ques: T=T,VseS}. (5.11) 


où l’action est celle par conjugaison. C’est l’ensemble des points fixes de E sous l’action de 
S. L'ensemble £ est la réunion des orbites sous S'et chacune de ces orbites a un cardinal qui 
divise |S| = p”. Par conséquent [Or| vaut 1 lorsque T € Es et est un multiple de p sinon. 
Nous avons donc 


[E|=|Es| mod p. (5.12) 
Nous voulons obtenir |Es| = 1. Évidemment S € Es parce que si s € S alors sSs! = S. 


Nous voudrions montrer que S est le seul élément de Es. Soit T'E Es, c’est-à-dire que Test 
un p-Sylow de G tel que 


Ts t=2T (5.13) 

pour tout s € S. Soit N le groupe engendré par S et T. Montrons que Test normal dans N. 
Un élément g dans N s'écrit 

9 = Siti°""Srtr (5.14) 


avec 5 € Sett eT.Site Ten utilisant le fait que T est un groupe et le fait que S le 
normalise, nous avons 


dti = hier a tel. (5.15) 


Donc T est un sous-groupe normal de N. Mais S et T sont conjugués dans N (parce que 
ils sont des p-Sylow de N), donc il existe un élément a € N tel que aTa-! = S. Mais étant 
donné que Test normal, 


S=aTa !=T. (5.16) 


Ceci achève la démonstration des théorèmes de Sylow. 


Proposition 5.12. 


1 


Si S est un p-Sylow dans le groupe G alors pour tout g € G, l’ensemble gSg— est encore un 


p-groupe. 


Démonstration. Si les éléments de S sont d'ordre p”, alors nous avons 


(gsg = gsîg = e. (5.17) 


1 1 


Pour avoir gs1g— = e, il faut et suffit que gs? = g, alors s7 = e, c’est-à-dire g = p”. Donc gSg 
est encore un p-Sylow. 


Lemcmbzum 
Lemme 5.13 ([139]). 
Soit G, un groupe fini et p, un nombre premier. Si H et K sont des groupes distincts d’ordre p, 
alors HN K = {e}. 


Démonstration. L'ensemble H nr K est un sous-groupe de H. Par conséquent son ordre divise celui 


de H qui est un nombre premier. Par conséquent soit |H n K] = 1, soit |H n K] = |H|. Dans le 
second cas nous aurions H = K, alors que nous avons supposé que H et K étaient distincts. 
PropyfhTmf 


Proposition 5.14 ([139)). 
Soit G un groupe fini et n le nombre de sous-groupes d’ordre p dans G. Alors le nombre d'éléments 
d'ordre p dans G vaut n(p — 1). 
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Démonstration. Si g est un élément d'ordre p dans G@, le groupe H engendré par g est d’ordre p. 
Réciproquement si A est un groupe d'ordre p, tous les éléments de H\{e} sont d’ordre p (parce 
que l’ordre d’un élément divise l’ordre du groupe). Donc l’ensemble des éléments d'ordre p dans 
G est la réunion des ensembles H\{e} où H parcourt les sous-groupes d’ordre p dans G. Chacun 
de ces ensembles possède p — 1 éléments et le lemme 5.13 nous assure qu'ils sont disjoints. Par 


conséquent nous avons n(p — 1) éléments d'ordre p dans G. 


Corolaire 5.15. 
Un groupe d'ordre premier est cyclique. 


Démonstration. Soit p l’ordre de G. Le nombre de sous-groupes d'ordre p est n = 1 (et c’est G 
lui-même). La proposition 5.14 nous dit alors que le nombre d’éléments d’ordre p dans G est p—1. 
Donc tout élément est générateur. 


5.2 Groupe monogène 
SECooXIHPooWVSjhT 
Groupe monogène : définition 1.318 ; groupe cyclique : définition 1.319. 
Le théorème suivant donne quelques informations à propos des groupes monogènes. Il impli- 
quera dans le corolaire 5.41 qu’un groupe monogène d'ordre n possède w(n) générateurs où @ est 


la fonction indicatrice d’Euler définie en 5.29. 
THOooDOMZoo0UEYHAe 


Théorème 5.16. 
Un groupe monogène est abélien. Plus précisément, 


(1) un groupe monogène infini est isomorphe à Z, 


(2) un groupe monogène fini est isomorphe à Z/nZ pour un certain n. 


Démonstration. Le groupe est abélien parce que g = a”, g = a" implique gg! = g"+" = g/g. Nous 
considérons un générateur a de G (qui existe parce que G est monogène) et le morphisme surjectif 


J:Z2-—G 


5.18 
po. (5-18) 


Si G est infini, alors f est injective parce que si a” = a”, alors a" = e, ce qui rendrait G cyclique 
et par conséquent non infini. Nous concluons que si G est infini, alors f est une bijection et donc 
un isomorphisme Z = G. 

Si G'est fini, alors f n’est pas injective et a un noyau ker f. Étant donné que ker f est un sous- 
groupe de G!, il existe un (unique) n tel que ker f = nZ et le premier théorème d’isomorphisme 


(théorème 2.6) nous indique que 


Z/ ker f = Z/nZ = Image f = G. (5.19) 


Le lemme suivant donne une démonstration alternative, avec une construction plus explicite 


de l’isomorphisme. 
LemZhxMit 


Lemme 5.17 ([1|). 
À propos de groupes monogènes* et cycliques. 


(1) Soit un groupe cyclique G de cardinal n dont g est un générateur. Alors i existe un isomor- 
phisme 
p: G— (Z/nZ, +) (5.20) 


tel que @(g) = 1. 


3. Définition 1.318. 
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(2) Si G est un groupe monogène d'ordre infini et si g est un générateur, alors existe un 


isomorphisme 


p:G—(Z,+) (5.21) 
tel que (g) = 1. 


(3) Soient G et H deux groupes monogènes de même ordre. Soient g un générateur de G et h, 


un générateur de H. Il existe un isomorphisme de G sur H qui envoie g sur h. 


Démonstration. Commençons par enfoncer une porte ouverte : comme le groupe est monogène, 
l’ordre du groupe est égal à l’ordre de son générateur. Nous séparons les cas selon que l’ordre soit 
fini ou non. 


(1) L’ordre de G est fini et vaut n Si k € Z, nous notons [k], la classe de & modulo n, 


— 


c’est-à-dire l’ensemble {k + pn tel que p € Z}. 
Nous construisons l’isomorphisme 6: G — Z/nZ de la façon suivante : 


®(g") = [mn (5.22) 


Cela est une bonne définition parce qu’une égalité du type g”” = g”” implique que m et m’ 

soient dans la même classe modulo n. Nous vérifions que cela est un isomorphisme entre G 

et Z/nZ. 

(la) Morphisme Pour l'identité, si x = e alors m = 0 et @(e) = [0],. Et si x = 9%, y = gl 
alors (xy) = (977) = [k+ ln = [ka + [ln = dx) + d(y). 

(1b) Injectif Supposons 4(g*) = @(gl) avec k > 1. Nous avons A° = h!, donc h*l = e, ce 
qui donne k — 1e [0], ou encore [k], = [{]h. En particulier g* = gl. 

(ic) Surjectif La classe [k], est l’image de gf. 

L'ordre de G est infini 

Si l’ordre de G est infini alors un élément x € G s’écrit de façon unique sous la forme x = g" 

avec m € Z. Dans ce cas nous définissons directement @(g”) = m. 


Le reste de la preuve est alors identique au cas d’ordre fini, mais sans les complications liées 
au modulo. 


La dernière assertion s'obtient des précédentes par composition d’isomorphismes. 


5.3 Automorphismes du groupe Z/nZ 


Notons que Z/nZ = F, est un groupe pour l'addition tandis que (Z/nZ)* est un groupe pour 


la multiplication. Il ne peut donc pas y avoir d’équivoque. 


Thoozyesn 
Théorème 5.18 ([140]). 
Pour chaque x € (Z/nZ)* nous considérons l’application 
Oz: Z]nZ — Z/nZ 
s:2/ / (5.23) 
y xy. 
L'application 
o: ((Z/nZ)*, : ) — Aut (Z/nZ, +) (5.24) 
ainsi définie est un isomorphisme de groupes. 
L’énoncé de ce théorème s’écrit souvent rapidement par 
Aut(Z/nZ) = (Z/nZ)*, (5.25) 


mais il faut bien garder à l’esprit qu'à gauche on considère le groupe additif et à droite celui 
multiplicatif. 


5.3. AUTOMORPHISMES DU GROUPE Z/NZ 387 


Démonstration. Nous notons [x] la classe de x dans Z/nZ. Nous avons Z/nZ = [1]. Soit f un 
automorphisme de (Z/nZ, +) ; pour tout r € Z nous avons 


Fr = Ar = F0) = MIE): (5.26) 
En particulier, puisque f est surjective, il existe un r tel que f([r]) = [1]. Pour un tel r nous avons 
[1] = fr]f([1]), c’est-à-dire que nous avons montré que f([1]) est inversible dans ((Z/nZ)*, - ). 
Nous montrons à présent que * 


o: Aut((Z/nZ, +)) 


en (H) G27) 


est un isomorphisme. 

Nous commençons par la surjectivité. Soit [a] € (Z/nZ)*. Les élément [a] et [1] étant tous 
deux des générateurs de (Z/nZ, +), il existe un automorphisme de Z/nZ qui envoie [1] sur [a] par 
le lemme 5.17. Cela prouve la surjectivité de oc. 

En ce qui concerne l’injectivité, considérons des automorphismes f\ et f2 de (Z/nZ, +) tels que 
fi([1) = f2(11])). Les automorphismes fi et f2 prennent la même valeur sur un générateur et donc 
sur tout le groupe. Donc fi = f2. 

Enfin nous prouvons que © est un morphisme, c’est-à-dire que o(f o g) = o(f)o(g). Nous avons 


f(g(1)) = FCO) = 91) FH) = o(Po(). (5.28a) 


Ce dernier résultat s'étend aux groupes cycliques. 
PROPooBZOMooVOHoYf 


Proposition 5.19. 
Si G est un groupe cyclique” d'ordre n, alors 


Aut(G) = ((Z/nZ)*, -). (5.29) 


Démonstration. Vu que G est cyclique, le lemme 5.17 nous dit que G est isomorphe à (Z/nZ), +. 
Maintenant le théorème 5.18 nous indique que 
Les égalités suivantes sont en réalité des isomorphismes de groupes : 


Aut(G) = Aut (2/n2, +) SUREDo NE BoEEE 


_ ((Z/n2y", | ) D ee 


Jusitifications. 


— Pour (5.30a). Le lemme 5.17 nous dit que G est isomorphe à (Z/nZ, +), et le lemme 1.40 dit 
que des groupes isomorphes ont des groupes d’isomorphismes isomorphes. 


— Pour (5.30b). C’est le théorème 5.18. 


CorwgmoTK 
Corolaire 5.20. 
Si p divise q — 1 alors Aut(F,) possède un unique sous-groupe d'ordre p. 


Démonstration. Si a est un générateur de F? alors le groupe 
gai EqAdGii 
gT (a ) k 631) 
est un sous-groupe d'ordre p. En ce qui concerne l’unicité, soit S un sous-groupe d’ordre p. Il est 
donc d'indice (q — 1)/p dans F% et le lemme 3.29 nous enseigne que le groupe donné en (5.31) est 


contenu dans S$. Il est donc égal à S parce qu'il a l’ordre de $. Le fait que $ soit normal est dû au 
fait que F? est abélien. 


4. Le o donné ici est l’inverse de celui donné dans l’énoncé. Cela ne change évidemment rien à la validité de 
l'énoncé et de la preuve. 
5. Définition 1.319. 
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5.4 Groupes abéliens finis 


Nous rappelons que l’exposant d’un groupe fini est le ppem des ordres de ses éléments. Dans 
le cas des groupes abéliens finis, l’exposant joue un rôle important du fait qu’il existe un élément 
dont l’ordre est l’exposant. C’est le théorème suivant. 


Théorème 5.21 (Exposant dans un groupe abélien fini). 
Un groupe abélien fini contient un élément dont l’ordre est l’exposant du groupe. 


Démonstration. Soit G un groupe abélien fini et x € G, un élément d'ordre maximum m. Nous 
montrons par l’absurde que l’ordre de tous les éléments de G& divise m. Soit donc y € G, un 
élément dont l’ordre ne divise pas m; nous notons q son ordre. Vu que q ne divise pas m, le 
nombre q possède au moins un facteur premier plus de fois que m : soit p premier tel que la 
décomposition de q contienne p° et celle de m contienne p° avec B > a. Autrement dit, 


m = pm (5.32a) 
qa=p°q (5.32b) 


où m' et g ne contiennent plus le facteur p. L'élément x étant d'ordre m, l’élément x?" est d’ordre 
m’. De la même manière, l’élément yŸ est d'ordre p”. Étant donné que p° et m/ sont premiers 
entre eux, l'élément x°°y1 est d'ordre p%m/ > m. D'où une contradiction avec le fait que x était 
d'ordre maximal. 

Par conséquent l’ordre de tous les éléments de G divise celui de x qui est alors le ppem des 
ordres de tous les éléments de @, c’est-à-dire l’exposant de G. 


PropfPRVxi 
Proposition 5.22. 
Soit G un groupe abélien fini et x € G, un élément d’ordre maximum. Alors 
(1) Il existe un morphisme @: G — gr(x) tel que w(x) = x. ItemKRYwjU 


(2) Il existe un sous-groupe K de G tel que G = gr(x)@ K. 


Démonstration. Nous notons a l’ordre de x qui est également l’exposant du groupe G. 

Nous allons prouver la première partie par récurrence sur l’ordre du groupe. Si G = gr(x), 
alors c’est évident. Soit H un sous-groupe propre de G contenant x et tel que le problème soit déjà 
résolu pour H : il existe un morphisme w: H — gr(x) tel que w(x) = x. Soit y € G\ AH, d'ordre b. 
Nous allons trouver un morphisme $: gr(H,y) — gr(x) telle que G(x) = x. 

Pour cela nous commençons par construire les applications suivantes : 


D: Z/0Z x H — gr(x) 


Eh) + ap(h) Ge 


où l est encore à déterminer, et 
p: 2/02 x H — gr(y, H) 


. (5.34) 


Pour que & soit bien définie, il faut que a divise bl. L'application p est bien définie parce que k est 
pris dans Z/bZ et que b est l’ordre de y. 
Nous allons construire le morphisme G en considérant le diagramme 


ker(p)— Z/0Z x H = gr(y, H) (5.35) 


| F4 
gr(x) 


que l’on voudra être commutatif. Puisque p est surjective, les théorèmes d’isomorphismes nous 


disent que 
Z/dZ x H 
H) = ———— 5.36 
gr(y; ) ker p ( ) 
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Si [k, h] est la classe de (k, h) modulo ker(p) alors nous voudrions définir @ par 
G(IE, A1) = 5,2). CS 0 
Pour que cela soit bien défini, il faut que si (r,z) € ker p, alors, 
P([kr, hz]) = O([Kk, h]), (5.38) 
c’est-à-dire que @(r,z) = e. Du coup la définition (5.37) n’est bonne que si et seulement si 
ker(p) € ker(@). (5.39) 


Nous pouvons obtenir cela en choisissant bien [. 

Déterminons d’abord le noyau de p. Pour cela nous considérons un nombre 6 divisant b tel 
que gr(y) n H = gr(y*). Nous aurons p(k,h) = e si et seulement si y} = e. En particulier 
h=7y "egr(y) n H = gr(y°). Si h = (y°)" = yTÉ, alors & = —mB et nous avons 


ker(p) = {(—-m8B,y"#) tel que m e Z}. (5.40) 


En plus court : ker(p) = gr(8,y "). Nous devons donc fixer { de telle sorte que @(8,y°) = e. 
Étant donné que w prend ses valeurs dans gr(x), il existe un entier a tel que w(y° 
utilisant cet &, nous écrivons 


PB, y) = sflo(y ?) = mire, (5.41) 


Par conséquent nous choisissons / = —a/5. Nous devons maintenant vérifier que ce choix est 
légitime, c’est-à-dire que a divise bl et que a/fB est un entier. 
Etant donné que y est d’ordre b, 


e = pu?) = p(y 07) = (y PV = atôle, (5.42) 


Par conséquent a divise 22 = —H]. 


Pour voir que { est entier, nous nous rappelons que a est l’exposant de G (parce que x est 
d'ordre maximum) et que par conséquent b divise a. Mais a divise a$- Donc a/fB est entier. 

Nous passons maintenant à la seconde partie de la preuve. Nous considérons un morphisme 
w: G — gr(x) tel que (x) = x. La première partie nous en assure l’existence. Nous montrons que 


dv: G — gr(x) ® ker(y 


gr (p(g),ge(g) !) (5.43) 


est un isomorphisme. D'abord gp(g)-! est dans le noyau de 4 parce que 4(g)-! étant dans gr(x), 
et ç étant un morphisme, 


p(ge(g)) = p(g)p(g) * = e. (5.44) 


L'application Ÿ est un morphisme parce que, en utilisant le fait que G est abélien, 


d(g192) = (p(g192), ng2p(ng2) *) (5.45a) 
= (p(n)v(g2),ne(g) ‘g2v(g2)*) (5.45b) 
= (gi) (go). (5.45c) 


L'application # est injective parce que si #(g) = (e,e) alors w(g) = e et gyp(g) ! = e, ce qui 
implique g = e. 

Enfin # est surjective parce qu’elle est injective et que les ensembles de départ et d’arrivée ont 
même cardinal. En effet par le premier théorème d’isomorphisme (théorème 2.6) appliqué à @ nous 
avons 


1GT = Igr(x)| * [ker(o)|. (5.46) 
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ThoRJWVJd 
Théorème 5.23. 
Si G est un groupe abélien fini non trivial, il exise un unique r > 0 et une unique liste de naturels 
(d1,...,d-) tels que 


(1) G=7/d4zZ@...@67Z/d,7Z 
(2) d>z1 
(3) di divise dira pour tout i =1,...,r — 1. 


Démonstration. Soit x: un élément d’ordre maximal dans G!. Soit n son ordre et 
H; — gr(x1) = Fu (5.47) 


D'après la proposition 5.22(2), il existe un supplémentaire X1 tel que G = F,, @ K1. Si K1 = {e} 
on s’arrête et on garde G = F,,. Sinon on continue de la sorte en prenant x2 d'ordre maximal 
dans X etc. 

Nous devons maintenant prouver l’unicité de cette décomposition. Supposons deux décompo- 
sitions avec les nombres (d1,...,d,) et (s1,...,54) : 


G=F26...6F: =F,:6...0F.. (5.48) 
L’exposant de G est d, et s,. Donc d, = s,. Les complémentaires étant égaux nous avons 


Fa D Fa = Fa D... @Fs, 1. (5.49) 


En continuant nous trouvons r = q et dj = 5. 


5.5 Groupes d’ordre pq 


Lemme 5.24. 
Soit G un groupe d'ordre pq où p et q sont des nombres premiers distincts. Nous supposons que 
Pp <q. 

(1) Le groupe G possède un unique q-Sylow. 

(2) Cet unique q-Sylow est normal dans G. 

(3) I n’est ni {e} ni G. 

(4) Le groupe G n’est pas un groupe simpleS. 


Démonstration. Soit n, le nombre de g-Sylow; par le théorème de Sylow 5.11(1) le groupe G 
possède des q-Sylow et par 5.11(4), 
ng € [1]e- (5.50) 


De plus le nombre n, divise |G| = pq. Donc n, vaut p, q ou 1. Avoir n; = p n’est pas possible 
parce que n € [1], et p < q. Avoir n, = q n’est pas possible non plus, pour la même raison. Donc 
ñ = 1. Notons À l’unique g-Sylow de G. 
Le fait que H soit normal est une conséquence de 5.11(3) parce que le conjugué de H est encore 
un q-Sylow alors que H est l’unique qg-Sylow. 
Vu que 
1<p=|H|< pq =1|G{, (5.51) 


le sous-groupe H n’est ni réduit à l'identité ni le groupe entier. 


Par conséquent G n’est pas simple parce qu’il contient un sous-groupe normal non trivial. 


Avant de lire le théorème suivant, n'oubliez pas de lire la définition d’un produit semi-direct 2.47. 


6. Pas de sous-groupes normaux non triviaux, 1.171. 
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ThoLnTMBy 
Théorème 5.25 ([141]). 
Soient deux nombres premiers distincts" p et q avec q > p. 
(1) Sip ne divise pas q — 1 alors tout groupe d'ordre pq est cyclique et plus précisément le seul 
groupe (à isomorphisme près) d'ordre pq est Z/pqZ. ITEMooFQXIo0FLAiUD 
(2) Sip | q —1, alors il n'existe que deux groupes d’ordre pq : 
— Le groupe abélien et cyclique Z/pqZ. 


— Le produit semi-direct non abélien 


C= 2/92 x, 2/02 FaNRP ES) 
où w(1) est d'ordre p dans Aut(Z/qZ). 


(3) Sip et q sont premiers entre eux, le produit est direct*. 


Démonstration. Division de la preuve en plusieurs parties. 


(1) Préliminaires avec Sylow 


Soit un groupe G d'ordre pq. Soient H, un g-Sylow et K, un p-Sylow de G. Ils existent parce 
que p et q sont des diviseurs premiers de |G| (théorème de Sylow 5.11). Si n, est le nombre 
de g-Sylow dans G alors n, divise [G| et n; = 1 mod qg. Donc d’abord n, vaut 1, p ou q. 
Ensuite n; = q est exclu par la condition n,; = 1 mod g; la possibilité n; = p est également 
impossible parce que p = 1 mod q est impossible avec p < q. Donc n, = 1 et H est normal 
dans G. 

L'ensemble H n K est un sous-groupe à la fois de H et de K, ce qui entraine que (théorème 
de Lagrange 2.13) | n K| divise à la fois p et q. Nous en déduisons que |H n K| = 1 et donc 
que HN K = {e}. 

Étant donné que H est normal, l’ensemble HK est un sous-groupe de G. De plus l’application 


V:HxK—HK 


Be k (5.53) 


est un bijection. Nous ne devons vérifier seulement l’injectivité. Supposons que hk = h'k'. 
Alors e = h-th'k'k=!, et donc 


hlh =(Kk M leHnK = f{e}. (5.54) 


Par conséquent |pq| = |H x K|] = |HK|, et HK = G. Le corolaire 2.49 nous indique que 
ne 
G=Hx,K ARE 


où w est l’action adjointe. Nous devons maintenant identifier cette action. En d’autres termes, 
nous savons que À = Z/q2 et K = Z/pZ et que w: Z/pZ — Aut(Z/qZ) est un morphisme. 
Nous devons déterminer les possibilités pour @. 

Soit n, le nombre de p-Sylow de G. Comme précédemment, n, vaut 1, p ou q et la possibilité 
ny, = p est exclue. Donc n, est 1 ou q. 


(2) Si p ne divise pas qg—1 


Si p ne divise pas q — 1 alors il n’est pas possible d’avoir n, = q parce que n, € [1],. Or dire 
ny = qg demanderait q € [1],, c’est-à-dire g = kp + 1, qui impliquerait que p divise q — 1. 

La seule possibilité est que n, = 1. Dans ce cas, K est également normal dans G. Du coup 
le produit semi-direct (5.55) est en réalité un produit direct (4 est triviale) et nous avons 


G=7Z/q2 x Z/pZ = 7/pqz. (5.56) 


7. Le cas p = q sera traité par la proposition 5.28. 
8. Cette affirmation me semble très bizarre. Comment deux nombres premiers distincts pourraient ne pas être premiers 
entre eux ? ?? 
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(3) Si p divise q—1 
Cette fois n, = 1 et n, = q sont tous deux possibles. Ce que nous savons est que &(Z/pZ) 
est un sous-groupe de Aut(Z/qZ). Par le premier théorème d’isomorphisme 2.6, nous avons 


_ IZ/p2 
[ker pl' 


\p(Z/pZ)| (5.57) 


ce qui signifie que |[p(Z/pZ)| divise |Z/pZ| = p. Par conséquent, |Yÿ(Z/pZ)| est égal à 1 ou p. 
Si c’est 1, alors l’action est triviale et le produit est direct. 

Nous supposons que [9(Z/pZ)| = p. Le corolaire 5.20 nous indique que Aut(Z/qZ) possède 
un unique sous-groupe d’ordre p que nous notons l'; c’est-à-dire que F = Image(y). Vu que 


w: Z/pZ — Aut(Z/qZ) est un morphisme, L est généré par (1) qui est alors un élément 
d'ordre p, comme annoncé. 


(4) Unicité Nous nous attaquons maintenant à l’unicité. Soient 4 et ÿ/ deux morphismes non 
triviaux Z/pZ — Aut(Z/qZ). Étant donné que Aut(Z/qZ) ne possède qu’un seul sous-groupe 
d'ordre p, nous savons que Image(ç) = Image(ÿ/) = l'. Nous pouvons donc parler de ÿ/-l en 
tant qu'application de Z/pZ dans l. Nous montrons que 


f: 2/q2 x, 2/pZ — Z/q2 x, Z/pZ 


5.08 
GE) => (ha (E) 
où à = glow est un isomorphisme de groupes. Le calcul est immédiat : 

FC, 1) f(hamke) = (ha, a(k1)) (ho, a(k2)) (5.59a) 
= (hig/(a(k1))homa(k1k2)) (5.59b) 
= f(hiw(k1)ho, k1ko) (5.59c) 
_ ne k1), (ho, ko)). (5.594) 


Par conséquent Z/q2Z x, Z/pZ = Z/q2 x, Z/pZ. 


Note : il existe des nombres premiers p et q tels que g = 1 mod p. Par exemple 7 = 1 mod 3. 
PROPooNSRYooEodtUl 


Proposition 5.26 ([53]). 
Soit G un groupe fini d'ordre pq où p et q sont deux nombres premiers distincts vérifiant 


pÆl modgq (5.60a) 
gÆl mod p. (5.60b) 
Alors G est cyclique, abélien et 

G = Z/pZ x Z/q2. (5.61) 


Démonstration. Soient n, et n, les nombres de p-Sylow et g-Sylow. Par le théorème de Sylow 5.11, 
ny divise pq et n, = 1 mod p. Le second point empêche n, de diviser p. Par conséquent n, divise 
g et donc n, vaut 1 ou q. La possibilité n, = q est exclue par l’hypothèse g Æ 1 mod p. Donc 
np = 1, et de la même façon nous obtenons n, = 1. 

Soient $S l’unique p-Sylow et T', l'unique q-Sylow. Pour les mêmes raisons que celles exposées 
plus haut, ce sont deux sous-groupes normaux dans G. Étant donné que S est d’ordre p” pour un 
certain n et que l’ordre de S doit diviser celui de G@, nous avons |S| = p. De la même façon, [T| = q. 
Par conséquent S' est un groupe cyclique d’ordre p et nous considérons x, un de ses générateurs. 
De la même façon soit y, un générateur de T'. 

Nous montrons maintenant que x et y commutent, puis que xy engendre G. Nous savons que 
S AT est un sous-groupe à la fois de S et de T, de telle façon que |S A T| divise à la fois |S| = p 
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et [T| = q. Nous avons donc |[S À T| = 1 et donc S n T se réduit au neutre. Par ailleurs, S et T 
sont normaux, donc 


(zyz y leT (5.62a) 
a(yx y des, (5.62b) 
donc zyx-lyl =e, ce qui montre que y = yx. 
Montrons que xy engendre G. Soit m > 0 tel que (xy)” = e. Pour ce m nous avons 4° = y" 
et y" = x, ce qui signifie que x” et y” appartiennent à S n T et donc x" = y" = e, Les 


nombres p et q divisent donc tous deux m; par conséquent ppem(p,q) = pq divise m. Nous en 
concluons que xy est d'ordre pq (il ne peut pas être plus) et qu’il est alors générateur. 

Pour la suite nous allons d’abord prouver que G& = ST puis que G = S x T. Nous savons déjà 
que |[S n T| = 1, ce qui nous amène à dire que [ST] = [SIT]. En effet si s,3 € Sett,t'et et si 
st = s't/, alors t = s=ls/t', ce qui voudrait dire que s- ls’ e T et donc que s7ls/ = e. Au final nous 
avons 


IST] = ISITT = pq = 1G1. (5.63) 


Par conséquent G = ST. En nous rappelant que S n T = {e} et que S et T sont normaux, le 
lemme 1.263 nous dit que G = S x T. Le groupe S étant cyclique d’ordre p nous avons S = Z7/pZ 
et pour T', nous avons la même chose : T = Z/q%. Nous concluons que 


G= 2/pZ x Z/q2. (5.64) 


ThoImkljy 
Théorème 5.27 (Théorème de Burnside[89]). 
Le centre d’un p-groupe non trivial est non trivial. 


Démonstration. Soit G un p-groupe non trivial. Nous considérons l’action adjointe G sur lui-même. 
Les points fixes de cette action sont les éléments du centre : 


Zac = {2€ G tel que o:(z) = 2,Vx e G} = Fixc(G). (5.65) 


Nous utilisons l’équation aux classes (2.38) pour dire que [G|] = [Zc| mod p. Mais |Za| n’est pas 
vide parce qu’il contient l'identité. Donc |ZG| est au moins d’ordre p. 


PropssttFK 
Proposition 5.28. 
Si p est un nombre premier, tout groupe d'ordre p ou p°? est abélien. 


Rappel : un groupe d’ordre p ou p? est automatiquement un p-groupe. 


Démonstration. Si [G| = p, alors le théorème de Cauchy 5.2 nous donne l’existence d’un élément 
d'ordre p. Cet élément est alors automatiquement générateur, G est cyclique et donc abélien. 

Si par contre G est d'ordre p?, alors les choses se compliquent (un peu). D’après le théorème 
de Burnside 5.27, le centre Z n’est pas trivial; il est alors d'ordre p ou p?. Supposons qu'il soit 
d'ordre p et prenons x € G\Z. Alors le stabilisateur de x pour l’action adjointe contient au moins 
Z et x, c’est-à-dire que | Fixg(x)| > p+ 1. Étant donné que Fixg(x) est un sous-groupe, son ordre 
est automatiquement 1, p ou p°. En l’occurrence, il doit être p? (parce que plus grand que p), et 
donc x doit être central, ce qui est une contradiction. 


5.5.1 Fonction indicatrice d’Euler 
DEFooZRYMooZCozga 


Définition 5.29. 
La fonction indicatrice d’Euler est l’application 


&w: N* — N* 
(5.66) 
nr Card (rm € N* tel que 1 £<m <n,pgcd(m,n) = 1}). 
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Note : voir le thème 11 pour des formules concernant l’indicatrice d’Euler. 
LEMooVGDHooStUaKH 


Lemme 5.30 ([142]). 
L'élément [m], est inversible dans le groupe ((Z/nZ)*, : ) si et seulement si pgcd(m,n) = 1. 


Démonstration. Dans les deux sens. 


(1) = Si [m,] est inversible, il existe u € Z tel que [u],[m]» = [1],. Cela donne [um], = [1] 
ou encore um € [1]», c’est-à-dire um = 1 + vn. Le théorème de Bézout 1.229 conclut que 
pacd(m,n) = 1. 

(2) = Si pgcd(m,n) = 1, alors le théorème de Bézout 1.229 nous dit qu’il existe u,v € Z tels 
que um + un = 1. Cela donne directement um = 1 — un € [1], et donc [u], est un inverse de 
[mn dans le groupe multiplicatif Z/nZ. 


LEMooCLYEooOUNhWKs 
Lemme 5.31. 
Nous avons 
g(n) = Card ((Z/nZ)*) (5.67) 
où A* est le groupe des inversibles (pour la multiplication) dans l’anneau À. 
Démonstration. En utilisant le lemme 5.30, 
(Z/nZ)”" = {[m]A tel que pgcd(m,n) = 1} (5.68a) 
= {[m], tel que 1 < m < n,pgcd(m,n) = 1} (5.68b) 


Comme deux entiers différents entre 1 et n ne peuvent pas être dans la même classe modulo n, il 
y à bijection entre le dernier ensemble et {1 < m < n tel que pgcd(m, n) = 1}. Donc 


g(n) = Card ({[m]A tel que 1 < m < n,pgcd(m,n) = 1}) = Card ((Z/nZ)*). (5.69) 


LEMooRGIYooRxgyCO 
Lemme 5.32 ([143]). 
Soit n,dEe N tels que d | n. Nous notons q = n/d et G = {k[qln tel que 0 < k < d—1}. Alors, 
pour r € Z nous avons d[r], = [0], si et seulement si [r], € G. 
Démonstration. Dans les deux sens. 


(1) = Nous supposons que d[r], = [0],. Étant donné que n = dq nous avons les implications 
suivantes : 


d[rlx = [0 = 2 | dr = da | dr = a | r. (5.70) 


Nous avons donc r = kq pour un certain k € Z. Par la division euclidienne 1.215, il existe 
s,t€ N tels que k = sd +t avec t < d. Avec ça, nous avons le calcul 


[rm T k[q}n — sd[q}n + t[aln = s[dq}n +t[qln et, (5.71) 


(2) = Sifrln e G, il existe 0 < k < d — 1 tel que [rl1 = k[g]n. De ce fait, 
d[r]n = dk[q]n . k[dqln = [O]n. (5.72) 


Et voila. 


La proposition suivante est un pas important dans l’algorithme de Shor permettant aux ordi- 
nateurs quantiques de factoriser rapidement des grands nombres[144]. 
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THOooXMBSooXrrfOP 
Théorème 5.33 (Euler-Fermat|145]). 
Deux énoncés très similaires. 
(1) Soient a,n premiers entre eux dans N. Alors Nous avons la formule 
Hell. (5.73) 
ITEMooJHZBooXVKMIT 
(2) Soient À, B € N premiers entre eux. Alors il existe p,m € N tels que 
# =mB +1. (5.74) 


Démonstration. Vu que pgcd(a,n) = 1, le théorème de Bézout 1.229 donne ua+vn = 1, c’est-à-dire 
u[aln € [1]n. Autrement dit, [a], est inversible dans Z/n7Z. De ce fait l’application 


F: (Z/n2)" > (Z/n2)” 


ze [alhx 


(5.75) 


est une bijection. 
Un produit peut être réindexé par une bijection ?. En posant P = [ec /nZyx Ÿ; NOUS AVONS 


Fe |], & (5.76a) 


xe(Z/nZ)* 

=  [[ f(@) (5.76b) 
xe(Z/nZ)* 

= [al,x (5.76c) 
xe(Z/nZ)* 

{II [alu ) ( [I 5) (5.76d) 
xe(Z/nZ)* xe(Z/nZ)* 


Card ((Z/nZ)*) 


= [a] 


En simplifiant par P dans Z/nZ nous trouvons 


P (5.76e) 


Card ((Z/nZ)*) 


[al 


Et comme le lemme 5.31 donne Card ((Z/nZ)*) = g(n), nous avons trouvé [a]£t = [1]1. Autre- 
ment dit, 


sf}. (5.77) 


af(n) e [1]n. (5.78) 


Le point (2) n’est qu’une reformulation. Vu que À et B sont premiers entre eux, nous venons 
de voir que A?(P) e [1]g. Il existe donc m € Z tel que A?) = 1 + mB. Vu que À et B sont dans 
N, le nombre m est contraint d’être positif, c’est-à-dire m € N. 


LEMooKPKBooPbrHKkT 
Lemme 5.34 ([143]). 
Soient d | n dans N*. Nous considérons le groupe additif Ga = {k[qln tel que 0 < k < d—1}. Les 
éléments d'ordre !° d dans (Z/nZ,+) sont les générateurs de G4. 


Démonstration. Les générateurs de G} sont d'ordre d parce que |[Gy] = d. Ça, c'était le sens facile. 
Dans l’autre sens, si [r], est d'ordre d, alors d[r], = [0]1. D’après le lemme 5.32, cela prouve que 
[rÎn € Ga. 

Comme le groupe engendré par [r], est d'ordre d, il est tout Ga. Donc [r|, est générateur de 


Ga. 


9. Proposition 1.302. Pour rappel, le produit n’est rien d’autre qu’une somme pour un groupe dont la loi est 
notée multiplicativement. 
10. Ordre d’un élément, définition 1.261. 
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LEMooQGGLooDkkmcF 
Lemme 5.35 ([146]). 
L'ensemble des générateurs de (Z/n2Z, +) est (Z/nZ)*. 


Démonstration. Si [r]\ est générateur de Z/n7, il existe k tel que kfr], = [1],. Dans ce cas, [k], 
est l'inverse de [r]\ pour la multiplication. Donc [rl], € (Z/nZ)*. 

À l'inverse, si [rl], est inversible, alors il existe k tel que k[r]h = [1]n. Dans ce cas, [t], = kt[rl,. 
ce qui montre que [r|, est générateur (pour l’addition). 


LEMooRMWRooRS jGPL 
Lemme 5.36 ([146]). 
Si G est un groupe cyclique d'ordre n, alors G possède $(n) générateurs. 


Démonstration. Vu que tous les groupes cycliques d’ordre n sont isomorphes à (Z/nZ),+, nous 
nous contentons de prouver le résultat pour ce groupe. Le lemme 5.35 montre que (Z/nZ, +) 
possède Card ((Z/nZ)*) générateurs. 

Mais le lemme 5.31 assure que Card ((Z/nZ)*) = (n). 


PROPooYHUDooUROTiN 
Proposition 5.37. 
Nous avons la formule 


= > p(d). FaTEE gg) 


din 


Démonstration. Nous notons Hy la partie de (Z/n7Z, +) composée des éléments d’ordre d. Nous 
avons vu dans le lemme 5.34 que H sont justement les générateurs de Gy — voir le lemme pour la 
notation. Mais comme G4 est un groupe cyclique d’ordre d, il contient w(d) générateurs (lemme 
5.36) : Card(Hy) = y(d). 
Vu que tous les éléments de Z/nZ ont un ordre qui divise n (corolaire 2.14), nous avons l’union 
disjointe 
Z/n2 = |) Ha, (5.80) 
din 


et donc au niveau des cardinals, 


n = Card(Z/n7) = Ÿ Card(Ha) = Ÿ w(d). (5.81) 
din din 


LEMooBEJOooDqTir j 
Lemme 5.38. 


Si p est un nombre premier, alors @(p") = p" n—1 


— D 
Démonstration. Les éléments de {1,...,p"} qui ont un pgcd différent de 1 avec p” sont des nombres 


qui s’écrivent sous la forme gp avec q < p*-1 11. Il y a évidemment p*-! tels nombres. 
n—1 


Par conséquent le cardinal de P,» est @(p") = p° —-p 


ii Avertissement /question au lecteur !! 5.39 
P, n’a pas été défini. 

Définition proposée (et vue par après) : P, = {me N tel que pgcd(m,n) = 1}. À mettre donc 
en lien avec Ay. 


5.5.2 Générateurs 
PropZnmuphiGensn 


Proposition 5.40. 
Soit n € N\{0} et le groupe (additif) Z/nZ. L'élément [x], est un générateur de Z/nZ si et 
seulement si x € P,. En particulier Z/nZ est un groupe contenant ç(n) générateurs. 


11. Corolaire 3.23. 
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Démonstration. Nous avons gr ([1],) = Z/nZ. L'élément [x], sera générateur si et seulement si il 
génère [1],, c’est-à-dire si il existe u tel que u[x], = [1],. Cette dernière égalité étant une égalité 
de classes dans Z/n7Z, elle sera vraie si et seulement si il existe v tel que 


ux + un = 1. (5.82) 


Cela signifie entre autres que !? xZ + nZ = Z, et aussi que pgcd(x,n) = 1 par le théorème de 
Bézout 1.229, et donc que x € P. 


CORooMBLSooMHKmAq 
Corolaire 5.41. 
Un groupe monogène d'ordre n possède w(n) générateurs, où ÿ est la fonction indicatrice d’Euler 
définie en 5.29. 


Démonstration. Le théorème 5.16 nous dit qu’un groupe monogène d'ordre n est isomorphe à 
Z/nZ. La proposition 5.40 nous indique que Z/nZ possède p(n) générateurs. 


5.5.3 Fonction indicatrice d’Euler (propriétés) 


subSecKGDEonAtEMSS 
Corolaire 5.42. 
Deux propriétés. 
(1) L'indicatrice d’Euler est multiplicative : si p est premier avec q, alors 
p(pq) = p(p)p(a). (5.83) 
(2) Si p est un nombre premier, 
pG) = (p—1). (5.84) 


Démonstration. Nous savons que si p et q sont premiers entre eux, alors le théorème 5.25 nous 
donne l’isomorphisme de groupe 


(Z/pq2, +) = (Z/p2Z, +) x (Z/q2, +). (5.85) 


Un élément (x,y) est générateur du produit si et seulement si x est générateur de Z/pZ et y est 
générateur de Z/qZ. Par la proposition 5.40, il y a w(p)w(q) tels éléments. Par ailleurs le nombre 
de générateurs de Z/pqZ est (pq), d’où l'égalité. 

Si p est premier, nous avons w(p) = p — 1 parce que tous les entiers de {1,...,p — 1} sont 
premiers avec p. 


5.6 Groupe symétrique, groupe alterné 
SECooZFYQooFfopMa 
La définition des permutations et du groupe symétrique sont 1.267. Voir aussi le thème 8. 


5.6.1 Le groupe alterné 


DEFO0oEIVIooFvVkHH 
Définition 5.43. 
Le groupe À, des permutations paires !* dans S, est le groupe alterné. 
PROPooCPXOooVxPAi;j 
Proposition 5.44. 
À propos du groupe alterné dans le groupe symétrique. 
(1) Le groupe alterné A, est un sous-groupe caractéristique * de Sy ITEMooWXXUooOWVFgE 


(2) Le sous-groupe À, est d'indice 2 dans S,. 


12. Corolaire 1.231 
13. Définition 1.289. 
14. Définition 1.169. 
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ITEMooGGAHooRYgNqq 


(3) Le sous-groupe À, est l’unique sous-groupe d'indice !* 2 de S,. 


Démonstration. Soit à € Aut(S,). Étant donné que € o & est un homomorphisme surjectif sur 
{—1,1}, par unicité de cet homomorphisme, nous avons € 0 & = €, et donc a(A,) = Ah. Par le 
premier théorème d’isomorphisme 2.6, il existe un isomorphisme 


f: Sn/ker(e) — Image(e). (5.86) 


En égalant le nombre d'éléments nous avons |S, : kere] = [S, : A,] = 2. 

Nous prouvons maintenant l’unicité. Soit H un sous-groupe d'indice 2 dans S$,. Par le lemme 
3.28, H est distingué et nous pouvons considérer le groupe $,/H. Ce dernier ayant 2 éléments, il est 
isomorphe à {—1,1}. Soit 0 l’isomorphisme. On note 4 le morphisme canonique w: 5, — S,/H : 


EqS7BP 
Dr nes) ASP 
La composition 40 est alors un homomorphisme surjectif de $, sur {—1,1} et nous avons 404 = € 


par la proposition 1.293. L'enchainement (5.87) nous montre que H = ker(@o) = ker(e) = A;. 
PROPooPSZVooSmAgPA 


Proposition 5.45 ([147]). 
Le groupe symétrique S, peut être écrit comme un produit semi-direct}$ du groupe alterné : 


Sn = An Xe 2/22 (5.88) 
où l’action de Z/2% sur A, est la conjugaison par o = (12), c’est-à-dire p(—1)r = oro !. 


Démonstration. Nous avons la suite exacte 


1 RE 0 + {+1} — 1 (5.89) 


où les à représentent des inclusions et € est la signature définie en 1.290. Grâce à cette suite et 
au fait que la signature soit un isomorphisme à partir de la partie {Id,o} (pour © d’ordre 2, par 
exemple o& = (12)), le théorème 2.48 nous dit que 


She y Si do} (5.90) 
où @ est l’action adjointe de {Id,o} sur À;. [1 
PROPooZO0WBoo1IMxx]1 j 


Proposition 5.46. 
Si BE Sn est une transposition, nous avons les égalités suivantes d’ensembles : 


Sn = An LU An = An LU BAn. (5.91) 
Démonstration. Les parties 4, et 5 A, ont le même nombre d’éléments. En effet, l'application 


D: An — Anf 


ue (5.92) 


est une bijection. 

De plus ces deux ensembles sont disjoints à cause de la proposition 1.293. En effet si o € 4, 
alors e(o) = 1. Mais un élément de 4,8 est de la forme of avec o € À,. Or e est un homomorphisme, 
donc e(oB) = e(a)e(B) = —1. 

Enfin, la proposition 5.44(2) dit que À, est d'indice deux dans $,. Donc la partie 


An U AnB (5.93) 


contient |Sn|/2 + |[Sn|/2 = [Sn 


15. Définition 2.12. 
16. Définition 2.47. 


éléments. C’est donc 5». 
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LemiApyfp 
Lemme 5.47. 
Le groupe dérivé du groupe symétrique est le groupe alterné : D(S,) = An. 


Démonstration. Tout élément de D(S,) s'écrit sous la forme ghg-lh-!. Quel que soit le nombre 
de transpositions dans g et h, le nombre de transpositions dans [g, h] est pair. 


PropsHlmvv 
Proposition 5.48 ([148]). 
Soit n > 3. Les 3-cycles c; = (1,2,i) avec à = 3,...,n engendrent le groupe alterné A,. 
Démonstration. Soit H, le groupe engendré par les c;. D’abord nous avons 
Gi = (1,2,i) = (1,2)(2,i), (5.94) 


de telle sorte que e(c;) = 1. Par conséquent nous avons À € A4. Nous montrons par récurrence 
que À, € H. 

Pour n = 3 il suffit de vérifier que A3 = {Id,c3, c4}. Supposons avoir obtenu le résultat pour 
An_1, et prouvons le pour À,. Soit s € A. 

Si s(n) = n, alors s se décompose de la même manière que sa restriction 4” à {1,...,n — 1}. 
Par l'hypothèse de récurrence, cette restriction, appartenant à 4À,_:1, se décompose en produit des 
C3,-..., Cn_1 et de leurs inverses. 

Si s(n) = k alors nous considérons l'élément c?cys. Cet élément envoie n sur n et peut donc 
être décomposé avec les c; (i = 1,...,n — 1) en vertu du point précédent. 


PropiodtBG 
Proposition 5.49. 
Lorsque n > 5, tous les 3-cycles de A, sont conjugués. Autrement dit, la classe de conjugaison 
d’un 3-cycle est l’ensemble des 3-cycles. 


Démonstration. Soient les 3-cycles o = (i1, 42,13) et & = (1, 12, 13). Nous considérons une bijection 
a de {1,...,n} telle que a(i,) = j,. Nous avons immédiatement que à € S, et que aoa! = . 
Donc les 3-cycles sont conjugués dans $,. Il reste à prouver qu'ils le sont dans 4,. 

Si a est une permutation paire, la preuve est terminée. Si a est impaire, alors nous devons 
un peu la modifier. Comme n > 5, nous pouvons prendre s et t, des éléments distincts dans 
{1,...,n}\{91, 2,33} et poser 7 = (st). Puisque la signature est un homomorphisme et que 7 et « 
sont impairs, l'élément ra est pair (lemme et proposition 1.292 et 1.288) et est donc dans 4,. Les 
supports de 7 et 4 étant disjoints, ces derniers commutent et nous avons 


1 


(ra)o(ra) ! = r(aoa !)r 1 = rp7 1 = 6. (5.95) 


Donc © et & sont conjugués par 7a qui est dans À,. 
ThoUR£fSUXP 


Théorème 5.50 ([53]). 


Le groupe alterné À, est simple !T 


pour n > à. 


Démonstration. Soit N, un sous-groupe normal de À, non réduit à l'identité. Étant donné que 
les 3-cycles engendrent 4, (proposition 5.48) et que tous les 3-cycles sont conjugués dans À, 
(proposition 5.49), il suffit de montrer que N contient un 3-cycle. En effet si N contient un 3-cycle, 
le fait qu’il soit normal implique (par conjugaison) qu’il les contienne tous et donc qu’il contient 
une partie génératrice de À,. 

Soit donc o € N différent de l'identité. Nous prenons À dans le support de o et j = o(i). Nous 
choisissons ensuite k € {1,...,n}\{i,j,a !(i)} et m = a(k). Nous considérons la permutation 
a = (ijk). Étant donné que N est normal, l'élément 


8 = (a lœa)o | (5.96) 


17. Pas de sous-groupes normaux non triviaux, définition 1.171. 
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est dans N. De plus en utilisant le lemme 1.283 et le fait que &! = (ikj) nous avons 


0 = (ikj)(jo(j)m). (5-97) 


Cela n’est pas spécialement un 3-cycle, mais nous allons en construire un. Nous allons déterminer 
que 0 est soit un 5-cycle, soit un 3-cycle , soit un 2 x 2-cycle suivant les valeurs de o(j) et m. 
Souvenons-nous que nous avons : 


— #3 = o(i), puisque à est dans le support de o ; 
— kZiet k £ j, par définition de k (rappelons aussi que k Z# o-!(i)); 
— m£éi,méjet m £o(j) puisque m = o(k). 
Il ne nous reste alors seulement les deux possibilités suivantes : 
(1) soit m = k, soit m £ k, d’une part; 
(2) soit o(j) = 4, soit o(j) = k, soit o(j) n’est ni 4, ni k, ni m, d’autre part. 


Supposons dans un premier temps que m = k; alors 
0 = (ik) (ol). (5.98) 
C’est à priori un 2 x 2-cycle. Mais si de plus o(j) = 4, alors 
0 = (ijk) (5.99) 


qui est un 3-cycle; et si o(j) = k, alors 
0 = (ik) (5.100) 
qui est un autre 3-cycle. 
Supposons à présent que m # k. Si o(j) n’est ni à, ni k, ni m, alors à, j, k, o(j) et m sont cinq 
nombres différents, et 


8 = (i,j0{ÿ),m,k) (5.101) 
est un 5-cycle. Si o(j) = à, alors 
0 = (ikj)(jim) = (imk) (5.102) 
qui est un 3-cycle. Si o(j) = k, alors 
0 = (ikj)(jkm) = (ikm) (5.103) 


qui est encore un 3-cycle. 
Bref nous avons montré que 0 est soit un 3-cycle, soit un 5-cycle, soit un 2 x 2-cycle. Si 0 est 
un 3-cycle, la preuve est terminée. 


Si 0 = (ab)(cd), alors on considère e € {1,...,n}\{a,b,c,d} et nous avons 
(abe)-l8(abe) 07! = (aeb)(ab)(cd)(abe)(an)(cd) = (abe) € N. (5.104) 
eN 


Si 4 est le 5-cycle (abcde), alors l’élément suivant est dans N : 
(abc) !O(abc)07! = (acb)(abcde)(abc)(aedcb) = (acd). (5.105) 


Dans tous les cas nous avons trouvé un 3-cycle dans N et nous avons par conséquent N = 4,, 
ce qui fait que À, ne contient pas de sous-groupes normaux non triviaux. Le groupe alterné À, 
est donc simple. 


Nous en déduisons immédiatement que si n > 5, le groupe dérivé de 4, est À, parce que À, 


ne contient pas d’autres sous-groupes non triviaux. 
LEMooICEHooGSSpkq 
Lemme 5.51. 


Le groupe alterné'® Aç n'accepte pas de sous-groupes normaux d'ordre 60. 


18. Définition 5.43. 
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Démonstration. Soit G normal dans A6, et a, un élément d’ordre 5 dans G (qui existe parce que 
5 divise 60). Soit aussi un élément b d’ordre 5 dans A6. Les groupes gr(a) et gr(b) sont deux 
5-Sylow dans 46. En effet, 5 est un nombre premier, et est la plus grande puissance de 5 dans 
la décomposition de 60; donc gr(a) est un 5-Sylow dans G. D’autre part, l’ordre de A6 (qui est 
ë * 6!) ne possède également que 5 à la puissance 1 dans sa décomposition. 

En vertu du théorème de Sylow 5.11(3), les 5-Sylow gr(a) et gr(b) sont conjugués et il existe 
re A6 tel que b = rar-!. Mais G étant normal dans A6, l'élément rar! est encore dans G, de 
telle sorte que be G. Du coup G doit contenir tous les éléments d'ordre 5 de A6. 

Les éléments d'ordre 5 de 44 doivent fixer un des points de {1,2,3,4,5,6} puis permuter les 
autres de façon à n’avoir qu’un seul cycle. Un cycle correspond à écrire les nombres 1,2,3,4,5 dans 
un certain ordre. Ce faisant, le premier n’a pas d'importance parce qu’on considère la permutation 
cyclique, par exemple (3,5,2,1,4) est la même chose que (5,2,1,4,3). Le nombre de cycles sur 
{1,2,3,4,5} est donc de 4!, et par conséquent le nombre d’éléments d’ordre 5 dans A6 est 6 + 4! — 
144. 

Le groupe G doit contenir au moins 144 éléments alors que par hypothèse il en contient 60; 
contradiction. 


Le théorème suivant montre que tout groupe peut être vu, en agissant sur lui-même, comme 
une partie du groupe symétrique. 


Théorème 5.52. 
Un groupe G est isomorphe à un sous-groupe de son groupe symétrique S(G). 


Démonstration. Nous considérons 4, la translation à gauche : 


:G > S(G 
" ss (5.106) 
9 lg 


où f4(h) = gh. Étant donné que 
p(gh) = ghx = g(tnx) = tjotn(x), (5.107) 


l'application 4 est un morphisme de groupes. Il est injectif parce que si gx = hx pour tout x, en 
particulier pour æ = e nous trouvons g = h. 

De la même manière, @(g)x = @(g)y implique x = y. Cela montre que l’image est bien dans le 
groupe symétrique. 

L'ensemble Image() est donc un sous-groupe de S(@G), et & est un isomorphisme vers ce 
groupe. 


LEMooMVUGooRiDaDz 
Lemme 5.58. 
Sin > 3, alors 
(1) Le centre de S, est trivial. 
(2) Le groupe Sn est non abélien. 
Démonstration. Soit s € Z(S,) et trois éléments distincts a, b et c de {1,...,n}. Nous posons 
T = (ab) et nous avons 87 = rs. En notant a’ = s(a) et b = s(b) nous avons 
a = sa) = (rsr !j(a) = (rs)(b) = T(b') (5.108a) 
D = s(b) = (rsTr !)(b) = (rs)(a) = r(a’). (5.108b) 


Donc Tr permute a” et b’. Mais comme 7 ne permute que a et b, en tant qu’ensembles, {a,b} = 
{s(a),s(b)}. Le même raisonnement sur {b,c} donne {b,c} = {s(b),s(c)}. Et puisque a, b et c sont 
distincts, 


{b} = {b,c} n {a,b} = {s(b)}. (5.109) 


Cela montre que s(b) = b, et donc que le centre de $, est réduit à la permutation identité. 
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En ce qui concerne le fait que $, est non abélien, si nous avions st = ts pour tout s,t € S, 
alors s = tst-! pour tout t{. Alors s serait dans le centre de $,. En bref, si S, était abélien, son 
centre serait 5, et non {Id}. 


PROPooUBIWooTrfCat 
Proposition 5.54 ([149, 139]). 
Tout groupe simple !* d’ordre 60 est isomorphe au groupe alterné A5. 


Démonstration. Nous avons la décomposition en nombres premiers 60 = 2? + 3 : 5. Déterminons 
pour commencer le nombre n; de 5-Sylow dans G. Le théorème de Sylow 5.11(4) nous renseigne 
que n; doit diviser 60 et doit être égal à 1 mod 5. Les deux seules possibilités sont n5 — 1 et 
ns = 6. Étant donné que tous les p-Sylow sont conjugués, si n5 = 1 alors le 5-Sylow serait un 
sous-groupe invariant à l’intérieur de G, ce qui est impossible vu que G est simple. Donc n5 = 6. 
Par le point (3) du théorème de Sylow, le groupe G agit transitivement sur l’ensemble des 

5-Sylow par l’action adjointe : 
g'S=gSg |. (5.110) 


Cela donne donc un morphisme 0: G — S6. Le noyau de 4 est un sous-groupe normal. En effet si 
k € ker 0 et si g € G nous avons 


(gkg 1) : S = gkg 7 "Ggk  g (5.111a) 
= gkTk lg | (5.111b) 
= gTg (5.111c) 

) 


- (5.111d 


où Test le Sylow T = g-!Sg. Étant donné que k € ker 0 nous avons utilisé kTk-! = aT. Au final 
gkg-! : S = S, ce qui prouve que gkg_! € ker 6. 

Étant donné que ker 0 est normal dans G, soit il est réduit à {e} soit il vaut G. La seconde 
possibilité est exclue parce qu’elle reviendrait à dire que G agit trivialement, ce qui n’est pas correct 
étant donné qu’il agit transitivement. Nous en déduisons que ker 0 = {e}, que 4 est injective et que 
Gest isomorphe à un sous-groupe de 56. 

Par ailleurs le groupe dérivé de G est un sous-groupe normal (et non réduit à l’identité parce 
que G' est non commutatif). Donc D(G) = G. Étant donné que G € Sg, nous avons 


G = D(G) = D(S6) = A6 (5.112) 


parce que le groupe dérivé du groupe symétrique est le groupe alterné (lemme 5.47). 
L'ensemble 07 1(46) est distingué dans G. En effet si a € A6 et si g € G nous avons 


0(90 7 (o)g"*) = 0(g)o(g) € A6. (5.113) 


Nous en déduisons que 0-1(A6) est soit G' entier soit réduit à {e}. Si 0-1(46) = {e}, alors pour 
tout g € G nous aurions g? = e parce que 0(g?) € A6. L'ordre de G étant 60, il n’est pas possible 
que tous ses éléments soient d’ordre 2. Nous en déduisons que 0(G) € A6. 
Nous nommons A = 0(G) et nous considérons l’ensemble X = A6/H où les classes sont prises 
à gauche, c’est-à-dire 
[o] = {ho tel que he H}. (5.114) 


Évidemment Ag agit sur X de façon naturelle. Au niveau de la cardinalité, 


|A6l 360 
IG] 60 


6. (5.115) 


Le groupe A6 agit sur X qui a 6 éléments. Nous avons donc une application w: A6 — A6. Encore 
une fois, la simplicité de A6 montre que o(A6) = A6. 


19. Définition 1.171. 
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Nous étudions maintenant w(H) agissant sur X. Un élément x € A fixe la classe de l’unité [el] 
si et seulement si x € H et par conséquent w(H) est le fixateur de [e] dans X. À la renumérotation 
près, nous pouvons identifier w(H) au sous-groupe de 46 agissant sur {1,...,6} et fixant 6. Nous 
avons alors @(H) = S5 n A6 = A5. Nous venons de prouver que @ fournit un isomorphisme entre 
A3 et H. Étant donné que H était isomorphe à G, nous concluons que G est isomorphe à A6. 


5.6.2 Sous-groupes normaux 
NORMooQAZTooBQLaDn 


5.55 ([150]). 

Soit le groupe V4 engendré par les doubles transpositions de 54. Nous savons de l’exemple 1.287(5) 
que ce groupe contient exactement 3 éléments non triviaux et l'identité. De plus, comme c’est une 
classe de conjugaison, V4 est normal dans S4. 


Lemme 5.56. 
Les sous-groupes Fixs, (a) (avec a € {1,...,n}) sont conjugués entre eux. 


Démonstration. Soit « € Fix(a) et s € S, nous devons prouver que sos_! est le fixateur d’un 
élément de {1,...,n}. Nous notons s(a) = b. Alors 


(sos 1)(b) = (so)(a) = s(a) = b. (5.116) 
Donc s Fix(a)s-! € Fix(b). 


Dans l’autre sens, si o € Fix(b) alors s7 
sFix(a)s”!. 


1 à 


os € Fix(a). Mais o = s(s-los)s-!, donc o € 


PROPooUTJAooUbzGZm 
Proposition 5.57 (Sous-groupes normaux de S, [150]). 
Les sous-groupes normaux de S, ne sont pas légions. 


(1) Pour n = 4, les sous-groupes normaux de S4 sont {Id}, V4, A4 et Sa. 


(2) Pour n £ 4, les sous-groupes normaux de S, sont {Id}, À, et Sn. 


Démonstration. Les cas n < 2 sont un peu triviaux, donc nous faisons n > 3. Soit H normal dans 
Sn et s Æ Id dans H ; par le lemme 5.53, s n’est pas dans le centre de 5, et il existe u € 5, 
tel que us Æ su. Comme « est un produit de transpositions (proposition 1.288), il existe une 
transposition t telle que st £ ts. Le sous-groupe H est normal et puisque s € H nous avons aussi 
ts-lt-l e H. Mais en même temps, la combinaison sts—l est le conjugué d’une transposition et 
est donc également une transposition (classe de conjugaison de S4 dans 1.287). Nous en concluons 
que sts—1#-l est un produit de deux transpositions appartenant à AH. 

Nous venons de prouver que H contient au moins un produit de deux transpositions. Et ce 
produit est différent de Id parce que sts— #1 = Id impliquerait st = ts. 

Soient donc deux transpositions {1,t2 € H telles que t1t2 Æ Id. Les supports de t1 et t2 ont soit 
1 soit aucun élément communs. 


(1) Premier cas 
Supposons {1 = (a,b), t2 = (b,c) avec a,b,c distincts dans {1,...,n}. Dans ce cas tit2 = 
(a,b,c) et H contient un cycle de longueur 3. Puisque H est normal et que les cycles de 
longueur trois sont une classe de conjugaison (exemple 1.287) et que À, est engendré par 
ceux-ci (proposition 5.48), 4, € H. Mais 4, est d’indice deux dans $, (proposition (2)(2)). 
Quel nombre plus grand que n!/2 divise n!? Seulement n lui-même. Donc H est soit A, soit 
Sn. 

(2) Second cas 


Le groupe A contient un élément de la forme (ab)(cd) avec a, b, c, d distincts dans {1,...,n}. 


(2a) Si n = 3 


Impossible parce que avec n = 3 nous n’avons pas quatre éléments distincts. 
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Si n = 4 

Le sous-groupe H de $4 contient un élément de V4 qui n’est pas l’identité. Par normalité 
et classes de conjugaison, H contient V4. Nous devons maintenant prouver que si H n’est 
pas W1 alors H est A4 ou S1. Nous avons les inclusions VW, € H € $4 et donc les inégalités 


4< |H| < 24. (5.117) 


Donc le nombre |H| est un multiple de 4 qui divise 24. Les possibilités sont |H| — 
4,8,12,24. La possibilité | H| = 4 donne A = V,; si |H| = 24 alors H = S; si | H| = 12 
alors H est d'indice 2 dans 54 et H = À, (proposition 5.44(3)). Quid de |H] = 8? 
D'après le corolaire 2.14 au théorème de Lagrange, l’ordre d’un élément divise l’ordre 
du groupe. Soit x dans H mais pas dans W. L'ordre de x peut être 1, 2, 4 ou 8. Ordre 
1 serait x = Id. Ordre 8, pas possible parce que S4 n’a pas d'éléments d'ordre 8. 


(2b.ü) x d’ordre 2 


Prenons la décomposition de x en cycles disjoints. Puisqu’on est dans S4, ces cycles 
ne peuvent être que des transpositions. Soit il y en a un (alors H contient une 
transposition et donc H = $4), soit il y en a deux et alors x est dans W. 


(2b.ü) z d’ordre 4 


(2c) 


L'élément x est alors un cycle de longueur 4, et H contient tous les cycles de longueur 
4; par exemple, le produit (abcd)(bacd) = (adc). Le sous-groupe A contient alors 
A4 (parce qu’il contient tous les 3-cycles). 
Sin > 
Soit un élément e ? distinct de a, b,c et d. Par notre liste préférée des classes de conju- 
gaison (exemple 1.287(5)), le 2-cycle (c,e)(a,b) est conjugué à (a, b)(c, d) et appartient 
donc à H. Mais alors le produit suivant est également dans A : 


(ce)(ab)(ab)(cd) = (ce)(cd) = (ecd). (5.118) 


Donc H contient un 3-cycle, et par conséquent tous les 3-cycles. Encore une fois, cela 
prouve que À est soit À, soit S,. 


Pourquoi n = 4 est spécial ? 


Dans le premier cas, nous montrons tout de suite que H = V4 n’est pas possible. Dans 
le deuxième cas, nous montrons que, grâce à un élément différent de a,b,c et d, la 
possibilité H = W4 est exclue. La possibilité H = V4 n’existe que pour n = 4. 


5.6.3 Indice 


Théorème 5.58. 
Tout sous-groupe d'indice n dans S, est isomorphe à Sn-_1. 


THOooXDRNoo!lyaGlv 


Démonstration. Pour n = 1, il n’y a pas de sous-groupe. Pour n = 2, un sous-groupe d'indice 2 ne 
peut contenir que 1 élément, qui est donc l'identité. Ok pour que {Id} soit égal à S1 ? 


Pour les autres, il y a un peu plus de travail. 


(1) Pour n = 3 
Nous avons |[S3| = 6. Donc un sous-groupe d'indice 3 dans S3 contient exactement 2 éléments. 


Il contient Id et un autre élément o € S3 qui doit vérifier o? = Id ou © 


2 = 5. Aucun élément 


de $3 ne vérifie a? = o (à part l'identité). Donc a? = Id, ce qui implique que © est une 
transposition. Donc 


H = {Id, (12)} (5.119) 


ou l'identité avec (23), ou avec (13). Dans tous les cas c’est isomorphe à S2. 


20. e n’est pas l’élément neutre ici 
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(2) 


Pour n = 4 

Nous avons |S4 : H| = 4, donc |H| = 6. Mais 6 = 2 x 3 et 2 | 3 — 1, donc le théorème 5.25 
nous dit que H est soit cyclique?! (et donc abélien), soit un produit semi-direct. Vu que 
S4 n’a pas d'éléments d'ordre 6, aucun sous-groupe d’ordre 6 ne peut être cyclique. Nous 
sommes donc dans le cas du produit semi-direct 


H = T3 %e 72 D 0 


où p: Z2 — Aut(Z2) et w(1) est d'ordre 2 dans Aut(Z2). Il convient de nous attarder un peu 
pour être sûr d’avoir bien compris tout ce qui se trouve dans l'identification (5.120). D'abord 
un point de notations : ici nous considérons les groupes Z, = Z/pZ munis de l’addition. Donc 
1 n’est pas le neutre. Ensuite nous savons du théorème 5.18 que Aut(Z/3Z) = (Z/3Z)*, et 
que via cette identification, w(1) = 2 € (Z/3Z)* au sens où w(1)x = 2x. Nous avons alors 
g(1)?x = 4x = x dans Z/3Z. Cela montre bien que w(1) est d’ordre 2. 

Par rapport à la proposition 5.45, ici nous écrivons Z2 = ({0, 1}, +) alors que là nous écrivons 
a = ({—1, 1h: j Ce sont les mêmes groupes, mais il convient de remarquer que le 1 ici est 
le —1 là. 

Nous savons par la proposition 5.45 que S, = A» X4 Z2; en comparant avec (5.120) nous 
voyons qu'il suffit de prouver que A3 = 7/37 pour avoir H = S3. 

Le groupe A3 possède |S3|/2 = 3 éléments. Il est vite vu que A3 = {Id, (12)(31), (12)(32)} : 
ce sont trois éléments de signature paire dans $3 ; donc c’est S3. La correspondance Id + 0, 
(12)(13) + 1, (13)(12) + 2 donne un isomorphisme avec (Z3, +). 

Pour n >5 

Soit un sous-groupe H d'indice n dans $, et l’action à gauche de $, sur E = $,/H (qui 
n’est à priori pas un groupe) donnée par g : [s] = [gs]. 


(3a) Morphisme v: Sy — Sg 


Le défini par l’action est un morphisme parce que 


p(g192)[s] = [g1925] = (g1)[g2s] = p(g1)p(g2)[s]. (5.121) 


Mais il faut également vérifier que pour chaque g € G, l'application 4(g): E — E est 
bien une permutation. Pour l’injectivité, si w(g)[s1] = w(g)[s2] alors [gs1] = [gs2], donc 
il existe h € H tel que gs1 = gs2h, ce qui prouve que s1 = s2h et donc que [s1] = [s2]. 
Pour la surjectivité, soit [t] € S,/H et résolvons @(g)[s] = [t] par rapport à s. L'élément 
8 — gt convient. 


(3b) ker(y) est normal 


Soit ze ker(), c'est-à-dire que @(z) = Idg. Alors pour a € $, nous avons w(oza 1!) = 
p(o)p(z)o(o"*) = Idg. 

(3c) ker(p) = es, 949 
Supposons que z € gHg-! pour tout g, et calculons w(z)[s]. D'abord par hypothèse il 
existe h e H tel que z = shs=!, donc 


p(2)[s] = [zs] = [shs=!s] = [sh] = [s], (5.122) 


ce qui prouve que (2) = Id. 
Dans l’autre sens, soit z € ker(w). Donc w(z)[s] = [s]. Il existe donc h € H tel que 
2s = sh, c'est-à-dire tel que z = shs=!. La formule demandée est donc prouvée. 

(3d) Questions d’ordre 
Nous savons que |H| = (n—1)! alors que | A,| = ne. Donc || < |A,]| avec une inégalité 
stricte. En même temps nous avons | ker()| < | H| parce que ker(w) est une intersection 
dont un des termes est H lui-même. Nous avons alors les inégalités 


| ker(o)| < LA] = (n — 1)! < [Aal. (5.123) 


21. Définition 1.319. 
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Mais les seuls sous-groupes normaux de $, sont 4,, S, et {Id} (proposition 5.57). Donc 
ker() = Id et 4 est une injection entre deux ensembles finis de même cardinalité. Cela 
fait de & une bijection et donc un isomorphisme de groupes 


P: Sn — SE. (5.124) 
Soit une fonction de numérotation #: E — {1,...,n}. Avec cela nous définissons un 
isomorphisme de groupes L 
: SE — S 
one. ! (5.125) 
o + Vov …. 
(3e) Fixateur 


(32) 


Nous montrons à présent que (4 ow)(H) = Fix (#[1d]) où le stabilisateur est pris dans 
Sn. Pour la première inclusion, soit h € H. Nous avons (Ÿ o w)(h) = 4 o @(h)#!, qui 
nous appliquons à v[Id] : 


(So p)(h)w{Id] = w 0 p(h)[Id] = wTh] = [Id]. (5.126) 
Donc (Ÿ o w)(H) © Fix (#[Id]). 
Pour l’autre inclusion, soit & € S, tel que ay[ld] = #[Id]. Puisque o € S, nous avons 
se SZ tel que o = #(s). Pour ce s nous avons donc 


(Y(s) o w) [Ta] = w[Id], (5.127) 
d’où nous déduisons s[Id] = [Id]. Cela prouve que s stabilise [Id] dans $g. Donc s — 


g(h) pour un certain h € H, et au final o = #(p(h)). 


Conclusion 
L'application do y: H — S, est une application dont l’image est le fixateur d’un point. 
Plus précisément, 

Dow: H — Fix (Y[Id]) (5.128) 


est un isomorphisme de groupe. Mais le stabilisateur d’un point dans $, est S,_1. 


5.7 Isométries du cube 


SecPVCmkxM 


Les isométries du cube proviennent de [103]. 

Nous considérons le cube centré en l’origine de RŸ et 
G, le groupe des isométries de R° préservant ce cube. Nous 
notons aussi G* le sous-groupe de G constitué des éléments 
de déterminant positif. Nous notons 


D= (Dr. Di (5.129) 


l’ensemble des grandes diagonales, c’est-à-dire les segments 
[AG], [EC], [FD], et [BH]. Nous savons que G préserve 
les longueurs et que ces segments sont les plus longs pos- 
sibles à l’intérieur du cube. Donc G agit sur D parce qu’il 


D 


F 


ne peut transformer une grande diagonale qu’en une autre grande diagonale. Nous avons donc un 


morphisme de groupes 
p: G— $S4. 


(5.130) 


Nous montrons que ce morphisme est surjectif en montrant qu’il contient les transpositions. Le 
groupe G contient la symétrie axiale passant par le milieu M de |A, E] et le milieu N de [C,G1. Il 
est facile de voir que cette symétrie permute [AG] avec [ECT. De plus elle laisse [FD] inchangée. 


5.7. ISOMÉTRIES DU CUBE 407 


En effet, aussi incroyable que cela paraisse en regardant le dessin, nous avons FD L MN, parce 
qu’en termes de vecteurs directeurs, 


1 1 
ON=|-1| OF= | 1 |. (5.131) 
0 =“ 


Étudions à présent le noyau ker(p). Si f € ker(p) n’est pas l'identité, alors f(D;) = D; pour tout 
i, mais au moins pour une des diagonales les sommets sont inversés. Quitte à renommer les sommets 
du cube nous supposons que la diagonale [ AG] est retournée : f(A) = Get f(G) = A. Regardons 
où peut partir B sous l'effet de f. Étant donné que f préserve les diagonales, f(B) e {B,C}, mais 
étant donné que f est une isométrie, d(f(B), f(G)) = d(B,G), et nous concluons que f(B) = H. 
Donc la diagonale | BH] est retournée sous l'effet de f. En raisonnant de même, nous voyons que 
f retourne toutes les diagonales. Donc les éléments non triviaux de ker(p) retournent toutes les 
diagonales ; il n’y en a donc qu’un seul et c’est la symétrie centrale : 


ker(p) = {Id, so}. (5.132) 


Le premier théorème d’isomorphisme 2.6 nous permet d’écrire le quotient de groupes : 


G 


Ds . 1 
Ma 7 ve 


Une classe d'équivalence modulo ker(p) dans Gest donc toujours de la forme {f, f o sp}. Et comme 
80 est de déterminant —1, une classe contient toujours exactement un élément de déterminant 1 
et un de déterminant —1. 

D'autre part, ker(p) est normal dans G parce qu’en tant que matrice, 35 = —1, donc les 
problèmes de commutativité ne se posent pas. L'application 


 ——_—— — G* 
F {Id, so} 
9 si det(g) > 0 thes 
[gl 
g°80 sinon 
est un isomorphisme de groupes. Et enfin nous pouvons écrire 
GT = Sa. (5.135) 


Nous allons maintenant utiliser le corolaire 2.49 pour montrer que G& = GŸ x, ker(p). Les 
conditions sont remplies : 


— ker(p) normalise G*Ÿ parce que ker(p) ne contient que +1. 

— ker(p) n GŸ = {Id}. 

— ker(p)G* = G parce que les classes d'équivalence de G modulo ker(p) sont composées de 
Lis f à so}: 


Puisque G* = S4 et ker(p) + Z/2Z nous pouvons écrire de façon plus brillante que 
G= Saxo 2/2. (5.136) 
Mais étant donné que la conjugaison par 50 est triviale, le produit semi-direct est un produit direct : 
G= Sa x 2/22. (5.137) 


Ilest maintenant du meilleur gout de pouvoir identifier géométriquement ces éléments. Les éléments 
de Z/2Z = {Id, so} ne font pas de mystère. Dans S4 nous avons les classes de conjugaison des 
éléments Id, (12), (123), (1234) et (12)(34) déterminées durant l’exemple 1.287. 
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(1) L'élément (12) consiste à permuter deux diagonales et laisser les autres en place. Nous avons 


— 


— 


— 


déjà vu que c'était une symétrie axiale passant par les milieux de deux côtés opposés. Cela 
fait 6 axes d’ordre 2. 


L'élément (123) fixe une des diagonales. C’est donc la symétrie axiale le long de la diagonale 
fixée. Par exemple la symétrie d’axe (AG) fait bouger le point B de la façon suivante : 


BDs EE: (5.138) 


C’est une rotation d’angle =. En tout, nous avons donc 8 rotations d’ordre 8. 
Notons à ce propos que la différence entre (234) et (243) est que la première réalise une 


rotation d'angle 27/3 tandis que la seconde, une rotation d'angle —27T/3. 


L'élément (1234) ne maintient aucune des diagonales et est d’ordre 4. C’est donc la rotation 
d’angle x/2 ou —7x/2 autour de l’axe passant par les milieux de deux faces opposées. Il y en 
a 6 comme ça (3 paires de faces puis pour chaque il y a x/2 et —7/2), et ça tombe bien 6 est 
justement la taille de la classe de conjugaison de (1234) dans S4. 


L'élément (12)(34) est le carré de la précédente ??, c’est-à-dire les rotations d'angle r autour 
des mêmes axes. Cela fait 3 éléments d’ordre 2. 


22. En fait c’est (13)(24), le carré de la précédente, mais c’est la même classe de conjugaison. 


Chapitre 6 


Corps 


6.1 Généralités 
NORMooGPWRoo!IKJqqw 


6.1. 

Nous trouvons parfois le terme anneau à division. Cela provient du fait que dans beaucoup de 
cas on considère uniquement des corps commutatifs ; donc on voudrait une façon de parler d’un 
anneau dont tous les éléments non nuls sont inversibles. Dans ce cadre on dit : 


— Un anneau à division est un anneau dont tous les éléments non nuls sont inversibles, 
— Un corps est un anneau à division commutatif. 


Pour prendre un exemple de cette différence, le théorème de Wedderburn 19.29 est énoncé ici sous 
les termes « Tout corps fini est commutatif ». Sous-entendu : la commutativité ne fait pas partie 
de la définition d’un corps. Par contre dans [103] il est énoncé sous les termes « Tout anneau à 
division fini est un corps ». Chez lui, un corps est toujours commutatif et un anneau à division est 
ce que nous appelons ici un corps. 


6.1.1 Corps ordonnés 


Nous avons vu la définition de corps totalement ordonné en 1.367. 


Définition 6.2 ([72]). 
Un corps est formellement réel si —1 n’est pas une somme de carrés. 


Proposition 6.3. 
Un corps totalement ordonné est formellement réel. 


Démonstration. Soit un corps totalement ordonné (K,<) et a € K alors a? > 0. En effet si a > 0 
alors a? = a x a > 0 directement par la définition 1.367(1b). Si a & 0 alors —a > O0 et 


a = (—a} > 0. (6.1) 


Comme —1 < O0, il ne peut donc pas être écrit comme un carré. À fortiori comme somme de 


carrés. 


6.1.2 Automorphismes de R et € 
PROPooLLPMooIVana0 


Proposition 6.4 ([151, 1]). 
L'identité est l’unique automorphisme du corps R. 


Démonstration. Soit un automorphisme © : R — IR. Comme pour tout automorphisme, 
o(a) = o(la) = o(1)o(a). (6.2) 
Donc o(1) = 1. 
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(1) Identité sur les rationnels De plus 


o(n)=0{(1+...+1)=0(1)+...+0o{(1)=n, (6.3) 


TOO EEE (6.4) 


Donc o(1/n) = 1/n. 
Nous en déduisons que pour tout q € Q, o(q) = q. Cela ne suffit pas pour déduire o(x) = x 
pour tout x € R parce que rien n'indique que © soit continue. 


et 


(2) Positive sur les positifs 
Si x > 0 alors o(x) = o(x})° > 0. 


(3) Croissance 


Six > y alors x —y > 0 et o(x — y) > 0. Cela donne o(x) > o(y). 


(4) Identité sur les réels 


Soit un irrationnel x € R et une suite (q;) dans Q qui converge de façon croissante vers x. 
Soit € > 0 dans Q. Il existe N tel que si à > N alors g + € > x; en appliquant © à cette 
inégalité et en se souvenant que © est l'identité sur Q, 


git+e> o(x). (6.5) 


Mais de plus, g < x donne o(q) < o(x), c’est-à-dire g; < o(x). En regroupant ces deux 
inégalités, 
E LZOUooPh 
qi < o(x) <q +Ee ne °° (6.6) 
pour tout e > 0 dans À et à > N. Ce € étant fixé nous pouvons prendre la limite des inégalités 
(6.6) : 
x <o(x) <T+e. (6.7) 


Cela étant valable pour tout € > 0 dans Q, nous avons bien x = o(x). 


REMooGHEDooOYYUPk 
Remarque 6.5. 
Certains[151] pensent que l'énoncé de cette proposition, ne parlant que de corps R n’autorise pas 
l’utilisation d'autre structure réelle que celle de corps. Du coup il faut reconstruire la notion d’ordre 
à partir seulement du langage des corps. Par exemple en disant que a > b si et seulement si il existe 
k tel que a = b+ k?. 

On peut s’en sortir en donnant l’énoncé suivant : « Si K est un corps isomorphe (en tant que 
corps) à R alors son unique automorphisme est l'identité ». Cela se démontre immédiatement en 
disant que si f est un automorphisme de K et si est un isomorphisme K — R alors po fo! 
est un automorphisme de R. Donc il est l’identité et f l’est également. 

Attention cependant à prouver que @ ! est un morphisme. En effet en posant 9 l(x) = a et 
®-l(y) = b nous avons 


P(P (x) + E 7 (y)) = x +y (6.8) 
parce que @ est un morphisme. D'autre part, 
p(D (x) + DT (y)) = d(a + b). (6.9) 
Donc 
DU (x +y) = 7 (da) + 6(b)) = 67" (ba + b)) = a + b = D (x) +67 (y). (6.10) 
PROPOooEATMoo!IPPrRV 


Proposition 6.6. 
Un automorphisme du corps € qui fire R est soit l'identité soit la conjugaison complexe |. 


1. Par « fixer IR » nous entendons que o(R) = R, pas spécialement que o(x) = x pour tout x ER. 
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Démonstration. Soit un automorphisme © vérifiant la condition de fixer KR. Alors la restriction de 
o à R est un automorphisme de R et y est donc l'identité par la proposition 6.4. 
En ce qui concerne les imaginaires purs, 


1 = o(—1) = o(ii) = o(i)?. (6.11) 
Donc a(i) est un élément de € vérifiant o(i)? = —1. C'est-à-dire a(i) = +1. 
Si o(i) = à alors o = Id. Si o(i) = —i alors o est la conjugaison complexe. 


6.1.3 Corps premier 
subsBEEonfSfreniBSKpq 


Définition 6.7. 
Un corps est premier si il est son seul sous-corps. Le sous-corps premier d’un corps est l’in- 


tersection de tous ses sous-corps. 
LEMooPOGUooATyqcf 


Lemme 6.8. 
Le sous corps premier d’un corps est un corps. 


Démonstration. Soit un corps K et son sous-corps premier P. Si x,y € P, alors pour tout sous- 
corps L de K nous avons x, y € L et donc xy € L € P. Même type de vérification pour les autres 
propriétés d’un corps. 


Lemme 6.9. 
Un corps premier est commutatif. 


Démonstration. Le centre d’un corps est certainement un sous-corps. Par conséquent un corps 
premier doit être contenu dans son propre centre, c’est-à-dire être commutatif. 


DefXIHLooBAcqYH 
Définition 6.10. 
Soit p un nombre premier. Nous notons F, = Z, = Z/pZ. 


Nous verrons plus loin (section 19.4) comment nous pouvons définir F,n lorsque p est premier, 
ainsi que l’unicité d’un tel corps. 
Nous avons par exemple 
F2 = Z/2Z = {0,1} (6.12) 


avec la loi 2 = 0. 
Notons que F, est un corps ? possédant p éléments. L'ensemble F; est un groupe d'ordre p—1. 


Lemme 6.11. 
Les corps Q et Z/pZ (avec p premier) sont premiers. 


Démonstration. Tout sous-corps de À doit contenir 1, et par conséquent Z. Devant également 
contenir tous les inverses, il contient Q. 

Tout sous-corps de F, doit contenir 1 et donc F, en entier. Par ailleurs nous savons de la 
proposition 3.60 que F, est un corps lorsque p est premier. 


LEMooCGIYooSwOmHG 
Lemme 6.12. 
Si k € %, nous notons kx l'élément k * 1x — nu 1x. L'application 
s:Z—K 
(6.13) 
ke kx 


est un morphisme d’anneaur. 
Si la caractéristique de K est O0, alors s est injective. 


2. Quand p est premier, Z/pZ est un corps, proposition 3.60. 
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PROPooXLLOoo!IAhEue 
Proposition 6.13 (Sous-corps premier[152]). 
Soit K, un corps® de caractéristique p. 


(1) Si p > 0 alors le sous-corps premier de K est isomorphe à Z. 


(2) Si p = 0 alors le sous-corps premier de K est isomorphe à Q. 


Démonstration. Pour les besoins de notations, dans la suite si k € Z, nous notons kx l'élément 
k : 1x — nn: 1x. Notons aussi P le sous-corps premier de K. 

Étant donné que 1x est dans tout sous-corps, nous devons avoir Z1x € P. Nous avons donc 
toujours 


ZixkcPceKkK. (6.14) 


Maintenant, le lemme 1.345 nous dit la nature de Z1x en tant qu’anneaux, et nous pouvons 
séparer les cas en fonction de la caractéristique. 


(1) Sip>0 Nous avons Zix = Z/pZ par le lemme 1.345. L'ensemble Z/pZ étant un corps, 
Z1x est un corps et c’est donc le corps premier de K. 
(2) Sip=0 Sip=0, alors Z1 = Z en tant qu'anneaux. Dommage que Z ne soit pas un corps. 


Soit n e Zlx et me (Z1x)*. L'élément nm ! e K est dans P parce que P est un corps. 
Donc l’application 


ÿ: Q — P 


ab + axbr! 10) 


prend bien ses valeurs dans [P et est un morphisme de corps. 


La surjectivité de Ÿ est ce dont nous venons de parler. En ce qui concerne l’injectivité, si 
D(ab-1) = p(xy-?), alors axbg = rxyx! et la commutativité de K nous permet d'écrire 


AKYK = TKÜK-. (6.16) 
Étant donné le lemme 6.12, nous déduisons que (ay — xb)x = 0. Et comme 2 + 2x est 


injective, nous en déduisons que ay — xb = 0 dans Z, et donc que ab! = xy-! dans Q par 
le lemme 1.379. 


PropqPPrgJ 
Proposition 6.14. 
Soit K un corps et P son sous-corps premier*. Si a € Aut(K) alors op = Id, c’est-à-dire que 
o(x) = x pour tout x € P. 


Démonstration. Soit IP le sous-corps premier de IK. La proposition 6.13 nous dit que P est soit 
Z, soit À en fonction de la caractéristique de K. Nous allons faire le cas de caractéristique nulle, 
c’est-à-dire P + Q. 

Tout élément de P peut être écrit sous la forme kKklr* pour des k,l € Z. Nous calculons la 
valeur de o sur ces éléments. D'abord o satisfait o(1x) et préserve la somme, dont o(kx) = kx 
pour tout ke Z°. Étant donné que o préserve également l'inverse et le produit, 


o(kxlx!) = o(kx)o(ix) ! = kxlx!. (6.17) 


Et voila. 


3. Je rappelle que tous les corps du Frido sont commutatifs, sauf mention explicite du contraire. 
4. Définition 6.7. 
5. Dans le cas de caractéristique non nulle, P = Z et vous pouvez vous arrêter ici. 
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6.1.4 Petit théorème de Fermat 


ThoOUPQ0i0 
Théorème 6.15 (Petit théorème de Fermat). 
Soit p un nombre premier. 
(1) Six e Z/pZ alors æ = x. 
(2) Si x e (Z/pZ)*, alors x?! = 1. 
(3) Six e (Z/pZ)* alors à" = ar? ITEMooRNIVooUIzqgce 


(4) Si x est premier avec p, alors x?-le [1],. 


Démonstration. Étant donné que Z/pZ est un corps commutatif et que p est premier, la propo- 
sition 3.46 nous indique que o(x) = x? est un automorphisme. La proposition 6.14 nous indique 
alors que 


a =, (6.18) 


Si a est inversible alors a?! = aa! = 1. 
Pour (4). Le nombre x n’est pas premier avec p uniquement lorsque x est multiple de p. Dans 
ce cas c’est [a], = 0 dans Z/pZ et donc a?! = 0. 


Exemple 6.16. 
Soit IK = F29. Le nombre 29 étant premier, K est un corps. C’est le corps des entiers modulo 29. 
Nous avons donc 


142 113 84 99 26 = 3 = 32 = 61 = 90 = 119. (6.19) 


Le petit théorème de Fermat nous permet aussi de calculer des exposants et des inverses. En effet, 
puisque 1 = x? pour tout x € F9, nous avons xl = x?7, et par suite, pour tout entier a, 


gt (rt )27 = p27a, (6.20) 

Le nombre 27a peut être grand par rapport à 29. Mais en réutilisant le fait que 1 = x, on obtient 

274 = xl7abs, (6.21) 

Cette expression doit être comprise comme disant que pour tout k e [27a]28 nous avons 7% = x*. 

Chose à retenir : dans les exposants nous calculons modulo 28. A 
6.1.5 Nombres de Sophie Germain 

DEFooCVFJooKCdVVD 


Définition 6.17. 
Un nombre premier p est de Sophie Germain si p > 2 et si le nombre q = 2p + 1 est également 
premier. 


Notons qu’il existe des nombres premiers de Sophie Germain. Par exemple p = 3 donne q = 
2x 3+1 — 7. Comme 7 est un nombre premier, le nombre 3 est de Sophie Germain. D’après 
Wikipédia[153], l'existence d’une infinité de nombres premiers de Sophie Germain est encore une 


question ouverte ©. 
LEMooIYIKooGkoqRJ 


Lemme 6.18 ([154, 155]). 
Soit p, un nombre premier de Sophie Germain. Si m € Z n’est pas divisible par q, alors m? e [+1], 
où q = 2p + 1. 


6. Si vous lisez ce paragraphe dans un futur où la question est tranchée, n’hésitez pas à m'écrire pour mettre à 
jour. 
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Démonstration. Le petit théorème de Fermat 6.15 nous dit que ml e [1],. Mais m7! = m°?P = 
(m?)?. Donc 
(mP)? e [1]o. (6.22) 


Puisque q est premier, l'anneau Z/q2Z est intègre par le corolaire 1.236. Comme 1 # —1, la propo- 
sition 3.130 s'applique et nous avons m? e [+1]4. 


THOooSZXWooVeHdrh 
Théorème 6.19 (1154, 155, 156]). 
Soit un nombre premier de Sophie Germain (définition 6.17). I n'existe pas de solution (x, y, 2) 
dans Z° au système 
PHP + zx = 0 
î ue (6.23) 


[ryzls # 0. 


Démonstration. Nous supposons que (x, y, z) € Z° est une solution telle que pgcd(x, y, z) = 1. 


(1) x, y et z sont premiers deux à deux Supposons que k soit un diviseur premier commun 
à æ et y. Alors il existe a, B € Z tels que x = ka et y = kB. Du coup on aurait  — 
—kP(aP + BP). Donc k divise 2?. Le lemme 3.17 nous indique qu’alors k divise z. Donc k = 1 
parce que k diviserait x, y et z. 


Ce qui est vrai pour le couple (x, y) est encore vrai pour (x,z) et pour (y, 2). 


(2) Le fameux uw Nous introduisons à présent une nouvelle variable intermédiaire qui va beau- 
coup nous aider. En utilisant le lemme 3.45, 


p—1 
x = pp + = (y+2) », gF(—2}P TE = (y+2)u (6.24) 
k=0 


où nous avons posé u = 2 (=, 


RS 
Co 
nr 


pagcd(u,y +2) =1 Soit à un nombre premier qui divise u et y +2. 


D'abord a divise x? et donc x (lemme 3.17). Autrement dit : [tla = 
Ensuite, 0 = [x + z],, de telle sorte que 


[yla - _ [a FOR Ne, 


Enfin, en prenant la classe de u modulo à, et en substituant (6.25) : 


p-1 
==] ga), (6.26a) 
k=0 
p—1 
= (ES (6.26b) 
k=0 
p—1 
= Spy! (6.26c) 
k=0 
— p[yl2*. (6.264) 


Nous avons donc p[y]2-! = 0. Mais Z/aZ est un anneau intègre !. Donc la règle du produit 
nul s’applique* et nous avons deux possibilités : [pla = 0 ou [y]?! = 0. 

D'abord a divise déjà x. Or pgcd(x,y) = 1. Donc a ne peut pas diviser y (à part si a = 1 
évidemment), et à fortiori pas y! non plus. Nous en déduisons que [pla = 0. Puisque p est 
premier, nous avons p = @. 

Mais nous avons déjà vu que a divisait x. Donc 0 = [x], = [x],. Cela n’est pas possible 
parce que [xyz], # 0. 

Nous avons donc prouvé que pgcd(u, y + z) = 1. 


7. Corolaire 1.236. 
8. Proposition 1.193. 
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Utilisation d’un lemme 


Pour rappel, p est impair. Nous avons (—x})? = (y + z)u. Le lemme 3.21 nous dit qu'il existe 


a, a € Z tels que 
y + z = a PRooRP Zee REr 
u = Oo. | 


Ce que nous venons de faire pour y + z peut être fait pour les autres couples. Donc il existe 
a, b,cE Z, tels que 


y+z=@ (6.28a) 
x+z=b (6.28b) 
z + y = ©. (6.28c) 


q divise un et un seul des x, y ou z2 Supposons que q ne divise ni x, ni y ni z. Alors le 
lemme 6.18 dit que x e [+1],, y € [+1], et 2? € [+1],. Donc les valeurs possibles pour 
[xP + yp + 2PT, sont [+3], et [+1]. 

Mais nous avons supposé que 2? + y + 2? = 0 et que qg > 5 de telle sorte que [+3], # 0. 
Contradiction. Donc q divise au moins un des trois æ, y ou z. 


Nous avons déjà montré que x, y et z étaient deux à deux premiers entre eux. Donc gq ne 
peut diviser qu’un seul des trois. 


q divise x Jusqu'à présent x, y et z avaient des rôles symétriques. Maintenant nous sup- 
posons que q divise x. 


[la = [+1] Nous savons que © = x + y. En passant aux classes modulo q, nous avons 


[Te = Elo + Tyle = [vla (6.29) 


parce que nous avons choisi que q divise x. Nous avons maintenant les implications suivantes : 
q ne divise pas y. 

= q ne divise pas © parce que [y], = [æ]4. 

= q ne divise pas c par le lemme 3.17. 

= @Eef[+1], par le lemme 6.18. 

= ye [+1], toujours parce que [y], = [æ]s. 

[2714 = [+1] Parce que les rôles de y et z sont symétriques. Donc ce que nous avons fait 
pour obtenir [y], = [+1], tient pour avoir [2], = [+1]4. 


q divise y+2z Nous avons dit que q divisait x. Il divise donc aussi 2x. Nous avons : 
2x = (x +y)+(x +2) — (y +2) = © + bP — ap. (6.30) 


En passant au modulo q, à gauche nous avons [2x], = 0. Donc 


[aa = [lo + [EP (6.31a) 
= [yla + (el (6.31b) 
= ET + Es (6.31c) 
€ {[2les [-2las LOe)- (6.314) 


En tout état de cause, [a?], n’est pas [+1],. La contraposée du lemme 6.18 nous dit alors 
que q divise a? = y + 2. 

[vla = [—-2]4 Il s’agit seulement du fait que q divise y + 2. 

[ula = [pla Par définition, u =  . y*(—z)P IF, On passe au modulo q, en substituant 
[2], par [ul : 


p—1 p—1l 
Lula = D ÉD TE = Net = pue! = [pl (6.32) 
k=0 k=0 


La dernière égalité est le fait que [y], = [+1], et que p — 1 est pair. 
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(12) La contradiction Vous vous souvenez de (6.27) qui disait que u = a? pour un certain p? 

Nous avons les implications suivantes : 

[a?], = [pla < 0 —q ne divise pas a?. 

—=q ne divise pas «a. 

= @ef+il. 

= [lee Hier 

La dernière ligne est clairement fausse parce que q > p et p n’est certainement pas égal à 1 

ou — 1. 

Nous avons prouvé le théorème pour les triples (x,y,z) sans facteur commun. Si k était un 

diviseur commun de x, y et z, alors (x/k,y/k,z/k) serait encore une solution, ce qui n’est pas le 
cas. 


6.2 Théorème des deux carrés 
PropleGdaT 


Proposition 6.20. 
Soit p un nombre premier et P un élément de F,[X]. L'anneau F,[X]/(P) est intègre si et seule- 
ment si P est irréductible dans F,[X]. 


Démonstration. Supposons que P soit réductible dans F,[X], c’est-à-dire qu'il existe Q,R e F,[X] 
tels que P = QR. Dans ce cas, Q est diviseur de zéro dans F,[X]/(P) parce que QR = 0. 

Nous supposons maintenant que F,[X]/(P) ne soit pas intègre : il existe des polynômes R,Q € 
F,[X] tels que QR = 0. Dans ce cas le polynôme QR est le produit de P par un polynôme : 
QR = PA. Tous les facteurs irréductibles de À étant soit dans Q soit dans À, il est possible de 
modifier un peu Q et À pour obtenir QR = P, ce qui signifie que P n’est pas irréductible. 


6.2.1 Un peu de structure dans Z{i] 


LemSCAI1ICY 
Lemme 6.21. 
L'application 
N:Z[i] > N 
DER (6.33) 
a+bir à +b 
est un stathme euclidien pour Zi]. 
Démonstration. Soient t,z € Z{i]\{0} dont le quotient s'écrit 
2 : 
PA à + iy (6.34) 


dans C. Nous considérons q = a + bi où a et b sont les entiers les plus proches de x et y. Siilya 
er aequo, on prend au hasard. Alors nous avons 


z [1+il V2 
ql < L 
t 2 2 


| ai (6.35) 


On pose r = 2 — qt qui est bien un élément de Z{i]. De plus 


7A 
rie le ail = él — al < lé, (6.36) 


c’est-à-dire que |r[? < |t|? et donc N(r) < N(t). 


Étant donné que Z{[i] est euclidien, il est principal (proposition 1.247). 
LemBMEIiiV 


Lemme 6.22. 
Les éléments inversibles de Zi] sont {+1,+i}. 


9. Dans l’exemple 1.246, nous prenions toujours l’inférieur parce que le stathme tenait compte de la positivité. 
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Démonstration. Déterminons les éléments inversibles de Zi]. Si z e Z[i[*, alors il existe 2’ € Z{i[* 
tel que zz/ = 1. Dans ce cas nous aurions 


1=N(sr) = NGIN (GE). (6.37) 


ce qui est uniquement possible avec N(2) = N(z') = 1, c’est-à-dire z = +1 ou z = +i. Nous avons 
donc 
Bi" = {+1, +}. (6.38) 


DEFooUCSHooJqGuVB 
Définition 6.23 ([157]). 
Un monoïde est un triplet (E,+,e) où E est un ensemble, e est un élément de E etx: EXE —E 
est une loi de composition telle que pour tout x,ye E, 


(1) x x(yxz) = (x x y) x z (associativité) 


(2) exx=x+xe—x (e est un neutre). 


Nous notons 2 = {a? + b? tel que a, be N}. 
LemIBDPzZMB 


Lemme 6.24. 
L'ensemble © = {a? + b? tel que a,b e N} est un sous-monoïde | de N. 


Démonstration. 1 suffit de prouver que si m,n € Y, alors le produit mn est également dans Y. Soit 
N, le stathme euclidien sur Z{i] (celui donné par le lemme 6.21). Vu que n € X, il existe ze Zi] 
tel que N(z) = n. Idem pour m : il existe z/ € Z[i] tel que N(z/) = m. Nous avons évidemment 
22" e Zi], et 

N(zz) = NG)N(7) = nm. (6.39) 


Donc nm est l’image de zz/ par N, ce qui prouve que nm € YX. 


ThospaAEI 
Théorème 6.25 (Théorème des deux carrés, version faible). 
Un nombre premier est somme de deux carrés si et seulement si p = 2 oupe[1]4. 


Démonstration. Soit p un nombre premier dans X. Si a = 2k, alors a? = 4k? et a? = 0 mod 4. Si 
au contraire a est impair, a = 2k + 1 et a? = 4k? +1+4k = 1 mod 4. La même chose est valable 
pour b. Par conséquent, a? + b? est automatiquement [0]4, [1]4 ou [2]4. Évidemment les nombres 
de la forme O0 mod 4 ne sont pas premiers ; parmi les 2 mod 4, seul p = 2 est premier (et vaut 
1? + 12). 

Nous avons démontré que les seuls premiers de la forme a? + b? sont p = 2 et les p = 1 mod 4. 
Il reste à faire le contraire : démontrer que si un nombre premier p vaut 1 mod 4, alors il est 
premier. Nous considérons l’anneau 


Zi] = {a + bi tel que a, be Z}. (6.40) 


puis l’application 
N':Z]i] — N 


6.41 
a+bir+ a? +b?. 


Un peu de calcul dans © montre que pour tout 2,2’ € Zi], N(22°) = N(:)N(2). 

Nous savons que les éléments inversibles de Z{i] sont +1 et +i (lemme 6.22). 

Le lemme 6.21 montre que Z{i] est un anneau euclidien parce que N est un stathme. L’anneau 
Zi] étant euclidien, il est principal (proposition 1.247). 

Pour la suite, nous allons d’abord montrer que p € Y si et seulement si p n’est pas irréductible 
dans Z[i]|, puis nous allons voir quels sont les irréductibles de Z{1]. 


10. Définition 6.23. 
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Soit p, un nombre premier dans Y. Si p = a? + b?, alors nous avons p = (a + ib)(a — bi), mais 
étant donné que p est premier, nous avons a £ 0 et b Æ 0. Du coup p n’est pas inversible dans 
Zi], mais il peut être écrit comme le produit de deux non inversibles. Le nombre p est donc non 
irréductible dans Z{i]. 

Dans l’autre sens, nous supposons que p est un nombre premier non irréductible dans Z{i]. 
Nous avons alors p = zz/ avec ni z ni 2’ dans {+1,+i}. En appliquant N nous avons 


p? = N(p) = N(N(2/). (6.42) 


Comme p est premier par hypothèse, c’est uniquement possible avec N(z) = N(z/) = p (avoir 
N(z) = 1 est impossible parce que cela signifirait que z est inversible). Si z = a + tb, alors 
p = N(2) = a? +b?, et donc pe. 

Nous savons déjà que Z{i] est un anneau principal et n’est pas un corps; la proposition 1.237 
s’applique donc et p sera non irréductible si et seulement si l’idéal (p) est non premier. Le fait que 
(p) soit un idéal non premier implique que le quotient Z[i]/(p) est non intègre (c’est la définition 
d’un idéal premier). Nous cherchons donc les nombres premiers pour lesquels le quotient Z{[i|/(p) 
n’est pas intègre. 

Nous commençons par écrire le quotient Z{[i|/(p) sous d’autres formes. D'abord en remarquant 
que si Z et J sont deux idéaux, on a (A/1)/J + (A/J)/I. Par conséquent, en tenant compte du 
fait que Z[i] = Z[X]/(X? + 1), nous avons 


Z[i/(o) = (ZIXT/(p))/CX? + 1) = F,[XT/(X? + 1). (6.43) 


Nous avons donc équivalence des propositions suivantes : 


pe (6.44a) 

F,[XJ/(X? + 1) n’est pas intègre (6.44b) 

X? +1 n’est pas irréductible dans F, Fe | 
X? + 1 admet une racine dans F, (6.44d) 
-le(F;) (6.44e) 

17e F, tel que y? = —1. (6.44f) 


Le point (6.44c) vient de la proposition 6.20. Maintenant nous utilisons le fait que p soit un premier 
impair (parce que le cas de p = 2 est déjà complètement traité), donc (p — 1)/2 € N et nous avons, 
pour le y de la dernière ligne, 


(=) _ (y2yw-1/2 = yp-1 =] (6.45) 


parce que dans F, nous avons y 2 1 par le petit théorème de Fermat (théorème 6.15). Ainsi 
p doit vérifier 
1= (136-072 (6.46) 


c’est-à-dire po = 0 mod 2 ou encore p = 1 mod 4. 


Remarque 6.26. 

Il n’est pas dit que les nombres dans [1]4 sont premiers (9 = 8 + 1 ne l’est pas par exemple). Le 
théorème signifie que (à part 2), si un nombre premier est dans [1/4 alors il est somme de deux 
carrés, et inversement, si un nombre premier est somme de deux carrés, il est dans [1]4. 


Théorème 6.27 (Théorème des deux carrés[103]). 
Soit n > 2 un nombre dont nous notons 


n = [][p°0 F6 47) 


pEP 


où P est l’ensemble des nombres premiers. Alors n € Y si et seulement si pour tout p € P n[3]4, 
nous avons vh(n) € [O]2 (c’est-à-dire v,(n) est pair). 
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Démonstration. (1) Condition suffisante. 


Le produit (6.47) est évidemment un produit fini que nous pouvons alors regrouper en quatre 
parties : P n [0l4, P n[1l4, P n [2 et P n[3]4. 
— I n'y à pas de nombres premiers dans [0]4. 


— Les nombres premiers de [1]4 sont dans Y. Le produit d'éléments de Y étant dans Y, 
nous avons 


I] res. (6.48) 
pEPnl[il4 
— Le seul nombre premier dans [2]4 est 2. C’est un élément de Y. 


— Le produit 


[I pt) (6.49) 


pEePnf[3l4 
est par hypothèse un produit de carrés (v,(n) est pair), et est donc un carré. 


Au final le produit Ter pt) est un produit d’un carré par un élément de X, ce qui est 


encore un élément de ». 


Pour cette partie, nous avons utilisé et réutilisé le lemme 6.24. 


Condition nécessaire. 


Soit p, un nombre premier. Nous voulons montrer que 
{vp(n) tel que n eZ} € [2]2. (6.50) 
Pour montrer cela nous allons procéder par récurrence sur les ensembles 
Ex = {up(n) tel queneZ}n{0,...,k}. (6.51) 


Il est évident que les éléments de Æ9 sont pairs, puisqu'il n’y a que zéro, qui est pair. 
Supposons que Ex € [0]2, et montrons que Ex+1 € [0]2. Soit un élément de 4,1, c’est-à-dire 
vp(n) < k+1 avec n = a? +b?. Si v,(n) = 0 alors l’affaire est réglée; sinon c’est que p divise 
n. Mais dans Z{[i] nous avons 


n = a? +b? = (a+ bi)(a — bi) (6.52) 


Comme Z{i] est principal, le lemme de Gauss 3.71 nous dit que si p divise n, alors il doit 
diviser soit a + bi, soit a — bi (et en fait, les deux). Nous avons alors p | a et p | b en même 
temps. Et donc 


pla +b=n. (6.53) 
Posons a = pa! et b = pb’ avec a’,b! € N. Nous avons 


n : p’a”? + pb? 


D Ê = a? +b?ex. (6.54) 


Mais par construction, 


Ü (2) = v,(n)—2<k. (6.55) 


Donc v,(+) est pair et par conséquent, v,(n) doit également être pair. 
P\p p 


420 CHAPITRE 6. CORPS 


6.2.2 Résultats chinois 


: / ; UBEQooHVCTooGXvbAH 
Nous allons maintenant parler du système d'équations F Fe Mr 
Tx=a] modp (6.56a) 
T=a2 mod q (6.56b) 


avec &1, a donnés dans Z et p,q des entiers premiers entre eux. Le lemme chinois nous donne la 
liste des solutions ainsi qu’une manière de les construire. Le théorème chinois en sera une espèce 
de corolaire qui établira l’isomorphisme d’anneaux Z/pqZ = Z/pZ x Z/qZ. Voir [158]. 

Notons que le système (6.56), en suivant les notations usuelles du Frido s’écrit plutôt 


x € [ai]p N [a2lg. (6.57) 
LemCtUeGA 
Lemme 6.28 (Lemme chinois [159]). 
Soient n1,n2 deux entiers premiers entre eux !!. Soient ar, a2 € Z. ITEMooZVUSooGop1 Qu 
1) Il exist e Z tel 
(1) Il existe ui, u2 els que a 
UN + Ua = 1. . 
ITEMooFMFE0OoQHNLFc 


(2) Nous posons 
= au2an2 + AN U1. (6.59) 
Nous avons 
[ailn A [aan = [alnin2- (6.60) 
Démonstration. En plusieurs points. 
(1) Pour (1) Il suffit d'utiliser le théorème de Bézout 1.229 


(2) Pour (2) première inclusion Soit x € [a]h,n,, et vérifions que x € [a1]h.. Il existe ke Z 
tel que 


T = GUN + GNU + ENIN0. (6.61) 


En remplaçant uon2 par 1 — uin1, nous avons 
x = Q(1 — Win) + aoniui + knino € [ailn, (6.62) 


parce qu’il n’y a que le tout premier terme qui ne contient pas de facteur n1. 


Le fait que x € [a2]h, se vérifie de même !?. 


(3) Pour (2) seconde inclusion Soit x € [ai], N [a2]n,. Il existe k € Z tel que x = a1 + kn. 


Donc 
æ— a = à + kni — (ayuan2 + a2niu1) (6.63a) 
= @j — AU + k!'n1 (6.63b) 
= a (1 — uon2) +Kk'n1 (6.63c) 
——, — 
=uini 
= GUN + k'n1, (6.634) 


ce qui signifie que n1 divise x — a. 
De même nous prouvons que n2 divise x — a. Il existe k,{ € Z tels que 
EQooFMWBooT 0j 
æ—a= kn = in. Q FA 


En particulier n1 divise {n2 alors que n1 et n2 sont premiers entre eux. Le lemme de Gauss 
3.71 dit alors que n1 divise {. Il existe donc s € Z tel que { = sn. En remettant ce { dans 
(6.64), nous trouvons 

T— a = In = NN, (6.65) 


11. Définition 1.252. 
12. Je dis ça au hasard; je n'ai pas vérifié. Faites-moi signe si c'est bon. 
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et donc x — a est divisible en nin2, c’est-à-dire 
TE [amine (6.66) 


ce qu'il fallait prouver. 


THOo00QHYLooVMBAfe 
Théorème 6.29 (Théorème chinois[160]). 
Soient p,q deux naturels premiers entre eux. Si p, q > 2 alors l’application 
o: Z/pq2Z — Z/pZ x Z/q2Z 


[x] »g ré (Ecls; [xla) (6.67) 


est un isomorphisme d’anneaut. 


Démonstration. Nous devons prouver que l’application @ respecte la somme, le produit et qu’elle 
est bijective. En ce qui concerne la somme, 


D([alpa + [Ylpg) = P((x + y) mod pq) (6.68a) 
= ([x + ylo, [x + ylo) (6.68b) 
= ([xlp + [un [la + [yla) (6.68c) 
= (xl, [rle) + ([ylo: [yla) (6.684) 
= d(x) + (y) (6.68e) 

En ce qui concerne le produit, c’est le même jeu : nous obtenons 
P(Lxylpa) = E(Lrlpal) 2 (T]pa) (6.69) 


en utilisant le fait que [xyl, = [x]p[y]p. 
Montrons maintenant que @ est surjective. Soient y1, y2 € Z et x € Z. Demander 


O([x]pq) = ([g1» [y2]a) (6.70) 


revient à demander de résoudre le système 


{ [rl = [y1l» (6.71a) 
[tla = [y2la (6.71b) 


pour l’inconnue x € Z. Le lemme chinois 6.28 nous assure qu’une solution existe. 
En ce qui concerne l’injectivité, nous supposons que x et y soient deux entiers tels que 


O([x] pq) = ([Y]pa)- (6.72) 


Nous en déduisons le système 


[tip = [yl» (6.73a) 
[rl = [y] (6.73b) 


c’est-à-dire qu'il existe des entiers k et { tels que x = y + kp et x = y + lq ou encore tels que 
kp + 1q = 0. (6.74) 


Étant donné que p et q sont premiers entre eux, le lemme de Gauss 3.12 implique que p divise L : 
il existe l’ e Z tel que /[p' = I. En injectant cela dans x = y + {q, nous trouvons x = y + l’pq. Donc 
[Tlpg = [Y]nas ce qu'il fallait. 


THOo0VIGQooUhwBLS 
Théorème 6.30 (Théorème chinois[1]). 
Soit À un anneau commutatif. Soient n > 2, des éléments x1,...,x, dans À et des idéaux Li,...,1h 
tels que I; + 1; = A pour tout à Æ j. 
Alors il existe un x € À tel que x — x; € J; pour tout 1 <i<n. 
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Démonstration. En plusieurs points. 
(1) Définition de J4 
Pour k€ {1,...,n} nous notons J} le produit J4 = [[,,, Li. 
(2) Si k Zi alors J4 € I; Un élément de J4 est de la forme 


[I + [I _ nr 


LEk L£k 
lÆi 


avec & € L. Vu que a; est dans J; qui est un idéal, tout le produit (6.75) est dans J;. 


(3) + J; = À En effet, soit k Æ à. Nous avons J, € 1, et donc 


l+Jci; +1, = A. (6.76) 

(4) Des a et des 5 
Soit te {1,...,n}. Puisque 1; +J; = À, nous pouvons donc prendre à; € 1; et 5; € J, tels que 
ai + B; = 1. (6.77) 


(5) Et enfin Nous posons + = D}, Bixi. Pour chaque k nous avons 


TZ — Xp = >, Bit — Ty (6.78a) 
il 

— >. Bit + (Bk — Leg (6.78b) 
i£k 
i£k 


Les deux termes sont dans /4. En effet, d’une part f; € J; € 14, et 14 est un idéal, donc 
Bixi € 14, et d’autre part ax € 14, donc ayxy € 14. 


Un idéal étant stable par somme, la somme du tout est dans 1}. 


Remarque 6.31. 

Ce théorème chinois est bien une généralisation du lemme chinois 6.28. En effet, l’élément x dont 
il est question est solution du problème x = x; mod J;. L'hypothèse 1; + 1; = A n’est pas nouvelle 
non plus étant donné que si p et q sont des entiers premiers entre eux nous avons pZ + qZ = % 
par le corolaire 1.231. 


6.3 Polynômes à coefficients dans un corps 
SECooFYOGooQHitgE 


Nous supposons que K est un corps commutatif, et nous étudions l’anneau K[X], défini 


en 1.352. 
LEMooKSTIooSTxA11l 


Lemme 6.32 ([116]). 
Soit un anneau factoriel À, ainsi que son corps des fraction! K. Si P e K[X] est de degré > 1, 
nous pouvons écrire P = qP; où 

(1) ae K* 

(2) Pi € A[X] est primitif l#. 


13. Définition 1.362. 
14. Définition 3.112(1). 
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Démonstration. Nous considérons le polynôme P — X 50 Si XI avec n > l, a; € À,s;e A* et 
J 


an À 0. Si s € ppem({s;};-1..n), nous avons 
1e : 
= 2er (6.79) 
3= 


avec a; € A. 


Si de pgcd({a;}), nous pouvons écrire a 
tout Ça, 


l. = 


; = db; où ls b;e À sont premiers entre eux. Avec 


d | 
P= NV px, | 
= 2 b (6.80) 


Maintenant en posant q = d/s et Pi = pr by XI nous avons ce qu’il faut parce que d/s € K* et P; 
est primitif. 


LEMooGTPJooPWkffg 
Lemme 6.33 ([10]). 
Soit un polynôme primitif P € A[X] sur l’anneau factoriel A. Nous notons K le corps des fractions 
de À Soient Q,R € K[X] tels que P = QR. Il existe q,r € K tels que 


P = (4Q)(rR) (6.81) 
avec qQ, rR dans A[X|. 


Démonstration. En utilisant le lemme 6.32, nous considérons gQ = Q: et rR = R1 avec Q1 et R: 
primitifs dans A[X]. Avec ces éléments nous avons 


E MGXYoo! 
R1Q1 = rqPQ = qgrP. RRONCREES (6.884 


À priori q et p sont dans K. Nous allons prouver que gr = 1 ...pas tout à fait. Nous allons prouver 
que gr est inversible. Ensuite il faudra choisir les q et r un peu autrement. 
(1) gre A Posons P = Y;a;X° ainsi que gr = s/t avec s,t € A. Nous supposons que s/t est 
une fraction irréductible. L’équation (6.82) nous dit que le polynôme gr P est R1Q: et donc 
à coefficients dans À. Pour chaque :, il existe donc b; € À tel que 


54; 
ra = b;, (6.83) 
ou encore sa; = tb;. Donc nous avons t | sa; pour tout à. Vu que la fraction pgcd(t, s) = 1, le 
lemme de Gauss 3.71 nous indique que t divise a;. Donc si 0 e pgcd({a;}i=1,..n), alors t | 6. 
Vu que P est primitif, 6 est inversible, et donc t l’est aussi. Nous avons alors le calcul 

S st”! 


1 


Nous avons prouvé que qr € À. 


(2) gr est inversible 


Comme gr est dans À nous pouvons l’utiliser dans le lemme 1.197. Nous savons que c(P) est 
inversible, disons c(P) = u. Nous avons donc, en utilisant le lemme 3.116, 


gru = gr c(P) = uc(qrP) = uc(Q1R1) = uvc(Q1)c(R1) € A* (6.85) 


pour un certain inversible v € A*. Donc qru est inversible et comme w est inversible, gr est 
inversible. 
(3) Conclusion 

Nous avions P = QR, et nous avions posé 4Q = Q1, rR = R1. Maintenant, en posant 
u = (gr)! nous avons 

(ugQ)(rR) = ugrQR = P. (6.86) 
En même temps, ugQ = uQ1 € A[X] et rR = R1 € A[X]. Donc les polynômes qui satisfont 
la demande sont uqQ et rR. 
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THOooJESZooNqScLF 
Théorème 6.34 ([10]). 
Soient un anneau factoriel A et son corps des fractions K. Les irréductibles !* dans A[X1] sont : 


(1) les polynômes de degré zéro dont l’unique coefficient est un élément irréductible de À (poly- 


nômes constants), ITEMooVKO0ooDeGYYz 


(2) les polynômes de A[X] qui sont de degré > 1, primitifs dans ATX] et irréductibles dans K[X]. 
Démonstration. Un polynôme est soit de degré zéro soit de degré > 1. 


(1) Degré zéro, = 


Soit un polynôme irréductible !$ P e Po(A). 


Si nous notons a € À l’unique coefficient de P, nous devons prouver que a est irréductible 
dans À. 


(la) a n’est pas inversible Si a était inversible dans À, alors nous pourrions considérer 
le polynôme Q € Po(A) dont le coefficient est a-!. Nous aurions alors PQ = U où 
U € P(A) est le polynôme dont le coefficient est 1 € À. 


Ce U étant le neutre pour la multiplication dans P(A), le polynôme P est inversible, ce 
qui est contraire à l’hypothèse. 


(1b) a n’est pas produit de deux non inversibles Même jeu : si a = xy avec x et y 
non inversibles, alors en prenant les polynômes correspondants, P est produit de deux 
non inversibles, le polynôme P serait produit de deux non inversibles, et donc pas 
irréductible dans P(A). 


(2) Degré zéro, = 


Si a est irréductible dans À, le polynôme P de coefficient a est irréductible dans P(A). Même 
principe de preuve que le point précédent. 

(3) Degré n > 1, = 
Soit P € P,(A) irréductible dans P(A). Nous devons démontrer que P est dans le cas 
(2). Nous écrivons P = c(P)P; avec Pi primitif. Vu que P n’est pas produit de deux non 


inversibles et que Pi n’est pas inversible, le polynôme c(P) e Po(A) est inversible !?, et donc 
c(P) est inversible dans À. Cela démontre déjà que P est primitif. 


Pour voir que P est irréductible dans P(K), nous supposons avoir une égalité P = QR avec 
Q,RE P(K). Par le lemme 6.33, il existe q,r € K tels que 


P = (qQ)(rR) (6.87) 


avec 4Q,rR € P(A). Vu que P est irréductible dans P(A), soit qQ soit rR doit être inversible 
dans P(A). Supposons que ce soit gQ. Nous avons donc gQ € A* (qui serait mieux écrit 
qQ € Po(A*)), et donc Q e P(K)*. 
En résumé nous avons prouvé que si P = QR (dans P(K)), alors soit Q soit R était dans 
PK)". 

(4) Degré n > 1, = 
Nous supposons que P € P;(A) vérifie la condition (2), et nous montrons qu’il est irréductible 
dans P(A). Les polynômes non constants ne sont jamais inversibles, donc pour cette partie-là 
de la définition d’irréductibilité on est bon. 


15. Définition 1.185. 

16. Cette notation P de (1.486) devrait être utilisée plus souvent; dans le meilleur des mondes, on n’utiliserait 
jamais A[X1|. 

17. On note de la même manière le polynôme constant c(P) et l'élément c(P) dans À, parce qu’on a beau détester 
les abus de notations, il y a des limites. 
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Supposons que P = QR avec Q,R € P(A) € P(K). Comme P est irréductible dans P(K), 
un des deux Q ou R est inversible dans P(K). Disons que Q le soit. Donc Q € P(K)*, et 
nous notons q € K* l’unique coefficient de Q. Nous avons donc 


Pegh FRONT AE) 


Comme, dès le début, on avait dit Q € P(A), nous avons en réalité q € À. Nous pouvons donc 
prendre le contenu de (6.88) en appliquant le lemme 1.197 : c(P) = qc(R). Nous savons que 
c(P) est inversible dans À; nous multiplions par c(P) 1: 


1 = qc(R)c(P) !. (6.89) 


Nous voyons que c(R)c(P)-! est un inverse de q dans A. Donc P est irréductible dans P(4). 


THOooVZUBooNSvcBr 


Théorème 6.35 ([10]). 
Si À est un anneau factoriel, l'anneau des polynômes P(A) est factoriel. 


Démonstration. Si P € P(A), nous devons prouver l’existence et l’unicité d’un décomposition de 
P en irréductibles. 


Existence 


Nous y allons par récurrence sur le degré de P. 


(1) Si deg(P) =0 L’unique coefficient de P est un élément de À, et se décompose en irréduc- 


(2 


) 


tibles parce que À est factoriel. 
Si deg(P)=n+1 Nous supposons que l'existence est prouvée pour tout k < n. Nous 
écrivons P = (P)P) avec P primitif dans P(A). Il y a deux possibilités : soit c(P) est 


inversible, soit non. Si c(P) est inversible, alors P est primitif et nous posons P. = P et 
(0) 
1 


ci = 1. Si c(P) n’est pas inversible, alors nous posons € = c(P) et P1 = . Dans les deux 
CaS nous avons 


P=ar (6.90) 
où P, est primitif et c1 est soit 1 soit non inversible. Si €; = 1, il n’y a rien à faire avec 
lui. Sinon, il est non inversible et non nul dans À qui est factoriel. Nous avons donc une 


décomposition en irréductibles c1 = p1...p4. Dans le cas € = 1, nous avons p1 = 1 et c’est 
tout. 


En ce qui concerne P\, il y a deux possibilités : soit il est irréductible dans P(K) soit pas. Si 
il est irréductible dans P(K) alors il est à fortiori irréductible dans P(A) et 


P = p1...prP (6.91) 


est une décomposition de P en irréductibles dans P (4). 


Et si P, n’est pas irréductible ? C’est qu’il existe deux non inversibles Q, R € P(K) tels que 
P = QR. Le lemme 6.33 permet d'écrire alors 


PL=QR=QR (6.92) 


avec Q1,R1 € P(A). Notons que ni P, ni R1 ne sont des constantes : les constantes sont 
inversibles dans P(K). Et comme la construction du lemme montre que deg(Q1) = deg(Q) 
et deg(R1) = deg(R), les polynômes Q1 et R1 sont non constants dans P(A). Nous avons 
donc deg(Q1) < n +1 et deg(R1) < n +1. 

L'hypothèse de récurrence fonctionne pour les polynômes Q1 et R1 dans P(A). Nous avons 
donc des polynômes irréductibles $5,...5, tels que 


Pi = Qu = Si... Si. (6.93) 
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Au final, nous avons la décomposition !° 


P = p1...pr91...81. (6.94) 


Unicité 


Soient P = p1...pp91...Sm = qg1...q11...1, deux décompositions de P en irréductibles de 
A. Les p; et les q; sont les polynômes de degré zéro (donc dans À) et les S;, T; sont ceux de degré 
strictement positifs. 


(1) Pour les p; et q; 


— 


Comme les polynômes $; et T'; sont irréductibles leurs contenus sont inversibles, et en utilisant 
les lemmes 3.116 et 1.197, l'égalité 


EPL: O0) Eloi + Qi) (6.95) 


devient 
D1 .- .prC(Si …. En) — 41... aTi . Th (6.96) 


Il existe donc un inversible u € À tel que p1 ...px = uqi ... q. L'élément (uq) est irréductible 
(lemme 1.188) et donc 

p1...pr = (ug)g...4q (6.97) 
sont deux décompositions en irréductibles du même élément dans À. Donc, parce que À est 
factoriel, nous avons k = let il existe une permutation © qui fait que p; est associé à q;(:). 


Pour les polynômes 


Nous avons S5...8S,n = T1...1m. Le polynôme S: divise le produit T1 ...7%,. Comme $: est 
irréductible dans P(A), il est irréductible dans P(K) par le théorème 6.34. 

L’anneau P(K) est euclidien par 3.107 et donc principal par 1.247. Or dans un anneau 
principal, les irréductibles sont premiers par 1.227. Tout ça pour dire que S1 est premier 
dans P(K). Donc, comme il divise un produit, il doit diviser un des facteurs. Disons que 
Si | T; dans P(K). 

Il existe À € P(K) tel que S1R = Ti. Comme Si est non inversible (irréductible), et T; est 
irréductible, R doit être inversible dans P(K). Il existe qg € K* tel que T; = q$S1. 

Comme T; et 51 sont irréductibles, ils sont primitifs dans P(A) (théorème 6.34). Supposons 
que q s’écrive sous forme irréductible g = s/t avec s8,t € A. On note T; — >; a; XŸ et 
S1 = D b;X1. Pour tout à nous avons 

sb; 

Es = à, (6.98) 
ou encore sb; = ta;. Donc t divise sb; pour tout j. Mais comme f est premier avec s, l'élément 
t divise b; pour tout j. Il divise dont le pgcd des a; qui est inversible parce que T; est primitif. 
Bref, t est inversible dans À. Nous avons donc 

s st! 


ee st le A. (6.99) 


Nous avons donc T; = q$S1 avec q € À. Comme 7; et Si sont irréductibles dans P (A), l'élément 
g est inversible dans À. 
Nous avons fini de montrer que S1 était associé à un des 7;. L'égalité 


so =. (6.100) 


peut être alors récrite 
51: : : Sm = QT... T1 S1Ti41 Th (6.101) 


18. Ici [116] utilise le théorème 6.34. Certes, il présente sa récurrence de façon un peu différente, mais j'espère n'avoir 
pas loupé une étape. Soyez prudente et écrivez-moi si vous voyez une erreur. 


6.3. POLYNÔMES À COEFFICIENTS DANS UN CORPS 427 


Comme À est factoriel, il est intègre, et donc P(A) est intègre (théorème 3.101). Nous pouvons 
donc simplifier par Si et il reste 


Sn =. TD. (6.102) 


Par récurrence, nous avons que chacun des S; est associé à un des T;. 


PropqGZXvr 
Proposition 6.36 ([116, 161]). 
Si K est un corps commutatif, alors l'anneau des polynômes P(K) est est factoriel}°. 


Démonstration. Un corps est un anneau factoriel (proposition 3.78), donc le théorème 6.35 conclut 
que l’anneau des polynômes sur un corps est factoriel. 


6.3.1 Irréductibilité 


Pour rappel, un élément irréductible dans un anneau est la définition 1.185 : non inversible et 


pas les produit de deux non inversibles. 
LEMooTMSUooCWoVHG 


Lemme 6.37. 
Soit un corps K. Les éléments inversibles dans K[X] sont les polynômes constants non nuls. 


Exemple 6.38. 

Si un polynôme P € Z[]X] n’a que des racines complexes, ça ne l'empêche pas d’être réductible 
sur Z. La réductibilité ne signifie pas qu’on peut mettre des racines en évidence. Par exemple le 
polynôme P = X4+3X? +2 est réductible sur Z en 


P=(X?+1)(X? +2), (6.103) 

mais n’a pas de racines dans Z. Si on veut réduire plus, il faut sortir de Z. 
A 
DefCPLSooQaHJKQ 


Définition 6.39 (Polynôme scindé). 
Nous disons que P € K[X] est scindé sur K si il est produit dans K[X] de polynômes de degré 1. 


Note : les constantes ne sont donc pas des polynômes scindés. 


Proposition 6.40 (Critère d’Eisenstein). 
Soit le polynôme P = 2. anX" dans Z[X]. Nous supposons avoir un nombre premier p tel que 


(1) p divise tous les ap,...,an-1, 
(2) p ne divise pas an, 
(3) p? ne divise pas ao. 


Alors P est irréductible dans Q[X]. 
Si de plus P est primitif au sens du pgcd (définition 3.112) alors P est irréductible dans Z[X]. 


Démonstration. Nous considérons P le polynôme réduit modulo p, c’est-à-dire P € F,[X]. Étant 
donné que par hypothèse tous les coefficients sont multiples de p sauf a,, nous avons P = cX?. 
Supposons par l’absurde que P = QR avec Q,R € QIX]. Alors le lemme de Gauss (3.71) impose 
P,Q € ZIX|. 

Nous avons aussi, au niveau des réductions modulo p que QR = P. Or P est un monôme, donc 
Q et R doivent également l'être. Donc Q = dXF et R = eX"-F et en particulier Q(0) = R(0) = 0, 
c’est-à-dire que Q(0) et R(0) sont divisibles par p. Cela impliquerait que ao = Q(0)R(0) soit 
divisible par p?, ce qui est exclu par les hypothèses. Donc P est irréductible. 

Supposons de surcroît que P soit primitif au sens du pgcd. Il est donc irréductible et primitif 
sur Q[X] et le corolaire 3.131 nous dit alors que P est irréductible sur Z[X|. 


19. Définition 3.61. 
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Exemple 6.41. 

Soit le polynôme P = 3X4 + 15X? + 10. Pour appliquer le critère d’Eisenstein il nous faut un 
nombre premier p divisant 15 et 10, mais pas 3, et dont le carré ne divise pas 10. On aura vite vu 
que p = 5 fait l'affaire. Le polynôme P est donc irréductible sur Q[X|. A 


6.3.2 Idéaux 


Soit P e K[X] un polynôme. Nous notons (P) l'idéal engendré par P : 
(P) = {PR tel que R € K[X]}. FqDer SO 


Lemme 6.42. 
Nous avons 


(1) (P) € (Q) si et seulement si Q divise P, 
(2) (P) = (Q) si et seulement si P et Q sont multiples (non nuls) l’un de l’autre. 


Démonstration. Si (P) € (Q), en particulier P € (Q) et il existe R € K[X] tel que P = QR, ce 
qui signifie que Q divise P. 

Si les idéaux de P et de Q sont identiques, l’un divise l’autre et l’autre divise l’un. Ils sont donc 
multiples l’un de l’autre. 


ThoCCHkoU 
Théorème 6.43. 


Soit K un corps commutatif. ITEMooL.ZWMooDRsRuW 


(1) L'anneau K[X] est euclidien et principal. 


(2) SiT est un idéal dans K[X!] et si PET est de degré minimal, alors (P) FrhtooASHKooZqkiCH 


(3) De plus si T Æ {0}, i existe un unique polynôme unitaire y tel que TI = (y). 


Démonstration. Le point (1) a déjà été démontré dans le lemme 3.107 via le fait que K[X] est 
euclidien. Nous allons cependant donner ici une preuve directe que tous les idéaux de K[X] sont 
principaux. Si 1 = {0}, le résultat est évident. Nous supposons donc 1 non nul. Soit P de degré 
minimum parmi les éléments de 1. Évidemment (P) € I. Nous allons démontrer qu’en réalité 
PEUT: 

Soit P'E I. Par le théorème 3.104 de la division euclidienne , il existe Q et R dans K[X1] tels 
que P' = PQ + R avec deg(R) < deg(P). Étant donné que R = P' — PQ nous avons R € I et par 
conséquent À = 0 parce que P a été choisi de degré minimum dans 1. Nous avons donc P' = PQ 
et Ic(P). 

L'existence d’un polynôme unitaire qui génère Z est obtenu en choisissant 1 = P/a, où a, est 
le coefficient du terme de plus haut degré. L’unicité d’un tel polynôme est obtenu par le fait que si 
1 et y’ génèrent le même idéal, alors ils sont multiples l’un de l’autre, or puisqu'ils sont unitaires, 
ils sont égaux. 


Nous voyons que n'importe quel polynôme de degré minimum dans un idéal génère l'idéal. 
Une importante conséquence du théorème 6.43 que nous verrons plus bas est que tout polynôme 


annulateur d’un endomorphisme est divisé par le polynôme minimal (proposition 9.99). 
CorsLGiEN 


Corolaire 6.44. 
Si K est un corps et si P est un polynôme irréductible, alors l’ensemble L = K[X|/(P) est un 
corps. De plus L est un espace vectoriel de dimension deg(P). 


Démonstration. En effet K[X] est un anneau principal par le théorème 6.43, par conséquent la 
proposition 1.239(2) déduit que K[X|/(P) est un corps. 


20. Ici K est un corps et donc l’hypothèse d’inversibilité est automatiquement vérifiée. 
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Une base de L est donnée par les projections de 1,X,X 2,...,X"-1, En effet ces éléments 
forment une famille libre parce que si Er ax; X" = 0 alors un représentant de cette classe doit 
être de la forme SP dans K[X|, c’est-à-dire 


D aœX* = SP, (6.105) 


ce qui n’est possible que si S = 0 et ay = 0. D'autre part c’est un système générateur. En effet si 
P = X"+Q avec deg(Q) = n — 1 alors 


xt Xnxt 2 (p-Q)X! = QX!. (6.106) 


Nous avons donc exprimé X"+{ comme une somme de termes de degré n + [ — 1. Par récurrence 


nous pouvons exprimer tout X”+!{ comme combinaison d'éléments de degré plus petit que n. 


6.45. 
Ce corolaire prendra une nouvelle jeunesse lorsque nous parlerons de polynômes d’endomorphismes, 


en particulier la proposition 9.109 va donner des précisions. 
LEMooGRIMooPxCXAZ 


Lemme 6.46 ([162]). 
Soit un isomorphisme de corps T: K — K’. Alors 


(1) L'application étendue 
T: KIX] — K'[X] 


a X° =. D iT(a)X° (6.107) 


est un isomorphisme d’anneaux ; 


(2) pour tout P € K[X|, le passage au quotient 


dr: KIXT/(P) — K'[X/(r(P) (6.108) 
Qr r(Q) 


est un isomorphisme d’anneaux (et d’abord est bien définie). 


Démonstration. Nous n’allons pas faire explicitement toutes les vérifications, mais tout de même 
les principales. Montrons que 7 respecte le produit entre K[X] et K’[X]. Nous rappelons que ce 
produit est défini par la formule (1.489). En notant P, les coefficients de P et Q; ceux de Q et en 
remarquant que la définition de 7 est essentiellement que r(P); = T(P;), nous avons : 


(PQ) =r(5 S PQ) x*) (6.109a) 
k  1=0 


k 
à à (PQ) (6.109b) 
k 
k 
= 2. 20 )7(Qx-1) (6.109c) 
k 
= > x’ > r(Phr(Q)x-1 (6.109d) 
k 1=0 
De iX°) Di(r(Q);x) (6.109e) 
i j 
=7(P}r(Q). (6.109f) 


Passons à l’isomorphisme d’anneaux donné par @.. 
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(1) Bien définie 
Si Q1 = Q2 alors Q2 = Q1 + RP pour un certain Re K[X]. Dans ce cas, 


r(Q2) = T(Q2) = T(Q1) +T(RP) (6.110a) 
= T(Q1) + T(R)T(P) (6.110b) 
= 7(Q:). (6.110c) 


L'application @- est donc bien définie. 
(2) Injection 
Si b(Q1) = p7(Q2) alors 7(Q1) = T(Q2), ce qui signifie que 


T(Q1) = T(Q2) +R r(P) (6.111) 


pour un certain À € K’[X]. Puisque r: K[X] — K’[X] est un isomorphisme, nous pouvons 
y appliquer Tr! pour trouver : 
Q1 = Q2+7 '(R)P, (6.112) 

ce qui signifie que Q1 = Q». 

(3) Surjection 
Un élément de K'[X]/(r(P)) est de la forme Q avec Q € K’[X]. C’est l’image par 9. de 
l'élément r-1(Q) e K[X]/(P). 

(4) Morphisme 


Nous vous laissons vérifier que l'application @, est un morphisme d’anneaux. 


6.3.3 Identité de Bézout 


Théorème 6.47 (Bézout). 
Les polynômes P1,...,P, dans K[X] sont étrangers entre eux si et seulement si il existe des 
polynômes Q1,...,Qn € K[X] tels que 


ThoBezoutOuGmLB 


PiQ1 +: + PnQn = 1. (6.113) 


Deux polynômes P et Q ne sont donc pas premiers entre eux si il existe des polynômes x et y 
tels que l'identité de Bézout soit vérifiée : 


xP + yQ = 0: Fa 44) 


cette dernière pourra être écrite en termes de la matrice de Sylvester, voir sous-section 9.2.7. 
LemuALZHn 


Lemme 6.48. 
Soient (Pj)5=1,..n € K[X] des polynômes étrangers deux à deux. Alors les polynômes 


=||# (6.115) 
JA 
sont étrangers entre eut”|. 
LemzwkYdn 
Lemme 6.49 ([163]). 
Soit K un corps commutatif et À © K un sous anneau de K. Alors A[X], vu comme idéal de 
K[X], est un idéal premier. 
En d’autres termes, si o € K[ÏX|, et si il existe Q € K[X] unitaire tel que dQ € A[X], alors 
pe AIX. 


21. Et non seulement deux à deux. 
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6.3.4 Lemme et théorème de Gauss 
ThoLLglsig 


Théorème 6.50 (Théorème de Gauss). 
Soient P,Q,R € K[X] tels que P soit premier avec Q et divise QR. Alors P divise R. 


Démonstration. Étant donné que P est premier avec Q, le théorème de Bézout ?? nous donne 
U,V € K[X] tels que PU + QV = 1. De plus il existe un polynôme S tel que PS = QR. En 
multipliant l’identité de Bézout par À, nous obtenons 


R= PUR + QVR = PUR +VPS = P(UR + VS), (6.116) 


ce qui signifie que P divise R. 


Le lemme suivant est une généralisation du lemme de Gauss dans Z (lemme 3.71). 
LemEfdkZw 


Lemme 6.51 (Lemme de Gauss[112]). 
Soient les polynômes unitaires P,Q € QIX]. Si PQ € ZIÏX|, alors P et Q sont tous deux dans 
ZIX |. 


Démonstration. Soit a > 0 le plus petit entier tel que aP € Z[X] (c’est le PPCM des dénomina- 
teurs) et de la même façon b > 0 le plus petit entier tel que bQ € Z[X]. On pose P, = aP et 
Q1 = bQ. 

Si ab = 1, alors a = b = 1 et nous avons tout de suite P,Q € Z[X]. Nous supposons donc 
ab > 1 et nous considérons p, un diviseur premier de ab. Ensuite nous considérons la projection 


Ap: Z[X] — (Z/pZ)[X]. (6.117) 
Par définition abPQ = PQ; € ZÏX]; en prenant la projection, 


(PQ) = m(P1Q1) = rP(ab)ry (PQ) = 0 (6.118) 


parce que m(ab) = 0. Étant donné que (Z/pZ)[ X] est intègre (théorème 3.101), nous avons soit 
fp(P1) = 0 soit r»(Q1) = 0. Supposons pour fixer les idées que 7,(P1) = 0. Alors P1 = pP> pour 
un certain P> € Z[X]. Par ailleurs P est unitaire et P, = aP, donc le coefficient de plus haut degré 
de P, est a, et nous concluons que p divise a. 

Mettons a = pa’. Dans ce cas, pa P = P, = pP:, et donc a/P = P, € Z[X]. Cela contredit la 
minimalité de a. 


6.3.5 Polynômes sur un corps et pgcd 


Nous savons qu’un corps est un anneau intègre (lemme 1.194). De plus l’ensemble des polynômes 
sur un anneau intègre est lui-même un anneau intègre (théorème 3.101). Donc la notion de pgcd à 
utiliser dans le cas de K[X] est celle de la définition 1.182. 


LEMooX1S0OooNAMeVXx 
Lemme 6.52 (Unicité du pgcd à inversibles près). 
Soit un corps commutatif K et S € K[X]. 
(1) Si 61 et 62 sont des pgcd”* de S, alors 61 = kô2 avec k € K. ITEMooARLJoo0QvBcw 


(2) Il existe un unique polynôme unitaire dans pgcd(S). 


Démonstration. Nous savons que Ô: est un pgcd de $, mais que ô2 divise $. Donc 02 | 81. De la 
même manière, 01 | 02. Il existe donc À, B € K[X] tels que 01 = A02 et 02 = Bô1. En substituant, 


61 = ABG. (6.119) 


22. théorème 6.47. 
23. Définition 1.182. 
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Mais K[X] possède la propriété de simplification par la proposition 1.193(3). Donc AB = 1. Cela 
signifie entre autres que À et B sont des inversibles de K[X]. 

Or les seuls inversibles dans K[X] sont les éléments de K ; si vous en doutez, pensez que le 
degré de AB est supérieur ou égal à celui de À. 

En ce qui concerne l'existence et l’unicité d’un polynôme unitaire dans pgcd(S). Existence : 
SP=Sr, a; XF € pgcd(S), alors le polynôme P/a, est unitaire et également dans pgcd(S). 
Unicité : supposons que P est unitaire dans pgcd(S) et que Q est dans pgcd(S). Il existe k € K tel 
que Q = kP. Vu que P est unitaire, Q ne l’est pas. 


NORMooUJDJooWfijxT 
6.53. 
En général, lorsque nous dirons « le » pgcd d’un ensemble de polynômes, nous parlerons du pgcd 
unitaire, qui existe et est bien défini par le lemme 6.52. En particulier, si P et Q sont des polynômes, 


nous notons pgcd(P, Q) l’unique polynôme unitaire parmi les PGCD de P et Q. 
LEMooIAGMooHUQtUs 


Lemme 6.54 ([164]). 
Soit un corps commutatif K, deux polynômes quelconques À, B € K[X] et un polynôme unitaire 
G. 


Nous avons G = pgcd(A, B) si et seulement si les deux conditions suivantes sont satisfaites : 
(1) Il existe U,V € K[X] tels que AU + BV = G, 
(2) G divise À et B. 


Démonstration. Une implication dans chaque sens. 


(4) = 
Si Gest le pgcd de À et B, il est clair que G|A et G|B. Il reste donc à montrer l'existence des 
polynômes U et V vérifiant AU + BV = G. Puisque G divise À et B, il existe des polynômes 
A1, B1 tels que À = GA; et B = GB. 
Nous montrons que les polynômes A1 et B1 sont premiers entre eux. S'ils ont un diviseur 
commun D, alors GD est un diviseur commun à À et B. Or, G est le pgcd de À et B donc 
GD|G'; D ne peut être qu’un polynôme constant (c’est-à-dire un élément de K). Mais comme 
G est unitaire, le coefficient du terme de plus haut degré de GD doit être 1. Donc D = 1. 
L'élément 1 est l’unique diviseur commun de À; et B;; donc À; et B; sont bien premiers 
entre eux. 
D'après le théorème de Bézout 6.47, il existe donc U et V tels que AjÙ + BV = 1. En 
multipliant par @, nous obtenons l’égalité voulue : AU + BV = G. 

(2) = 
Si G vérifie les deux conditions, montrons que G est le pgcd de À et B. Nous savons déjà 
(par hypothèse) que G divise À et B, il reste à montrer que tous les diviseurs commun à À 


et B divisent aussi G. Soit donc D un diviseur commun à À et B : il existe A1 et B1 tels que 
A = DA; et B = DB:. Nous savons que G = AU + BV donc G = D(AjU + BV), et D|G. 


Par définition, G est bien le pgcd de À et B. 


Notons qu’en supprimant la condition d’unitarité de G@, le résultat tient presque : il suffit de 


remplacer partout « le pgcd » par « un pgcd ». 
LEMooVFBUooLoaUGr 


Lemme 6.55 ([165]). 
Soit un corps K. Soient des polynôme P et Q dans K[X]. Si S est un diviseur commun de P et 
Q, alors 


(1) S divise pgcd(P, Q) 
(2) deg(S) < deg (pgcd(P, Q)). 


ITEMooZTCCooPBqzNE 


ITEMooIIINooUZVtAb 
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Démonstration. Il faut bien relire la définition 1.182 du pgcd; en particulier le point (2) dit exac- 
tement notre point (1). 

Étant donné que S divise pgcd(P, Q) nous avons automatiquement que le degré de S est plus 
petit que celui de pgcd(P, Q). 


LEMooGNAMooXRpgBn 
Lemme 6.56 ([164]). 
Soient deux polynômes À, B premiers entre eux. Si le polynôme P est divisible par À et par B 
alors P est divisible par AB. 


Démonstration. Comme À | P, il existe Q1 € K[X] tel que P = AQ:1. Mais B divise P = AQ; 
alors que B est premier avec A; donc d’après le théorème de Gauss 6.50 : B|Q1. 

Il existe donc Q2 € K[X| tel que Q1 = BQ2. On a donc P = ABQ: : P est bien divisible par 
AB. 


LemUELTuwK 
Lemme 6.57 ([164]). 
y 24) EN 1 À 
Quelques propriétés du PGCD dans les polynômes. Soient des polynômes Pere BE rerc 1 


(1) Nous avons l'égalité? 


pgcd(P, PQ + R) = pgcd(P, R). (6.120) 
ITEMooUVGRooNSGDZn 


(2) SiQ et R sont premiers entre eux, 


pecd(P, QR) = pgcd(P, Q) pecd(P.R) (6.121) 
ITEMooYXAHooXibkgV 


(3) Si P et Q sont premiers entre eux, 


pagcd(P, QR) = pgcd(P, R) (6.122) 


Démonstration. Dans la suite si À et B sont des polynômes, nous dirons « les diviseurs de {A, B} » 
pour parler des diviseurs communs de À et B. 


(1) () 
Nous montrons que {P, PQ + R} a les mêmes diviseurs que {P, R}. 
D'une part, si À | {P, PQ + R}, alors il existe des polynômes B1 et B2 tels que P = AB: et 
PQ + R = AB3. Donc 


R = AB: — PQ = AB: — AB:Q = A(B: — B1Q), (6.123) 


et nous concluons que À divise R. 


D'autre part, si À | {P,R} alors il existe des polynômes B1 et B2 tels que P = AB; et 
R = AB:. Donc 
PQ+R= AB:Q + AB: = A(B:1Q + B2), (6.124) 


et À divise PQ +R. 
Conclusion : les paires {P, PQ +R} et {P, R} ont même ensemble de diviseurs, et donc même 
pgcd. 
(2) C2) 
Nous avons trois polynômes P, Q, R et nous savons que Q et R sont premiers entre eux. Nous 


notons : G1 = pgcd(P,Q) et G2 = pgcd(P, R). Il faut montrer que G1G2 est le pgcd de P et 
QR ; pour cela nous allons utiliser le lemme 6.54. 


24. Définition 1.182. 
25. Notez l’analogie avec le lemme 3.6. 
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(2a) 2U, V tels que G1G2 = PU + QRV 
Puisque G1 = pgcd(P, Q), il existe U1 et V1 tels que G1 = PU + QVA (lemme 6.54). On 
a de même : G2 = PU + RV:. En prenant le produit : 


G1G2 = (PUi + QVi)(PUo + RV2) = P(PUiU + RU1Vo + QV1Ve)+ QR(ViVo). (6.125) 


Donc c’est bon pour ce point. 


(2b) G1 et G2 sont premiers entre eux 


Si D est un diviseur commun à G1 et Go, alors D divise Q et R qui sont premiers entre 
eux; D ne peut être qu’un polynôme constant. Tous les diviseurs communs de G et 
G2 sont dans K. Mais le pgcd est par définition un diviseur commun unitaire, donc 
pacd(G1,G2) = 1. Cela signifie que G1 et G2 sont premiers entre eux (définition 1.252). 
(2c) G1G2 | QR En effet : G1|Q et G2lR donc G1G2|QR. 
(2d) G1G2 | P Le polynôme P est divisible par G1 et par G2, et de plus G1 et G2 sont 
premiers entre eux. Donc le lemme 6.56 conclut que P est divisible par G1G. 


(3) (3) 
Supposons d’abord que À € KI[X] divise P et QR. Le théorème de Bézout 6.47 assure 
l’existence de polynômes Ü et V tels que PU +QV = 1. Ensuite l'hypothèse de division nous 
donne des polynômes B: et B: tels que P = AB; et QR = AB. Nous avons : 


1 = PU + QV = ABiU + QV. (6.126) 


Cela prouve que À est premier avec Q grâce encore à Bézout, mais dans l’autre sens. Donc 
A est premier avec Q et À | QR. Donc A}R par le théorème de Gauss 6.50. 
Dans l’autre sens, si A|R alors on a évidemment : A[QR. 


Les diviseurs de {P,QR} sont exactement les diviseurs de {P,R}. En conséquence, nous 
concluons que les paires {P,QR} et {P, R} ont le même pgcd. 


6.4 Extension de corps 

SECooLQVIenoB&GER 
Lemme 6.58. 
Soit L un corps ® fini et K un sous-corps de L. Alors il existe s e N tel que 


Card(L) = Card(K})*. F9 


Démonstration. Le corps L est un K-espace vectoriel de dimension finie. Si s est la dimension alors 


nous avons la formule (6.127) parce que chaque élément de L est un s-uple d’éléments de K. 
DEFooFLJJooGJYDUÜe 


Définition 6.59 ([166]). 
Soit K un corps commutatif. Une extension de K est un couple (L,j) où L est un corps et 
j: K — L est un morphisme de corps. 


Nous identifions le plus souvent K avec j(K) € L, mais il faut savoir que le corps L étendant K 
n’est pas toujours un sur-corps de K. En particulier, l’ensemble L peut ne pas être une extension 


de l’ensemble K. 
LemooULIlooXzdppM 


Lemme-Définition 6.60. 
Si (L,i) est une extension de K, alors L devient un espace vectoriel sur K si nous posons 


À T4) (6.128) 


pour tout }Ee K etxe L. La multiplication du membre de droite est celle du corps L. 


26. Définition 1.202. 
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DefUYiyieu 
Définition 6.61. 
Le degré de L est la dimension de cet espace vectoriel. Il est noté [L : K] ; notons qu'il peut être 
infini. 
Exemple 6.62. 


L'ensemble C est une extension de R et son degré est [C : R] = 2. A 
PROPooEBS6pGHS32MpY 


Proposition 6.63 (Composition des degrés[167]). 
Si L2 est une extension de L1 qui est elle-même une extension de K, alors L2 est une extension 


de K et on a : 
[Lo : K] = [Lo : La][Ia : K]. oem) 


Dans ce cas, si {vi};er est une K-base de Li et si {wa}acA est une Li1-base de L2 alors {vi;wa} ier 
ae A 


est une K-base de L. 


Notons que la formule (6.129) n’est pas très instructive dans le cas des extensions non finies. 
La seconde partie, sur les bases, est en réalité nettement plus intéressante. 


Démonstration. Soit a € Lo. Puisque les w, forment une L;-base de IL», il existe des ay € LA tels 
que 
a= Ÿ aawa. (6.130) 
(07 


Mais les v; forment une K-base de L1, donc chacun des a, peut être décomposé comme ax = 
Did. Donc : 


a = y AaiViWa (6.131) 
ai 


qui donne une décomposition de a en éléments de {v;w,} à coefficients dans K. La partie proposée 
est donc génératrice. 
Pour prouver qu’elle est également libre, nous supposons avoir des éléments a; € K tels que 


D daititiie = 0. (6.132) 
ai 


En récrivant sous la forme 


D (D ui) = 0, (6.133) 


nous reconnaissons une combinaison linéaire nulle des w, à coefficients dans L:. Les coefficients 
sont donc nuls : ÿ; &œiv; = 0. C’est une combinaison linéaire nulle des v; à coefficients dans K. 
Comme les v; forment une base, les coefficients sont nuls : ax = 0. 


6.4.1 Extension et polynôme minimal 


DefCVMooFGSAgL 
Lemme-Définition 6.64 (Polynôme minimal). 
Soit L une extension de K et ae L. Nous considérons la partie 
1, = {P E K[X] tel que P(a) = 0} (6.134) 
que nous supposons non réduite à {0} ?7 
ITEMooUNLCoo!IfYZry 
(1) La partie I, est un idéal dans K[X|, TTEMooDCDRooPDnnbu 
(2) la partie T, est un idéal principal dans K[X|]|, ITEMooXFYQooTuMzIu 


(3) l'idéal T, possède un unique générateur unitaire. 


27. La non trivialité de 1, est une vraie hypothèse. En effet si nous prenons K = Q et l’extension L = R, alors il 
suffit de prendre un réel a non algébrique sur À pour que Z, soit réduit au seul polynôme identiquement nul. 
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Cet unique générateur unitaire est le polynôme minimal de a sur K. 


Démonstration. En plusieurs parties. 
(1) Pour (1) Soit PEL, : P(a) = 0. Si Q € K[X] alors la proposition 1.356 nous indique que 


(PQ)(a) = P(a)Q(a) = 0. (6.135) 


Donc PQ € 1I,. Comme de plus 1, est clairement vectoriel, 7, est un idéal. 
Notez que nous avons utilisé la règle du produit nul justifiée par le fait que K soit un corps 
et donc soumis au point (3) de la proposition 1.193. 
(2) Pour (2) Nous savons par le théorème 6.43 que K[X] est un anneau principal. En parti- 
culier, tous ses idéaux sont principaux, c’est dans la définition 1.221 d’un anneau principal. 
(3) Pour (3) Le théorème 6.43(3) nous informe alors que 1, possède un unique générateur 
unitaire. 


Si nous avons un corps et un élément dans une extension du corps, il n’est pas autorisé de dire 
« soit le polynôme minimal de cet élément dans le premier corps » parce qu’il n’existe peut-être 
pas de polynôme annulateur. 


6.65. 
Dans le cas des opérateurs sur un espace de dimension finie (par exemple les matrices), il existe 
toujours un polynôme minimal, comme nous le verrons dans le lemme 9.94. 


Exemple 6.66. 
Le polynôme minimal dépend du corps sur lequel on le considère. Par exemple le nombre imaginaire 


pur à accepte X — à comme polynôme minimal sur € et X? +1 sur Q[X]. A 
PropRARooKavaIT 


Proposition 6.67 ([1]). 
Soit L une extension de K et a € L dont le polynôme minimal sur K est lu € Ko oLvxri 


(1) le polynôme 1 est irréductible?” sur K ; 


30 


(2) Le polynôme 4 est premier” avec tout polynôme de K[X] non annulateur de a. 


Démonstration. Une chose à la fois. 

(1) D'abord le polynôme y, n’est pas inversible parce que seuls les éléments de K (ceux de degré 
zéro) peuvent être inversibles *!. Mais ces polynômes sont constants et ne peuvent donc pas 
être des polynômes annulateurs de quoi que ce soit. 

Ensuite, supposons la décomposition u, = PQ avec P,Q € K[X]. En évaluant cette égalité 
en & nous avons 
0 = P(a)Q(a). (6.136) 


1°? et nous déduisons 


Puisque nous sommes sur un corps, nous avons la règle du produit nu 
que soit P(a) soit Q(a) est nul, ou les deux. Pour fixer les idées, nous supposons P(a) = 0. 
Dans ce cas, P fait partie de l’idéal annulateur de a, lequel idéal est engendré par 4. Donc 


il existe S € K[X] tel que P = Su. En récrivant 44 = PQ avec cela nous avons : 


ba = SHaQ (6.137) 


ou encore : $Q = 1, ce qui signifie que S et Q sont dans K et inversibles. 
Nous concluons que y, ne peut pas être écrit sous forme de produit de deux non inversibles. 


28. Si vous connaissez un contre-exemple à cette proposition dans le cas où K serait remplacé par un anneau, écrivez- 


29. Définition 1.185. 

30. Définition 3.108. 

31. Et d’ailleurs, le sont, mais ce n’est pas important ici. 

32. Parce qu’un corps est un anneau intègre par le lemme 1.194 et qu’un anneau intègre est justement un anneau 
sur lequel nous avons la règle du produit nul, voir la définition 1.193. 
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(2) Soit Q un polynôme non annulateur de a. Soit aussi un diviseur commun P de Q et u, dans 
K[X]. Nous devons prouver que P est un inversible, c’est-à-dire un élément de K (le fait que 
P ne soit pas le polynôme nul est évident). Nous avons u, = PR1 et Q = PR2 pour certains 
polynômes R1, R2 € K|[X]. Puisque u, est irréductible par (1), il n’est pas produit de deux 
non inversibles. En d’autres termes, soit P soit R; est inversible. Si P n’est pas inversible, 
alors R1 est inversible ; disons R1 = k € K. Alors 


O0 = u,(a) = P(a)k, (6.138) 


donc P(a) = 0. Mais alors 
Q(a) = P(a)Ri(a) = 0, (6.139) 


ce qui est contraire à l'hypothèse selon laquelle Q n’était pas annulateur de a. 
Nous retenons donc que P est inversible, ce qu’il fallait montrer. 


Définition 6.68. 
Deux éléments a et 5 dans L sont dit conjugués s'ils ont même polynôme minimal. Par exemple 
i et —i sont conjugués dans © vu comme extension de Q. 


6.4.2 Extensions algébriques et éléments transcendants 
6.4.2.1 Éléments algébriques et transcendants 


6.69. 
Mise en garde pour les gens qui aiment avoir des notations précises. Dans les lemmes 6.71 et 6.73 
ainsi que dans la définition 6.75 il faut garder en tête qu’une extension L de K est une application 
r: K — IL. Il n’est pas spécialement vrai que IK est un sous-sensemble de IL. 

Pour être rigoureux, beaucoup d’énoncés devraient contenir plus d'applications : un peu par- 


tout. 
DEFooBBYGooWoUloR 


Définition 6.70. 
L'ensemble A[X] devient un K-espace vectoriel avec la définition 


APje XP. (6.140) 


Voici une définition d’un élément algébrique sur un corps. Une caractérisation plus « pratique » 
sera donnée dans le lemme 6.73. 


LEMooLVPLooEkWYDN 
Lemme-Définition 6.71 (Élément algébrique et transcendant[168]). 
Soit une extension L de K et a € IL. Nous considérons l'application 
op: K[X] -L (6.141) 
PH P(a). | 


Alors 
(1) L'application w est un morphisme d’anneaux*. 
(2) L'application & est un morphisme de K-espace vectoriel. 
Si est injective, nous disons que a est transcendant. Sinon, nous disons qu'il est algébrique. 


Démonstration. Le fait que 4 soit un morphisme d’anneaux est le lemme 1.356 déjà prouvé. 
Pour le morphisme de K-espace vectoriel, il faut seulement ajouter le calcul 


p(AP) = (AP)(a) = AP(a) = Ay(P). (6.142) 


33. Définition 1.42. 
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Notons la justification suivante qui n’est pas tout à fait triviale : 


(AP)(a) = D (AP}raf = Ÿ XP,af = AP(a) (6.143) 
k k 


qui utilise la définition 6.70. 


Exemple 6.72. 
L’injectivité de @ n’est pas automatique. Prenons par exemple L = Q[42] dans R. Les polynômes 
dans Q[X] ont des degrés arbitrairement élevés en X, tandis que les éléments de L n’ont pas de 
degré très élevés en 42 parce que ÿ2V2 = 2. L'ensemble Q[42] ne contient donc que des éléments 
de la forme a + by2 avec a,be Q. 

Si par contre x € R n’est racine d’aucun polynôme (cela existe parce que R n’est pas dénom- 
brable), alors Q[xo] contient tous les ne ay avec N arbitrairement grand. Et tous ces nombres 
sont différents. A 


Le lemme suivant donne une caractérisation d’élément algébrique moins abstraite que la défi- 


nition 6.71. 
LEMooTZSSooZmwYji 


Lemme 6.73. 
Soit K, un corps et L, une extension de K. Un élément a € L est algébrique sur K si et seulement 
si existe un polynôme non nul P € K[X] tel que P(a) = 0. 


Démonstration. Nous considérons l’application & de la définition 6.71. Si 4 n’est pas injective, 
c’est qu'il existe un polynôme P dans K[X] tel que &(P) = 0. Dans ce cas, P(a) = 0. 

À l'inverse si il existe P non nul dans K[X] tel que P(a) = 0, alors w(P) = 0 et & n’est pas 
injective. 


DEFooYZOYooAesmnP 
Définition 6.74. 
Un corps K est algébriquement clos si tout polynôme non constant à coefficients dans K contient 
au moins une racine dans K. 


Nous verrons dans le théorème de d’Alembert 12.90 que © est un corps algébriquement clos. 
DEFooREUHooLVwRuw 


Définition 6.75 (Extension algébrique, clôture algébrique). 
Soient un corps K et une extension a: K — IL. 


(1) L'extension L est une extension algébrique de K si tous ses éléments sont algébriques ** 


sur K, c’est-à-dire sont racines de polynômes à coefficients dans a(K), PPÉU ER UUT PrtoR 


(2) L'extension L est algébriquement close si le corps L est algébriquement clos (définition 
6.1). 


(3) L'extension L est une clôture algébrique du corps K si elle est une extension algébrique 
qui est algébriquement close. 


6.76. 

Donc une extension est algébrique si elle contient seulement des racines de polynômes ; elle est close 
si elle contient au moins une racine de chaque polynôme. L'extension est une clôture algébrique si 
elle est les deux en même temps. 


Exemple 6.77. 
Le corps R n’est pas une extension algébrique de Q. En effet il existe seulement une infinité dénom- 
brable de polynômes dans Q[X] et donc une infinité dénombrable de racines de tels polynômes. 


Toute extension algébrique de Q est donc dénombrable. Voir aussi la proposition 6.130. A 
LEMooEYRSooUREeD1 


Lemme 6.78. 
Un corps est algébriquement clos si et seulement si tous ses polynômes sont scindés*”. 


34. Définition 6.71. 
35. Définition 6.39 
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Démonstration. Si tout polynôme est scindé, tout polynôme possède des racines ; c’est l’autre sens 
qui est plus consistant. 

Soit un corps algébriquement clos K. Nous allons effectuer une récurrence sur le degré des 
polynômes. Si P est un polynôme de degré 1, alors il est scindé. 

Nous supposons que tous les polynômes de degré n — 1 sont scindés. Soit un polynôme P de 
degré n. Le corps étant algébriquement clos, le polynôme P a une racine que nous notons a, € K. La 
proposition 3.124 nous explique qu’il existe un polynôme Q de degré n — 1 tel que P = (X —-a»)Q. 

Par hypothèse de récurrence, le polynôme Q est scindé : il existe {a;};=1,..n-1 dans K tels que 
= Mere — à). Au final, 


PEN ao [Lx — hi) (6.144) 


et P est scindé. 


LEMooYVHKooWhewKp 
Lemme 6.79. 
Soient un corps K et un polynôme P € K[X]. Nous supposons que P est scindé : 


P- [Iæ _ (6.145) 
k=1 


Si a est une racine de P, alors & est l’un des az. 


Démonstration. Dire que a est une racine de P revient à dire que 


(a — ay) =) ARE 


= 


k 


1 


Un corps est toujours un anneau intègre (lemme 1.194), c’est-à-dire que la règle du produit nul est 
utilisable. Dans notre cas, le produit nul (6.146) nous indique que à — ax = 0 pour (au moins) un 
des k. Donc effectivement « est l’un des az. 


Lemme 6.80. 
Soient un corps algébriquement clos K ainsi qu’une extension algébrique a: K — L. Alors a(K) = 
L. 


Démonstration. Nous allons montrer que tous les éléments de L sont dans l’image de a. Soit 
donc ! € IL. Puisque l’extension a: K — IL est une extension algébrique, il existe un polynôme 
P e a(K)[X] tel que P(1) = 0. 

Étant donné que a est injective, il est possible de considérer le polynôme Q = a l(P), c'est-à- 
dire que, si P = Y, ax XF, nous posons Q = >, a (az) XF. 

Le corps K étant algébriquement clos, le polynôme Q est scindé (proposition 6.78) : 


Q = [[(X -) (6.147) 
k=1 
avec b4 € K. Nous avons alors aussi la factorisation 
P = [[(X -a()) (6.148) 
k=1 


dans L[X]. Nous avons vu que { était une racine de P. Donc l est un des a(bx) (lemme 6.79). Cela 
prouve que | € a(K). 
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6.4.3 Extension algébrique et polynôme minimal 


PROPooALFJooDjmIcb 
Proposition 6.81 ([92]). 
Soit une extension algébrique Ÿ L du corps K. 
(1) Pour tout a € L, il existe un polynôme P € K[X] tel que P(a) = 0. ITEMOOEFNFooKYqXDk 


(2) Le polynôme minimal de a dans K[X | est l’unique polynôme unitaire irréductible annulant 
a. 


Démonstration. Le premier point est seulement la définition 6.75 d’une extension algébrique. 

L'idéal annulateur 1, = {P € K[X|] tel que P(a) = 0} n’est pas réduit à {0} parce que L est 
une extension algébrique. L'existence du polynôme minimal est le lemme 6.64 et le fait qu’il soit 
irréductible est la proposition 6.67(1). 

Ce qui nous intéresse ici est l’unicité. Soit u1 € K[X], un polynôme annulateur de a irréductible 
et unitaire. Puisque y € 1, et que par définition, 7, = (y), il existe P € K[X] tel que 1 = Puy. 
Comme y n’est pas inversible et que 1 est irréductible, P doit être inversible : 1 = ku pour un 
certain k € K. 

Puisque u et 1 sont unitaires, k = 1. Donc 1 = y. 


LEMooHKTMooKEoOuK 
Lemme 6.82. 
Soient un corps K, une extension L de K et a € L, un élément algébrique" sur K. Si u est le 
polynôme minimal de à sur K alors 


g: Klal — K[X]/(u) 


O0 (6.149) 


avec Q € K[X] est un isomorphisme de corps et de K-espaces vectoriels. 


Démonstration. D'abord, a est algébrique, donc l'idéal annulateur Z,, n’est pas réduit à {0}, et 
l'existence d’un polynôme minimal est assurée par le lemme 6.64. 
Ensuite, le fait que K[X]/(u) soit un corps est le corolaire 6.44. Nous montrons à présent que 
w est un isomorphisme (d’anneaux) ; cela suffit pour en déduire que K[a] est également un corps. 
Ces préliminaires étant dits, nous commençons. 
(1) Bien définie Nous devons prouver que est bien définie, c’est-à-dire que tout élément de 
K|{a] peut être écrit sous la forme Q(a) pour un Q € K[X], et que si Q1(a) = Q2(a) alors 
Q1 = Q2. 
Le fait que tous les éléments de K[a] peuvent être écrits sous la forme Q(a) est la proposi- 
tion 3.100. Supposons que Q1(a) = Q2(a). Alors nous définissons R € K[X] par Q1 = Q2+R, 
et en évaluant cette égalité en & nous avons 


Q1(a) = Q2(a) + R(a), (6.150) 


autrement dit R(a) = 0. Donc R est dans l'idéal annulateur de à et est donc dans (y), 
c’est-à-dire que dans le quotient K[X]/(4) nous avons R = 0 et donc Q1 = Q». 


(2) Surjective 
Tout élément de K[X]/(u) est de la forme Q pour un Q € K[X]. Or ces éléments sont ceux 
de l’ensemble d’arrivée de «. 


(3) Injective 


Si Q1 = Qo, alors Q1 = Q2 + R avec R dans l'idéal engendré par y, c’est-à-dire entre autres 
R(a) = 0. Donc Qi(a) = Q:(a). 


Nous devons encore montrer que nous avons là un morphisme de K-espaces vectoriels. 


36. Définition 6.75. 
37. Définition 6.71. 
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(1) Sike K alors p(kQ(a)) = kQ. Mais par définition de la structure d'espace vectoriel sur 
K[X]/(u), kQ = kQ (vérifier que cette définition de la multiplication par un scalaire sur 
K[X]/(u) est correcte). 


(2) Nous avons aussi @(Q1(a) + Qo(a)) = p((Q1 + Q2)(a)) = Qi + Q2 = Qi + Q2. 


6.4.4 Extensions et polynômes 


Nous savons déjà depuis la définition 1.352 ce qu'est A[X] pour tout anneau À et donc, à 


fortiori, pour un corps. 
DEFooQPZIooQYiNVh 


Définition 6.83. 


Soit un corps commutatif®. Nous notons K(X) le corps des fractions” de K[X]. 
DEFooZHBZooK1NfGZ 


Lemme-Définition 6.84. 
Si Re K(X), avec R = P/Q et si L est une extension de K contenant l'élément à, alors nous 
définissons 

R(a) = P(a)Q(a) !. (6.151) 


Cela est une bonne définition au sens où elle ne dépend pas du choix du représentant (P,Q) pris 
dans la classe P/Q. 


Démonstration. Supposons R = P1/Q1 = P2/Q2. Par définition des classes (définition 1.362) nous 
die. EQooKHVNoo 
AG=08. (6,149) 


Puisque l'évaluation est un morphisme K[X] — IK{! nous pouvons évaluer l'équation (6.152) en 
a : 


Pi(a)Q2(a) = Qi(a)P2(). FRe0TATG 0e 


Cette dernière est une égalité dans le corps IK. Nous pouvons donc la multiplier par Q2(a) 1Qi(a)" 1 
(et utiliser toutes les hypothèses de commutativité des anneaux et corps) pour obtenir 


Pi(a)Q1(a)" = Pr(a)Qo(a) ?, (6.154) 

c’est-à-dire 
(P1/Q1)(a) = (P2/Q2)(a). (6.155) 
DEFooVSKGooMyeGel 


Proposition-Définition 6.85 ([1]). 
Soient un corps K, une extension (L,j1) de K et un élément à € L. Nous définissons K(a)r, 
comme étant l'intersection de tous les sous-corps de L contenant j1(K) et a. 
Alors 
(1) K(a)x est un sous-corps de L, 
(2) K(a)x est une extension“? de K. 


Démonstration. Nous commençons par prouver que K(a)r, est bien un corps. Si a, b € K(a)r, alors 
il suffit de calculer ab, a + b et a! dans n'importe quel sous-corps de L contenant K et a; nous 
avons une garantie que a, b, ab, a + b et a! sont dans tous les tels sous-corps. 

Pour prouver que K(a)r est bien une extension, nous devons trouver un morphisme de corps 
j: K — K(a)r. On constate que prendre j = j1 fonctionne parce que par définition, K(a)r est 
une partie de L contenant l’image de jy. 


38. Sauf mention du contraire, tous les corps du Frido sont commutatifs. 

39. Définition 1.362. 

40. Définition 6.59. 

41. Lemme 1.356. Certes ce lemme ne parle que d’anneaux, mais à y bien penser, dans le passage de (6.152) à 
(6.153), nous ne considérons que les structures d’anneaux sur K[X] et K. 

42. Définition 6.59. 
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LEMooHZLCooPLHKLS 
Lemme 6.86. 
Soit n tel que /n ne soit pas un rationnel. Si à € {a + b/n}aveQ, alors il existe un unique choix 
(x, y) € Q? tel que 
a = x +yvn. (6.156) 


Démonstration. L'existence est dans la définition de a. Il s’agit de voir l’unicité. Supposons x + 
yyn = a + b/n avec x, y, a, b € Q. Si b Æ y nous pouvons écrire 


T—€Q 


Vn= ns (6.157) 


Comme 4/n n’est pas un rationnel, une telle écriture est impossible. Donc b = y. Nous avons alors 
x + yyn = a+ y4yn et du coup aussi x = a. 


Exemple 6.87. 
Nous avons 


Q(V2)r = {a + bV2} no (6.158) 


où à droite nous calculons les sommes et les produits dans KR. Le tout est un sous-ensemble de R 
qui se révèle être un corps contenant Q et 2. 


En particulier, dans Q(42)r nous avons 4242 = 2. A 
LEMooKVPZooPqPrce 


Lemme 6.88. 
Les corps Q(V2)r et Q(V3)r ne sont pas isomorphes. 


Démonstration. Supposons l'existence d’un morphisme de corps “ 
d: Q(V2)r — Q(V3)R. (6.159) 


Nous notons « 1 » à la fois le neutre de la multiplication dans Q(V2)r et Q(V3)r (qui s'avèrent 
être les mêmes en tant qu'élément de R, mais ça n’a pas d'importance ici). 
Soit a € Q(V2)r tel que a? — 2 = 0. Alors nous avons aussi 


p(a)* —2 = Y(a°) — Y(2) = p(a°? — 2) = #(0) = 0. (6.160) 


Donc #(a) est un élément de Q(43)r qui est une racine de X? — 1. 
Or un tel élément n'existe pas dans Q(V3)r parce que nous savons que dans R entier, il n’y 
a que deux racines : +2, et aucune des deux n’est dans Q(V3)r. 


EXo0oJRSUooYhAZKR 
Exemple 6.89. 
Est-ce que K(a)r, dépend réellement de L? Si L2 est une extension de L alors nous avons évidem- 
ment K(a)r, = K(a)r. 
Nous commençons par construire un corps K un peu idiot qui, comme ensemble, est comme 
Q(V2)r, c’est-à-dire la partie 
{a + bV2}awo: (6.161) 


de R. 
Mais cette fois nous définissons la multiplication suivante : 
(a + bV2)(c + d2) = ac + 3bd + (ad + bc) V2. (6.162) 


C’est un corps parce que tout élément non nul est inversible. En effet, l'équation 


PR DC DE EoolZLEco[PqRec 


43. Définition 1.42. Oui, c’est un bête morphisme d’anneaux. Il n’y a pas plus de structure dans un corps que dans 
un anneau. 
44. Vérifiez-le tout de même. 
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6 90-0) a 


( 
b 


donne 


À : : : : 3b : , 
Ce système a une unique solution si et seulement si det ( ) = 0. Cela survient si et seulement 


si 
a? — 3b? = 0. (6.165) 


Les solutions de cette équation dans R sont a = +4/3[b|. Dès que a ou b est non nul, cela ne peut 
pas satisfaire a,b € Q. Donc le déterminant est toujours non nul et il existe x,y € Q tels que 
(6.163) soit satisfaite. 

Tout cela nous a donné un corps K dont Q est un sous-corps et qui contient l'élément 42 de 
R. Il n’est cependant pas un sous-corps de R. 

Ce corps est isomorphe à Q(V3)r. En effet, nous montrons que 


d: K — Q(V3)r 


6.166 
a+bV2 + a + bV3 ) 


est un isomorphisme de corps. Pour le produit, nous avons 


D((a+ bV2)(c + dV2)) = (ac + 3bd + (ad + bc)V2) FN PEER] 
= ac + 3bd + (ad + bc) V3 OLD) 
= (a+ bc + 49) SUBEQOoIGBZopMqnS 
= Y(a + bV2)p(c + dV2). (6.167d) 


Remarques : 


— L'application 4# est bien définie grâce au lemme 6.86 couplé au théorème 3.36 appliqué à 
n=2etn=3. 
— Dans le membre de gauche de (6.167a), bÿ2 est un produit dans R (d’où l'importance du 


lemme 6.86 qui permet de re-séparer les éléments de R partie rationnelle et partie multiple 
de 12), et le produit entre (a + bÿ2) et (c+ dy2) est un produit dans K. 


— Dans (6.167b) et (6.167c), tous les produits sont dans R. 


En comparant avec le lemme 6.88, nous avons alors 


Q(V2)x = Q(V3)r # Q(V2)r (6.168) 


6.90. 
Nous allons encore enfoncer le clou sur le fait que K(a)r, dépend de L. 

Le fait est que si on y pense, l’objet 42 n’a aucun rapport avec Q. En effet les objets de Q 
sont des classes d'équivalence de couples d'éléments de Z, alors que l’élément V2 est une classe 
d'équivalence de suites de Cauchy dans Q. 

Lorsque nous écrivons Q(42), nous associons des objets de nature complètement différentes, 
et il n’y a aucune raison à priori de définir la multiplication entre eux d’une façon plutôt qu’une 
autre. 

Plus généralement, dans ZF (nous faisons semblant de suivre ZF tout en sachant que nous ne 
savons pas ce que c’est réellement ), tout est ensemble. Peut-on dire ce que serait Q(J) si Z est 
un ensemble quelconque ? Attention : en écrivant Q(7), nous entendons un corps dont 7 est un 
élément, pas un corps qui contiendrait comme éléments tous les éléments de 1. 

Si I est juste un ensemble, quelle définition donner de 1°? Il y a plein de choix et rien ne se 
dégage clairement comme étant pertinent. Si par contre, en guise de 7 nous considérons l’ensemble 


45. En lisant quelques pages de Wikipédia, vous pourrez briller en société, mais ne tentez pas le coup à l’agrégation. 
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V2 (oui, c’est un ensemble : un ensemble de suites de Cauchy dans Q), alors tout de suite nous 
nous disons que la bonne façon de faire est D = 2. Ce réflexe est juste conditionné par le fait 
que nous connaissons déjà par ailleurs le corps R. Rien de plus. 

Donc oui, K(a)r, dépend de L, mais dans les cas particuliers où K est un sous-corps de ©, il 
y a une égalité implicite L = C. Cela étant dit, il n’y a plus d’ambiguïté en écrivant Q(42). 

EXooKLRBooUswzpV 

Exemple 6.91. 
Soit K = Q et L = Q(12, V3). Afin de montrer que L = Q(a) avec à = 42 + 43 nous devons 


montrer que V2 et V3 sont des polynômes en a. PA 
DefZCYIbve 


Définition 6.92. 


jt un nsion +5 orps j: K L. Soit AC L. 
Soit une extensio de c Ps J .. 5 ITEMooJEGUooMsDBhF 


(1) Nous notons K(A)r le plus petit sous-corps de L contenant j(K) et A. C’est l'intersection 
de tous les sous-corps de L contenant A et j(K). 


(2) Nous notons K[Al]r le plus petit sous-anneau de L contenant j(K) et A. C’est l'intersection 
de tous les sous-anneaux de L contenant À et j(K). 


Nous disons que l’extension L de K est monogène ou simple si il existe 0 € L tel que 
L = K(4). Un tel élément 0 est dit élément primitif de L. Il n’est pas nécessairement unique. 


Le plus souvent, l'indice L dans K(A)x et K[A]x est omis parce que le contexte est clair “7, 
et nous avons même très souvent K € L en tant qu’ensembles. Dans ce cas, l'application j est 
l'identité et elle sera omise. 


Remarque 6.93. 

Les ensembles K(A) et K[A] sont aussi appelés respectivement corps engendré et anneau engendré 
par À. Cependant il faut bien remarquer que ce sont les parties de L engendrées par À. Il n’est 
pas question à priori de parler de corps engendré par À sans dire dans quel corps plus grand nous 
nous plaçons. 


Exemple 6.94. 
Nous savons que R est une extension de Q. Si a € R alors Q{a) est le plus petit corps contenant 
À et a. A 


Exemple 6.95. 
Nous avons déjà vu à l’occasion de la définition 1.352 que A[X] est l’anneau de tous les polynômes 
de degré fini en X. Cela rentre dans le cadre de la définition 6.92 parce qu'un anneau contenant 
X doit contenir tous les X”. 

Notons que même si K est un corps, K[X] reste un anneau parce qu’un éventuel inverse de 
X n’est pas dedans . Par contre, K(X) est un corps parce qu'il contient également les fractions 


rationnelles. VAN 
ExLQhLhJ 


Exemple 6.96. 
Si nous prenons F3 et que nous l’étendons par À, nous obtenons le corps K = F;(i). Nous savons 
que tous les éléments a € F5 sont racines de X° — X. Mais étant donné que 4° = à, nous avons aussi 
x° = x pour tout x € Fs(i). Pour le prouver, utiliser le morphisme de Frobenius. Le polynôme 
X5 — X est donc le polynôme nul dans K. 

Ceci est un cas très particulier parce que nous avons étendu F, par un élément à tel que 
a? = a. En général sur F,(a), le polynôme X? — X n’est pas identiquement nul, et possède donc 
au maximum p racines. Pour x € F,(a), nous avons x? = x si et seulement six e F,. A 


46. Définition 6.59. 

47. Et je me demande si il est possible de trouver un cas tordu où K(A)r # K(A)m. Par exemple lorsque À est dans 
L et M, mais que L n'est pas inclus dans M, ni M dans IL. 

48. Lorsqu'on multiplie, les degrés montent toujours. 


6.4. EXTENSION DE CORPS 445 


Dans l’énoncé suivant, la notation R(«)1 signifie que l'évaluation de À sur a se fait en calculant 
dans le sur-corps L de K. Cette proposition semble indiquer que K(a) est donné en termes de 
K(X), lequel est défini de façon très intrinsèque sans faire appel implicitement à un sur-corps de 


K. 
PROPooYSFNooFGbbCi 


Proposition 6.97 ([1]). 
Soit une extension L du corps K et a € L. Alors nous avons les isomorphismes de corps suivants : 


(1) K(a)r = Frac (K[alr), 


ITEMooATPTooVXKd1K 


(2) K(a)r = {R(a)x tel que RE K(X)}. 


Démonstration. Le corps K(a) est un sous-corps de L contenant K{a] comme sous-anneau. La 
proposition 1.363 nous dit alors que l’application suivante est un morphisme injectif de corps : 


€: Frac (K{a]) — K(a) 


ss (6.169) 


Pour rappel, la notation P/Q est bien une notation pour la classe d'équivalence du couple (P,Q) 
pour la relation définie en 1.362. 


Par ailleurs, la partie (Frac (Kla])) de L et est un corps contenant K et a. Donc ce corps 


fait partie des corps sur lesquels on prend l'intersection pour définir K(a) “*. Cela prouve que 
K(a) = (Frac (Kla])). (6.170) 


L'application € est donc surjective sur K(a). Comme elle était déjà injective, elle est bijective. 
Pour la seconde partie, veuillez lire la définition 1.365 de l’évaluation d’une fraction rationnelle 
sur un élément de l’anneau. Si R = P/Q € K(X) et si a € L, nous avons 


R(a) = P(a)Q(a) !. (6.171) 


Tout sous-corps de L contenant K et a doit contenir en particulier {P(a) tel que P € K[X]}, les 
inverses {P(a)-! tel que P E K[X], P(a) Z 0} et les produits de ceux-ci. Donc tout sous-corps de 
L contenant K et a contient {R(a) tel que RE K(X)}. 
Nous avons donc 
{R(a) tel que RE K(X)} € K(a). (6.172) 


Mais puisque K(a) est lui-même un sous-corps de L contenant K et à, il est contenu dans 
{R(a) tel que R € K(X)}. D'où l'égalité. 


Pourquoi cela ne contredit pas l’exemple 6.89 ? Lorsque nous écrivons 
K(a) = {R(a) tel que R e K(X)}, (6.173) 


certes K(X) est défini sans faire appel à un corps contenant K. Mais l'évaluation R(a), oui. Pour 
calculer R(a), il faut écrire R = P/Q et calculer P(a)Q(a)-!. Tous les calculs de cette dernière 
expression doivent se faire dans un sur-corps de K. Il suffit que le sur-corps en question soit un 
monceau de mauvaise foi comme celui de l'exemple 6.89, et en réalité K(a) peut ne pas être ce 
que l’on croit. 

Le corolaire suivant montre que les choses s’arrangent. 


Corolaire 6.98. 
Soient un corps K, une extension L: de K, un élément a € L: et une extension IL2 de L:. Alors 


K(a)r, = K(a)r,. (6.174) 


49. Pour rappel, la définition 6.92(1) donne K(a) comme une intersection. 
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Démonstration. La proposition 6.97 nous dit que 


K(a)r, = {R(a)r, tel que R € K(X)} (6.175a) 
K(a)r, = {R(a)r, tel que RE K(X)}. (6.175b) 


Mais lorsque À € K(X), le calcul de R(a) est exactement le même dans L: et dans L2 parce que 
Lo est un sur-corps de LA et que les calculs effectifs de R(a) = P(a)Q(a)-! ne font intervenir que 
des quantités de K et des puissances de a. 


Ce que ce corolaire nous dit est que si le contexte fixe une extension de K, nous pouvons faire 
tous les calculs dans cette extension, même si il y a des piles d'extensions à côté. 
Typiquement, à chaque fois que nous considérons des sous-corps de ©, les extensions se feront 
dans € : pour tout a € C, les corps Q(a), R(a) se calculent dans C. 
PROPooSYQWooFbfQtm 
Proposition 6.99. 
Soit un corps K, une extension L et un élément a € L. Nous considérons l’application 


: KIX| -L 

SCSI (6.176) 
PH P(a). 
ITEMooUZDQooUasiRQ 

(1) Si a est transcendant, alors K[a] = K[X] (isomorphisme d’anneaux). 

(2) Si a est transcendant, alors K(a)r, = K(X) (isomorphisme de corps), 
(3) Si a est algébrique, alors ker(s) est un idéal possédant un unique générateur unitaire, lequel 

est le polynôme minimal” de a sur K. 


Démonstration. Point par point. 


(1) Nous savons que K[a] = {Q(a) tel que Q € K[X]} (c’est la proposition 3.100). Donc w est 
surjective sur K[a], et est donc bijective. Elle est un isomorphisme °! parce que le lemme 6.71 
dit déjà que c’est un morphisme. 


(2) Nous supposons encore que a est transcendant et nous considérons l’application 


Ÿ: K(X) — K(a) 


D sn. (6.177) 


Note : cette application n’est pas @. En effet & n’est définie que sur K[X]; le corps des 
fractions K(X) est nettement plus grand (classes d'équivalence de couples). 
Le fait que cette application soit surjective est la proposition 6.97(2). Pour l’injectivité nous 
supposons que Y(R) = 0, c’est-à-dire que R(a) = 0. Nous considérons un représentant (P, Q) 
de R; c’est-à-dire R = P/Q. L'égalité R(a) = 0 signifie P(a)Q(a)_! = 0 (égalité dans L). 
Puisque L est un corps, c’est un anneau intègre et nous avons la règle du produit nul; soit 
P(a) = 0, soit Q(a) ! = 0. La seconde possibilité est impossible parce que zéro n'est pas 
inversible. Donc P(a) = 0. Donc w(P) = 0 et 4 étant injective, P = 0. 
Lorsque P = 0, la classe P/Q est nulle dans K(X) = Frac (K[X]). 

(3) C’est le lemme-définition 6.64. 


PropXULooPCusvE 
Proposition 6.100. 
Soit un corps K et une extension L. Soit P e K[X] et ae L, une racine de P. Alors le polynôme 
minimal d’une racine divise *? tout polynôme annulateur. 
Autrement dit, l’idéal engendré par le polynôme minimal est l’idéal des polynômes annulateurs. 


50. Définition 6.64. 

51. Les amateurs d'écriture inclusive ne seront, je l’espère, pas choqué par « elle est un isomorphisme » ; c’est une 
tournure que je propose ici sur le modèle de l’immonde « elle est un ministre » ou, à peine moins grave, « il est une 
sommité ». 

52. Définition 3.105. 
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Démonstration. Nous considérons l'idéal 
I = {Q € K[X] tel que Q(a) = 0}. (6.178) 


Le fait que cela soit un idéal est simplement dû à la définition du produit : (PQ)(a) = P(a)Q(a). 
Par le théorème 6.43, le polynôme minimal w, de a est dans I et, qui plus est, le génère : 1 = (lu). 
Par conséquent tout polynôme annulateur de a est divisé par Ua. 


6.4.4.1 Extension algébrique, degré 


Proposition 6.101. 
Toute extension finie est algébrique. 


Démonstration. Soient un corps K, une extension L de degré * n de K et a e L. Nous devons 
montrer qu'il existe un polynôme annulateur de a à coefficients dans K. 
Soit la partie S — {1,a,a?,...,a"} de L. Si cette partie contient des éléments non distincts, 
alors c'est plié. En effet, si a* = a!, alors le polynôme X-!{ est un polynôme annulateur de a. 
Nous supposons donc que S' contienne exactement n + 1 éléments distincts. Le lemme 4.11 nous 
assure que S est une partie liée : il existe des éléments k; € K tels que >}, k;aï = 0. 


Donc le polynôme Y;, a; X° est un polynôme annulateur de a. 


PropURZooVtwNXE 
Proposition 6.102 (Propriétés d'extensions algébriques|[1]). 
Soit K un corps commutatif®* et a un élément algébrique” sur K, de polynôme minimal la de 
degré n. Alors 


ItemJCMooDgEHajmi 
(1) En considérant l'application d'évaluation 
: KIX]-IL 
PAU) (6.179) 
Q+ Q(a), 

nous avons K[a] = Image(w). TtenJCMooDgEHa j iv 
(2) Une base de K[a] comme espace vectoriel sur K est donnée par {1, a, tem ÉMoobeEHa ji ii 

(3) Le degré de l’extension K[a] est égal au degré du polynôme minimal : 
[K[a] : K] = n. (6.180) 


(4) L'anneau K{a] est l’ensemble des polynômes en a de degré jusqu'à n — 1 à coefficient dans 
K. ItemJCMooDgEHaji 


(5) K(a) = K{al. ItemJCMooDgEHajii 


(6) Il existe un isomorphisme d’anneaur @: K[a] — K[X]/(ue) tel que @(k) = k pour tout 
ke K. K{a] + K[X/|/(ua) (isomorphisme d’anneau). 


L'intérêt de (6) est qu’il permet de caractériser K[a] sans avoir recours à un sur-corps de K. Le 
point (3) indique que le degré d’une extension algébrique est égal au degré du polynôme minimal. 


Démonstration. (1) Nous avons K[a] € Image(w,) parce que Image(w,) est lui-même un sous- 
anneau de L contenant K et a. Pour rappel, K{[a] est l'intersection de tous les tels sous- 
anneaux. 

L’inclusion inverse est le fait que si Q € K[X] alors Q(a) € K{a] parce que K[a] est un 
anneau et contient donc tous les a”. 


53. Définition 6.61. 
54. Juste en passant nous rappelons que tous les corps considérés ici sont commutatifs 
55. Définition 6.71. 
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(2) La partie {1,a,a?,...,a"-1} est libre parce qu’une combinaison linéaire de ces éléments est 


RS 
Co 
a 


TR 
Æ 
nr 


ns 
Qt 
LEZ 


— 


un polynôme de degré au plus n — 1 en a. Un tel polynôme ne peut pas être nul parce que 
nous avons mis comme hypothèse que le polynôme minimal de a est de degré n. 

Rappelons qu’en vertu de la définition 6.64, le polynôme minimal y est unitaire; donc 
deg (la(X) — X") < n — 1. Par conséquent en posant S(X) = X" — u4(X), nous avons 
deg(S) < n—1et S(a) = a”. 

En vertu du point (1), un élément de K{a] s'écrit Q(a) pour un certain Q € K[X]. Supposons 
que Q soit de degré p > n — 1; alors nous le décomposons en une partie contenant les termes 
de degré jusqu’à n — 1 et une partie contenant les autres : 


Q(X) = Q1(X) + X"Q2(X) (6.181) 
où deg(Q1) < n — 1 et deg(Q2) = p — n. Nous évaluons cette égalité en a : 

Q(a) = Qi(a) + S(a)Q2(a). (6.182) 
Donc Q(a) est l’image de a par le polynôme Q: + SQ2 qui est de degré p— 1. Par récurrence, 
Q(a) est l’image de a par un polynôme de degré n — 1. 
Notons que l’idée est très simple : il s’agit de remplacer récursivement tous les a” par S(a). 
Conséquence immédiate de (2). 


Conséquence immédiate de (2). 


Un élément général non nul de K{a] est de la forme Q(a) avec Q € K[X|: il s’agit de 
lui trouver un inverse. Pour cela nous remarquons que les polynômes w,(X) et Q(x) sont 
premiers entre eux, sinon {4 ne serait pas un polynôme minimal (voir la proposition 6.67). 
Donc le théorème de Bézout 6.47 affirme l’existence d'éléments U, V € K[X] tels que 


Li VOS (6.183) 
dans K[X]. Nous évaluons cette égalité en a en tenant compte de 44(a) = 0 dans K{a] : 
U(a)ua(a) + V(a)Q(a) = 1 (6.184) 


dans K{a]. Par conséquent V(a)Q{(a) = 1, ce qui signifie que V(a) est l'inverse de Q(a). 


Nous considérons l’application 


b: K[X]/(ta) — K{a] 


= (6.185) 


et nous montrons qu’elle convient. Pour cela, nous nous souvenons que la proposition 6.100 
nous enseigne que (Ua), l'idéal engendré par Ua, est égal à l’idéal des polynômes annula- 
teurs de a dans K[X]. Le polynôme y, divise tous les éléments de cet idéal; voir aussi la 
définition 1.205 de l’idéal (4). Cela étant mis au point, nous passons à la preuve. 
(6a) 4 est bien définie 
Si R = S alors R = S + Q avec Q € (lu), et par conséquent R(a) = S(a) + Q(a) avec 
Q(a) = 0. 
(6b) Surjective 
Nous savons que K[a] = Image(y,). Si x € K{a] alors il existe Q € K[X] tel que 
x = Q(a). Dans ce cas nous avons aussi & = Y(Q). 


(6c) Injective 


Si Y(R) = 0 alors R(a) — 0, mais comme mentionné plus haut, 4, engendre l'idéal des 
polynômes annulateurs de a. Donc À € (4) et nous avons À = 0 dans K[X]/(ua). 


6.4. EXTENSION DE CORPS 449 


Exemple 6.103. 

Un fait connu est que F5 = \2, Donc l'inverse de 42 s'exprime bien comme un polynôme en y2 
à coefficients dans Q, ce qui confirme le point (5) de la proposition 6.102. Du point de vue de 
Bézout, ZX )= X? — 2, et nous cherchons des polynômes U et V tels que 


U(X? —2) + VX = 1. (6.186) 


cette égalité est réalisée par U = —} et V = ZX. Et effectivement V(4/2) est bien l'inverse de V2 : 


V(4/(2)) = =v2. (6.187) 


A 
PROPooNGJWooYSpwVn 


Proposition 6.104 ([168]). 
Soient un corps K, une extension L de K et un élément a de L. Il y a équivalence entre les trois 


points suivants : ITEMooYTEBooUuEfBz 
(1) a est algébrique sur K, ITEMooWMQTooLnepQl 
(2) K[a] = K(a), ITEMooAQIUooMVZo jp 


(3) Kia] est un K-espace vectoriel de dimension finie. 


Si ces affirmation sont vraies, alors [K(a) : K] est le degré du polynôme minimal de à sur K. 


Démonstration. Démonstration décomposée en plusieurs implications. 
(1) (1) implique (2) 
Soit à algébrique sur K. Nous considérons le polynôme minimal de a sur K (définition 6.64). 


Nous savons par le lemme 6.82 (qui fonctionne parce que a est algébrique) que K[a] = 
K[X]/(4) en tant qu'anneaux. 


Mais K[X] est un anneau principal et 1 en est un élément irréductible. Donc la proposi- 
tion 1.237 dit que (x) est un idéal maximum; la proposition 1.239 avance encore un peu en 
disant que K[X]/(u) est un corps. 
Donc K[X|]/(u) est un corps isomorphe à K{a] en tant qu’anneaux. En conséquence de quoi 
K[a] est un corps. 
Le corps K{a] est un sous-corps de L contenant K et «; par définition nous avons donc 
K(a) € K[al|. 
Mais d’autre part, K[a] est contenu dans tout sous-corps de L contenant K et @, donc il est 
inclus dans l'intersection de tout ces corps, donc K{a] € K(a). 
Nous avons donc l'égalité K[a] = K(a). 

(2) (2) implique (1) 
Nous montrons que non-(1) implique non-(2). Nous disons donc que a est transcendant sur 
K ; cela implique par la proposition 6.99(1) que K[a] = K[X] en tant qu’anneaux. Donc 
K[a] n’est pas un corps parce que K[X] ne l’est pas. 


N'étant pas un corps, K[a] ne peut pas être égal à K(a) qui, lui, est un corps. 


(3) (1) implique (3) 
L'élément & est maintenant algébrique et nous considérons son polynôme minimal u. Nous 
savons par le lemme 6.82 que K[a] = K[X|]/(u) en tant qu’espaces vectoriels. Or K[X]/(u) 
est de dimension finie deg(u). Donc K{[a] est également de dimension finie. 


(4) (3) implique (1) 
Nous démontrons la contraposée. En supposant que a est transcendant nous avons K[a] = 
K[X] par la proposition 6.99. Or K[X] n’est pas de dimension finie sur K, donc K[a] non 
plus. 
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LEMooIPAXOoCNGMQT 
Lemme 6.105 ([169]). 
Soit L un corps commutatif et (Ki)ier une famille de sous-corps de L. Alors (J,-, K; est un sous- 
corps de IL. 


Lemme 6.106. 
Soit P € K[X] un polynôme unitaire irréductible de degré n. Il existe une extension L de K et 
a € L telle que L = K(a) et P est le polynôme minimal de a dans L. 


Démonstration. Nous prenons L = K[X|]/(P) où (P) est l'idéal dans K[X] généré par P. C’est 
un corps par le corolaire 6.44. Nous identifions K avec 6(K) où 


$: K[X] - L (6.188) 


est la projection canonique. Nous considérons également a = (X). 

Nous avons alors P(a) = 0 dans L. En effet P(a) = P(@(X)) est à voir comme l'application du 
polynôme P au polynôme X, le résultat étant encore un élément de IL. En l’occurrence le résultat 
est P qui vaut 0 dans LL. 

Le polynôme P étant unitaire et irréductible, il est minimum dans LL. 

Nous devons encore montrer que L = K(a). Le fait que K(a) € L est une tautologie parce 
qu'on calcule K(a) dans L. Pour l'inclusion inverse soit Q(X) = 5, Q;X° dans K[X]. Dans L nous 
avons évidemment Q = ÿ;, Qiaï. 


PropyMTEbH 
Proposition 6.107 ([92]). 
Soit K, un corps et P E K[X] un polynôme. Soient a et b, deux racines de P dans (éventuellement) 
une extension L de K. Si 4 et y sont les polynômes minimaux de a et b (dans K[X |) et si Æ lw, 
alors Lapin divise P dans K[X]. 


Démonstration. Nous considérons les idéaux 


I, = {Q € K[X] tel que Q(a) = 0}; (6.189a) 
1, = {Q € K[X] tel que Q(b) = 0}. (6.189b) 


Même si Q(a) et Q(b) sont calculés dans L, 1,, 1, sont des idéaux de K[X]. Le polynôme y, est 
par définition le générateur unitaire de 1,, et comme a est une racine de P, nous avons P € 1, et 
il existe un polynôme Q € K[X| tel que 


P = pQ. F6.190) 


Montrons que 44(b) Æ 0. Pour cela, nous supposons que u4(b) = 0, c’est-à-dire que y € 1. 
Il existe alors R € K[X] tel que w, = ùR. Mais par la proposition 6.67, le polynôme y, est 
irréductible, donc soit 4, soit R, est inversible. Comme les inversibles sont les éléments de K 
(polynômes de degré zéro), 4 n’est pas inversible (sinon il serait constant et ne pourait pas être 
annulateur de b). Donc R est inversible. Disons R = k. 

Donc 4 = kw. Mais puisque u, et jy sont unitaires, nous avons obligatoirement 4 = 1. Cela 
donnerait 4 = Jp, Ce qui est contraire aux hypothèses. Nous en déduisons que u4(b) # 0. 

Étant donné que y4(b) # 0, l'évaluation de (6.190) en b montre que Q(b) = 0, de telle sorte que 
Q € 1, et il existe un polynôme $ tel que Q = 29, c’est-à-dire tel que P = us, ce qui signifie 
que Law divise P. 


Exemple 6.108. 
Soit P = (X? +1)(X? + 2) dans R[X]. Dans € nous avons les racines a = à et b = V/2i dont les 
polynômes minimaux sont u, = X? +1 et jy = X? + 2. Nous avons effectivement ,uy divise P 
dans R[X|]. 

Si par contre nous considérions les racines a = à et b = —i, nous aurions 4 = ay = X? +1, 
tandis que le polynôme y? ne divise pas P. A 
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6.4.5 Racines de polynômes 
CorDIYooEtmztc 


Corolaire 6.109 (Factorisation d’une racine). 


Soit PE K[X], un polynôme de degré n et a € K tel que P(a) = 0. Alors il existe un polynôme Q 
de degré n — 1 tel que P(x) = (X — a)Q. 


Démonstration. Il s’agit d’un cas particulier de la proposition 6.100 : si & € K alors son polynôme 
minimal dans K est X — «; donc X — a divise P. Il existe un polynôme Q tel que P = (X — a)Q. 
Le degré est alors immédiat. 


Avant de lire l’énoncé suivant, allez relire la définition 3.98 pour savoir ce qu’est un polynôme 


nul. 
ThoLXTooNaUAKR 


Théorème 6.110 (Polynôme qui a tellement de racines qu’il s’annule). 
Soit K un corps et P E K[X] un polynôme de degré n possédant n + 1 racines distinctes @1,..., 
An+1, alors P = 0. 


Démonstration. Si P est de degré 1, il s'écrit P = aX +b; si il a comme racines a et 5, nous avons 
le système 


aa +b=0 (6.191a) 
ab + b= 0. (6.191b) 
La différence entre les deux donne a(a — B) = 0. Puisque à Æ B, la règle du produit nul 


(lemme 1.194) nous donne a = 0. Maintenant que a = 0, l'annulation de b est alors immédiate. 

Nous faisons maintenant la récurrence en supposant le théorème vrai pour le degré n et en 
considérant un polynôme P de degré n + 1 possédant n +2 racines distinctes. Puisque P(a1) = 0, 
le corolaire 6.109 nous donne un polynôme Q de degré n tel que 


P = (X — @)Q. Fans oo TUE 


Étant donne que pour tout à # 1 nous avons à; £ @1, 


0 = P(oi) = (ai — @1) Q(a), (6.193) 
RE, — 
#0 
et la règle du produit nul donne Q(a;) = 0. Par conséquent le polynôme Q est de degré n et 


possède n + 1 racines distinctes ; tous ses coefficients sont alors nuls par hypothèse de récurrence. 
Tous les coefficients du produit (6.192) sont alors également nuls. 


ExGRHooBNpjSP 
Exemple 6.111. 
Un polynôme à plusieurs variables peut s’annuler en une infinité de points sans être nul. Par 
exemple le polynôme X? + Y?— 1€ R[X, Y] s’annule sur tout un cercle de IR? mais n’est pas nul, 
loin s’en faut. 
Nous verrons dans la proposition 6.184 une condition pour qu’un polynôme à plusieurs variables 
s’annule du fait qu’il ait « trop » de racines. A 


Remarque 6.112. 

L'intérêt du théorème 6.110 est que si l’on prouve qu’un polynôme s’annule sur un corps infini, 
alors il s’annulera sur n’importe quel autre corps. Nous aurons un exemple d'utilisation de cela 
dans le théorème de Cayley-Hamilton 13.25. 
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6.4.6 Corps de rupture 
DEFooVALTooDJJmJv 


Définition 6.113. 
Soit P E K[X] un polynôme irréductible. Une extension L de K est un corps de rupture pour 
P si il existe a € L tel que P(a) = 0 et L = K(a). 

NORMALooTPOIooVZAfUo 
6.114. 
Nous insistons sur le fait que nous ne définissons le concept de corps de rupture que pour un 
polynôme irréductible à coefficients dans un corps. Les deux points sont importants : irréductible 
et à coefficient dans un corps. 


Nous discuterons brièvement le pourquoi de cela dans la section 6.4.11. 
ExemGVxJUC 


Exemple 6.115. 
Soit K = Q et P = X?-—2. On pose a = V2 et L = Q(V2) € R. De cette façon P est scindé dans 
L : 

P=(X — V2)(X + V2). (6.194) 


Le corps Q(V2) est donc un corps de rupture pour P. PA 


Exemple 6.116. 
Dans l’exemple 6.115, nous avions un corps de rupture dans lequel le polynôme P était scindé. Il 
n’en est pas toujours ainsi. Prenons 

P=x3-2 (6.195) 


et a = Ÿ2. Nous avons, certes, P(a) = 0 dans Q(Ÿ2), mais P n’est pas scindé parce qu'il y a deux 
racines complexes. A 


Exemple 6.117. 

Nous considérons le corps Z/pZ où p est un nombre premier. Si s € Z/pZ n’est pas un carré, alors 
le polynôme P = X? + s est irréductible et un corps de rupture de P sur Z/pZ est donné par 
(Z/pZ)[X1/(X? + s), c’est-à-dire l’ensemble des polynômes de degré 1 en 4/s. Le cardinal en est 
p°. PA 


Comme nous allons abondamment parler du quotient K[X]/(P), nous nous permettons un 


petit lemme. 
LEMooWYYFooXYacdF 


Lemme 6.118. 
Soit un corps K et P € K[X] non constant. Alors K[X|/(P) est un corps si et seulement si P est 
irréductible. 


Démonstration. Nous utilisons le trio d’enfer dont il est question dans le thème 18. D'abord K[X] 
est un anneau principal par le lemme 3.107. Donc K[X]/(P) sera un corps si et seulement si (P) 
est un idéal maximum (proposition 1.213), et cela sera le cas si et seulement si (P) est engendré 
par un polynôme irréductible (proposition 1.237). 

Il ne nous reste qu’à montrer que (P) est engendré par un irréductible si et seulement si P est 
irréductible. Il y a un sens dans lequel c’est évident. 

Soit un irréductible y tel que (P) = (y). En particulier y € (P), c’est-à-dire qu'il existe Q 
tel que 1 = PQ. Puisque w est irréductible, soit P, soit Q, est inversible. Si P est inversible, 
c’est-à-dire constant, c’est ce que nous avons exclu par hypothèse. Si par contre Q est inversible, 
alors P = ku pour un certain k € K, ce qui montre que P est irréductible autant que w. 

PROPooUBIlIooGZQyeE 


Proposition 6.119 (Existence d’un corps de rupture). 

Soit un corps K et un polynôme irréductible non constant P. Alors 
(1) Le corps L = K[X]/(P) est un corps de rupture pour P. 
(2) L'élément X de L est une racine de P. 


(3) L= K(X)x 
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Démonstration. Commençons par nous convaincre que K[X]/(P) est une extension de K (défini- 
tion 6.59). Le fait que ce soit un corps est le lemme 6.118. Le morphisme 7: K — K[X]/(P) est 
simplement k + k où à droite, k voit k& dans K[X] comme étant le polynôme constant. Notez qu'il 
est automatiquement injectif (lemme 1.301). 

Il faut maintenant voir que K[X]/(P) = K(a) pour un certain a € K[X]/(P). Grâce à notre 
compréhension des notations acquise dans 1.19.2.2, nous savons que X € K[X] et qu’il est donc 
parfaitement légitime de poser a = X dans K[X]/(P). Il s’agit simplement de l’ensemble X = 
{X + QP tel que Q € K[X]} où X est une notation pour la suite (0,1,0,0,...). 


Bref, nous notons a = X et nous démontrons que P(a) = 0 et que K[X[/(P) = K(a) (isomor- 
phisme de corps). 


fi} PEX) =0 
C’est le moment de nous souvenir comment la notation des X fonctionne, et en particulier la 
pirouette autour de (1.498). D’abord la définition du produit sur K[X]/(P) est PQ = PQ: 
en particulier si P = Y} a; XF, alors P(X) = Ya XF = 5, ax XP, et 


P(X) = P(X) = P=0. (6.196) 


(2) L'égalité 
Nous montrons à présent que K(X)r, = L. C'est-à-dire que L est bien engendrée par K et 
un seul élément. D'abord, L = K[X]/(P) contient bien évidemment K et X. Ensuite nous 
devons prouver que tout sous-corps de L contenant K et X est en réalité L entier. 


Soit Q € K[X], et montrons que Q est dans tout sous-corps de L contenant K et X. 


Par le lemme 3.96 nous avons Q = Q(X). Et si un corps contient K et X, il doit contenir 
tous les polynômes en X à coefficients dans K. Donc un tel corps doit contenir Q(X) et donc 


Q. 


Exemple 6.120. 
Soit le polynôme P = X2+1e Z[X]. Dans le quotient Z[X]/(P) nous avons X? + 1 — 0 et donc 
X? = 1. C'est-à-dire que Z[X]/(P) contient un élément dont le carré est —1. Avouez que c’est 
bien ce à quoi nous nous attendions. 

Notons que —X est également une racine de P dans Z[X]/(P). 

En calculant dans les polynômes à coefficients dans Z(X) nous avons : 


(X+X)X-X)= x? X?2= X2+1, (6.197) 
c’est-à-dire que P est bien factorisé, et que nous avons retrouvé la multiplication 2? + 1 = (x + 
i)(x — à). A 
6.121. 


Il n’y a évidemment pas unicité d’un corps de rupture pour un polynôme donné. Une raison est 
qu’un polynôme peut accepter plusieurs racines complètement indépendantes. Le corps étendu 
par l’une ou l’autre racine donne deux corps de rupture différents. Par exemple dans Q[X|], le 
polynôme 

P=rX =X =) (6.198) 


a pour racines (dans €) les nombres V2 et i. Donc on a deux corps de rupture complètement 


différents : Q(4V2) et Q(i). 


6.122. 

La proposition suivante donne une unicité du corps de rupture dans le cas d’un polynôme irréduc- 
tible. Et nous comprenons pourquoi : un polynôme irréductible n’a fondamentalement qu’une seule 
racine « indépendante ». Par exemple X? — 2 a pour racines +42. Autre exemple, le polynôme 
X?2+6X +13 a pour racines, dans C, les nombres complexes conjugués z = —3+ 2i et z = —3— 924. 
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PROPooVJACooNDmlfb 
Proposition 6.123 ([162]). 
Soient un corps K et un polynôme irréductible P € K[X]. Alors toute extension L contenant une 
racine a de P admet un unique morphisme de corps 


d: K[XJ/(P) — L (6.199) 
tel que Y(X) = a. 


Dans un tel cas, 
(1) l’image de est K(a)r. , ITEMooHRFHooWL IdWU 
(2) si L = K(a)r alors d est un isomorphisme. 


Démonstration. L'idéal annulateur de & parmi les polynômes de K[X] n’est pas réduit à {0} parce 
qu’il contient P. Le lemme 6.64 s'applique donc et nous avons w, le polynôme minimal de « dans 
K[X]. Il divise P qui est irréductible, donc 


P=)y (6.200) 


pour un certain À € K. 
Nous posons 
v: K[X]/(P) - L 
Q + Q(a). 
(1) Bien définie Si Q1 = Q alors il existe un À € K[X] tel que Q1 = Q9 + RP. Mais alors 
Y(Q1) = Qi(a) = Qr(a) + R(a)P(a) = Q2(a). 
(2) Injective 


Si #(Q1) = Y(Q2) alors Q1 — Q2 = R pour un certain R € K[X] vérifiant R(a) = 0. Nous 
avons alors un polynôme $ tel que R = Su = À-!SP. Donc R = 0 et donc Q;1 = Q. 
(3) Morphisme 
Laissé comme exercice; la paresse de l’auteur de ces lignes attend vos contributions. 
(4) La condition 
Le morphisme 1 respecte de plus la condition 


Y(X) = X(a) = a. (6.202) 


(6.201) 


En ce qui concerne l’unicité, fixer Y(X) est suffisant pour fixer un morphisme. En effet si 
Y(X) = à, alors 


v(Q) = (Du) = Da(X) = Yaaf. (6.203) 
k k k 
Pour le second point de l’énoncé, il faut remarquer que « est algébrique et non transcendant. 
Donc en utilisant les propositions 3.100 et 6.102(5) nous trouvons 
Image(#) = {Q(a) tel que Q € K[X]} = K[a] = K(a). (6.204) 


Et finalement pour le dernier point, un morphisme de corps est toujours injectif. Si il est 
également surjectif, il sera bijectif. 


6.4.7 Pile d’extensions 


Lemme 6.124 (|1]). 
Soient un corps K, des extensions L:,..., IL, et des éléments @; € L; tels que 


fi = K(a)r, FAGOR OR 


LEMooTURZooXnjmjT 


et 
Lx = Ly_1(ax)1,: (6.206) 


Alors 


Ln = K(a,...,an)L (6.207) 


n° 
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Démonstration. Nous démontrons par récurrence sur n. Le cas n = 1 est simplement l’hypothèse 
(6.205). 

Supposons donc que le lemme soit correct pour n, et étudions le cas n + 1. Nous avons, par 
définition et par hypothèse de récurrence : 


Lsr = Ln(@nr1)le = (K(ar..,an)z, )(an+1)Leus (6.208) 
Notre tâche sera donc de montrer que 


(Ka. an), }(an+1) = K(an,.…,an+1) en 


où nous n’écrivons plus les indices L,,}1 partout. 
Le membre de gauche est un sous-corps de L,,,1 contenant à la fois K et tous les a;, si bien 


que 
K(o1,..., Qn+1) € (K(a1,..., an), )(Qn+1)Lnss POP) 


Il faut donc prouver l'inclusion inverse; c’est-à-dire montrer que tout élément x du corps 
(K(o, —. On)L,)(An+1) est forcément dans tout sous-corps de L,,1 contenant K et les a;. Un 
tel élément x est, par la proposition 6.97(2), de la forme r(a,+1) avec r € K(a1,...,an)(X), 
c’est-à-dire 

Pldm1)Q(e) (6.211) 
avec P,Q € K(œi,...,an)[X|]. 

Prouvons d’abord que si P € K(a1,...,a»)[X], alors P(a,}1) est dans tout sous-corps de 
Lh+1 contenant K et les a;. Nous pouvons écrire P = ÿ;; a; X° avec a; € K(a1,...,a»), et donc 


P(an+1) = D aa. (6.212) 
À 


Tout corps contenant K et les a1,..., a, contient les a;. Par produit, tout corps contenant K, 
@1,..., An+1 Contient les termes don et donc P(a»+1) par somme. 

De la même façon, si un corps contient K et les @;, (i = 1,...,n+1), alors il contient Q(a+1). 
Comme c’est un corps, il contient aussi son inverse Q(a»+1) !, et il contient aussi le produit 


r(an+1) S P(an:1)Q{ani1) *. (6.213) 


On vient ainsi de montrer que tout élément x € (K(a,...,an)r,)(an+1) était dans tout 
sous-corps de L,+1 qui contient K et les @;, (i = 1,...,n + 1); en d’autres termes : 


(K(a, Sue , An)T.) Ro PRNR LEE Œ K(a, sacs oi) RO ONE A 


Les inclusions (6.210) et (6.214) prouvent l'égalité d’ensembles (6.209) que nous voulions montrer. 


6.4.8 Clôture algébrique 


Le concept de clôture algébrique a été défini dans 6.75. Voici un lemme qui dit qu’une clôture 


algébrique est en quelque sorte une extension algébrique maximale. 
LEMooQSCGooMyCktA 


Lemme 6.125 (|1]). 
Soient un corps K et une extension algébrique F de K. Nous supposons que pour toute extension 
algébrique de L nous avons L = F 

Alors F est algébriquement clos %. 


Démonstration. Soit un polynôme P € K[X]. Nous voudrions prouver que P a des racines dans 
F. Pour cela, nous voyons P comme un polynôme sur F[X] et, grace à la proposition 6.119 nous 
considérons un corps de rupture L pour P. Puisque L est une extension de F, nous avons L = F. 
Donc F contient des racines de P. [1 


56. Définition 6.75(2). 


456 CHAPITRE 6. CORPS 


6.126. 
Nous avons défini le concept d’extension algébrique en 6.75. Nous allons en construire un petit 
exemple très piéton. 

Souvenez vous que la proposition 1.457 nous donne l’existence et l’unicité d’un réel 42 stric- 
tement positif dont le carré est 2. Ce réel est irrationnel par la proposition 1.393. 


Proposition 6.127 ([170]). 
Soit L = {a La bV2}abQ- 


2 
(1) C’est un sous-corps de R. ITEMooUSUAo0ZoBh1a 


(2) Tout sous-corps de R contenant Q et V2 contient L. 
Démonstration. Nous devons d’abord prouver que L est un corps en vérifiant d’une part que c’est 
un anneau (définition 1.41) et d’autre part le fait que tous les éléments non nuls sont inversibles. 


— La partie L de R est stable pour l’addition : dès que a, b, a’,b! e Q, 
(a + bV2) + (a! +8 V2) = (a+a)+(b+6)V2eL. (6.215) 


— Les neutres 0 et 1 sont dans L. 
— Siae L, alors —-a € L: 


—(a + bV2) = -a — bV2. (6.216) 


— La partie L est stable pour le produit parce que 
(a + bV2)(a/ + b V2) = (aa! + 2bb') + (ab! + ba!) V2. (6.217) 


— L'inverse d’un élément de L est dans L. C’est le seul point pas tout à fait évident. D'abord, 
l’ensemble R est un corps par le théorème 1.401. Donc pour tout a, be R, le nombre 


1 


(6.218) 


existe dans KR. 


D'abord a—b42 n’est pas nul, parce que si il l'était, nous aurions 42 = a/b € Q alors que 2 
n’est pas rationnel par la proposition 1.393. Nous pouvons donc faire le coup de multiplier 
le numérateur et le dénominateur par le binôme conjugué : 


1 : a = b4/2 : a b 
a+by2 (a+by2)(a-bV2) a?—2b?  a?-— 21? 


V2. (6.219) 


Cela est un rationnel. Donc le éléments non nuls de L ont un inverse qui appartient également 
à IL. 
Nous passons à la preuve du point (2). Si L/ est un corps qui contient Q et 2, il doit contenir 


bV2 pour tout be Q et donc aussi tous les a + b2 avec a, be Q. Par conséquent, L/ doit contenir 
au moins tout IL. 


Proposition 6.128. 
Soit L = {a no bV2}a bo: 


(1) C’est un espace vectoriel de dimension 2 sur Q. 


ITEMooOMDMooLNhlyh 


ITEMooWGGDooSbsesf 
(2) Siae L, alors il existe un polynôme P € L|X] de degré 2 ou moins tel LENS To LptxvuQ 


(3) Le corps L est une extension algébrique de Q. 


Démonstration. En plusieurs parties. 


(1) (1) Pour la dimension, notez que {1, V2} est une partie libre et génératrice de L. 
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(2) (2) 
Soit a € L. La partie {1,a,a?} est de cardinal 1, 2 ou 3. Si c’est 1 ou 2, c’est que 1 = a ou 
1 = a? ou a = @?. Si par exemple 1 = à alors avec P = X — 1 nous avons P(a) = 0. 
Si au contraire {1,«,a?} est de cardinal 3, alors c’est une partie liée par la proposition 4.7. 
Il existe donc des rationnels a, b,c tels que a + ba + ca? = 0, c'est-à-dire P(a) = 0 avec 
P=cX?+bX +a. 


(3) (3) Nous venons de voir que tous les éléments de L sont des racines de polynômes de Q[X]. 


LEMooHWPHooZeWqns 
Lemme 6.129. 
Si K est un corps infini, alors K[X1] est équipotent®" à K. 


Démonstration. Notons provisoirement K,/[X] l’ensemble des polynômes de degré n. Nous avons 
une surjection 
p: K**1=K,[X] 


FooFGZ VOOR ES 


(ko, En) ÿ kXi. 
i=0 


Par récurrence sur le théorème * 1.158, nous avons K"*1! & K. La surjection (6.220) dit alors que 
Ka[X] < K**1&K. (6.221) 


Mais puisqu'il y a une surjection K — K,[X], nous avons aussi K,[X] > K. Le théorème 1.142 
dit alors que K,[X] & K. 
Le lemme 1.159 nous permet alors de conclure que 


K[X] = Ü K,[X] + K. (6.222) 


n=0 


PROPooVPQFooScWvksS 
Proposition 6.130 ([1]). 
Soit un corps K. Une extension algébrique de K est 
(1) au plus dénombrable si K est fini, 


(2) équipotente à K si K est infini. 


Démonstration. En deux parties. 


(1) Si K est fini Un polynôme non nul possède toujours au maximum un nombre fini de 
racines (éventuellement zéro) par la proposition 6.110. Par ailleurs, chaque degré de polynôme 
ayant seulement un nombre fini de possibilités, l’ensemble K[X] est au plus dénombrable 
(proposition 1.134). 

Pour P € K[X] nous avons une surjection de IN vers l’ensemble des racines de P. Nous la 
notons wp: IN — L, en posant par exemple wp(n) = 1 si P n’a pas de racines. Enfin nous 
posons 
p: K[X]x*N —-L 
(P,n) » grP(n). 


C’est la fonction qui à un polynôme P et un nombre n fait correspondre la n° racine de P. 


(6.223) 


Comme L est une extension algébrique, 4 est surjective. 

En termes de cardinalité, que K[X] soit fini ou dénombrable, dans les deux cas, K[X] x N est 
dénombrable (proposition 1.131). Il existe donc une surjection d’un ensemble dénombrable 
vers L. Le lemme 1.133 conclut que L est fini ou dénombrable. 


57. Définition 1.111. 
58. J'ai quand même du mal à croire qu'il faille vraiment le lemme de Zorn pour prouver que K[X] est équipotent à 
IK. Si vous connaissez un moyen plus direct, écrivez-moi. 
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(2) Si K est infini Nous procédons de la même manière, mais nous devons faire appel à des 
résultats plus technologiques pour maitriser la cardinalité. Nous considérons à nouveau l’ap- 
plication 


p: K[X]x*xN —-L 
(P,n) = pp(n). 
Cette application est encore surjective : L < K[X] x IN. Le lemme 6.129 nous assure que 


K[X] = K parce que K est infini. Ensuite la proposition 1.152 nous dit que K[X] x N # 
K[X]. Donc 


(6.224) 


K&K[X]&K[X]xN>F. (6.225) 


Mais Fest une extension de K. Donc il existe une injection K — F, c’est-à-dire K < F. 
Ayant K <F <K, le théorème 1.142 implique que K & F. 


Lemme 6.131 ([1]). 
Soient des corps K et L ainsi qu’un morphisme de corps p: K — L. Si P € K[X] a une racine 
dans K, alors le polynôme p(P) a une racine dans L. 


Démonstration. Nous notons P = 5, P,XF. Si a e K est une racine de P, alors >}, Pxa* = 0. 
Nous appliquons p à cette égalité : 3, p(Px)p(a)* = 0, c’est-à-dire p(P)(p(a)) = 0. Donc p(a) € L 
est une racine de p(P). 


LEMooIIKYooHMNqaYn 
Lemme 6.132 ([171]). 
Nous considérons un triplet (K,L,F) où 


(1) K, Let F sont des corps 
(2) il existe a € L algébrique sur K tel que L = K(a) et un morphisme de corps a: K — L. 
(3) F est une extension algébriquement close de K : il existe un morphisme 5: K —F. 
Alors il existe un morphisme de corps a: L — F tel que ox) = LB. 
Note : en pratique, les corps L et F sont le plus souvent des sur-corps de K, de telle sorte 


que les applications a et 5 sont l'identité. En particulier, la conclusion de ce lemme s’écrit le plus 
souvent o|x = Id. Il faut juste savoir que le Frido est un névrosé des notations précises. 


Démonstration. Comme L est monogène, si 44 € K[X] est le polynôme minimal de a € L, alors 
les points (5) et (6) de la proposition 6.102 disent que L + K{[a] + K[X/|/(4). Pour référence 
ultérieure, nous considérons un isomorphisme 


gp: L— K[X|/(Ha). (6.226) 


Les coefficients de y, sont dans K, donc nous pouvons voir 4 € F[X]. Plus précisément, si 
la = 4 ax XF, nous définissons 


ue = D B(&)X" e F[X]. (6.227) 
k 


Comme F est algébriquement clos, le polynôme y}, possède une racine (au moins) be F : ,(b) = 0. 


Nous posons 
gl: K[X/(e) — F 


k k 


(1) o’ est bien définie Si P =, s XF et la = 3” ag XF (ag,sx € K), alors 


CPE) =6 O_ (ax + s)XF) = DC + >, sb = pl,(b) + o'(P) = o'(P). (6.229) 
k k k 
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(2) o' est un morphisme de corps À justifier. 


(3) p(a(k)) = k Quand nous parlons de k, nous parlons de la classe du polynôme de degré zéro 
donné par ke K. 


(4) La réponse Nous posons 


g =00. (6.230) 
Pour tout ke K, : 
(o'pa)(k) = o'(k) = B(k), (6.231) 
c’est ce qu'il fallait. 
LEMooUULTooYcytat 


Lemme 6.133 ([171]). 
Soit un corps K muni de deux extensions a: K — L et 5: K — F. Nous supposons que 


(1) L est algébrique sur K ; 
(2) F est algébriquement clos. 


Alors il existe un morphisme de corps o: L — F tel que oo a = f. 
Démonstration. Nous allons utiliser le lemme de Zorn 1.23 sur l’ensemble 


M est un sous-corps de L 
a(K) c M | 
©: M — F est une extension de corps | 


poa=fb 


A = {M g) tel que (6.232) 


Nous ordonnons (partiellement) cet ensemble en disant que (M1,w1) < (M2,42) si M € Met 
polmM, = #1. Il se fait que À est un ensemble inductif et que nous pouvons donc lui appliquer le 
lemme de Zorn. 

Soit un élément maximal (M,4). Nous allons montrer que M = L. 

Soit € L. Puisque L est une extension algébrique de K, il existe un polynôme P à coefficients 
dans a(K) tel que P({) = 0. Mais comme a(K) € M, ce polynôme est également à coefficients 
dans M. Donc { est un élément algébrique sur M. 

Nous pouvons donc considérer le triplet (M, Mi), F) qui vérifie les hypothèses du lemme 6.132. 
Il existe donc un morphisme de corps &: M{{) — F tel que o|m = +. 

Nous avons 

doa=0l(K°Aa=0moa=voa— pb. (6.233) 
Donc l'élément (M(1),0) majore (M, 4) dans A. 

Par maximalité, nous déduisons que M = L. Donc le morphisme 4: L — F vérifie 6 o a = f, 

ce qu'il nous fallait. 


THO00EDQKooLEG1Dv 
Théorème 6.134 (Steinitz[172, 173]). 
À propos de clôture algébrique. 


(1) Tout corps possède une clôture algébrique °°. 
(2) Si 1: K — F1 et a2: K — F2 sont deux clôtures algébriques du même corps K, alors ül 
existe un isomorphisme de corps o: F1 — F2 tel que ÿ o ai = a. 
Démonstration. Nous commençons par l'existence, en plusieurs points. 


(1) Un ensemble Nous considérons un ensemble Q qui contient K, qui est strictement sur- 
potent % à K et qui est infini non dénombrable si K est fini. Par exemple P(K) U K si K 
est infini et R L K si K est fini (voir le théorème de Cantor 1.145). 


59. Définition 6.75. 
60. Définition 1.111. 
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L'ensemble pour Zorn Nous considérons l’ensemble des extensions algébriques de K 
contenues dans (, c’est-à-dire 


KecLcecQ } 
(L, +1, XL) est une extension algébrique de (K, +, x). 
(6.234) 


A = {@, +1, XL) tel que 


Nous ordonnons À par l'inclusion : nous disons que 
(L1, +1, X1) < (Lo, +2, xXa) (6.235) 


lorsque (L2, +2, xX2) est un sur-corps de (L:1,+1,x1) (en particulier Li € La). 


A est inductif Soit une partie F = {(L;,+;, x;)}ier de À que nous supposons être totale- 
ment ordonnée. Nous allons lui trouver un majorant dans À. Nous posons L = [),., L:, et si 
ae L;, be L;, alors nous définissons 


a+Lb=a+xb (6.236a) 
XL = AXE (6.236b) 


où k € I est sélectionné de telle façon à avoir (L;,+:, x;) < (Lx, +, Xx) et (IL, +5, Xÿ) < 
(Lx, +k, xx). Comme tous les corps L; sont des sous-corps les uns des autres, c’est une bonne 
définition. 

Lemme de Zorn Nous utilisons le lemme de Zorn 1.23. Nous notons (F,+, x) un élément 
maximal de À. Puisque K en est un sous-corps, il n’y a pas d’ambiguïté de noter + et x ses 
opérations. 


Stratégie pour la suite Nous allons montrer que si E est une extension algébrique de F, 
alors E = F (le but est d’utiliser le lemme 6.125). 


Un peu de cardinalité D'abord, comme FF est algébrique sur K, l’ensemble FF est équi- 
potent à K si K est infini, et au plus dénombrable, si K est fini; c’est la proposition 6.130. 
En bref : 


— SiK est infini, K&F&E < 0. 


— Si K est fini, K < F < IE < ( où E est au maximum dénombrable et ( est indénom- 
brable. 


Dans tous les cas, Q est strictement surpotent à FF, et le lemme 1.154 permet de dire 


E\F<E<Q=A\F. (6.237) 


Quelques injections Il existe donc une injection @: E\F — Q\F. Nous posons 


J:E—-90Q 
: sireF (6.238) 
CS 


Nous montrons que f est injective. Soient x,y € E tels que f(x) = f(y). Si x,y € EF, alors 
x = f(x) = f(y) = y. SixeFetyéF, alors x = (y) alors que x € F et w(y) € Q\F; ce 
cas est impossible. Enfin si x et y sont hors de F, alors f(x) = (x) et f(y) = w(y) ; donc 
px) = (y) et x = y par injectivité de w. 


Nous avons donc bien une injection f : IE — Q. 


La maximalité 


Nous pouvons mettre sur f(E) € Q la structure de corps venant de E. Comme f(F) = F, le 
corps f(E) est une extension algébrique de F. Par maximalité, f(E) = F. 


Mais si x € E\F, alors f(x) € Q\F. Donc en réalité nous avons aussi E CF. 
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(9) Conclusion En conclusion E = ÆF et le lemme 6.125 termine en disant que F est une 
clôture algébrique de K. 


Nous passons à la partie « unicité » de la clôture algébrique. Étant donné que F1 est une extension 
algébrique de K et que F2 est algébriquement clos, le lemme 6.133 nous donne un morphisme de 
corps ©: F; — F2 tel que © o «1 = a2. 

Nous sommes donc dans la situation où ©: F1 — F2 est une extension de corps où F; est 
algébriquement clos et F2 est algébrique. Le lemme 6.79 conclut que o(F;) = F2, c’est-à-dire que 
o est surjectif. En tant que morphisme de corps, © était déjà injective ; elle est donc bijective. 


Donc ©: F1 — F2 est un isomorphisme de corps vérifiant © o ai = @2. 


6.135. 
Bien que C soit une extension algébriquement close de Q, l’ensemble € n’est pas une clôture 


algébrique de Q. C’est ce que nous montrons maintenant. 
LEMooRDIZooRjWNMa 


Lemme 6.136. 
Le corps C n’est pas une clôture algébrique®! de Q. 


Démonstration. Nous montrons qu’il existe des éléments de € qui ne sont pas des racines de 
polynômes à coefficients rationnels. L'ensemble À est dénombrable par la proposition 1.378. L’en- 
semble des polynômes de degré n à coefficients dans À est en bijection avec les n-uples de rationnels, 
c’est-à-dire avec Q" qui est également dénombrable par la proposition 1.137. Enfin l’ensemble des 
polynômes à coefficients sur Q est l’union des polynômes de degré fixés, donc dénombrable par la 
proposition 1.134. 

Jusqu'ici nous avons prouvé que l’ensemble des polynômes à coefficients rationnels était dé- 
nombrable. Or chaque polynôme possède une quantité finie de racines par le corolaire 3.128. Donc 
la partie de © constituée des nombres qui sont des racines de polynômes à coefficients dans À 
est dénombrable. Mais € n’est pas dénombrable, donc possède des éléments qui ne sont pas des 
racines de polynômes. 


6.4.9 Polynômes à plusieurs variables 


Nous avons déjà vu A[X, Y] lorsque À est un anneau en la définition 3.47. 
DEFOoRHRKooPqLNOp 


Définition 6.137. 
Soit un corps K. Le corps K(X1,...,X») est le corps des fractions de l’anneau K[X1,..., Xh]. 


DEFooUCPHooXneutp 
Définition 6.138. 
Soient un corps K et une extension L de K contenant les éléments a1,..., an de L. Nous défi- 
nissons K(a1,...,an) comme étant l'intersection de tous les sous-corps de L contenant K et les 
Qi. 

La proposition suivante est analogue à 6.97(2). 

LEMooQEJHooAmSNxU 
Lemme 6.139 ([1]). 
Soient un corps K, une extension L et des éléments a1,...,an dans L. Alors 

K(a1,...,an) = {r(a1,...,an) tel que r € K(X1,..., Xn)}. (6.239) 


Démonstration. Ce que nous avons à droite est un corps : par exemple pour l'inverse, si r = 
P/Q alors r(a1,...,an) = P(a1,...,a»)Q(a,...,an) !. Cet élément a un inverse en la fraction 


(OP lois: 0) 


Donc à droite nous avons un sous-corps de L contenant K ainsi que les a;. Donc 


K(ai,...,an) € {r(a1,...,an) tel que r € K(X1,..., Xn)}. (6.240) 


61. Clôture algébrique, définition 6.75. 
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D'autre part, tout corps contenant K et les a; doit contenir tous les P(ai,...,a,) (P € 
K[X:1,...,X,]), leurs inverses ainsi que leurs produits; bref doit contenir tous les r(a1,...,an) 
avec r € K[X1,..., Xal. 


6.4.10 Corps de décomposition 
DEFo0oEKGZooSkvbum 


Définition 6.140. 
Soit K un corps commutatif et F = (P;);er une famille d'éléments non constants de K[X]. Un 
corps de décomposition de F' est une extension L de K telle que 

(1) les P; sont scindés sur L, 

(2) L = K(R) où R={J,.,{xe L tel que P;(x) = 0}. 
C'est-à-dire que L étend K par toutes les racines de tous les polynômes de F.. 

PROPooDPOYooFHcqkU 

Proposition 6.141 ([174]). 
Tout polynôme admet un corps de décomposition. Plus précisément, soit un corps K et un polynôme 
P E KIX] de degré n. Il existe un corps de décomposition D de la forme D = K(ai,...,a») où 
les a; sont des racines de P dans D. 


Notons que rien dans l’énoncé ne prétend que les à; soient tous distincts, ni même que certains 
(voire tous) ne seraient pas dans K. 


Démonstration. Soient un corps K et un polynôme P € K[X]. Si le degré de P est 0 ou 1, alors K 
est un corps de décomposition pour P. Pour le reste nous faisons une récurrence sur le degré de P. 
Il y à deux possibilités, soit il existe à € K tel que P(a) = 0, soit non. 


(1) Si racine dans K Alors le corolaire 6.109 nous permet de factoriser X — à : 


P=(X-a)Q (6.241) 


avec deg(Q) = deg(P) — 1. Dans ce cas, K est un corps de rupture de P. 
(2) Si pas de racines dans K 


Nous prenons alors un corps de rupture L = K(a) avec P(a) = 0 (c’est la proposition 6.119 
qui donne l'existence d’un corps de rupture). Dans Li nous avons 


P=(X -a)Q (6.242) 
avec Q € L1[X] et deg(Q) = deg(P) — 1. 


(3) Dans les deux cas 


Dans les deux cas, par hypothèse de récurrence nous avons un corps de décomposition pour 
Q qui se présente sous la forme 


L = K(a, …. “Mat ): (6.243) 


De plus, L est une extension de L parce que c’est une extension du corps sur lequel est Q. 


Pour terminer la preuve nous prouvons que 


D = K(æœ,...,Qn-1,@) (6.244) 


est un corps de décomposition de P. Vu que D contient K(a) (comme cas particulier du lemme 
6.139), dans D nous avons l'égalité P = (X—a)Q. Et vu que D contient également K(a1,...,an-1), 
toujours dans D nous avons aussi 


Q=(X—-a)...(X — an-1). (6.245) 


Donc nous avons dans D l'égalité 


PER Aa) Ca (6.246) 
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LEMooJNGWooTXdGre 
Lemme 6.142 (|1]). 
Soit un polynôme P € K[X], et un corps L dans lequel P est scindé. Si P = P1...P, est la 
décomposition de P en irréductibles dans K, alors chacun des P, est scindé dans L. 


Démonstration. Juste pour le mentionner, le fait que P ait une décomposition en irréductibles est 
le fait que K[X] soit factoriel, c’est-à-dire la proposition 6.36. 
Le polynôme P est scindé dans LL, c’est-à-dire que, en notant n le degré de P, 


— [I X- x) EooNFxS0opkien 


i=1 


avec }; € L. 

Soit L:, une extension de L dans laquelle P; est scindé. Ensuite, L2 une extension de L; dans 
laquelle P; est scindé et ainsi de suite. Nous avons construit L,, une extension de L dans laquelle 
tous les P; sont scindés ainsi que P lui-même. Dans ce corps nous avons l'égalité 


us [I —. EnooBEFUcopngfts 


k=1 


où les ux sont des éléments des diverses extensions L;, et sont les racines des P;. En tout cas, tous 
sont dans L,.. 

Les deux décompositions (6.247) et (6.248) sont des décompositions dans L,[X] du polynôme 
P. Vu que ce dernier est factoriel, en réalité les deux décompositions sont identiques (se souvenir 
de la définition 3.61), et nous avons x € L pour tout k. Toutes les extensions L; sont en réalité 
triviales, et nous avons L, = IL. 

Bref, tout cela pour dire que les P; ont toutes leurs racines dans IL. 


THOo0oQVKWooZAAYxK 
Théorème 6.143 ([162]). 


Soient : 
(1) un isomorphisme de corps T: K — K’ ; 
(2) un polynôme non constant P € K[X] de degré n ; 
(3) un corps de décomposition L de P sur K ; 
(4) un corps de décomposition L’ de T(P) sur K’ ; 


Alors T se prolonge en un isomorphisme o : L — I’. 


Démonstration. Soit m le nombre de racines de P dans L\K. Nous faisons une récurrence sur m. 
Si m = 0 alors K est un corps de rupture de P ; nous avons 


P=(X-AÀ)...(X — ) (6.249) 
avec À; € K. Dans ce cas nous avons aussi 
T(P) = (X -r(x))... (X -7()) (6.250) 


avec T(À;) € K’. Nous avons donc L/ = K’ et prendre © = Tr fonctionne. 
Nous supposons à présent que m > 0. Plus précisément nous considérons un polynôme possé- 
dant exactement m racines dans L\K. Soit 


P=P...P, (6.251) 


sa décomposition en irréductibles dans K[X] (notons que r < n parce que chacun des facteurs est 
de degré au moins 1). Au moins un des P,; est de degré plus grand ou égal à 2. Nous savons de la 
proposition 6.36 que K[X] est un anneau factoriel. Le lemme 6.142 nous assure que les polynômes 
P, sont également scindés dans L. Et l’unicité de la décomposition fait en sorte que les racines des 
P,; sont celles de P. 
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Soit à € L, une racine de P;. Vu que P, est irréductible sur K, l'application suivante est un 
isomorphisme de corps par le lemme 6.82 : 


Ÿ: K[X]/(P) — Ko] 

Qr Q(a). 

Notons que le lemme parle du quotient par le polynôme minimal, mais ici nous avons un irréduc- 
tible. Un polynôme annulateur irréductible est multiple du polynôme minimal, et l’idéal engendré 


est le même. 
Nous avons aussi la décomposition 


(6.252) 


HP = (he -TCR) (6.253) 


et chacun des 7(P;) a ses racines dans L/. Soit B, une racine de 7(P1) dans L/. Alors nous avons 
l’isomorphisme 


Y': K'[X]/(7r(P:)) — K'[8]. (6.254) 


De plus, par le lemme 6.46, nous savons que 7 passe aux classes : 
Pr: K[XT/(P:) — K'[XT/(r(P:)) (6.255) 


est un isomorphisme d’anneaux. Et enfin, dernier résultat externe à invoquer, la proposition 6.102 
nous assure que K[a] = K(a) et K’[5] = K’(86). Posons pour l’occasion K1 = K(a) et K' = K’(5). 
Nous avons l’enchainement suivant d’isomorphismes de corps (? : 


n = Yo oÿ":K1— K[X]/(P) — K'[X]/(r(P1)) — Ki. (6.256) 


Cet isomorphisme 71: K1 — K! prolonge 7. Si vous aimez les diagrammes, en voici un sur lequel 
les à représentent des inclusions et où 7 et T1 sont des isomorphismes 


l'OS CES P (6.257) 


nn: 


K'—>K! À 


Le corps L est un corps de décomposition de P sur K1, et le nombre de racines de P dans L\K: 
est strictement plus petit que m parce qu’il y en a exactement m dans L\K et que K; en a au 
moins une de plus que K. Même raisonnement pour K’, K' et IL’. 

Résumons la situation : 


— T1: K1 — K' est un isomorphisme de corps: 

— PEK:[X] est un polynôme non constant ; 

— L est un corps de décomposition de P sur K: ; 

— L/ est un corps de décomposition de P sur K' ; 

— le nombre de racines de P dans L\K:1 est strictement inférieur à m. 


Donc, par hypothèse de récurrence sur m, il existe un isomorphisme ©: L — I} qui prolonge 71. 
Vu que 7 prolonge 7, nous avons également o qui prolonge 7. 


L'’énoncé le plus compact pour l’unicité du corps de décomposition (à isomorphisme près) est 


le suivant : 
PropTMkfyM 


Proposition 6.144. 
Soit K un corps et P € K[X]. Soient L et F deux corps de décomposition de P. Alors il existe un 
isomorphisme f:L — F tel que flx = Id. 


62. En réalité il est plus exact de dire « isomorphisme d’anneaux », parce que la structure de corps n’est en réalité 
aucune nouvelle structure par rapport à l’anneau. 
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Démonstration. C’est un cas particulier du théorème 6.143, où nous considérons K = K’ muni de 
l’isomorphisme identité. 


Cependant le passage par l'énoncé plus compliqué 6.143 est nécessaire pour les besoins de la 
récurrence. 


6.145. 
À propos de terminologie. Lorsque nous disons « un corps de décomposition » nous référons à la 
définition 6.140 et il n’y a pas vraiment unicité. Si nous disons « le corps de décomposition » nous 
référons en général à celui construit dans la proposition 6.141 qui n’est en réalité même pas très 
explicite. 

Quoi qu’il en soit, nous nous permettons de dire « le » corps de décomposition lorsque nous 
parlons de propriétés invariantes par isomorphisme. 


6.146. 
La construction du corps de décomposition d’un polynôme fonctionne en prenant successivement 
le corps de rupture des facteurs irréductibles. Nous insistons sur le fait que cette opération se fait 
sur chaque facteur irréductible séparément. 

L'exemple suivant montre dans quel ordre se passent les choses. 


Exemple 6.147. 
Soit le polynôme P = X4-—5X? + 6. Sa factorisation en irréductibles est : 


PR = (x7 5). (6.258) 


Ce polynôme n’est pas irréductible sur À et il ne s’agit donc pas de prendre brutalement un corps 
de rupture pour P. Il s’agit de poser P = P; P» avec 


P,=X?-2 (6.259a) 
P2 = X? 3, (6.259b) 


de remarquer que P; et P2 sont irréductibles sur Q et de chercher des corps de rupture pour eux. 
On commence par P.. Nous avons le corps de rupture Li = Q(42) et la factorisation 


P, = (X + V2)(X — V2). (6.260) 


Ensuite nous considérons P; dans L1[X]. Ce P2 est encore irréductible. Nous lui cherchons un 
corps de rupture, et c’est L2 = L1(43) dans lequel nous avons 


P> = (X — V3)(X + V3). (6.261) 
Nous savons (par le lemme 6.124) que 
Le = Li(V3) = (Q(V2))(V3) = Q(V2, V3). (6.262) 
Nous pouvons donc écrire en toute confiance, dans Q(v2, V3) la factorisation 
P=(X +V2)(X — V2)(X + V3)(X — V3). (6.263) 


Et nous notons que si nous avions commencé par P2 au lieu de P;, nous aurions eu le même 


résultat final. VAN 
CORooEËELAU00OPQGLKR 


Corolaire 6.148 ([1]). 
Le corps de décomposition d’un polynôme est une extension finie. 


Démonstration. Soient un corps K, un polynôme P € K[X] et un corps de décomposition D de 
P de la forme D = K(a,...,a») où les a; sont les racines de P dans D. Cela existe par la 
proposition 6.141. 
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Vu que le lemme 6.124 donne 
Ko... ou) (Re... 5060): (6.264) 


le corps D se construit comme une pile d’extensions finies. Les degrés se composant par le 
lemme 6.63, au final ce corps de décomposition est une extension finie. 

Soit maintenant un corps de décomposition quelconque IL. La proposition 6.144 donne un 
isomorphisme de corps ® f: L — D tel que f soit l'identité sur K. 


Si {v;}ier est une base de D comme espace vectoriel sur K, êtes-vous prêts à parier que { f(v;)}ier 
est une base de L comme espace vectoriel sur K 64? 


6.4.11 Non irréductible ou pas corps ? 
SUBSECooEDMJooTXBfOu 


Nous avons déjà mentionné que nous ne définissons le corps de rupture d’un polynôme que 
dans le cas de polynôme irréductible à coefficients dans un corps. 

D'abord si P n’est pas irréductible, la question de chercher un corps de rupture n’a pas beaucoup 
de sens. 

Si À est un anneau intègre et si P est un polynôme irréductible sur À, nous pouvons considérer 
le corps des fractions de À, dire P € Frac(A)[X] et continuer. Étendre la définition de corps de 
rupture de cette façon aux polynômes à coefficients dans un anneau intègre n’est pas une grande 
révolution. 

Au lieu de cela, nous pouvons nous demander dans quel cas nous aurions que A[X]/(P) est 
directement un corps. 


Exemple 6.149. 
Soit le polynôme constant P = 2 dans Z[X |. Il y est irréductible parce qu’il ne peut pas être écrit 
comme produit de deux non inversibles. Ce polynôme a deux propriétés ennuyeuses : 


— Il n’est plus irréductible sur Q, 
— Il n'existe aucun corps contenant une racine de P tout en contenant Z comme sous-anneau. 


A 


6.4.12 Clôture algébrique 
THOo00QFWWooMWXERT 


Théorème 6.150. 
Tout corps K possède une clôture algébrique Q. De plus si L est une extension de K, alors L 
est K-isomorphe à un sous corps de Q. 


Les deux parties de ce théorème utilisent l’axiome du choix. 
Notons en particulier que si ®/ est une autre clôture algébrique de K, alors Q et Q/ sont des 
sous corps l’un de l’autre et sont donc K-isomorphes. 


Lemme 6.151. 
Les polynômes P,Q € K[X] ne sont pas premiers entre eux si et seulement s'ils ont une racine 
commune dans la clôture algébrique Q de K. 


Démonstration. Soit À un polynôme non inversible divisant P et Q. Par définition de Q, ce poly- 
nôme À à une racine dans Q qui est alors une racine commune à P et Q dans Q. 

Pour le sens inverse, si & est une racine commune de P et Q, alors le polynôme X — a divise 
P et Q et donc P et Q ne sont pas premiers entre eux. 


ExfUqQXxQ 


63. Un isomorphisme de corps est juste un isomorphisme d’anneaux. 
64. Personnellement, je n'ai pas vérifié. Vérifiez vous-même et écrivez-moi pour dire si c'est bon ou non. 
65. Définition 6.75. 
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Exemple 6.152. 
Soit p un nombre premier. Montrons que le polynôme 

Q(X) = XP-X +1 (6.265) 


est irréductible dans F,,. 
Nous supposons qu'il n’est pas irréductible, c’est-à-dire que 


Q(X) = R(X)S(X) (6.266) 


avec R et S, des polynômes de degrés > 1 dans F,[X] 
Soit F, une clôture algébrique % de F, et à € F, tel que R(a) = 0. Pour tout a € F,, nous 
avons 


Q(a+a)=(a+a} —-(a+a)+1 (6.267a) 
=+@-a-a+l (6.267b) 
=#-a+1 (6.267c) 
= Q(a) (6.267d) 
=] (6.267e) 


où nous avons utilisé le fait que a? = a et que « était une racine de Q. Ce que nous venons de 
prouver est que l’ensemble des racines de Q dans F, est donné par {a + a tel que ae F,}. 

Les polynômes R et S sont donc formés de produits de termes X — (a + a) avec a € F,. L'un 
des deux -disons À pour fixer les idées- doit bien en avoir plus que 1. Nous avons alors 


k 
R(X) = [ [(X -(a+ ai) (6.268) 
i=1 


où les a; sont les éléments de F,. En développant un peu, 


k 
R(X) = XF - > (a + &)XF 1 + termes de degré plus bas en X. (6.269) 
i=1 


Le coefficient devant X*-1 n’est autre que ka + Y; «. Étant donné que k Z 0 et que RE F,[X], 
nous devons avoir @& € F,. Par conséquent nous avons a? = a et une contradiction : 


Q(a)=#-a+1=1%0. (6.270) 


Le polynôme XP — X +1 est donc irréductible sur F,. A 


6.4.13 Dérivée de polynômes 
DEFoo1CHTooAggARW 


Définition 6.153 ([175]). 
Soit un anneau À ainsi que a € A. Pour le polynôme P = YF ax XF, nous définissons le 
polynôme dérivé 
nm 
P'= N kaX° (6.271) 


k=1 
LEMooËEFQQooTzDanH 


Lemme 6.154 (Règle de Leibnitz[175]). 


Soit un anneau À. Nous considérons l'application dérivée $* 


D: A[X] — A[X] 
Pr P'. 


66. Définition 6.75. Pour l’existence c’est le théorème 6.150. 
67. Définition 6.153. 


(6.272) 
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(1) L'application D est A-linéaire. 


(2) Elle vérifie (PQ) = PQ! + P'Q. 
LEMooFNFYooAfIPRT 
Lemme 6.155 ([175]). 
Soit un corps K. Nous considérons l’application de dérivation ® D: K[X] — K[X]. 


(1) SiK est de caractéristique nulle, alors ker(D) = K. 
(2) Si K est de caractéristique p Æ 0, alors ker(D) = K[X?]. 


Ici, K[X?] est un gros abus de notations pour dire 


K[X?] = {Q(XP) tel que QE K[X|}. (6.273) 


6.4.14 Extensions séparables 


Notons que dans ce qui va suivre nous allons parler de K[X], l’ensemble des polynômes sur un 
corps. Cela ne s'applique donc pas à Z[X] par exemple. 

Une des choses intéressantes avec les extensions séparables c’est qu’elles vérifient le théorème 
de l’élément primitif 6.170. 


LEMooGUUJooDSrQFU 

Lemme 6.156 ([175]). 
Soit un corps K. Soient P € K[X] et ae K. Nous avons équivalence entre : ITEMooHMMMooUKzSLA 
(1) a est une racine multiple®° de P. ITEMooZXCTooPctrMn 
(2) (X—a)| Pet (X—a)|P. ITEMooBMSSooNOYfKn 


(3) P(a) = P'(a) = 0 


Démonstration. Soit n la multiplicité de la racine a de P. Éventuellement n = 0 si a n’est en 


P = (x : a)"Q St 


réalité pas une racine. Nous avons 


avec Q(a) £ 0. 


En ce qui concerne la dérivée, si n = 0 nous avons P’ = Q, et si n > 1 nous avons 
E LIN 
P'=nX-a}"1Q+(X-a)"Q. rt) 


Nous faisons maintenant la preuve. 


(1) (1) implique (2) Nous supposons que a est une racine multiple, c'est-à-dire n > 2. Les 
relations (6.274) et (6.275) nous montrent que (X — a) divise aussi bien P que P. 


(2 


— 


(2) implique (3) Celle-ci est facile. Les hypothèses sont qu'il existe des polynômes À et 
B tels que P = (X —a)A et P' =(X — a)B. Nous avons alors bien P(a) = P'(a) = 0. 


(3) implique (1) Nous avons P = (X — a)"Q avec Q(a) Æ 0. Par hypothèse P(a) = 0. 
Donc n > 1. Nous pouvons alors utiliser la formule (6.275) pour la dérivée : 


(3 


— 


P'=n(X = a)" TQ(a) +(X — a)". (6.276) 


Nous avons donc P'(a) = n0"-1Q(a) avec Q(a) Æ 0. Par hypothèse P'(a) = 0 et donc 
n — 1 > 0, ce qui signifie n > 2 et donc que a est une racine multiple de P. 


Proposition 6.157. 
Soit P irréductible dans K[X] ayant des racines distinctes dans le corps de décomposition L. Si 
L/ est un autre corps de décomposition pour P, alors P a aussi ses racines distinctes dans L’. 


68. Voir lemme 6.154. 
69. Racine multiple, définition 3.121. 
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Démonstration. L’ingrédient est la proposition 6.144 qui donne l’unicité du corps de décomposition 
à K-isomorphisme près. Soit donc #: L — IL” un isomorphisme laissant invariant les éléments de 
K. D'une part, étant donné que P est à coefficients dans K, nous avons d(P) = P. D'autre part 
dans L le polynôme P s'écrit 

P = a(X — œ)...(X — an) (6.277) 


avec a € K et à; € L. Nous avons donc 


P = Y{(P) = a(X — Y(ai))...(X — Y(ar)). (6.278) 


Donc les racines de P dans L/ sont les éléments Y(a;) qui sont distincts. 


Exemple 6.158. 
Un polynôme peut être séparable sur un corps, mais non séparable sur un autre. Soit L = F,(T) 
et K = F,(7?). Nous considérons le polynôme 


P=XP- Tr (6.279) 
dans K[X]. Par le morphisme de Frobenius nous avons 
P=(X-T}P (6.280) 


dans L[X]. Le polynôme P est irréductible sur K[X] parce que ses diviseurs sont de la forme 
(X — T}F qui contiennent T* qui n’est pas dans K (sauf si £ = n ou k = 0). 

Ce polynôme n’est pas séparable sur K parce que dans le corps de décomposition L, la racine 
Test multiple. Notons bien le raisonnement : P étant irréductible, pour savoir si il est séparable, 
on le regarde dans un corps de décomposition. 

Par contre si nous regardons P dans L[X] alors P n’est plus irréductible parce que ses facteurs 
irréductibles sont (X — T). N’étant pas irréductible, nous regardons les racines de ses facteurs 
irréductibles. Or chacun des facteurs irréductibles étant X — 7’, les racines sont simples. A 


Exemple 6.159. 
Le polynôme X% — 1 est séparable sur Q parce que ses facteurs irréductibles dans Q[X1] sont X —1 
et X? + X + 1, et ces deux polynômes ont des racines simples (dans Q(i)). À 


Exemple 6.160. 
Le polynôme (X? + 1)? est séparable dans Q[X]. En effet, il a pour facteurs irréductibles le 
polynôme X? + 1 (en deux exemplaires), et ce polynôme a pour racines +4 dans l’extension Q(i), 


racines qui sont simples pour ce polynôme. A 
PropolyeZzff 


Proposition 6.161 ([176]). 
Soit PE K[X] un polynôme non constant. Les propriétés suivantes sont équivalentes. ItemdqPFUi 


(1) Il existe une extension de K dans laquelle P a une racine multiple. 


ItemdqPFUib 

(2) P à une racine multiple dans tout corps de décomposition . ItemdqPFUii 
/ . « 

(3) P et P' ont une racine commune dans une extension de K. ItemdqPFUiii 


(4) le degré de pgcd(P, P') est > 1. 


Démonstration. En plusieurs parties. 


= 


(1) (1)=(2) Soit a, une racine multiple de P dans une extension L de K, et E, un corps de 


a 


décomposition de P. Alors nous voulons prouver que P ait une racine multiple dans E. 


Nous pouvons voir P € L|X|, et construire un corps de décomposition E” qui est une exten- 
sion de L. Vu que E et E/ sont deux corps de décomposition de P nous avons un isomorphisme 
v: EF —E.SiaeE est une racine multiple de P, alors (a) est une racine multiple de P 
dans E’ parce que 


P(y(a)) = Y(P(a)). (6.281) 
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(2) (2)=(3) Soit L un corps de décomposition de P sur K et a € L, une racine multiple de P. 
On a alors P = (X — a)?Q avec Q € L[X]. En dérivant, 


P'=AX-a)jQ+(X-a)ÿQ, (6.282) 


et donc a est également une racine de P”. 
(3) (3)=(4) Soit D un pgcd de P et P'. D’après le théorème de Bézout il existe À, B € K[X] 
tels que 
AP + BP'= D. (6.283) 
Si a est une racine commune de P et P’ dans une extension L, alors c’est aussi une racine 
de D et donc deg(D) > 1. 
(4) (4)J=(1) Si le degré de D est plus grand ou égal à 1, alors nous considérons une racine a 


de D dans L (une extension de K). Étant donné que D divise P et P', l'élément a est une 
racine commune de P et P’. Nous montrons maintenant que a est alors une racine multiple 
de P. Vu que P(a) = 0 nous avons 


P={X-%)0, (6.284) 


et Pl =Q+(X — a)Q). Mais alors P'(a) = Q(a) et donc Q(a) = 0 et donc a est une racine 
double de P. Par conséquent a est une racine multiple de P dans K. 


Notons que si P est irréductible, cette proposition donne des conditions pour que P ne soit pas 
séparable. 
LEMooVWBPooQITIUL 
Lemme 6.162 ([165]). 
Soient un corps K ainsi qu’un polynôme irréductible non nul P € K[X]. Soit un polynôme Q € 
K[X]. Alors P divise Q si et seulement si pgcd(P, Q) 1. 


Démonstration. Nous notons D = pgcd(P,Q). C’est un polynôme qui divise P. De plus P est 
irréductible, donc non inversible. Vu que P est non nul, nous avons deg(P) > 1. 


(1) = Nous supposons que P divise Q. Alors P est un diviseur commun de P et Q. Le lemme 
6.55 (qui n’est en fait qu’une répétition de la définition du pgcd) nous dit alors que P divise 
pgcd(P, Q). Nous avons donc 


0 < deg(P) < deg (pgcd(P, Q)). (6.285) 


Donc le polynôme pgcd(P,Q) est un polynôme non constant et n’est en particulier pas 1. 


(2) = Le polynôme D est un diviseur commun de P et Q. En particulier P = SD pour un 
certain polynôme $. Étant donné que P est irréductible, soit S soit D (ou les deux) est 
inversible. Par hypothèse D ZÆ 1, et comme D est unitaire, nous savons que D n’est pas un 
inversible. Bref, S est un inversible, c’est-à-dire que S = k € K. Nous notons que 


P=ED FAGOR ES 


Le polynôme D divise également Q. Il existe T € K[X] tel que Q = TD. En remplaçant D 
par sa valeur déduite de (6.286) nous avons 


Q=TD=Kk IT, (6.287) 


ce qui signifie que P divise Q. 


Nous rappelons à la très aimable lectrice que pgcd(P, Q) est l’unique polynôme unitaire parmi 
les PGCD de P et Q. La définition des PGCD est 1.182 et l’unicité de l’unitaire est dans le lemme 
6.52(2). 
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PROPooPRGQoo0UkEmag 

Proposition-Définition 6.163 ([175, 177]). 
Soient un corps K, un polynôme non constant P € K[X] ainsi qu’une extension algébriquement 
close Q et un corps de décomposition ® M pour P. Alors les propriétés suivantes sont équiva- 
lentes"! : ITEMooVMJLooUdZLQR 

(L}.peed(P. PF) = 1, 

(2) P et P' n'ont de racines communes dans aucune extension de K. 

(3) P et P' n'ont pas de racines communes dans M. 


(4) P et P' n'ont pas de racines communes dans Q. ITEMooARPLooBoUrxX 


(5) P n'a de racines multiples dans aucune extension de K. 
(6) P n'a que des racines simples dans M. 
(7) P n'a que des racines simples dans (. 


(8) Il existe une extension L de K ainsi que B,a; € L tels que 
nm 
P = B][(X-«) (6.288) 
i=1 


où les a; sont distincts. 
(9) I existe B,a; € M tels que P = BIT, (X — ai) où les a; sont distincts. 
(10) I existe B,ai € À tels que P = BIT, (X — ai) où les a; sont distincts. 
Un polynôme irréductible qui vérifie ces conditions est dit séparable. 
Si P est un polynôme non constant dont la décomposition en irréductibles est P = P1...P,, 


nous disons qu'il est séparable si tous les P; le sont. 
PROPooMOZFooDGemBJ 


Proposition 6.164 ([175, 177]). 
Soit un corps K et un polynôme irréductible non nul P € K[X]. Les conditions suivantes sont 


équivalentes : ITEMooDOTTooTZGhSq 
; ve 
(1) P est séparable ITEMooRTDCooJGEtum 
1 
(2) F0 ITEMooZOMZooDPrNaC 


(3) Il existe une extension L de K dans laquelle P a une racine simple. 


Démonstration. En plusieurs parties. 
(1) (3) implique (2) Soient une extension L de K ainsi qu’une racine simple a € L. Nous 
utilisons la proposition 3.125 : il existe un polynôme Q € L{X] tel que P = (X — a)Q(X) 
avec L # 0. 
Nous utilisons la règle de Leibnitz (lemme 6.154) : P' = (X — a) Q(X) + (X — a)Q'(X) = 
Q(X) + (X — a)Q'(X). En évaluant en a, 
P'(a) = Q(a) # 0. (6.289) 
(2) (2) implique pgcd(P, P') =1 Notons D = pgcd(P, P'). Vu que D divise P, il existe un 
polynôme Q tel que P = QD. Le polynôme P étant irréductible, soit Q soit D est inversible. 


Supposons que Q est inversible. Alors P = kD avec k € K. En particulier deg(P) = deg(D). 
Mais comme D est un diviseur de P’, nous avons 


deg(D) < deg(P') < deg(P). (6.290) 


Nous avons une contradiction. 
Nous en déduisons que dans l'égalité P = DQ, c’est D qui est inversible. Donc D € K. Vu 


que D est unitaire *, nous avons D = 1. 


70. Tout polynôme admet un corps de décomposition, proposition 6.141. 
71. Pour lee polynôme dérivé P’, définition 6.153. 

72. Polynôme séparable, définition 6.163. 

73. Le pgcd de deux polynômes est l’unitaire parmi tous les pgcd, voir 6.53. 


472 CHAPITRE 6. CORPS 


(3) (2) implique (1) Nous avons déjà vu que dans le cas (2) nous avons pgcd(P, P') = 1. La 
proposition-définition 6.163(1) nous indique qu’alors P est séparable. 


(4) (1) implique (3) La proposition 6.141 nous permet de considérer un corps de décomposi- 
tion de P. Dans ce corps, P admet des racines (autant que son degré, mais c’est une autre 
histoire), et ces racines sont simples par la définition 6.163(5). 


CorUjfJSE 
Corolaire 6.165. 
Si K est de caractéristique nulle, alors tout polynôme de K[X] est séparable. 


Démonstration. [1 suffit de montrer que les irréductibles sont séparables. Soit P un polynôme 
irréductible et unitaire de degré d. Le terme de plus haut degré de P' est alors dX-! qui est 
non nul parce que d Æ 0 en caractéristique nulle. Donc P' Æ 0 et donc P est séparable par la 
proposition 6.161. 


DEFooKTVHooTydOTM 
Définition 6.166. 
Soit L une extension algébrique de K. ITEMooOFYPooL.YkIPr 
(1) On dit que l'élément a € L est séparable sur K si son polynôme minimal dans K[XT] est 
séparable sur K (définition 6.163). 


(2) L'extension L est séparable si tous ses éléments sont séparables. 


PropUmxJVw 

Proposition 6.167. 
Soit K un corps. Les conditions suivantes sont équivalentes : ITEMooUSKRooDmsGmv 
(1) toutes les extensions algébriques de K sont séparables ; ITEMoo JCULooKTnxSC 


(2) tout polynôme irréductible de K[X] est séparable. 


En particulier les extensions algébriques des corps de caractéristique nulle sont toutes séparables. 


Démonstration. En plusieurs parties. 


(1) (1) implique (2) 
Soit un polynôme irréductible P de K[X], et un corps de décomposition L de P. Cela est 
une extension algébrique par le corolaire 6.148. Elle est donc séparable par hypothèse. 


Voilà une première chose de dite. 


Maintenant, nous voudrions montrer que P est un polynôme séparable. Dans L nous avons 
nm 
P=][(X-«), (6.291) 


et tout le défi est de prouver que les a; sont tous distincts. 

Soient deux racines à,b € L de P. Nous considérons les polynômes minimaux u4 et y dans 
K[X]. Ces deux polynômes divisent P parce que P est à la fois dans l’idéal annulateur de a 
et de b. Mais comme P est irréductible, il existe k4, kn € K tels que P = ku, et P = kpjt. 
Donc les polynômes u,,u1 et P sont multiples les uns des autres. Vu que u, et y, sont 
unitaires, Ua = fb. 


Nous avons : 


Pin [IX — di). (6.292) 
i=1 


Or le polynôme w est irréductible par la proposition 6.67(1), et l'extension L est séparable, 
donc y n’a que des racines simples, Donc tous les a; sont distincts. 
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(2) (2) implique (1) 
Soit une extension algébrique L de K. Soit a € L. Nous devons prouver que le polynôme 
minimal de a dans K est séparable, c’est-à-dire qu’il n’a que des racines simples. 


Le polynôme minimal uw; € K[X] de a est irréductible et donc séparable. Donc L est sépa- 
rable. 


La dernière phrase est une conséquence du corolaire 6.165. 


CORooNZZMoo!loBYXY 
Corolaire 6.168. 
Toute les extensions algébriques de À sont séparables. 


Démonstration. Le corps Q est de caractéristique nulle (définition 1.343). Le corolaire 6.165 dit 
alors que tout polynôme sur À est séparable. La proposition 6.167 conclut en disant que toutes les 
extensions algébriques de À sont séparables. 


ThobkwCMm 
Théorème 6.169 ([99]). 
Soit K un corps (pas spécialement fini). Tout sous-groupe fini de K* est cyclique. 


Démonstration. Soit G un sous-groupe fini de K* et w son exposant (qui est le PPCM des ordres 
des éléments de G). Étant donné que |G| est divisé par tous les ordres, il est divisé par le PPCM 
des ordres. Bref, nous avons 

5 (6.293) 


pour tout x € G. Mais ce polynôme possède au plus w racines dans K. Du coup |G| < w. Et 
comme on avait déjà vu que w | |G|, on a w = |G|. Il suffit plus que trouver un élément d’ordre 
effectivement w. Cela est fait par le lemme 3.32. 


ThoURxgBC 
Théorème 6.170 (Théorème de l'élément primitif[99]). 
Toute extension de corps séparable finie admet un élément primitif "*. 
Autrement dit, soient des éléments algébriques a1,...,an séparables © sur K, et soit l’extension 
engendrée L = K(a1,...,a»). Alors L admet un élément primitif, c’est-à-dire un élément 0 tel 


que L = K(6). 


Démonstration. Si le corps K est fini, alors L est également fini. Donc L* est cyclique par le 
théorème 6.169. Si 4 est un générateur de L*, alors L = K(8). 

Passons au cas où K est infini. Il suffit d'examiner le cas n = 2; en effet pour n = 1 c’est trivial 
et si n > 2, alors 


K(a1,...,an) = K(a1,...,@n-1)(an), (6.294) 
et donc si K(a1,...,a»_1) = K(), nous avons 
K(a1,...,an) = K(6,an) (6.295) 


et nous sommes réduit au cas n = 2 par récurrence. 
Soit donc L = K(a, 8); soit P le polynôme minimal de a sur K et Q celui de 5. Nous nommons 
E, un corps de décomposition de PQ. Nous avons L € E. Vu que P et Q sont polynômes minimaux 


d'éléments qui sont par hypothèse séparables, les polynômes P et Q sont séparables. Donc dans E 
les racines de P sont distinctes parce que P est irréductible (et idem pour Q). Soient les racines 


O1 = @,092,..., Ar (6.296) 


de P dans E et les racines 


Bi = B,B2,...,bs (6.297) 
de Q dans E. Ici r et s sont les degrés de P et Q. 


74. Définition 6.92. 
75. Définition 6.166(1). 
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Si s = 1 alors Q = X —-B et donc B € K (parce que Q € K[X]). Du coup nous avons L = K(a) 
et le théorème est démontré. Nous supposons donc maintenant que s > 2. 

Pour chaque (4, j) € [1,r] x [2,5], l'équation à; + 8x = @1 + 81 pour x e K a au plus © une 
solution donnée le cas échéant par 


z = (oi — &1)(B1 — Bx)* F6 208) 


Notons que cela est de toutes façons dans L et qu’étant donné que B1 Æ y, cette solution a un 
sens (ici on utilise l'hypothèse de séparabilité). Etant donné que K est infini nous pouvons donc 
trouver un c € K qui ne résout aucune des équations (6.298) : 


@ + Côr À O1 + Ci. FQooTTHVoomEEgE, 


Nous posons 0 = «1 + cf et nous prétendons que L = K(0). 

Pour cela, commençons par montrer que B1 € K(8). On considère, dans K(0)[T], les polynômes 
Q(T) et S(T) = P(0 — cT), et on nomme À le PGCD de ces deux polynômes. Alors, une racine 
de À doit être une racine de Q, et est donc un des f;. Or, d’une part, le choix de 0 fait que Bi est 
une racine de R parce que 


S(B1) = P(0 chi) = P(ai + chi — chi) = P(a:) = (. (6.300) 
D'autre part, si & > 2, alors 


S(Bk) = P(a1 + Bi — cr) = P(a1 + (Bi — Bk)) À 0 (6.301) 


parce que a + €(B1 — By) ne vaut ni a (le second terme est non-nul), ni un autre a; (à cause de 
(6.299)). 
Il s'ensuit que Q et S n’ont qu’une racine commune B; = B, qui est donc l’unique racine de À. 
Ainsi, 
R=X-fBEK(8)[T|, (6.302) 


et donc 8 € K(6). 
Dès lors a = 1 = 0 — cB est alors immédiatement dans K(0) ; puisque les deux éléments a et 
B sont dans K(0), nous avons obtenu L = K(a, 5) = K(6). 


Exemple 6.171. 

Le théorème de l’élément primitif 6.170 ne tient pas pour les corps non commutatifs. Considérons 
par exemple le corps K des quaternions et le groupe à 8 éléments G = {+1,+i,+7,+k}. Ce dernier 
groupe n’est pas cyclique alors qu’il est un groupe fini dans K*. A 


Exemple 6.172. 

Il est aussi possible pour un groupe fini d’avoir w(G) = |G| sans pour autant que G soit cyclique. 
Par exemple pour G = $S3, nous avons |S3| = 6 alors que les éléments de S2 sont soit d’ordre 2 soit 
d'ordre 3 et w(G) = ppem(2,3) = 6. Pourtant S3 n’est pas cyclique. A 


6.5 Idéal maximum 


6.5.1 Idéal maximum 
DefWHDdTrC 


Définition 6.173. 
Une K-algèbre est de type fini si elle est le quotient de K[X1,...,X,] par un idéal (pour un 
certain n). 


76. La solution (6.298) peut être dans L et non dans K. L’équation peut donc très bien ne pas avoir de solutions 
æe K. 
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ThonoZyKa 
Théorème 6.174 ([178]). 
Soit K un corps et B, une K-algèbre de type fini. Si B est un corps, alors c’est une extension 
algébrique finie de K. 


ThowgZYqx 
Théorème 6.175 ([178]). 
Si K est un corps algébriquement clos, les idéaux maximaux * de K[X1,...,X,] sont de la forme 
(X1 — a,..., Xn — An) (6.303) 
où les a; sont des éléments de K. 
Démonstration. Nous commençons par montrer que 
J = (X1-a1,..., Xn — Gn) (6.304) 
est un idéal maximum. Pour cela nous considérons le morphisme surjectif d’anneaux 
D: K[X1,..., Xn] — K (6.305) 


Pr P(a,...,an). 


Soit P € ker(@); nous écrivons la division euclidienne de P par X — a; puis celle du reste par 
X — a2 et ainsi de suite : 


P=(X — a1)Q1+:::+(Xn — an)Qn + R F4 SO) 


où R doit être une constante parce que le premier reste est de degré zéro en X1, le second est de 
degré zéro en X1 et X2, etc. Afin d'identifier cette constante, nous appliquons l'égalité (6.306) à 
(a1,...,an) et en nous rappelant que P € ker(@) nous obtenons 


0 = P(a,...,an)=R, (6.307) 


donc R = 0 et P = (X3 — a1)Qs + --- + (X» — an)Qn, c'est-à-dire P € J. Nous avons donc 
ker(®) € J. Par ailleurs J € ker(®) est évident, donc J = ker(d). 
Vu que J est le noyau de l'application K[X1,...,X,] — K, nous avons 


K[X:,...,X 
sl (6.308) 
J 
Donc J est un idéal maximal parce que tout polynôme n'étant pas dans J doit avoir un terme 
indépendant non nul et donc être dans K vis à vis du quotient K[X1,..., Xh]/J. 
Nous montrons maintenant l’implication inverse. Nous supposons que 1 est un idéal maximum 
et nous montrons qu’il doit être égal à J (pour un certain choix de a1,...,an). 
Le quotient 
K[X:,...,X 
Sal un vi] (6.309) 


est une K-algèbre de type fini (définition 6.173). De plus c’est un corps par la proposition 1.213. 
C’est donc une extension algébrique finie de K par le théorème 6.174. Mais K étant algébriquement 
clos, il est sa propre et unique extension algébrique ; nous en déduisons que 


K[X1, A > Xn] 
I 


=K. (6.310) 


Donc pour tout 1 <i< n, il existe a; € K tel que X;—a; € Ï, sinon le monôme X; ne se projetterait 
pas sur un élément dans K dans le quotient. Cela prouve que J est contenu dans J ; par maximalité 
nous avons donc 1 = J. 


77. Définition 1.212. 


AT6 CHAPITRE 6. CORPS 


Corolaire 6.176. 
Soit K un corps algébriquement clos et T, un idéal de KÏX1,...,X,]. Si nous notons 


V(I) = {ze K” tel que P(x1,...,2%n) =0,VPEeÏ} (6.311) 


l’ensemble des racines communes à tous les éléments de I, on a V(I) = @ si et seulement si 
LR: 


Démonstration. Si I = K[X1,...,X,] en particulier 1 € Z et nous avons évidemment V(1) = G. 
Le sens difficile est l’autre sens. 

Supposons que 1 Æ K[X:1,...,X,] et que Æ est un idéal maximum contenant 1 (ça existe 
par le théorème de Krull 1.214). Nous savons déjà par le théorème 6.175 que X est de la forme 
K = (X3 — a1,..., Xn — an). Un élément de J est dans K, donc si P € I nous avons 


Plas...0n) = 0 (6.312) 


c'est-à-dire que (a1,...,an) € V(I) et donc que V(1) 4 G. 


6.6 Polynômes symétriques et alternés 


6.6.1 Polynômes symétriques, alternés ou semi-symétriques 


Nous rappelons que le groupe symétrique $, agit sur l’anneau des polynômes de n variables 
sur l’anneau À par le lemme 1.361. 


Définition 6.177. 

Un polynôme Q en n indéterminées est 
(1) symétrique si Q = o : Q pour tout o € S, ; 
(2) alterné si o : Q = e(o)Q pour tout o € S, ; 


(3) semi-symétrique si o *: Q = Q pour tout o € A} 


Le polynôme T1 + T2 est symétrique; le polynôme T1 + TÈ ne l’est pas. 


6.6.2 Polynôme symétrique élémentaire 
DEFooTREUooZKoXeg 


Définition 6.178. 
Le k-ième polynôme symétrique élémentaire à n inconnues est le polynôme 


k 
as) IE (6.313) 
seF% i=1l 
où Fy est l’ensemble des fonctions strictement croissantes {1,2,...,k} — {1,2,...,n}. 


Une autre façon de décrire ces polynômes élémentaires est 


1<Li1<...<ip<n 


Par exemple 


01(11,...,1n) =D +P+...+T (6.315a) 
o2(T\, 3e 1%) = TD +... + TT + DB +. <PTp +. + Th Th (6.315b) 
en = 0, (6.315c) 


En particulier, o2(x,y,2) = xy + yz + æz. 
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TholReBiw 
Théorème 6.179 ([179]). 
Si Q est un polynôme symétrique en T,...,7,, alors il existe un et un seul polynôme P en n 
indéterminées tel que 


Q(T, ess 1) — P(oi(T,. .. Le … > Cn(Ti; … Ale (6.316) 


Exemple 6.180. 
Nous voulons décomposer P(x,y, 2) = x° + y° + 2% en polynômes symétriques élémentaires, c’est- 
à-dire en 


O1=T+y+2z (6.317a) 
O2 = TY + T2 + YZ (6.317b) 
03 = TYZ. (6.317c) 


Étant donné que P est de degré 3, les seules combinaisons des 0; qui peuvent intervenir sont 
oŸ, 0102 et 03. Étant donné que dans P le coefficient de x° est un, il est obligatoire d’avoir un 
coefficient 1 devant oŸ. Nous le calculons : 


| Sage Version 4.8, Release Date: 2012-01-20 | 
| Type notebook() for the GUI, and license() for information. | 


sage: P=x*x*3+yxx3+Z%*x%*x3 
sage: 9S1=x+y+z 
sage: S2=x*y+X*xZ+V*XZz 
sage: 9S3=x*y*Zz 
sage: (S1**3) .expand() 
X73 + 3xx72%xy + 3kx72%xz + BkxkY 2 + GKXKYXZ + ZXXXZT2 + 73 
+ 3*y72*z + 3*xy*xz"2 + z73 
sage: (S1*x*3-P) .expand() 
SXkx72*y + 3Kkx7T2%Z + ZkxkY 2 + CKXXYXZ + ZKXXZT2 + KV 2XxZ + 3kYXZT2 
X73 + 3xx72*%xy + 3kx72%xZ + ZkxkY 2 + CKXKYXZ + 3kXKkZ72 
+ ÿ73 + 3%xy72*%xz + 3xyxz"2 + z°73 


Dans la différence aÿ — P nous voyons que le terme en xyz est 6xyz; par conséquent nous savons 
que le coefficient de o3 sera —6. Il nous reste : 


sage: (S1*x*3+6*%S3-P) .expand() 
SXkxT2*y + 3KkxT2%XZ + ZkxkY 2 + 12KXXYXZ + ZKXXZT2 + 3kY 2xZ + 3kYXxZ2 


que nous identifions facilement avec 30102. Nous avons donc 
P = 0? — 30102 + 303. (6.318) 


A 
LemSoXCQH 


Lemme 6.181 ([112]). L 
Soit K une extension de degré d de Q et PE KIÎT:,...,Tm|]. Alors il existe P € QÎIT:,...,Tm] tel 
que 

(1) deg P = 6deg(P) 

(2) pour tout (z1,...,2m) € €" tel que P(z1,...,2m) = 0, on a P(21,...,2m) = 0. 
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Démonstration. En vertu de la proposition 6.167 et du corolaire 6.168, K est une extension sé- 
parable de Q, et donc vérifie le théorème de l’élément primitif (6.170). Il existe 4 € K tel que 
K = Q(4). Soit P, € Q[X] le polynôme minimal de 0. L'extension K étant de degré 6, et 0 étant 
un générateur, une base de K comme espace vectoriel sur Q est 


{1,8,...,80 1. (6.319) 
Mais par ailleurs la proposition 6.102(2) nous indique qu’une base de Q(4) sur Q est donnée par 
{1,9,...,071} (6.320) 


où n est le degré de P9. Donc Ph est de degré ô. Nous nommons 6:,...,0% les racines de Ps dans un 
corps de décomposition. Ici nous notons 0 = 0; et nous ne prétendons pas que 04 € K. Notons que 
ces 0; sont toutes des racines simples de Py, sinon nous aurions un facteur irréductible (X — 44)?, 
et Pa ne serait pas irréductible sur Q. 

Soit ox le morphisme canonique 


ok: Q(8) — Q(6k) 


Nous avons 01: K — K qui est l’identité. 
Notons N le degré du polynôme P € K[T:,...,Th] dont il est question dans l’énoncé. Nous le 
décomposons alors en 


N m 
P = > », cuT} (6.322) 


avec cy € K. Nous voyons c;. comme un élément de K”? et donc nous écrivons À 


N m 
PES ÿ abiT (6.323) 


où & € Q[X]". Nous pouvons choisir deg(c;) < 6 parce que les puissances plus grandes de 0 ne 
génèrent rien de nouveau. 
Nous posons aussi 
PRET al} e QE) M.Tel, (6.324) 


Li 


et P = PP92...P°k, Le coefficient de T! dans P est 


G(01,...,05)i = x Bip (ba }e «2, (65 la (6.325) 
PENSE 


Ce dernier est un polynôme en les 04 à coefficients dans Q. Qui plus est, c’est un polynôme 
symétrique. En effet un terme contenant 020? provenant de c, (@)c, (dy) a un terme correspondant 
00% provenant de a;(0)c,(@). 

C’est donc le moment d’utiliser le théorème 6.179 à propos des polynômes symétriques élémen- 
taires qui nous dit que les coefficients de P sont en réalité des polynômes en ceux de P) qui sont 
dans Q. Donc P € Q[T1,...,Tn]. Par ailleurs nous avons que 


deg(P) = 6 deg(P) (6.326) 


parce que P est le produit de à « copies » de P. De plus P = P°1 divise P donc on a bien que si 
P(2) = 0 alors P(z) = 0. Le polynôme P est celui que nous cherchions. 


78. Il me semble qu’il manque la somme sur à dans [112]. 


H 
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6.6.3 Relations coefficients racines 
ThoOQRgjpl 


Théorème 6.182 (Relations coeffitients-racines). 
Soit le polynôme P = an X7 +: + a1X + ao et r; ses n racines. Alors nous avons pour chaque 
1<k<n la relation 
CPR 
op(ri...,Tn) = (—1)F (6.327) 
An 
où o& est le k°polynôme symétrique défini en 6.178. 


ExHIfHhBr 
Exemple 6.183. 
Soit le polynôme 
P(x) = x° + 2x? + 3x +4 (6.328) 


et ses racines que nous nommons @,b,c. Nous voudrions calculer a? + b? + c?. D'abord nous 

décomposons Q(a,b,c) = a? + b? + c en polynômes symétriques élémentaires : Q(a,b,c) = 
2 

o1(a, b, c)* — 202(a, b, c). 


Mais les relations coefficients-racines 


nous donnent o1(a,b,c) = —2 et o2(a,b,c) = 3, donc 


d+b+ce=(-2} -2. 3-2. (6.329) 


Cela nous assure déjà qu’au moins une des solutions n’est pas réelle. 
Nous pouvons en avoir une vérification directe en calculant explicitement les racines (ce qui est 
possible pour le degré 3) : 


sage: P(x)=xxx3+2xx*xx2+3xx+4 
sage: S=solve( P(x)==0,x ) 


sage: sols=[ s.rhs() for s in S ] 


sage: Q=[ sxx2 for s in sols |] 


s|sage: s=sum(Q) 


sage: s.simplify_full() 
-2 


tex/frido/VAY VmNRpolynomeSym.py 


Notez qu’il faut un peu chipoter pour isoler les solutions depuis la réponse de la fonction 
solve. A 


En suivant le même cheminement que dans l’exemple, si P est un polynôme de degré n et si r; 


sont ses racines, il est facile de calculer Q(r1,...,7n) pour n’importe quel polynôme symétrique Q 
PropTETooGuBYQf 


Proposition 6.184 (Annulation de fonctions polynomiales[180]). 
Soit K un corps et P un polynôme à n indéterminées. Nous supposons que P s’annule sur un 
ensemble de la forme A1 x ::: x A, avec Card(4;) > degx,(P) pour tout j. Alors P = 0. 


De plus si P = 0 alors tous ses coefficients sont nuls °®. 


Démonstration. Nous prouvons le résultat par récurrence sur le nombre n d’indéterminées. Si 
n = 1, cela est le théorème 6.110. Nous classons les monômes du polynôme P par ordre de 
puissance de X,, et nous le factorisons : 


mm 
Phox, (6.330) 
i=1 


79. Théorème 6.182 
80. L'intérêt de cela est qu’un polynôme de Z[X:,...,X,] peut s’évaluer sur un élément de n’importe quel corps ; 
il restera le polynôme nul. 
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avec P; € KIX1,..., Xn_1]. Soit (a1,...,an-1) € A1 X ... X Ah-_1 et posons 


m 


OU) Fete) Please (6.331) 
i=1 


Le polynôme Q s’annule sur À, avec deg(Q) = degx, (P) < Card(4,) et le théorème 6.110 nous 


donne Q = 0. Or les coefficients des différentes puissances de T dans Q(T) sont les P;(a1,...,an-—1): 
ils sont donc nuls. 
Nous avons montré que le polynôme P, s’annule pour tout élément de A1 x ... x An_1, mais 


nous avons 
degx,(P:) < degx, P < Card(4;), (6.332) 


donc l’hypothèse de récurrence donne P; = 0. Par suite, P = 0 également. 


6.7 Minuscule morceau sur la théorie de Galois 


Vous trouverez des détails et des preuves à propos de la théorie de Galois dans [181, 99]. 


Définition 6.185. 
Soit K, un corps. 

Le groupe de Galois d’une extension L de K est le groupe des automorphismes de L laissant 
K invariant. 

Le groupe de Galois d’un polynôme sur K est le groupe de Galois de son corps de décomposition 
sur K. 


Définition 6.186. 
Des éléments b1,...,bA d’une extension de K sont algébriquement indépendants si ils ne sa- 
tisfont à aucune relation du type 

D (6.333) 


avec @i..in € K. 


Nous disons que l’équation 
2 + an12 + + ax + ao = 0 (6.334) 


est l'équation générale de degré n si les coefficients a; sont algébriquement indépendants sur K. 
THOo0oDTCX00TIOSZe 


Théorème 6.187. 


Le groupe de Galois d’un polynôme de degré n est isomorphe au groupe symétrique Sn. 
CORooBRKTooBW1ldRC 


Corolaire 6.188 ([182]). 
L'’équation générale de degré n est résoluble par radicaux si et seulement sin < 5. 


Chapitre 7 


Topologie générale 


7.1 Éléments généraux de topologie 


7.1.1 Définitions et propriétés de base 
DefTopologieGene 


Définition 7.1 ([183]). 
Soient X, un ensemble et T, une partie de l’ensemble de ses parties qui vérifie les propriétés 
suivantes. 


(1) Les ensembles © et X sont dans T, 
(2) Une union quelconque! d'éléments de T est dans T. 
(3) Une intersection finie d'éléments de T est dans T. 
Un tel choix T de sous-ensembles de X est une topologie sur X, et les éléments de T sont appelés 


des ouverts. On dit aussi que (X,T) (voire simplement X lorsqu'il n'y a pas d’ambiguité) est un 
espace topologique. 


Deux espaces topologiques sont isomorphes quand il existe une bijection continue d’inverse 
continue. Nous verrons ça en la définition 7.37. 


7.1.2 Base de topologie 
DEFooLEHPoollNmpi 


Proposition-Définition 7.2 (Base de topologie[184, 185]). 
Soit un espace topologique (X,T). Soit une partie B de T. Les propriétés suivantes sont équiva- 


lentes : ITEMooCTPEooRCaxvx 


. à à ne 
(1) Tout élément de T est une réunion d'éléments de B. HTEMocHOVYOCRez YU 


(2) Pour tout x E X et pour tout ouvert © contenant x, il existe B € B tel que 


xeBcO. (7.1) 


Une partie B de T qui vérifie ces propriétés est une base de topologie pour X. 


Démonstration. En deux parties. 


(1) (1) implique (2) Soient x € X et © un ouvert contenant x. Étant donné que © est une 
réunion d'éléments de B, il y a au moins un B € B contenant x. Ce B vérifie re BE O. 


(2) (2) implique (1) Soit O un ouvert de X ; pour chaque x € © nous considérons un ouvert 
B(x) € B tel que x e B(x) € ©. Nous avons alors O = | J,.0 B(x). 


1. Par « quelconque » nous entendons vraiment quelconque : c’est-à-dire indicée par un ensemble qui peut autant 
être IN que R qu’un ensemble encore considérablement plus grand. 
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7.1.3 Fermés 


Définition 7.3. 
Si X est un espace topologique, un sous-ensemble F de X est dit fermé si son complémentaire, 
X\F, est ouvert. 


DEFFermeooNSAAooHxZbAo 


DEFVoisinageooGHZCooLRcpXY 
Définition 7.4. 
Si ace X, on dit que V € X est un voisinage de a si il existe un ouvert O ET tel que a € O et 


OcCV. 
DEFooBWZIooXotZLA 


Définition 7.5 (Base de voisinage[186]). 
Soient un espace topologique X ainsi que a € X. Un ensemble {U;};er de voisinages de a est une 
base de voisinages de à si pour tout voisinage V de a, il existe ke T tel que Ux € V. 


LemQYUJwPC 

Lemme 7.6. 
Union et intersection de fermés. ITEMooBHIGooMvkUtX 
(1) Une intersection quelconque de fermés est fermée. LtemKJYVooMBnMbG 


(2) Une union finie de fermés est fermée. 
Démonstration. Soit {F;};er un ensemble de fermés ; nous avons 
C 
nr) -Ur (7.2) 
iel iel 


Le membre de droite est une union d’ouverts, c’est donc un ouvert ; donc l'intersection qui apparaît 
dans le membre de gauche est le complémentaire d’un ouvert : c’est donc un fermé. 
De la même manière, le complémentaire d’une union finie de fermés est une intersection finie 


de complémentaires de fermés, et est donc ouvert ?. 


LEMooSFMZooBguLdf 
Lemme 7.7. 
Si F est fermé et si O est ouvert, alors F\O est fermé. 


Démonstration. Nous savons par le lemme 1.28 que (F\O)° = F°00O. Vu que F° et © sont ouverts, 
l’union est ouverte. Le complémentaire de F\O étant ouvert, il est fermé. 


Dans un espace topologique, nous avons une caractérisation très importante des ouverts. 
ThoPartieOUvpartouv 


Théorème 7.8. 
Une partie d’un espace topologique est ouverte si et seulement si elle contient un ouvert autour de 
chacun de ses éléments. 


Démonstration. Soit X un espace topologique et À € X. Le sens direct est évident : À lui-même 
est un ouvert autour de x € À, qui est inclus dans X. 

Pour le sens inverse, nous supposons que À contienne un ouvert autour de chacun de ses points. 
Pour chaque x € À, choisissons ©, € À un ouvert autour de x. Alors, 


ji U O, FR CRE) 


zE A 


en effet, d’une part, À € [],-1 Oz parce que chaque élément x de À est dans le O; correspondant, 
par construction ; et d’autre part, [J,-1 Ox € A parce que chacun des ©, est inclus dans À. 
Ainsi, À est égal à une union d’ouverts, cela prouve que À est un ouvert. 


Le lemme 7.222 est une version particulière de celui-ci, pour l’espace topologique R. Une autre 
application typique est la proposition 7.2 et le théorème 7.196. 


2. Un bon exercice est d'écrire ces unions et intersections, pour se convaincre que ça fonctionne. 
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7.1.4 Quelques exemples 


7.1.4.1 Une première vague 
DefTopologieGrossiere 


Exemple 7.9. 
Soit un ensemble quelconque X. L'ensemble de parties T = {, X} est une topologie sur X. 
La topologie ainsi définie sur X est appelée topologie grossière. A 


DefTopologieDiscrete 
Exemple 7.10. 
Pour un ensemble X quelconque, on considère l’ensemble T° constitué de toutes les parties de 
X. Avec cet ensemble, on confère à nouveau une structure d’espace topologique à X ; toutes les 
parties sont des ouverts, et aussi des fermés. La topologie ainsi posée sur X est appelée topologie 


discrète. A 
EXooLAOSooJt;jJnu 


Exemple 7.11 (Toutes les topologies d’un ensemble à 3 éléments). 
On pose X = {1,2,3}. Alors on peut munir X de 29 topologies différentes[187]:; saurez-vous les 
retrouver toutes ? A 


7.1.4.2 Topologie engendrée 
DefTopologieEngendree 


Proposition-Définition 7.12 (Topologie engendrée, prébase[188]). 
Soient un ensemble X, et To un ensemble de parties de X. Nous définissons T(To) comme étant 
l’union quelconque d’intersections finies d'éléments de To. 

Plus précisément, nous faisons les constructions suivantes : 


(1) Nous notons {O;}ier les éléments de To indexés par l’ensemble I. 
(2) Soit B(To) l’ensemble des intersections finies d'éléments de To : 
B(To) : { M Oj}y fini dans I (7.4) 
jeJ 
Où nous CONvENnoNns que Ne O=x*, 
(3) Soit À un ensemble qui indexe B(To) : 


B(To) — {Ba}acA- (7.5) 


(4) Nous posons 
T(T6) = { Ù] Ba} gear (7.6) 


aesS 
Alors : ITEMooTCGTooJwfpel 
(1) r(To) est une topologie sur X. ITEMooBJWVooEVRgdq 
(2) Toute topologie sur X contenant To contient T(To). 


La topologie T(To) est appelée la topologie engendrée par To. La partie To est appelée prébase 
de la topologie T(To). 


Démonstration. Pour (1), nous devons montrer les différents points de la définition 7.1 d’une 
topologie. 
(1) L'ensemble vide est dans r(7o) parce que @ = [Je Ba. L'ensemble X est également dans 
T(To) parce que X € B(To). 
(2) Soient {Di}er des éléments de 7(70) indexés par un ensemble L. Pour chaque { nous avons 
un ensemble S € À tel que D} = |) Bx. En posant $S = [J,, Si nous avons 


aesS 
UP: = [] Ba € (To). (7.7) 
EL aes 


Donc r(To) est stable par union quelconque. 


3. Bref, nous mettons X dans B(To). 
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(3) Soient D: et D2 des éléments de 7(70). Nous posons D; = |) B4. Alors nous avons 


as; 


U Ba _. U Bg _ U (Ba À Bg). FAR POSER 


a€sSi BES2 a, BES1 x S2 


Mais B, et B; sont dans B(T5). Donc B, n B3 € B(To). Donc (7.8) est une union d’éléments 
de B(To). 
Au final nous avons prouvé que 7(7) est une topologie sur X. 

Nous démontrons à présent le point (2). Soit une topologie u sur X contenant 7(76). Puisque 
est une topologie, les intersections finies d'éléments de y: sont dans 1, donc, en suivant les notations 
de 7.12, B(To) € L. 

Comme toutes les unions d'éléments de y sont dans w, l'inclusion de B(To) dans u implique 
celle de 7r(7o). 


Dès que nous avons une topologie, nous avons une notion de convergence de suite. 
DefXSnbhZX 


Définition 7.13 (Convergence de suite). 
Une suite (x») d'éléments de X converge vers un élément x de X si pour tout ouvert © contenant 
x , iexiste un K € N tel que k > K° implique x4 € ©. 

Nous disons alors que x est une limite de (xx). 


La proposition suivante montre que vérifier la convergence d’une suite sur une prébase suffit 


pour vérifier la convergence. 
PROPooJTJBooNtczsO 


Proposition 7.14. 
Soit To un ensemble de parties de l’ensemble X. Soient une suite (x,) dans X ainsi que x € X. 
Nous supposons que la suite (tn) satisfait la propriété suivante : pour tout À € To tel que x € À, 
il existe K € N tel que k > K implique xy € À. 

Alors nous avons la convergence de suite 


0 Gr) à (7.9) 


Démonstration. Nous considérons la topologie r(70) sur X. Soit un ouvert © contenant x. Nous 
le décomposons en suivant (à l’envers) la construction de la définition 7.12 : 


O= {JB (7.10) 


as 


avec B, € B(To). Donc pour chaque à, il existe un ensemble fini J, tel que 


Ba = () 4; (7.11) 


JE Ja 


avec À; € To. Puisque x € ©, nous avons un a tel que x € B,,,. Donc x € À; pour tous les j € J4. 
Pour chaque j € JD, il existe K; e IN tel que k > K; implique #4 € A;j. Comme J,,, est un 
ensemble fini, nous pouvons poser K — MAX je Ja) Kj: 
Maintenant, si k > K, nous avons x} € A; pour tout j, et donc x} € B4,. Par conséquent, 
Tk € ©. 


7.1.5 Topologie produit 


DefIINHooAAjTdY 
Proposition-Définition 7.15 (Produit d'espaces topologiques, thème 27). 
Soient {(X;,Ti)}i=1,..n des espaces topologiques. Nous posons 
nm 
X=]]x (7.12) 


i=1 


4. Définition 7.13. 
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el 
E K 
T={OC X tel que Vre U, AU; er, tel que x e Ui x... x U, « PY _ tr 


Alors (X,T) est un espace topologique. 
Cette topologie est la topologie produit. 


Dans le cas d'espaces normés, nous verrons dans le lemme 7.217 que la topologie produit est 
la même que celle obtenue par la norme produit. 


Proposition 7.16 (Convergence composante par composante). 
Soient des espaces topologiques X; (i = 1,...,n) et une suite (af, at) dans X1 X ... X Xn. 
Nous avons la convergence 


CR ne) (7.14) 
si et seulement si ai) — aÜ) pour chaque 1. 
Démonstration. En deux parties. 
(1) Sens direct Soient des ouverts ©; autour de a) dans X;. Puisque O1 x ... x O, est un 
ouvert autour de (al1),...,al")), il existe K € NN tel que si k > K nous avons (al), ne al) E 
O1 x... x Oh. Pour ce K nous avons séparément a) € ©; pour chaque 1. 


(2) Sens inverse Une prébase de la topologie sur X1 x...x X,, est donnée par les O1 x...xO» 
où O,; est un ouvert de X;. Voir la définition 7.15 de la topologie produit et la définition 7.12 
de ce qu'est une prébase. 


(1) (n) 


La proposition 7.14 nous permet de ne vérifier la convergence de (az ”,...,ax; ) que sur la 
prébase. Soit donc © = O1 x ... x On avec (al),...,al)) e ©. Puisque (a) zen — ab), 


pour chaque 2, il existe KX; € NN tel que si 4 > K; alors ai) E O;. 
En posant K = max;(K;), nous avons (a), 5 ,a)) € O1 x ...O, pour tout k& > K. 
La proposition 7.14 permet de conclure. 


7.1.6 Adhérence, fermeture, intérieur, point d’accumulation et point isolé 
DEFooSVWMooLpAVZRInt 


Définition 7.17. 
Soient un espace topologique X et une partie À de X. 


(1) Un point x € X est intérieur à À si il existe un ouvert O tel quex e O € À. 


(2) L'intérieur de À, notée Int(A), est l’union de tous les ouverts de X contenus dans À. 


Lemme 7.18. 
Quelques propriétés en vrac. ITEMooHLIMooJEacKt 


(1) L'intérieur de À est l’ensemble de tous les points intérieurs de A. ITEMooYTXSooMyiBpMgzK 


(2) Pour tout AC X, l’ensemble Int(A) est un ouvert. 
(3) On a Int(A) € À 


ITEMooYYFDooHgsRfV 


ITEMooTDXFooFdyLeU 
(4) Nous avons Int(A) = À si et seulement si À est un ouvert. 


Démonstration. En plusieurs morceaux. 


(1) (1) Siae Int(A), alors a est dans un ouvert contenu dans À, et donc a est un point intérieur 
à À. Dans l’autre sens, si a est un point intérieur à À, alors il existe un ouvert © € À contenant 
a. Puisque © est un ouvert dans À, nous avons © € Int(A), et en particulier a € Int(A). 


(2) (2) L'ensemble Int(A) est une union d’ouverts. 


(3) (3) L'ensemble Int(4) est une union d’ensembles contenus dans À. 
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(4) (4) Supposons que Int(A) = A. Puisque Int(A) est ouvert (point (3)), À est ouvert aussi. 


Dans l’autre sens, nous supposons que À est ouvert. Puisque À est un ouvert contenu dans 
À, nous avons À € Int(A). Mais comme Int(A) € À, nous avons l'égalité. 


7.1.6.1 Adhérence et fermeture 


Disons-le tout de suite : « adhérence » et « fermeture » sont synonymes. Dans le Frido, nous 
allons utiliser les notations Adh(A) et À de façon opportuniste. La notation Z définissant le com- 
plexe conjugué de z, si À est une partie de ©, il est plus sûr d’écrire Adh(A) pour la fermeture, 
plutôt que A. 

Au contraire, pour éviter une quantité excessive de parenthèses, nous écrirons B(a,r) pour la 


boule fermée. 
DEFooSVWMooLpAVZR 


Définition 7.19. 

Soient un espace topologique X et une partie À de X. Un point x € X est adhérent à À si tout 
ouvert de X contenant x a une intersection non vide avec À. L'ensemble des points d’adhérence 
de À est noté Adh(A) ou À. 


LEMooILNCooOUFZaTe 
Lemme 7.20. 
À propos d’adhérence. 
(1) L'’adhérence de À est l'intersection de tous les fermés de X contenant À. 
(2) Nous avons l'égalité 
Int(A)° = Adh(4°). (7.15) 


Démonstration. Commençons par prouver la dernière égalité d’ensembles. On a les équivalences 
entre les affirmations suivantes, pour tout x € X : 


— zx n'est pas dans Int(A); 

— il n’y à aucun ouvert contenant x et inclus dans À: 

— tout ouvert contenant x a une intersection non-vide avec À‘; 
— zx est dans Adh(4°). 


Nous allons à présent montrer l'égalité d’ensembles Int(A)° = Adh(A°) en prouvant la double 
inclusion. 


(1) Si Int(A)° € Adh(A°) Soit x € Int(A)°. Nous devons prouver que x € Adh(A4°). Soit un 
ouvert © contenant x. Vu que x n’est pas dans l’intérieur de À, l’ouvert © est pas inclus 
dans À, et donc © ñn A° est non vide. 


Nous avons montré que tout ouvert contenant x intersecte A°. Autrement dit : x e Adh(A°). 
(2) Adh(A°) € Int(A)° 

Soit x € Adh(A°). Tout ouvert contenant x intersecte A°, et ne peut donc pas être inclus 

dans À. Si aucun ouvert contenant x n’est inclus dans À, alors x n’est pas dans Int(A). 


RemAdhFerme 
Remarque 7.21. 
Comme corolaire du lemme 7.20, et grâce aux remarques faites pour les intérieurs, on obtient que 
pour AC X : 


(1) l’ensemble À est fermé : c’est en effet le complémentaire d’un ouvert, précisément l’intérieur 
de À‘; 

(2) À est fermé si et seulement si À = À : en effet, À est fermé si et seulement si A° est ouvert, si 
et seulement si l’intérieur de A° est À° lui-même ; or, l’intérieur de A° est le complémentaire 
de À par le lemme 7.20, si bien que À est fermé si et seulement si (A)° = A°, ou encore... ce 
qu'on affirmait au début. 
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DefEnsembleDense 
Définition 7.22. : 
Soit X un espace topologique. Un sous-ensemble À de X est dense dans X si À = X. 


7.1.6.2 Frontière 


Définition 7.23. 
Soit X un espace topologique, et A € X. La frontière de À, notée OA, est l’ensemble des points 
adhérents de À qui ne sont pas intérieurs à À. Ainsi, 


OA = Adh(A)\Int(4). (7.16) 


7.1.6.3 Topologie induite 
DefVLrgWDB 


Proposition-Définition 7.24 (Topologie induite[189]). 
Soit un espace topologique (X,Tx), et soit Y € X. Nous définissons 


Ty = {Y nO tel que OE rx}. (7.17) 


L'ensemble Ty est une topologie sur Y. 
Elle est la topologie induite. 
Démonstration. Il s’agit de vérifier les conditions de la définition 7.1. 
(1) Yery Parce que Y = X ñn Ÿ et que X est un ouvert de X. 
(2) GEerTy Parce que @ = Y n G et que @ est un ouvert de X. 


(3) Union quelconque Soient des ouverts À; de X. Nous avons 


UYnA=Yn(U4). EnooIUYRoOMEEE 


icl iel 


Comme les À; sont des ouverts de X, leur union est encore un ouvert de X. Donc (7.18) est 
encore dans Ty. 


(4) Intersection finie Nous avons 


f\Ynai=Yrn na). (7.19) 


iel icl 


LemBWSUooCCGvax 
Lemme 7.25 ([1|). 
Soit (X,Tx) un espace topologique et S € X, un fermé de X sur lequel nous considérons la topologie 
induite Ts. Si F est un fermé de (S,Ts) alors F est fermé de (X,Tx). 


Démonstration. Nous savons que F € $ et que le complémentaire de F dans S' est un ouvert 
de (S,Ts) : il existe un ouvert Q € 7x tel que S\F = S À (. Si maintenant nous considérons le 
complémentaire de F dans X nous avons 


F° = (S\F)U(X\S)= (8NnA)US = (SAN)U(SAN)USE = AUS. (7.20) 


Puisque Q et S° sont des ouverts de X, l’union est un ouvert. Donc Æ° € 7x et F'est un fermé de 
X. 


LemkUYkQt 
Lemme 7.26. L 
Si BC À alors la fermeture de B pour la topologie de A (induite de X) que nous noterons B est 


B=BnA (7.21) 


où B est la fermeture de B pour la topologie de X. 
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Démonstration. Si a e B n À, un ouvert de À autour de a est un ensemble de la forme © A À où 
O est un ouvert de X. Comme a € B, l'ensemble © intersecte B et donc (O n A) n B Z G. Donc 
a est bien dans l’adhérence ° de B au sens de la topologie de À. 

Pour l'inclusion inverse, soit a € B, montrons que a € B n A. Par définition a € À, parce que 
B est une fermeture dans l’espace topologique À. Il faut donc seulement montrer que a € B. Soit 
donc © un ouvert de X contenant a; par hypothèse © A À intersecte B (parce que tout ouvert de 
A contenant a intersecte B). Donc © intersecte B. Cela signifie que tout ouvert (de X) contenant 
a intersecte B, ou encore que a € B. 


Si À est un ouvert de X, on pourrait croire que la topologie induite n’a rien de spécial. Il 
est vrai que B sera ouvert dans À si et seulement si il est ouvert dans X, mais certaines choses 


surprenantes se produisent tout de même. 
LEMooIGQCoo0UrroHT 


Lemme 7.27. 


La partie Q dans R est d'intérieur vide, et sa fermeture est R. 
ExloeyoR 


Exemple 7.28. 
Prenons X = R et A = ]0,1[. Si B = ]4,1[, alors la fermeture de B dans À sera B = [},1[ et non 
[5,1] comme on l'aurait dans R. A 


Prendre la topologie induite de R vers un fermé de IR donne des boules un peu spéciales comme 


le montre l’exemple suivant. 
ExKYZwYxn 


Exemple 7.29. 
Quid de la boule ouverte B(1,e) dans le fermé [0,1]? Par définition c’est 


B(1,e) = {xe [0,1] tel que |x — 1] <e} = ]1—-Ee,1|. (7.22) 


Oui, c’est ouvert dans [0,1]. C’est d’ailleurs un des ouverts de la topologie induite de R sur [0,1]. 
Donc pour la topologie de [0,1], toutes les boules ouvertes B(x, à) avec x € [0,1] sont incluses 
dans [0,1]. Bref, vous pouvez écrire 


B(. 10) € [0,1], (7.23) 


mais vous avez intérêt à être très clair sur la topologie sous-entendue. AN 


7.1.6.4 Points d’accumulation et isolés 
DEFOooGHUUooZKTJRi 


Définition 7.30. 
Soient un espace topologique X et une partie À de X. Un point s € X est un point d’accumula- 
tion de A si tout ouvert de X contenant s contient au moins un élément de A\{s}. 


Quelle est la différence entre un point d’accumulation et un point d’adhérence ? La différence 
est que tous les points de À sont des points d’adhérence de À, parce que tout voisinage de a € À 
contient au moins a lui-même, alors que certains points de À peuvent ne pas être des points 
d’accumulation de À. Voir l'exemple 7.227. 

Notons qu’un point d’accumulation de À dans X n’est pas spécialement dans À. 

DEFooX10OWooWUKJhN 
Définition 7.31. 
Soient un espace topologique X et une partie À de X. Un point s € À est un point isolé de À si 
il existe un voisinage ouvert © de s dans X tel que An O = fs}. 


5. Définition 7.19. 
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7.1.7 Applications continues 
La définition suivante est la définition de la continuité dans tous les cas. 
DefOLNtrxB 
Définition 7.32 (Application continue[190]). 
Deux définitions : ITEMooXARPooNzsWLr 
(1) Soient une application f: X — Y entre les espaces topologiques X et Y et un point a € X. 
Nous disons que f est continue en a si pour tout ouvert W contenant f(a), il existe un 


voisinage V de a dans X tel que f(V)c W. ITEMooEHGWooDATTRV 


(2) Une fonction f: X — Y est continue sur X si pour tout ouvert © de Y, l’ensemble 
defFmi 1 
f (O)={xe X tel que f(x) € O} enr PS | 
est ouvert dans X. 
PROPooOUVKEooCkJmmO 
Proposition 7.33 ([1]). 


Une application f : X — Y entre deux espaces topologiques est continue sur X si et seulement si 
elle est continue en chacun des points de X. 


Démonstration. Dans les deux sens. 

(1) = Nous supposons que f: X — Ÿ est continue. Soit a € X. Si W est un ouvert contenant 
f(a), alors V = f-!(W) est un ouvert contenant a et vérifiant f(V) € W. 

(2) = Nous supposons que f: X — Y est continue en chaque point de X. Soit un ouvert © de 
Y. Pour a € f-!(O), la partie © est un ouvert contenant f(a). Donc il existe un ouvert VW, 
contenant a et tel que f(V,) € ©. 

Nous posons à présent V = [Je f-1(0) V.. C’est un ouvert comme union d’ouverts. Ensuite 


nous avons V = f-!(O). En effet d’une part nous avons f(V,) € ©, donc V, € f-!(O) pour 
tout ae X. Donc V € f-1(O). 


D'autre part, pour chaque a € f-!(O) nous avons a € V,, et donc f !(O)c V. 


LEMooYTLSooKhetml 
Lemme 7.34. 
Soient deux espaces topologiques X et Ÿ et une application f: X — Y. Soit une base de topologie 
{A;}hier de Y. Si f-!(A;) est ouvert dans X pour tout ie I alors f est continue. 


Exemple 7.35 ([1]). 
Un truc bien avec la définition 7.32(1) est que la continuité de f en un point est définie pour tout 
point du domaine; pas seulement les points d’accumulation. Soit par exemple une fonction simple 


f:{a —R 


a 4. 


(7.25) 


Si W est un ouvert de R contenant 4, nous avons l’ouvert V = {a} tel que f(V) € W. Donc f est 
continue au point 4. 
Mais f est également continue sur {4} en tant qu’espace topologique. En effet, si W est un 


ouvert de R, l’ensemble f-1(W) est soit @ soit {a}. Dans les deux cas c’est un ouvert. A 
LEMooATLRooEKnlro 


Lemme 7.36. 
Une application f: X — Y est continue si et seulement si pour tout fermés F de Y, la partie 
(EF) est fermée dans X. 


Démonstration. Supposons que f est continue. Si Fest fermé dans Ÿ, alors F° est ouvert et donc 
(CF) = f-1(F)S est ouvert. Donc f-1(F) est fermé. 

Dans l’autre sens, si © est ouvert dans Ÿ, alors f 1(O)° = f-1(O°) est fermé, de telle sorte 
que f-!(©) est ouvert. L'application f est alors continue. 
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7.1.7.1  Isomorphismes 
DEFooYPGQooMAObTO 


Définition 7.37 (Isomorphisme d'espaces topologiques). 
Un isomorphisme d'espaces topologiques est une application bijective continue® entre deux es- 
paces topologiques dont la réciproque est continue. On dit également homéomorphisme. 


Un isomorphisme d’un espace avec lui-même est un automorphisme. 
LEMooMJSHooUszteq 


Lemme 7.38 ([1]). 
Si f: X — Y est un homéomorphisme” et si F est fermé dans X, alors f(F') est fermé dans Y. 


Démonstration. Le complémentaire F° est ouverte. Vu que fl est continue, la partie f(F"°) est 
ouverte. Comme f est une bijection, nous avons f(F°) = f(F)°. D'où le fait que f(F)° est ouvert, 
et donc que f(F') est fermé. 


7.2 Topologie rendant continue 
PROPooGOEVooZBAOQh 
Proposition-Définition 7.39 (Topologie initiale[191]). 
Soient un ensemble X, des espaces topologiques (Y;,Ti)ier, et des applications gi: X — Y;. Nous 
notons 
À = {(i,ui) tel queie I,uw € Ti}. (7.26) 


Pour chaque T fini dans À, nous posons 


Pr = N pr (wi). (7.27) 
(i,w;)er 


Enfin nous posons 
=  (]J &r (7.28) 
L fini dans A 
Nous avons : 
(1) Tr est une topologie sur X. 
(2) Toutes les applications w; sont continues® pour cette topologie. 
(3) La topologie Tr est la plus faible topologie sur X pour laquelle toutes les w; sont continues. 


La topologie ainsi définie est souvent référée comme la plus petite topologie qui rend les appli- 
cations y; continues. Elle est aussi appelée topologie initiale des v:. 


La topologie quotient d’un espace topologique par une relation d'équivalence est définie comme 


la plus petite topologie rendant continue la projection. Voir la définition 7.44. 
LEMooVRGFooNgbwKu 


Lemme 7.40 ([191, 192]). 
Soient des espaces topologiques {(Ÿ;,Ti)}ier, et X, un ensemble. Pour chaque à nous considérons 
une base de topologie B; de T;. Nous considérons des applications wi: À — Yi. 

L'ensemble 


= LA Pa; (U5) tel queneN,a,...,anE€l,UrE si} (7.29) 
j=1 


est une base de la topologie initiale® des 4. 

PROPooUPJCooAIUXCW 
Proposition 7.41 ([1]). 
Soient un espace topologique (Y, Ty) et une application f: X — Y. Soient xo € X et yo = (yo). Si 


6. Application continue, définition 7.32. 
7. Définition 7.37. 

8. Application continue, définition 7.32. 
9. Proposition 7.39. 
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{B;}ier est une base de voisinages de y, alors {f-!(B;)}ier est une base de voisinages de 9 pour 
la topologie initiale \® de f. 


Démonstration. Soit un ouvert © autour de xo pour la topologie initiale de f. En adaptant le 
lemme 7.40 au cas d’une seule application, 


B = {f"!(U) tel que U € ry} (7.30) 
est une base de topologie sur X. Donc © est une union de la forme !! 
O= {JF (Ua) (7.31) 
a A 


avec U, € Ty. Soit à € À tel que +0 € f (U,). Nous avons y = f(x0) € Ua. Vu que U,, est un 
ouvert contenant Yo, et vu que {B;};er est une base de voisinages de Yo, nous avons un 1 € Î tel 
que 

Vo € B; Œ U,. (7.32) 


Donc nous avons aussi 


Fier Wed, (7.33) 


Donc tout voisinage de x contient un élément de {f-!(B;)};jer. Cela prouve que ce dernier est 
une base des voisinages de xo. 


LEMooADPLooYylNs;j 
Lemme 7.42 ([191)). 
Soient des espaces topologiques {(Y3,Ti)}ier, et X, un ensemble. Nous considérons des applications 
pi: À — Y; ainsi que T, la topologie minimale sur X telle que les applications y; soient continues. 
Soit une suite (x») dans X. Nous avons tn — x si et seulement si w;(xn) + w;(x) pour tout 
iel. 


Démonstration. Dans le sens direct, c’est seulement le fait que les 4; sont continues. 

Dans le sens réciproque, nous supposons que g@;(tn) —*+> (x) pour tout à et nous devons 
prouver que Tn —— TX. 

Soit un voisinage U de x. Vue la base de topologie donnée dans le lemme 7.40, il existe un J 
fini dans J ainsi que des ouverts {V;};ez tels que 


zeW=f\r; (V)eu (7.34) 
jEJ 


Par hypothèse, w;(1n) — gi(x). Mais V; est un ouvert qui contient w;(x). Donc il existe N; e N 
tel que 4;(xn) € V; pour tout n > N;. En posant !? N = max{N;};ey, nous avons que 4;(xn) € V; 
pour tout n > N et pour tout j € J. 


Dans ce cas nous avons aussi 4, € W € U. La convergence est prouvée. 


Proposition 7.43 ([191]). 
Soient des espaces topologiques (Ÿ;,T;), un ensemble X, et des applications w;: X — Y;. Nous 
considérons sur X la plus petite topologie rendant continues les oi. 

Soit un espace topologique Z. Une application d: Z — (X,T1) est continue si et seulement si 
les applications ÿ; o D: Z — Y; sont continues pour toutie I. 


Démonstration. Le sens direct est une simple composée de fonctions continues. Pour l’autre sens, 
nous supposons que les @; 0 4 sont continues, nous considérons Ü € T7 et nous devons montrer que 
#T(U) est un ouvert de Z. 


10. Définition 7.39. 

11. Définition 7.2(1). 

12. Notez l’utilisation du lemme 1.73 pour justifier que le maximum existe. 
13. Proposition 7.39. 
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En posant 
À = {(i,w) tel queie I,wEe ri}, (7.35) 


il existe un [ fini dans À tel que 


U= [) y; (uw). (7.36) 


(i,w)er 


Nous avons donc 
dU)= [) (por t)(wi). (7.37) 
(i,w;)er 


Vu que Yo! est continue, chacun des (4 o w; !)(w) est ouvert. Donc #1 (U) est ouvert comme 


intersection finie d’ouverts. 


7.2.1 Topologie quotient 
DEFooHWSYooZZLXQU 


Définition 7.44 ([193]). 
Soit un espace topologique X ainsi qu’une relation d'équivalence — sur X. La topologie quotient 
sur l’ensemble X/ —< est la plus petite topologie qui rend continue * la projection canonique p: X — 
X/=. 

PROPooDRPLooOUNCwYs 
Proposition 7.45. 
Soit un espace topologique X muni d’une relation d'équivalence —. Une partie O € X/ = est 
ouverte! si et seulement si p1(O) est ouverte dans X. 

PROPooYKLBooQuanfA 


Proposition 7.46 ([193]). 
Soient des espaces topologiques X et Y ainsi qu'une relation d'équivalence — sur X. Soîit la pro- 
jection canonique p: X — X/ —. Une application f: X/ -— Y est continue si et seulement si 


l'application composée f o p: X — Y est continue. 
DEFooBXGJooUBQaNw 


Définition 7.47 (Passage d’une application aux classes). 
Soient deux ensembles X et E ainsi qu’une relation d'équivalence < sur X. Nous disons qu'une 
application f: À — E passe aux classes si f est constante sur chaque classe d'équivalence de 
X. Dans ce cas nous considérons l'application quotient 


PRES (7.38) 
[rl f(x). 
LEMooKTINooKDjNex 
Lemme 7.48 ([194)). 
Soient deux espaces topologiques X et Y. Soit une relation d'équivalence — sur X. Nous considérons 
une application continue $ f: X — Y capable de descendre aux classes !T. Alors l'application 
quotient f: X/-—7Y est continue. 


Démonstration. Nous considérons la projection canonique p: X — X/ =. Soit un ouvert © dans 
Y. La partie f-1(O) sera ouverte si p_1(f"1(O)) est ouverte (proposition 7.45). Nous avons 


pr" (f (0) = (for) ‘(O). (7.39) 
Mais fop= f parce que (fo p)(x) = f([x]) = f(x). Donc 
p "(F7 (0)) = (op) ‘(O) = f'(O) (7.40) 


qui est ouvert parce que f est continue. 


14. Définition 7.39. 

15. La topologie est définie en 7.44. 
16. Définition 7.32. 

17. Voir la définition 7.47. 


7.3. SUITES ET CONVERGENCE 493 


Lemme 7.49 ([194)). 
Soient deux espaces topologiques X et Y ainsi qu’une relation d'équivalence — sur X. Nous consi- 
dérons une application continue g: X/ -— Y. Alors 


(1) L'application go p est continue. 

(2) Si nous posons f = go p, alors f descend aux classes et Î = 9. 
Démonstration. La projection p est toujours continue par définition de la topologie quotient. Donc 
g © p est continue par composition d'applications continues. 


Voyons que f descend aux classes. Si x + y, alors p(x) = p(y) et donc f(x) = f(y). En ce qui 
concerne l’application f, nous avons 


f(L]) = (go p)(x) = g(Ixl), (7.41) 


donc f = g et le lemme est démontré. 


7.3 Suites et convergence 


7.50. 

À propos de notations. La pire notation possible pour une suite est (a,),. Mais que vient faire le 
second indice n ? Il peut être raisonnable d'écrire (a»)er lorsqu'on veut dire dans quel ensemble 
se déplace n. Si nous parlons de suite, il faut une sérieuse raison de prendre autre chose que IN 
comme ensemble d’indices. 

Une suite étant une fonction, de la même façon qu’on ne devrait pas dire « la fonction f(x) », 
mais « la fonction f » ou « la fonction x + f(x) », nous devrions simplement écrire a pour désigner 
la suite dont les éléments sont a. 

Par conséquent, il est parfaitement légal, et même conseillé, d'écrire « a + b » pour la somme 
des suites a et b. Et il est tout aussi légal d'écrire « lim a » au lieu de limy_,+ an. 

Le hic est que nous écrivons souvent x la limite de la suite n + r,. Dans ce cas, nous sommes 
évidemment obligé d'écrire l’indice n pour parler de la suite. 

Tout cela pour dire qu’il faut être souple avec les notations. 


7.3.1 Convergence dans un fermé 
PROPooBBNSooCjrtRb 


Proposition 7.51 ([1]). 
Une suite contenue dans un fermé ne peut converger © que vers un élément de ce fermé. 


Démonstration. Soient un espace topologique X et un fermé F dans X. Nous supposons que la 
suite (xx) soit contenue dans F. Nous allons prouver qu'aucun élément de F° ne peut être limite. 

Soit a € FE", Puisque le complémentaire de F' est un ouvert, et d’après le théorème 7.8, il existe 
un ouvert ©, contenant a, et contenu dans F°. Le voisinage ©, de a ne contient donc aucun 
élément de la suite (x), qui ne peut donc pas converger vers a. 


CorLimAbarA 
Corolaire 7.52. 
Soit À un sous-ensemble d’un espace topologique X. Toute suite d'éléments de À qui converge, 
admet pour limite un élément de Adh(A). 


Démonstration. Une fois la suite (x,) fixée, il suffit de remarquer que tous les x, sont dans Adh(A), 
et puis d'appliquer la proposition 7.51. 


LemPESaiVw 
Lemme 7.53. 
Soit AC X muni de la topologie induite de X et (x) une suite dans A. Si (x,) converge vers un 
élément x dans À, alors elle converge aussi vers x dans X. 


Démonstration. Soit © un ouvert autour de x dans X. Alors À N © est un ouvert autour de x 
dans À et il existe N € N tel que si n > N, alors 3, €E An OC OO. 


18. Définition 7.13. 
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7.3.2 Pour des limites uniques : séparabilité 


Notons que l’on a parlé d’une limite de suite jusqu’à présent : en effet, si il existe deux éléments 
distincts x et y tels que tout ouvert contenant x contient y, alors la définition 7.13 dit que toute 


suite convergeant vers y converge aussi vers ï... 
EXooSHKAooZQEVLB 


Exemple 7.54. 
Oui, il y a moyen de converger vers plusieurs points distincts si l’espace n’est pas super cool. Nous 
pouvons par exemple [195] considérer la droite réelle munie de sa topologie usuelle et y ajouter 
un point 0’ (qui clone le réel 0) dont les voisinages sont les voisinages de O0 dans lesquels nous 
remplaçons 0 par 0’. Dans cet espace, la suite (1/n) converge à la fois vers 0 et 0”. 

En fait, on « voit » le problème : on ne peut pas distinguer d’un point de vue topologique le 0 
et le 0’. A 


Nous posons la définition suivante, qui nous permettra de donner une assez grande classe 


d'espaces topologiques dans lesquels nous avons unicité de la limite !. 
DefYFmfjjm 


Définition 7.55 (Espace topologique Hausdorff). 
Si deux points distincts admettent toujours deux voisinages disjoints ?, nous disons que l’espace 
est séparé ou de Hausdorff. 


Attention, cette notion est à ne pas confondre avec : 
DefUADooqilFK 


Définition 7.56 (Espace topologique séparable). 
22 


Un espace topologique est séparable si il possède une partie dénombrable®! dense ??. 
PropUniciteLimitePourSuites 


Proposition 7.57. 
Dans un espace topologique séparé, si une suite converge, alors sa limite est unique. 


Démonstration. Supposons que la suite (xx) converge vers deux éléments distincts x et y. L'espace 
étant séparé, il existe deux ouverts O, et O,, disjoints, contenant respectivement x et y. La suite 
convergeant à la fois vers x et y, il existe k, et k,, tels que, si k > max{k,,k,}, l'élément xy 
est (à la fois) dans ©, et ©,. Cela est en contradiction avec le fait que ces deux ensembles sont 
disjoints. 


7.58. 
Donc, on pourra parler, avec des espaces séparés, de « la limite d’une suite ». On notera zh — a, 


ou limy-,0 Zn = &, pour signifier que la suite (x,) converge vers a. 
LEMooMDTNooTh1HJ1 


Lemme 7.59 ([1]). 
Soit a Æ 0 dans un espace vectoriel topologique 25 Hausdorff”*. Il existe un voisinage V de 0 tel 
que a € V. 


Démonstration. Étant donné que l’espace topologique est Hausdorff, nous pouvons considérer des 

voisinages V de 0 et W de a tels que Vr W = G. 
Dans ce cas nous avons a # V (voir la définition 7.19 de la fermeture de V). 
PROPooNRRTooCPesg0 


Proposition 7.60 ([1]). 
La convergence de suite pour la topologie de l’espace produit? est équivalente à la convergence des 
suites « composante par composante ». 


19. Voir la proposition 7.105. 
20. Définition 1.5. 

21. Définition 1.125. 

22. Définition 7.22. 

23. Définition 7.161. 

24. Définition 7.55 

25. Définition 7.15. 
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Démonstration. En deux parties 


(1) Sens direct Pour simplifier les notations, nous allons considérer le produit de deux espaces. 


Soit donc (xy,yx) S (x, y) et des ouverts O1 dans X autour de x et O2 autour de y dans 
Y. 


La partie O1 x O2 est ouverte dans X x Y. Donc il existe K tel que k4 > K implique 
(tr, Ur) € O1 X On. 

Nous avons prouvé que pour tout ouvert O1 autour de x il existe K tel que k > K implique 
x € O1. Donc x4 À, x. Idem pour y. 


(2) Dans l’autre sens Nous considérons l’espace produit 25 X = IL, À: Nous supposons 


: : ; X; 
pour chaque À, avoir une suite convergente (x); = x. 


Nous allons prouver que 


((æi)e..., (&n)e) À (m1, ,Œn). (7.42) 


Soit un ouvert © de X autour de (x1,...,æ,). Nous considérons des ouverts U; de X,; tels 
que x; EU; et Ui x... Un € ©. 


Vu que (x) ES? x, il existe K; € NN tel que k > K; implique (x;)x € Ui. Si k > max;{Ki}, 
alors (x;)x € U; pour tout à et nous avons 


(Css Qnx) Eh Rise X De O: (7.43) 


LEMooSJKMooKSiEGq 
Lemme 7.61 ([1|). 
Soit un espace topologique X. Soient dans X une suite (x,) et un élément x tels que toute sous-suite 
de (xn) contient une sous-suite convergente vers x. Alors &n — x. 


Démonstration. Supposons que (x,) ne converge pas vers x. Il existe alors un ouvert © autour de 
x tel que pour tout N > 0, il existe n > N tel que x, n’est pas dans ©. 

Cela nous permet de construire une sous-suite de (x,) composée d'éléments hors de ©. Aucune 
sous-suite de cette sous-suite ne peut converger vers x. 


7.3.3 Fonctions équivalentes 
DEFooWDSAooKXZsZY 


Proposition-Définition 7.62 ([196]). 
Soit un espace topologique X et D € X. Soient encore des fonctions f,g: D — © et un point 
ae Adh(D)??. 

Nous définissons sur Fun(D,C) la relation f — g lorsque qu'il existe un voisinage V de a dans 
X et une fonction a: V — R telles que 


(Lee Gr) = 0 
(2) pour tout x € (V n D)\{a}, 


M 


Fa (1 + a(x))g(x). 


Cette relation est une relation d'équivalence. 
Lorsque f — g, nous disons que f et g sont équivalentes en a. 


Démonstration. Nous devons prouver les trois conditions de la définition 1.31 de relation d’équi- 
valence. 


(1) Réflexive Il suffit de poser a(x) = 0. 


26. Pour les notations, ça va être le sport : (x;)x désigne une suite dans X;, mais æ; désigne la limite de cette suite. 
27. Adhérence ou fermeture, c’est la même chose. Voir la définition 7.19 et le lemme 7.20. 
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(2) Symétrique Si f — 9, il existe une fonction a vérifiant ce qu’il faut telle que 
f(x) = (1+a(x))g(x). (7.45) 


Comme lim,_,4 a(æ) = 0, il y a un voisinage de a sur lequel |a(x)| < 1 ; il n’y a donc pas de 
problème de dénominateur en écrivant 
1 


g(x) 


Nous posons alors B(x) = —a(x)/(1 + a(x)). Cela vérifie 


g(x) = (1 + B(x)) f(x). (7.47) 
Et 
lim 8x) = 0 (7.48) 


parce que limsa (1 + @(x)) = 1 et lims_,a —a(x) = 0. 


(3) Transitive Soit f - get g — h. Sur un voisinage V de a nous avons 


f(x) = (1+a(x))g(x), (7.49) 

sur un voisinage W de a nous avons 
g(x) = (1+B(x))h(x). (7.50) 

Sur le voisinage V n W nous avons 
f(x) = (1 + 8(x) + a(x) + (a8)(x))h(x). (7.51) 


Donc la fonction (x) = B(x) + a(x) + (aB)(x) fait l’affaire. 


Notons que la notion d'équivalence de fonctions, de même que la notion de limite, ne dépend 
pas des valeurs exactes atteintes par les fonctions au point. 


Lemme 7.63. 
Si f et g sont équivalentes en a, et si g ne s’annule pas sur un voisinage de a, alors pour tout 
e > 0, il existe r tel que 


—— € B(1,e) (7.52) 
pour tout x € B(a,r). 


Démonstration. Nous considérons un voisinage V de a sur lequel en même temps : 
— la fonction a de la définition d'équivalence est définie, 
— |a(x)| < € pour tout x € V, 
— g(x) # 0, pour tout x € V. 


Ensuite nous considérons r > 0 tel que B(a,r) € V. En divisant la condition (7.44) par g(x) nous 
trouvons 


54) 1 + a(x). (7.53) 
Donc JU) 
Qe) — 1| = a(x)| <e, (7.54) 


ce qu’il fallait prouver. 
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7.4 Connexité 


L'idée de la connexité, c’est de s’assurer qu’un ensemble est « d’un seul tenant ». 
DefIRKNooJJImiD 


Définition 7.64. 
Lorsque X est un espace topologique, nous disons qu’un sous-ensemble À est non connexe quand 
on peut trouver des ouverts O1 et O2 disjoints tels que 


A= (A nOdu(A AO. Éqpernge 


et tels que An O1 £ D, et An Où £ D. Si un sous-ensemble n’est pas non-connexe, alors on dit 
qu'il est connexe. 


Une autre façon d'exprimer la condition (7.55) est de dire que À n’est pas connexe quand il est 


contenu dans la réunion de deux ouverts disjoints qui intersectent tous les deux À. 
LEMooKXHQooAÿVQsT 


Lemme 7.65 ([1]). 
Si C'est un connexe de l’espace topologique X, alors C' muni de la topologie induite de X est 


CcOnneExE. 
PROPooBCFXooR1lMvch 


Proposition 7.66 ([197]). 
Soit un espace topologique X. Soient (Ci)ier des connexes de X tels que ),., Ci Æ ©. Alors (7 Ci 
est connexe. 


Démonstration. Nous notons C = J;-7 Ci. Soient des ouverts disjoints À et B recouvrant C. Nous 
devons démontrer que soit À n C'soit B n C'est vide. 

Nous notons À; = C; n À et B; = Ci n B. Les parties À; et B; recouvrent C; et nous avons 
À; LU B; = Ci. Le lemme 7.65 nous dit que C; est connexe pour la topologie induite de X ; or dans 
cette topologie, les parties À; et B; sont ouvertes. Nous en déduisons que soit 4; soit B; est vide. 
Mais lequel ? 

Par hypothèse, [7 
x € À; pour tout À; soit x € B et alors x € B; pour tout i. 

Dans le premier cas, x € À; pour tout à, de telle sorte que B; = @ pour tout à. Nous avons 
alors 


C; est non vide. Soit x un élément de cette intersection. Soit x € À et alors 


D=(JB-{JCinB)-B°cC. (7.56) 


iecl iel 


Dans le second cas nous obtenons de même que An C = G. 


DEFOoFHXNooJGUPPn 
Proposition-Définition 7.67 ([198]). 
Soient un espace topologique X et un point x € X. ITEMooBZAQooNwuzaS 


(1) La réunion de toutes les parties connexes de X contenant x est connexe. 
(2) Cette réunion est la plus grande (au sens de la relation d’inclusion) de toutes les parties 
connexes de X contenant x. 


La réunion de toutes les parties connexes de X contenant x est nommée composante connexe 
de x dans X. 


Démonstration. La réunion de toutes les parties connexes contenant x est connexe par la proposi- 
tion 7.66. 

Nous notons C la réunion de toutes les parties connexes contenant x. Si D est un connexe 
contenant x, alors D € C' parce que C’ est une union de tous les connexes, y compris D. 


PropHSjJcIir 
Proposition 7.68 ([1]). 
Soit X un espace topologique. Les conditions suivantes sont équivalentes. ITEMooXHIKooGgrgTs 
2 
(1) L'espace X est connete. ITEMooRTNPooADKVnw 


(2) Si X = Où LU O2 avec Où et O2 des ouverts disjoints, alors soit O1 = @ soit Où = @. 
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ITEMoo0EZYooFBNa0OZ 
(3) Si X = Fi 0 F3 avec Fi et F fermés disjoints dans X, alors F1 = D 04m N£bzootDPnEf 


(4) Si AC X avec À ouvert et fermé en même temps, alors À = @ ou A = X. 


Démonstration. En quatre parties. 


(1) (1) implique (2) Par rapport à la définition 7.64, nous prenons la partie X de l’espace X. 
Supposons que À et O2 sont tout deux non vides. Dans ce cas nous avons 


X=O0UO2=(OnX)LU(OnX), (F.57) 


ce qui prouverait que X est non connexe. Contradiction. Un des O,; est vide. 

(2) (2) implique (3) Soit une union disjointe de fermés X = F1 U F2. Puisque l’union est 
disjointe, nous avons F = X\F2 et F2 = X\F, ce qui fait que F1 et F2 sont également 
ouverts. Nous en déduisons que X = F L F2 est une union disjointe d’ouverts. L'hypothèse 
indique que Fi = G ou F2 = D. 

(3) (3) implique (4) Soit À une partie ouverte et fermée de X. Nous supposons que À est 
ouvert et fermé, donc X\A est également ouvert et fermé : c’est la définition 7.3 d’un fermé. 
Nous avons évidemment l'union X = À LU (X\A) qui est une union disjointe de fermés. Par 
hypothèse nous avons soit À = @ soit X\A = G. 


(4) (4) implique (1) Supposons que X ne soit pas connexe. Il existe donc des ouverts disjoints 


Où et O tels que X = O3 LO2. Étant donné que O1 = X\Ob, la partie O1 est fermée comme 
complémentaire d’ouvert. Donc O: est fermé et ouvert (et O2 aussi d’ailleurs). Par hypothèse 
nous concluons que O; est soit X soit @. 


Nous verrons plus tard (proposition 7.207) une autre caractérisation de la connexité basée sur 


la continuité des fonctions X — Z. 
PROPooSCKNooRbewdv 


Proposition 7.69 ([1]). 
Soient un espace topologique X ainsi que S & X. SiU & X est connexe À et sU € S CU, alors 
S' est connete. 


Démonstration. Supposons que S ne soit pas connexe. Il existe des ouverts disjoints À et B tels 
que SC AUBet ShAZG,SnB £ G. Nous prouvons que ces ouverts fonctionnent aussi pour 
prouver que U est non connexe (donc on aura une contradiction). 

D'abord À et B recouvrent ÜU parce que U € $S € AU B. Ensuite prouvons que U n À £ @. 
Soit re Sn A. Vu que x e $S & U, tout voisinage de x intersecte U (c'est la définition 7.19 de 
l’adhérence). De plus x € À et À est ouvert. Soit donc un voisinage V de x contenu dans À. Nous 
avons VE Aet VAU Æ G. Donc ANUÛU £ @. 


Le même raisonnement tient pour B. 


PropIWIDzzH 
Proposition 7.70. 
Stabilité de la connexité par union. ITEMooL.VSSooTGstBz 


(1) Une union quelconque de connexes ayant une intersection non vide est connexe. 


(2) Pour tout ne N,n > 0, si A1,..., A, sont des connexes de X avec A; N A;}1 # ©, alors 
l’union (J;_, Ai est connexe. 


Démonstration. Point par point. 

(1) Soient {Ci}ier un ensemble de connexes et un point p dans l'intersection : p € (7 Ci. 
Supposons que l’union ne soit pas connexe. Alors nous considérons À et B, deux ouverts 
disjoints recouvrant tous les C; et ayant chacun une intersection non vide avec l’union. 
Supposons pour fixer les idées que p € À et prenons ze Bn) 
que x € C;. Avec tout cela nous avons 


Ci. Il existe un j € Î tel 


iel 


28. Définition 7.64. 
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(la) C; € AU B parce que À U B recouvre tous les C;, 
(1b) C; n À £ S parce que p est dans l’intersection, 

(ic) Cjn B 4 © parce que x est dans cette intersection. 
Cela contredit le fait que C'; soit connexe. 


(2) Pour la seconde partie nous procédons de proche en proche ?”. D'abord A1 U A2 est connexe 
par la première partie, ensuite (A1 L A2) L A3 est connexe parce que les connexes A; LU A2 
et À3 ont un point d’intersection par hypothèse, et ainsi de suite. 


PROPooCZJGooR1lyEOV 
Proposition 7.71 ([199)). 


Soit un espace topologique X. Nous avons équivalence entre les points suivants : 
(1) X est localement convexe. 
(2) Pour tout ouvert U de X, les composantes connexes de U sont des ouverts de X. 


(3) Les ouverts connexes forment une base des ouverts de E. 
LEMooWGOCooHSoCzb 
Lemme 7.72 ([200)). 


Soit un espace topologique localement connexe X. Soient un fermé F de X, et D, une composante 
connexe de X\F. Alors la frontière de D est dans F : 


eDcF. (7.58) 


Démonstration. En plusieurs parties. 
(1) 0D est fermé Par définition, 0D = D\D. Utilisant 1.28(3) nous écrivons 


X\0D = (X\D)n D. (7.59) 
Vu que D est fermé, X\D est ouvert. De plus D est ouvert par la proposition 7.71. Donc 
X\0D est ouvert. 


(2) Par l’absurde Supposons qu'il existe p € 0D\F. Vu que F est fermé, il existe r > 0 tel 
que B(p,r) nr F = @. Etant donné que p € 0D, tout voisinage de p contient un point de D : 
il existe x € B(p,r) n D. 


Donc B(p,r) et D sont des ouverts connexes qui ont une intersection non vide. La proposition 
7.70 nous indique que D L B(p,r) est un ouvert connexe strictement plus grand que D. 
Cela contredit la maximalité de D en tant que composante connexe. 


7.5 Compacité 


La compacité est le thème 32. 


7.5.1 Définition et notions connexes 


Soit Æ, un sous-ensemble de R. Nous pouvons considérer les ouverts suivants : 


O.= B{s,i) (7.60) 
pour chaque x € E. Évidemment, 
Ec (JO. (7.61) 
xeE 


Cette union contient en général de nombreuses redondances. Si par exemple E = [—10,10|], l’élé- 
ment 3 € E est contenu dans O35, O2 7 et bien d’autres. Pire : même si on enlève par exemple O2 
de la liste des ouverts, l’union de ce qui reste continue à être tout Æ£. La question est : est-ce qu’on 
peut en enlever suffisamment pour qu'il n’en reste qu’un nombre fini ? 


29. Parce qu’on a la flemme de rédiger correctement une récurrence. 


500 CHAPITRE 7. TOPOLOGIE GÉNÉRALE 


Définition 7.78. 
Soit E, un sous-ensemble de R. Une collection d’ouverts O; est un recouvrement de E si E € 


U; Oi- 


Définition 7.74. 

Une partie À d’un espace topologique est compacte si elle vérifie la propriété de Borel-Lebesgue : 
pour tout recouvrement de À par des ouverts (c’est-à-dire une collection d’ouverts dont la réunion 
contient À) on peut extraire un recouvrement fini. 


DefJJVsEqs 


Remarque 7.75. 
Certaines sources (dont wikipédia) disent que pour être compact il faut aussi être séparé *°. Pour ces 
sources, un espace qui ne vérifie que la propriété de Borel-Lebesgue est alors dit quasi-compact. 


7.76. 
La définition 7.74 en cache deux. En effet, si la partie À est l’espace topologique lui-même, cela 
définit un espace topologique compact. Un espace topologique est compact en soi lorsque de tout 
recouvrement par des ouverts, nous pouvons extraire un sous-recouvrement fini. Dans ce cas, si X 
est l’espace et si {A;};er est le recouvrement, nous avons X = [J;, À; et non une simple inclusion 
Xe Be, Ai. 

LEMooNNHYoo1TNbyz 
Lemme 7.77. 


Si a,beR, alors la partie [a,b] est compacte*! dans R. 
LEMooVYTRooKTIYdn 


Lemme 7.78. 
Si K est une partie compacte de l’espace topologique X, alors K est un espace topologique compact 
pour la topologie induite? de X. 


Démonstration. Nous notons 7 la topologie de X et 7x la topologie induite de X vers K, c’est-à- 
dire 
Txk = {On K'telqueOEer)}. (7.62) 


Soient des ouverts À; € TK (i € I où 1 est un ensemble quelconque) tels que UJ, 4; = K. Pour 
chaque à € I, il existe un ©; € 7 tel que À; = K n O;. Nous avons 


K=|JKnoi)e{Jo:. (7.63) 


iel icl 


Donc les ©; forment un recouvrement de K par des ouverts de X. Puisque K est une partie 
compacte de X, il existe un sous-ensemble fini J de 1 tel que 


Ke{]Jo;. (7.64) 
jEJ 
Nous avons donc aussi 
Kc{[JKno;={J4; (7.65) 
jeJ jeJ 


Nous avons prouvé que {A;};ey est un recouvrement fini de À par des ouverts de À. Donc K est 


un espace topologique compact. 


PROPooUXKSooEDzCRZ 
Proposition 7.79 ([201]). 
Soit K compact dans €. Si © est une composante connexe de C\K, alors 00 © K. 


30. Définition 7.55. 
31. Définition 7.74. 
32. Définition 7.24. 
33. Définition 7.67. 
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Démonstration. Supposons que 00 n’est pas inclus dans K, et considérons w € 00\K. Nous posons 
A = OÙ {w}. Vu que w € 00, nous avons w € ©. Donc 


DeAe oO, (7.66) 


La proposition 7.69 fait que À est connexe parce que © est connexe. Donc À est un connexe 
de C\ÆX contenant strictement ©. Impossible parce que © est une composante connexe de C\K. 
Contradiction. 

Nous en déduisons que 00 € K. 


7.5.2 Espace localement compact 
DEFooBODRooEFhzeT 


Définition 7.80. 


Une partie d’un espace topologique est relativement compact si sa fermeture est compacte. 
DefEIBYooAWoESf 


Définition 7.81. 


Un espace topologique est localement compact si tout élément possède un voisinage compact. 
LEMooAXESooYvyesg 


Lemme 7.82. 
Si X est un espace topologique localement compact et si K est compact dans X, il existe un ouvert 


V tel que KE V et V est compact. 
LEMooKYMKooPxZjWN 


Lemme 7.83. 
Soient un espace localement compact X, un compact K et un ouvert © tel que K € ©. Il existe 
un ouvert relativement compact V tel que 


Feveveo: (7.67) 


7.5.3 Autres compacité 
DEFO0oTVDOooZbwOFK 


Définition 7.84 (Séquentiellement compact). 
Nous disons qu’un espace topologique est séquentiellement compact si toute suite admet une 


sous-suite convergente. 
DefFCGBooLpnSAK 


Définition 7.85. 
Un espace topologique est dénombrable à l'infini si il est réunion dénombrable de compacts. 


Définition 7.86. 
Une famille À de parties de X a la propriété d’intersection finie non vide si tout sous- 
ensemble fini de À a une intersection non vide. 
PropXKUMiC;j 
Proposition 7.87. 
Soient X un espace topologique et K € X. Les propriétés suivantes sont équivalentes£ omxymCHFai 
(1) K est compact. 


(2) Si{Fi}hier est une famille de fermés telle que (\ 
non vide À de I tel que (V1 Fin K =. TtenXYnCHFaiii 


(3) Si{Fiier est une famille de fermés telle que pour tout choix de A fini dans I, (14 FN K # 
S, alors l'intersection complète est non vide : (5 FN K #4 @. 


ItemXYmGHFaii 


ser TiNK = @, alors il existe une partie finie 


ItemXYmGHFaiv 
(4) Toute famille de fermés de X, à laquelle K est joint, et qui a la propriété d’intersection finie 
non vide, a une intersection non vide. 


Démonstration. Les propriétés (3) et (2) sont équivalentes par contraposition. De plus le point (4) 
est une simple ** reformulation en français de la propriété (3). 


34. Enfin, simple. .… il faut remarquer que dans la formulation de (4), les intersections peuvent ne pas faire intervenir 
K, mais, au final, on s’en moque. 
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Prouvons (1) = (2). Soit {Fi}ier une famille de fermés tels que Kf,,F; = @. Les com- 
plémentaires ©; de F; dans X recouvrent K et donc on peut en extraire un sous-recouvrement 
fini : 

Ke|]Jo: (7.68) 
ic A 


pour un certain sous-ensemble fini À de /. Pour ce même choix À, nous avons alors aussi 


NFrKk-=@. (7.69) 


ie À 


L'implication (2) = (1) est la même histoire de passage aux complémentaires. 


Le théorème 7.284 est en général celui qu’on nomme « théorème des fermés emboîtés », mais 


le corolaire suivant en mériterait également le nom. 
CORooQABLooMPSUBf 


Corolaire 7.88 ([1]). 
Soient un espace topologique compact X et une suite (F;);ex de fermés emboîtés** dans X telle 
que 


(lee (7.70) 


ieN 


Alors il existe jo € N tel que F; = @ pour tout i > jo. 


Démonstration. La proposition 7.87 nous dit qu’il existe une partie finie non vide J de N telle que 
Üjes F; = G. Si jo = min(J), alors F; € F;, pour tout j e J et nous avons 


G=f|A=E; (7.71) 


jeJ 


Dès que F;, = @, tous les suivants sont également vides. 


7.5.4 Quelques propriétés 
LemOWVooZKndbI 


Lemme 7.89. 
Une partie K d’un espace topologique est compacte si et seulement si de tout recouvrement par des 
ouverts d’une base de topologie nous pouvons extraire un sous-recouvrement fini. 


Remarquons que la partie qui est réellement à prouver est que, si & ça marche » pour des 
ouverts d’une base de topologie, alors «& ça marche » pour tous types d’ouverts. 


Démonstration. Soit K une partie d’un espace topologique et {O;};er un recouvrement de Æ par 
des ouverts. Chacun des O; est une union d’éléments de la base de topologie par la proposition 7.2 : 
disons Oi = [ie Ain Soit J = {5 = (à, ji)li € Z, j: € Ji}; alors nous obtenons [Je 7 À; = Uier Où. 

Par hypothèse nous pouvons extraire un ensemble fini Jo € J tel que K € |) LE À: Par 
construction chacun des À; est inclus dans (au moins) un des O;. Le choix d’un élément de 7 pour 
chacun des éléments de J donne une partie finie 16 de I telle que K € Ur, Aj € Üier, Oi. 


Exemple 7.90 (Un compact non fermé). 

En général, un compact n’est pas toujours fermé. Si nous prenons par exemple un ensemble X de 
plus de deux points muni de la topologie grossière {@, X}. Toutes les parties de cet espace sont 
compactes, mais les seuls fermés sont {Z,X}. Toutes les autres parties sont alors compactes et 


non fermées. A 
LemnAeACf 


Lemme 7.91 (Compacts et fermés[202]). 
À propos de parties fermées dans un compact. ITEMooNKAKooQoNdar 


(1) Une partie fermée d’un compact est compacte. 


35. C'est-à-dire que F541 € Fi. 
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ITEMooAZWVooLyPDeY 
(2) Tout compact d’un espace topologique séparé est fermé. 


Démonstration. En deux parties. 


(1) Pour (1) Soient F fermé dans un compact K et {O;};er un recouvrement de F par des 
ouverts. Puisque F est fermé, F° est ouvert et {O;}jer L {K\F} est un recouvrement de K 
par des ouverts. Si nous en extrayons un sous-recouvrement fini, c'est un recouvrement de 
F, et en supprimant éventuellement l’ouvert K\F', ça reste un sous-recouvrement fini de F 
tout en étant extrait de {O;}ier. 


(2) Pour (2) Soient X un espace séparé et K compact dans X. Nous considérons y € K° et, 
par hypothèse de séparation, pour chaque x € K nous considérons un voisinage ouvert V, de 
x et un voisinage ouvert * W, de y tels que V4, n Wx = @. Bien entendu les V, forment un 
recouvrement de À par des ouverts dont nous pouvons extraire un sous-recouvrement fini : 
soit S fini dans K tel que 

Aer (7.72) 
xesS 
L'ensemble W = f 
ouvert autour de y. 
Montrons que W n K = G. Soit a € K ; par définition de S, il existe 5 € S tel que a € V:. 
Par conséquent, a n’est pas dans W, et donc pas non plus dans W. 


«es Wx est une intersection finie d’ouverts autour de y et est donc un 


L'’ouvert W prouve que y est dans l’intérieur du complémentaire de K, et comme y est 
arbitraire, nous concluons que le complémentaire de K est ouvert (théorème 7.8), en d’autres 
termes, que X est fermé. 


CORooSSFFooNkNmls 
Corolaire 7.92. 
Dans un espace séparé, une intersection d’un compact avec un fermé est compacte. 


Démonstration. Soient un compact K et un fermé F. Par 7.91(2), K est fermé. La partie KnF 
est donc fermée en tant qu'intersection de fermés (lemme 7.6(1)). 

La partie K n Fest un fermé dans le compact K. Le lemme 7.91(1) dit alors que K N F est 
compact. 


LEMooFJZDooSxYWV\W 
Lemme 7.93 ([1]). 
Toute union finie de compacts est compacte. 


Démonstration. Soient (K;);-1..n des compacts dans X. Si {Os}ies est un recouvrement de 
Ü;cr Ki par des ouverts, à fortiori, ce sera un recouvrement de chacun des X;. Pour chaque à, 
il existera donc une partie finie S; de S telle que {Os}ses, recouvre K;. 

L'union finie de parties finies S; est une partie finie de S, et nous avons 


Le, Los (7:73) 


sel), Si 


PROPooQWHSooXeJOKT 
Proposition 7.94 ([203]). 
Dans un espace séparé, toute intersection de compacts est compacte. 


Démonstration. Soit un espace topologie séparé X et des compacts {K;};er dans X (1 est un 
ensemble quelconque). Chacun des X; est fermé par le lemme 7.91(2). Donc l'intersection 


K=()K; (7.74) 


iel 


36. Oui, la notation du voisinage peut surprendre, mais elle est quand même pratique pour ce qu’on veut en faire. 
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est un fermé de X par le lemme 7.6(1). Soit à dans 1. Nous avons K € K;. Donc K est un fermé 
dans le compact K,; il est donc compact par le lemme 7.91. 


Exemple 7.95 (Intersection de compacts non compacte[203]). 
Un exemple d’intersection de compacts qui n’est pas compacte. Vu la proposition 7.94, il va falloir 
chercher un espace non séparé. Soit X = NU {x1,æ2} où +1 et x2 sont deux éléments distincts hors 
de N. Nous définissons une topologie sur X en disant que les ouverts sont les parties suivantes : 
— les parties de N, 
— la partie N LU {x1}, 
— la partie N L {x}, 
— la partie N L {x1,x2}. 
Nous considérons les parties K1 = N U {x1} et Ka = N LU {x}. 
(1) K; est compact Soit {O;};er un recouvrement de X1 par des ouverts de X. Alors il existe 
io € Î tel que 1 € O;,. Vue la liste des ouverts, O;, est soit N L {x1} soit N LU {x1,%2}. Dans 
les deux cas, {O;,} est un sous-recouvrement fini de K1. 


(2) KinK2=N C'est immédiat parce que x et 2 sont distincts. 
(3) NN n’est pas compact Il peut être recouvert par les ouverts {{i}};en dont on ne peut pas 
extraire de sous-recouvrements finis. 


A 
PropGBZUooRKaUxy 


Proposition 7.96. 
Si V est une partie de l’espace topologique X muni de la topologie induite®T ry de celle de X, et 
si K est un compact de (V,Ty) alors K est un compact de (X,Tx). 


Démonstration. Soient {Ou}acA des ouverts de X recouvrant X. Alors les ensembles V n ©, 
recouvrent également K, mais sont des ouverts de V. Donc il en existe un sous-recouvrement fini. 
Soient donc {V n O;};er recouvrant ÆX avec 7 un sous-ensemble fini de À. Les ensembles {O;};er 
recouvrent encore K et sont des ouverts de X. 


Proposition 7.97 ([1]). 
Soient des espaces topologiques X et Y. Nous considérons des ouverts À de X et B de Y. Soit un 
compact M dans À x B ®. Il existe des compacts K et L dans À et B tels que M © K x L. 


Démonstration. Nous considérons les « projections » de M sur À et B : 
K = {a € À tel que 4 € B tel que (a,b) e M}, (7.75) 


et 
L = {be B tel que 4 € À tel que (a, b) € M}. (7.76) 


Nous avons M € K x L; il reste à montrer que K et L sont des compacts de leurs espaces respectifs. 
Soit un recouvrement {U;}ier de K par des ouverts de X et {V;};ey de L par des ouverts de Y. 
Alors 

jeJ 


est un recouvrement de M par des ouverts de X x Y. Puisque M est un compact de X x Y, nous 
pouvons en extraire un sous-recouvrement fini, c’est-à-dire /9 fini dans J et Jo fini dans J tels que 
{Ui x Vikieo (7.78) 
JEJo 
soit encore un recouvrement de X x L. Nous prouvons à présent que {U}ier, est un recouvrement 
de K, ce qui montrera que K est un compact. 
Soit a € K. Il existe b € B tel que (a,b) € M. Donc il existe io € Lo et jo € Jo tels que 
(a, b) e Ui X Vi. En particulier a € U:. 
Le même raisonnement montre que {V;};ey, est un recouvrement de L. 


37. Définition 7.24. 
38. Topologie produit, définition 7.15 
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7.5.5 Compactifié d’Alexandrov 
PROPooHNOZo0oPSZKIN 


Proposition-Définition 7.98 ([204]). 
Soit un espace topologique séparé localement compact*” X. Nous considérons un élément w € X et 
l’ensemble X = X L {w}. Nous nommons « ouverts de X » les parties suivantes : 


— les ouverts de X, 

— les parties de la forme À L {w} avec X\A compact dans X. 
Alors À est un espace topologique compact (cela justifie le nom « ouvert » donné aux parties sus- 
définies). 


Démonstration. La première chose à faire est de prouver que À est bien un espace topologique 
(définition 7.1). Nous notons 7 la topologie sur X et f l’ensemble des « ouverts » de X. Le but est 
de prouver que f est une topologie. 


(1) L’espace lui-même À € À parce que À = X U {w} et que X\X = G est compact. 
(2) Le vide gercf. 


(3) Union quelconque Soient À; (i € 1) des éléments de f. Nous posons J, = {ie I tel que À; € 
X} et 22 = 1\11. Nous avons 


[Ai = (Ù 4) v (Ù 4) = 80 (Ù Bi 0 {w}) (7.79) 


iel ieli iel2 iel2 


où B et les B; sont des ouverts de X tels que X\B; est compact dans X. Nous récrivons ça 


sous la forme 
[Ai = 80 (UJ B:) vu {tu}. (7.80) 
iel iel2 
La question est de savoir si 
x\(8 u(U B;)) (7.81) 
ielo 


est compact dans X. Un peu de réécriture : 


x\(8 0 ( U #)) - (X\B) n X\(U] 8) = (MB) 0 (AB). (7.82) 


iel2 iel2 iel2 


La partie X\B est fermée dans X parce que B est ouverte. La proposition 7.94 dit qu’une 
intersection de compacts est compacte (parce que X est séparé). Nous sommes donc en 
présence de l'intersection entre un compact et un fermé. 

Tout compact d’un espace séparé est fermé “. Donc nous sommes en présence de l'intersection 
de deux fermés. Donc (X\B) n (er, (X\B)) est fermé. Mais c’est contenu dans le compact 
Mie (X\B:). Fermé dans un compact, donc compact (lemme 7.91). 


(4) Intersection finie Nous considérons les « ouverts » (A4;);=1..n de X. Si ce sont tous des 
ouverts de X, l'intersection est un ouvert de X et on est bon. 


Supposons que tous les À; soient de la forme À; = B; Ü {w} avec X\B; compact. Alors 


RE U {w}) = [A 0) LU {w} (7.83) 


i=1 


Mais le lemme 1.26 (appliqué un nombre fini de fois) donne 
*\ (A ñ) = | |(X\B,) (7.84) 
i=1 i=1 


n 


39. Définition 7.81. 
40. Lemme 7.91(2). 
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qui est compact en tant qu’union finie de compacts “!. 
Enfin, nous supposons que les À; sont un mélange des deux types, nous les séparons entre 
ceux qui sont directement des ouverts de X et les autres : 


B. ie 
à = EEE (7.85) 
Cuiw} sig<i<n 


où B; sont ouverts et C; sont des parties de X telles que X\C; est compacte. 
Nous avons 


A; = [A 5) n | f (cv lu) (7.86a) 
= 


i=1 i=q+1 


=Bn | a c) | (7.86b) 


i=q+1 


U 


Justifications. 
— Nous avons posé B est l'intersection des B;. 
— Vu que w n’est pas dans B, nous pouvons l’oublier dans les C; LU {w}. 


C’est le moment d'étudier E = (,,, Ci. Nous avons 


Pare x\( a ci) = Ü Para) (7.87) 


i=q+1 i=q+1 


Vu que X\C; est compact, il est fermé *?. La partie X\E est donc fermée comme union finie 
de fermés . Et donc E est ouvert. Et finalement 


A\A=BNE (7.88) 
i=1 


est un ouvert de À comme intersection d’ouverts. C’est donc aussi un ouvert de X. 


Nous avons fini de prouver que (À ,T) est un espace topologique. Nous montrons à présent que À 
est compact. 

Soit {A;};er un recouvrement de À par des ouverts. Pour au moins un ÿç € 1 nous avons w € À;,. 
Nous posons À;, = B U {w} avec X\B compact dans X. 

Les ouverts {A;};er forment un recouvrement de X\B par des ouverts. Nous pouvons en extraire 
un sous-recouvrement fini : 


X\Bce | JA. (7.89) 
ieli 
Nous avons alors 
$e ë . EQoo JQFMOOKPHES 
il: U{io} 


Et voilà que X est recouvert par un nombre fini des À;. Notez que (7.90) est une égalité, mais 
nous n’en avons pas besoin. 


7.99. 

Oh bien entendu, les plus férus de questions embarrassantes demanderont, si X est l’espace consi- 
déré, où prendre ce w? Quel « objet » existe en-dehors de X ? Qui m'’assure que X n’est pas 
tellement grand que tout est dedans ? Le fait est qu’il n’existe pas d'ensemble contenant tous les 
ensembles (c’est le corolaire 1.147). Nous pouvons donc toujours trouver un ensemble w qui n’est 
pas dans X. 


41. Lemme 7.93. 
42. Par le lemme 7.91(2) et le fait que nous considérons un espace séparé. 
43. Par le lemme 7.6(2). 


7.6. LIMITE DE FONCTION 907 


En ce qui concerne R auquel nous pouvons attacher deux infinis (+00 et —), ce sera la 
définition 12.27. 
Pour C, nous donnerons une caractérisation de la limite en © dans le lemme 12.85. 


7.5.6 Propriété d’intersection finie 
DEFooCESGooZkACqs 


Définition 7.100 (Propriété d’intersection finie[205]). 
Soit un ensemble X. Une famille non vide À de parties de X a la propriété d’intersection finie 


si toutes intersection finie d'éléments de À est non vide. 
THOooCQSQooDuasqo 


Théorème 7.101 ([205]). 
Un espace est compact si et seulement si toute famille de parties fermées ayant la propriété d’in- 
tersection finie a une intersection non vide. 


7.6 Limite de fonction 
DefYNVoWBx 


Définition 7.102 (Limite d’une fonction, thème 29[206|). 

Soient des espaces topologiques X et Y ainsi que OA € X et a € Adh(Q). Soit une application 
f:Q — Y. Nous disons que l’élément { de Y est une limite de f en a lorsque pour tout ouvert V 
contenant L, il existe un voisinage ouvert U de a tel que 


E XL Z 
f(@ na)\a) « v or Red 
Si un tel élément est unique, alors nous disons que cet élément est la limite de f et nous notons 
lim fé) =#. (7.92) 


7.103. 
Il aurait été tout aussi bien de définir la limite d’une fonction f: X — Y définie sur tout X, puis 
de considérer ( avec la topologie induite depuis X. 

Dans ce cas, nous aurions écrit (7.91) sous la forme 


f(U\ta}) cv (7.93) 


en disant que U est un voisinage de a, et en laissant la lectrice deviner que ici, & voisinage » signifie 
« voisinage au sens de la topologie induite ». Vu que nous considérons la fonction f uniquement 
définie sur (, c’est la seule interprétation possible, et il n’y aurait pas au d’ambigüité[207]. Mais 
bon...si ça va sans dire, ça va encore mieux en le disant. 


Remarque 7.104. 

Nous ne saurions trop insister sur le fait que la valeur de f en a n'intervient pas dans la définition 
de la limite de f en a. Il n’est même pas nécessaire que f soit définie en a pour que l’on puisse 
parler de limite de f en a. Par exemple nous avons 


im = 2, (7.94) 


alors que la fonction n’est pas définie en x = 1. 

Plus généralement, un peu par principe, toutes les fois que la notion de limite apporte une 
information, le point où l’on prend la limite est spécial. Sinon on ne calculerait pas la limite, 
mais on regarderait directement la valeur de la fonction. Cela est typiquement le cas lorsque nous 
aborderons les dérivées. En effet, regardons (en faisant semblant d’anticiper) la définition (12.164). 
Dans la formule 


(a) = lim (7.95) 


T— a T — 
la fonction sur laquelle nous prenons la limite n’est jamais définie en x = a. 


44. Définition 7.100. 
45. Rappelons que ce n’est pas toujours le cas, mais que ça l’est si l’espace topologique est séparé — définition 7.55. 
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PropFObayrf 
Proposition 7.105 (Unicité de la limite pour un espace séparé). 
Soient X un espace topologique, À une partie de X et Y un espace topologique séparé. Nous 
considérons une fonction f: À — Y. Si ae Adh(A), alors f admet au plus une limite en a. 


Démonstration. Soient y et y’ des limites de f en a, ainsi que des voisinages V et V’ de y et y. 
Nous prenons également les voisinages W et W” correspondants : 


fJWnA)eV (7.96a) 
f(W' n À) eV”. (7.96b) 
Quitte à prendre des sous-ensembles nous pouvons supposer que W et W” sont ouverts. Il s’ensuit 
alors que : 
— l’ensemble W = W” est un ouvert contenant a et intersecte donc À; 
— l’ensemble (W à W”) n À est donc non vide: 
— et donc, f(WnW'A A) est, lui aussi, non vide. 
Mais 
fWnW'nA)cef(WnA)e y, (7.97) 
et 
fWanW'nA)jcf(W'nA)cv', (7.98) 


d’où V et V”’ ont une intersection. Puisque ces ensembles sont arbitraires, nous avons prouvé que 
tout voisinage de y et tout voisinage de y ont une intersection non vide; étant donné que Ÿ est 
séparé, nous devons avoir y = y/. 


Proposition 7.106. 
À propos de séparation. 


(1) Tout espace métrique est séparé. 
(2) Si une suite dans un espace métrique possède une limite, alors elle est unique. 
Démonstration. Si deux éléments x et y sont distincts, alors en posant r = d(x,y)/3 > 0, les boules 


B(x,r) et B(y,r) sont disjointes. 
En ce qui concerne les limites, ce sont les propositions 7.57 et 7.105. 


7.7  Topologie, distances et normes 


Certains ensembles ont plus de structures qu’une topologie. Nous fixons quelques bases main- 
tenant, et nous détaillerons certains résultats plus tard. 


7.7.1 Distance et topologie métrique 
DefMVNVFsX 


Définition 7.107. 
Si E est un ensemble, une distance sur E est une application d: E x E — KR telle que pour tout 
æ,yEE, 


(1) d(x,y 
(2) d(x,y 
(3) d(x, y) = d(y, x) 

(4) d(x, y) < d(x, z) + d(z, y). 


La dernière condition est l'inégalité triangulaire. 
Un couple (E,d) formé d’un ensemble et d’une distance est un espace métrique. 


> 0 


= 0 si et seulement si x = y, 


NA NY NA NCA 


46. Définition 7.55. 
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Le lemme suivant est similaire à la proposition 7.150. 
LEMooXCXHooVtrkvl 


Lemme 7.108. 
Si(E,d) est un espace métrique et si x,y,2 € E, nous avons 


Id(æ, z) — d{(y, z)| < d(x, y). (7.99) 


La définition-théorème suivante donne une topologie sur les espaces métriques en partant des 


boules. 
ThoURdLYUu 


Théorème-Définition 7.109 (Topologie métrique). 
Soit (E,d) un espace métrique. Nous définissons les boules ouvertes par 


hi 
B(a,r)={xeE tel que d(a,x) < r}. Du 100) 


pour tout a € E et r > 0. Alors en posant 
EqGD 
T={OCE tel que Vae O,3r > 0 tel que B(a,r) c O} ë Moopzti, 


nous définissons une topologie sur E. 
Cette topologie sur E est la topologie métrique de (E,d). En présence d’une distance, sauf 
mention explicite du contraire, c’est toujours cette topologie-là que nous utiliserons. 


Démonstration. D'abord @ € T parce que tout élément de l’ensemble vide ...heu ...enfin parce 
que, d'accord hein 7. Ensuite si les {4;};ey sont des éléments de 7 et si x € | J,7 Ai alors il existe 
ke I tel que x € Ax. Par hypothèse il existe une boule B(x,r) € Ag € [er Ai. 

Enfin si les {Ai}iegi.….n} sont des éléments de 7 alors pour tout à il existe r; > 0 tel que 
B(x,r;) € À;. En prenant r = min{ri};=1,..n nous avons B(x,r) € (2, Ai. 


PROPooZXTXo0EMLgMn 
Proposition 7.110. 


La topologie sur un espace métrique est la topologie engendrée” par ses boules ouvertes. 
NORMooJBMXooLHfAJK 


7.111. 

Si vous avez un peu de temps, vous pouvez vérifier que si K est un corps totalement ordonné, alors 

avec toutes les définitions de 1.367, en posant d(x,y) = |x — y| nous avons une distance sur K. 
De plus, les boules définies en 1.367 sont alors les mêmes que celles définies en (7.100), ce qui 


donne à tout corps totalement ordonné une structure d'espace topologique. 
P 
PROPooUXDJooCrWBbd 


Proposition 7.112 ([1]). 
Soient un espace métrique (E, d), ainsi qu’une suite convergente an À, 4. I existe r > 0 tel que 
pour tout n nous ayons d(l, an) < Tr. 


Démonstration. Soit r1 > 0 et N € N tel que n > N implique d(£, an) < r1. Ensuite nous posons 
r2 = max{d(£, an)}n=0...,N: 
Pour tout n nous avons d(an, £) < r1 + ro. 


PROPooNOHQooTqBQLk 
Proposition 7.113 ([1]). 
Soient un espace topologique X, un espace topologique normé®° Y. Soit une application continue 
f: X — Y. Pour tout x € X, il existe un voisinage ouvert de x sur lequel f est bornée. 


Démonstration. Soit Ô > 0. Nous considérons dans Y la boule B( TOR 6). Par continuité de f, la 


partie f—! (B(/(), 5)) est ouverte dans X. Si y est dans cette partie, alors 


f(y) € B(f(x).6). (7.102) 


L'application f y est donc bornée. 


47. Pour qui ne serait pas d'accord, ajoutez @ dans la définition des ouverts et puis c’est tout. 
48. Définition 7.109. 

49. Définition 7.12 

50. Topologie en 7.109. 
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7.7.2 Topologie métrique et induite 
LEMooKDMYooMIcFRI 


Lemme 7.114. 
Soit un espace vectoriel normé (V, I.) muni d’un sous-espace vectoriel M. La topologie induite de 
M depuis V est la même que la topologie métrique (M, IBDE 


7.7.3 Intérieur, adhérence et frontière 
7.115. 
Choses déjà faites : 
— Intérieur, définition 7.17. 
— Adhérence, qui est la même chose que fermeture, définition 7.19, et précisé par le lemme 7.20. 
Dans le cas de R” dans lequel les boules forment une base de la topologie nous pouvons encore 


préciser de la façon suivante : 


x e AdhA € Ve>0,B(x On Az @ (7.103) 
Proposition 7.116. 
Pour À € R”, nous avons 


mt AC AC AdhA 


DEFooACVLooRwehT1 
Définition 7.117. 
La frontière ou le bord de A est défini par OA = Adh A\ Int À. 
LEMooMPZWooGrqYIXx 
Lemme 7.118. 
Une partie À d’un espace topologique est ouverte si À = Int À, et fermée si À = Adh À. 
LEMooEUYEooYcUfKr 


Lemme 7.119 (Caractérisation équivalente de la frontière). 
Soient X un espace topologique et S € X. Un point x € X est dans OS si et seulement si tout 
voisinage de x contient un point de S et un point de S". 


Démonstration. Supposons que tout voisinage de x contienne un point de $ et un point de S*. 
Alors x € Adh(S) (définition 7.19), mais pas dans l’intérieur de S parce que x ne possède pas de 
voisinage contenu dans $. Donc x € OS. 

À l'inverse, si x € 0S alors x est dans l’adhérence de S et tout voisinage de x contient un point 
de $. Mais x n’est pas dans l’intérieur de $ et tout voisinage de x contient un point qui n’est pas 
dans $, aka un point de S*. 


Corolaire 7.120. 
Un ensemble et son complémentaire ont même frontière. 


Démonstration. Conséquence du lemme 7.119. Les points de 0(S°) sont caractérisés par le fait que 
tout voisinage contient un point de 5° et un point de (S°)° = $. 


Exemple 7.121. 
Soit X = [0,1] muni de la topologie de la distance |x — y| (définition 7.109). Les points 0 et 1 ne 
sont pas dans la frontière de X. En effet une boule ouverte autour de 1 est un ensemble de la forme 


B(1,r) = {xe X tel que (x —-1| <r}=]1-7r,1] (7.104) 


où nous avons supposé r < 1. 
Les points 0 et 1 sont par contre sur la frontière de [0,1] lorsque cet ensemble est vu comme 


partie de l’espace métrique R. PA 
LEMooLKWEoo1tGnkP 


Lemme 7.122 (Passage de douane[208, 209]). 
Dans un espace topologique, toute partie connexe qui rencontre à la fois une partie À et son com- 
plémentaire rencontre nécessairement la frontière de À. 
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Démonstration. Nommons + la partie connexe qui intersecte À et A°. Les ouverts Int(A) et X\A 
ne peuvent pas recouvrir 7 parce que ce sont deux ouverts disjoints alors que 7 est connexe (voir 
la définition 7.64 de la connexité). Donc + doit contenir des points qui sont dans À mais pas dans 
Int(A). C'est-à-dire des points de 04. 


On vérifiera que les notations et les dénominations sont cohérentes en prouvant la proposition 
suivante. 


Proposition 7.123. 
Pour € > 0, 
(1) l’adhérence de B(x,e) est B(x,e), 
(2) l’intérieur de B(x,e) est B(x,e), 
(3) la boule ouverte B(x,e) est un ouvert, 
(4) la boule fermée B(x,e) est un fermé. 


Nous avons également les liens suivants entre intérieur, adhérence, ouvert, fermé et passage au 
complémentaire (noté °) : 


Proposition 7.124. 

Si ACR" et A° = R?\A, nous avons 
(1) (Int A)° = Adh(A°) et (Adh A)° = Int(A°), 
(2) À est ouvert si et seulement si A° est fermé, 
(3) Int À est le plus grand ouvert contenu dans À, 


(4) Adh À est le plus petit fermé contenant À, 
ExBFLooUNyvbw 


Exemple 7.125. 
Il n’est en général pas vrai que AN B = AN B. Par exemple si À = [0,1[ et B = ]1,2]. Dans ce 
cas, An B = @ alors que An B = {1}. A 


7.7.4 Boules ouvertes, fermées, sphères 
DEFooPDSJooFcUqKH 


Définition 7.126. 
Soit un espace métrique (E, d). 
(1) Nous nommons boule fermée la fermeture de la boule ouverte, c’est-à-dire les parties de la 
forme B(a,r). 


(2) La sphère de centre a € E et de rayon r € R* est la frontière®! de la boule : S(a,r) = 
0B(a,r). 


7.127. 

Les différences entre boules ouverts, fermées et sphères sont très importantes. D'abord, les boules 
sont pleines tandis que la sphère est creuse. En comparant à une pomme, la boule ouverte serait 
la pomme « sans la peau », la boule fermée serait « avec la peau » tandis que la sphère serait 


seulement la peau. 
LEMooDYYYooHZitMZ 


Lemme 7.128. 
Quelques liens entre les boules et les sphères. 
(1) La sphère est donnée par S(a,r) = {x € V tel que d(x, a) = r}. 
(2) La fermeture de la boule est B(a,r) = {x € V tel que d(x,a) <r}; 


(3) Nous avons B(a,r) = B(a,r) L S(a,r). 


51. Frontière, définition 7.117. 
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7.7.5 Continuité séquentielle 
PropFnContParSuite 


Corolaire 7.129 (Caractérisation séquentielle de la continuité en un point[1]). 
Une application entre deux espaces topologiques continue en un point y est séquentiellement conti- 
nue. 


Démonstration. Soit une application f: À — Y entre les espaces topologiques X et Y. Nous 
supposons que f est continue en a € X. Soit une suite convergente 74 Er a. Nous devons prouver 
que f(x) — f(a). 

Soit un voisinage V de f(a) dans Y. Le fait que f soit continue en a signifie *? que f(a) est 
une limite de f en a, c’est-à-dire ** qu'il existe un voisinage W de a tel que f(W\{a}) « V. 

Puisque x — a, il existe N tel que xx € W pour tout k > N. Pour ces valeurs de k, nous 
avons f(x) € V. 

Nous avons prouvé que pour tout voisinage V de f(a) dans Ÿ, il existe N tel que f(xy) € V 
dès que k > N. Cela signifie exactement que f(x) — f(a). 


7.7.5.1 Les boules, une base de topologie 
PropNBSooraAFr 


Proposition 7.130. 
Un espace métrique séparable °* accepte une base de topologie” dénombrable. 

Soit À dense et dénombrable dans l’espace métrique séparable (E, d). Si {a;};en est une énu- 
mération de À et {r;};jen une énumération de Q, alors 


B = {B(ai,r;)}i,jen (7.105) 


est une base de la topologie Ÿ de E. 


Démonstration. Soient x € E et V un voisinage de x. Ce dernier contient une boule B(x,r) et 
quitte à prendre r un peu plus petit nous supposons que r € À (existence d’un tel rationnel par le 
lemme 1.424). 

Soit a € A avec |a — x| < % (existe par densité de À dans E); nous avons B(a, 2) Se Er;r) 


parce que si y € B(a, 7) alors 


2 1 
y zl<ly-al+la-zl<2r+arer (7.106) 


La seconde inégalité est stricte parce que les boules sont ouvertes. Le tout montre que y € B(x,r). 


Par ailleurs x € B(a, 2r) et nous avons trouvé un élément de B contenant x tout en étant inclus 
dans V. Cela prouve que B est bien une base de la topologie de Æ. 


RemIPVLooHUXyeW 
Remarque 7.131. 
Il est vite vu que les cubes ouverts forment aussi une base de la topologie de R”. Cela est à mettre 
en rapport avec le fait que toutes les normes sont équivalentes sur R” (proposition 11.46). 


Voir aussi le corolaire 14.282 qui donnera tout ouvert comme union de pavés presque disjoints. 
DefEnsembleBorne 


Définition 7.132. 
Soit (X,d) un espace métrique. Un sous-ensemble À € X est borné si il existe une boule de X 


contenant À. 
PROPooJIOAooWqzKMu 


Proposition 7.133. 
Toute réunion finie d’ensembles bornés est un ensemble borné. Toute partie d’un ensemble borné 
est un ensemble borné. 


52. C’est la définition 7.32 de la continuité en un point. 

53. Définition 7.102 d’une limite. 

54. Qui possède une partie dense dénombrable, définition 7.56. 
55. Base de topologie, définition 7.2. 

56. Définition 7.2. 
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7.7.6 Continuité et compacité 


Un résultat important dans la théorie des fonctions sur les espaces vectoriels normés est qu’une 
fonction continue sur un compact est bornée et atteint ses bornes. Ce résultat sera énormément 


utilisé pour trouver des maximums et minimums de fonctions. Le théorème exact est le suivant. 
LemQFXOWyx 


Lemme 7.134 (de Lebesgue[210]). 

Soit (X,d) un espace métrique tel que toute suite ait une sous-suite convergente à l’intérieur de 
l’espace. Si {V;} est un recouvrement par des ouverts de X, alors il existe € tel que pour tout x € X, 
nous ayons B(x,e) € V; pour un certain 1. 


Démonstration. Par l'absurde, nous supposons que pour tout n, il existe un x, € X tel que la boule 

B(xzh 1) n’est contenue dans aucun des V:. De ces x,, nous extrayons une sous-suite convergente 
‘nm ; 

(que nous nommons encore (x,)) et nous posons æ, — x. Pour n assez grand (À < €) nous avons 


Tn € B(x,€), donc tous les x, suivants sont dans le V; qui contient x. 


LemMGQqgDG 
Lemme 7.135 ([210]). 
Soit (X,d) un espace métrique tel que toute suite possède une sous-suite convergente. Pour tout 
e > 0, il existe un ensemble fini {xi}ier tel que les boules B(x;,€) recouvrent X. 


Démonstration. Soit par l'absurde un € > 0 contredisant le lemme. Il n'existe pas de parties finies 
de X autour des points desquels les boules de taille e recouvrent X. 

Nous construisons par récurrence une suite ne possédant pas de sous-suite convergente. Le 
premier terme, x est pris arbitrairement dans X. Ensuite si nous avons déjà N termes de la suite, 
nous savons que les boules de rayon € centrées sur les points {x;};-1...n ne recouvrent pas X. Donc 
nous prenons æn+1 hors de l’union de ces boules. 

Ainsi nous avons une suite (x,) dont tous les termes sont à distance plus grande que € les uns 
des autres. Une telle suite ne peut pas contenir de sous-suite convergente. Contradiction. 

ThoBWFTXAZNH 


Théorème 7.136 (Bolzano-Weierstrass[210], thème 32). 
Un espace métrique est compact si et seulement si toute suite admet une sous-suite qui converge à 
l’intérieur de l’espace. 


Démonstration. Soient X un espace métrique compact et (x,) une suite dans X. Nous considérons 
la suite de fermés emboîtés 


Xn = {rx tel que k > n}. (7.107) 


Ce sont des fermés ayant la propriété d’intersection finie non vide, et donc la proposition 7.87 nous 
dit qu’ils ont une intersection non vide. Un élément de cette intersection est automatiquement un 
point d’accumulation de la suite ?”. 

Nous passons à l’autre sens. Nous supposons que toute suite dans X contient une sous-suite 
convergente, et nous considérons {V/};er, un recouvrement de X par des ouverts. Par le lemme 7.134, 
nous considérons un € tel que pour tout x, il existe un 4 € TI avec B(x,e) € V;. Par le lemme 7.135, 
nous considérons un ensemble fini {y;};<A tel que les boules B(y:;,€) recouvrent X. 

Par construction, chacune de ces boules B(y;,€) est contenue dans un des ouverts V;. Nous 
sélectionnons donc parmi les V; le nombre fini qu’il faut pour recouvrir les B(y;,e) et donc pour 
recouvrir X. 


ExEFYooTILPDKk 
Exemple 7.137 (Non compacité de la boule unité en dimension infinie). 
Le théorème de Bolzano-Weierstrass permet de voir tout de suite que la boule unité n’est pas 
compacte dans un espace vectoriel de dimension infinie : la suite des vecteurs de base ne possède 
pas de sous-suite convergente. PA 


Le théorème de Bolzano—-Weierstrass 7.136 a l’importante conséquence suivante. 


57. Définition 7.30. 
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ThoWeirstrassRn 
Théorème 7.138 (Weierstrass). 
Une fonction continue à valeurs réelles définie sur un compact est bornée et atteint ses bornes. 


Démonstration. Soient À un compact et f: K — R une fonction continue. Nous désignons par À 
l’ensemble des valeurs prises par f sur K : 


A = f(K) = {f(x) tel que x e K}. (7.108) 


Nous considérons le supremum M = sup À = sup,-x f(x) avec la convention suivante : si À n’est 
pas borné supérieurement, nous posons M = (voir définition 1.444). 

Nous allons maintenant construire une suite (x,) de deux façons différentes selon que M = 
ou non. 


(1) Si M = ©, nous choisissons, pour chaque n € N, un x, € K tel que f(x») > n. C’est 
certainement possible parce que si À n’est pas borné, nous pouvons y trouver des nombres 
aussi grands que nous voulons. 


(2) Si M # ©, nous savons que pour tout €, il existe un y € À tel que y > M — €. Pour chaque 


n, nous choisissons donc x, € K tel que f(xn) > M — L. 


Quel que soit le cas dans lequel nous sommes, la suite (x,) est une suite dans X qui est compact, 
et donc nous pouvons en extraire une sous-suite convergente à l’intérieur de K par le théorème de 
Bolzano-Weierstrass 7.136. Afin d’alléger la notation, nous allons noter (x) la sous-suite conver- 
gente. Nous avons donc 

Tn TE K. (7.109) 


Par la proposition 7.129, nous savons que f prend en x la valeur 


Jai ln Jr) (7.110) 


n— 00 


Donc f(x) < co. Évidemment, si nous avions été dans le cas où M = , la suite x, aurait été 
choisie pour avoir f(x,) > n et donc il n’aurait pas été possible d’avoir lim, f(æn) < 00. Nous 
en concluons que M < ©, et donc que f est bornée sur K. 

Afin de prouver que f atteint sa borne, c’est-à-dire que M € À, nous considérons les inégalités 


M- - ct) (7.111) 


En passant à la limite n — ©, ces inégalités deviennent 


M < f(x) < M, (7.112) 


et donc f(x) = M, ce qui prouve que f atteint sa borne M au point x € K. 


LEMooQLVAoo!ICaPvR 
Lemme 7.139 ([1]). 
Soient des compacts À, B et une fonction continue f: À x B —R. Alors 
sup _|f(x,y)| = sup (sup|f(x,y)|). (7.113) 
(x,y)EAxB xeA yeB 


Démonstration. Pour chaque x € À, la fonction f,: B — R donnée par f;(y) = |f(x,y)| est 
continue et atteint donc sa borne Ÿ en yy(x). Notons que cela ne définit pas de façon univoque 
ym(x) parce que f; peut atteindre son maximum en plusieurs points. L'important est que pour 
tout x, le nombre | f(x, yu(x))| ne dépend pas du choix de ym(x) parmi les y qui réalisent le 
maximum. 


58. Théorème 7.138. 
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Notons (xo,yo) un point de À x B sur lequel |f| réalise son maximum °° : 


EQooDDXDoo 
sup [/(æw)l = |f(æo,v)|. (FH 
(x, y)EAxB 
Nous avons d’une part 
sup (sup |f(x,y)l) = sup| f(x, yu(x))| < |f(xo. Yo) (7.115) 
xEeA yeB xEA 
Et d'autre part, quelques calculs avec justifications en-dessous : P'ISERCOP IPS OBATEEN 
SUBEQooAKPOÜo 
sup (sup|{(#, y)|) < supsup | (0, vo)| PE 
xEeA yeB A yeB 
= |f(x0, yo) (7.116b) 
(oJe] [e] 
< |f(xo, yu(xo))| Ra Faro 
O0 (eo) 
< sup|{(æ, var(æ)) PPTTORS 
< sup (sup|f(x,y)|). (7.116e) 


xEA yeB 


Justifications. 
— Pour (7.116a). Le point (xo, Yo) est un maximum de |f|. 
— Pour (7.116c). y est définie pour maximiser, en fonction de x, la quantité | f(x, ym(x))|. 
— Pour (7.116d). Au lieu de conserver la valeur x fixé, nous prenons le maximum sur tous les 
x possibles. 
Vu que les premiers et derniers termes des inégalités (7.116) sont égaux, toutes les inégalités sont 
en réalité des égalités. En particulier, en reprenant (7.114), 


sup |f(x,y)| = |f(xo, vo)l = sup (sup|f(x,y)|). (7.117) 
(x,y)eAxB xeA yeB 


7.7.7 Distance à un ensemble 


DEFOoGNNUooFUZINs 
Définition 7.140. 
Si À est une partie de l’espace métrique (X,d), et sibe X, nous définissons 
d(b, À) = inf d(b, y). (7.118) 
yEA 
LEMooAIARooQADaxM 


Lemme 7.141 ([1|). 
Si À est fermé dans (X, d), et sibe X vérifie d(b, À) = 0, alors bE A. 


Démonstration. Puisque A est fermé, le complémentaire A° est ouvert (c’est la définition 7.3). 
Supposons que b € A‘. Alors il existe r > 0 tel que B(b,r) € A. Si a € À nous avons alors 
d(b, A) > d(b,a) > r > 0. Cela contredit l'hypothèse d(b, À) = 0. 

Nous en déduisons que b n’est pas dans A° et qu'il est donc dans À. [1 


Exemple 7.142 (Pas avec un ouvert). 

En prenant l’ouvert À = |0,1[ dans R nous avons d(0, A) = 0, alors que 0 n’est pas dans À. A 
LEMooJNRTooZyKiFC 

Lemme 7.143 ([1|). 


Soient un espace métrique (X,d) ainsi qu'une partie A € X. Soit r > 0. La partie 
= {re X tel que d(x, À) < r} (7.119) 


est ouverte. 


59. Encore une fois, ce point n’est pas déterminé de façon unique par cette propriété. 
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Démonstration. Soit y € © ; nous avons d(y, A) < r. Autrement dit, 
inf d(y,a) <r (7.120) 
ac A 


et donc il existe a € À tel que d(y,a) < r. Soit Ô = d(y,a) < r. Nous montrons à présent que 
B(y,r — 6) est dans ©. En effet si z € B(y,r — 6), alors 


d(z, a) < d(z,y) + d(y,a) <r—-0+ô=r. (7.121) 


LEMooEQIZooLpsbÜe 
Lemme 7.144 (|1]). 
Soit un fermé F de l’espace métrique (X, d). Si a € X vérifie d(a, F) = 0, alors a € F. 


Démonstration. Supposons que d(a, F) = 0, c’est-à-dire que inf,er d(a, x) = 0. Il existe donc une 
suite (xx) dans F telle que d(a, xx) — 0. 


X,d He : 
Cela signifie que xx 06 a. La proposition 7.51 nous dit alors que a € F. 


LEMooCFGToolfdcfk 
Lemme 7.145 ([1]). 
Si À est une partie de (X, d), alors la fonction 

: Q — [0,00 
! [0, ol (7.122) 
x d(x, À) 

est continue. 
7.7.8 Convexité 

DEFooQQE0ooAFKbcQ 


Définition 7.146 (Partie convexe). 
Une partie À d’un espace vectoriel est convexe si pour tout a, be À et pour tout t € [0,1], le point 
ta + (1—t)b est dans À. 


Autrement dit, une partie est convexe lorsqu'elle contient tous les segments joignant ses points. 
PROPooJOCEooUKhkqQ 


Proposition 7.147 ([211]). 
Toute intersection de convexes est convere. 


Démonstration. Soit un espace vectoriel E ainsi que des parties convexes {C;};er indexées par un 
ensemble quelconque J. Nous prouvons que C = f,., Ci est convexe. 

Soient x,y € C, ainsi que à € 1. Nous avons x,y € C; et donc {tx + (1 —t)y}ejou € Ci. Vu que 
cela est vrai pour tout ?, nous avons 


{x + (1 yep © (NC (7.123) 


icl 


et donc le résultat attendu. 


LEMooEFCCooOuStrb 
Lemme 7.148. 
L'intérieur d’un convexe est convete. 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


7.7.9 Norme 


Définition 7.149 ([212], thème 25). 
Soit E un espace vectoriel (pas spécialement de dimension finie) sur le corps K (= R ou C). Une 
norme sur E est une application N': E — [0,1 telle que 


1) Ne) =0 
(2) N(x) = 0 si et seulement si x = 0; 


DefNorme 
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ItemDefNormeii 
(3) N(x) = NIN(x) ItemDefNormeiii 
4) N(x+y) < N(x) + N(y) 
pour tout x,y€e E et pour tout À € K. 
La propriété (}) est appelée inégalité triangulaire. 
Un espace vectoriel muni d’une norme est un espace vectoriel normé. 
En prenant À = —1 dans la propriété (3), nous trouvons immédiatement que N(—x) = N(x). 
PropNmNNm 
Proposition 7.150. 
Toute norme N sur l’espace vectoriel E vérifie l'inégalité 
IN(x) — N(y)| < N(x — y) (7.124) 
pour tout x,ye E. 
Démonstration. Nous avons, en utilisant le point (4) de la définition 7.149, 
bEqNN 
N(x) = N(x—y+y) < N(x —y) + N(y), 7 + (ra) 
bEqNN 
N(y) = N(y-x+x) < N(y— x) + N(x). SUPEQNMLe Ep 
Supposons d’abord que N(x) > N{y). Dans ce cas, en utilisant (7.125a), 
INC) — N(y)} = N(x) — N(y) < Na — y) + N(y) — N(y) = N(x— y). (7.126) 


Si par contre N(x) < N(y), alors nous utilisons (7.125b) et nous trouvons 


IN(z) — N(y)| = N(y) - Na) < N(y—zx) + N(x)— N(x) = N(y-x) = N(x—y) (7.127) 


Dans les deux cas, nous avons retrouvé l’inégalité annoncée. 


Cette proposition signifie aussi que 
EgNleqNNleqN 
-Ntr- Ye NE) NU) ENG 0). AegiNleqtag 


Le lemme suivant dit que nous pouvons remplacer l'inégalité triangulaire par la convexité de 
la boule unité dans la définition de norme. 


LEMooAVIJooFhdxXr 
Lemme 7.151 ([213]). 
Soit une application N': E — [0,1 telle que 
(1) N(x) >0 pour toutxeE, 
(2) N(x) = 0 si et seulement si x = 0, 
(3) N(x) = [AÏN(x). 
Alors N est une norme si et seulement si la partie 
B={xeE tel que N(x) <1} (7.129) 


est convexe ©. 


Démonstration. Dans les deux sens. 


(1) = Nous supposons que N est une norme et nous prouvons que la boule B est convexe. 
Soient x,y€e Bet À€ [0,1]. Nous avons 


N(Az +(1—X)y) < N(xx) + N((1— y) (7.130a) 
= ÀN(x) +(1— XN(y) (7.130b) 
<\st=) (7.130c) 
= (7.130d) 

Nous avons utilisé diverses propriétés de la norme, ainsi que la majoration N(x), N(y) < 1. 


60. Définition 7.146. 
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(2) = Nous supposons que B est convexe, et nous prouvons que N vérifie l'inégalité triangulaire. 
Soient x, y € E que nous choisissons tous deux non nuls (sinon c’est trop facile). Nous posons 


— LFU FRS 


N(x) + N(y) 


et la subtilité sera d’écrire z de telle sorte à être une somme de deux éléments de B. L’astuce 
est de poser 


N(x) 
À = 7.132 
Na) + NU) LE 
Une simple vérification montre qu’alors 
ns (7.133) 


N(x) 

Nous avons évidemment x/N(x) e B (et de même avec y). Puisque B est convexe, nous avons 

z € B. Exprimons le fait que z € B à partir de la définition (7.131) : 
N(x + y) 


NG) + NO < hi 


Cela signifie exactement N(x + y) < N(x) + N(y). 


7.152. 
Afin de suivre une notation proche de celle de la valeur absolue, à partir de maintenant, la norme 
d’un vecteur v sera notée |v| au lieu de N(v). La proposition 7.150 s’énoncera donc 


el — lyll < le — vi. (7.135) 


Un espace vectoriel E muni d’une norme est, on l’a déjà dit, un espace vectoriel normé ; on le 
notera (E,|.|) pour distinguer la norme fixée. 


Une autre inégalité utile de temps en temps. 
CORooDFBGooAqVR£S 


Corolaire 7.153. 
Si a et b sont dans un espace vectoriel normé, alors 


Ia — ol! — lb] < la. (7.136) 


Démonstration. Il s’agit seulement de la proposition 7.150 avec x = a — b et y = b. 
LEMooWGBJooYTDYIK 


Lemme-Définition 7.154 (Distance induite par une norme). 
Soit un espace vectoriel normé (E,|.|). Nous posons 


dx, y) = |x — yl. FOR 


Alors ITEMooLITDooPeReOUk 
(1) d est invariante par translations : d(a,b) = d(a + u,b + u) 
(2) d est une distance! sur E. 


C’est la distance induite par la norme. 


Démonstration. Le fait que la formule (7.137) soit invariante par translations est immédiat. En ce 
qui concerne le fait que ce soit une distance, le seul point délicat à vérifier est l’inégalité triangulaire. 
Mais, pour tous æ,y,z2€E,ona 


d(x,y) = x y =lx-2z+2-vl< x 21+12- y d(x,2) + d(z, y). (7.138) 
[ 


61. Définition 7.107. 
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DEFOooPMVFooPSYVNQ 
Définition 7.155. 
La topologie associée à une norme est celle associée à la distance donnée en 7.154 par le théorème 


7.109. 
CORooMWCUooKyoyZV 


Corolaire 7.156. 
Un espace vectoriel normé est un espace vectoriel topologique : en d’autres mots, l’addition et la 


multiplication par un élément du corps sont continues. 
PROPooYMCUooERvDpk 


Proposition 7.157. 
La norme est une application continue sur un espace vectoriel normé. 
Plus précisément, si (E,||.|) est un espace vectoriel normé, alors l'application 


J:E—R 
(7.139) 
xt |x| 
est continue. 
PROPOooQUAZo0GXSkwE 
Proposition 7.158. 
La norme sur un espace vectoriel normé est une fonction de classe C®. 
LEMooGCJEooUAynZW 


Lemme 7.159 ([1]). 
Soient un espace vectoriel normé E ainsi qu'une partie libre {a;} dans E. Si nous avons |; Mail < 
M, alors nous avons 


Lxlla| < M (7.140) 


pour chaque i. 

LEMooSCIIooRyRrHA 
Lemme 7.160. 
Soient un espace vectoriel normé (V, |.|) ainsi qu'une isométrie f: V — V. Si À est une partie de 
V telle que f(A) € À, alors 


À = f(4). (7.141) 


Nous étudierons plus en détail les espaces vectoriels topologiques à partir de la définition 7.161. 


7.8 Espaces vectoriels topologiques 

DefEVTopologique 
Définition 7.161. 
Un espace vectoriel V sur le corps valué®? K muni d’une topologie est un espace vectoriel 
topologique si 


(1) la somme de deux vecteurs est une application continue V x V — V ; et 
(2) la multiplication par un scalaire est une application continue K x V — V. 


Ici, sur V x V et sur K x V nous avons la topologie produit. 
Dans toute la suite, nous supposons que K est un corps avec une topologie métrique. 


On le redit quand même : le corps lui-même doit avoir sa topologie. Dans la grande majorité 
des cas, ce corps est IR ou © muni de la topologie usuelle. 
Mine de rien, le fait que les deux opérations usuelles soient continues à de belles conséquences 


sur la topologie de l’espace. … 
PROPooDXLFooFghbWk 


Proposition 7.162 ([214]). 
Soit un espace vectoriel topologique V. Pour x e V et ÀEK, À Æ 0 fixés, les fonctions T, et M, 


62. Définition 1.458. 
63. Définition 1.202 


520 CHAPITRE 7. TOPOLOGIE GÉNÉRALE 


définies par : 


Te :V — V et M; :V —V (7.142) 
y x+y y— \y (7.143) 


sont des automorphismes* de l’espace topologique V. 


Démonstration. Ce sont des bijections continues, dont les inverses sont respectivement T', et 
Mix. 


PROPooJYLVooPpLWFX 
Proposition 7.163. 
Soit un espace vectoriel topologique X. Si © est un ouvert dans X, alors pour tout x € X et pour 
tout À € K, les parties O + x et ÀO sont des ouverts. 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 
LEMooEZTYooBBxdJ; 


Lemme 7.164 ([1]). 
Soit un espace vectoriel topologique V sur le corps K. Si © est un ouvert autour de 0 dans V et si 
1Z40€EK, il existe un ouvert U autour de 0 tel que AU € O. 


Démonstration. La réponse est U = À710. En effet par définition d’un espace vectoriel topologique, 
la fonction donnée par f(x) = Àx est continue; donc U = f !(O) est un ouvert. De plus AU = 


CL 


7.8.1 Base de topologie 


Toute base de voisinage de 0 se transporte en tout point de l’espace vectoriel topologique. 
ProplnvarianceTopologie 


Corolaire 7.165 (Invariance de la topologie[214]). 
Soit un espace vectoriel topologique (X,T). Si Bo est une base de topologie en 0, alors Bo + a est 
une base de topologie en a. 


Démonstration. Soit un ouvert U contenant a. Alors U — a est un ouvert contenant 0 (proposition 
7.163). Il existe donc B € B tel que 0 € B EU — a. Nous avons alors ae B+acU. 


7.8.1.1 Somme directe topologique 
PropKZDaTR 


Proposition-Définition 7.166 ([215, 216, 1]). 
Soit V un espace vectoriel topologique et une décomposition en somme directe ® V = V1@V2. Alors 
les trois conditions suivantes sont équivalentes. 


ITEMooMUELooWdJQeW 
(1) La bijection 
VX VW—V (7.144) 
(x1,t2) > T1 + T2 | 
2 . 66 
est un homéomorphisme””. ITEMooDKOYooUpEfOR 


(2) Les parties V1 et Va sont fermées dans V et la projection s: V2 — V/Vi est un homéomor- 
phisme. ITEMooFSSMooCQzTIc 
(3) Les parties V1 et Va sont fermées dans V et la projection m2: V — V2 est continue. 
Lorsqu'une décomposition en somme directe vérifie ces conditions, nous disons que la décomposition 
est topologique. 


64. Définition 7.37. 

65. Définition 4.138. 

66. C’est à dire isomorphisme d’espaces vectoriels : bijection continue de réciproque continue. En ce qui concerne 
la topologie sur Vi x V2, elle est donné par la définition 7.15. 
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Démonstration. Avant de commencer, nous rappelons les topologies. 


— Sur Vi et V2 nous avons la topologie induite, définition 7.24. 


— La topologie produit sur VA x V2 est la définition 7.15. 


— La topologie quotient sur V/VA est la définition 7.44. 


Voici quelques points qui ne dépendent pas des hypothèses (1), (2) ou (3). 


(1) La projection p: V — V/Vi est continue La projection est toujours continue pour la 


(2) 


topologie quotient ; c’est la définition même, voir 7.44. 


4 est une bijection continue Le fait que # soit continue fait partie de la définition 7.161 
d’un espace vectoriel topologique. Pour que ce soit une bijection, c’est le lemme 4.139. 


s est injective Soient v,w € V2 tels que s(v) = s(w). Alors {v + ti}rmie = {W + Yi}mew: 
En particulier v € {w+yi }yev, . Il existe donc 71 € Vi tel que v = w+y1. Donc v—w € Vi. Mais 
comme V2 est un espace vectoriel, nous avons aussi v — w € V2. Donc vu — we Vin V2 = {0}. 


s est surjective Soit x € V. Nous devons trouver v € V2 tel que s(v) = [x]. Nous savons 
qu’il existe x1 € V1 et 2 € V2 tels que x = 1 + 2. Nous avons alors [x] = 5(x2). 


s est continue Soit un ouvert © de V/V1. La partie p_! (©) est ouverte dans V (proposition 
7.45), et donc 


s 1(O)=p (O)jnVw (7.145) 


est ouvert dans V2 parce que la topologie sur V2 est celle induite ©? de la topologie de V. 


Et maintenant on prouve les équivalences. 


(1) Si (1) alors VA est fermé La partie V1 x {0} est fermée dans V1 x V2. Vu que # ! est 


(2 


) 


— 


continue, nous en déduisons que LA x {0}) est fermée dans V par le lemme 7.38. Mais 
comme v(V X {0}) = Vi, nous avons que VA est fermé dans V. 


(1) = (3) Nous supposons que Ÿ: V1 x V2 — V est un homéomorphisme. Nous considérons 


l'application 
XV xV 


(x, y) — (0, y). 


Cette application est continue et permet d'écrire m2 sous la forme 72 = Ÿ o ©. En tant que 
composée d’applications continues, l'application 72 est continue. 


(7.146) 


(3) = (2) L'application x: V — V2 est constante sur les classes (modulo Vi). Donc elle 


6 


descend aux classes en l'application 


VV -V 


fe] ro). (7.147) 


Cette application est continue parce que 7 l’est et parce que le lemme 7.48 le dit. Le point 
à remarquer est que s—! = ? parce que pour tout æ € Va nous avons 


s(F([r])) = s(r(x)) = s(x) = [x] (7.148) 


parce que T(x) = x du fait que x € V2. Vu que est continue, l'application sl est également 
continue. 

(2) = (1) Nous pouvons écrire la projection m2: V — V2 comme composée m2 = 5710 p. 
En effet pour vi € VA et v2 € V2 nous avons (5-10 p)(v1 + v2) — sl ([u]) = V2 = M2(v1 + V2). 


L'est 


Nous savon que p est continue (construction de la topologie et tout ça), et que 57 
également continue par hypothèse. Donc 72 est continue. Etant donné que 71 + 72 = Id et 


que l'identité est continue, nous déduisons que T1 est également continue. 


67. Topologie induite, définition 7.24. 
68. Voir la définition 7.47. 
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7.167 ([217]). 
Si V est normé, il existe une façon plus directe (mais pas spécialement plus simple) de prouver 
l'implication (1) = (2), et en particulier la continuité de s-!. Voyez 11.67. 

Si V est de Banach, la continuité de s-! peut venir du théorème d’isomorphisme de Banach 


27.1 parce que s est une bijection continue entre espaces de Banach. Attention toutefois à vérifier 
que V/VA est de Banach °°. 


7.8.1.2 Limite dans un espace vectoriel topologique 
LEMooAHTGooJhpPvo 


Lemme 7.168 (Changement de variables). 
Soient un espace vectoriel topologique ® X ainsi qu'un espace séparé Y et une application f: X — 
Y. Nous supposons que lim,_,4 f(x) = £. Alors lim,_,, f(x + a — b) existe et vaut L. 


Démonstration. Soit un voisinage V de £ dans Y. Il existe un voisinage U de a tel que f(U) € V. 
Nous posons U’ = U — a + b. C’est un voisinage de b. En posant g(x) = f(x + a — b) nous avons 


g(0”) = f(U—-a+b+a—b) = f(U)E V. (7.149) 
Donc lim,-_,5 g(x) = L. C’est cette égalité qui signifie lim,_,5, f(x + a — b). 
PROPooFGWXooFjvTY); 
Proposition 7.169 (Limite de fonction composée[218]). 
Soient des fonctions f,g: IR — R telles que 
lim J(u)= 2 (7.150a) 
y—> 
Jim g(c) = 1. (7.150b) 


Nous supposons qu'il existe un intervalle ouvert I contenant l tel que g(x) Æ l sur 1\{a}. 
Alors 


Jim (fo g)(x) = lim J(u) = z. (7.151) 
PROPooKNVHooX1QyVA 
Proposition 7.170 (Limite de fonction composée[218]). 
Soient des fonctions f,g: IR — R telles que 
lim f(y) = z (7.152a) 
y—> 
Jim gs) = (7.152b) 
Nous supposons que f est continue en L. 
Alors 
lim(f o g)(x) = lim f(y) = z. (7.153) 
za y—l 
PROPooBEHTooBrLWuh 


Proposition 7.171. 
Toute application linéaire entre espaces vectoriels topologiques de dimension finie est continue. 


7.8.2 Corps topologique 
DEFooWKLOooPdsxQ1l 


Définition 7.172 (Anneau topologique[219]). 
Un anneau topologique est un anneau" 
multiplication sont continues ??. 


muni d’une topologie dans laquelle l’addition et la 


69. Je ne l'ai pas fait, et au doigt mouillé je dirais que ça m'étonnerais que ce soit vrai pour tout choix de sous-espace 
vectoriel V1. À vos risques et périls. Écrivez-moi si vous avez une idée. 

70. Définition 7.161. 

71. Définition 1.41. 

72. Définition 7.32(2). 
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PROPooAWAKooKRmbGT 
Proposition-Définition 7.173. 
Si (K,|.|) est un corps valué"*, alors l'application 


d:KxK—R' 


7e nn 


est une distance !*. 


Un corps valué muni de sa topologie métrique T5 est un corps to ologique Le 
P q PS 10p q 
LEMooCHDTooZsgXEK 


Lemme 7.174. 
Les corps R et © sont des corps valués. Leur topologie métrique (en tant que corps valués) est leur 
topologie usuelle. 


7.8.3  Voisinage symétrique et équilibré 
DEFooKBMAooAhYQAm 


Définition 7.175 (Partie symétrique[214]). 


Une partie U d’un espace vectoriel topologique est symétrique si x E U implique —x EU. 
DEFooPNRIooEFFAlii 


Définition 7.176 (Partie équilibrée[214]). 
Une partie U d’un espace vectoriel topologique V est équilibrée si pour tout |a| < 1 dans K, 


aU ce U. 
DEFooMNZJooSIAVGZ 


Définition 7.177 (Partie absorbante[220]). 
Soit un espace vectoriel X. Une partie U est absorbante si pour tout x € X, il existe px > 0 tel 


que Àx EU pour tout |A] < ps. 
DEFooYSWJooPkcrJe 


Définition 7.178 (Partie absolument convexe). 


Une partie est absolument convexe si elle est convexe et équilibrée. 
LEMooXKOTooLWDXhp 


Lemme 7.179. 
Si À est équilibré ou absorbant, alors 0 € À. 


Démonstration. En deux parties. 


(1) Si À est équilibré Pour tout [a] < 1, nous avons à A € À. En particulier pour a = 0 nous 
voyons que 0 € À. 


(2) Si À est absorbant Si x € X, alors il existe p tel que Àx € À pour tout |A] < p. En 
particulier avec À = 0 nous avons encore 0 € À. 


LEMooEEKYo0oVCnBMq 
Lemme 7.180 ([221|). 
Dans un espace vectoriel topologique sur K = R ou C, tout ouvert contenant 0 est absorbant". 


Démonstration. Soïent un ouvert U contenant 0 et x € X. Nous considérons l’application 


Mm KxXX—X 


ae (7.155) 


qui est continue par définition 7.161. La partie m !{(U) c K x X est un ouvert contenant (0, x0). 
Par définition 7.15 de la topologie produit, il existe un r > 0 et un ouvert B de X contenant *9 
tels que 

(0,0) € B(0,r) x Bcm l(U). (7.156) 


73. Définition 1.458 
74. Distance, définition 7.107. 
75. Définition 7.109. 
76. Définition 7.172. 
77. Définition 7.177. 
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Si À < r, alors nous avons 


Xto = M(X, xo) € m(B(0,r),B) € U. (7.157) 


LEMooKBRIooUAAPXV 


Lemme 7.181. 
Si À est équilibré et si £ Æ 0 (dans R ou C), alors 


A = [élA (7.158) 


Démonstration. Vu que le corps K est R ou ©, il existe s € K tel que |s] = 1 et £ = s|£] (prendre 
s = é/lé|). Vu que |s| = 1 et que À est équilibré, sA € À et donc £A = sfé|A € [é]A. 
Pour l'inclusion dans l’autre sens, nous savons que |s-1| = 1 et donc que [£|A = s-l£A © 


EA. 


Lemme 7.182 ([214, 1]). 
Soit un espace vectoriel topologique. 


LEMooYSWXooNqAcOQ 


ITEMooSWWQooTreWIE 


(1) Soit un ouvert A autour de 0 dans l’espace vectoriel topologique V. Il existe Ô > 0 dans le 


(2) Tout voisinage de O0 contient un ouvert équilibré. 


corps K et un voisinage ouvert W de 0 tel que AW € À pour tout |À] < PTEMooXZNHooGVp1pu 


ITEMooRLVSooGihcLce 
(3) Tout voisinage de O0 contient un ouvert équilibré et symétrique. 
Démonstration. En plusieurs parties. 
(1) Pour (1) Nous savons que 0 : 0 = 0 et que l’application 
:KxV—V 
Ï (7.159) 
À,zt Àt 


— 


— 


est continue. La partie f-1(A) contient (0,0). Il existe donc un voisinage ouvert $ de 0 dans 
K et un voisinage ouvert W de 0 dans V tel que S x W € f-!(A). 
Puisque K est un corps dont la topologie est métrique ©, il existe une boule S’ = B(0,6) & S. 
Donc nous avons f(S' x W) € À et pour tout [A] < 6, AW € A. 
Pour (2) Soit un voisinage ouvert © de 0 dans V. Par le point (1), nous considérons un 
voisinage W de 0 et un à > 0 tel que AW € © pour tout |A] < 6. 
Nous posons 

U = {Aw < tel que [À] < ô,we W}. (7.160) 


Nous avons U € © par définition de W. De plus U est équilibré parce que si [ul < 1, et si 
x E U, il existe |A] < 0 et w € W tels que x = Aw. Alors ux = uw. Nous avons [uAÀ| < 6 et 
donc uw € U. 


Pour (3) Nous considérons U équilibré comme dans (2). Ensuite nous posons VU = Un 
(—U). La partie U’ est symétrique, elle est ouverte (intersection d’ouverts). Et elle est équi- 
librée parce que si x € U’ et [À] < 1 alors : 


— xeEU et U est équilibré, donc Àx € U. 


— x€e —U et U est équilibré, donc il existe y € U tel que x = —y. Pour ce y nous avons 
Aye U et donc Àx = —]ye —U. Donc Àx € —U. 


— Au final, Xx EU n(—-U) = U' et U’ est équilibré. 


78. Le corps K est un corps valué, et donc métrique par la définition 7.173. 
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LEMooQEFRooHAxOys 
Lemme 7.183 ([222]). 
Soit un espace vectoriel topologique V ainsi qu'un voisinage ouvert O de 0 dans V. Il existe des 
voisinages ouverts U\1 et U2 de 0 dans V tels que 


U1 + U2 € O. (7.161) 
Démonstration. Par définition d’un espace vectoriel topologique, l’application 


JVxV-Vv 


(7.162) 
Ty T+Y 


est continue. Donc la partie f-!1(©) est un ouvert de V x V (c’est la définition 7.32(2) de la 
continuité). La définition 7.15 de la topologie produit, appliquée au point (0,0) € V x V implique 
qu'il existe des voisinages U1 et U2 de 0 dans V tels que 


UxU@c f {(O). (7.163) 


Donc f(U1 x U2) € © et en particulier U1 + U2 € ©. 
PROPSommeTopologique 

Proposition 7.184 ([214, 1]). 

Soit V un espace vectoriel topologique, et O un voisinage ouvert de 0. Il existe un voisinage ouvert 

U de 0 tel que 


(1) U est symétrique”, 

(2) U est équilibré 0 

(3) U vérifie U +U € O. 

(4) U vérifie U+U+U+UcCO. 


Démonstration. En plusieurs petits pas. 


(1) Le point de départ Le lemme 7.183 donne des voisinages ouverts U1 et U2 de 0 dans V 
tels que Ui + U2 € O. 


(2) Symétrique En posant U’ = U; n U2 n (—U;) n (—U2), on a un sous-ensemble symétrique 
de U; et U2 qui vérifie VU’ + U”' € Ui + Us € ©. De plus U’ est encore un voisinage ouvert de 
0 dans V. 


(3) équilibré C’est le moment d'utiliser le lemme 7.182. La partie U’ contient un voisinage 


ouvert U” de 0 qui est symétrique et équilibré. Ce U” vérifie encore U” + U" € ©. 


(4) En 4 parties Maintenant nous ré-appliquons tout ce que nous venons de faire à U” pour 
obtenir un voisinage symétrique et équilibré de 0 tel que U + U € U’. Nous avons alors 
U+U+U+UcCO. 


Notons que ce U vérifie à fortiori U + U € ©. 


LEMooKLOKooËEfKhgN 
Lemme 7.185 ([220, 223]). 
Soit une partie B d’un espace vectoriel topologique. 
(1) Si B est équilibré, alors la fermeture B est équilibrée. ITEMooL.ZZE0oAqoQVO 


(2) Si B est équilibré et si 0 € Int(B), alors Int(B) est équilibré. 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


79. Définition 7.175. 
80. Définition 7.176. 


526 CHAPITRE 7. TOPOLOGIE GÉNÉRALE 


7.8.4 Limite de suites 


Proposition 7.186 ([1]). 
Soit une suite (xx) dans l’espace vectoriel topologique X. L'élément x est une limite de (xx) si et 
seulement si 0 est une limite de (x — xy). 


PROPooTJQPooMHtOAv 


Démonstration. En deux parties. 


(1) = Supposons que x est une limite de (xx). Soit un ouvert © autour de 0. La partie © + x 
est un ouvert autour de x (proposition 7.186). Donc il existe N tel que si n > N, alors 
Zn € O + x. Pour ces valeurs de n nous avons x, — x € ©. 


(2) = Soit un ouvert © autour de +. La partie © — x est un ouvert autour de 0. À partir de là 
la preuve fonctionne comme dans l’autre sens. 


PROPooQIQSooHbNKkIy 
Proposition 7.187 ([1]). 


Soient deux suites (xx) et (yx) dans l’espace vectoriel topologique X. Si x est une limite®! de (xx) 
et si y est une limite de (yx), alors x + y est une limite de (xx + Yx). 


Démonstration. En deux parties 


(1) Le cas r=y—=0 Nous commençons avec x = y = 0. Soit un ouvert À autour de 0. La 
proposition 7.184 nous permet de considérer un voisinage U de 0 tel que U € Aet U+U € A. 


Vu que 0 est une limite de (x4), il existe N tel que x, € U pour tout b > N. Quitte à prendre 
le maximum, nous supposons aussi que yn € U pour n > N. Avec ça, Zn + Yn EU +U € À. 
Cela montre que 0 est une limite de (xx + y). 


(2) Le cas général Nous supposons que x est une limite de (x}) et que y est une limite de 
(yk). La proposition 7.186 nous dit que 0 est une limite de x — xx et de y — yx. La première 
partie dit alors que 0 est une limite de 


ke rt Xp + y —Yyr = Te + yx — (x + y). (7.164) 


La proposition 7.186, prise dans l’autre sens nous dit alors que x + y est une limite de 
ke Tg + Yk. 


7.8.5 Espace topologique localement convexe 
DefPJokvAa 


Définition 7.188 ([220]). 
Un espace topologique est localement convexe il admet une base de voisinages de l’origine dont 


les éléments sont des parties convexes. 
PROPooUAXHoo0UGhRbu 


Proposition 7.189 ([220]). 

Un espace vectoriel topologie localement convexe a une base de voisinage constituée d'éléments qui 
Son : 

(1) ouverts 

(2) absorbants 

(3) converes 

(4) équilibrés 


Démonstration. Soit un voisinage N de 0 dans l’espace vectoriel topologique X. Vu que X est 
localement convexe, il existe un voisinage convexe W de 0 contenu dans N. Par le lemme 7.182, 
W contient un ouvert équilibré U. Nous considérons enfin l’enveloppe convexe $ = Conv(U) de U, 
et nous montrons que l’intérieur Int(S) vérifie tout ce qu’il faut. 


81. Limite de suite, définition 7.13. 
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ouvert Parce que c’est un intérieur. 
convexe L'intérieur d’un convexe est convexe par le lemme 7.148. 
absorbant Tout ouvert contenant 0 est absorbant par le lemme 7.180 


contient 0 La partie ÜU contient 0 parce qu’elle est équilibrée et le lemme 7.179. Vu que U est 
ouvert, il contient un voisinage de tout ses points. Donc 0 est dans l’intérieur de U. Il est 
donc également dans l’intérieur de son enveloppe convexe. 


équilibré Par le lemme (2) parce que c’est un ouvert contenant 0. 
contenu dans N Nous avons les inclusions U & W & N. Étant donné que W est convexe, nous 
avons aussi Conv(U) € W, et donc 


Int(S)c S=Conv({U)cWECN. (7.165) 


THOo0oPTLUooJLaHGE 
Théorème 7.190 ([220]). 
Soit un espace vectoriel topologique localement convexe’. Il existe une base de voisinages B de 0 
tels que : 


(1) les éléments sont absorbants et absolument convexes**. 
(2) pour tout À,B € B, il existe WE B tel que WE AnB, 


(3) pour tout AE B, et pour tout p > 0, il existe WE B tel que W € pA. 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


Voici une réciproque du théorème 7.190. 
THOooKNXGooEebnxlI 


Théorème 7.191 ([220)). 
Soit en espace vectoriel X et une collection B de parties de X vérifiant 


(1) les éléments sont absorbants et absolument convexes. 

(2) pour tout À,B € B, il existe WE B tel que WE AnB, 

(3) pour tout AE B, et pour tout p > 0, il existe WE B tel que W € pA. 
Alors il existe une unique topologie Tr sur X telle que 

(1) T est compatible avec la structure vectorielle de X, 

(2) (X,T) est localement convexe 


(3) la collection B est une base de voisinages de 0 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


7.8.6 Limite de suites 


Si (&h) est une suite dans un espace vectoriel topologique, rien ne garantit qu’elle ait une limite, 
ni qu’elle soit unique. Donc lorsque nous écrivons 


Zn 2 x, (7.166) 


nous sous-entendons seulement que x est une limite. 

De même, dans la proposition 7.193, nous montrerons que æzy + Yn Es y et À V, xx. 
Cela signifie que si x et y sont des limites de (x,) et (y1), alors x + y est une limite de (x, + Yn) 
et que Àx est une limite de (Ax,). 

Si V est un espace vectoriel topologique dans lequel il n’y a pas unicité de la limite **?, nous ne 
pouvons pas exactement dire que le processus de limite est une opération linéaire sur l’ensemble 
des suites convergentes. 


82. Définition 7.188. 
83. Absolument convexe : convexe et équilibrée. 
84. La proposition 7.57 dit qu’il y a unicité de la limite dans les espaces topologiques séparés. 
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LEMooJDJVooHUKdSe 
Lemme 7.192. 
Soient un espace vectoriel topologique V ainsi qu'une suite (xh) dans V. Nous avons 
En 7 & (7.167) 
si et seulement si 
14 
En — T — 0. (7.168) 


Dans la proposition 7.193, nous considérons un espace vectoriel topologique. Il n’y a pas de 


produit. Pour la convergence 


voir la proposition 10.27. 
PROPooZRCBooKiJhDg 


Proposition 7.193 ([1]). 

Soit V, un espace vectoriel topologique. Soient deux suites convergentes xn Es zx Et Yn y ainsi 

que ÀE K. Alors ITEMooSHPAooQyEkgT 
(1) 


Ln + Un > T+y. 7.170 
ITEMooYHHYooYATzW 


(2) 
\En —> Àx. (7.171) 


Démonstration. En deux parties. 


(1) (1) Nous allons montrer que æy + Yn — (T + y) A 0 ; ce sera suffisant par le lemme 7.192. 
Soit un ouvert © autour de 0. Soient des ouverts Ui et U2 autour de 0 tels que U1 + 2 € O 
(lemme 7.183). 

Vues les convergences de (x,) et de (y), il existe un N tel que n > N implique x, — x € U: 
et Yn — y € U2. Dans ce cas, Zn + Yn — (x + y) E Ui + 2 € O. 


Donc pour n > N nous avons bien y — yn — (x + y) € ©, ce qui signifie que 4 + Yn V, x + y. 
(2) (2) En plusieurs étapes. 
(2a) zn — x 3,0 C'est le lemme 7.192. 


(2b) Àzy — Àt —,0 Soit un ouvert © autour de 0. Par le lemme 7.164, il existe un ouvert 


U autour de 0 tel que AU € ©. Comme x, — x = 0, il existe N tel que n > N implique 
In —tEU. 

Pour ces N et n nous avons aussi À(x, — x) € AU € ©. Nous avons donc démontré que 
ln — ÀT ne 


(2c) Conclusion Encore le lemme 7.192 nous permet de déduire que At» je 


7.9 Applications continues 


7.9.1 Continuité 


La définition de la continuité d’une fonction est donnée en 7.32. 


7.194. 
Lorsque nous écrivons f: X — Y, nous entendons que f est définie sur tout X, mais pas qu’elle soit 
surjective sur Ÿ. En particulier, pour que f soit continue en a, il faut que a soit dans le domaine 
de définition de f. 

Dans le cas de fonctions IR — KR, l’espace X sera la partie de R sur laquelle f sera définie, et 
la topologie sera la topologie induite de R. 
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PROPooUXBCooIzLaPe 
Proposition 7.195 ([224)). 
Soient deux espaces topologiques X et Y. Une application f: X — Y est continue ®® si et seulement 
si pour tout x e X et pour tout voisinage ® V de f(x), la partie f-!(V) est un voisinage de x 
dans X. 


Démonstration. En deux parties. 
(1) = Soient ze X et un voisinage V de f(x) dans Y. Il existe alors un ouvert © de Y tel que 

fæ)eOc y. 

La partie f-1(O) vérifie : 
— f-1(O) est un ouvert de X parce que f est continue. 
— ze f (0) 
— f (0) € FN). 

Donc f-!(V) contient un ouvert contenant x. Donc f-!(V) est un voisinage de x dans X. 


(2) = Soit un ouvert © de Y. Nous devons prouver que f-1(©) est un ouvert de X. Pour cela 
nous prouvons que f-!(©) contient un ouvert autour de chacun de ses éléments et utilisons 
le théorème 7.8. 


Soit donc x € f !(O). La partie © est un voisinage de f(x). Donc f (©) est un voisinage 
de x. Il existe donc un ouvert V de X tel que 


zseVcef {(O). (7.172) 


Nous en déduisons que f-!1(©) contient bien un ouvert autour de chacun de ses points. 


La proposition 7.283 donnera des détails sur ce qu’il se passe lorsque l’espace est métrique. 
ThoESCaraB 


Théorème 7.196. 
Une fonction f: X — Y est une fonction continue si et seulement si elle est continue en chacun 
des points de X. 


Démonstration. En deux parties. 


(1) = Nous supposons que f est une fonction continue. Soient a € X et W un voisinage de 
f(a). Nous considérons ©, un voisinage ouvert de f(a) contenu dans W ; l’ensemble f-!(©) 
est alors un ouvert contenant a, et l’image de f-!(©) par f est bien entendu contenue dans 
W. 


(2) = Soit © un ouvert de Y. Pour prouver que f 1(©) est un ouvert de X, nous allons 

considérer un élément a € f-!(©) et montrer qu'il existe un voisinage ouvert de a contenu 
dans f-1(O); le théorème 7.8 nous assurera alors que f (©) est ouvert. 
L'ensemble © est un voisinage ouvert de f(a) parce que a a été choisi dans f-!(O). Donc 
la continuité de f en a nous assure qu'il existe un voisinage W de a tel que f(W) € ©. 
En prenant un ouvert contenant a à l’intérieur de W nous avons un voisinage ouvert de a 
contenu dans f (©). 


Remarque 7.197. 

À cause de l’éventuelle non unicité de la limite, deux fonctions continues et égales sur un sous- 
ensemble dense ne sont pas spécialement égales. Ce sera vrai sur les espaces métriques et plus 
généralement pour les espaces séparés. Voir l'exemple 7.54 et la proposition 7.105. 


85. Définition 7.32. 
86. Définition 7.4 
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LEMooCQQWooVSAWiy 
Lemme 7.198 ([1]). 
Soient une fonction f: X — Y, et un point d’accumulation a € X°7. La fonction f est continue 
en a si et seulement si f(a) est une limite de f en a. 


Démonstration. En deux parties. 


(1) = Nous supposons que f est continue en a € X. Soit un ouvert V de Ÿ contenant f(a). 
Par continuité de f au point ® a, il existe un voisinage U de a tel que f(U) € V. À fortiori, 
f (U\a) € W comme le demande la définition de la limite. 


(2) = Nous supposons que f(a) est une limite de f(x) lorsque x tend vers a. Si W est un 
ouvert de Ÿ contenant f(a), il existe un voisinage V de a dans X tel que f (V\a) c W. Mais 
puisque f(a) € W, nous avons f(V) € W. 


7.9.1.1 Continuité séquentielle 
DefENiolCV 


Définition 7.199. 
SiX et Y sont deux espaces topologiques, une fonction f : X — R est séquentiellement continue 
en un point a si pour toute suite convergente tn — à dans X nous avons f(xn) — f(a) dans Y. 


7.200. 
Nous allons maintenant voir deux résultats disant que si une fonction est continue, alors elle peut 
être permutée avec une limite de suite. Dans le cas des espaces métriques, la proposition 7.245 
montrera la réciproque : si pour toute suite x, — a, nous avons limh_, f(4n) = y, alors f a une 
limite en a qui vaut y. 

fContEstSeqCont 
Proposition 7.201 (Permuter limite et fonction continue|1]). 
Soient deux espaces topologiques X et Y ainsi qu’une fonction f: X — Y. Soitae X etle Y. Si 


Loi FE) = 6, (7.173) 


Ta 


alors, pour toute suite (xx) telle que xx — à, on a 
lim f(xx) = €. (7.174) 


Démonstration. Nous considérons une suite (x4) qui converge vers a dans X. Soient V un voisinage 
de £ et W un voisinage de a tels que f(W) € V (définition 7.102 de la continuité en un point). Par 
la convergence xx — à, il existe N tel que pour tout k > N,x,e W, et donc tel que f(xy) € V, 
ce qui donne la continuité séquentielle de f. 


7.9.1.2 Application réciproque 
DEFooBFCQooPyKvRK 


Définition 7.202 (injection, surjection, bijection). 
Soient des ensembles À et B ainsi qu’une application f: À — B. 
(1) La fonction f est injective si f(x1) = f(x2), implique 1 = 2. 
(2) La fonction f est surjective si tous les éléments de B sont atteints, c’est-à-dire si pour tout 
ye B il existe x € À tel que f(x) = y. 


(3) La fonction f est une bijection entre À et B si elle est injective et surjective, c’est-à-dire 
si pour tout y € B il existe un unique x € À tel que f(x) = y. 


87. Un point d’accumulation de X n’est pas spécialement dans X, si X est un sous-espace d’un autre. Par exemple 
0 est un point d’accumulation de ]0,1[ dans R. Ici nous supposons que a € X, sinon il n’y a de toute façon pas de 
continuité en a. 

88. Continuité en un point, définition 7.32(1). 


7.9. APPLICATIONS CONTINUES 931 


La surjection et l'injection sont des propriétés bien différentes qu’il convient de prouver sépa- 
rément. De plus une même « formule » peut définir une application injective, surjective, bijective 


ou non selon le domaine sur laquelle nous la considérons. 
DEFOoTRGYooRxORpY 


Définition 7.203. 
Soit f: À — B une bijection. L'application réciproque de f est la fonction 


fl: B—A 


7.175 
y lex e À tel que f(x) = y. ) 


Plus généralement si f: X — Y est une application quelconque et si S € Y nous notons 
f S) = {x e X tel que f(x) e S}, (7.176) 


et dans le cas où S est réduit à un unique élément y, nous notons f—l(y) au lieu de f HE Si 
de plus f-!(S) est un singleton x, nous noterons f-!(S) = x et non f !(S) = {x}. 

Les plus acharnées parmi les lectrices se rendront compte de la différence ontologique fonda- 
mentale entre x et {x}. 


7.9.2 Continuité et topologie induite 
PROPooNPLBooPfmmym 


Proposition 7.204 ([1]). 

Soit une fonction f: X — Y, continue sur l’ouvert À de X au sens où elle est continue en chaque 
point de A. Alors la fonction restriction f: À — Y est également continue pour la topologie sur À, 
induite®® de X. 


Démonstration. Soit a e À, et montrons que f est continue en a, c’est-à-dire que f(a) = f(a) soit 
une limite de f en a. Soit un voisinage V de f(a) dans Ÿ. Par la continuité de f, nous avons un 
ouvert W de X tel que 


F(W\{a}) € v. (7.177) 


La partie W n À est un voisinage de a pour la topologie de À, et vérifie 
F(W n A\{a}) € V. (7.178) 


donc f(a) est une limite de f pour x — a. La fonction f: A — Y est continue en chaque point de 
À. 


Au niveau de la notion de continuité, il n’y a pas trop de changements en passant de R à Q 


muni de la topologie induite. 
EXooHWIIooYYbfGE 


Exemple 7.205. 

Que signifie d’être continue pour une fonction f: Q — IR? D’après le théorème 7.196, il s’agit 
d’être continue en chaque point de Q. Il s’agit donc, par la définition 7.32 que pour tout qg € Q, le 
nombre f(q) soit une limite de f pour æ — q. 

L'espace d'arrivée étant R, un voisinage de f(q) est pris comme une boule de taille €. La 
continuité de f exige qu'il y ait un voisinage W de q dans Q tel que pour tout g € W (différent 
de q), | f(g) — f(g')| < e. 

Qu'est-ce qu’un ouvert dans Q ? D’après la définition 7.24 de la topologie induite, ce sont les 
ensembles À n © avec © ouvert dans R. Tout cela pour dire que pour tout € > 0, il doit exister 
6 > 0 tel que pour tout q € Q tel que 0 < |q — q'| < Ô, nous ayons |f(q) — f(q/)| < €. 

Bref, c’est exactement le mécanisme usuel de la continuité sur KR, sauf qu’il ne faut considérer 
que les rationnels. AN 


89. Définition 7.24. 
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LEMooHAODooYSPmvH 
Lemme 7.206 (Application partielle[1]). 
Soient trois espaces topologiques X1, X2 et Y. Nous considérons une fonction continue f: X3 x 
X9o — Y ainsi que x1 € X1. Alors l'application 


: Xo — Y 
Fe (7.179) 
to + f(r1,%) 


est continue. 


Démonstration. Soit un ouvert © de Y ; par hypothèse sur f, la partie f (©) est ouverte dans 
X1 x Xo2. Notre but est de prouver que g-!(O) est un ouvert de X2. Nous avons : 


g (©) = {x2 € Xo tel que (x1,x%2) e f !(O)}. (7.180) 


Nous considérons æ2 € g_!(©) et nous prouvons qu’il existe dans X2 un voisinage de 2 entièrement 
contenu dans g_1(O). 

Étant donné que (x1,x2) est dans f-!(©) qui est ouvert, la définition 7.15 de la topologie sur 
X1 x X2 nous donne des ouverts À; dans X: et A2 dans X: tels que 


(x1, 2) € A x Ac f l(O). (7.181) 


Nous montrons à présent que A2 € g !(O). Soit yo € Ao. Par construction (x1,y2) € A1 x A © 
ft (O), donc 
g(y2) = f(x1,ÿ2) € O. (7.182) 


Cela termine la démonstration. 


7.9.3 Continuité et connexité Lo 
PropConnexiteViaFonction 


Proposition 7.207. 
Un espace topologique X est connexe si et seulement si toute application continue X — Z est 
constante. 


Démonstration. En deux parties. 


(1) = Soit une fonction continue f: X — Z. Supposons qu’elle ne soit pas constante. Nous 
allons en déduire que X n’est pas connexe. En effet supposons que f(a) = u et f(b) = v avec 


u £ v. Nous posons 
A= f"(u) 


2. (7.183) 


La partie À est ouverte parce que {u} est ouvert dans Z. La partie B est également ouverte 
parce que c’est une union d'ouverts : B = |), f —l(n). La parie À contient a, et B contient 
b. 


Voila. Ce sont deux parties ouvertes non vides, disjointes qui recouvrent X. Donc X n’est 
pas connexe. 


(2) = Encore par l’absurde nous supposons que X n’est pas connexe. Soient deux ouverts À 
et B qui font ce qu'il faut. Alors en définissant 


Ji X—2Z 
0 sixeAÀ (7.184) 
Tr 
1 sireB, 


nous avons une fonction continue non constante sur X à valeurs dans Z. 


90. La topologie sur Z est celle de l’ensemble des parties. C’est également la topologie induite de R, mais ça n’a 
aucune importance pour l'instant 
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NORMooSCAWooPFnrV;j 
7.208. 
Pour mettre les idées au clair, dire qu’une partie À n’est pas connexe 
ouverts O1 et O2 vérifiant 


%1 signifie qu'il existe des 


ITEMooRACDooKLaVXP 

(1) GnAzg ITEMooNCQVooN jAYCT 

(2) nO= cg ITEMooPIHJooNJYpQo 
(3) AC O1 L O2. 

LemConncontconn 


Lemme 7.209. 
L'image d’un connexe par une application continue est connexe. 


Démonstration. Soit une application continue f: X — Ÿ entre deux espaces topologiques. 

Nous allons prouver la contraposée. Soit À une partie de Y telle que f(A) ne soit pas connexe. 
Nous allons prouver que À elle-même n’est pas connexe. Vu que f(A) n’est pas connexe, il existe 
des ouverts disjoints O1 et O2 recouvrant f(A) et intersecant tous deux À. Nous prouvons que À 
n’est pas connexe en considérant les parties A1 = f 1(@:) et A2 = f !(O2), et en vérifiant les 
propriétés de 7.208. 


(1) À; est ouvert Les parties À; sont ouvertes parce qu’elles sont images inverses d’ouverts 
par une fonction continue (définition 7.32(2)). 


(2) Pour (1) Nous devons prouver que A;n A Z @, c'est-à-dire qu’il existe un x € f l(O;)nA. 


Nous commençons par considérer y € ©; n f(A). Nous avons d’une part f-l{y) € f -1(O;) = 
A;. D'autre part, vu que y € f(A), nous avons f-l(y) n À £ G. Nous prenons donc x € 


fr) nA. 
Ce x vérifiéxe f l{y)n Ac AnA. 

(3) Pour (2) Sixe f l(O;)n f-!(O2), alors f(x) € O1 n Où, ce qui contredirait le fait que 
O1 et O2 sont disjoints. Il n’y a donc pas d'éléments dans l'intersection de f-1(©1) et de 
F7" (Oo). 


(4) Pour (3) Si f (O1) et f (O2) ne recouvrent pas À, il existe un x dans À qui n’est dans 
aucun des deux. Dans ce cas, f(x) est dans f(A), mais n’est ni dans O1, ni dans O», ce qui 
contredirait le fait que ces deux derniers recouvrent f(A). 


Nous déduisons que À n’est pas connexe. Et donc le lemme. 


Une application de ce lemme sera le théorème des valeurs intermédiaires 10.89. 


Exemple 7.210. 
Les espaces topologiques R et IR? ne sont pas homéomorphes. A 


Démonstration. Supposons par l'absurde que f: R — R? soit un homéomorphisme. Nous posons 
E = f(R\{0}) et z0 = f(0). Puisque f est bijective nous avons 


E = R?\{2}, (7.185) 
qui est connexe. 


Comme E est connexe et que fl est continue, le lemme 7.209 nous dit que f-1(E) est connexe. 
Mais par définition, f-!(E) = IR\{0} qui n’est pas connexe. 


91. Connexe, définition 7.64. 
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7.9.4 Continuité et compacité 
ThoImCompCotComp 


Théorème 7.211. 


L'image d’un compact”? 


par une fonction continue est un compact. 


Dans le cadre des espaces vectoriels normés, ce théorème est démontré en la proposition 7.279. 


Démonstration. Soit K € X, un ensemble compact, et étudions f(K) ; en particulier, nous consi- 
dérons Q, un recouvrement de f(K) par des ouverts. Nous avons 


f&)e (J 0. (7.186) 
OEQ 
Par construction, nous avons aussi 
Ke |) "#10; (7.187) 
OEQ 


en effet, si x € K, alors f(x) est dans un des ouverts de Q, disons f(x) € ©, et évidemment, 
ze f !(O). Les f !(O) recouvrent le compact K, et donc on peut en choisir un sous-recouvrement 
fini, c’est-à-dire un choix de {f-!(©1),...,f-1(O,)} tels que 


Ke) 10) (7.188) 
i=1l 
Dans ce Cas, nous avons 
f(K) € (JO, (7.189) 
i=1 


ce qui prouve la compacité de f(K). 


7.9.5 Continuité de la réciproque sur un compact 
LEMooNEEVooSeHYzx 


Lemme 7.212. 
Soit un espace compact K et un espace topologique séparé X. Si f: K — X est une bijection 


continue, alors f est un isomorphisme d'espaces topologiques. 
LEMooPLGTooATIGov 


Lemme 7.213 ([225]). 
Soit une application continue et bijective f: K — X où K est compact et X est métrique. Alors 
la réciproque f-!: X — K est continue. 


Démonstration. Nous allons montrer que si F est fermé dans K, alors (f-!)-!(F) est fermé dans 
X. Le lemme 7.36 conclura. Si F est fermé dans K, alors F est compact (lemma 7.91(1)). Le 
théorème 7.211 dit que l’image d’un compact par une application continue est compacte. Donc 
f(F) est compact dans X. Mais comme X est métrique, tout compact est fermé (lemme 7.91(2)). 
Bref, f(F) est fermé. 


LEMooKSDKooDbKKeB 
Lemme 7.214 ([1|). 
Soit un espace vectoriel normé V ainsi qu’une application continue f : [a,b] — V. Nous supposons 
que f:[a,b[ — V est injective. 
Alors en posant S — f([a, b[). l’application réciproque 


ft: 8 — [ab (7.190) 


est continue. 


92. Définition 7.74. 
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Démonstration. Pour tout x € [a,b] nous notons V, = f([a,x]). 

Par hypothèse d’injectivité, l'existence de fl sur V, est assurée. En ce qui concerne sa conti- 
nuité, pour chaque x € |a, b], l'application f: [a, x] — V, vérifie le lemme 7.213. Donc l’application 
réciproque fl: V, — [a,x] est continue. 

Le théorème 7.196 dit alors que l'application f—! est donc continue en chaque point de V, 
pour tout a < x < b. Elle est donc continue en chaque point de f ([a, b[) parce que chacun de ces 
point est dans un V,. Le théorème 7.196 (dans l’autre sens) montre alors que —l: S — [a,b[ est 
continue. 


7.10 Produit fini d’espaces vectoriels normés 
sec_prod 
Dans cette section nous parlons de produits finis d'espaces. Cela ne signifie pas que chacun des 
espaces soient séparément de dimension finie. 


7.10.1 Distance et norme produit 


DefZTHxrHA 
Proposition-Définition 7.215 (Distance produit). 
Si (E1,d1),..., (En, dn) sont des espaces métriques alors la formule 
dx, y) = max di(ts, yi) (7.191) 
i=1,..,n 
définit une distance sur le produit cartésien E = FE x ... x E,. Elle est la distance produit. 


La définition de la norme sur un produit d'espaces vectoriels normés découle immédiatement 


de la définition de la distance 7.215 : 
DefFAJgTCE 


Lemme-Définition 7.216 ([226]). 

Soient V et W deux espaces vectoriels sur K. Si (vi, w1) et (v2, w2) sont des éléments de VxW et 
si À est un élément de K, alors les opérations suivantes donnent une structure d'espace vectoriel 
au produit V x W : 


— (ui, wi) + (va, wa) = (v1 + va, wi + w2) 
— X(v1,w1) —= (Avi, AW). 


Démonstration. Il faut seulement faire les vérifications d'usage. 


LEMooFQMSooLmdlIvD 
Lemme-Définition 7.217. 
Soient deux espaces vectoriels normés V et W. 
(1) L'opération 
EqNormeVx 
le) fav = max{ fol. (nel). (7185 


est une norme ® sur V x W. 


(2) La topologie de cette norme ** est la même que la topologie produit” sur V x W. 


Démonstration. En plusieurs parties. 
(1) Norme On doit vérifier les trois conditions de la définition 7.149. 
— Soit (v,w) dans V x W tel que |(v,w)]yxw = max{kvy,|]wlw} = 0. Alors |v|y = 0 
et [ww = 0, donc v = Ov et w = Ow. Cela implique (v, w) = (0»,0x) = Oyxw. 
— Pour tout a dans R et (v,w) dans V x W, la norme Ja(v,w)|yxw se calcule de la façon 
suivante : 


la(v,w)fvxw = max{lav|v, lawlw} = |a|max{lvlv, ww} = lall(v, w)|vxw. 
(7.193) 


93. Définition 7.149. 
94. Topologie associée à une norme : c’est la topologie associée à la distance correspondante, définition 7.155. 
95. Topologie produit, définition 7.15. 
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Soient (v1,w1) et (v2, w2) dans V x W. 


ICu1, wi) + (ua, wa)|vxw = max{lui + v2v, lui + wow} 
max{ [01] + lv2llv, lui + lwlw} 
max{|01|v, lwiluw} + max{|ulv, |w2lw} 


Qui, w1)vxw + |(u2, w2) [y xw. 


/\ 


(7.194) 


IN 


(2) Équivalence 
Dans cette preuve, nous considérons la « topologie de V x W » comme étant la topologie 
produit et « la topologie métrique de V x W » la topologie de la norme produit. 


(2a) 


7.218. 


Dans un sens La définition 7.15 de la topologie produit dit qu’une prébase de V x W 
est donnée par 


{B(v, r) x B(w,s) tel queve V;wEeWir,s> 0}. (7.195) 


Nous prouvons maintenant que la partie S = B(vo,r) x B(wo, s) est un ouvert de l’espace 
(V x W, |. vxw). Pour cela nous prouvons que tout élément de S contient un voisinage 
métrique contenu dans S. 

Soit (v1,w1) € S. Nous posons 


d((v1,w1), (vo, wo)) = ê < maxfr, s}. (7.196) 


Nous considérons € > 0 et nous montrons que si € est assez petit, B((v1, w1),€) ce S. 
Pour cela nous considérons (v,w) € B((v1,w1),€) et nous calculons un tout petit peu : 


d((v, w), (vo, wo)) < d((v,w), (v1, w1)) + d((v1, w1), (vo, wo)) (7.197a) 
<E +0. (7.197b) 


Si e est assez petit, le tout reste plus petit que max{r, s}. 

Donc $ est bien un ouvert métrique par le théorème 7.8. Vu que la topologie métrique 
contient une prébase de la topologie produit, tout ouvert de la topologie produit est un 
ouvert de la topologie métrique. 

Dans l’autre sens Soient un ouvert métrique © ainsi que (vo, wo) € © ; il existe r > 0 
tel que 


B((vo, wo), r) c ©. (7.198) 
Nous affirmons que B(vo,r) x B(wo,r) est contenu dans ©, de telle sorte que © soit un 
ouvert de la topologie produit. Pour (v1,w1) € B(vo,r) x B(wo,r) nous avons 


d((u1,w1), (vo, wo)) = max{|v1 — vol, wi — wo} < r (7.199) 


parce que v1 € B(vo,r) et wi € B(wo,r). 
Donc tout élément de © admet un voisinage « produit » contenu dans © ; donc © est 
ouvert pour le topologie produit. 


En particulier, pour la topologie de la norme maximum, la convergence d’une suite implique la 
convergence « composante par composante » par la proposition 7.60. 


On remarque tout de suite que la norme |.|, sur IR? est la norme de l’espace produit R x R. 
En outre cette définition nous permet de trouver plusieurs nouvelles normes dans les espaces IR?. 
Par exemple, si nous écrivons IR comme R? x IR? on peut munir IR de la norme produit 


l(t1,%2, 23,%4) 0,2 = max{|(a1,22)00, |(t3, 24) 2} 
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Les applications de projection de l’espace produit V x W vers les espaces «facteurs», V W sont 
notées proj et projw et sont définies par 


projy: VxW—V 


(7.200) 
(v,w) + v 
et 
rojw:VxW—WwW 
projw (7.201) 
(v,w) + w. 
Les inégalités suivantes sont évidentes 
rojy(v,w < |(v,w 
Iproju(o,)lv < I(o-w)lvaur _—. 
Iprojw(v,w)lw < |(v,w)|vxw. 


La topologie de l’espace produit est induite par les topologies des espaces «facteurs». La construc- 
tion est faite en deux passages : d’abord nous disons que une partie À x B de V x W est ouverte si 
À et B sont des parties ouvertes de V et de W respectivement. Ensuite nous définissons que une 
partie quelconque de V x W est ouverte si elle est une intersection finie ou une réunion de parties 
ouvertes de V x W de la forme À x B. 

Ce choix de topologie donne deux propriétés utiles de l’espace produit 


(1) Les projections sont des applications ouvertes. Cela veut dire que l’image par projy 
(respectivement projw) de toute partie ouverte de V x W est une partie ouverte de V 
(respectivement W). 


(2) Pour toute partie À de V et B de W, nous avons Int(A x B) = Int À x Int B ou 


Une propriété moins facile à prouver est que pour toute partie À de V et B de W nous avons 
AxB=AXx B. Voir le lemme 11.68. 

Ce que nous avons dit jusqu'ici est valable pour tout produit d’un nombre fini d'espaces vec- 
toriels normés. En particulier, pour tout m > 0 l’espace IR”? peut être considéré comme le produit 
de m copies de R. 


Exemple 7.219. 
Si V et W sont deux espaces vectoriels, nous pouvons considérer le produit Æ = V x W. Les 
projections proj,, et projw, définies dans la section 7.10, sont des applications linéaires. 

En effet, la projection proj,,: V x W — V est donnée par proj,(v,w) = v. Alors, 


projy ((v, w) + (v',w')) = projy ((v + v'), (w + w')) 
=v+v (7.203) 
= projy(v,w) +projy(v',w'), 
et 
projy (A(v,w)) = projy ((Av, Aw)) = Av = Aprojy(v,w). (7.204) 


Nous laissons à la lectrice le soin d’adapter ces calculs pour montrer que proj, est également une 

projection *6. A 
PropDXR_KbaLC 

Proposition 7.220. 

Si © est un voisinage de (a,b) dans Vx*W alors © contient un ouvert de la forme B(a,r) x B(b;r). 


Démonstration. Puisque © est un voisinage, il contient un ouvert et donc une boule 


B((a,b),r) = {(v,w) e V x W tel que max{|v — al, |w — b|} < r}. (7.205) 


Évidemment l’ensemble B(a,r) x B(b,r) est dedans. 


96. Écrivez-moi si ça pose un problème. 
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7.11  Topologie réelle en dimension n 


Nous considérons sur R la topologie donnée par la valeur absolue, et sur IR” celle de la topologie 
produit ou du maximum, qui sont identiques par le lemme 7.217. 

En particulier, nous n’avons pas encore la norme donnée par |x|] = 5,2, parce qu’elle 
demande la racine carré, définie en 10.92. 


7.11.1 Ouverts et fermés 


La proposition suivante est évidemment à mettre en rapport avec le théorème 7.8. 
PROPooEQYJooBbPiA;j 


Proposition 7.221. 
Une partie À de R” est ouverte si et seulement si pour tout a € A il existe r > 0 tel que B(a,r) € À. 


Démonstration. C’est la définition 7.101 de la topologie métrique. 


LemMESSExh 
Lemme 7.222. 
Pour tout x e R" et tout r > 0 la boule®" B(x,r) est ouverte. 


Démonstration. Afin de prouver que la boule est ouverte, nous prenons un point p € B(x,r), et 
nous allons montrer qu’il existe une boule autour de p qui est contenue dans B(x,r). 

Étant donné que pe B(x,r), nous avons d(p, x) < r. Prouvons que la boule B(p,r—d(p, x)) est 
contenue dans B(x,r). Pour cela, nous prenons p’ € B(p,r — d(p,x)), et nous essayons de prouver 
que p' € B(x,r). En effet, en utilisant l'inégalité triangulaire, 


d(x,p') < d(x,p) + d(p,p') < d(x,p) +7 — d(p,x) =r. (7.206) 


7.11.2 Point d’accumulation, point isolé 


Les définitions de point d’accumulation et de point isolé sont 7.30 et 7.31. Nous voyons main- 
tenant ce que ces définitions donnent dans le cas de l’espace topologique R. 


Lemme 7.228. 
Soit DCR. Un point a € D est isolé dans D si et seulement si il existe & > 0 tel que 


[la—e,a+e] n D = {a}. (7.207) 
Autrement dit, il existe un intervalle autour de a dans lequel a est le seul élément de D. 


Lemme 7.224. 
Un point a € R est un point d’accumulation de D si pour tout € > 0, 


(Ia —e,a+ l\{a}) nD#@. (7.208) 


Autrement dit, quel que soit l'intervalle autour de a que l’on considère, le point a n’est pas tout 
seul dans D. 


Exemple 7.225. 
Prenons D = [0,1[0]2,3]. Cet ensemble n’a pas de point isolé, et l’ensemble de ses points d’accu- 
mulation est [0,1] L [2,3]. 

Notez que les points 1 et 2 sont des points d’accumulation de D qui ne font pas partie de D. Il 
est possible d’être un point d’accumulation de D sans être dans D, mais pour être un point isolé 
dans D, il faut être dans D. A 


97. Définition 7.109. 
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Exemple 7.226. 
Soit D = {L}nen. Tous les points de cet ensemble sont des points isolés (vérifier !). Aucun point 


de D n’est point d’accumulation. Cependant 0 est un point d’accumulation. PA 
EXooWOYQooJolaTV 


Exemple 7.227. 
Soit D = |1,2[ U {12}. Le point 12 est adhérence, mais pas d’accumulation parce que le voisinage 
19, 14[ n’intersectionne pas D\{12}. A 


7.11.3 Limite de suite 


Définition 7.228 (Limite d’une suite dans R??). 
Une suite de points (x») dans R”' est dite convergente si il existe un élément Le R” tel que 


: . 
Ve>0,1NeN tel que Vn>N,|æ—{|<e. qconaLinsn ts) 


Dans ce cas, nous disons que L est la limite de la suite (x,) et nous écrivons lim x, = £ ou plus 
simplement zn — L. 


Remarque 7.229. 
Nous n’'écrivons pas « limy-,0 Zn » parce que, lorsqu'on parle de suites, la limite est toujours 
lorsque n tend vers l'infini. Il n’y a aucun intérêt à chercher par exemple lim,_,47, parce que cela 
vaudrait 4 et rien d’autre. 

Ceci est une différence importante avec les limites de fonctions. 


Lemme 7.230 (Unicité de la limite). 
Îl ne peut pas y avoir deux nombres différents qui satisfont à la condition (7.209). En d’autres 
termes, si L et l' sont deux limites de la suite (xh), alors £ = W'. 


Démonstration. Soit € > 0. Nous considérons N tel que 
tn — £] < € (7.210) 


pour tout n > N,et N'> 0 tel que 
[tn — L'| < € (7.211) 


pour tout n > N’. Maintenant, nous prenons n plus grand que N et N’ de telle façon que les deux 
équations pour %, soient vérifiées en même temps. Alors 


le 8] = le œn tan — | < le œal + ler — 2] < 2. (7.212) 


Cela prouve que |£— £/| = 0. 


Le théorème de Bolzano-Weierstrass 7.136 dit que dans le cas métrique, la compacité séquen- 
tielle est équivalente à la compacité. 


7.12  Topologie et distance 

LemDUJXooWsnmpL 
Lemme 7.231. 
Soient (X1,d1) et (X2,d2) des espaces métriques séparables. Alors X1 x X2 admet une base dénom- 
brable de topologie constituée de produits de boules de X1 par des boules de X2. Plus précisément 
si À; est dénombrable et dense dans X; alors l’ensemble des produits 


{B(y,r1) x B(y2,r2)} peu, (7.213) 


rEeQ+ 


est une base de topologie pour X1 x X2. 
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Démonstration. Soit © un ouvert de X1 x X2 et (21,72) € ©. Par définition de la topologie 
produit Ÿ, il existe r1,r9 € Q* tels que B(x1,r1) x B(x2,r2) € ©. Les parties À; étant denses, il 
existe y; € B(x;,r:/2) n Ai. Avec ces choix nous avons x; € B(y;, ©). Nous avons donc 

T2 


(x1,22) € Bu, 3) x B(y2, 5). (7.214) 


Il est facile de voir que By;,r;/2) € B(x:;,r;). En effet si 2; € By, ri/2) alors 


dia, vi) < d(zi, y) + d(yi, vi) < _ La _ = Ti. (7.215) 
Au final, 
"1 T2 
(x1, 2) E B(y1, 5) X B(y, n. c ©. (7.216) 


Définition 7.232. 
Si (X,dx) et (Y,dy) sont des espaces métriques, une isométrie est une application bijective 
f: À — Y telle que pour tout x,y € X nous ayons 


dy (f(x). f(y)) = dx (x, y). OO spl 


Remarque 7.233. 
Une application vérifiant (7.217) est automatiquement injective. En pratique, il ne faut donc vérifier 
que la surjectivité. 


Exemple 7.234 (Manque de surjectivité). 
Si X = [0,00[ et f(x) = x + 1 alors f vérifie (7.217) pour la distance d(x, y) = [x — y|, mais n’est 
pas surjective. A 


Proposition-Définition 7.235 (Groupe des isométries). 
Si (X,d) est un espace métrique, 
(1) l’ensemble des isométries de X, noté Isom(X) est un groupe pour la composition. 
(2) Ce groupe agit fidèlement” sur X. 
PropLYMgVMJ 


Proposition 7.236. 
Une isométrie entre deux espaces métriques est continue. 


Démonstration. Soient f: À — YŸ une application isométrique et © un ouvert de Ÿ. Soit a € 
F7 (O); si d(a,b) < r, alors d(f(a), f(b)) < r et donc be f-T(B(f(a),r)). Donc autour de chaque 
point de f-!(©) nous pouvons trouver une boule ouverte contenue dans f1(©), ce qui prouve 
que f_!(O) est ouvert. 


Exemple 7.237. 
Si X est un ensemble, nous pouvons écrire la distance discrète : 


0 six =7y 
d(x — 7.218 
(a, 4) | si T £ y. 

La topologie résultante est la topologie discrète, côtoyée dans l'exemple 7.10 100, 
Pour cette métrique, le groupe des isométries est le groupe symétrique de X, c’est-à-dire le 
groupe de toutes les bijections de X sur lui-même. A 


98. Définition 7.15. 
99. Si vous ne savez pas ce que c’est, alors vous avez zappé la définition 2.30. 
100. Vérifiez-le tout de même! 
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7.12.0.1 Distance point-ensemble 


Définition 7.238. 
Si À est une partie de l’espace métrique (X, d) et si x € X, nous disons que la distance entre À 
et x est le nombre 


d(x, À) = inf d(x, a). Faderi stef 


ac À 


TX 


FIGURE 7.1: La distance entre x et À est donnée par la distance entre x et p. Les distances entre 
x et les autres points de À sont plus grandes que d(x, p). LabelFigDistanceEnsemble 


7.12.1 Suites et espaces métriques 
PROPooJY0OUooZWocoq 


Proposition 7.239 (Caractérisation séquentielle de la limite[1]). 
Soient deux espaces métriques X et Y ainsi qu’une fonction f: X — Y. Soitae X etleY.Ona 


tes EqLimooJYODooznogeas 


Ta 


si et seulement si, pour toute suite (xx) telle que xx — à, on a 
EqLi Y Z 
lim f(œx) = £. a ot) 


Par ailleurs, l’une des deux limites existe si et seulement si l’autre existe. 


Démonstration. Le sens direct est la proposition 7.201. Pour la réciproque, nous passons par la 
contraposée. C'est-à-dire que nous supposons que Ÿ n’est pas une limite de f pour x — a. Il existe 
un € tel que pour tout 6, il existe un x vérifiant dx(x; a) < ô et dy (f(x); 0) > €. 

Nous construisons à présent une suite de la manière suivante. Pour ô — L nous considérons 
xn tel que dx(xn; a) < 6 et dy(f(æn); 0) > €. Cette suite converge vers a, mais la suite f(xA) ne 
converge manifestement pas vers £ : elle ne rentre jamais dans la boule B(L,€). 


Une fonction continue est séquentiellement continue. Dans les espaces métriques la proposition 
suivante montre que la réciproque est également vraie et la continuité est équivalente à la continuité 


séquentielle. Cela n’est cependant pas vrai pour n’importe quel espace topologique. 
PROPooBHRBooJMZYSg 


Corolaire 7.240 (Caractérisation séquentielle de la continuité en un point{[1|). 
Si X et Y sont des espaces métriques, alors une fonction f: X — Ÿ est continue en un point si 
et seulement si elle est séquentiellement continue en ce point. 


Démonstration. Paraphrasons la preuve précédente. Nous supposons que X et Ÿ sont métriques. 
Si f n’est pas continue en a, il existe € > 0 tel que pour tout 6 > 0, il existe x tel que |xr — a < Ô 
et | f(x) — f(a)| > €. Nous considérons un tel e et pour chaque n > 1 € N nous considérons un æ} 
correspondant à à = +. Cela nous donne une suite x, — a dans X mais | f(x,) — f(a)| reste plus 
grand que €. Cela montre que f n’est pas non plus séquentiellement continue. 
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Définition 7.241 (Fermeture séquentielle[227]). 
Une partie F d’un espace topologique X est dit séquentiellement fermé si la convergence d’une 
suite (x) de F vers x implique que x appartient à F. 


Les espaces métriques ont une propriété importante que la fermeture séquentielle est équivalente 


à la fermeture. 
PropLFBXIjt 


Proposition 7.242 (Caractérisation séquentielle d’un fermé). 
Soient X un espace métrique et F € X. L'ensemble F est fermé si et seulement si toute suite 
contenue dans F et convergeant dans X converge vers un élément de F.. 


Démonstration. Une suite contenue dans un fermé ne peut converger que vers un élément de ce 
fermé : c'était la proposition 7.51. Le point le plus important est donc l’autre sens : si toute suite 
d'éléments de F' converge dans F' alors F' est fermé. 

Par contraposée, supposons que X\F ne soit pas ouvert. Alors il existe x € X\F pour lequel 
tout voisinage intersecte F. En prenant x4% € B(x, À), nous construisons une suite contenue dans 
F', convergeant vers x qui n’est pas dans F. 


Le lemme suivant est précisément la version « espace métrique » du corolaire 7.52; mais, 


donnons-en une preuve tout de même. 
LemLimAbarA 


Lemme 7.243. 
Soit X un espace métrique, et soit (tn) une suite convergente contenue dans un ensemble A € X. 
Alors la limite x, appartient à À. 


Démonstration. Supposons que nous ayons une partie À de X, et une suite (x,) dont la limite £ se 
trouve hors de À. Dans ce cas, il existe un r > 0 tel que 0! B(£,r) n À = G. Si tous les éléments 
xn de la suite sont dans À, il n’y en à donc aucun tel que d(xn, £) < r. Cela contredit la notion de 
COnVETBence Zn — L. 


CorAdhEstLim 
Corolaire 7.244. 
Soit X un espace métrique, À € X eta € A. Alors il existe une suite d'éléments dans À qui 
COnverge vers à. 


Démonstration. Si a € À, alors nous pouvons prendre la suite constante x, = a. Si a n’est pas 
dans À, alors a est dans 04, et pour tout n, il existe un point de À dans la boule B(a, d). Si nous 
nommons Zn Ce point, la suite ainsi construite est une suite contenue dans À et qui converge vers 
a (ce dernier point est laissé à la sagacité de la lectrice.). 


En termes savants, ce corolaire signifie que la fermeture À est composé de À plus de toutes les 


limites de toutes les suites contenues dans À. 
PropXIAQSXr 


Proposition 7.245 (Caractérisation séquentielle de la continuité[1]). 

Soient X et Y deux espaces topologiques séparés. Nous supposons que X est métrisable. Une 
application f : X — Ÿ est continue sur X si et seulement si elle est séquentiellement continue sur 
X. 


Démonstration. Le sens direct est déjà prouvé dans la proposition 7.201. Nous nous concentrons 
donc sur la réciproque. 

Soit © un ouvert de Y ; nous allons voir que le complémentaire de f1(©) est fermé dans X. 
Pour cela nous considérons une suite convergente xx À, x avec zx € X\f-1(O) pour tout k. Nous 
allons montrer que x € X\f-!(O) et la caractérisation séquentielle {2 de la fermeture conclura 
que X\f-1(O) est fermé. 


101. Une autre manière de dire la même chose : si £{ # À, alors d(£, A) > 0. 
102. Proposition 7.242, valable parce que la topologie de X provient d’une métrique. 
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Pour tout k, nous avons f(xx) € X\O, et f(xx) Le f(x) parce que f est séquentiellement 
continue. Vu que f(x;) est une suite dans le fermé Y \O, la limite est également dans Y\©. Nous 
en déduisons que f(x) € Y\O, de telle sorte que x e X\f-1(O). 


PropCJGIooZNpnGF 
Proposition 7.246. 
Si X et Y sont deux espaces métriques et f,g: À — Y sont deux fonctions continues égales sur 
une partie dense de X alors f = g. 


Démonstration. Les fonctions f et g sont séquentiellement continues (proposition 7.129, ou pro- 
position 7.240). Soient À un ensemble dense dans X sur lequel f et g sont égales, et x # À. Vu 
que À est dense, il existe une suite a, dans À telle que a, — x. La séquentielle continuité de f et 
g donnent 


F(an) — f(x) (7.222a) 
g(an) — g(x), (7.222b) 


mais pour tout n, f(an) = g(an). Par unicité de la limite !% dans Y, f(x) = g(x). 


7.12.2 Espace métrisable 
DEFooGLTUooJjaSmI 


Définition 7.247 (Espace vectoriel topologique métrisable[228]). 
Un espace topologique est métrisable si il existe une distance compatible avec la topologie. 


PROPooXWBTooCvGLO;j 
Proposition 7.248 ([229)). 


Soit un espace topologique métrisable X. ITEMooOXVRooBsKwruq 


(1) Tout fermé de X est une intersection dénombrable d'ouverts. 


(2) Tout ouvert de X est une union dénombrable de fermés. 


Démonstration. Soit une métrique d compatible avec la topologie de X et un fermé A. Nous posons 
1 

V, = {x € X tel que d(x, À) < —-}. (7.223) 
n 


Et juste pour faire simple nous notons W = X. 


(1) Les parties V, sont ouvertes Soit x € V,. Trouvons un voisinage de x contenu dans V, 
afin de pouvoir encore invoquer le théorème 7.8. D'abord, vu que x € V,, il existe a € À tel 
que d(x, a) < À (ici les inégalités strictes sont importantes). 


Soient € > 0 que nous fixerons plus bas, et y € B(x,e). L’inégalité triangulaire donne 
1 
d(y, a) < d(y,x) + d(x, a) < e+ —. (7.224) 
n 


Nous pouvons donc choisir € de telle sorte que d(y,a) < 1/n. Avec ce €, nous avons, pour 
tout yEe B(x,e) : 


d(y, À) < d(y,a) < (7.225) 


31H 


et donc y € Vh. 


(2) À est l’intersection des V, Nous avons évidemment À € V, pour tout n. Et d’autre part, 
si a € (ex Vn alors d(a, À) < 1 pour tout n. Cela implique d(a, À) = 0, et donc a € A par 
le lemme 7.141. 


103. Proposition 7.105. 
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Ceci démontre le point (1). 
En ce qui concerne la seconde partie, nous appliquons la première partie au complémentaire. 
Si © est ouvert, O° est fermé et 


= fl (7.226) 
neN 
ce qui donne immédiatement 
O={Jv% (7.227) 
neN 
où les VŸ sont fermés. 
CORo0oTWFYooCNMieM 


Corolaire 7.249. 
Si X est un espace topologique métrisable, alors X accepte une base dénombrable de topologie 
autour de chaque point. 


Démonstration. Il s’agit seulement de remarquer que les singletons sont fermés et d'appliquer la 
proposition 7.248. 


7.13 Suites de Cauchy, métrique et espaces complets 


7.13.1 Généralités 
DefZSnlbPc 


Définition 7.250 (Suite de r-Cauchy, espace vectoriel topologique[230, 214]). 
Soit E un espace vectoriel topologique. Une suite (xx) dans E est une suite T-Cauchy si pour 


tout voisinage U de 0 il existe N € N tel que xx — x EU pour tout k,l> N. 
DEFooVQDBooNxprFU 


Définition 7.251 (Espace 7-complet). 
Nous disons qu’une partie À d’un espace vectoriel topologique est T-complet si toute suite T- 


Cauchy d'éléments de A converge !% vers un élément de A. 
DEFooX0YSooSPTRTn 


Définition 7.252 (Suite de Cauchy, espace métrique). 
Une suite (ax) dans un espace métrique (V, d) est de Cauchy si pour tout € > 0 dans R, il existe 
N tel que sin,m > N alors d(as, am) < €. 


Notons qu'ici, même si l’espace V n’a rien à voir avec KR, nous prenons € dans R et la distance 
à valeurs dans IR. Cela semble une évidence, mais il faut se rendre compte que IR commence à 
prendre une place centrale dans nos constructions. Ce n’était pas le cas du temps où nous parlions 
de suites de Cauchy et de complétude dans des corps totalement ordonnés (définitions 1.367). Dans 


ce contexte, le € était pris dans le corps lui-même. 
DEFooHBAVooKmqerL 


Définition 7.253 (Métrique complète). 
Soit (E,d) un espace métrique. Nous disons que la métrique d est complète si toute suite de 
Cauchy dans (E,d) converge dans E. 


7.254. 
Ces définitions méritent quelques remarques. 


(1) Dans le cas des espaces vectoriels topologiques, nous définissons les notions de suite r-Cauchy 
et d’espace topologique 7-complet. Nous ajoutons le préfixe 7 pour indiquer que ce sont des 
notions topologiques. 


(2) Dans le cas des espaces métriques, nous définissons la notion de métrique complète. C’est 
bien la métrique qui est complète, et non l’espace. En effet nous allons voir dans l’exemple 
7.256 que le même espace topologique peut accepter plusieurs distances différentes (donnant 
la même topologie) donnant lieu à des suites de Cauchy différentes. 


104. Définition 7.13. 
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(3) Si un espace vectoriel a une topologie issue d’une distance, rien ne dit que ses suites 7-Cauchy 
et ses suites de Cauchy sont les mêmes. Ce sont deux notions à priori séparées. Si V est un 
espace vectoriel topologique que l’on peut munir de deux distances di,d2 donnant toutes 
deux la topologie, dire que V est 7-complet, dire que di est complète et dire que d2 est 
complète sont trois choses différentes. Même si les trois topologies sont identiques. 


(4) Nous allons bien entendu voir que dans de larges gammes d’exemples, les notions de suite de 


Cauchy et 7-Cauchy coincident. 
DefVKuyYpQ 


Définition 7.255 (espace de Banach, algèbre de Banach[231]). 
Un espace de Banackh est un espace vectoriel normé complet % pour la topologie de la norme. 
Une algèbre de Banackh est une algèbre commutative et associative qui est un espace vectoriel 


normé complet. 
EXooNMNVooXyJSDm 


Exemple 7.256 (La complétude n’est pas une propriété topologique[232]). 
Le fait pour un espace d’être complet n’est pas une propriété topologique, mais une propriété mé- 
trique. Plus exactement, il existe des espaces topologiques isomorphes, mais dont l’un est complet 
et l’autre non. 

Nous considérons la distance suivante sur NN : 
À 


l 
dix, y) = Ë — (7.228) 


Pour vérifier que cette formule définit bien une distance (définition 7.107), le seul point non im- 
médiat est l'inégalité triangulaire : 


1 1 


T 7A 


1 1 1 1 
den = ]<h- +0] 462 +4 (7.229) 


Au niveau de la topologie induite par cette distance, c’est la topologie discrète. En effet, soit 
æeNete>0; nous voulons déterminer la boule B(x,e) en résolvant l'équation 


= = >. (7.230) 


É Ti : 
pour y € N. Nous trouvons que ae et y rt soit 


1 
2 7.231 
4 L + € ( a) 
1 
y < (7.231b) 


Si e est assez petit, la seule solution entière est y = x. Les ouverts sont donc toutes les parties 
parce que tous les singletons sont ouverts. 
L'espace topologique associé à (IN, di) est donc la topologie discrète 
Si nous considérons par contre la distance usuelle sur N, à savoir d(x, y) = |x—yl|, nous obtenons 
encore la topologie discrète. Nous avons donc un isomorphisme d’espaces topologiques 


106 


(N, d) = (N, di). (7.232) 


Nous pouvons même donner un isomorphisme explicite : f(n) = n. 
La suite (x,) = n est une suite de Cauchy dans (N, di) parce que si € > 0 est donné, il suffit de 
prendre N assez grand pour avoir + < € (possible par le lemme 1.424) nous avons, pour n,m > N: 


11 
n N 


1 1 
| Pr. (7.233) 


| < 
n m 


105. Définition 7.253. 
106. Celle dont toutes les parties sont des ouverts. 
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Or cette suite ne converge pas. Soit en effet un candidat limite k. Calculons 
1 l 1 
d H=f-:)-- 0. 7.234 
i(œnk) = fe 5] 224 (7.234) 


L'espace (N, di) n’est pas complet. 
Notons que cette suite n’est pas de Cauchy dans (N, d). 
En résumé : 


(1) Les espaces topologiques (IN, d) et (IN, d;1) sont isomorphes. 

(2) Ils ont les mêmes notions de suites convergentes : une suite convergente pour l’un est conver- 
gente pour l’autre. 

Ils n’ont pas les mêmes notions de suites de Cauchy. 

Dans (N, di), il existe des suites de Cauchy qui ne convergent pas (pas complet). 

L'espace (IN, d) est complet, mais (IN, di) n’est pas complet. 

Le fait pour un espace topologique métrique d’être complet n’est pas intrinsèque à sa topo- 
logie : la complétude est une propriété de la distance. La complétude est une propriété de la 
métrique, et non de la topologie qui s’en suit. 


A 
PROPooUVGGooNffWJW 
Proposition 7.257 ([233]). 
Le dual\%7 d’un espace de Banach'® est de Banach. 
7.13.2 Espace topologique métrique 
Dans les espaces vectoriels topologiques métriques, il n’y a pas d’ambiguïté. 
PropooUFEUooLelImr 
Proposition 7.258 (Caractérisations avec la distance d). 
Soit (E,d) un espace vectoriel topologique métrique. ItemooROYMooAQCXn 


109 vers x si et seulement si pour tout ee R ül existe 


(1) Une suite (x») dans E est convergente 
Ne tel que pour tout n > Ne nous avons d(xn, x) < €. 
(2) Une suite (xn) dans E est de Cauchy !! si pour tout e € R, il existe un N. tel que sip,q > N., 


nous avons d(Tp, Ta) < €. 


Démonstration. En ce qui concerne la convergence : 


(1) Sens direct 
Nous supposons que x, — x dans Æ. Soit € > 0; vu que B(x,e) est un ouvert contenant x, 
il existe un Ne > 0 tel que k > Ne implique x4 € B(x,e). Cela signifie d(x, xx) < €. 

(2) Réciproque 
Nous supposons que pour tout € > 0, il existe Ne > 0 tel que si k > Ne alors xx € B(x,€). Soit 
un ouvert © autour de x. Nous sommes dans un espace métrique ; ergo la topologie est donné 
par le théorème 7.109 et en particulier la liste des ouverts est donnée par (7.101). Il existe 
donc une boule B(x,e) incluse à ©. Pour tout k > Ne nous avons alors 4 € B(x,e) € ©. 

En ce qui concerne les suites de Cauchy : 

(1) Sens direct Si (x,) est une suite de Cauchy et si € > 0 est donné, alors B(0,e) est un 
voisinage de 0 et il existe N: tel que si p,q > Ne alors x, — x4 € B(0,e). Posons ü = xp — x; 
en utilisant l’invariance par translation (lemme 7.154(1)) nous avons 


d{u, 0) = d{xp — %g,0) = d(tp, Ta). (7.235) 


Par conséquent d(xp, ta) < €. 


107. Définition 4.125. 
108. Définition 7.255. 
109. Définition 7.13. 
110. Définition 7.250. 


7.13. SUITES DE CAUCHY, MÉTRIQUE ET ESPACES COMPLETS 947 


(2) Réciproque Soit © un voisinage de 0. Il existe € tel que B(0, €) € ©. Par hypothèse il existe 
Ne tel que d(x»,x4) < € dès que p,q > Ne. En utilisant encore l’invariance par translation 
nous avons 


dns t) = dr; = zx 0), (7.236) 


et comme cela est plus petit que €, nous avons x, — x, € B(0,€) € O. 


PROPooZZNWooHghltd 
Proposition 7.259 ([234]). 
Toute suite convergente dans un espace métrique est de Cauchy. 


Démonstration. Nous utilisons les caractérisations de la proposition 7.258 des suites convergentes 
et de Cauchy. 
Soit un espace métrique (X, d) et x, — L une suite convergente. Si € > 0, la proposition 7.258(1), 
dit qu’il existe N tel que pour tout n > N nous ayons d(x,,l) < €. Par conséquent si n,m > N 
alors 
dre) dés +ad(br.) Se (7.237) 


Cela prouve que (x,) est une suite de Cauchy. 


7.13.3 Compacts, fermés 
PROPooRMADOooZ1gXwy 


Proposition 7.260 (Séparation [214, 235]). 
Soit V, un espace vectoriel topologique. Soient des parties K et F de V telles que : 


(1) K est compact, 
(2) F est fermé, 
(D KNnF=G. 


Alors il existe un voisinage U de 0 tel que 
(K+U)n(F+U) = G. (7.238) 
Autrement dit, la topologie d’un espace vectoriel topologique sépare les fermés des compacts. 


Démonstration. Soit un élément x € K. La partie F° est un ouvert qui contient x; done Æ° — x 
est un voisinage ouvert de 0. 


(1) Quelque chose sans intersection avec F Par la proposition 7.184, il existe un ouvert 
symétrique ÜU, autour de 0 tel que 


Ur + Ur + Ur + Ur CES — x. (7.239) 
En enlevant un des éléments de la somme, nous gardons la même inclusion : 
Uz + Ur + Ur € ES — x. (7.240) 
Et en passant le x de l’autre côté : 
2 + Uz + Ur + Ur © F°. (7.241) 
Cela pour dire que nous avons, pour chaque x € K un voisinage ouvert VU, de 0 tel que 


(+ Ur +U+UW)NE = D. FI 0 2) 


(2) (x + Ux + Uz) N (Ux + EF) = @ Supposons z € (x + Uz + Uz) N (Ux + F), et déduisons une 
contradiction. En particulier z € U, + F et donc il existe u € U,, f € F tel que 2 = v + f. 
Nous avons alors (nous utilisons le fait que U, soit symétrique) 


f=r-vezt+ls (7.243) 
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Mais z est aussi dans x + U, + U,. Donc 
lJessber+ietrts (7.244) 


Cela prouve que æ+Uz+Uz+Ux NF Z# ©, en contradiction avec (7.242). Nous en concluons 
que 
E NL 
Litatie(a ie RoRRÉCROQEES 


(3) Un sous-recouvrement fini Fini de rigoler. Si nous avons un compact dans les hypo- 
thèses, il fallait que ça arrive. Pour chaque x € K nous avons un voisinage ouvert UV, de 0 
et donc un voisinage ouvert x + U, de x. Du coup {U, + x}-ex forme un recouvrement de 
K par des ouverts. Et hop, sous-recouvrement fini (c’est la définition 7.74 d’un compact) : 


nous avons {t;};=1..n tels que 


KE [ex + Uri). (7.246) 


s 
Il 
ma 


Nous posons U = fŸ;_, Ux,. Même si c’est évident, remarquez que U est un ouvert autour de 
0 et que U est plus petit que chacun des U,,. Récrivons (7.245) pour chacun des x; : 


GED A D)A(FER) = ROSE 


Lorsqu'on enlève des éléments dans une intersection vide, l’intersection reste vide. Donc en 
remplaçant des U,, par des U dans (7.247), nous conservons une intersection vide : 


(tx + Us, +U)N (F+U) =. (7.248) 


(4) Conclusion Aucun ensemble de la forme x + U,, + U n’intersecte F + U. L'union ne 
l’intersecte pas non plus : 


[Ge + Uni) +UN(F+U) = 2. (7.249) 
i=1 
Et donc 
(K+U)n(F+U) =, (7.250) 
comme nous le voulions. 
DEFooGTOZooRcvGHg 


Définition 7.261. 
Une distance d sur un espace vectoriel topologique V est dite compatible avec la topologie si la 


topologie induite 1 de d est celle de V. 
DEFooEUXVooEBYhNU 


Définition 7.262. 
Une distance d sur un espace vectoriel V est dite invariante si pour tout x,y,a € V nous avons 


d(x + a,y + a) = d{x, y). (7.251) 


Notons que lorsque nous parlons d’une distance compatible avec un espace vectoriel topologique, 


nous parlons de compatibilité avec la topologie, pas avec la structure vectorielle. 
LEMooZNBAooUhEwJd 


Lemme 7.263 ([1]). 
Soit un espace vectoriel muni d’une distance invariante. Alors 


B(a,r)+x= B(a+x;r). (7.252) 


111. Définition 7.109. 
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Démonstration. Un élément de B(a,r) + x est de la forme y + x avec d(a, y) < r. Nous avons alors 
d{y + x,a + x) = d(y,a) < r, de telle sorte que y+xe B(a+x,r). 

Dans le sens inverse, si y € V vérifie d(a + x,y) < r, alors je prétend que y — x € B(a,r). En 
effet dy — x,a) = d{y-x+x,a+x)=d{y,a+zx) <r. 


FT 
Une version plus complète du lemme suivant sera dans la proposition 11.132 et ce qui suit. 
LEMooIQBXooUEtdoy 
Lemme 7.264. 
Nous introduisons l’ensemble D2 des suites finies dans {0,1} 12. 
L'application 
@: D> = [O, 1[ 
LUE (7.253) 
FE Dion 
i=1 


où (x) est la longueur de la suite finie x est injective. 


Démonstration. Le lemme 1.470 donne la somme partielle de la série géométrique. Dans notre cas, 
q = 1/2. Sixe D,, alors en majorant chacun des c; par 1, 


n À 
1 1 — (1/2) 
< = i=i- (mA EeIT 7.254 
ee (s) = (2) (7.254) 
Donc c’est bon pour dire que & prend ses valeurs dans [0,1{. 

Il reste à voir l’injectivité. Nous supposons que (x) = w(y). Quitte à alonger x ou y par des 
zéros, nous supposons qu’elles ont même longueur N. Enfin nous définissons no le plus petit indice 
pour lequel x; £ y;. Nous avons : 


Le ÿ D EQooEUKNooMo JÉEC 


7 2n0 2 
i=no+l 


Le deuxième terme est majoré de la façon suivante : 


NO mu [ri — wi 
> x l< Re du (7.256a) 
i=no+l i=no+l 
ei 
< à (7.256b) 
i=n0+1 
N îi no À 
:) -X() 
= (7.256c) 
i=1l Ê =] 2 
Ÿ= (ee 1.— (2) rt 
= 2 
L (7.256d) 
1 1 
1 
. (7.256) 


L'égalité (7.255) n’est donc pas possible. Nous déduisons que no n'existe en fait pas et que x = y. 
D'où l’injectivité de «. 


Toujours avec l’application @ du lemme 7.264 nous avons ceci. 


112. C’est en gros ce qui se fera dans 11.130 pour les développements de nombres dans une base donnée, sauf qu'ici 
nous n’avons pas besoin de subtilités sur les queues de suites. 
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LEMooVDPWooWLQzbF 
Lemme 7.265. 
Soient r,s € @(D2) tels que r + s < 1. Alors r + 8 € W(D2). 


LEMooQYILooMimKHS 
Lemme 7.266. 
Soient r, s € p(D2) tels que r + s < 1. Nous posons u =  l(r}), u =" !(s) et w = l(r+s). Si 
k est le plus petit entier tel que wy Æ ux + vg, alors ux = vx = 0 et wy = 1. 


THOo0AGBXooZnvQLKk 
Théorème 7.267 (Espace topologique métrisable[214, 1]). 
Si V est un espace vectoriel topologique. Nous supposons : 
(1) Tout point admet une base dénombrable de topologie *. 
(2) Le singleton {0} est fermé!". 
Alors il existe une distance d sur V telle que 
(1) d est compatible avec la topologie de V,, 


(2) d est invariante par translation. 


Démonstration. Vu que V admet une base dénombrable de topologie, nous en considérons une 
autour de 0 dans V : {A;}ien. 


(1) Nouvelle base de topologie Nous construisons une nouvelle base de topologie {U;};en 
autour de 0 de la façon suivante. La proposition 7.184 donne un ouvert symétrique équilibré 
dans Ao. Nous le nommons U : 


Pour les suivants, Uz, est un ouvert symétrique équilibré dans Uyx n A4 vérifiant 
EQooECMVooll 
Up + Up + Up + Ur € Ar NU. 288) 


Le fait est que Az n U, est un ouvert autour de 0; donc la proposition 7.184 permet de 
construire un ouvert symétrique et équilibré Uz:1 autour de 0 ayant la propriété demandée. 

(2) C’est bien une base Notons d’abord que Ux € 4x. Si © est un ouvert autour de 0, il 
existe k tel que A4 € © : c’est la définition 7.2 d’une base de topologie. Nous avons donc 
Ur € Ag € O, et les {Uz} forment une base dénombrable de la topologie autour de 0. 


(3) Quelques inclusions Notons au passage quelques inclusions. Pour tout n € IN nous avons 


EqBaseTopoMetri 
Un: + Un: En Un: + Uni € Us 6856) 


Unui € Un re) 


et pour tout n, k € IN, nous obtenons alors 


À fortiori nous avons 


EqB T Metri P 
RE UE Un+(#-1) + ÜUnik € Un+t1 + Un+1 À. F7 ASE) 


(4) L’ensemble D Nous considérons l’ensemble D et l’application 4 du lemme 7.264. Nous 
notons D = @(D2) € [0,1[. L'application w: D2 — D est injective, et nous pouvons donc 
parler de w-{!(r) pour tout re D. 

(5) La fonction @ 

Nous définissons maintenant une fonction à valeurs dans la topologie 7y de V : 


: DUT[I, +00[ — Try 


V Siret (7.262) 
re 
2 op l(r);U; sire D. 


113. Définition 7.2. 
114. Attention : dans [214], cela fait partie de la définition d’un espace vectoriel topologique et n’est donc pas listé 
dans les hypothèses de ce théorème. 
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La dernière somme est toujours une somme finie et est un ouvert parce que la multiplication 
par un scalaire et l’addition sont des ouverts. 


Notez aussi que plus r est petit, plus ce sont les grands À qui tendront à avoir 6-l(r) Z 0. En 
effet, pour r = 1/8, nous avons w71(1/8) = (0,0,0,1), et plus généralement pour r < 1/2V, 
les N premiers termes de w”!(r) seront nuls. 


Quelques remarques sur cette fonction. 


(5a) Une égalité facile Si je ne me trompe pas d’un off-by-one, nous avons 


p(1/29) = Un. (7.263) 


(5b) 0e @(r) pour tout r En effet, O(r) n’est jamais vide, c’est toujours un voisinage de 
0. 


(5c) pr) + p(s) c pr+s) Sir+s> 1, c’est clair. Sinon, nous posons u = @ l({r), vu = 
gl (s) et w = -l(r +5). Dans la suite, nous prolongeons w et v pour qu'elles aient le 
même nombre d'éléments que nous notons N. 


Deux cas se produisent : soit w; = u; + v; pour tout 4 soit non. 


(5c.iii) Premier cas Si w; = u; + v; pour tout à, alors en particulier les u; et v; ne 
peuvent pas être 1 en même temps et nous pouvons séparer clairement les termes 
de la somme : 


d(r +s) = > wiU: = » wU; + > VU, = pr) + d(s): (7.264) 


(5c.ii) Second cas Sinon, posons k le plus petit entier tel que wy Æ ux + v4. Alors le 
lemme 7.266 dit que ux = vx = 0 et wy = 1. Nous avons d’abord 


k—1 n k—1 
dr) = D'uUi+ Nue N'uUi + Usa + Une (7.265) 
i=1 i=k+1 i=1 


où nous avons utilisé (7.260) pour tous les derniers termes. De même nous avons : 


k—1 n k—1 
ds) = D'oUi+ V1 vu; € No: + Unar + Urrr: (7.266) 
i=1 i=k+1 i=1 


En combinant, et en utilisant (7.259), 


k—1 k—1 
Pr) + fs) = D Us + D vUi + Ugis + Usa + Une + Uri (7.267a) 
= — ———————— ——————————— 
i=1 i=1 EL 
k—1 
€» wU + Ux (7.267b) 
i=1 
k 
BE 
: > wU, SU RooZKIiogFRHEs a 
i=1 
c(r+s). (7.267d) 
Pour (7.267c) nous avons utilisé le fait que wx = 1. Au final nous avons bien 
gr) + d(s) € plr +5). 


(5d) ® est croissante Dans notre contexte « croissante » signifie que si r < s alors @(r) € 
d(s). Il suffit d'écrire 


@(r) € d(r) + p(s — r) € d(s). (7.268) 
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(6) Définition de la distance (enfin!) Nous définissons l’application 


dié;æ)=0 


(11 


) 


f:V—R 


x + inf{r tel que x € p(r)}, (7.269) 


et ensuite ce qui va être notre distance : 


d(x, y) _ fu : x). FAPEDT ETAGE c ONE nn 


Notons que cet infimum est un réel, et qu’il n’est pas spécialement dans 4(D2). Nous devons 
prouver que ce d est une distance invariante par translation et compatible avec la topologie. 


d est invariante par translation Il s’agit seulement d'écrire d(x + a, y + a) et de remar- 
quer que (y+a)—{(x+a) = y x. 


Oui, car 0 est dans @(r), pour tout r, puisque les U; sont des voisinages de 0. 


d(x, y) = 0 implique x =y Nous montrons que f(x) Æ 0 dès que x Æ 0. Rappellez-vous 


que nous avons posé l’hypothèse que {0} est un fermé dans V. Vu que {x} est un compact !!, 
la proposition 7.260 nous indique qu’il existe un voisinage À de 0 qui ne contient pas x. 

Vu que les {Uz}rken forment une base de la topologie autour de 0, il existe un m0 tel que 
zT £ Un,. Et comme Uz,1 € UZ nous avons 


z É Ur (7.271) 


pour tout # > no. Nous savons aussi que est croissante et que 9(1/2N) = Uxy. Donc pour 


tout € < + nous avons 


@(e) € Ur Or:272) 
et donc x # @(e). Donc 
Fe Æ > 0 (7.273) 


la dernière inégalité est stricte et c’est important. 
En ce qui concerne la distance, si d(x,y) = 0, alors f(y — x) = 0. Cela signifie que y — x = 0 
et donc que æ = y. Ok. 


d(x,y) = d(y,x) Oui, car tous les voisinages considérés sont symétriques. Donc x — y € @(r) 
si et seulement si y — x € o(r). 


d(x,z) < d(x,y) + d(y,z) Nous supposons que x, y et z sont trois points distincts, de telle 
sorte que les trois distances soient strictement positives. 


Soit € > 0. Par définition des distances comme infimums, et grâce au corolaire 1.428, il existe 
r et s dans w(Do) tels que : 


d(x,y) <r < d(x,y) + à et  d(y,z) < s < d(y,2) + ce (7.274) 
En sommant : 
dx, y) + d(y,z) < r + s < d(x,y) + d(y,z) +e. (7.275) 
Vu que 6 est croissante, on a y — x € @(r) et z — y E p(s); donc 
z—x={(y— x) +(2-—/y)Ee dr) + d(s) € pr +5) (7.276) 
Ainsi, pour tout e > Ü,ona 
d(x, 2) <r +s< d(x,y) + d(y,z) + e. (7.277) 


Compatibilité avec la topologie Nous devons montrer que les d-ouverts sont les mêmes 
que les ouverts de la topologie de V. Nous allons utiliser la proposition 7.2. 


115. Les singletons sont toujours des compacts dans les espaces topologiques. 
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(11a) Les ouverts sont des d-ouverts Soit un ouvert © contenant x € V. Alors O — x est 
un ouvert contenant 0, et il existe un n tel que 


Un c O-— x. (7.278) 
Nous avons alors i 
B(0,,)c Un CcO-—x. (7.279) 
Nous utilisant le lemme 7.263 pour additionner x dans toutes les inclusions : 
B(, 9) = B(0, 5) + c 0. (7.280) 


Les boules forment donc une base de la topologie de V. Donc tous les ouverts de V sont 
des unions de boules et sont donc des d-ouverts. 
(11b) Les d-ouverts sont des ouverts 


Considérons une boule B(0,r). Il existe un n tel que B(0,1/2”) € B(0,r) et donc tel 
que 


Un « B(0r). (7.281) 


En procédant par translations et tout ça, on en déduit que les {U, + t}nenN,rev forment 
une base de la d-topologie. Donc les d-ouverts sont des ouverts. 


7.13.4 Équivalence entre Cauchy et 7r-Cauchy 
LEMooIAHSooFkXjvr 


Lemme 7.268. 
Soit un espace vectoriel topologique 5 V et une distance d: V x V — R* compatible! avec la 
topologie de V. Si d est invariante!®, alors les suites de Cauchy pour d et les suites r-Cauchy 
sont les mêmes. 


Démonstration. Nous avons deux implications à prouver. 


(1) Cauchy pour d implique 7-Cauchy Soit (x,), une suite de Cauchy dans V pour d, et un 
voisinage U de 0. Vu que d est compatible avec la topologie de V, il existe une boule ouverte 
B(0, €) incluse à U. Soit N > 0 tel que m,n > N implique d(x»,Æm) < €. Par invariance de 
la métrique, nous avons aussi 


d(0,Zm — Tn) < €, (7.282) 
c’est-à-dire Zm — Zn € B(0,€) € U. La suite (x,) est donc 7-Cauchy. 


(2) r-Cauchy implique Cauchy pour d Soit (x,), une suite r-Cauchy dans V et € > 0. Vu 
que B(0,e) est un voisinage de 0 dans V, il existe N tel que m,n > N implique z» — tm € 
B(0, €). Cela signifie que d(0, x» — Zm) < € et toujours par invariance, que d(xy,Tm) < €. 


Tout ceci nous mène à donner une large classe d’espaces vectoriels topologiques sur lesquelles 

les notions de suites de Cauchy pour une distance et 7-Cauchy coïncident. 
THOo00GQZSooAmQolf 

Théorème-Définition 7.269. 
Soit V un espace vectoriel topologique métrisable -”, alors il admet une métrique d compatible avec 
la topologie telle que une suite dans V est de Cauchy pour d si et seulement si elle est T-Cauchy. 

Une suite de Cauchy dans un espace vectoriel métrique (E, d) est une suite Tr-Cauchy ou de 
Cauchy pour d. 


119 


116. Définition 7.161. 
117. Définition 7.261. 
118. Définition 7.262. 
119. Voir la proposition 7.267 pour une condition suffisante. 
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Démonstration. Soit d'une métrique sur V satisfaisant au théorème 7.267. Vu qu’elle est invariante 


par translation, les suites d-Cauchy sont exactement les suites 7-Cauchy par le lemme 7.268. 
REMooUFQYooUVCCijs 


Remarque 7.270. 
Même si V est métrisable, si on choisit la métrique n’importe comment, on ne peut rien espérer. 


7.271. 
Sur les espaces vectoriels topologiques métrisables, nous pouvons donc parler de suite de Cauchy 
sans préciser si nous parlons de 7-Cauchy ou de d-Cauchy, parce que nous sous-entendons avoir 
choisi une métrique non seulement compatible avec la topologie, mais également invariante par 
translation. 

Il reste cependant à traiter le cas d’un espace vectoriel topologique non métrisable. Dans ce 
cas, il n’y a pas de métrique, et la question de l’équivalence des définitions ne se pose pas. 


Le théorème suivant donne la complétude de R et le critère de Cauchy pour les définitions 
métriques et topologiques usuelles. Lorsqu'on dit que IR est complet, le plus souvent nous parlons 
de ce théorème, et non de 1.439 qui en est un lemme indispensable mais qui parle de notions 
différentes, bien que très liées. 


THOooNULFooYUqQYo 
Théorème 7.272 (Complétude de R, critère de Cauchy[17]). 
Nous avons : 
(1) L'espace métrique (R, d) est complet (définition 7.253). ITEMooUUFCooIVtGgz 


(2) Une suite dans R est convergente (définition 7.13) si et seulement si elle est de Cauchy 
(définition 7.269). 


Démonstration. Tout ce théorème se base sur le fait que la définition de suite de Cauchy dans 
(R, d) et de suite convergente dans (R, d) coïncident avec les définitions correspondantes dans R 
vu comme simple corps ordonné (définitions 1.367). 
Donc si (x,) est de Cauchy dans (R, d), elle est de Cauchy dans le corps ordonné (R, <). Donc 
le théorème 1.439 nous dit que (x,) est convergente dans (R, <). Et donc convergente dans (R, d). 
Toutes les autres affirmations se prouvent de la même manière. 


Si vous n'êtes pas sûr ou si vous ne voulez pas étudier les notations de convergence et de suites 
de Cauchy dans les corps, vous pouvez simplement recopier la démonstration du théorème 1.439 
en remplaçant partout Q par R, et aussi en remplaçant les |x — y| par d(x, y). 


7.273. 
Nous pouvons également mettre une structure d'espace métrique sur € en posant 


d(z,2) =1|2- 2. (7.283) 
PROPoo0IQKooPtyXgm 
Proposition 7.274. 
L'espace métrique (C, d) est complet. 


Démonstration. Commençons par nous rendre compte que pour tout z € C nous avons | Re(z)| < 
||. C’est bon? Vous vous en êtes rendu compte ? Ok. Continuons. 
Soit une suite de Cauchy (24) dans € et € > 0. Si nous posons x; = Re(z;), nous avons 


Ixre — al = |Re(zz — )| < [2x — 4]. (7.284) 
Vu que (zx) est de Cauchy, il existe un N tel quesik,l>N, 
[te — ail < [24 — al < €. (7.285) 


Donc la suite des parties réelles converge par la complétude de (R, d) du théorème 7.272. Notez 
que le d ici n’est pas tout à fait le même, et que la démonstration fonctionne parce que la distance 
prise sur R est la restriction à R de la distance prise sur C. Notons x la limite de (xx). 
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De la même manière la suite des parties imaginaires y, = Im(z;) converge vers un réel que 
nous notons y. Avec tout cela, la suite z; converge dans € vers x + iy. En effet pour € donné et 
pour un k suffisament grand, 


2x — (x + iy)| = | Re(zx) — x + i(m(zx) — y)| < [rx — x] + lyx — yl < €. (7.286) 


7.14 Norme, espace vectoriel normé 
SECooWKJNooKOqpsx 
La valeur absolue est essentielle pour introduire les notions de limite et de continuité pour 
les fonctions d’une variable. Par exemple nous verrons dans la proposition 10.80 que la fonction 
f:R—R est continue en a si et seulement si pour tout € > 0, il existe un 0 > 0 tel que 


[x — al < Ô = |f(x) — f(a)| < €. (7.287) 


La quantité |x — a| donne la « distance » entre x et a; la définition de la continuité signifie que 
pour tout €, il existe un Ô tel que si a et x sont au plus à la distance 6 l’un de l’autre, alors f(x) 
et f(a) ne seront éloignés au plus d’une distance €. 

La valeur absolue, dans KR, nous sert donc à mesurer des distances entre les nombres. Les 
principales propriétés de la valeur absolue sont : 


(1) [x] = 0 implique x = 0, 
(2) lAxl = JAÏx}, 
(3) x + ul < [xl + |yl 


pour tout x,yeRet À€R. 

Afin de donner une notion de limite pour les fonctions de plusieurs variables, nous devons 
trouver un moyen de définir les notions de « taille » d’un vecteur et de distance entre deux points 
de R”, avec n > 1. La notion de « taille » doit satisfaire propriétés analogues à celles de la valeur 
absolue. 

La première notion de « taille » pour un vecteur de R? que nous vient à l’esprit est la longueur 
du segment entre l’origine et l’extrémité libre du vecteur. Cela peut être calculée à l’aide du 
théorème de Pythagore : 


taille de (a,b) = V/a? + b?. (7.288) 


Nous pouvons introduire une notion de distance entre les éléments de IR? de façon similaire : 


d((a ay); (b»; Dy)) = V/(a — be)? + (ay — by). (7.289) 


Cette définition a l'air raisonnable ; est-elle mathématiquement correcte ? Peut-elle jouer le rôle de 
la valeur absolue dans R?? Est-elle la seule définition possibles de « taille » et distance en IR? ? 

Nous voulons formaliser les notions de « taille » et de distance dans R”, et plus généralement 
dans un espace vectoriel V de dimension finie. Pour cela nous nous inspirons des propriétés de la 
valeur absolue. 


7.14.0.1 Critère de Cauchy 
THOooRDYOooJHLfGq 


Théorème 7.275 (Bolzano-Weierstrass, thème 32). 
Toute suite contenue dans un compact admet une sous-suite convergente. 


Démonstration. Nous faisons la preuve par l’absurde en supposant que (xx) n’admette pas de 
sous-suite convergente. Soit a € K ; aucune sous-suite de (x}) ne converge vers a. En particulier, 
il existe un voisinage ouvert ©, de a et une partie finie /, de N tel que xx € ©, seulement pour 
ke L. 
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Les ouverts ©, recouvrent K ; nous pouvons en extraire un sous-recouvrement fini (c’est la 
définition 7.74 de la compactié). Nous avons donc des points a1,...,an tels que 


kel: (7.290) 


nm 
i=1 

et tels que pour chaque O,,, nous avons 74 € O,, seulement pour k € 1,,. Bien entendu, toute la 
suite est dans Æ et donc dans l’union. 


En conclusion, nous avons N = | J#_, L,, ce qui prouve que N est un ensemble fini. Contradic- 
tion avec la proposition 1.117 qui dit que N est infini. 


CORooBTIPooUYWucb 
Corolaire 7.276 (|[1]). 
Une suite dans un compact dont toutes les sous-suites convergentes convergent vers la même limite 
est convergente. 


Démonstration. Soient un espace topologique X, un compact K et une suite (x;) dans K. Nous 
supposons que toutes les sous-suites convergentes de (x};) convergent vers a € X. Nous devons 
montrer que zx Er 

Supposons que ce ne soit pas le cas. Alors il existe un voisinage V de a tel que pour tout NE N, 
il existe k tel que xx £ V. Cela produit une sous-suite hors de V. Cette sous-suite est encore dans 
K et possède donc une sous(-sous)-suite convergente (théorème 7.275). Par hypothèse, cette sous- 
sous-suite doit converger vers a, ce qui est impossible. 


Contradiction et le corolaire est prouvé. 


Lemme 7.277. 
Une suite de Cauchy! dans un espace vectoriel normé admettant une sous-suite convergente est 
elle-même convergente vers la même limite. 


Démonstration. Soit (a,) une suite de Cauchy dans un espace vectoriel normé E et £ la limite 
d’une sous-suite de (a,). Soit e > O0 et Ne N tel que |am — a| < € dès que m,p > N. Nous allons 
montrer que si k > N alors |ax — {| < 2e. Pour cela nous considérons un n > N tel que [an — {| < € 
et nous calculons 


lag — £] < Îax — an] + Jan — #] < 2e. (7.291) 


Dans le cas des espaces de dimension finie, le fait d’être complet est automatique, comme le 


montre la proposition suivante. 
PROPooGJDTooX0oYfw 


Proposition 7.278. 
Soit (E, ||.|) un espace vectoriel normé de dimension finie sur un corps K qui est complet ?1. Alors 
E est complet ??. 


Pour rappel, la complétude de l’espace métrique R est la proposition 1.390. 


Démonstration. Nous considérons une suite de Cauchy (f,) dans E et si {e,} est une base or- 
thonormée de Æ nous définissons les coefficients f} = ÿ}, änaea. La somme sur à est finie par 
hypothèse sur la dimension de Æ. 

Nous avons 


l fn — ml = | NC — Ama)Eal = >. lana — mal?. (7.292) 


120. Définition 7.252. 

121. La définition est 1.367, mais si vous n’avez pas envie de vous embarquer trop loin, dites juste « toutes les suites 
de Cauchy convergent ». Typiquement c’est R ou C. 

122. Définition 7.253. 
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Soit € > 0. Il existe N tel que si m,n > N alors | fr — fm < €. Avec ces conditions sur N, n et m 
nous avons 


> De = tee (7.293) 


(2 


Pour chaque a nous avons donc [ana — @mal < VE: 
Autrement dit, pour chaque à, la suite (äna)nen est de Cauchy dans K et converge donc dans 
K. Soit a, la limite et définissons f = ÿ,, aaea. Nous avons alors 


fn — fl = | D (ana — Ga)eal, (7.294) 


dont la limite n — 0 est bien zéro. Donc la suite (f,) converge vers f € E. L'espace E est alors 
complet. 


PropContinueCompactBorne 
Proposition 7.279. 
Soient V et W deux espaces vectoriels normés. Soient K une partie compacte de V et f: K—W 
une fonction continue. Alors l’image f(K) est compacte dans W. 


Ce résultat est démontré dans un cadre plus général par le théorème 7.211. 


Démonstration. Nous allons prouver que f(X) est fermée et bornée. 


(1) f(K) est fermé Nous allons prouver que si (y,) est une suite convergente contenue dans 
f(K), alors la limite est également contenue dans f(K). Dans ce cas, nous aurons que l’adhé- 
rence de f(K) est contenue dans f(X) et donc que f(X) est fermé. Pour chaque n € N, le 
vecteur %, appartient à f(K) et donc il existe un x, € K tel que f(xn) = Yn. La suite (x) 
ainsi construite est une suite dans le fermé X et possède donc une sous-suite convergente (pro- 

position 7.275). Notons (x/,) cette sous-suite convergente, et a sa limite : lim(x’,) = a € K. 

Le fait que la limite soit dans À provient du fait que K° est fermé. 


Nous pouvons considérer la suite f(x!,) dans W. Cela est une sous-suite de la suite (y,), et 
nous avons lim f(x°,) = f(a) parce que f est continue. Par conséquent nous avons 


fa) = lim f(x.) = limy. (7.295) 


Cela prouve que la limite de (y,) est dans f(K) et par conséquent que f(X) est fermé. 


(2) f(K) est borné Si f(K) n’est pas borné, nous pouvons trouver une suite (x,) dans À telle 


que 
lf(an)lw > n Farxniege 


Mais par ailleurs, l’ensemble K étant compact (et donc fermé), nous avons une sous-suite 
(x},) qui converge dans X. Disons lim(x,) = a € K. 


Par la continuité de f nous avons alors f(a) = lim f(x/,), et donc 


1 F(a)luw = lim | f(x) ll. (7.297) 


La suite f(x!) est alors une suite bornée, ce qui n’est pas possible au vu de la condition 
(7.296) imposée à la suite de départ (x). 


CorFnContinueCompactBorne 
Corolaire 7.280. 
Si f: K — IR est une application continue où K est une partie compacte d’un espace vectoriel 
normé, alors f(K) est borné. 


Démonstration. En effet, la proposition 7.279 montre que f(X) est compact et donc borné. 
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7.15 Espaces métriques 


7.15.1 Espaces métrisables 


Définition 7.281. 


Un espace topologique est métrisable si il est homéomorphe à un espace métrique. 
PROPooKNVUooMbLZoy 


Proposition 7.282. 
Une fonction séquentiellement continue sur un espace métrisable et à valeurs dans un espace mé- 
trique est continue. 


Démonstration. Soient E un espace métrique et D: X — (E,d) un homéomorphisme. Nous sup- 
posons que f: X — Y est séquentiellement continue. Nous considérons l'application f = f o 6-1, 
c’est-à-dire 


JE —Y 
ar f(9""(a)). 


L'application o! est continue et donc séquentiellement continue. De plus f est séquentiellement 


(7.298) 


continue. En effet si ag > a, alors 
(ax) = F(8T"(ax)), (7.299) 


mais D! est séquentiellement continue, donc 9—!(az) en D l(a), ce qui signifie que D! (az) est 
une suite convergente dans X et donc 


dim (ax) = Jim f(674(ax)) = F(674(a)) = F(a). (7.300) 


L'application f est donc séquentiellement continue. Mais étant donné que f est définie sur un 
espace métrique (E) et à valeurs dans un métrique, elle est continue par la proposition 7.245. 
L'application f = f © d est donc continue en tant que composée d’applications continues. 


7.15.2 Fonctions continues 


La propriété suivante donne des caractérisations importantes de la continuité dans le cas des 


espaces métriques. 
PropQZRNpMn 


Proposition 7.283 (Continuité, ouverts et voisinages et limite[236]). 
Soient f: E — F une application entre espaces métriques et a € E. Alors nous avons équivalence 
entre les choses suivantes : ItemCBUoRWJi 


(1) f est continue en a, ténéBtoUTis 


(2) Pour tout voisinage ouvert W de f(a), il existe un voisinage ouvert V de a tel que fe W. 
el . . 1 ! 
(3) Pour toute boule W' = B(f(a),e), il existe une boule V' = B(a,ô) telle que FO) bRuriv 


(4) Ve > 0, 36 > O tel que f(B(a,ô)) « B(f(a),e). ItenYNQpikrii 


(5) limz-,a f(x) = f(a) où la limite est donnée par la définition 7.102, ItemYNQpikeri ii 


(6) Pour tout € > 0, il existe d > 0 tel que |x — a] < Ô implique | f(x) — f(a)| < €. 


La proposition 7.333 nous montrera que ces équivalences tiennent encore lorsque l’espace a une 
topologie de seminormes. 


Démonstration. L'équivalence (1) & (2) est la définition 7.32. L'équivalence (3) (4) est une 
simple paraphrase. 
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Montrons (2) = (3). Si W' — B(f(a), ô), nous avons un voisinage V de a tel que f(V) € W7. 
L'ensemble V contenant une boule autour de chacun de ses points !, il en contient un autour de 
a: V'= B(a,6) € V. A fortiori nous avons f(V’) € W. 

Montrons (3) = (2). Si W est un ouvert autour de f(a), il contient une boule autour de f(a) : 
B(f(a),e)  W. Il existe donc une boule V' = B(a, 6) telle que f(V') & B(f(a),e) c W. 

L'équivalence (1) (5) est la définition 7.32 de la continuité en un point couplée à l’unicité 
de la limite due à la proposition 7.105 parce qu’un espace métrique est séparé. 

Prouvons (5) = (6). Soient € > 0 et V — B(f(a), €). Étant donné que f(a) est une limite de f 
pour x — a, il existe un voisinage W de a tel que f(W) € V. Soit à > 0 tel que B(a,d) € W ; alors 
si |æ—a| < 6 nous avons x € B(x,6) € W et donc f(x) € B(f(a),e), c’est-à-dire | f(a)— f(x)| < €. 

Enfin l'implication (2) = (5) est une réécriture de la définition de la limite en un point. 


Voici un théorème qui parle de fermés emboîtés dans un espace métrique. Le corolaire 7.88 


parle du cas Nn;A; = @ dans un compact. 
ThoCQAcZxX 


Théorème 7.284 (Théorème [237|). 
Soit (E,d) un espace métrique. Il est complet si et seulement si toute suite décroissante de fermés 
non vides dont le diamètre tend vers zéro a une intersection qui se réduit à un seul point. 


Démonstration. En deux parties. 


(1) Condition suffisante 

Soit {Fh}nen une telle suite de fermés emboités. Si nous choisissons des points x, € F}, nous 
obtenons une suite (x,) de Cauchy et qui est par conséquent convergente vu que l’espace est 
par hypothèse complet. De plus, pour chaque N > n, la queue de suite (x,)A1>nN est contenue 
dans Fw et donc converge vers un élément de FN (parce que ce dernier est fermé). Donc la 
limite de (x,) est dans (en Fn- 

De plus cette intersection a diamètre nul parce que le diamètre de f,,ù Æn est majoré par 
tous les diamètres des F,, lesquels sont arbitrairement petits par hypothèse. Donc l’intersec- 
tion est réduite a un point. 


(2) Condition nécessaire 
Soit (x,) un suite de Cauchy. Nous considérons les ensembles 


En = {x tel quei>n)}. (7.301) 


Le fait que la suite soit de Cauchy implique que diam(F,,) — 0. Par hypothèse, nous avons 
alors 


(= {a (7.302) 


neN 


Pour s'assurer que a est bien la limite de (x,), il suffit de remarquer que 


d(tn, a) < diam F, — 0. (7.303) 


PropGULUooNzqzK; 
Proposition 7.285. 
Soient (X,d) un espace topologique métrique et F un fermé de X. Nous avons d(x, F) = 0 si et 
seulement sixeF. 


Démonstration. Si x € F alors d(x, F) = 0 parce que d(x,x) fait partie de l’ensemble sur lequel 
nous prenons l’infimum. 

Si réciproquement d(x, F) = 0, cela signifie que pour tout €, il existe x. € F tel que d(xe, x) < 
En prenant € = 1/k nous construisons une suite (xx) d'éléments dans F vérifiant d(xx,x) = 
Cela signifie que limg_,+ 2x = x par la proposition 7.258(1). 


123. Cela est le théorème-définition 7.109 des ouverts dans un espace métrique, à ne pas confondre avec le théo- 
rème 7.8. 
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Par la caractérisation séquentielle des fermés (un fermé contient les limites de toutes ses suites, 
proposition 7.242), la suite (xx) étant dans F, la limite est dans F. Donc xe F. 


LemooÿynkH 
Lemme 7.286. 
Soit A, une suite décroissante de fermés dans un espace métrique ?* compact K. Alors 
C= (4 (7.304) 
neN 


est non vide. 


Démonstration. Soit (x,) une suite dans K telle que x, € A,. La suite étant contenue dans A, 
et A1 étant compact (lemme 7.91), elle possède une sous-suite (y» = t,,(n)) Convergente dont la 
limite est dans À; par le théorème de Bolzano-Weierstrass 7.136. Une queue de la suite y, est dans 
A2 et nous considérons donc une sous-suite convergente dans A2 donnée par 


2n — Voa(n) — Loio(n): (7.305) 


En continuant ainsi nous construisons une suite convergente dans Az. Nous considérons enfin la 
suite 


Un — Loi..on(n)- (7.306) 


Pour tout k, une queue de cette suite est une sous-suite de To1.….og(n) €t Par conséquent cette suite 
converge dans 44. La limite de cette suite est donc dans l'intersection demandée. 


Remarque 7.287. 
Cette propriété est fausse pour les ouverts. Par exemple 


RAID I = g. (7.307) 


n>1 
LemKIcAbic 
Lemme 7.288. 
Si K est un compact dans un espace métrique et F un fermé disjoint de K, alors d(K, F) > 0. 


Démonstration. La fonction 


K—R 


NN. (7.308) 


est une fonction continue sur K, et donc atteint son minimum par le théorème de Weierstrass 7.138. 
Soit xo € K un point de K qui réalise ce minimum. Si d(xo, F) = 0, alors on aurait une suite (x,) 
dans F qui convergerait vers x, mais F' étant fermé cela signifierait que xo serait dans F', ce qui 
contredirait l’hypothèse que F'et K sont disjoints. 


PropLHWACDU 
Proposition 7.289. 
Soient (X,d) un espace métrique compact et (u,) une suite de X telle que 


ln dus, dns) = 0: (7.309) 


n— 00 


Alors l’ensemble des points d’accumulation |? de (u,) est connexe. 


Démonstration. Nous notons T° l’ensemble des points d’accumulation de la suite. 


124. L'hypothèse métrique provient de l’utilisation de Bolzano-Weierstrass, lequel est vrai pour les espaces séquen- 
tiellement compacts, dont les espaces métriques. 
125. Définition 7.30. 


7.15. 


(1) 
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l'est compact Nous notons À, = {u, tel que n > p} et nous avons 


r=f)4, (7.310) 


pEeN 


parce que si x € l’, alors pour tout n, il existe m > n tel que x» € B(x,e), et donc tel que 
x E B(tm,e). Donc pour tout € et pour tout p, l'intersection B(x,€) n À, est non vide. 

En tant qu’intersection de fermés, l est fermé (lemme 7.6). En tant que fermé dans un 
compact, l'est compact (lemme 7.91). 


Recouvrement par deux compacts 
t 126 


Supposons que l' ne soi pas connexe. Nous pouvons alors considérer Set O, deux ouverts 
disjoints recouvrant let intersectant tous deux ll”. Nous posons alors 


A=Snr (7.311a) 
B=OnT, (7.311b) 


et nous avons évidemment F = À B. Montrons que À est fermé (B le sera aussi par le 
même raisonnement). Soit une suite d'éléments de S n l convergent dans X. Alors la limite 
est dans F = T'et donc elle est donc © ou $, mais elle est certainement dans $. Cependant 
S n’intersecte pas ©. En effet si x e S n O, alors tout voisinage de x intersecterait S, mais 
il y a des voisinages de x étant inclus dans © parce que © est ouvert; cela donnerait une 
intersection entre O et S, ce qui est impossible. Donc la limite n’est pas dans © et donc elle 
est dans $. Au final la limite est dans $ A |’, ce qui prouve son caractère fermé. 


Comme d'habitude, F n S est compact parce que fermé dans un compact !?7. 


Décomposition en trois morceaux 


Vu que À et B sont des compacts disjoints, nous avons d(A, B) = à > 0 pour un certain @ 
par le lemme 7.288. Nous notons 


A'= {re X tel que d(x, À) < 5) (7.312a) 


B'={xe X tel que d(x, B) < 5) (7.312b) 


Nous avons 4’ = [),. 1 B(x,%) et donc en tant qu’union d’ouverts, 4’ est ouvert (définition 
de la topologie). Même chose pour B. 
Enfin nous notons 

K = X\(A'U B") (7.313) 
qui est fermé en tant que complémentaire d’ouvert, et donc compact. Étant donné que À & 4’ 
et BC B', nous avons K NT = G. 
L'idée est maintenant de montrer que K contient un point d’accumulation de (u,). 


Sous-suites de (u,) 


L'hypothèse sur la suite (u,) nous indique qu’il existe un M, tel que Vn > No, 
a EqlHio; 
d(un; Un+1) < 3 b. Ait | 


Soient N > No et vo € À. Étant donné que x est point d’accumulation de la suite, il existe 
n1 > N tel que d(xo,un,) < %. Même chose dans B : nous prenons 9 € B et un naturel 
n2 > m1 tel que d(yo,un,) < $. Nous avons un, € A! et Un, € B". 

Soit no le plus petit naturel supérieur à n1 tel que u,, # A’. Cela existe parce que u,, € B' 
et B'n 4" = @, mais no n’est pas n2 lui-même parce que d(4’, B') > % alors que nous 


considérons no,n1,n2 > No et donc pour tous les 4 entre n1 et n2 (compris), d(ui, ui+1) < 3. 


126. est-ce qu'il faut vraiment un subjonctif ici ? 
127. Lemme 7.91. 
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Notons qu'ici le strict dans la condition (7.314) est important. Nous avons donc No < n1 < 
no < N2. 

Nous allons maintenant montrer que u,, est dans X. C’est fait pour : il est loin en même 
temps de 4’ et de B’. En utilisant l'inégalité triangulaire à l’envers, nous avons 


des B) > PILE B) — diet Uno) 
Z d(A, B) En d(uno—1: À) d(us-1;: Uno) 
ne (7.315) 
3 3 


Pour la dernière inégalité nous avons utilisé le fait que u,,_1 n’est pas dans 4’. Bref, nous 
avons montré que Un, n’est pas dans B’ (dans la définition de ce dernier nous avons bien une 
inégalité stricte). Vu que par définition w,, n’est pas non plus dans 4”, nous avons uh, € K. 
Nous avons montré jusqu’à présent que pour tout N > No, il existe un no > N tel que 
Un, € X. Cela nous construit donc une sous-suite (v,) de (u,) contenue dans K. En tant 
que suite dans le compact Æ, la suite (v,) admet un point d’accumulation dans K. Ce 
point est également point d’accumulation de la suite (u,) complète, ce qui donne un point 
d’accumulation de (u,) dans X et donc une contradiction. 


Nous concluons que [est connexe. 


Encore une petite conséquence sans ambition du théorème de Bolzano-Weierstrass. 
PropHNy11AW 


Proposition 7.290. 
Si (tn) est une suite dans un compact telle que toute sous-suite convergente ait le même point x 
comme limite. Alors la suite entière converge vers x. 


Démonstration. Supposons que ce ne soit pas le cas. Alors il existe un € tel que pour tout N > 0, 
il existe n > N avec d(x,,x) > €. Cela nous donne une sous-suite de (x,) composée d'éléments 
tous à une distance de x supérieure à €. Nous la nommons (y,): c’est une suite dans un compact 
qui admet donc une sous-suite convergente (et une telle sous-suite est une sous-suite de (x,,)) dont 
la limite devrait être x, mais c’est impossible par construction. 


LemGDeZ10o 
Lemme-Définition 7.291 ([238]). 
Soit ( un ouvert dans un espace métrique E. Il existe une suite (Kn) de compacts tels que 


(UK; eù 
(2) Un=o Kn = Q 
(3) Kh € Int(Kyu1). 
Une telle suite de compacts vérifie alors 


(1) Il existe Ôn tel que pour tout z € Kn, B(z,ôn) € Kn+1. 


ITEMooBPYPooEMhSmŸ 
(2) Tout compact de Q est inclus dans Int(K,) pour un certain n. 
Une telle suite de compacts est une suite exhaustive de compacts pour ©. 
Démonstration. Nous considérons les ensembles 
1 
V, = {2e E tel que |z|} U U B(a, —), (7.316) 
n 


afQ 


et nous définissons X, = VŸ. Vérifions que ces ensembles vérifient tout ce qu'il faut. 


(1) K,k CA Siaé A alors a est dans tous les V, et donc dans aucun des K, ; nous avons donc 
bien K,, € (1. 
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(2) Be Ky = Q Nous avons déjà prouvé que bé Ky € (. Pour avoir l'inclusion dans l’autre 
sens, soit z € Q. Nous prenons n1 > |z| puis n2 tel que B(z, +) c Q(. Alors z € Kn avec 
n > max(n1,n2). Pour ce choix de n, nous avons z € K,. Cela prouve que A € UE Ky. 

(3) Kn cInt(Kny1) Soit 2 € Kn. L'élément z vérifie d(z, N°) > À. Du coup si nous prenons 6 
tel que 


1 1 


alors B(z,0) € Kn+1. 

(4) Les K, sont compacts Enfin, les K, sont tous compacts. En effet ils sont bornés parce 
que Kn € B(0,n) et ensuite X, est fermé en tant que complémentaire d’un ouvert (V, est 
ouvert en tant qu'union d’ouverts). 


Nous passons maintenant aux propriétés, qui sont indépendantes de la façon dont nous avons 
construit les X,, vérifiant les conditions. 

(1) Nous pouvons considérer la fonction K, — R donnée par z + d(z, K£,,). Vu que K, € 
Int(Kh+1), c'est une fonction (continue sur le compact K,) prenant des valeurs strictement 
positives. Elle a donc un minimum strictement positif. Si 6, est plus petit que ce minimum 
nous avons B(z,0n) € Kn+1 pour tout 2 € K}. 


(2) D'abord nous avons Q = [J}_,Int(K,). En effet nous avons 


00 00 00 
Q = CES = U m(Kas:) = LEA) (7.318) 


L'’inclusion dans l’autre sens est facile. 
Soit K compact dans (. Vu que Q est l’union des Int(K,), nous avons 


Le] 
K€ | JInt(K,). (7.319) 
n=0 
Cela donne à X un recouvrement par des ouverts dont nous pouvons extraire un sous- 


recouvrement fini par compacité. Les K, étant croissants, du recouvrement fini, il suffit de 
prendre le plus grand (disons X,,) et nous avons K € Int(K,h). 


Notons qu'avec la suite de K,, telle que construite, le dernier point est réglé en prenant 


1 1 
— < y < —. (7.320) 
n +1 n 


LEMooWRIXooSBHavt 
Lemme 7.292 ([239)). 
Soient un compact K & RŸ ainsi que des ouverts hum tele que Ke (UF: 0%. 
Il existe des compacts {Ki}i-1,..n tels que 


— K; = Qe 
— KE LS K;. 
Démonstration. Soit x € K. Vu que les (; recouvrent K, il existe un k(x) € {1,...,n} tel que 


TE Or). De plus, vu que (},) est ouvert, il existe un voisinage de x contenu dans Q}(,) (théorème 
7.8). Autrement dit, il existe r(x) > 0 tel que 


Bs;r(r)) c 0. (7.321) 


Vu que l’ensemble {Bar} est un recouvrement de À par des ouverts, nous pouvons en 
extraire un sous-recouvrent fini l#. Soient donc x1,...,7m € K tels que 


Ke Ù Btair(m)). FAOOËTRCOOGIRIEX 


= 1 


128. C'est la définition 7.74 d’un compact. 
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Pour chaque j = 1,...,n, nous posons 
Aj = {le {1,...,m} tel que k(xr) = j}. (7.323) 
Et enfin nous définisssons, pour j = 1,...,n les parties 
Kj = U B(x,r(x)) (7.324) 


lEA; 


et il nous reste à prouver que ces ensembles répondent bien à la question. 


(1) Us À; = {1,...,m} est une union disjointe Un élément / de À; n A; devrait vérifier 


i = k(x) = j.Sise {1,...,m}, alors s € 4;(,,). Donc oui, l’union des À; est tout {1,...,m}. 
(2) KjcQ; Nous avons 


Kj= |] B(aur(a)) € [] Qt = (D = (7.325) 


lEAÀ; lEA; lEAÀ; 


(3) KE: Ki. Par (7.322), et vu que {1,...,m} = [J5_:1 À;, 


m 


KC Ü B(xi,r(xi)) (7.326a) 


_ Ü U Ber)) (7.326b) 


j=11leA; 
EE) (7.326c) 
j=1lEA; 
——  — 
K; 
= (JK;. (7.326d) 
j=1 


ThoFWXsQ0Z 
Théorème 7.293 (Tykhonov). 
Un produit quelconque d'espaces métriques non vides est compact si et seulement si chacun de ses 
facteurs est compact. 


Nous n’allons donner la preuve que dans le cas d’un produit fini dans le théorème 7.299. 


7.15.3 Ensembles enchainés 
Soit (X,d) un espace métrique. 


Définition 7.294. 
Une e-chaine joignant les points a et b de X est une suite finie (uo,...,un) dans X telle que 
Uo = &, Un = b et pour tout 0 < i< n — 1 nous avons d(un, Un+1) < €. 

Une partie À de X est bien enchainée si pour tout € > 0 et pour tout a,b € À, il existe une 
e-chaine joignant a et b dans À. 


Lemme 7.295. 
Les rationnels dans R sont bien enchaïinés. 


Démonstration. Soient p et q des rationnels avec p < q, ainsi que € > 0. Le lemme 1.424 nous 
permet de considérer un rationnel Ô vérifiant 0 < 0 < €. Et nous définissons les rationnels 


rr = p + kô. (7.327) 
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Vu que Q est archimédien !?°, il existe K tel que rx > q. D'autre part, ro = p < q. Donc il 
existe N = max{k € N tel que rx < g}. 

Nous considérons la chaine (ro,...,rn,gq). Elle débute à ro = p et termine à q; pas de problèmes 
avec Ça. À part pour le dernier pas, nous avons 


[rn = Tan 1] = 0 <é (7.328) 
donc c’est bien une e-chaine. Il reste à voir |q — rn|. Nous avons rv < q <rnN+1, et donc 
q q + 


O<q—rN TN TN =ÔRE. (7.329) 


Donc ok aussi pour ce dernier pas. 


PROPooBUNOooïvfugn 
Proposition 7.296 ([240, 1]). 


Un espace métrique connexe 0 est bien enchainé. 


Démonstration. Soit un espace métrique X et € > 0. La relation x — y si et seulement si x et y 
peuvent être reliés par une e-chaine est une relation d'équivalence. 

Soit x € X. Nous prouvons que la classe [x] est ouverte. En effet soit y € [x], si z € B(y,e) nous 
avons z € [y], et donc 2€ [x]. Nous en déduisons que B(y,e) € [x], et donc que [x] est ouvert par 
le théorème 7.8. 

Donc les classes sont des ouverts. 

Supposons que À n’est pas bien enchainé. Alors il existe e pour lequel X possède plus qu’une 
classe d'équivalence. Soit {[x4]|}1e7 l’ensemble des classes d’équivalences. 

Nous considérons un io € Î quelconque, et nous définissons les ouverts À = [x:;,] et 


B= |] [xl]. (7.330) 
kel\{io} 


Ce sont deux ouverts disjoints qui recouvrent X qui n’est donc pas connexe. 


PROPooXHTWooZibddz 
Proposition 7.297. 


La fermeture d’un ensemble bien enchaïiné dans un espace métrique compact (X,d) est connexe. 


Démonstration. Soit À & X un ensemble bien enchainé, et soient a,b € A. Nous construisons 
une suite (uy) dans À de la façon suivante. Pour chaque n > 0 nous prenons a € B(a, 1) n À 


et b € B(b, 1) n A. Ensuite nous considérons une À-chaine CNT dans À entre a’ et b. Ici 


l’ensemble Z, est fini. La suite (uz) est simplement construite en mettant bout à bout les éléments 
0). 
La suite ainsi construite est une suite dans À admettant a et b comme points d’accumulation 
(les autres points d’accumulation sont également dans À) et telle que limx_,4 d(ux, ux+1) = 0. 
Par conséquent la proposition 7.289 nous dit que l’ensemble des points d’accumulation de (ux) est 
connexe dans X. Nous le notons C4. 

Si nous fixons a € À, alors nous avons 


([] Cox = À. (7.331) 
xeÀ 


Vu que le membre de gauche est une union de connexes, c’est un connexe par la proposition 7.70. 
CORooSIKCooTncoQm 


Corolaire 7.298. 
Un espace métrique compact est connexe si et seulement si il est bien enchainé. 


Démonstration. Dans le sens direct, c’est la proposition 7.296. Dans l’autre sens, si X est compact, 
alors X est fermé par le lemme 7.91(2). Et vu qu’il est fermé et bien enchainé, la proposition 7.297 
implique qu'il est connexe. 


129. Proposition 1.383. 
130. Définition 7.64. 
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7.15.4 Produit fini d'espaces métriques 


Pour rappel, la distance sur un espace produit est donnée par la définition 7.215. 
THOIYmxXuu 


Théorème 7.299 ([1]). 
Un produit fini d'espaces métriques non vides est compact si et seulement si chacun de ses facteurs 
est compact. 


Démonstration. Soient K1,..., K, des compacts et K = K3 x ... x K, le produit muni de sa 
métrique usuelle de la définition (7.215) (attention : chacun des K; peut être de dimension infinie) : 


d(a, B) = max{di(ai, B)} (7.332) 


où d; est la distance sur 5. Si (a,) est une suite dans Æ alors la suite (a, )1 est une suite dans le 
compact 1 dont nous pouvons extraire une sous-suite convergente (Bolzano-Weierstrass 7.136). 
De la sous-suite de a correspondante nous extrayons la sous-suite pour la seconde composante, 
etc. 

En fin de compte nous avons une sous-suite (que nous nommons « également) donc chacune 
des composantes est convergente. Notez que nous utilisons ici de façon cruciale le fait que nous 
ayons qu’un nombre fini de facteurs. 


Autrement dit, pour chaque à = 1,...,n, l'application p + (a,); est une suite dans 5, et cette 
suite converge vers /;. 
Soit € > 0 pour chaque à = 1,...,n, il existe N; > 0 tel que si p > N; alors 
di((ap}is Li) < €. (7.333) 


En prenant N = maxz N, et n > N nous avons 
d(an, Cheese e n)) < €. (7.334) 


Par conséquent de la suite (a) nous avons extrait une sous-suite convergente et la partie « réci- 
proque » de Bolzano-Weierstrass nous assure alors que X est compact. 

À l'inverse si un des facteurs n’est pas compact (mettons X1) alors nous prenons un recouvre- 
ment {O;};-er de K1 par des ouverts duquel il est impossible d’extraire un sous-recouvrement fini. 
Ensuite nous posons 

P,=O; x K2x...x Ky, (7.335) 


qui est un recouvrement de X par des ouverts (de X) d’où aucun sous-recouvrement fini ne peut 
être extrait. 


Pour la culture générale, il y a bien entendu moyen de faire des produits dénombrables et pire 
d'espaces métriques. 


Définition 7.300 ([241]). 
Soient (Eh,dn) des espaces métriques. Sur l’ensemble produit E = NE E; nous définissons la 
métrique 

1 


Ze (ris Vi) (7.336) 


18 


d(x, y) = 
k 


1 


où d, = min(d;, 1). 


On peut montrer que ce d est bien une distance et que (Æ, d) devient un espace métrique. 
ThoKKBooNaZgoU 
Théorème 7.301 (Tykhonov dénombrable[241]). 
Un produit dénombrable d'espaces métriques non vides est compact si et seulement si chacun de 
ses facteurs est compact. 


Note : ce résultat est encore valable pour un produit quelconque, c’est le théorème de Tykho- 
nov 7.293. 
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7.15.5 Équicontinuité 
DEFooDHQDooFflvsX 


Définition 7.302 ([1, 242, 243]). 
Soient un espace topologique X et un espace vectoriel topologique Y . Une famille H d'applications 
X — Y est équicontinue en a € X si pour tout voisinage V de 0 dans Y , il existe un voisinage 
U de a dans X tel que 

R(U) € h(a) + V (7.337) 


pour tout h € H. 


Nous disons que H est équicontinue si elle est équicontinue en tout point. 
LEMooMIHJooUhvPgM 


Lemme 7.303 ([1]). 
Soient un espace métrique X, un espace vectoriel normé Y ainsi qu'une famille H d’isométries 
linéaires X — Y. Alors H est équicontinue. 


Démonstration. Nous suivons la définition 7.302 de l’équicontinuité. Soient a € X et un voisinage 
V de O0 dans Y. Nous considérons r > 0 tel que B(0,r) € V, et nous posons U = B(a,r). 
SizeUet he H, nous avons 


IR(æ) — h(a)| = Ih(x — a)| = d(x,a) < r, (7.338) 


de telle sorte que h(x) € h(a) + B(0,r). 
Donc H est équicontinue en a. Vu que a est arbitraire, H est équicontinue en tout point et 


donc équicontinue sur X. 
LEMooKEMRooYyqsB1l 


Lemme 7.304 ([243]). 

Soit une famille de fonctions f;: X — E indexée par un ensemble I où X est un espace topologique 
et E un espace métrique. Cette famille est équicontinue en x € X si pour tout € > 0, il existe 
un voisinage V de x tel que 


| f(x) — fi(y)| < € (7.339) 
pour tout à dès que y € V. 


La proposition suivante permet de montrer que certaines fonctions définies par une limite sont 


continues. Ce sera par exemple le cas de la fonction puissance, proposition 12.417. 
PROPooICNNooAMjcut 


Proposition 7.305 ([1, 243]). 
Soit une suite équicontinue (f;) de fonctions qui converge simplement vers f, alors f est continue. 


Démonstration. Soit une suite équicontinue f;,: X — E convergeant simplement vers f. Soit a € X. 
Nous prouvons que f est continue en a. Pour cela nous considérons € > 0 et, conformément à 
l'hypothèse équicontinuité un voisinage V de a tel que |f;(a) — f;(x)| < € pour tout x € V. 

Nous avons la majoration 


Lf(æ) — f(a)l < If) — f(x) + fix) — fi(a)l + lfi(a) — f(a)l. (7.340a) 


Plusieurs majorations. 
— Vu que f; — f, il existe M. tel que | f(x) — fi(æ)| < € pour tout à > Mi. 
— De plus, par définition de V, nous avons aussi | f;(x) — fi(a)| < €. 
— Vu que f; — f, il existe N tel que |f;(a) — f(a)| < € pour tout à > AN. 


Donc en prenant x € V et à > max{N;, N} nous avons 


Lf(æ) — f(a)| < 3e. (7.341) 


131. Définition 7.302. 
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ii Avertissement /question au lecteur !! 7.306 
Je n'ai pas du tout vérifié si le lemme 7.307 est correct. Sinon, il faudra trouver autre chose dans 
la preuve de la proposition 21.89. 


LEMooSXWKooAmqeïic 
Lemme 7.307 ([1]). 
Si À est une partie fermée de R*, alors projr+(A) est fermé dans R. 
7.15.6 Continuité uniforme 

DEFooYIPXooQTscbG 


Définition 7.308 ([244]). 
Soient deux espaces métriques (E,d) et (E',d'). Une application f: E — E’ est uniformément 
continue si pour tout € > 0, il existe Ô > 0 tel que d(x, y) < Ô implique dE): f(y)) < €. 


Dans l’uniforme continuité, le & qui fait fonctionner € doit le faire fonctionner pour tous les 
xz,y € E. C’est la différence avec la continuité simple dans laquelle nous pouvons choisir, pour un 
même €, un Ô différent en chaque point. 

Nous parlons plus d’uniforme continuité dans la section 12.7. 


7.16 Ensembles nulle part denses 


Nous allons nous limiter au cas de KR, mais je crois que ça se généralise sans trop de peine aux 
espaces métriques, voire plus. Voir aussi la section 7.19 sur les espaces de Baire. 


Définition 7.309. 
Un ensemble est dit nulle part dense si il n’est dense dans aucun intervalle. 
Un ensemble dans R est de première catégorie ou maigre si il est une union dénombrable 


d’ensembles nulle part dense (c’est-à-dire d’ensembles denses sur aucun intervalle). 
ThoQGalIO 


Théorème 7.310 (Baire[245]). 
Une réunion dénombrable d’ensembles nulle part denses est d'intérieur vide. 


Démonstration. Soient a € S et € > 0. Nous allons trouver un élément dans B(a,e) qui n’est pas 
dans S. Nous commençons par choisir x1 € B(a,e) et r; < 5 tel que 


B(x1,r1) [A] À: = g. (7.342) 


Ensuite nous choisissons æ2 € B(x1,r1) et ra < e/4A tel que B(x2,r2) € B(x1,r1) et B(x2,r2)n A2 = 
S. Notons que B(x2,r2) Nn A1 = @ aussi, par construction. 
Par récurrence nous construisons une suite d'éléments x, et de rayons r, < e/2" tels que 
(1) B(tn,rn) N A; = © pour tout j <n, 
(2) Bain) es B(r:-35 te 
Cette suite étant de Cauchy (parce que contenue dans des intervalles emboîtés de rayon décroissant 


vers zéro), elle converge l*? donc vers un point qui en particulier appartient à B(a, e). Mais la limite 
n’est dans aucun des À, et donc pas dans S$. 


7.17 Seminormes 


Les principaux espaces topologiques construit avec des seminormes seront les espaces de fonc- 
tions de la définition 30.16. Nous verrons également la topologie +-faible sur Z/(Q) en la défini- 
tion 30.32. 


132. Par la proposition 1.390 
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7.17.1 Seminorme 
DefPNXlwumi 


Définition 7.311. 
Si E est un espace vectoriel sur le corps K = R,C, une seminorme sur E est une application 


p: E —R telle que ItemSHnimhDii 
(1) p(az) = Np(x) TtenSHnimhDi11 


(2) px + y) < p(x) + p(y) 
pour tout x,ye E et pour tout À E K. 


Remarque 7.312. 
Deux remarques. 
(1) La seule différence avec une norme est qu’une seminorme peut s’annuler en des éléments 
non-nuls de l’espace. 


(2) Une seminorme prend ses valeurs dans R. En particulier pour que p soit une seminorme, il 
faut que p(x) < © pour tout x. 


LEMooHTOAo0oGmRGZL 

Lemme 7.313 ([246, 220]). 

Soit une seminorme!% p. Nous avons ITEMooFRCRooZBWTxH 
(1) p(0) = 0, ITEMooHVWHooAVZsTf 
(2) 1p(x) — p(y)l < p(x — y). ITEMooXCHBooDoBvpL 
(3) px) z 0 pour tout x € X. ITEMooQIGMooVNDakF 


(4) ker(p) est un sous-espace vectoriel. 


Démonstration. En plusieurs parties. 
(1) Pour (1) Pour la première affirmation, il suffit de poser À = 0 dans l'inégalité de définition 
p(Az) = lAp(x). 
(2) Pour (2) Nous avons d’une part p(x + h) < p(x) + p(h) et d’autre part p(x) < p(x + h) + 
p(—h) = p(x + h) + p(h). En isolant p(x + h) — p(x) dans chacune ce des deux inégalités, 


—b(h) < p(x +h) — p(x) < p(h) (7.343) 
px + h) — p(x)| < p(h) (7.344) 


qui donne le résultat demandé en posant À = y — x. 


Pour (3) Soit x € X. Nous appliquons le point (2) avec y = 
p(0) = 0 : Ip(x) — p(0)| < p(x — 0), c'est à dire 0 < |p(x)| < p(x). 
(4) Pour (4) Soient x,y € ker(p) ainsi que à, 5 € K. En utilisant les points précédents, 


RS 
Co 
nr 


0, en nous souvenant que 


0 < p(ax + By) < [alp(x) + |BIp(y) = 0. (7.345) 


Vu que les inégalités commencent par 0 et finissent par zéro, ce sont toutes les égalités, et en 
particulier p(ax + By) = 0. 


DEFOoNFOAooRAUuOk 
Définition 7.314 ([247|). 
Soit un espace vectoriel complexe X. Une application f: X — € est dominée par la seminorme 
p si pour tout x dans X nous avons |f(x)| < p(x). 
Si M est un sous-espace vectoriel de X, nous disons qu’une application f : M — R est dominée 
par le dessus par la seminorme p si f(m) < p(m) pour tout me M. 


133. Définition 7.311. 


570 CHAPITRE 7. TOPOLOGIE GÉNÉRALE 


LEMooKTSKooïteFGq 
Lemme 7.315 ([247]). 
Une application linéaire est dominée par une seminorme si et seulement si sa partie réelle est 
dominée par le dessus !°*. 


Démonstration. Soit une application linéaire f: À — €. Nous la décomposons en parties réelles 
et imaginaires par 


f(x) = u(x) + iv(x) (7.346) 
où u et v sont des application à valeurs réelles. 


(1) = Nous supposons que |f(x)| < p(x) pour tout x € X. Nous avons les majorations 
u(x) < [u(æ)| < |f(x)1 < px). (7.347) 


(2) = Nous supposons que u(x) < p(x), et nous devons prouver que |f(x)| < p(x). Nous notons 
z = f(x). Si z = 0 nous avons évidemment |z| < p(x). Nous supposons que z Æ 0. Nous 


avons L 
[21 


El = 


A A 


f(æ) = l2l. (7.348) 


En particulier f (Ex) est réel et est donc donné par u : 


[21 , _ ll 
f( : À = ; Œ) (7.349) 
Nous avons alors le calcul 
… ls A6 [21,4 L: 
= f(x) = u(Ëla) < p(Ëla) = |Eliptz) = pr). (7.350) 
7.17.2 Fonctionnelle de Minkowski 
DEFooJQXHooGDaJtW 


Définition 7.316 ([220|). 
Soient un espace vectoriel X et une seminorme p sur X. Nous posons 


Ü, = {re X tel que p(x) < 1} (7.351a) 
U, = {ze X tel que p(x) < 1}. (7.351b) 


Notez qu'il n’y a aucune raison particulière de croie que U, serait la fermeture de U,, parce que 


pour l'instant nous n’avons aucune topologie sur X. 
DEFooYQYBooRkAf jG 


Définition 7.317 (Fonctionnelle de Minkowski[220]). 
Soient un espace vectoriel X ainsi qu’une partie À € X. La fonctionnelle de Minkowski de A 
est l’application 


:X—R 
7 (7.352) 
zrinf{À > 0 tel que x € AA}. 
Nous posons aussi paA(x) = © si l’ensemble est vide. 
LEMooEIWEooPgoskd 


Lemme 7.318 ([220]). 
Soient un espace vectoriel X sur le corps K (R ou ©) ainsi qu’une partie À € X qui est non vide, 
absorbante 6 et absolument convexe !°T. Alors 


134. Définition 7.314. 

135. Notez que si on écrit z en coordonnées polaires z = re", le nombre z/|z| est eŸ. Passez par les polaires pour 
simplifier les notations si cela vous chante, mais remarquez que le théorème 18.62 n'arrive que dans longtemps. 
136. Définition 7.177. 

137. Définition 7.178. 
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(1) La fonctionnelle de Minkowski pa est une seminorme. 


(2) Nous avons | 
Lu AO (7.353) 


Note : le lemme 7.319 donnera la même inclusion en mieux parce qu'il n’y aura pas besoin de 
l’absolue convetité. 


Démonstration. En plusieurs parties. 


C’est une seminorme. 


(1) pa(x) < © pour tout x Nous avons supposé que À est absorbant. Soit x € X. Il existe 


p > 0 tel que Àx € À pour tout |A] < p. En particulier px € À, et donc x € A. L'ensemble 
{1 > 0 tel que x € ÀA} est donc non vide parce qu’il contient 1/p. Nous en déduisons que 
pa(a) < 1/p < œ. 
(2) pa(O) = 0 Le lemme 7.179 nous dit que 0 € À, de telle sorte que 0 € ÀA pour tout À > 0. 
Donc 
pA(O) = inf{À > O0 tel que 0 € XA} = 0. (7.354) 


PITEMooGDÇDaoMBDsPB 
(3) Condition pour éx € A RO Te À. Nous prouvons que £x € ÀA si et seulement si 


x E ér4: En utilisant le lemme 7.181, nous avons 


XA = © lélA = LEA. (7.355) 


Donc £x € ÀA si et seulement si £x € aÉA si et seulement si x € Ér4- 


(4) pa(£x) = l[élpa(x) Soient x e X et £e K avec & £ 0. Nous avons 


paA(Ëx) = inf{A > 0 tel que £x € AA} (7.356a) 
= inf{À > 0 tel que x € a) par (3) (7.356b) 
. À À 
= PUITS > 0 tel que LE (7.356c) 
LA À 
= |é| inf > Otelqueze E (7.356d) 
= |é|inf{u > 0 tel que x € HA} cf. just {0 BEROOTHJHOGHEREN 
= |élpa(x). (7.356f) 


Pour (7.356e). Si À prend toutes les valeurs strictement positives, alors À/|é| aussi. 
(5) pa(x + y) < pA(x) + pay) Soit e > 0. Nous notons S4(x) = {À > 0 tel que x € ÀA}. 
Vu que pA(x) et pA(y) sont définis comme des infimums, il existe À, u > 0 tels que 


À < pA(x) +e (7.357a) 
ui < pA(y) + € (7.357b) 
avec x € ÀA et yE A. 
Vu que À est convexe, et vu que 
À H 
Lo — |, 7.358 
À+u + 
pour tout z,z/ € À nous avons 
À LL 


Je (7.359) 


138. Avec les notations de 7.316. 
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ou encore : Àz2+yuz/ € (À +wu)A. En particulier pour z et 2’ choisis tels que Àz = x et uz/ = y 
nous avons æ + y € (À+yu)A. Nous avons alors 


pA(x + y) = inf{ô > 0 tel que x + y € OA} < À + u < pA(x) + pA(y) + 2e. (7.360) 


Étant donné que € est arbitraire, nous avons prouvé que p4(x + y) < pa(x) + pa(y). 


(6) pa est une seminorme Nous avons prouvé toutes les conditions de la définition 7.311. 


o 


Upa € AC Up 


o 


(1) Première inclusion Soit x e U,,, 


c’est à dire pa(x) < 1, ou encore 
inf{A > 0 tel que x € AA} < 1. (7.361) 


Donc il existe À € [0, 1[ tel que x € ÀA. Vu que À est équilibré (ça fait partie d’être absolument 
convexe) et que À < 1, nous avons ÀA € À. Bref, 


ze AC À. (7.362) 


Cela prouver que x € À. 


(2) Seconde inclusion Soit x € À. Nous avons 1 € {À > 0 tel que x € AA}, et donc 
pa(x) = inf{À > 0 tel que x € AA} < 1, (7.363) 


ce qui signifie que x e U,,,. 


LEMooFUXVoo JumSc\W 
Lemme 7.319 ([248]). 
Soit un espace vectoriel topologique X ainsi qu’une partie convexe et absorbante A. Alors 


{x e X tel que pa(x) <1}c Acf{xe X tel que pA(x) < 1}. (7.364) 


Démonstration. Nous prouvons les deux inclusions séparément. 


(1) Première inclusion Soit x e X vérifiant pa(x) < 1. Nous avons 


inf{A > 0 tel que x € AA} < 1. (7.365) 


Soit À € ]0,1[ tel que x € XA. En particulier x/X € A. Étant donné que À est convexe et que 
0 € À (toute partie absorbante contient 0), le segment joignant 0 à x/X est contenu dans A. 
En particulier, nous avons 


= (5x) + (1 V0 e À (7.366) 


(2) Seconde inclusion Soit x € À. Nous avons évidemment 


1€ {À > 0 tel que x € ÀA}. (7.367) 


Donc pa(x) = inf{A > 0 tel que x € AA} < 1. 


LEMooFWCIooVwGutp 
Lemme 7.320 ([220]). 
Soit une seminorme q sur l’espace vectoriel X. Alors 


(1) Ü, est absorbant. 


(2) Üy est absolument convexe. 
(3) 4 = px 


Démonstration. En plusieurs points. 
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(1) Ü, est absorbant Soit x € X. Nous devons montrer l'existence de p,; > 0 tel que pour 


tout |A] < p,, nous ayons Àr € be. 
Si qg(x) = 0, alors q(Ax) = |Alg(x) = 0 < 1 et donc n'importe quel p; > 0 fait l’affaire. 
Si q(x) > 0, alors il suffit de prendre px € ]0,1/q(x)[. En effet si |A] < p+, nous avons 
1 
q(Ax) = |Alq(x) < ——q(x) = 1, 7.368 
CAES (7.368) 
et donc Àx € da 


(2) b, est équilibré Soient [a| <1l,etre Le Nous avons 


q(ax) = |alq(x) < q(x) < 1. (7.369) 


Donc ax e U,. 


(3) Üy est convexe Soient x,y€ Üy ainsi que t € [0,1]. Nous avons 


gtx + (1—t)y) < q(tx) + q((1 — t)y) (7.370a) 
= léla(x) + ]1 — tla(y) (7.370b) 
£<|tl+|1-t] (7.370c) 
=t+(1-t) (7.370d) 
= À, (7.370e) 
Donc tr +(1—-tjye Le 
(4) q = Pü, Soit x e X. Nous avons 
Pü, (&) = inf{À > 0 tel que x € AUS) = inf{À > 0 tel que q(x) < À} = q(x). (7.371) 
LEMooQSAJooCgPNnD 
Lemme 7.321 ([249)). 
Soit un espace vectoriel X, ainsi qu’une seminorme p sur X. Nous posons "#? 
B,,(0,1) = {re X tel que p(x) <1 
BA(0.1) = ! que pa) < 1) _—. 
B,(0,1) = {x e X tel que p(x) < 1}. 
Alors pour tout € > O nous avons 
eB,(0,1) = {re X tel que p(x) < € 
BA. 1) = ! que p{a) < 9 _—. 
eB,(0,1) = {x e X tel que p(x) < €}. 
PROPooDDURooJHfHLiw 


Proposition 7.322 ([249, 250]). 
Soit un espace vectoriel topologique X, ainsi qu’une seminorme p. Les faits suivants sont équiva- 
lents. ITEMooCAUXooGNBeSB 

(1) p est continue. 


ITEMooWWUSooEPkolWiU 
(2) p est continue en 0. ITEMooPKFLooTR1Kwo 
(3) B,(0,1) est un voisinage de 0. ITEMooRTFZooUXUVnA 
(4) B,(0,1) est un voisinage de 0. 
Démonstration. Nous prouvons les implications dans l’ordre cyclique (1) = (3) = (4) = (2) 


(1). Courage, c’est parti. 


139. Nous ne supposons pas de compatibilité particulière entre la topologie de X et p. Donc à priori B, (0, 1) n’est 
pas la fermeture de B,(0,1). Si ça avait été le cas, nous aurions écrit B,(0, 1). 
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(1) (1) = (3) Nous avons 


REA. KR 


— 


B,(0,1) = {x € X tel que p(x) < 1} = p!(]-00,1[). (7.374) 


Vu que p est continue et que |—c0, 1[ est ouvert, la partie B,(0, 1) est un ouvert contenant 0. 


(3) = (4) La partie B,(0, 1) contient B,(0, 1) qui est un ouvert contenant 0. 


(4) = (2) Nous vérifions la condition de la définition 7.32(1). D'abord p(0) = 0. Nous 
considérons donc un ouvert W de R contenant 0, et nous allons chercher un voisinage V de 
0 dans X tel que p(V) € W. 

Soit r > 0 tel que B(0,r) € W. Par hypothèse B,(0,1) est un voisinage de 0. Comme la 
topologie de X est vectorielle, la partie eB(0, 1) est également un voisinage de 0 pour tout 
e > 0. Montrons que 


p(5B,(0. 1)) c B(0,r) c W. (7.375) 


Soit x e 5 B,(0, 1). Nous avons p(x) < r/2 par le lemme 7.321, et donc p(x) € B(0,r) € W. 
Bref, en posant V = £B, (0,1), nous avons bien p(V) € W. 
(2) = (1) Nous supposons que p est continue en 0 € X et nous devons prouver qu’elle est 


continue en a € X. Soient x € X, et r > 0. Pour prouver la continuité de p en x (définition 
7.32(1)), nous devons prouver l'existence d’un voisinage V de x tel que f(V) € B(p(x),r). 


Pour € > O0 nous posons 
U. = p *(B(0,e)). (7.376) 


Cette partie est ouverte parce que p est continue en 0 et que p(0) = 0. Nous allons prouver 
que si € est assez petit, alors p(x + Ec) € B(p(x), pi}: 


Soit z e U.. Nous avons 


Ip(x) — p{x + 2)| < p(x — (x +y)) lem.7.313 (7.377a) 
= p(—+) (7.377b) 
= p(2) (7.377c) 
c B(0,6). (7.377d) 


Donc p(x+2) € B(p(x),e) et nous avons montré que p(x+U.) € B(p(x),e). Donc en prenant 
e<r, c'est bon. 


7.18 Topologie des seminormes 


Soit (pi)ier une famille de seminormes sur £. Il existe plusieurs façons de construire une topo- 


logie sur Æ à partir des seminormes. 


7.18.1 Topologie initiale des seminormes 


La première topologie qui nous tombe sous la main est celle de la topologie initiale 140 des ps. 


PROPooVUYTooJXKRYW 


Proposition 7.323 ([1, 251]). 
Soient un espace vectoriel X et une seminorme p: X — R. Soit x0 € X. En posant 


Be = {x € X tel que |p(x) — p(xo)| < €}, (7.378) 


l’ensemble B = {B.}.=0 est une base de voisinages de x0 pour la topologie initiale de p. 


140. La topologie minimale rendant les p; continue, définition 7.39. 
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Démonstration. Nous nommons 7 la topologie initiale de p sur X. Posons yo = p(xo). Une base de 
voisinages de yo (dans R) est {B(yo,€)}e-0. Donc la proposition 7.41 dit qu’une base de voisinages 
de xo dans X est donnée par 


{pp (B(p(xo), 9) }e>0- (7.379) 

Or nous avons 
p ! (B (po), 9) = {xe X tel que p(x) € B(p(xo),e)} (7.380a) 
— {x e X tel que |p(x) — p(xo)| < €}. (7.380b) 


La topologie initiale des seminormes n’est pas une bonne idée, parce qu’elle ne donne en général 
pas lieu à une structure d'espace vectoriel topologique 1. 


Exemple 7.324 ([251|). 
Nous considérons R avec la seminorme 


p:R—R 


ze [x]. 


(7.381) 


Nous considérons sur R la topologie initiale de cette seminorme. En vertu de la proposition 7.323, 
une base de topologie en x9 € R est donnée par les parties 


B(x0) = {x € R tel que |[x| — [xl] < é}. (7.382) 


Considérons la suite constante xx = 1. Le nombre 1 est évidemment une limite de (xx). Mais 
en y regardant bien, le nombre —1 est également une limite. En effet une base de voisinages autour 
de —1 est donnée par 

Be(-1) = {ze R tel que [fx] — 1] < €}. (7.383) 
Et donc 1€ B.(—1) pour tout €. 

Si R muni de cette topologie était un espace vectoriel topologique, la proposition 7.163 dirait 
que —1 + 1 = 0 serait une limite de (xx + xg). La suite (xx + xx) est la suite constante égale à 2. 
Or un voisinage typique autour de 0 est 


B.(0) = {x e R'|x| < 6}. (7.384) 


Autant dire que la suite (xx + xx) = 2 n’y rentre pas souvent. À 


7.18.2 Topologie avec des boules 
DEFooROUXMooCpmTwa 


Définition 7.325. 
Soit un espace vectoriel E sur lequel nous avons des seminormes {pi}ier. Pour chaque à € T nous 
posons 


Bi(x,r) = {yeE tel que pily — x) <r}. (7.385) 

Si J est une partie finie de 1, nous considérons les parties 
By(x,r) = {ye E tel que p;(y — x) <rVjeJ}. (7.386) 
LEMooCNRNooWCejjz 


Lemme 7.326. 
Soit un espace vectoriel E sur lequel nous avons des seminormes {pi}ier. Pour chaque a € E, nous 
considérons la translation 


ta: EE 
‘ (7.387) 
Tr x+a. 
Pour toute partie finie J € T1 nous avons 
ta(By(z,r)) = By(x +a,r) (7.388) 


141. Espace vectoriel topologique, définition 7.161. 
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Démonstration. D'une part si y € By(x + a,r), nous avons p;(y — x — a) < r pour tout j € J. Dans 
ce cas, y—ae B;(x,r), et nous avons donc bien y = ta(y — a) € ta (Br(x, ph 
Pour l'inclusion dans l’autre sens, c’est le même raisonnement. 


DEFooZTKAooWYUyDa 
Proposition-Définition 7.327 (Topologie et seminormes[252, 253, 220]). 
Soient des seminormes {p;}ier sur l’espace vectoriel E. Nous posons 16e 


TB ={OCE tel que Vxr E O,3J,r tel que By(x,r) € O} {gg} 00NMNooG ER, 


Dans cette formule, les J sont des parties finies de I. 
Pour chaque ie T'etxe E nous posons 


Pix: ER (7.390) 
y pif(y — 2). 

Alors ITEMooQPVRooKyOBPi 
(1) Les parties TR forment une topologie sur E. ITEMooQIYWooAmPCal 
(2) Les applications p;: E — R sont continues pour (E,TB). ITEMooYGNWooYhBzSa 
(3) Les applications pix: E — R sont continues pour TB. LTEMooMUUZo0BKBhsH 
(4) Sir est une topologie sur E dans laquelle tous les Pix sont continus, QE EEECTFOONADKAN 


(5) L'espace topologique (E,TB) est un espace vectoriel topologique localement convexe #. 


Cette topologie est la topologie des seminormes sur E. 


Démonstration. En plusieurs parties. 

(1) Pour (1) Vérifier les trois conditions de la définition 7.1. D'abord E et @ sont dans Tg. 
Ensuite si {O;}ser sont des éléments de TB, nous considérons x € [J,-r O, et nous montrons 
que x est contenu dans une boule contenue dans ([J.-7 ©.. Nous considérons s € T tel que 
ze O,. Vu que O, € TB, il existe J,r tels que 


re Bi rTe ee U O,. (7.391) 
seT 
Enfin pour l'intersection finie, l'intersection By(x,r)n By(x,r/) contient la boule By, yr(x, 6) 
avec Ô = min{r,r’}. 

(2) Pour (2) Pour montrer que p; est continue, nous montrons que l’image inverse d’un ouvert 
est ouverte. Soit a € R ainsi que r > 0. Nous considérons l’ouvert B(a,r) et nous montrons 
que pr '(B(a;r)) € TB. Soit x € pr '(B(a;r)). Nous allons montrer que si Ô est assez petit, 
alors Bi(x,6) € p; !(B(a,r)). 

Soit y € B;(x,0). Par définition nous avons p;(y — x) < 6, et par le lemme 7.313, 


Ipi(y) — pifx)| < pi(x — y) < à. (7.392) 


D'autre part, vu que x € p, | (B(a,r)), nous avons |pi(x) — a| < r. Nous considérons s > 0 
tel que |p;(x) — a] < r — s. Avec tout ça, 


Ipi(y) — al < Ipi(y) — pi(x)| + Ipi(x) — al (7.393a) 
<Ô+r—Ss (7.393b) 
me (7.393c) 


dès que nous choisissons 0 < 5. 
Nous avons donc montré que p;(y) € B(a,r), et donc que pi(x. 6) c B(a,r). Donc p; est 
continue. 


142. Nous ajoutons explicitement l’ensemble vide parce que nous n’avons pas envie de vérifier des propriétés du 
genre Vx € , blah blah...Mais bon. En principe c’est pas obligatoire parce que l’ensemble vide est obtenu avec 
r = 0. 

143. Définition 7.188. 


7.18. 


(3) 
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Les translations sont continues Nous considérons les translations t{,: E — E données 
par t,(x) = x +a. Soit un ouvert © dans E. Nous prouvons que t, (©) = t_,(O) est ouvert. 
Pour cela nous considérons un élément x € t_,(O) et nous prouvons qu’il existe une boule 
autour de + contenue dans t{_,(O). Soit y € © tel que x = y — a; vu que © est ouvert, il 
existe r, J tels que By(y,r) € ©. Nous avons alors 


ba(By(yr)) € t_a(O), (7.394) 


et donc 
Br(y—a,r) =t_a(By(y;r)) ct-a(O). (7.395) 
Pour (3) Nous avons p;x = piot_,. Nous avons déjà prouvé que p; et t_; sont continues. 


Pour (4) Soit une topologie 7 telle que toutes les applications p;, sont continues. Nous 
avons 


B;(a,r) = {ye E tel que pi(y — a) <r} = {ye E tel que pia(y) < r} = Pra (B(0;r)). 
(7.396) 
Étant donné que B(0, r) est ouverte et que p;4 est continue, la partie Pr, . (B(0,r)) est ouverte. 
Donc 7 contient toutes les boules de la forme B;(a,r). 


Vu que 7 est une topologie, elle contient toutes les intersections finies d’ouvert. En particulier 
si J est une partie finie de 1, r doit contenir toutes les boules de la forme By(a,r). 


Pour (5) Le point (5), ce sont les points suivants. 


L’addition est continue Nous prouvons que l’application 


a: EXE—E 
(7.397) 
y) z+y 
est continue pour la topologie 78. Soit © € T8 ; nous devons prouver que la partie 
a (©) = {(x,y)e E x E tel que x + ye O} (7.398) 


est ouvert dans E x E (topologie produit). Soit (ro, yo) € a !(O). Vu que x0 + y € ©, il 
existe un r et un ie Î tels que B;(x0 + %o,r) € ©. 
Nous prouvons que si e est assez petit, 


B;(x0, €) x Bi(yo, €) € a! (Bi(æo vor) (en a (©). (7.399) 


Nous avons 


pi((æ + y) — (ro + yo)) = pi((x — &o) + (y — yo) (7.400a) 
< pi(x — &o) + Pi(y — Yo) def. 7.311(2) (7.400b) 
< 2€. (7.400c) 


En prenant € < r/2 nous avons donc a(x, y) € B; (xo + yo, r) c ©. 


La multiplication est continue Nous considérons la multiplication 


m KxXE—E 


_.— (7.401) 


et nous montrons que c’est une application continue. Soit un ouvert O € E, nous considérons 
(do, to) € m_!(O), et nous allons prouver que K x E contient un ouvert contenant (0, 0) 
et contenu dans m !(O). 

Il existe r > 0 et à € I tels que B;(Aoto,r) € ©. Nous allons trouver une valeur de € > 0 telle 
que l’ouvert B(Ao,e) x Bi(xo,€) vérifie 


(ho, to) € Bo, €) x B;(xo, €) € mm (B;(Aoto;r)) cm !{(O). (7.402) 


578 CHAPITRE 7. TOPOLOGIE GÉNÉRALE 


Soit (À,x) € B()o,€) x B;(x0,€). Nous avons |A] < | ol + € et le calcul suivant : 


pi(X — Àoto) = pi(At — Àxo + Àro — ÀoTo) (7.403a) 
= pi(A(x — %0) + (À — À0)x0) (7.403b) 
< AÏpi(x — zo) + |A — Aolpi(xo) (7.403c) 
< (|Aol + €) pifz — xo) + [À — À] pi(xo) (7.403d) 
Nr 
< (|ol + €) + epi(xo) (7.403e) 
= + e(l ol + pi(xo)). (7.403f) 


Il n’y a pas de problèmes pour trouver un € > 0 pour que le tout soit plus petit que r. 


(9) Espace vectoriel topologique Nous avons prouvé que (E,7p) était un espace vectoriel 
topologique. 


(10) Localement convexe en 0 Nous montrons que B;(0,r) est convexe. Soient x,y € B;(0,r) 
ainsi que {€ [0,1]. Nous avons 


pi(te + (1 —t)y) < [tlpi(æ) + [1 — tIpi(y) (7.404a) 
<tr+(1—tr (7.404b) 
= (7.404c) 


Donc tx + (1—t)ye Bi(0,r). 

(11) Localement convexe Soit a € E, et montrons que B;(a,r) est convexe. Si t, est la trans- 
lation de vecteur a nous avons Bi(a,r) = ta(B(0,r)). Soient x,y € Bi(a,r). Nous avons 
x—a,y—a€ B;(0,r), et vu que la boule B;(0,r) est convexe, 


t(x— a) + (1—t)(y — a) € B;(0,r). (7.405) 

Un tout petit peu de calcul : 
t(x—a)+(1—t)(y— a) =tr+(1—-t)y—-ta—(1—-tja (7.406a) 
=tr+(1-t)y-a. (7.406b) 


Cela prouve que tx + (1 — t)y — a € B;(0,r), et donc que tx + (1 — t)y € B;(a,r), ce qu’iol 
fallait. 


PROPooNAFAooShzixo 
Proposition 7.328 ([220, 1]). 
Soit un espace vectoriel X ainsi qu’un ensemble de seminormes {pi}ier. Îl existe une unique topo- 
logie T sur X telle que 


(1) (X,7) est un espace vectoriel topologique localement convexe. 


(2) Une base de topologie de T en 0 est donnée par 
Bo = {Byj(0,e) tel que J est fini dans I,e > 0}. (7.407) 
Cette topologie est la topologie Tr donnée en (7.389). 


Démonstration. En ce qui concerne l’existence, la topologie 78 donnée dans la proposition 7.327 
fait l'affaire. Nous démontrons l’unicité. Soit une topologie 7 sur X vérifiant les conditions. Nous 
allons prouver que T = Tg. 
En deux inclusions. 
(1) TR € T La topologie rg a une base formée de parties de la forme By(x,r). Nous montrons 
que ces parties sont dans 7. En utilisant le lemme 7.326 et la proposition 7.163, nous avons 


Bj(x,r) = Bj(0,r)+xceBo+zcr. (7.408) 


Vu que 7 contient une base de la topologie Tg, nous avons TB € T. 
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(2) rc rs Les By(0,r) qui forment une base de topologie de 7 en 0 sont des éléments de Tg. 
Les By(x,r) = By(0,r) + x forment une base de topologie de 7 en x, et font aussi partie de 
TB. 


PropQPzGKVk 
Proposition 7.329. 
Soit un ensemble E muni de la topologie des seminormes {pi}ier. Une suite (x,) dans E converge 
vers æ si et seulement si pour toutielT, 


Di(T — Tn) — 0. (7.409) 


Démonstration. Si la suite (x,) converge # vers x, alors pour tout ouvert © autour de x, il existe 


un N tel que si n > N, alors x, € ©. En particulier pour tout j et pour tout € > 0, il doit exister 
un n > N; tel que x, € B;(x,e). 

Voyons l’implication inverse. Soit € > 0. Pour tout 1 € 1, il existe un N,; tel que n > N,; implique 
pi(x — tn) < €. Si O est un ouvert, il doit contenir une boule du type By(x,r) pour un certain 
ensemble fini J € I. 

En prenant N = max{N; tel que j € J}, nous avons pj(x — x,) < € pour tout j et donc 
tue Bré,r). 


ii Avertissement /question au lecteur !! 7.330 
Je n'ai pas vérifié si la proposition 7.331 est correcte. D'ailleurs je même pas trouvé l’énoncé; et 
j'avoue n'avoir pas trop cherché. 


La preuve serait sans doute similaire à ce qu’on a pour le lemme 7.217. 


Proposition 7.331 ([1]). 
Soient des espaces vectoriels munis de seminormes (E, {pi}ier) et (F, here Nous posons 


REX —R Ts) 
(x, y) + max {pi(x), q;(y)}. 
Alors : 
(1) Les r;; sont des seminormes. 


(2) La topologie induite sur E x F par ces seminormes est la topologie produit. 
PROPooGXGQooLRTwvH 
Proposition 7.332 ([254, 1]). 
45 


Un espace vectoriel muni de seminormes sur un corps valué est un espace vectoriel topologique *. 


Démonstration. Soit un espace vectoriel Æ muni des seminormes {p;};er. Sa topologie est donnée 
par la définition 7.327. Sur le corps K, nous avons la topologie métrique 7.173. 


(1) Somme 


Nous commençons par prouver que 


f:ExE—E 


ns. (7.411) 


est continue. Soit un ouvert © de E ; nous allons prouver que f-!1(©) est ouvert en prouvant 
qu’il contient une boule ouverte autour de chacun de ses points (théorème 7.8). Notez que 
f-'(O) c Ex E; la topologie sur cet ensemble est celle est seminormes rij données en 
(7.410). Nous allons en particulier utiliser la seminorme q; = ri; donnée par 


q X EQooPDRPoo 3) 
(x,y) + max {pi(x),pi(y)}. 


144. Définition 7.15. 
145. Définition 7.161. 
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Soit (a,b) e f-!(O). Vu que a + be O et que © est ouvert, la partie © contient une boule 
ouverte autour de a + b (définition 7.327). Soit 1 € I et r > 0 tels que 


B;(a + b,r) € ©. (7.413) 


Nous allons prouver qu’il existe un s > 0 tel que B;((a, b), s) c f (©), et plus précisément 
que 


S(Bi((a.t),s)) € Bi(a + br). (7.414) 
À gauche, B; est la boule dans E x E pour la seminorme (7.412). Soit (x,y) € B;((a, b), s), 


c’est-à-dire — 
qi((a, b) En (x, y)) < 5. sa CCooogy 


Pour savoir si f(x,y) € B;(a + b,r), nous posons x = a + h et y = b + k et nous calculons 


p(f(a,9) — (+8) = m(e+y 0-0 (7.416) 
= pj(h + k) (7.416b) 
< pi(h) + pi(k) (7.416c) 
< 2max{pi(h), pi(k)} (7.416d) 
— qi(h, k) (7.416e) 
< 25 par (7.415). (7.416f) 


En posant s = r/2, nous avons bien f(x,y) € ©, et donc f-!(O) est un ouvert; f est alors 
continue. 


Produit Nous nommons K le corps de l’espace vectoriel E. Nous devons voir que l’appli- 


cation 
J:KxE—E 


ne (7.417) 


est continue. 
La topologie sur K est sa topologie métrique, c’est-à-dire la topologie de son unique semi- 
norme À + |A]. La topologie sur K x E est donc celle des seminormes 


q x R PAC FRA 
(A,x) > max{lA|, pi(x)}. 


Nous pouvons donc reprendre le même cheminement que celui que nous avons pris pour la 
somme. Soit un ouvert © dans E ; nous considérons (À, a) € f-!(O). Vu que f(x, a) e O, et 
que © est ouvert pour la topologie des {pi}ier, il existe à € T'et r > 0 tel que B; (F(A a), r) (en 
O. 


Nous allons prouver qu'il existe s > 0 tel que 
f(B(Q0.s)) € Ben). (7.419) 


Ici encore, à gauche B; est la boule pour la seminorme q; donnée en (7.418). Soit (u4,x) € 
B; ((A, &); s) , c’est-à-dire 


q(Qu,æ) — (À, a)) = max{|A — y}, pi(a — x)} < 5. (7.420) 
En particulier nous avons les deux inégalités 


[À — ul <s, (7.421a) 
pi(a — x) < 5. (7.421b) 
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: SUBEQSooHWMSooBJsR 
Nous avons le calcul suivant : | Q 8y 


pi( fu, x), Xa) = pi(ux — da) (7.422a) 
= p;(ux — Àx + Àx — Àa) (7.422b) 
< pi((u — X)x) + |AÏpi(x — a) (7.422c) 
= [u — Àlpi(x) + [Alpi(x — a) (7.422) 
< spi(æ) + |Als. (7.422e) 


C’est le moment de chercher une majoration pour p;(x) : 
pifz) = pifa + (x — a)) < pi(a) + pi(x — a) < pi(a) + 8. (7.423) 


Nous pouvons continuer la majoration (7.422) tout en ne nous posant pas de questions sur 
le sens de l’inégalité parce que nous cherchons s > 0 : 


pi(f(u, x), Aa) < spi(æ) + [AÏs (7.424a) 
< s(pi(a) + s) + |AÏs (7.424b) 
= 57 + (|A + pi(a)}s. (7.424c) 


Nous devons prouver l'existence d’un s > 0 tel que 5? + (IA + pi(a))s < r; autrement dit 
nous devons résoudre l’inéquation 


8? + (|A + pi(a))s — r < 0. (7.425) 


Nous sommes en présence d’un polynôme du second degré en s qui vaut —r < 0 en s = 0. Par 
continuité, il existe un voisinage de s = 0 dans R sur lequel le polynôme reste strictement 
négatif. Il suffit de prendre un 5 positif dans ce voisinage. 


La proposition suivante est pratiquement une copie de la proposition 7.283. 


PropNGjQnqF 

Proposition 7.333. 

Soit f:R—(E,pi);ier une application. Nous avons équivalence entre TtemHNxGMpCi 
(1) la fonction f est continue en to € R, TtemHNxGMpCi i 
(2) si W est un voisinage ouvert de f(to) il existe un voisinage ouvert V de to (dans R) tel que 

f(V)eW, ItemHNxGMpCiii 
(3) pour toutielT ete > 0 il existe 8 > 0 tel que 
f(B(t0,6)) € B;(f(to), €). (7.426) 


Démonstration. L'équivalence (1) & (2) est la définition 7.32. 

Prouvons (2) = (3). Soient ie I et e > 0. Considérons la boule B;(f(to),€), qui est un ouvert 
de E contenant (to). Il existe donc un ouvert V autour de to tel que f(V) € B;(f(to),e). En 
particulier V contient une boule B(t0, 0) et nous avons 


F(B(t0,6)) € f(V) € Bi(f(to),e). (7.427) 


Prouvons (3) = (2). Soit W un ouvert autour de f(to). Il existe un à € J et € > 0 tel que 
B;{f (60), €) ec W. Nous avons alors un 6 > 0 tel que 


f(B(to; ô)) (en B; (f (to), €) c W. (7.428) 
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Lorsqu'on à un espace E muni d’une quantité dénombrable de seminormes {p4}xer nous défi- 
nissons l'écart !16 1 aile 
d(x, y) = sup min Cop(e — y)}. EU ) 
> 


Notons que cet écart est invariant par translation au sens où pour tout &,y,h dans Æ nous avons 


1 
d(x +h,y+h) = sup min {2 pk(œ y)} = dx, y). (7.430) 
k>1 


7.18.3 Seminorme et métrisable 


Définition 7.334 ([220]). 
Soit un espace vectoriel topologique X. Une famille {pi};er de seminormes est séparante si pour 
tout x E X\{0}, il existe à € I tel que pi(x) Z 0. 

PROPooMJEQooHtIyex 
Proposition 7.335. 
Si X est un espace topologique dont la topologie est donnée par une famille dénombrable et séparante 
de seminormes "7, alors il est métrisable $. 


Démonstration. Nous utilisons le théorème 7.267. Nous considérons les seminormes {pi};er où 1 
est dénombrable. 


(1) Base dénombrable Vu que 1 est dénombrable, l’ensemble des parties finies de Z est dé- 
nombrable °, Pour a € X, l’ensemble des boules de la forme By(a,1/n) avec n € N et J fini 
dans 1 est donc dénombrable et forme une base de topologie en a. 


(2) Singleton fermé Prouvons que {0} est fermé. Pour cela nous prouvons que le complémen- 
taire est ouvert. Soit a £ 0. Vu que {p;};er est séparante, il existe à € 1 tel que p;(a) Æ 0. 


L'application p; est continue par 7.327(2). Donc pour tout € > 0, la partie pe (8 (pi(a), 9) 
est un ouvert contenant a. 


En prenant 0 < e < p;(a) et en tenant compte du fait que p;(0) = 0, 
Ipi(0) — pi(a)| = Ipi(a)| > €, (7.431) 


et donc pi(0) # B(pi(a),e) ou encore 
0épr'(B(pi(a), 0): (7.432) 


Bref, l’ouvert p; | (8 (pi(a), 9) contient a mais pas 0. 


7.18.4 Boules et topologie 


PropLOwUvCO 
Proposition 7.336 ([246]). 
La topologie donnée par les boules 
1 E Y 
By(a;r)={xeE tel que Vk< -,py(x — a) <r} a 
2 


est la même que celle « usuelle » donnée par les seminormes. En disant « la même » nous entendons 
le fait que les ouverts sont les mêmes : À est ouvert pour une des deux topologies si et seulement 
si il est ouvert pour l’autre. 


146. Dans le cas de E = Z(K), la première seminorme est numérotée à zéro, donc il faudra poser d(41,w2) avec 
Pk-1 au lieu de px. 

147. Topologie des seminormes, proposition 7.327. 

148. Métrisable, définition 7.247. 

149. Lemme 1.135. 
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Démonstration. Pour cette démonstration nous allons préfixer par d les notions topologiques issues 
des boules (7.433) et par P celle des seminormes : P-continue, d-ouvert, etc. 


Bia;r) = N Bz(a,r). Far PARIS 


1 
k<} 


D'abord nous avons 


Si O est un d-ouvert, il contient une d-boule autour de chacun de ses points. Or d’après la formule 
(7.434), une d-boule est une intersection finie de P-ouverts et donc est un P-ouvert par définition. 
Donc © contient un P-ouvert autour de tous ses points et est donc P-ouvert. 

Inversement nous supposons que © est un P-ouvert. Commençons par prouver que les semi- 
normes p4 sont d-continues. En effet soient k € NN, € < À et x,y € E tels que d(x,y) < €; nous 
avons 


Ipk(y) — pk(x)| < pk(z — y) (7.435) 
= min{ . ,pk(x — y)} (7.435b) 
< dE, u) (7.435c) 
< €. (7.435d) 


Montrons à présent que © est d-ouverte. Si a € ©, il existe k et r tels que Bz(a,r) € ©. Soit 
x € By(a,r). Montrons que si e est suffisamment petit, la d-boule B(x,e) est inclue à By(a,r). 
Pour cela prenons y € B(x,€) ; nous avons 


Jpk(a — x) — pe(a — y)| < d(x, y) < €. (7.436) 
Par conséquent le nombre p4(a — y) est dans l'intervalle 


pk(a—z)+e (7.437) 


r—pr(a—x) 
2 : 


et il suffit de prendre € < 


THOo00TKWYooYYiBNa 
Théorème 7.337 ([255]). 
Soit une famille de seminormes {pi}ier sur E. Pour une seminorme q sur E, les conditions sui- 
vantes sont équivalentes. 


ITEMooHKNYooARXiXs 
(1) L'application q: E — R est continue. ITEMooBBNCooCwHrUT 
(2) Il existe une partie finie J de I et un nombre M ER tels que 
q(x) < M max p;(x) (7.438) 
j€ 
pour tout x € E. ITEMooWXSWooV£vSUy 


(3) L'application q est bornée dans un voisinage de 0. 


Démonstration. En trois parties. 


(1) @&) = (3) 


C’est la proposition 7.113. 


(2) (3) = (2) 
Soit un voisinage V de 0 sur lequel q est borné par y. Ce voisinage contient une boule centrée 
en 0. Par la définition 7.327, nous avons une partie finie J € I et r > 0 tels que q est bornée 
par 4 sur By(0,r). 
Soit x € E. Nous posons 


te ]0,min (7.439) 


AE 
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Pour { € J nous avons alors 


piftx) = tpi(x) (7.440a) 
< sur © 0 (7.440b) 
< A@ 7) (7.440c) 
=" (7.440) 


Donc tx € Bj(0,r). En ce qui concerne q nous avons alors tq(x) = q(tx) < u et donc 


q(x) < _ (7.441) 
En utilisant la proposition 1.434, 
q(x) < ne (7.442a) 
l 
re (7.449b) 
= Hmax pie) (7.442c) 
= Fmax pi(®). (7.442d) 
En posant M = y/r nous avons 
q(x) < Mmexpi(æ), (7.443) 


comme demandé. 


(3) (2) = (1) 
Nous avons une partie finie J € let MER tels que g(x) < M maxjey p;(x) pour tout x e E. 
Soit x € E. Nous prouvons que q est continue en x. Pour tout y nous avons 


a) — a()l < ax — y) < Mmaxp;(z — y). (7.444) 
Soit e > 0. Si nous prenons y € By(x,€), alors nous avons 


la(y) — g(x)| < Me. (7.445) 


Cela prouve que q est continue en x, et donc continue sur Æ par la proposition 7.33. 


CORooSLUCooRaZyYK 
Corolaire 7.338 ([255]). 
Soient une famille de seminormes P sur E, ainsi qu’une famille Q de seminormes sur F. Une 
application linéaire f: E — F est continue si et seulement si q o f est une seminorme continue 
sur E pour tout q € Q. 

CORooGMVHooNgYOaY 
Corolaire 7.339 ([255]). 
Soient des seminormes P = {p;}hier sur E. Soit une application linéaire f: E — K. Elle est 
continue si et seulement si il existe une partie finie J € TI et MER tels que 


[f(x)| < M max D; (x) (7.446) 


pour tout x € E. 
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7.18.4.1 Norme induite sur la topologie quotient 
PROPooDUAVooEfrEGI 


Proposition-Définition 7.340 (Norme quotient[256]). 
Soient un espace vectoriel topologique normé E, et un sous-espace M. Pour a € E/M nous posons 


la gym = d(a, M) (7.447) 

où d(a, M) est la distance entre la partie à et la partie M. 
Nous avons : ITEMooQOZXooZiZdTn 
(1) La formule |a| = infuea [ul ITEMooFE0Go0TTDgC j 
(2) L'opération |.| est une seminorme !°° sur l’espace vectoriel E/M. ITEMooWCCSooMeaQHL 


(3) C’est une norme si et seulement si M est fermé. 


Nous parlons de (semi)norme quotient. 


Démonstration. Point par point. 
(1) Pour (1) La définition de |a| est la] = d(a, M) = inf, [lu — v|. Mais 


veM 
{u—vtel queuea,veM}=a, (7.448) 
donc 
d(a, M) = inf fu||. (7.449) 


(2) Pour (2) Nous devons vérifier les propriétés de la définition 7.311. D’abord en tant que 
distance, nous avons [a] > 0 pour tout a. 


Sie R nous avons aussi 
JAa| = inf Ju] = inf JAu] = [À inf Ju] = |A||a|. (7.450) 
uEÀQ ue uEX 


Enfin si à, 8 € E/M, nous avons 


inf {ul < inf [u+v| < inf (|u] + [u|) = inf Jul + inf fu] = al + [ob]. (7.451) 
uea+fB —. ei ue veB 


(3) Pour (3) en supposant que M est fermé Nous supposons que M est fermé et nous 
montrons que |.| est une norme. Nous supposons donc que d(a, M) = 0 et nous prouvons 
que à = 0. Soit x € E tel que a = [x]. Nous avons donc 


a={x-—vtel que ve M} (7.452) 


Notez qu’on a écrit —v et non +vw. De toutes façons M est vectoriel ; ça ne change rien et ça 
tombera mieux plus bas. 


Nous avons donc 
0 = lai = da, M) = juf lu] = inf br — ul (7.453) 


Il existe donc une suite (v,) dans M telle que |x — v,| — 0. La suite est donc convergente : 
Un — +. Comme M est fermé, la proposition 7.242 nous indique que la limite doit être dans 
M. Autrement dit : x € M. Par définition des classes nous avons alors «a = [x] = 0. 


(4) Pour (3) en supposant que |.| est une norme 


Supposons que M n’est pas fermé. Il ne contient donc pas son adhérence. Soit a € Adh(M)\M. 
Vu que M est vectoriel, nous supposons que a Z 0. 


Étant donné que a est dans l’adhérence de M nous avons d(a, M) = 0 et donc |[a]| = 0. 


150. Définition 7.311. 
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ii Avertissement /question à la lectrice !! 7.341 
Je ne suis pas certain de la proposition 7.3/2. Peut-être qu'il faut ajouter l'hypothèse que M est 


fermé. 
PROPooKLXSooSOUZkc 


Proposition 7.342. 
Soient un espace vectoriel topologique normé E, et un sous-espace M. La topologie quotien 
E/M est la même que celle de la seminorme induite !°?. 


+51 sur 


7.18.5 Espace dual 


Nous parlerons plus en détail d'espace dual d’un espace normé en la section 11.15. 
DefHUe1lCDD 
Lemme-Définition 7.343. 


Soient F un espace métrique et E un espace topologique vectoriel. Pour chaque v € E,, l'application 


Po: L(E,F)—R 


T = [T(v)|r EE 


est une seminorme. 
La topologie +-faible sur L(E, F) est la topologie des ces seminormes. 


7.344. 

C’est une famille de seminormes indicées par les éléments de Æ. Si E est un espace métrique, c’est 

cette topologie qui sera considérée sur son dual topologique Æ’ des applications continues E — R. 
La topologie ainsi définie est, dans l’idée, celle qui sera choisie pour les espaces de distributions, 

voir la définition 30.32. 


La proposition suivante indique qu’elle est un peu la topologie de la convergence ponctuelle. 
PROPooQWOOooUBhBiG 


Proposition 7.345. 
Soient E un espace muni de la topologie des seminormes {pi}ier et F un espace métrique. Soient une 


suite (T,) dans L(E,F) et Te L(E,F). Nous avons T, > T si et seulement si T,(v) TE T(v) 
pour tout ve E. 


Démonstration. Nous avons équivalence entre les lignes suivantes : 
Tn —T 
Po(ln — T)—0Vve E proposition 7.329 
[Tn(v) — T(v)lr —0VveE 


T(v) > T(v). 


7.455a 
7.455b 
7.455C 


7.455d 


ES 
LE KR NP NA 


TT 


7.18.6 Espace C'(R, FE) 


Nous revenons à nos histoires de limites de la définition 7.13. 
PropRBCiHbz 


Proposition 7.346 (Unicité de la limite dans un dual topologique). 
Soient E un espace métrique et E’ son dual topologique muni de sa topologie de la définition 7.343. 
Il y a unicité de l’élément de E’ vers lequel une fonction u: R — E" peut converger. 


Démonstration. Soit T un élément vers lequel u converge lorsque t — to. Soient e > Oetxe E. 
La boule B,(T,e) de E’ subordonnée à la norme p, et centrée en T est un ouvert de E’. Etant 


151. Topologie quotient, définition 7.44. 
152. Voir la définition 7.340. 
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donné que u converge vers T il existe Ô > 0 tel que w € B,(T, €) dès que [t — to] < 6. Nous avons 
donc, pour tout x € E, la limite (dans R)) : 
Jim w(x) = T(x). (7.456) 
10 
Cela prouve que la convergence de w vers T implique l'existence pour tout x de la limite de w(x) 
dans R. Si T’ est un autre élément vers lequel u4 converge, nous avons par le même raisonnement 


que 
Jim w(z) = T'(x). (7.457) 
10 


Par unicité de la limite dans R nous devons alors avoir T(x) = T'(x) pour tout +, c’est-à-dire 
T=1", 


PropVKSNf1B 

Proposition 7.347. 
Soit u: R — E’ une fonction continue. Alors ItenLSJjfZdi 
(1) pour tout x € E la fonction t - w(x) est continue, Item. SJjfZdii 


(2) pour tout x € E nous avons la limite dans R 


lim w(x) = uw,(x), FAN EE NS) 


t—to 
ItemLSJjfzdiii 
(3) nous avons la limite dans E' 
Jim = (7.459) 


Démonstration. Soient x € E et € > 0. Par la proposition 7.333 la continuité de w donne un 6 > 0 
tel que 
UB(t0,6) S Bus, €). (7.460) 


C'est-à-dire que si |t — to] < Ô nous avons 
[ur (x) — w(x)| < €, (7.461) 


ce qui signifie bien que la fonction t + u(x) est continue en tant que fonction R — R. Cela est le 

point (1). Le théorème de limite et continuité dans R nous donne immédiatement la limite (7.458). 
Nous passons à la preuve du point (3). Soit © un ouvert de E’ contenant w4,. Il existe donc un 

ielet e> 0 tel que B(w,,e) € ©. Étant donné que u est continue, il existe 6 > 0 tel que 


UB(t0,6) € Bi(uto, €) € ©. (7.462) 


Cela signifie bien que 
É—tol <= we, (7.463) 


c'est-à-dire que nous avons la limite limy_,4, u = ur, dans E”. Pour dire cela nous avons utilisé la 
définition 7.102 de la limite et le résultat d’unicité 7.346. 


DefDZsypWu 
Définition 7.348. 
Si nous avons une application u: IR — E" nous considérons sa dérivée donnée par la limite 


(7.464) 


Cela est un nouvel élément de E' (pour peu que la limite existe). La fonction w': R — E’ ainsi 
définie peut être continue ou non. Cela nous permet de définir les espaces C*(R, E') et C?(R, E'). 


Une des principales utilisations que nous ferons de ces espaces seront les espaces de fonctions 
à valeurs dans les distributions tempérées dont nous parlerons dans la section 30.4. 
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7.19 Espaces de Baire 

DEFooYEMSoBDSAUYa 
Définition 7.349. 
Un espace de Baire est un espace topologique dans lequel toute intersection dénombrable d’ouverts 


denses est dense. 
LEMooTOJDooQDtEWUC 


Lemme 7.350 ([257]). 
Un espace topologique est de Baire si et seulement si toute union dénombrable de fermés d'intérieur 


vides est d'intérieur vide. 
ThoBBI1;jNM 


Théorème 7.351 (Théorème de Baire[257|). 
Les espaces suivants sont de Baire : 


(1) les espaces topologiques localement compacts, 
(2) les espaces métriques complets (donc ceux de Banach en particulier), 


(3) tout ouvert d’un espace de Baire. 


Démonstration. (1) Espaces topologiques localement compacts 


(2) Espaces métriques complets Soit (E,d) un espace métrique complet. Soient V un ouvert 
quelconque de E et U, une suite d’ouverts denses. Le but est de prouver que l’ensemble 
Nyen Un intersecte V. Vu que V est ouvert dans un espace métrique, il contient une boule 
ouverte et donc une boule fermée Bo de rayon strictement positif. L'ensemble U; est dense 
et intersecte donc un ouvert contenu dans B5. L’intersection est un ouvert qui contient alors 
une boule fermée B1 de rayon strictement positif. Continuant ainsi nous construisons une 
suite de fermés emboités B, telle que 


[un v (7.465) 
neN 


contient l'intersection des B,. Par le théorème 7.284 des fermés emboîtés (que nous utilisons 
parce que E est métrique et complet), cette intersection est non vide. 


(3) Ouvert d’un espace de Baiïire 


Parmi les applications du théorème de Baire, nous avons 
— Le théorème de Banach-Steinhaus 11.139. 


— Le théorème de l'application ouverte 11.148. 


Chapitre 8 


Espaces affines 


8.1 Vecteurs agissant sur un espace 


Définition 8.1. 
Soit E, un espace vectoriel. Un espace affine modelé sur E est un ensemble € sur lequel le 
groupe (E,+) agit à droite transitivement et librement !.. 


Étant donné que E est un groupe commutatif, l’action peut être vue indifféremment à gauche 
ou à droite. Si ME € et si x e E nous notons M + x au lieu de x : M le résultat de l’action de x 


sur M. 
NORMooZANAooQdXqlh 


8.2. 
Lorsque nous écrivons & M + x », le symbole plus n’est pas une loi de composition interne de €, 


mais une action. 
DEFooWAYTooMLbqEE 


Proposition-Définition 8.8. 
Soient N,M E €. Il existe un unique x € E tel que M + x = N. 
Nous noterons MN ce vecteur. 


Démonstration. La transitivité de l’action assure l'existence et la liberté assure l’unicité. 


LEMooFZCRooQxzObv 
Lemme 8.4. 
Pour tout élément À nous avons À + 0 = À. 
Démonstration. Soit B € €. Nous avons : 
B+0=B+(0+0)=(B+0)+0 (8.1) 


parce que le + dénote une action. 


En appliquant cette égalité à l’élément B = À — 0 nous trouvons l’égalité demandée. 
PROPooCOZCooCghwaR 


Proposition 8.5. 
Soit un espace affine € modelé sur l’espace vectoriel E. Soient A, B,C € €. Nous avons les égalités 


suivantes dans E : ITEMooSDMIooUQiKeW 
(1) AB + BC = AC (relations de Chasles), LTEMooWZAVooGfGBwd 
(2) AÀ = 0, ITEMooLDVXooFZMbsQ 


(3) BÀ = -AË. 


Démonstration. Point par point. 


1. Définition 2.45. 
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(1) Pour (1) Nous avons, par définition 8.3 les égalités 


C = A+ AC (8.2a) 
B=ALAE (8.2b) 
C=B+BC (8.2c) 


En substituant les deux premières dans la troisième, nous trouvons À + AB+BC = A+AC. 
Par liberté de l’action, nous pouvons « simplifier » par À et trouver la relation de Chasles. 


(2) Pour (2) Nous avons À + AÂ = À, mais aussi À + 0 = A. Par unicité nous avons AÀ = 0. 
(3) Pour (3) Nous avons B+ BÂ = Act A+ AB = B. En mettant bout à bout, 


B + BÀ + AB = B. (8.3) 
Donc BÀ + AB = 0. 


NORMooXAJLooïlupek;j 
8.6. 


Si E est un espace vectoriel, le groupe (E, +) agit sur E par l’action t,(x) = y + x. Utilisant cette 
action nous construisons l’espace affine canonique de Æ. En particulier nous notons €,(K) 
l’espace affine canonique de K" vu comme espace vectoriel sur K. 
— En tant qu’ensembles, €,(K) = K”. 
— Sur cet espace en particulier, si M, N € £,(K), nous avons MN = N — M où à droite, la 
différence est la différence vectorielle dans K”. 


Ces deux points se généralisent immédiatement à un espace vectoriel E au lieu de K”. 


8.2 Repères cartésiens affines 


Soit E un K-espace vectoriel de dimension n et € un espace affine construit sur Æ. 
DEFooQELZooEXvxgw 
Définition 8.7. 


Un multiplet (A,e1,...,en) où À est un point de € et {e;} est une base de E est un repère 
cartésien de €. 
Nous disons que {e;} est la base associée au repère. 


Proposition 8.8. 
Si € est un espace affine modelé sur l’espace vectoriel E de dimension n sur le corps K, et si 
(A, {ei}i=1..n) est un repère cartésien, alors 
p: K€ 
(t1,...,2n) + A+ mie. (8.4) 
i 
est une bijection. 
Ces nombres x; sont les coordonnées du point À + Ÿ;; ie; dans le repère (A, e;). 


Démonstration. L'application @ est surjective parce que l’action de E sur € est transitive et injec- 
tive parce que l’action est libre. 


8.3 Classification affine des coniques 


Soit une conique f(x, y) = 0 avec 
f(x, y) = ax? + 2bxy + cy° + 2dx + 2ey + f (8.5) 


dans le repère R = (A,e;). 
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LEMooXZURooSVySRT 
Lemme 8.9. 
La signature de la quadratique 
q(x,y) = ax? + 2bxy + cy? (8.6) 
ne dépend pas de la base choisie et un changement de variables 
& = ax + By (8.7a) 
ÿ = yx + Ôy (8.7b) 
peut nous amener dans trois cas : 
æ +9? genre ellipse 
g(x,y) = 4%? —ÿ? genre hyperbole (8.8) 
3? genre parabole. 


Dans le troisième cas, la matrice de q est de rang 1. 


Nous cherchons maintenant à savoir si un point T1 = (x0,%o) est un centre de symétrie de 
f(x, y) = 0. Pour cela nous choisissons le repère centré en J, c’est-à-dire que nous posons 


= T0 +È (8.9a) 
= Yo + Ÿ. (8.9b) 
Un peu de calcul montre qu’alors la conique s’écrit 
f(xo, Yo) + q(&, ÿ) + (axo + 2byo + 2d)& + (2bxo + 2cy0 + 2e)ÿ = 0. (8.10) 
LEMooMVIDooVEUJsp 
Lemme 8.10. 
Le point I sera un centre de symétrique si les termes linéaires en Z et ÿ s’annulent, c’est-à-dire a 
{ axo + byo + d = 0 (8.11a) 
bxo + cyo + e = 0. (8.11b) 


yskhiOvW 


Nous supposons que (d,e) Æ (0,0), sinon la conique de départ serait déjà centrée. Le détermi- 
nant du système (8.11) est 
= ac — b. (8.12) 


Si ce dernier est différent de zéro, le système possède une unique solution et la conique aura alors 
un unique centre de symétrie. 

Si le déterminant du système est nul, il y a soit aucun centre de symétrie, soit une infinité. 
Dans le premier cas nous sommes en présence d’une parabole, et dans le second cas de deux droites 
parallèles. 


Exemple 8.11. 
Soit 
E 
f(x, y) = x? + 2xy — y? — 6x + 2y — 1 —=0 ESF 


donnée dans le repère affine R = (A, {e;}). Nous commençons par étudier la signature de q(x, y) = 
2? + 2xy — y? dont la matrice symétrique est 


Q= È 2 (8.14) 


Son polynôme caractéristique est À? — 2 dont les racines sont +42. La signature est donc (1,1) et 
nous sommes en présence d’une conique de genre hyperbole. Nous cherchons le centre en suivant 
le lemme 8.10. Nous posons x = # + %0, y = ÿ + yo, et nous cherchons à résoudre le système 


{ To + Yo — 3 = 0 (8.15a) 
to — Yo +1 = 0. (8.15b) 
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L’unique solution est (x0, yo) = (1,2). Nous considérons le repère centré en (x, yo), c’est-à-dire le 
repère 
R' = (I, {ei}) (8.16) 
avec T1 = À + xpe1 + yoe2 où À est l’origine du repère dans lequel l’équation (8.13) était donnée. 
Par construction dans ce repère nous avons la conique 


f(xo, Yo) Ed qa(&, ÿ) = 0, (8.17) 
c’est-à-dire 

ER +2%ÿ-ÿ —2—0. (8.18) 
Maintenant, nous avons une quadrique centrée que nous voulons mettre sous une forme plus ca- 
nonique : 


(Re+0) -#-1 = 0. (8.19) 


Nous posons donc 


1 
X = —(5+ÿ 8.20a 
0) ÿ) (8-20a) 
Y = ÿ, (8.20b) 
pour trouver l’hyperbole 
ER ea (8.21) 


Cherchons le changement de base correspondant. Pour trouver les coordonnées de e, dans la 
base (e1,e2) nous cherchons pour quelles valeurs de x,y nous avons €} = xei + ye2. Le point el 
étant caractérisé par X = 1, Y = 0 nous avons à résoudre 


1 
—(x+y)=1 8.22a 
Te +0) (8.22) 
y = 0, (8.22b) 
ce qui donne x = ÿ2 et y = 0. Donc 
ei = V2ei. (8.23) 
Pour trouver €, c’est le même raisonnement en posant X = 0 et Ÿ = 1. Le résultat est : 
En = —E1 + €2. (8.24) 
: EqfiVwym 
Résumons : | 


e, = V2e (8.25a) 
Ep = —E1 + €2. (8.25b) 


Il y a un dicton qui dit que les vecteurs de base se transforment avec la matrice inverse des 
coefficients. Prenons la matrice M donnée par 


EC 9 -u() . 


Calculons la matrice inverse. 


sage: M=matrix([ [1/sqrt(2), 1/sqrt(2)1,[0,1] ]) 


sage: M 
| [1/2*sqrt (2) 1/2*xsqrt (2)] 
C (0) 1] 
s|sage: M.inverse() 
| Csqrt (2) -1] 
C 0 1] 


tex/sage/sageSnip023.sage 


Nous voyons que les colonnes de la matrice M7! donnent les coordonnées des vecteurs e4 et €. 
A 
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8.4 Applications affines 


Voici la définition d’une application affine entre deux espaces affines. La définition 9.157 donnera 


le définition d’une application affine entre espaces vectoriels. 
DEFooUAWZooXcMKve 


Définition 8.12. 
Soient € et £’ deux espaces affines sur les espaces vectoriels E et E' (sur le même corps K). 
Une application f : £ — £' est dite affine si pour tout M € €, il existe une application linéaire? 
um: E — E' telle que 
EqM 
FM + x) = (M) + um(x) Ban 


pour tout x € E. 


La définition suivante permet de décomposer une application affine en une partie linéaire et une 


translation. À partir de là, la proposition 8.62 nous donnera une structure de groupe sur Aff CR 
LEMooYJCDooUGAHKkF 


Lemme-Définition 8.13 (partie linéaire d’une application affine[1]). 
Soient € et €’ deux espaces affines sur les espaces vectoriels E et E’ (sur le même corps K). Nous 
considérons une application affine f : £ — €". 

Il existe une unique application linéaire u: E — E' telle que 


fM + x) = f(M) + u(x) (8.28) 


pour tout x E E et pour tout ME €. 
Cette application linéaire est appelée partie linéaire de f. Pour varier les notations, nous 
noterons souvent f = a 07, pour une application linéaire a et la translation 7, de vecteur v. 


Démonstration. En plusieurs étapes. 


(1) Unicité Supposons que ui et u2 vérifient la propriété, alors pour tout x € E et tout ME € 
nous avons f(M + x) = f(M) + wi(x) et f(M + x) = f(M) + ui(x). Cela suffit à nous 
convaincre que U] = U2. 

(2) um = un Avant de prouver l’existence, nous considérons M,N € € et les applications 
linéaires um et un vérifiant l'équation (8.27) pour M et N respectivement. Prouvons que 


UM = UN. 
Posons 
FM + x) = f(M) + um(x) (8.29a) 
FN + y) = F(N) + un(y). (8.29b) 
Définissons a € E par N = M + a; nous avons d’une part 
JON +y) = {M +y+a) = f(M) +um(y + a), (8-30) 
et d'autre part 
JON + y) = f(M + a) +un(y) = F(M) + um(a) + un(y). (8.31) 


Par conséquent um (y + a) = um(a) + un(y). Par linéarité un = um. 
(3) Existence Soit M € €. Nous affirmons que um fait l’affaire. En effet, soient NE£etreE. 
Puisque uy = un nous avons 


JON +2) = JON) + un(x) = FN) + um(x). (8-32) 


Donc effectivement uw peut être utilisé en tout point de €. 


Ce lemme est important car il permet de démontrer qu’une application est affine en prouvant 
la linéarité des uy séparément sans devoir prouver qu’elles sont égales. 


2. Définition 4.28. 
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8.4.1 Autres propriétés 
LEMooXXTPooKYFGGM 


Lemme 8.14 ([1|). 
Soient M € € et A,B € € deux points donnés par À = M + x,, B = M + x. Soit encore une 
application affine f sur €. Alors 


FA)S(B) = us(xy — Ta). (8-33) 
Démonstration. En appliquant f à À = M +x, et B= M +32, 
F(A) = (M) + u(xa) (8.34a) 
F(B) = F(M) + up(x). (8-34b) 
Donc f(B) = f(A) — uf(xa) + ur(xy) ou encore 
F(B) = (A) + us(xy — a). (8-35) 


Remarque 8.15. 
La condition (8.27) pour tout M € € est équivalente à demander 


FOotx = tu(x) ° J (8.36) 


pour tout x € E. 
PROPooALXYooHoMdqQ 


Proposition 8.16 ([1]). 
Soit une application affine f : £ — E. ITEMooSKCYooHyRZYN 


(1) I existe une unique application linéaire ur telle que f(M + x) = f(M) + us(x) pour tout 
MEË£ettoutxeE. 


(2) L'application u est injective si et seulement si f est injective. 


(3) L'application ur est surjective si et seulement si f est surjective. 


Démonstration. En plein de parties. 
(1) Pour (1) 
La partie (1) est le lemme 8.13. 
(2) Si us est injective Soient M, N € € tels que f(M) = f(N). Nous avons 


f(M) = FN) = FM + (N — M)) = f(M) +uÿ(N — M), (8-37) 
donc uf(N — M) = 0. Vu que u; est injective, nous déduisons que N — M = 0. 


(3) Si f est injective Soient r,y € E tels que uy(x) = uy(y). Soit M quelconque dans E&; 
nous avons 


J(M +2) = f(M) +u(z) = f(M) +us(y) = f(M + y). (8.38) 

L’injectivité de f nous indique alors que M +x = M +y et donc que x = y parce que l’action 
de E sur € est libre. 

(4) Si up est surjective Soit M e €. Nous allons trouver un élément de £ dont l’image par f 
est M. Soient Ne£etre E tels que uf(x) = M — f(N). 
Alors nous avons f(N + x) = f(N)+u(x) = M. 

(5) Si f est surjective Soit a € E. Nous voulons x € E tel que u(x) = a. Soit M e E. Vu 
que f est surjective, il existe N € € tel que f(N) = f(M) + a. 
Posons x = N — M. Nous avons d’une part 


FM + x) = f(M) + ur(x) (8.39) 


et d'autre part 
J(M +2) = f(M+(N -M)) = f(N) = f(M) +a. (8.40) 


En égalisant nous trouvons uf(x) = a. 
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Proposition 8.17. 
Soient des espaces affines € et €’ de même dimension. Une application affine f: £ — E' est 
injective si et seulement si elle est surjective. 


Démonstration. Nous allons utiliser les équivalences de la proposition 8.16, ainsi que le corolaire 
4.48 pour la partie linéaire. Nous avons les équivalences : 


f est injective & u/ est injective + us est surjective & f est surjective. (8.41) 


EXo0oAGINooYmvPML 

Exemple 8.18. 
L'espace R’ est très particulier parce qu’il agit sur lui-même; il est donc un espace affine à lui 
tout seul : € = E = R?. 

Dans le cas de R”, en posant M = 0 dans la condition (8.27), si f est une application affine il 
existe une application linéaire a et un vecteur v tel que f = 7, 0 a. 

Notons que ça n’a pas de sens de poser M = 0, et la décomposition f = 7, © à n’a aucun sens 
en général. En particulier, nous ne pouvons pas appliquer une application linéaire à un élément 


d’un espace affine général. A 
PROPOoOUNE00oQUZetlW 


Proposition 8.19. 
Si f: € — E et g: €! — E" sont des applications affines, alors go f: £ — €" est affine et 
Ugof —= Ug O uf. 


Démonstration. Si M e € et x € E nous avons 


(go f)(M + x) = g(f( (M) + us(x pi 
= g(f(M)) + ug(us(x)) (8.42) 
= (go f)(M) + (ugo us)(x). 


THOo0oBAPDooEUtBgF 
Théorème 8.20. 
Soient € et € deux espaces affines de dimensions finies p et q sur K. Soient les repères cartésiens 
R = (O,f{e:;}) et R! = (0',{el}). Une application f: € — E" est affine si et seulement si il existe 
une matrice a € M,,.(K) et be KA tels que° 


f(x) = b+ ax. Fais, 


8.5 Isomorphismes 


Définition 8.21. 
Un isomorphisme entre les espaces affines € et €’ est une application affine f : € — E£" inversible 


dont l'inverse est affine. 
PropxtFeDE 


Proposition 8.22. 
Une application affine bijective est un isomorphisme. Si f est un isomorphisme d’espaces affines, 
alors up-1 = (up) À. 


Proposition 8.23. 


Un espace affine de dimension finie n sur un corps K est isomorphe à l’espace affine canonique 
En(K). 


3. L’équation (8.43) est écrite en utilisant un abus de notation entre le vecteur x € IK? et le point de € qui est 
représenté par x dans le repère (A, {e:}). 
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Démonstration. Si nous considérons le repère R = (A, {e;}) de l’espace affine € alors l’application 


p: K"—€ 
(x1, re ] = À + > me (8.44) 


est un isomorphisme. 


8.6 Sous espaces affines 

DEFooJSUHooJjtpwz 
Définition 8.24. 
Soit £ un espace affine sur l’espace vectoriel E. Un sous-espace affine de € est une orbite de 
l’action d’un sous-espace vectoriel de E. 


Si F est un sous-ensemble de €, il sera un sous-espace affine de € si et seulement si l’ensemble 
F = {AB tel que A,BeF} (8.45) 


est un sous-espace vectoriel de ÆE. Dans ce cas nous disons que Fest la direction de F. Si AeF, 
alors l'orbite de À sous Fest F. La dimension de F est la dimension de sa direction. 

Si F et G sont des sous-espaces affines de € de directions F et G, nous disons que F est 
parallèle à G si FE G. 


Proposition 8.25. 
Soit F un sous-espace affine de dimension k dans l’espace affine € de dimension n. Alors il existe 
une application affine f : € — K"-* telle que F = f-1(0). 


Démonstration. Soient F la direction de F et AE F. Nous considérons une base {e;} adaptée à F 
au sens {e1,...,ez;} est une base de F. Nous considérons maintenant le repère cartésien (A, {e;}) 
et nous construisons l’application affine 


f:E— K°* 
z 
n nn (8.46) 
À + », Lie 
i=1 Ln 
Par construction nous avons f(M) = 0 si et seulement si M € F. 
PropomhBwi 


Proposition 8.26 ([58]). 
Soit o une partie de l’espace affine €. 


(1) L'intersection de tous les sous-espaces affines contenant © est un sous-espace affine, noté F. 
(2) Si AE ©, alors la direction de F est le sous-espace vectoriel 


F = Span{AM tel que M € 0}. FRE 
Le sous-espace affine donné par la proposition 8.26 est le sous-espace affine engendré par la 
partie ©, et il est noté eae(a). 
PROPooAKJBooMkmsiV 
Proposition 8.27. 
Soit € un espace affine de dimension n sur K, soit f: € — K” une fonction affine. Pour tout 
a = (a1,...,a) € K”, l’ensemble fl (a) est un sous-espace affine* de dimension dim ker(u). 


4. Définition 8.24. 
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Démonstration. Nous considérons le repère (A, {e;}) de €. Étant donné que f est affine nous avons 
J(A + >, dé) = f(A) + us(D Titi) ; (8.48) 

Nous avons donc f (A +3, Titi) — a lorsque 
urD Tie;) = a — (À). (8.49) 


En utilisant le lemme 4.39, nous avons donc 
FT (a) = A+ (us) l(a— f(A)) = A +m +ker(us) (8.50) 


où m est n'importe que élément de We” (a — f(4)). 


PROPooUQLUooDQfYLT 
Proposition 8.28. 


Soit un espace vectoriel normé* (V,|.|). Pour tout a e V et r > 0, la boule B(a,r) est convexe. 
La boule fermée B(a,r) également. 
Démonstration. En deux parties. 
(1) La boule centrée en zéro Soient x,ye B(0,r) et À € ]0,1[. Alors 
DAz + (1 — A)yl < Aa] +11 — Ally] < (A+ — Ar <r (8.51) 


où nous avons utilisé le fait que [A] = À et [1 — À] = 1 — À. 
Cela prouve que Àx + (1 — À)ye B(0,r). Notez l'inégalité stricte due au fait que |x| < r et 
yl < r. Dans le cas de la boule fermée, nous avons une inégalité large. 


(2) La boule centrée autre part 


Soient x,y € B(a,r). Alors x — a et y — a sont dans B(0,r), de telle sorte que 
ÀA(e— a) + (1— À)(y —a)e B(0,r) (8.52) 
par la première partie. En développant et simplifiant, 
Àz +(1—))y-ae B(0;,r), (8.53) 
ce qui signifie que Àx + (1 — Àjye Bar). 


PropPoNpPz 
Proposition 8.29. 
Soit A un ensemble convexe” dans un espace vectoriel et v1,...,Un des éléments de A. Alors toute 
combinaison 
QU + *** + Ann (8.54) 


telle que ai +---+ an = 1 et a; € [0,1] appartient à A. 


Démonstration. Nous prouvons la proposition pour n = 3. Nous devons trouver des nombres 
t1,t9 € [0,1] tels que 


ta(tivi + (1— tue) + (1 — to)us = avi + bu + cus. (8.55) 
La réponse est immédiatement donnée par 
ta=1-c (8.56a) 
ti = a/t. (8.56b) 
Étant donné que c € [0,1] nous avons t2 € [0,1]. En ce qui concerne fj nous avons 
t F<p=-i (8.57) 


5. Définition 7.149. 
6. Définition 7.146. 
7. Définition 7.146. 
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8.7 Barycentre 


Soit € un espace affine sur le K-espace vectoriel E. Un couple (A, À) avec AE € et À € K est 
un point pondéré. 
LemtEwnSH 
Lemme-Définition 8.30 ([258]). 
Soit une famille de points pondérés {(A, Àj)}i=1.r. St, À # 0, alors il existe un unique GE € 
tel que 


S'XGA; = 0. (8.58) 
i=1 


Le point G donné par le lemme 8.30 est le barycentre des points pondérés (A;, À). 


Notons que l’on peut toujours supposer que ÿ;;, À; = 1 parce que le barycentre ne change pas 


lorsque tous les À; sont multipliés par un même nombre. 
DefIMZooLFdIUB 


Définition 8.31 (Combinaison convexe). 
Des nombres positifs ou nuls À1,..., An vérifiant ÿ,; À; = 1 forment une combinaison convexe. 


Le théorème suivant donne quelques caractérisations équivalentes du barycentre. 
ThoIJVzxr 


Théorème 8.32 ([258]). 
Soient {(Ai, X;)}i=1,…r une famille de points pondérés. Les conditions suivantes sur le point Ge € 
sont équivalentes. 


(1) Le point G est le barycentre de la famille. 
(2) Pour tout a € R*, Y,(aX;)GA; =), 
(3) Il existe A € € tel que (>; x)AG = ÿ X AZ. 


(4) Pour tout BE Ë, nous avons (y); x)BG =). XBÀ. 


ItemEgOQBX 


Définition 8.33. 
Si A,BE €, le segment | AB] est l’ensemble des barycentres de À et B pondérés par des poids 
positifs (ouvert ou fermé suivant que l’on accepte que l’un ou l’autre des poids soit nul). 


Lorsque tous les À; sont égaux, nous parlons d’isobarycentre. Autrement dit, l’isobarycentre 
des points À; est le barycentre des points pondérés (4;, 1). 


8.7.1 Sous-espaces affines 


Proposition 8.34. 
Une partie F de € est un sous-espace affine si et seulement si elle est stable par barycentrisation. 


Démonstration. Soit F un sous-espace affine de direction F et A:,..., A4, des points de F. Nous 
devons voir que le barycentre des points À; pondérés de n’importe quelles masses appartient à F. 
Pour ce faire nous faisons appel à la caractérisation (4) du théorème 8.32 : pour tout BEF, 


BG =) XBA:. (8.59) 


Puisque B et À; sont dans F, nous avons BA; e F et donc BG e F. Mais comme Be F , le point 
Gest à son tour dans F. 

Réciproquement, nous supposons que F est stable par barycentrisme. Nous voudrions montrer 
que l’ensemble 


ue EaC | 

F = {AB tel que A,BeF} * Ro) 

est un sous-espace vectoriel. Soit À € F. Nous commençons par prouver que les vecteurs de la 
——> 

forme AX (X € F) forment un espace vectoriel. Considérons AX + AŸ qui est un élément de E; 


il existe donc V € € tel que 
AV = AX + AY. (8.61) 
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Par les relations de Chasles, 
AV = AV+VX+AV +VY, (8.62) 


donc 


O=VX-VA+VY, (8.63) 


ce qui prouve que V est un barycentre de X, À, Ÿ, et donc que V € F. De la même manière si 
> 
W e € est défini par AW = uAX, alors 


AW = uAX = (AW +WX), (8.64) 
ce qui signifie que 
(1 B)AW + uXW = 0 (8.65) 


et que W est un barycentre. 
Afin de montrer que (8.60) est bien un espace vectoriel, nous devons considérer À,B,X,Y eF 
et prouver que AX + BY € F. Nous avons 


AX + BY = AX + BÂ + AY 


) 
= AV + BÀ V est celui donné plus haut 8.66b) 
= AV - AB (8.66c) 
= AV + AW W est donné par u = —1. (8.664) 
= AV!. (8.66e) 


PropBVbCOS 
Proposition 8.35 ([258]). 
Soient Ao,...,A, des points de €. L'ensemble des barycentres de ces points (avec des masses de 
somme 1) est le sous-espace affine engendré par les À; que nous nommons F. 


Démonstration. Soit G le barycentre associé aux poids À;. Nous avons 


G = Ao + AoG = Ao + Ÿ À 404. (8.67) 


i=1 


Notons que les vecteurs A0; sont dans la direction du sous-espace affine engendré par les À; par 
(8.47). Donc G est bien dans F. 
Inversement si X est dans F, on a 


X = A+ À404 (8.68) 


parce que »,; A0 est un élément général de la direction de F. Donc 


AoX = >, ÀAoAi, (8.69) 


et en utilisant la relation de Chasles sur chacun des A54;, 


A6X = D (40% + X Ai). (8.70) 


De là nous concluons que 


(GS x) 40X + S'XAX = 0, (8.71) 


ce qui signifie précisément que X est un barycentre des À;. 
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Proposition 8.36. 
Soient r + 1 point Ao,...,A, dans €. Le sous-espace affine engendré par les À; est au plus de 
dimension Tr. 


Démonstration. La direction de l’espace engendré AfF{4;} est l’espace 


Span{AoA=1,.r} (8.72) 


qui est engendré par r vecteurs et donc est au plus de dimension r. 


En deux mots, la proposition suivante signifie que le barycentre des barycentres est le bary- 


centre. 
PropSFvjFZb 


Proposition 8.37 (Associativité des barycentres[259]). 
Soit une partition Jo,...,J, de I = {0,1,...,n}. Soient des points a0,...,an € € et À0,...,Ân 
des nombres tels que Ÿ,, À; # 0. Nous supposons que px = Ÿ, X; Æ 0 pour tout k, et enfin nous 
nommons bx le barycentre de la famille {(a;i, X),i€ Jx}. 

Alors le barycentre de la famille {(bx, ix)}k=1….r est le barycentre de la famille {(ai, À) }ier. 


ie Jr 


Démonstration. Nous nommons b le barycentre des by; pondérés par les 44, donc par définition 


O0 — > xbbp, (8.73a) 
k=0 

- >, X;bbr, (8.73b) 
k ieJx 

= D, D Mai + ab) (8.73c) 
k=0 ieJy 

= NON Xbai+ NN ab (8.734) 
k=0 ie Jr k=0 iE Jr 

=0 

icl 


Donc b est bien barycentre des a; avec les poids À;. 


8.7.2 Enveloppe convexe 
DefNLYYooXUHFUY 


Définition 8.38. 
Soit À une partie d’un espace vectoriel E. L’enveloppe convexe de A, notée Conv(A) est l’inter- 
section de tous les convexes contenant À. 


L'’enveloppe convexe est un convexe. En effet soit C un convexe contenant À et x,y € Conv(A); 
alors x et y sont dans C' et par conséquent le segment [x, y] est inclus dans C. Ce segment étant 
inclus dans tout convexe contenant À, il est inclus dans Conv(A). 

PropSVvAQzi 
Proposition 8.39 ([260]). 
Soit C un convexe dans l’espace affine £ et une famille de points pondérés {(a;, À;)}i=1...r dont 
tous les poids sont positifs (et non tous nuls). Alors le barycentre est aussi dans C.. 
En d'autre termes, un convexe est stable par barycentrage à poids positifs*. 


Démonstration. Nous prouvons par récurrence. D'abord pour r = 2. Le barycentre des points 
pondérés (ai, A1), (a2, A2) est le point b tel que 


Abai + A2baz = 0. CN: 


8. Sauf si on prend tous les poids nuls ; mais contre ce genre d’idées, on ne peut rien faire. 
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Par définition, ce qui est noté ab n’est rien d’autre que b — a; en déballant (8.74), nous trouvons 
À (ai = b) + A2(a2 . b) = 0 (8.75) 


et donc 
A n 2 
= ai a2 
À + À + ’ 
qui est bien un point du segment [a1,a2|] parce que c’est une combinaison à coefficients positifs de 
somme 1. 


b (8.76) 


Nous passons maintenant à la vraie récurrence avec un ensemble de points pondérés 
Ar — (ar, Athsa ses (ar, Àr)} (8.77) 


de masse totale non nulle; et en vous laissant deviner ce que va désigner À,_1. Si une des masses 
est nulle (disons À,), alors le barycentre de À, est le même que celui de À,-_; et l'hypothèse de 
récurrence nous enseigne que ledit barycentre est dans ©. Nous supposons donc que À; # 0 pour 
tout i. Dans ce cas le théorème d’associativité des barycentres 8.37 dit que le barycentre de À, est 
le barycentre entre le barycentre de 4,1 et (ar, À;), qui sont deux points de C' par hypothèse de 
récurrence. 


Si E est un espace vectoriel et si x; € E et À; € R, alors le barycentre des couples (x, À;) est 
le point g tel que };; Ag, c’est-à-dire ÿ;; ÀA;(x; — g) = 0 ou encore 


D Xiti = . Xg. (8.78) 


Donc, quitte à diviser tous les À; par la somme, nous pouvons supposer que la somme des poids 
Fi nl 

est 1. C’est pourquoi lorsque nous parlerons de barycentre dans un espace vectoriel sans contexte 

affine, nous allons toujours supposer ÿ}; À; = 1 et avoir le barycentre 


PropYHMTmZX 
Proposition 8.40. 
Soit E, un espace vectoriel et AC E. L'’enveloppe convexe Conv(A) est l’ensemble des barycentres 
de familles finies de points affublés de masses positives. 


Démonstration. Nous notons B l’ensemble des dits barycentres. Par la proposition 8.39, ces bary- 
centres sont dans l’enveloppe convexe et donc B € Conv(A). À contrario, si nous prouvons que B 
était convexe, alors nous aurions Conv(A) € B parce que l’enveloppe convexe est l’intersection des 
convexes contenant À. 

Soient a,b € B, c’est-à-dire que l’on à àp,...,an et bp,...,0m dans À ainsi que les nombres 
strictement positifs Ào,...,Àn €t L0,...,Lm tels que 


a = D Xa 
b=N pb, 
J 


Un point du segment |[a, b] est de la forme p = ta + (1 — t)b avec t € [0,1]. En développant, 


ÿ X=1 (8.80a) 


5 dj =1 (8.80b) 


p= Da + DC Dub, (8.81) 


C’est le barycentre de la famille {(a;, À), (b;,1;)}, parce que la somme des coefficients vaut bien 
L.; 


SEX) + SL bu =t+ (1-0 = 1. (8.82) 
5 


i 


602 CHAPITRE 8. ESPACES AFFINES 


ThoJLDjXLe 
Théorème 8.41 (Carathéodory[103]). 
Dans un espace affine de dimension n, l'enveloppe convexe” de A est l’ensemble des barycentres à 
coefficients positifs ou nuls de familles de n + 1 points. 


Démonstration. Soit x € Conv(A) ; on sait par la proposition 8.40 que x est barycentre de points 
de À avec des coefficients positifs : 


oo. Eat QT 


avec D}, 4 = 1. Nous supposons que p > n + 1 (sinon le théorème est réglé), et nous allons faire 
une récurrence à l’envers en montrant qu'on peut aussi écrire x sous forme d’un barycentre de 
strictement moins de p points. 

Étant donné que p—1 > n, la famille {t+i—t1};-2..n est liée et il existe donc &1,...,4& € R 
tels que LE a(xi — 1) = 0, c’est-à-dire telle que 


P P 
> Aili — > dix]: (8.84) 
i=2 i=2 


Nous posons a = — )}_, a. Remarquons qu’alors D}, a;x; = 0 parce que 
p p p p 
> ti = AT + D dti = T1 + T1 = 5 Qt] = 0. (8.85) 
i=1 i=2 i=2 i=1 


Par conséquent ça ne coûte rien de récrire (8.83) sous la forme 
p 
2 = D '(X + to). (8.86) 


Les a; ne sont pas tous nuls, mais leur somme est nulle, donc il y en a au moins un négatif. Nous 
notons 


TT Her tel que a; < 0}, (8.87) 
à: 


t 


et J l’ensemble de * pour lesquels ce minimum est atteint. Nous considérons aussi les nombres 
pui = À; + Tai. Plusieurs remarques. 


(1) Sije J, alors u; = 0 


(2) Si a; > 0 alors u; > 0, mais si à; < 0 alors 
À + Ta > À +(——)a = 0 (8.88) 


donc u; > 0 quand même. 

(3) 1 = 1, toujours parce que D ?_, @ = 0. 

Avec tout ça, nous avons 
p 
> Hubs = lt =: (8.89) 

ik] i=1 

Et voilà, nous avons écrit x comme un barycentre à coefficients positifs de moins de p éléments 
parce que J n’est pas vide. 


CorOFrXzIf 
Corolaire 8.42. 
Dans un espace affine de dimension finie, l’enveloppe convexe d’un compact est compacte. 


9. Définition 8.38. 
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Démonstration. Soit À une partie compacte de l’espace vectoriel Æ, et Conv(A) son enveloppe 
convexe. Nous allons montrer que toute suite dans Conv(A) admet une sous-suite convergente en 
écrivant un point de Conv(A) comme le théorème de Carathéodory 8.41 nous le suggère. Pour cela 
nous considérons le simplexe 


n+1l 
A = L e R"*{ tel que >, A =letÀ;> vs) | (8.90) 
k=1 


Montrons en passant que À est compact. Si Àx € À est une suite, alors chacun des À£ est un 
(n + 1)-uple de nombres dans [0,1] : 
ke (Ar): (8.91) 


est une suite qui possède une sous-suite convergente. En passant n + 1 fois à une sous-suite, nous 
tombons sur une suite convergente vers À € À, grâce à la convergence composante par composante. 
De plus pour chaque k nous avons St): — 1, et en passant à la limite, la somme étant une 
application continue, ÿ;; À; = 1. 
Considérons l'application 
fi A x APE Cony(A) 


ie, 8.92 
(À,z) + » ÀÂgTk. ea 
k=1 


C’est une application continue parce qu’elle est bilinéaire en dimension finie ; son image est contenue 
dans Conv(A) par la proposition 8.39, et elle est surjective par le théorème de Carathéodory 8.41. 
Bref, Conv(A) = f(A x A%+1) est donc l’image d’un compact par une application continue; elle 
est donc compacte par le théorème 7.211. 


Notons que sans le théorème de Carathéodory, peut être que le nombre de points utiles pour 
décomposer les différents az n’était pas borné; dans ce cas nous aurions du prendre une infinité 
de sous-suites et rien n’aurait été sûr. 


8.7.3 Applications affines et barycentre 
PROPooGSPZooRnVgiU 


Proposition 8.43 ([261]). 
Une application f : £ — E’ entre deux espaces affines est affine si et seulement si pour tout système 
{(Ai, Xi)}i=1..x de barycentre G et de poids total non nul, le point f(G) est barycentre du système 


{(F(Ai), x)}. 
Démonstration. En deux parties. 


(1) Si f est affine 
Par définition d’un barycentre, 


S'XGA; = 0. (8.93) 


Nous considérons un point arbitraire O € € et nous écrivons À; = O + x;, G = O + x. 
Ensuite nous utilisons le lemme 8.14 pour le calcul suivant : 


DASGA) = X xuy(xi — x9) (8.94a) 
| = 20 Xi — t)) (8.94b) 
= D XGA) (8.94c) 

= (0) = 0. (8.944) 


Donc f(G) est bien le barycentre du nouveau système. 
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(2) Si f conserve les barycentres 


Nous définissons w par f(O + x) = f(O) + u(x). À priori, ce u dépend de O et n’est pas 
linéaire. 
(2a) u est linéaire 

Soient M,N € € et les éléments zy»,2n € E tels que OM = Tm et ON = Zn. Nous 


définissons enfin P par 
OP = aOM + BON, (8.95) 


et P=O+x,. En décomposant M À et NO par les relations de Chasles de la proposi- 
tion 8.5(1) nous avons 


(œ+8—1)PO - aPM - BPN =0 (8.96) 
et donc P est barycentre du système 
{(O,a + B—1), (M, a), (N, B)}. (8.97) 
Le point f(P) sera barycentre du système 
{((O),a + 8-1), (F(M),a), (FN), 8)}. (8.98) 
Cela signifie que 
(a+ 8—1)f(P)F(O) — af(P)F(M) — BFCP)F(N) = 0. (8.99) 
En y substituant f(P)f(O) = u(-x»), f(P) FM = u(tm — 2p) et F(P)F(N) = u(tn — 


Tp) ainsi QUE Tp = Alm + Pty nous trouvons 


U(ATm + Prn) = QU(Tm) + BUu(tn). (8.100) 


Donc u est linéaire. 


(2b) u ne dépend pas du point O 


Il n’est pas besoin de démontrer cela parce que la définition 8.12 ne le demande pas. 
Note : c’est le lemme 8.13 qui dit que c’est par ailleurs vrai. 


8.8 Repères, coordonnées cartésiennes et barycentriques 


Définition 8.44. 
On dit que les points Ao,...,A4, € € sont affinement indépendants si le sous-espace affine 


engendré est de dimension r. 
PropGAneHg 


Proposition 8.45 ([258]). 

Pour r +1 points Ao,...,A, dans €, les propriétés suivantes sont équivalentes. 
(1) Les À; sont affinement indépendants. 
(2) Pour tout i = 0,...,r, le point À; n'est pas dans AfF{A0,..., 45 1, Ai41,..., Are cnrazktl 
(3) Les points Ao,...,A;_1 sont affinement indépendants et À, € AfF{A0,...,A,_1}. 


(4) Il existe à tel que les vecteurs Az A; (k Æ i) sont linéairement indépendants. ItemFBfcuq 


(5) Pour toutie {1,...,r}, les vecteurs Ax A; (k Æ i) sont linéairement indépendants. 


Notons à propos de la condition (3) que l'existence d’un à pour lequel À; n’est pas dans 
Af{A40,..., A5 1, A:1,..., À,} n'implique pas l'indépendance des r + 1 points. En effet dans R? 
nous considérons les 4 points A9 = (0,0), A1 = (1,0), A2 = (2,0) et A3 = (0,1). Évidemment le 
point 43 n’est pas dans l’espace engendré par les trois autres ; il n'empêche que ces points ne sont 
pas affinement indépendants parce que la direction est de dimension 2 au lieu de 3. 
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DefguuwEO 
Définition 8.46. 
Soit € un espace affine de dimension n et F un sous-espace affine de dimension k. Un repère 
affine de F est la donnée de k + 1 points affinement indépendants de F. 


Si {Ao,...,4,} est un repère affine, le point A0 est l’origine. C’est un choix complètement 
arbitraire ; et c’est bien cet arbitraire qui nous amènera à considérer les coordonnées barycentriques 
au lieu des coordonnées cartésiennes. 

Soit M € € ; par définition nous avons 


M = À + AM. (8.101) 


; re 
Mais nous savons que les vecteurs AA; forment une base de E, nous avons donc des nombres À; 
tels que 


AoM = >, x A0. (8.102) 


Les nombres À; ainsi construits sont les coordonnées cartésiennes du point M dans le repère 
{A0,..., An} d’origine As. 
À partir de ces coordonnées, le point M € € se retrouve par la formule 


nm 
M = A9+ Ÿ XAoÀ:. (8.103) 
i=1 
PROPoolXVBooPpKsDE 
Proposition 8.47 ([1]|). 
La paire (O, {e1,.…. 7) est un repère cartésien de € si et seulement si {0,0 +e1,...,0 + e»} 
est un repère affine. 


Démonstration. En deux parties. 


(1) Sens direct Vue la proposition 8.45, il suffit de prouver que les vecteurs O(O + e;) sont 
linéairement indépendants. Mais O(O + e;) = e;, donc oui, ils sont linéairement indépendants. 


(2) Sens inverse Il s’agit d'utiliser la même proposition 8.45 qui est encore applicable parce 
que c’est une équivalence. 


8.48. 

Soient (A,e;) et (4',e;) deux repères cartésiens pour l’espace affine €. Soit (s;;) la matrice de 

changement de base entre {e;} et {e!} dans Æ. Nous voudrions trouver les x; en termes des x. 
Pour cela nous considérons un point M dans € et nous l’écrivons dans les deux bases. Cela 


fournit l'égalité 
EqcŸ 
A + > Tie; = À! + , aies. EVE 
ï ï 
Nous considérons les coordonnées (a;) de 4’ dans le repère (A, e;), c’est-à-dire 


#2 A+ Joe Ep 


En substituant e; = Ÿ, sjrex et (8.105) dans (8.104) nous trouvons 


>, Tkex = >, ageg + : She: (8.106) 
k k jk 
et par conséquent 
x = Op + d Sté. (8.107) 


J 


Les coordonnées barycentriques sont données par la proposition suivante. 
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PROPooTIRXooLAïÏpRa 
Proposition 8.49 ([258]). 
Soient Ao,..., A, des points affinement indépendants dans € et F = Af{A0,...,A,}. Tout point 
ME F s'écrit de façon unique comme barycentre ! des À; affectés de poids À; tels que = 


Démonstration. Nous avons vu plus haut (définition 8.46) que l’affine indépendance des points À; 
assurait que (A40,...,A,) était un repère de F. 

En ce qui concerne l’existence de l’écriture de M comme barycentre, nous savons que les sous- 
espace affines sont exactement les ensembles de barycentres (proposition 8.35), c’est-à-dire que si 
on a des points dans un sous-espace affine, alors les barycentres de ces points est encore dans le 
sous-espace affine. 

L’unicité est comme suit. Si M est barycentre des À; avec poids À;, nous écrivons la caractéri- 
sation (4) du théorème 8.32 avec B = A : 


AoM = Ÿ' x;404; (8.108) 
i=1 


\ \ . a % . . \ . Ter Ed . . / ni . 
où la somme à droite s'étend à priori de 0 à r, mais comme 4040 = 0, nous l’avons limitée à 1. Si 
M s'écrit comme barycentre de deux façons différentes, nous aurions 


T T 
i=1 i=1 
7 # . \ ET 
avec D, À = D; = 1. Étant donné que les points A6, ..., 4, forment un repère, les vecteurs AoÀ; 
sont linéairement indépendants (point (5) de la proposition 8.45) et donc À; = u; pour à = 1,...,r. 
La condition de somme des poids égale à 1 impose alors immédiatement À6 = Lo. 
DEFooTXPPooQdacbO 


Définition 8.50. 
Soit un espace affine € de dimension n. Soient des points affinement indépendants A1,...,A;. 
Pour M E €, la proposition 8.4/9 indique qu'il existe un unique choix de À; tel que 


She (8.110a) 


S'XMA = 0. (8.110b) 


Ces À; sont les coordonnées barycentriques de M dans le repère {Ai}i=1..n. 
NORMoo0GHBooMjmouu 


8.51. 
Soit R? et les points non alignés À, B, C. Les coordonnées barycentriques («, 8,7) dans ce système 
correspondent à l’unique X € R? tel que 


aX À + BXB + XC = 0. (8.111) 


Exemple 8.52. 
Soient les points À = (3,1), B = (—1,2) et C = (0, —1) dans R?. Nous allons montrer qu'il forment 
un repère affine de R?. L'espace engendré par ces trois points est l’espace des 


A+ aAB + BAC, (8.112) 


et la direction correspondante est l’espace vectoriel donné par aAB + BAC qui est de dimension 
deux. Donc l’espace affine engendré par À, B et C'est de dimension 2. A 


10. Définition 8.30. 
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Exemple 8.53. 
Dans le repère (A, B,C), quel est le point de coordonnées barycentriques (à, 4, à) ? D'abord nous 


Co 


Ensuite nous cherchons X € R? tel que 


SAR + SEX Je OX = 0, (8.114) 


1/x—3 l/x+l1 1 x 
1 L À _b, Hi 
Oui)+sGta)+a Ga) ù 650) 


; ; 1 
Nous trouvons immédiatement x = 1/6 et y = 1/3. Le point cherché est donc le point Ga) A 


LEMooDUMVooFtfFOUe 


c’est-à-dire 


Lemme 8.54 ([1]|). 
Une application affine f: £ — € qui préserve les points d’une base affine de € est l'identité. 


Démonstration. Une base affine de € consiste en n+1 points {A0,..., 4, } affinement indépendants. 
————— 
Nous utilisons la proposition 8.47 pour dire que (4, {AoAi}i=1,.n) est un repère cartésien. 
En utilisant la formule du lemme 8.13, 


(45) = f(4o + AoÀi) = f (40) + u(AoÀi). (8.116) 
Donc À; = A9 + u(Ao4), ce qui signifie que 
dd EnooA JYHooRTiGER 
Par ailleurs, tout point M !l de € peut être écrit sous la forme 


M = A+) XAo4. (8.118) 


En appliquant f, et en utilisant (8.117), 


F(M) = f(Ao) + ÿ'xu(Ao4i) = A0 + ÿ'\A404; = M. (8.119) 


Donc tout point de € est fixé par f, ce qui signifie que f est l’identité. 


8.8.1 Équation de droite 
DEFooCYDPooEdRby1l 


Proposition-Définition 8.55. 

Soit £ un espace affine de dimension trois muni d’un repère barycentrique !? (A1, A2, A3). Nous 
notons D(a,b,c) l’ensemble des éléments de € dont les coordonnées barycentriques (normalisées) 
(x, y,2) vérifient ax + by + cz = 0, c’est-à-dire l’ensemble des M € € tels que 


z+y+z=1l (8.120a) 
2 MA + yMA + 2MA3 = 0. (8.120b) 


Alors l’ensemble D(a, b,c) est un sous-espace de dimension 1 de €. 
Nous nommons droite affine une telle partie de €. 


Idée de preuve : ne pas oublier la condition x + y + z = 1 parce que la somme des coordonnées 
barycentriques doit valoir 1. 


11. Même les points qui ne s’appellent pas « M » en fait. 
12. Définition 8.50. 
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Exemple 8.56. 
La droite D(1,1,1) n'existe pas parce que ce serait x + y + z = 0, qui est incompatible avec 
z+y+z=l. AN 


Les droites D(a,b,c) et D(a',b',c') s’intersectent selon les solutions du système 


Tz+y+z=l1 (8.121a) 
ax + by+cz=0 (8.121b) 
adx+by+cz=0 (81216) 


Donc deux droites affines ont un unique point d’intersection si et seulement si 


1 1 1 
d=l|la b c|\Æ#0. (8.122) 
a D c 


Elles seront parallèles ou confondues si et seulement si d = 0. 


8.8.2 Associativité, coordonnées barycentriques dans un triangle 


Lemme 8.57 ([262]). 
Soient trois points non alignés À, B, C' ainsi que des nombres a, B, 7 tels que à + B Æ 0 et 
a+8+7#0. 
Soit H le barycentre du système {(A, a),(B,B)} et G le barycentre de {(A, a),(B,B),(C;,7)}. 
Alors G est barycentre de {(H,a + B),(C,7)}. 


Démonstration. Vues les définitions de À et G nous avons 


aHÀ + BHB = 0 (8.123a) 
aGÀ + BGB + GC = 0. (8.123b) 


En utilisant les relations de Chasles nous introduisons À dans la seconde relation : 


o(GË + HÀ) + B(GH + HB) + yGC = 0 (8.124a) 
(a + B)GH + aH À + BHB +yGC = 0 (8.124b) 

=D 
(a + B)GH + GC = 0. (8.124c) 


Les coordonnées barycentriques dans un triangle (et plus généralement en fait) permettent de 
faire des projections. 
PROPooBCUVooWKttiH 
Proposition 8.58. 
Soient trois points non alignés À, B, C' ainsi qu’un point N de coordonnées barycentriques (a, B, y) 
dans le système (A, B,C). Si P est l'intersection (AN) n (BC) alors les coordonnées de P sont 


(0,8,7). 


Démonstration. Un dessin de la situation : 
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A 


Dire que les coordonnées de N sont (a, 8,7) signifie que 


aNÂ + BNB + NC = 0. (8.125) 


Nous voudrions montrer que le point P est bien le point de coordonnées (0, 8,7). Soit donc le point 


P tel que EQooYLGDoo 
en Hagen 


et montrons que ce point est l'intersection (BC) n (NA). 
D'abord la relation (8.126) nous dit immédiatement que P est sur la droite (BC). Ensuite, en 
utilisant les relations de Chasles pour introduire N : 


B(PN + NB) + (PN + NC) = 0. (8.127) 
Nous remplaçons BNB + NC par -aNÀ pour obtenir : 


(B+%)PN - aNÀ = 0. (8.128) 


Cela montre que les vecteurs PN et NÀ sont colinéaires, et donc que P, N et À sont alignés. 


8.9 Applications affines sur R’ 


Soit ve R”; nous notons 7,: R'" — R" la translation donnée par 7,(x) = x + v. Le groupe de 
toutes les translations de R” est noté T(n) et est isomorphe au groupe abélien (R”, +). 

Nous avons déjà discuté de la structure d’un espace vectoriel (en particulier R°) comme espace 
affine en 8.6. 


LEMooZZAIooUMiayy 

Lemme 8.59. 
Décomposition d’une application affine. ITEMooSJBFooYHURto 
(1) Une application f: E — E est affine si et seulement si il existe v € E et une application 
linéaire à sur E telle que f = T0 @. ITEMooPYEUooKTesYm 
(2) Dans ce cas, le choix de (v,a) est unique. ITEMOOHTAUOORx Tax 


(3) Si f est bijective, alors à est bijective. 


Démonstration. Nous supposons d’abord que f est affine. Alors il existe une application linéaire 
u sur E telle que 
OM + x) = f(M) + u(x) = (Trou © ur)(x) (8.129) 
pour tout x et M. De plus l’application u/ ne dépend ni de M ni de x (c'est la proposition 8.16(1)). 
En posant M = 0 nous avons : 
FC) = (rs(0) © ur)(x). (8.130) 


Dans l’autre sens nous supposons avoir v € E et a linéaire sur E telles que 


ÎJ(M) = (moa)(M). (8.131) 
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Notons qu’il y a un abus de notation entre « qui est linéaire sur l’espace vectoriel E et l'application 
a qui est une application sur l’espace affine E. Cet abus est légitime parce que les deux espaces 
sont identiques en tant qu’ensembles. Ce qui est vraiment abuser par contre, c’est de se poser ce 
genre de questions. 

Nous avons : 


JM + x) = r(a(M +x)) = a(M + x) + v = a(M) + v + a(x) 


Loouiam=riian 


Donc la fonction f vérifie la définition 8.12. La partie (1) est prouvée. 

Pour prouver l’unicité de la partie (2), nous supposons que 7, o à = 7% © &. En appliquant 
cela à 0 nous trouvons v = w. Nous avons donc 7, o à = 7, 0 B. Comme 7, est inversible, nous en 
déduisons @ = f. 

Enfin le point (3) est relativement évident du fait que r,, elle, est surement bijective. 

COR0OATCNooUwWEPNI 


Corolaire 8.60. 
Une application affine qui conserve l’origine est linéaire. 


Démonstration. Conserver l’origine demande de poser v = 0 dans l’expression du lemme 8.59. 


PROPooYRCJoo!IcmUVI 
Proposition 8.61. 
Soit une application affine f : IR? — IR". L'ensemble des points fixes 
Fix(f) = {x e R' tel que f(x) = x} (8.133) 
est soit vide soit un sous-espace affine de R?. 
Démonstration. Soit f = 7, © à; nous avons x € Fix(f) si et seulement si 
z = T(a(x)) = a(x) + v, (8.134) 


autrement dit, en considérant l’application linéaire 8 = Id —a, si et seulement si B(x) = v. Nous 
écrivons Fix(f) = 8-!(v). Supposons que cet ensemble soit non vide et considérons æ0 € 87 {(v). 
Nous avons 


B7l(v) = {x e R” tel que B(x) = B(xo)} (8.135a) 
= {x tel que B(x — xo) = 0} (8.135b) 
= {x tel que x — x0 € ker(B)} (8.135c) 
= ker(B) + xo (8.135d) 
= Tr0 (ker(B)). (8.135e) 


Mais comme ker(/B) est un sous-espace vectoriel, B—1!(v) est le translaté d’un sous-espace vectoriel, 
c’est-à-dire un sous-espace affine. 


8.9.1 Structure de groupe pour les applications affines 
PROPooBPKKooJRAMeT 


Proposition-Définition 8.62 ([1]). 
L'ensemble des applications affines bijectives de IR" forment un groupe pour la composition. Les 
lois de groupe sont données par les formules suivantes : 


» Le 
(1) Le neutre est l’identité. ITEMooCUFRooMuhXds 


EQooMIFSooKTvy 
(Tu " a) (Two 9 B) — Ta(w)+v © ab. CRE 
ITEMooYOMSooRUDSdm 


(2) Le produit est donné par 


(3) L'inverse est donné par 
(roa) = Late) o CES (8.137) 
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Ce groupe est noté AfF(R?). 


Démonstration. Pour l'identité, oui, composer par l’identité est neutre. 
Le fait que la formule (8.136) soit vraie est un simple calcul : 


(ro 0 à) 0 (rw © B)(x) = (aB)(x) + a(w) +0 = (ra(u)+e © AB)r. (8.138) 


Le fait que la formule (8.136) donne bien un produit pour tous les éléments de AfF(R?) est le 
lemme 8.59. 
En ce qui concerne l'inverse, c'est un calcul : 


aa (no) (tr) = (T_a-1(0) "(a (x) + v) (8.139a) 
= T_o-i(o) (x + a (v)) (8.139b) 
2 (8.139c) 


Si f: R? — R’' est une application affine, la proposition 8.59 affirme qu'il existe une application 
linéaire u telle que 


(x + y) = f(x) +u(y). (8.140) 
En écrivant cela pour x = O0, 
(y) = f(0) + u(y), (8.141) 
ou encore f = Tf(p) © U 
PROPooTPFZooKtFxhg 


Proposition 8.63. 
L'ensemble AH(R”) est isomorphe au produit semi-direct !° 
Af(R”) = T(n) x 4a GL(n,R) (8.142) 
où Ad est l’action adjointe, c’est-à-dire 
Ad: GL(n,R) — Aut (T(n 
( ) ( ) . (8.143) 
ar (nr aonoa Je 
Démonstration. En plusieurs points. 
(1) Égalité d’ensembles Il faut que Af(R") soit en bijection avec T(n) x GL(n,R). En 
effet si f € AfF(R”), la décomposition f = 7, o à est unique. D'abord en appliquant à O, 
F(0) = ry(a(v)) = v. Donc v est fixé par la valeur de f(0). Ensuite a = fo 7, !, donc a fixé. 


(2) L’action adjointe fonctionne Il faut vérifier que a o 7, o « ! est bien dans T'(n). Pour 


cela, en agissant sur x € IR” nous trouvons 
ara (x) = a(a”l(x) +v) = x + a(v) = OI CAl (8.144) 
Le fait que Ada) soit un automorphisme est toujours correct. 
(3) Morphisme Nous montrons que 
D: T(n) x GL(n, R) — AF(R") 
(ma) moa 


(8.145) 


est un isomorphisme de groupes. D'abord la loi de groupe sur AF(R”) est donnée par 


(rw 9° à) 0 (Tw © B) = Tuta(w) © (A 0 B). (8.146) 
Ensuite la loi de groupe du produit semi-direct est donnée par 
(ro, à) + (ras B) = (To Ad(a)7u, a8) = (roTatw)s 28) = (Tatw)+vs AP). (8.147) 
Nous avons donc bien 
DU(Tos 8) : (ru B)) = (To, B) © (ru, B). (8.148) 


13. Définition 2.47. 
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8.10 Isométries 
DEFooZGKBooGgjkgs 


Définition 8.64 (Isométrie d'espace affine). 
Si € est un espace affine muni d’une distance d, une isométrie de € est une application f: £ — € 
préservant d, c'est-à-dire telle que 


dx, y) = d(f(x), f(y)). (8.149) 


Notons que toutes les applications affines ne sont pas des isométries : par exemple les homo- 
théties. 


PROPooHSOGo0oBbFTYt 
Proposition 8.65. 
Si € est modelé sur un espace euclidien (E, ||.|) alors la formule 
d(A, B) = |AB| (8.150) 
définit une distance * sur €. 


Démonstration. Étant donné la proposition 8.3, la formule a un sens parce qu’à À et B donnés 
dans €, il est associé un unique vecteur ABeE. 

Pour vérifier que d est une distance, nous vérifions les points de la définition 7.107 et nous 
utilisons les propriétés correspondantes dans la définition 7.149 d’une norme. 


(1) d(A,B) = VAË| > 0. 
(2) Si d(A, B) = 0, alors |AË| = 0, ce qui implique que AB = 0. Nous avons donc 


B=A+AB proposition 8.3 (8.151a) 
= A+0 (8.151b) 
= À lemme 8.4. (8.151c) 


(3) En utilisant la proposition 8.5(3), 
d(A,B) = |AB| = | - BÀ| = |BÀ| = d(B, A) (8.152) 
(4) En utilisant les relation de Chasles 8.5(1) ainsi que l'inégalité triangulaire 7.149(4) 


d(A, B) = |AB| = |AC + CB] < | AC] + |CB| = d(A,C) + d(C, B). (8.153) 


Nous parlons d’isométries affines ou linéaires dans le thème 77. 


14. Définition 7.107. 


Chapitre 9 


Espaces vectoriels (encore) 


9.1 Déterminants 


SecGYzHWs 

9.2 Applications multilinéaires 
DefFRHooKnPCT 

Définition 9.1 (Application multilinéaire). 
Soient des espaces vectoriels V1,..., V4 ainsi qu’un espace vectoriel W. Une application T: V* — 
W est dite k-linéaire ou k-multilinéaire si pour tout (v1,...,ux) € Vi x... x V4 les applications 
Ti -W 
D (9.1) 
D Toi dise 0e) 


sont linéaires. 
En particulier lorsque k = 2, nous parlons d'applications bilinéaires. 
Nous notons L(Vi,..., V4: W) ou Ly(Vi,..., V4; W) l’ensemble des applications k-linéaires de 


Vi x... x Vy vers W. Lorsque tout les V; sont identiques nous notons Lx(V,W). 
DEFooYWOBooUGJojy 


Définition 9.2. 
Soit E, un K-espace vectoriel. Une application multilinéaire alternée sur E est une application 
k-linéaire f: EF — K telle que f(v1,...,vr) = 0 dès que v; = v; pour certains À À j. 
Une application multilinéaire alternée est une forme linéaire. 
DEFooZFCKooGIoYrE 


Définition 9.8. 
Soit E, un K-espace vectoriel. Une forme multilinéaire f: E° — K est antisymétrique si 


FA (9.2) 
pour tout couple (i, j). 


9.4. 
Il serait une erreur ! de noter £(V x V,R) l’ensemble de applications bilinéaires sur V. En effet, 
L(V x V,R) est l’ensemble des applications linéaires V x V — MR. 

Si S e L(V x V,R), il n’y a pas de formules particulières pour S{u, Av). Par contre si T € 
L2(V,W), alors 


Tu, Av) = ÀT(u,v). (9.3) 
Nous avons par contre 
T(Au, }v) = XT(u, v) (9.4) 
alors que 
S(Au, Av) = S(A(u,v)) = ÀSu, v). (9.5) 


Certains[263] notent @fV* l’espace des formes k-linéaires sur V, voir la proposition 11.170. 


1. Mais je crois que c'est fait à plusieurs endroits dans le Frido. Faire attention. 
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Exemple 9.5. 
Soit une application linéaire A: R" — R”". L'application de Rx R” dans R associée à À définie 
par 

TA: R'xR"—R 


9.6 
Ty x: AÀy G.9) 
est une forme bilinéaire. 
Elle est aussi donnée par la formule 
Ta(x,y) = x Ay = Ajmiy. (9.7) 
i,3 

A 

9.2.1 Formes multilinéaires alternées 
LemHiHNey 


Lemme 9.6 ([264]). 
Une forme k-linéaire alternée est antisymétrique?. Si K est de caractéristique différente de 2, alors 
une forme antisymétrique est alternée*. 


Démonstration. Soit f une forme alternée ; quitte à fixer toutes les autres variables, nous pouvons 


travailler avec une 2-forme et simplement montrer que f(x,y) = —f(y,x). Pour ce faire nous 
écrivons 

0 = f(x+y,x+y) = (sx) + fe, y) + fy,x) + fu. y) = f(x, y) + (y, x). (9.8) 

Pour la réciproque, si f est antisymétrique, alors f(x,x) = —f(x,x). Cela montre que f(x,x) = 


0 lorsque K est de caractéristique différente de deux. 


ProprbjihK 
Proposition 9.7 ([265]). 
Soit E, un K-espace vectoriel de dimension n, où la caractéristique de K n’est pas deux. L'espace 
des n-formes multilinéaires alternées sur E est de K-dimension 1. 


Démonstration. Soient {e;}, une base de Æ, une n-forme linéaire alternée f : E — K ainsi que des 


vecteurs (v1,...,,) de E. Nous pouvons les écrire dans la base 
nm 
Vj — Qij Ci (9.9) 
i=1 
et alors exprimer f par 
nm n 
rss) = Ï( > Ge sit » de) (9.10a) 
1 in=1 
— >, ir sde (rss2sses D: (9.10b) 
Lin 


Étant donné que f est alternée, les seuls termes de la somme sont ceux dont les à; sont tous 


différents, c’est-à-dire ceux où {i1,...,in} = {1,...,n}. Il y a donc un terme par élément du 
groupe des permutations S, et 
flop: >. Des tal lentes véto (9.11) 
OESn 
En utilisant encore une fois le fait que la forme f soit alternée, f = f(e1,...,en)ll où 
IT(u1,..., Un) = x Lo) tn (9.12) 
OESn 


2. Antisymétrique, définition 9.3. 
3. Définition 9.2. 
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Pour rappel, la donnée des v; est dans les nombres a@;;. 

L'espace des n-formes alternées est donc au plus de dimension 1. Pour montrer qu’il est exac- 
tement de dimension 1, il faut et suffit de prouver que IT est alternée. Par le lemme 9.6, il suffit de 
prouver que cette forme est antisymétrique *. 

Soient donc v1,...,v, tels que v; = v;. En posant 7 = (li) et 7’ = (2j) et en sommant sur oTT' 
au lieu de ©, nous pouvons supposer que à = 1 et j = 2. Montrons que [{(v,v,v3,...,Un) = 0 en 
tenant compte que @;1 = @;2 : 


iduus mul > e(o)a(1)1%0(2)2%0(3)3 + + + Ao(nn (9.13a) 
CESn 
E » E(OT)Qor(1)1Qor(2)2 A or(3)3 + Xor(n)n où T = (12) (9.13b) 
CES n 
= — D o)a(1)100(2)200(3)3 - : : Ao(nyn (9.13c) 
CES n 
= —II(v,v,u3,...,Un). (9.13d) 


9.2.2 Déterminant d’une famille de vecteurs 


Nous considérons un corps K et l’espace vectoriel Æ de dimension n sur K. 


DEFooUDDFooSNahPb 
Définition 9.8 (Déterminant d’une famille de vecteurs|10]). 
Le déterminant de la famille de vecteurs (v1,...,vn) dans la base B = {b1,...,bh} est l'élément 
de K . 
EQoo0UJEX00X £ 
dt b)(Piseeün) = D e(o)] [ééç(vi) NES 
CES n i=1 
où 


— la somme porte sur le groupe symétrique, 
— le nombre e(o) est la signature” de la permutation o, 


— les éléments {b*} sont la base duale® de {b;}. 


9.9. 
La base {e;} est la base canonique de K”, et l’élément ef est la forme linéaire définie par 
ei: K°—K 
D'œis — (9.15) 
i 


Il n’est pas sous-entendu que K” ait un produit scalaire. Il n’est donc pas autorisé de dire que 
{e;} est une base orthonormée et que ef(x) = <ex,x). Ce genre d’égalités sont vraies dans le cas 
K = R, mais n’ont pas de sens en général. 

Le lemme 11.5 va un peu parler du cas où K” est muni d’une base orthonormée. 


LemJMWCooELZuho 
Lemme 9.10 ([10]). 
Les propriétés du déterminant. Soit B une base de E. ITEMooAHOHooDZgtSB 
,  . ne _. 
(1) L'application detg: E" — K est n-linéaire. ITEMooTXXBooBmDtzd 


(2) L'application detg: E” — K est n-linéaire est antisymétrique et QUE ÉGTEMOONF JTooTaGoPr 
(3) Pour toute base, detg(B) = 1. 


4. C’est ici que joue l’hypothèse sur la caractéristique de K. 

5. Définition 1.290. 

6. Définition 4.126. 

7. Alternée, définition 9.2. En caractéristique 2, alternée n’est pas équivalent à symétrique. 
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ITEMooALRQooDvBzDQ 
(4) Le déterminant ne change pas si on remplace un vecteur par une combinaison linéaire des 
autres : 
nm 
detp(v1,...,Un) = detp (vi + > AsUs V2, ... sun} (9.16) 
S ITEMooQTTRooMbzqyW 


(5) Si on permute les vecteurs, 


detp(vi,...,Un) = e(o) detp(vo(1), .: ; Uo(n)): (9.17) 
ITEMooIPIDooTrerVF 
(6) Si B' est une autre base : dE 
detg —= detg(B) detp L é (181 
ITEMooXKTAooXynFTE 
. ! _ 
(7) Nous avons aussi la formule detg(B) detp(B) = 1. tenDNELoobtieshé 
(8) Les vecteurs {v1,...,v,} forment une base si et seulement si detp(vi1,...,Un) # 0. 
Démonstration. Point par point. 
(1) 1} En posant v1 = 1 + Àx2 nous avons 
nm 
detp(x1 + ÀT2,U2,..., Un) = e(o) El ti (Vi) (9.19a) 
g i=1 
nm 
= Le(o) (eat + A2) [ [tot (9.19b) 
o i=2 


À partir de là, la linéarité de e*,,, montre que detz est linéaire en son premier argument. 
Pour les autres arguments, le même calcul tient. 


(2) (2) 
Nous prouvons à présent que det est alternée. Si votre corps est de caractéristique différente 
de deux, vous pouvez lire la proposition 9.11. 


Supposons vy = w, et considérons la permutation 8 = (k,l). Nous savons par la proposition 
5.46 que Sn = An L AB. Cela nous permet de décomposer la somme sur 5, en deux parties : 


2 DIIéut@) = ED TTS00) + 2 DT pates 082) 


CES n OEAn CEÂn 


D'abord (—1)7 = 1 et (—1)7Ÿ = —1. Ensuite, pour un o € À, donné, nous avons 


Loc) = pu nn) [Ton (vi) (9-21a) 
t i£k 
iZl 


_ EG) (vx) (x) (ur) g (à) (ui) (9.21b) 
Al 

= Eu) (x (Ur) il Et (Vi) (9.21c) 
i# 
il 


= II Si). (9.214) 


Donc les deux termes de la somme (9.20) ne diffèrent que par un signe. Elle est donc nulle, 
et la forme déterminant est alternée. 


La fonction det est antisymétrique parce que alternée, voir le lemme 9.6. 
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(3) (3) Nous avons 


nm 


detg(B) = ÿ e(o)[ [eçy(ei). (9.22) 
0ESn SE 
—Oo(i),i 


Si o n’est pas l’identité, le produit contient forcément un facteur nul. Il ne reste de la somme 
que © = Id et le résultat est 1. 


(4) (4) Vu que detg est linéaire en tous ses arguments, 


nm nm 
detg (vi + > AsUs V2, ... sua) = detp(vi,...,Un) + > as detp(us, U2,..., Un). (9.23) 
s—=2 s—=2 


Chacun des termes de la somme est nul parce qu’il y à répétition de v, parmi les arguments 
alors que la forme est alternée. 


(5) (5) Nous devons calculer detg(v,(1),...;Vo(n)), et pour y voir plus clair nous posons w; = 
Vo(iÿ- Alors : 


detp(vo(1}; :::; Vo(n)) = D e(a’) El (y (Wi) (9.24a) 
i=l 


o! 


_ > e(o’) El EG/(i) (Vo (i)) (9.24b) 


= > (0) Il EG—19/(:) (Vi) (9.24c) 


o! i=1 

= > (ca) [I (y (Vi) (9.24d) 
oc! i=1 

= e(o) detp(vi1,...,Un). (9.24e) 


Justifications : nous avons d’abord modifié l’ordre des éléments du produit et ensuite l’ordre 
des éléments de la somme. Nous avons ensuite utilisé le fait que €: 5, — {0,1} était un 
morphisme de groupe (proposition 1.293). 


(6) (6) Étant donné que l’espace des formes multilinéaires alternées est de dimension 1, il existe 
un Àe K tel que detg = Àdetp. Appliquons cela à B' : 


detg(B") = \dety(B), (9.25) 


donc À = detg(B). 
(7) (7) I suffit d'appliquer l'égalité précédente à B en nous souvenant que detg(B) = 1. 


(8) (8) Si B'= {v1,...,v,} est une base alors detg(B") # 0, sinon il n’est pas possible d’avoir 
detg(B) detg/(B) =]: 
À l'inverse, si B’ n’est pas une base, c’est que {v1,...,v} est liée par la proposition 4.18. 
Il y a donc moyen de remplacer un des vecteurs par une combinaison linéaire des autres. Le 
déterminant s’annule alors. 


PROPooXNLDooGGkHpd 
Proposition 9.11. 
Si la caractéristique du corps de base n’est pas deux, le déterminant est antisymétrique et alterné. 


Démonstration. Si la caractéristique du corps de base n’est pas deux, une forme antisymétrique 
est alternée (lemme 9.6). 

Pour prouver que le déterminant est antisymétrique, remarquez que permuter v4 et vw revient 
à calculer le nombre detg(v,,,(1); : ::; Voy(n)) au lieu de detg(w1,...,v1). Cela revient à changer la 
somme »,, en >: Cela multiplie e(o) par —1 parce qu’on ajoute une permutation. 


618 CHAPITRE 9. ESPACES VECTORIELS (ENCORE) 


Donc le déterminant est antisymétrique. Nous en déduisons qu’il est alterné parce que, en 
permutant trivialement v1 et v1, nous obtenons detg(v1,v1) = —detp(vi,v1). Si le corps est de 
caractéristique différente de deux, cela implique que detg(vi,v1) = 0. 


D'après la proposition 9.7, il existe une unique forme n-linéaire alternée égale à 1 sur B, et 
c’est detg: E" — K. 
9.2.3 Déterminant d’un endomorphisme 

L'interprétation géométrique du déterminant en termes d’aires et de volumes est donnée après 


le théorème 14.280. 
LEMe6fQUREoofKBRixA 


Lemme-Définition 9.12. 
Si f: E — E est un endomorphisme, et si les parties B et B' sont deux bases, alors 


detg (f(B)) = detg (f(B")). (9.26) 
Ce nombre, indépendant de la base choisie est nommé le déterminant de f et est noté det(f). 


Démonstration. L'application 


vw: E = K (0.27) 
U1,-.., Un > detp (ft) fn) | 
est n-linéaire et alternée ; il existe donc À € K tel que & = À detg. En appliquant cela à B : 
detp (f(B)) = Adetp(B) = À. (9.28) 
Nous avons donc déjà prouvé que À = detg ( Î (B)); c’est-à-dire 
detg (f(v)) = dets (f(B)) det(v). (9.29) 
Nous allons maintenant introduire B’ là où il y a du v en utilisant les formules (9.18) : 
detg (f(v)) = detg(B") det (f(v)) (9.30a) 
detg(v) = detg(B) detp(v). (9.30b) 
Nous obtenons 
detpr (f(v)) — detg (f(B)) detpr(v). (9.31) 
Et on applique cela à v = B' : 
detp (f(B')) — detg (f(B)) detp(B) Ê (9.32) 
=1 
PropYQNMooZj1Y1A 


Proposition 9.13. 
Principales propriétés géométriques du déterminant d’un endomorphisme. ItemUPLNooYZMRJy 


(1) Si f et g sont des endomorphismes, alors det(f o g) = det(f) det(g).  :rEMooNZNLoooDaxeH 


% si et seulement si det(f) ÆÉTEMooZMVX00LGjvCy 


(2) L’endomorphisme f est un automorphisme 
(3) Si det(f) £ 0 alors det(f-!) = det(f)-!. 
(4) L'application det: GL(E) — K\{0} est un morphisme de groupe. 


ItemooPJVYooYSwqaE 


Démonstration. Point par point. 


8. Définition de dets(B'), 9.8. 
9. Endomorphisme inversible, définition 4.35. 
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(1) Nous considérons l’application 
vo: EE —K 


vi detg (f(v)). 


Comme d'habitude nous avons w(v) = Adetg(v). En appliquant à B et en nous souvenant 
que dets(B) = 1 nous avons detg (f(B)) = À. Autrement dit : 


(9.33) 


À = det(f). (9.34) 


Calculons à présent p(9(B)) : d’une part, 


p(g(B)) = detg ((f ° g)(B)) (9.35) 
et d’autre part, 
g(g(B)) = Adetg (g(B)) = Adet(g) (9.36) 
En égalisant et en reprenant la la valeur déjà trouvée de À, 
det ((f o g)(B)) = det(f) det(g), (9.37) 


ce qu'il fallait. 

(2) Supposons que f soit un automorphisme. Alors si B est une base, f(B) est une base. Par 
conséquent det(f) = dets (f(B)) # 0 parce que f(B) est une base (lemme 9.10(8)). 
Réciproquement, supposons que det(f) 0. Alors si B est une base quelconque nous avons 
detg ( f(B )) ZÆ 0, ce qui est uniquement possible lorsque f(B) est une base. L'application f 
transforme donc toute base en une base et est alors un automorphisme d’espace vectoriel. 

(3) Vu que le déterminant de l'identité est 1 et que f est inversible, 1 = det(f o f-!) = 
det(f) det(f-?). 


PROPooFKDXooKMSolt 
Proposition 9.14. 
Soient deux espaces vectoriels E et F de dimension finies n et m sur le corps K munis de bases 
{e;} et {fa}. À une matrice À € M(m x n,K) nous associons l'application linéaire !° 


=) At (9.38) 


Alors, en ce qui concerne les déterminants !!, nous avons 
(1) det(f4) = det(A) 
(2) det(fa) = det(f4) det(fB) 


Démonstration. Nous devons étudier la formule 


det(f4) = Dr AT JA(e:)) (9.39) 
oESn 
En premier lieu nous avons 
JA( = Ÿ Ajr(es) C7 re; = 2iAsier (9.40) 
jk 
Nous avons alors 
n (FA(ei)) dis eo = À, (y. (9.41) 
Ô 


jo(i) 


10. Dont nous avons déjà beaucoup parlé entre autres dans la proposition 4.72. 
11. Définition 9.12 pour les applications linéaires et 4.78 pour les matrices. 
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Au final, 
det(fa) = D e(a) [ [ Ac = det(4) = det(4) (9.42) 
[°4 i=1 


où la dernière égalité est autorisée par le lemme 4.80. 
Cela prouve la formule det(f4) = det(A). 
En ce qui concerne la seconde formule, il s’agit de se souvenir de la proposition 4.72 qui donne 
fag = fAo fp, et ensuite de la proposition 9.13(1) qui donne det(f4 o fs) = det(f4) det(fg8). 


9.2.4 Déterminant de Vandermonde 


PropnuUvt)j 
Proposition 9.15 ([112]). 
Le déterminant de Vandermonde est le polynôme en n variables donné par 
1 1 1 
Ti D ... T, 
Punm)edll 7 . . [= I] G-7 (9.43) 
: : Le L : | 1<i<j<n 
n— n— _ 
+ Ts ss, LP 
Notez que l'inégalité du milieu est stricte (sinon d’ailleurs l'expression serait nulle). 
Démonstration. Nous considérons le polynôme 
FX) = VD: T1, À) € (K[T:, — , Tn-1])[X]. (9.44) 
C’est un polynôme de degré au plus n — 1 en X et il s’annule aux points 1,...,1,_1. Par consé- 
quent !? nous pouvons factoriser les X — T3, c'est-à-dire qu'il existe à € K[T1,...,Tn_1] tel que 
= Eqge w 
fol |) aetgaes 
i=1 
Nous trouvons a en écrivant f(0). D'une part la formule (9.45) nous donne 
EqblwWM; 
(0) = a(—1)" IT... Te 1. ee) 
D'autre part la définition donne 
l l 1 
Ti Ty-1 0 
f(0) = det | ou. (9.47a) 
1 D Ù 
Ti Tn=1 
= (—1)" det | : *. : (9.47b) 
Re UE 
1 . 1 
D De D dt) Ze à (9.47c) 
ee 
A Pat (lie. 1) (9.474) 
En égalisant avec (9.46), nous trouvons à = V(T:,...,1»_1), et donc 
f= VB...) [| X-7) (9.48) 
j<n—1l 


12. Proposition 3.120. 


9.2. APPLICATIONS MULTILINÉAIRES 621 


Enfin, une récurrence montre que 


V...,T)= 0) (9.49a) 
Yates) TG (9.49b) 
j<n—1 
- El El (DT) (9.49c) 
k<n j<k—1 
= (El G=7) (9.494) 
1<j<k<n 


Exemple 9.16. 

Le déterminant de Vandermonde (proposition 9.15) est alterné, semi-symétrique et non symétrique. 
Le fait qu’il soit alterné est le fait qu’il soit un déterminant. Étant donné qu’il est alterné, il est 
semi-symétrique parce que sur À», nous avons € = 1. Étant donné qu’il est alterné, il change de 


signe sous l’action des éléments impairs de 5, et n’est donc pas symétrique. PA 
PropUDqXax 
Proposition 9.17. 
Un polynôme semi-symétrique f € K[T1,...,Tn] se décompose de façon unique en 
fJ=P+VQ (9.50) 


où P et Q sont deux polynômes symétriques. 


Démonstration. Nous commençons par prouver l’unicité en montrant que si f = P +VQ avec P 
et Q symétrique, alors P et Q sont donnés par des formules explicites en termes de f. 

Si o1 et o2 sont deux permutations impaires de {1,...,n}, alors o1 : f = o2 : f parce que 
l'élément 03 lo: est pair (proposition 1.293), de telle sorte que ao, loi + f = f. Nous posons donc 
g=T: f où 7 est une permutation impaire quelconque — par exemple une transposition. 

Vu que V est alternée et que 7 est une transposition nous avons 


g=T f-=P-VQ. (9.51) 


Donc f +g=2P et f — g = 2VQ. Cela donne P et Q en termes de f et g, et donc l’unicité. 
Attention : cela ne donne pas un moyen de prouver l’existence parce que rien ne prouve pour 
l'instant que f — g peut effectivement être écrit sous la forme VOQ, c’est-à-dire que f — g soit 
divisible par V. C’est cela que nous allons nous atteler à démontrer maintenant. 
Nous commençons par prouver que f + g est symétrique et f — g alterné. Si © est une trans- 
position, 


o'(f+g)=0o f+orT f=g+f (9.52) 
parce que or est pair. De la même façon, 
g'(f-g)=g-f=eo)(f — 39). (9.53) 


Dans les deux cas nous concluons en utilisant le fait que toute permutation est un produit de 
transpositions (proposition 1.288) et que € est un homomorphisme. 


Soient maintenant deux entiers À < k dans {1,...,n} et l’anneau 
on Cl) (9.54) 


Cet anneau contient le polynôme 7% —T1 où 1% est la variable et T7, est un coefficient. Nous faisons 
la division euclidienne de f — g par 1% — Ty parce que nous avons dans l’idée de faire arriver le 
déterminant de Vandermonde et donc le produit de toutes les différences 7% — T} : 


f-g=(U-Tjatr FU) 
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où degy, r < 1, c’est-à-dire que r ne dépends pas de 7}. Nous revoyons maintenant l'égalité (9.55) 


dans K[T:,...,7,] et nous y appliquons la transposition 7x. Nous savons que 7n(f—g) = —(f—g) 
et TETE Th) = (Tr Th: et donc 
EqVOh; 
CF — 9) = —-(Tr — Th)Tkn * + Th T q (046) 


où 7Txn ‘ r ne dépend pas de 7. Nous appliquons à (9.56) l’application 
ta: KT... To] = K(Tu...,É..., Ta) L.5n) 
PT Di = Pi. The Tale 


Cette application vérifie Q(Tkn - r) = a(r) et nous avons 


—a(f — g) = ar). (9.58) 
Puis en appliquant a à la relation f — g = (Ty — Tn)q + r, nous trouvons 
af —g)= ar); (9.59) 


et par conséquent a(r) = 0. Ici nous utilisons l’hypothèse de caractéristique différente de deux. 
Dire que a(r) = 0, c’est dire que r est divisible par T% — Th, mais r étant de degré zéro en 7%, 
nous avons r = 0. Par conséquent 7% — Ty divise f — g pour tout h < k, et nous pouvons définir 
un polynôme Q par 
Egr 
f-g=20[[ [[(-7)-20R,...,7)V(R,..,7), te) 
h<k k£&n 


où nous avons utilisé la formule du déterminant de Vandermonde de la proposition 9.15. 

Étant donné que f + g est un polynôme symétrique, nous allons aussi poser f + g = 2P avec 
P symétrique. 

Montrons à présent que Q est un polynôme symétrique. Soit © € 5, ; vu que nous savons déjà 
que f — g est alternée, nous avons 


a (f— 9) = e(o)(f — 9) = e(o)2QV, EP .61) 


Mais en appliquant o à l’équation (9.60), 


Ca (f — 9) on 2(o ‘ V)(T, ses 5» 1n)(o | Q)(T, EE à) (9.62a) 

= Jlo)V(li. Date + OT Tue (9.62b) 

Nous égalisons cela avec (9.61) et nous souvenant que l’anneau K[T:,...,7,] est intègre par le 
théorème 3.101. Ensuite nous simplifions par 2e(o)V pour obtenir 

Q=0:0Q, (9.63) 


c’est-à-dire que Q est symétrique. 
Au final nous avons f +q = 2P et f — g = 2VQ avec P et Q symétriques. En faisant la somme, 


f=P+VQ. (9.64) 
9.2.5 Déterminant de Gram 
Si Z1,...,x sont des vecteurs d’un espace vectoriel, alors le déterminant de Gram est le 
déterminant 
Gsm) det (Cas). (9.65) 
Notons que la matrice est une matrice symétrique. 
PropMsZhIK 
Proposition 9.18. 
Si F est un sous-espace vectoriel de base {x1,...,,} et six est un vecteur, alors le déterminant 
de Gram est un moyen de calculer la distance entre x et F' par 
G(x,t1,...,7 
d(x, F)? = Gr n) (9.66) 


Oei.sstn) 
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9.2.6 Déterminant de Cauchy 


Soient des nombres a; et b; (i = 1,...,n) tels que a; + b; Æ 0 pour tout couple (i,j). Le 
déterminant de Cauchy est 


Dh = det ; 9.67 
d à (. LE .) 
ProptoDYKA 
Proposition 9.19 ([266]). 
Le déterminant de Cauchy est donné par la formule 
D — Ile;(a; — di) [l<;(; = bs) (9.68) 
[ai + b;) 
9.2.7 Matrice de Sylvester 
DEFooEGKBeoxQB8T&P 
Définition 9.20 (Matrice de Sylvester, résultant[267]). 
Soient P et Q deux polynômes non nuls, de degrés respectifs n et m : 
P() = po + pit +: + par” (9.69) 
Q(x) = go + gr +--:+ ma. (9.69b) 


La matrice de Sylvester associée à P et Q est la matrice carrée m + n x m+n définie ainsi : 


(1) la première ligne est formée des coefficients de P, suivis de 0 : 
(Pn Pn-1 *** P1 po 0 :-+ 0); (9.70) 


(2) la seconde ligne s'obtient à partir de la première par permutation circulaire vers la droite ; 
(3) les (m — 2) lignes suivantes s’obtiennent en répétant la même opération ; 


(4) la ligne (m + 1) est formée des coefficients de Q, suivis de 0 : 
(dm Gm-1 *:: q go 0 --- 0); (9.71) 


(5) les (n — 1) lignes suivantes sont formées par des permutations circulaires. 


Le déterminant de la matrice de Sylvester associée à P et Q est appelé le résultant de P et Q et 
noté res(P, Q). 


Ainsi dans le cas n = 4 et m = 3, la matrice obtenue est 


pa P3 p2 p1 po 0 
O Pa P3 pP2 P1 Do 
0 O0 pa p3 p2 pi 
EqP 
Spg = 143 42 qi 4 0 0 L (872$) 
0 gqg3 qg2 qi 4o 0 
0 0 q3 42 4 & 
0 


0 0 q3 4 4 & 


cooscs 


Attention : si P est de degré n et Q de degré m, il y a m lignes pour P et n pour Q dans le 
déterminant du résultant (et non le contraire). 
LemBFrhgnA 
Lemme 9.21 ([268]). 
Si P et Q sont deux polynômes de degrés n et m à coefficients dans l’anneau À, alors pour tout 
1e A, 


res(ÀP, Q) = \"'res(P, Q) (9.73a) 
res(P, ÀQ) = X"res(P, Q). (9.73b) 
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Démonstration. Cela est simplement un comptage du nombre de lignes. Il y a m lignes contenant 
les coefficients de P ; donc prendre ÀP revient à multiplier m lignes dans un déterminant et donc 
le multiplier par À”. 


L'équation de Bézout (6.114) peut être traitée avec une matrice de Sylvester. Soient P et Q, 
deux polynômes donnés et à résoudre l’équation 


xP +yQ = 0 Fa 725 


par rapport aux polynômes inconnus x et y dont les degrés sont deg(x) < deg(Q) et deg(y) < 
deg(P). Si nous notons & et ÿ la liste des coefficients de x et y (dans l’ordre décroissant de degré), 
nous pouvons récrire l'équation (9.74) sous la forme 


5e (5) =ÿ (9.75) 
Y 
Pour s’en convaincre, écrivons pour les polynômes de l'exemple (9.72) : 


pa 0 0 g 0 0 


0 T2P4 + V3q3 
ps Pa 0 9 gs 0 017 P3T2 + Dati + Gays + q3y2 
P2 P3 Pa Qi Q2 q3 0 TO 
Pi P2 P3 Go a 4 q|\ly3|— (9.76) 
Po pP1 P2 0 Go qi qa||y 
0 po p1 0 0 Go ullu 
0 0 po 0 0 0 &/ \y 


Nous voyons que sur la ligne numéro k (en partant du bas et en numérotant de à partir de zéro) 
nous avons les produits p;x; et qy; avec à + j = k. La colonne de droite représente donc bien les 


coefficients du polynôme xP + yQ. 
PropAPxzcUl 


Proposition 9.22. 
Le résultant de deux polynômes est non nul si et seulement si les deux polynômes sont premiers 
entre eux. 


Un polynôme P a une racine double en a si et seulement si P et P' ont a comme racine 
commune, ce qui revient à dire que P et P’ ne sont pas premiers entre eux. 

Une application importante de ces résultats sera le théorème de Rothstein-Trager 20.94 sur 
l’intégration de fractions rationnelles. 


Exemple 9.23. 
Si nous prenons P = aX? +bX +cet P!' = 2aX + b alors la taille de la matrice de Sylvester sera 
2+1=3et 


a b c 
SPP! = 2a b 0 |. (9.77) 
0 2a b 
Le résultant est alors 
res(P, P') = —a(b? — 4ac). (9.78) 


Donc un polynôme du second degré a une racine double si et seulement si b? — 4ac = 0. Cela est 
un résultat connu depuis longtemps mais qui fait toujours plaisir à revoir. A 


La matrice de Sylvester permet aussi de récrire l’équation de Bézout pour les polynômes ; voir 
le théorème 6.47 et la discussion qui s'ensuit. 

Une proposition importante du résultant est qu’il peut s'exprimer à l’aide des racines des 
polynômes. 
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PropNDBOGNx 
Proposition 9.24. 
Si 
p 
P(X) = ap | [(X — «) (9.79a) 
i=1 
q 
Q(X) = b4 [ [(X — 8) (9.79b) 
j=1 


alors nous avons les expressions suivantes pour le résultant : 


res(P,Q) = af [TT [C8 ai) = I [P(8) = (Da [ Tec). ER) 


i=1 j=1 j=1 i=1 


Démonstration. Si P et Q ne sont pas premiers entre eux, d’une part la proposition 9.22 nous dit 
que res(P,Q) = 0 et d’autre part, P et Q ont un facteur irréductible en commun, ce qui signifie 
que nous devons avoir un des X — a; égal à un des X — B;. Autrement dit, nous avons a; = f; 
pour un couple (i,j). Par conséquent tous les membres de l’équation (9.80) sont nuls. 

Nous supposons donc que P et Q sont premiers entre eux. Nous commençons par supposer que 
les polynômes P et Q sont unitaires, c’est-à-dire que a, = b, = 1. Nous considérons alors l’anneau 


À = Z{o,...,0p, B1,..., Bal. (9.81) 


Dans cet anneau, l'élément B; — a; est irréductible (tout comme X — Y est irréductible dans 
Z[X, Y |). Le résultant À = res(P, Q) est un élément de À parce que tous leurs coefficients peuvent 
être exprimés à l’aide des a; et des B;. Dans A, l'élément B; — a; divise R. En effet lorsque B; = a, 
le déterminant définissant le résultant est nul, ce qui signifie que B; — à; est un facteur irréductible 
de À. 

Par conséquent il existe un polynôme T' € À tel que 


pr 
R= Ton, , 8) | [ ] ](8; — ox). (9.82) 
i=1 j=1 


Comptons les degrés. Pour donner une idée de ce calcul de degré, voici comment se présente, au 
niveau des dimensions, le déterminant : 


. p+1 - g=1 EqJ SES 


0 déitiatanbisssss 0 + Ap SR TERRES Ses a] . ao 


p+q 


si les a; sont les coefficients de P. Mais chacun des a; est de degré 1 en les a;, donc le déterminant 
dans son ensemble est de degré q en les à;, parce que R contient q lignes telles que (9.83). Le même 
raisonnement montre que R est de degré p en les B;. Par ailleurs le polynôme [ [?_, [L-1(8; — @i) 
est de degré p en les B; et q en les a;. Nous en déduisons que T doit être un polynôme ne dépendant 
pas de à; ou de B;. 

Nous pouvons donc calculer la valeur de T en choisissant un cas particulier. Avec P(X) = XP 
et Q(X) = X1 + 1, il est vite vu que R(P,Q) = 1 et donc que T = 1. 

Si les polynômes P et Q ne sont pas unitaires, le lemme 9.21 nous permet de conclure. 
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9.2.8 Théorème de Kronecker 


Nous considérons X, l’ensemble des polynômes de Z[X] 
(1) unitaires de degré n, 
(2) dont les racines dans € sont de modules plus petits ou égaux à 1, 
(3) et qui ne sont pas divisés par X. 


Un tel polynôme s'écrit sous la forme 


n—1 
Pere) ax (9.84) 
k=0 
ThoOWMNAVp 
Théorème 9.25 (Kronecker|[103]). 
Les racines des éléments de K, sont des racines de l’unité. 
Démonstration. Vu que € est algébriquement clos nous pouvons considérer les racines a1,...,a» 
de P dans C. Nous les considérons avec leurs multiplicités. 
Soit R = X" + ee b XF un élément de K, dont nous notons B1,...,/Bn les racines dans C. 


Les relations coefficients-racines stipulent que 


n—k 
bx = >, IDE (9.85) 


1<i1<...<in_K<n j=1l 


En prenant le module et en se souvenant que |5,| < 1 pour tout {, nous trouvons que 


br < L ) (9.86) 
n—k 
Mais comme by € Z, nous avons 


net-(,7,)-(r)ere (Ti) (9.87) 


qui est de cardinal pe) + 1. Nous avons donc 


n—1 
Card(K,) < TI (1 à 9.88 
en < [a+ ("pes (2.5) 


La conclusion jusqu'ici est que K,, est un ensemble fini. 
Pour chaque k € N* nous considérons les polynômes 


Pr = [ [(X — of) (9.89a) 
i=1 
G=X Ye zIxT| (9.89b) 
et puis nous considérons le résultant Rx = resx(P,Qx) € Z[Y]: 

1 Gn-1 ::: à 0 ... 0 0 0 

0 1 &Gn-1 :::  &o 0 ... 0 0 

0 0 1 An—1 RH ao 0 0 

0 0 1 An—1 ao 0 
0)" ao (9.90) 

1 0 —Y 0 0 0 

0 1 0 0 —Y 0 0 

0 0 1 0 0 —Y 0 


[æ) 
[æ) 
= 
© : 
[æ) 
kQ 
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Cela est un polynôme en Ÿ dont le terme de plus haut degré est (—1)"Y”. Les petites formules de 
la proposition 9.24 nous permettent d'exprimer R;(Y) en termes des racines de P : 


nm nm 


Rk(Y) = [ TQu(oi) = [ [(af -Y) = (-D"TTE - af) 


i=1 i=1 i=1 


(—1)"P,(P). (9.91) 


Vu que P € K, nous savons que les a; ne sont pas tous nuls; donc Px € K,. Cependant nous 
avons vu que X, est un ensemble fini; donc parmi les P}, il y a des doublons (et pas un peu) l*. 
Nous regardons même l’ensemble des Pon dans lequel nous pouvons en trouver deux les mêmes. 
Soit ! > k tels que Pr = Pu. Si à est racine de Px, alors il est de la forme à = 82 pour une 
certaine racines 8 de P. Par conséquent 


se _ SA Sn) 


est racine de PA. Notons que dans cette expression il n’y a pas de problèmes de définition d’exposant 
fractionnaire dans € parce que { > k. Vu que (9.92) est racine de Ph, il est aussi racine de P#. 
Donc . 

CET (9.93) 


. n(i—k 
est racine de PA et donc de P,x. Au final nous savons que tous les nombres de la forme a? " 


sont racines de P,K. Mais comme P,+ à un nombre fini de racines, nous pouvons en trouver deux 
égales. Si nous avons 


Er dE (9.94) 


pour certains entiers m > n, alors 
n(i-k)__om(i-k) 
ca : = 1, (9.95) 


ce qui prouve que @ est une racine de l’unité. Nous avons donc prouvé que toutes les racines de 
P.x sont des racines de l’unité et donc que les racines de P sont racines de l’unité. 
2 


9.3 Orientation 


9.3.1 Cas vectoriel 
DEFooNVRHooEBHUSu 


Proposition-Définition 9.26 ([269]). 
Soient deux bases B et B' d’un espace vectoriel réel E. Nous définissons la relation B —< B' si et 
seulement si detg(B') > 0 "1. 

Cela est une relation d'équivalence 
orientations de FE. 


15 sur l’ensemble des bases de E, et les classes sont les 


Démonstration. Tout est dans le lemme 9.10. D'abord quand B et B' sont des bases, detg(B") Z 0 
ensuite, nous passons en revue les points qu’il faut pour être une relation d'équivalence. 


(1) B - B parce que detg(B) = 1 > 0. 
(2) Vu que detg(B”) — CITE les deux sont positifs en même temps ou pas du tout. 


(3) Si B - B'et B' - B”, alors en utilisant la formule 
dets(B”) = detg(B') detg (B”), (9.96) 


nous voyons que detg(B”) > 0. 


13. Ici dans [103], il déduit qu'on a un k tel que Px = P1 = P. Moi je vois pourquoi on a un k et un | tels que 
Px = P,, mais pourquoi on peut en trouver un spécialement égal au premier ? Une réponse à cette question permettrait 
de solidement réduire la lourdeur de la suite de la preuve. 

14. Définition 9.8. 

15. Définition 1.31. 
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Lemme 9.27. 


Soit un espace vectoriel réel E. L'ensemble des bases de E possède exactement deux orientations *5 


Démonstration. Nous considérons une base B = (e1,...,eh) !" à partir de laquelle nous définissons 
une autre base : BB” — (—e1,e2,...,en). Nous allons prouver que ces deux bases ne sont pas 
équivalentes, et que toute base de E est équivalente soit à B soit à B. 


(1) Au moins deux classes Le fait que detg(B”’) = —1 vient du fait que detg(B) = 1 et que 
l’application detg est n-linéaire ; en multipliant par —1 le premier argument, la valeur du 
déterminant est multipliée par —1. 


Donc les bases B et B' ne sont pas équivalentes et il existe au moins deux classes. 


(2) Au plus deux classes Nous montrons à présent que toute base est équivalente soit à B 
soit à B’. Supposons que B” ne soit pas équivalente à B, c’est-à-dire que detg(B”) < 0. Nous 
utilisons encore la formule (9.18), 


dets(B”) = detg(B') dety(B"). (9.97) 
< < 


et nous déduisons que detg/(B"”) > 0. 


9.28. 
Vu qu'il n’y a que deux classes d'équivalence parmi les bases, nous pouvons utiliser le vocable 
« avoir la même orientation que » ou « avoir l'orientation contraire de ». Ce n’est pas ambigu. 


Proposition 9.29 ([269]). 
Si B est une base de l’espace vectoriel E de dimension n, et sir est une transposition ® de S,, 
alors la base T(B) est de sens contraire. 


Démonstration. Le lemme 9.10(2) dit que detg est une forme anti-symétrique ; donc 


detg(B") = — detg (r(B)'). (9.98) 


Si l’un est positif, l’autre est négatif. Elles ont donc des orientations contraires. 


Corolaire 9.30. 
Si B est une base de l’espace vectoriel E de dimension n, et si o € S, la base o(B) a même 
orientation que B si et seulement si o € Ah. 


Démonstration. Notons c1 la classe d'orientation de B et c2 l’autre classe. La permutation © se 
décompose en produit de transpositions dont la parité est fixée (proposition 1.289). Posons o = 
TR. T1. 
En posant Bo = B et By}1 = n+1(B1), pour tout {, la base B, est d'orientation contraire à celle 
de la base B;_1. Une base sur deux a l'orientation de B et l’autre sur deux a l'orientation contraire. 
Donc o(B) a la même orientation que B si et seulement si k est pair. Mais o € À, si et seulement 
si k est pair. C’est bon. 


PROPooNBAXooKNUrnk 
Proposition-Définition 9.31 ([269]). 
Soit un espace vectoriel réel, et un endomorphisme f de E. Deux définitions. :rEMoonAXFooL.TPH1w 


(1) L'endomorphisme f est direct si sont déterminant est strictement POSE TEMooNKYCOOXTgK JA 


(2) L'’endomorphisme préserve l'orientation si il transforme toute base de E en une base de 
même orientation. 


16. Définition 9.26. 
17. Nous notons (e1,e2) et non {e1,e2} parce que l’ordre est important. 
18. Définition 1.286. 
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Un endomorphisme est direct si et seulement si il préserve l’orientation. 


Démonstration. En deux sens. 


(1) Direct implique préserve l’orientation Soit une base B de E et un endomorphisme 
direct u. D'abord, u est inversible du fait que son déterminant est non nul par la proposition 
9.13(2). Donc u transforme une base en une base par le lemme 4.8. 


La définition 9.12 du déterminant de u est que 
det(u) = detg (u(B)) > 0. (9.99) 


Donc B et u(B) ont même orientation. 


(2) Préserve l'orientation implique direct Le fait que u préserve l'orientation signifie en 
particulier qu’il transforme une base en une base et qu’il est inversible par le lemme 4.8. 


Donc si B est une base, u(B) est encore une base et nous avons, parce que B et u(B) ont 
même orientation, 


0 < dety (u(B)) = det{u). (9.100) 


9.3.2 Cas affine 


Définition 9.832. 
Soit un espace affine £ modelé sur E. Les repères cartésiens !” (O,B) et (0', B') ont même orien- 
tation si les bases B et B' ont même orientation. 


DEFooUTFPooIVkHFP 


Les classes d'équivalence (il y en a deux) sont les orientations de €. 
Une application affine f: £ — £ préserve l'orientation si sa partie linéaire? préserve 
l’orientation. 


9.4 Hermitien, orthogonal, adjoint 
NORMooWGEJooCtGtqz 
9.33. 
Une des choses à retenir de la définition de l’opérateur adjoint est que la notion de A* dépend du 
produit scalaire considéré. 
Il se fait que le plus souvent, sur IR”, nous considérons le produit scalaire usuel et la base 
canonique. De ce fait, les notions d’opérateur adjoint et d’opérateur transposés se confondent avec 


la notion de matrice transposée. Ce sont pourtant, en général, trois notions distinctes. 
DEFooROVNooF1TbSK 


Proposition-Définition 9.34 (Définition de la transposée{[1]). 
Soient deux espaces vectoriels euclidiens ou hermitiens E et F et une application linéaire A: E — 


F. ITEMooRUZWooSZgGnf 
(1) Il existe une unique application linéaire B: F — E telle que 


(Az, Dr _ (x, Byÿr CONTES 


pour toutreE etyeF. ITEMooXXEUooPtfPKY 


(2) Si {e;} est une base orthonormée de E et {fa} est une base orthonormée de F, alors la 
matrice de À et B pour ces bases sont liées par 


Het. EQooUSNVoo F0) 


L'application B ainsi définie set nommée adjoint de À et sera notée B — A*. 


19. Définition 8.7. 
20. Définition 8.13. 
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Démonstration. Pour l’unicité, nous écrivons la condition avec x = e; pour obtenir : 


(Ae;,y) = (e;, By) = (By); (9.103) 


c’est-à-dire que les coefficients B(y); de B(y) dans la base canonique sont fixés par la condition. 
Pour l'existence, il suffit de vérifier que poser 


B(y) = D KAe;,ye; (9.104) 


J 


fonctionne. Pour cela il faut utiliser la bilinéarité du produit scalaire et le fait que €x,e;) = x;. 
Nous avons : 


Cr B(y)) = (x, > KA(e5); y)e;) (9.105a) 
J 
= ) KA(;),yXx,6;) (9.105b) 
J 
= D XA(xje;),y) (9.105c) 
j 


= (A(x), y). (9.105d) 


En ce qui concerne la matrice de l’application B ainsi définie, nous écrivons la condition (9.101) 
avec y = e!, et x = e;, de telle sorte que 


A(x) = A(ei) = Ÿ Ages (9.106) 
E 


et 
B(y) = B(ec) = ÿ) Bjatÿ. (9.107) 
5 


Alors nous avons : 


> Apiep, en) = BiKéi ei) (9.108) 
B j 


donc 
Ai = Bjo. (9.109) 


9.35. 

À cause de l'expression (9.102) pour la matrice de A*, cette application est souvent appelé trans- 
posé de À et noté A!. Nous allons cependant voir plus tard (définition9.185) que la transposée 
de À est une application At: F* — E*. Il nous arrivera cependant d'écrire des égalités comme 


(Az, y) = (x, Afy). 
PROPooSHZMooGwdfBd 


Proposition 9.36. 
En ce qui concerne le déterminant, 


det(A*) = det(A)* (9.110) 
où l'étoile à droite dénote la conjugaison complexe dans C. 


Démonstration. Écrivons l'expression explicite (9.14) du déterminant. Le tout avec la base cano- 
nique : 


det(4) = detee.. (A1, ...; Aen) = Ÿ, e(o) | [efy(Aei). (9.111) 
= 


CESn 


Mais nous pouvons développer : 


et ( A6) — ébu Ae;) — (A’ety e;) = ei, AB) . €? es)" (9.112) 
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Notez que dans la dernière expression, les trois * ont trois significations différentes. Par conséquent, 


I 
7 
= 3 
= 
3 


det(A) (9.113) 


Mais e*(A*e,(;)) = y (A*E;) pour j = o(i), donc le produit ne change pas si on déplace le o : 


det(4) = D e(o)] [ec (4*ei)* = det(4*)*. (9.114) 
il 


oESn 


Nous avons donc det(A) = det(A*)*, c'est-à-dire det(A)* = det(A*). Pour information, la dernière 
étoile est la conjugaison complexe. 


PROPooVPSYooRuoEFi 
Proposition 9.37 ([1]). 
Si À: E — E3 et B: E; — E2 sont des applications linéaires, alors 


(AB)* = B*A* (9.115) 
où la « multiplication » est la composition. 


Démonstration. L'existence de (AB)*, de A* et de B* ne donne pas lieu à débat parce que la 
proposition 9.34 ne souffre pas de discussions. La propriété que (AB)* est unique a avoir est que 


(ABax, y) = (x, (AB)*y) (9.116) 
pour tout x € E1 et y € E3. Or l'application B*A* possède également cette propriété parce que 
€x, B*A*y) = <Bz, A*y) = <ABrx, y). (9.117) 


La partie unicité de la proposition 9.34 nous impose donc d’accepter que les applications (AB)* 
et B*A* sont en réalité les mêmes ?!. 


9.38. 
Un grand moment d'utilisation de la notion d’adjoint pour un opérateur non carré sera la définition 
d’une intégrale sur une variété; en particulier dans la proposition 20.9. 


Lemme 9.39. 
Si E est un espace euclidien, un endomorphisme f: E — E est autoadjoint si et seulement si pour 
tout x,y € E nous avons {x, f(y)> = <f(x), y). 


Démonstration. Dans le sens direct, nous avons 


(FC), y) = x, fu) = <e, F(y)). (9.118) 


La première égalité est la définition de f* et la seconde est l’hypothèse f = f*. 
Dans l’autre sens, l'hypothèse est que l’endomorphisme f vérifie x, f(y)> = f(x), y). Mais 
la proposition 9.34(1) spécifie que f* est l’unique endomorphisme à satisfaire cette égalité. Donc 


ar DE 


9.4.1 Opérateur orthogonal, matrice orthogonale 
DEFooYKCSooURQDos 


Définition 9.40. 

Un opérateur est orthogonal lorsque A* = A! où A* est l’adjoint de A définit en 9.34. 
DEFooUHANooLVBVID 

Définition 9.41. 

Une matrice U est orthogonale si Ut = U-!. Le groupe orthogonal noté O(n) est l’ensemble 

des matrices orthogonales n x n. 


21. Et ce même si vous croyez les avoir déjà vu ensemble dans la même pièce. 
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LEMooSSALooSBFzJb 
Lemme 9.42. 
Soit un opérateur À: R”? — IR” muni du produit scalaire usuel. Il est orthogonal si et seulement si 
sa matrice dans la base canonique est orthogonale ??. 


Démonstration. Soit la base canonique {e;};-1..n de R”. Nous avons 


(AA*e;, ej) = es, ej) — PE (9.119) 


donc ((AA* ei), = 0, ou encore (AA*);; = d;;, ce qui signifie que la matrice AA* est l'identité. 


PropKBCXooOUuEZcs 
Proposition 9.43 (Thème 77). 


À propos de matrices orthogonales. 
PE 9 ITEMooHSTAooIbVrwa 


(1) L'ensemble des matrices réelles orthogonales forme un groupe noté O(n,R). 


(2) Si À est une matrice orthogonale, alors det(A) = +1. A 


(3) Le groupe O(n) est le groupe des isométries linéaires’ de R". 
Démonstration. Commençons par prouver que O(n, R) est un groupe. La matrice 1 est orthogo- 
nale. De plus si À et B sont orthogonale, la matrice produit AB est orthogonale : 


(AB)(AB)' = ABB‘A* = A14' = 1. (9.120) 


Nous avons donc bien un groupe. 

En ce qui concerne le déterminant, AA! = 1 donne det(A) det(Af) = 1, mais la proposition 9.36 
dit que det(A) = det(A*), donc det(A)? = 1. D'où le fait que det(A) = +1. 

D'autre part si À est une isométrie de R” alors pour tout x,y € R” nous avons (Ax, Ay) = 
{æ,y). En particulier, 


(A'Ax, y) = (x, y) (9.121) 
pour tout x,y € R”. En prenant y = e; nous trouvons 
(A'Ax); = x, (9.122) 


ce qui signifie que pour tout x, AAx = x, ou encore que A’A est l'identité. 
Réciproquement si A°A est l'identité nous avons 


x, y) = (A Ax, y) = {Ax, Ay), (9.123) 


ce qui prouve que À est une isométrie. 


En ce qui concerne les valeurs propres des matrices de O(n) ainsi que leurs formes canoniques 
(avec des fonctions trigonométriques) pour O(3) et SO(3), ce sera pour la proposition 18.220 et ce 
qui s'ensuit. 

DEFooJLNQooBKTYUy 
Définition 9.44. 
Le sous-groupe des matrices orthogonales de déterminant 1 est le groupe spécial orthogonal noté 


SO(n). 


22. Définition 9.41. 
23. Au sens où, parmi les applications linéaires, les isométries sont les éléments de O(n). À part ça, il y à aussi les 
translations, mais c’est une autre histoire qui vous sera contée une autre fois. 


9.5. TOPOLOGIE 633 


9.5 Topologie 


9.5.1 Boules et sphères 


Un espace vectoriel normé (définition 7.149) vient avec sa topologie métrique (théorème 7.109). 
Sphères et boules fermées viennent dans la définition 7.126. 


Définition 9.45. 
Une partie À de V est dite bornée si il existe un réel R tel que A € B(0v, R). 


Une partie est donc bornée si elle est contenue dans une boule de rayon fini. 


Exemple 9.46. 
Dans R, les boules sont les intervalles ouverts et fermés tandis que la sphère est donnée par les 


points extrêmes des intervalles : 
B(a,;r) =la-r,a+rl, 


B(a,r) = [a —r,a + b], (9.124) 
S(a,r) = {a-—r,a+r}. 
A 
Exemple 9.47. 
Si nous considérons R?, la situation est plus riche parce que nous avons plus de normes. Essayons 


de voir les sphères de centre (0,0) € IR? et de rayon r pour les normes |.|1, ||.|2 et ||.|co. 
Pour la norme |.|;1, la sphère de rayon r est donnée par l'équation 


[x] + [y] = r. (9.125) 
Pour la norme |.|2, l'équation de la sphère de rayon r est 


Va?+y=7r, (9.126) 


et pour la norme supremum, la sphère de rayon r a pour équation 


max{|x|,|yl} = r. (9.127) 
Elles sont dessinées sur la figure 9.1 
n 4 n 
IN + 
> à > nr i > 
pabelFigLesé HeresssLabBASehFigLesSpleresésL aHalSaitFigl espere 


(a) La sphère unité pour la (b) La sphère unité pour la (c) La sphère unité pour la 
norme ||.|1 norme |.|2 norme |.| 


FIGURE 9.1: Les sphères de rayon 1 pour les trois normes classigéSrigLesSpheres 


A 
PropBoitPtLoin 


Proposition 9.48. 
Soient V un espace vectoriel normé, a dans V et x tel que d(a,x) = r, c'est-à-dire x € S(a,r). 
Dans ce cas, toute boule centrée en x contient un point P tel que d(P, a) > r et un point Q tel que 


HO EE Tr 


Démonstration. Soit une boule de rayon 6 autour de x. Le but est de trouver un point P tel que 
d(P, a) > r et d(P, x) < 6. Pour cela, nous prenons P sur la même droite que x (en partant de a), 
mais juste « un peu plus loin », comme sur la figure suivante : 
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Plus précisément, nous considérons le point 
P=x+— (9.128) 
= x+— ; 
N 


oùv=x—aet N est suffisamment grand pour que d(x, P) soit plus petit que 6. Cela est toujours 
possible parce que 


d(P,x) = |P — x| 


ul 
.12 
(9.129) 


peut être rendu aussi petit que l’on veut par un choix approprié de N. Montrons maintenant que 
d(a; P) > d\a;%) : 
U 
d(a, P) = |a— x — — 
G@P)=|a-s- À 
a x | 
NON (9.130) 
= |(1+ LJ(a- 0) 
N 


= |a—zx+ 


> [la — x] = d(a,x). 


Nous laissons en exercice le soin de trouver un point Q tel que d(Q, a) < r et d(Q,x) < 6. 


9.5.2 Ouverts, fermés, intérieur et adhérence 


Définition 9.49. 
Soit (V,||.]|) un espace vectoriel normé et À, une partie de V. Un point a est dit intérieur à À si 
il existe une boule ouverte centrée en a et contenue dans À. 

On appelle l’intérieur de À l’ensemble des points qui sont intérieurs à A. Nous notons Int(A) 
l’intérieur de À. 


Notons que Int(A) € À parce que si a € Int(A), nous avons B(a,r) € À pour un certain r et 
en particulier a € À. 


Exemple 9.50. 
Trouver l’intérieur d’un intervalle dans R consiste à « ouvrir là où c’est fermé ». 


(1) Int ([0,1[) = J0, 1. 
Prouvons d’abord que |0,1[ € Int([0,1[). Si a € ]0,1[, alors a est strictement supérieur à 
0 et strictement inférieur à 1. Dans ce cas, la boule de centre a et de rayon te est 


contenue dans ]0,1[ (voir figure 9.2). Cela prouve que a est dans l’intérieur de [0,1{. 


FIGURE 9.2: Trouver le rayon d’une boule autour de a. Une boule qui serait centrée en a avec un 
rayon strictement plus petit à la fois de a et de 1 — a est entièrement contenue dans le segment 


10, 1f. LabelFiglntervalleUn 


Prouvons maintenant que Int ([0,1[) & ]0,1[. Vu que l’intérieur d’un ensemble est inclus dans 
l’ensemble, nous savons déjà que Int ([0, 1[) € [0,1[. Nous devons donc seulement montrer 
que 0 n’est pas dans l’intérieur de [0,1[. C’est le cas parce que toute boule du type B(0,r) 
contient le point —r/2 qui n’est pas dans [0,1{. 
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(2) Int (I0, of) — ]0, of. 


(3) Int (]2,3[) = ]2,31. 
a 
ExemplelntBoules 


Exemple 9.51. 
Les intérieurs des boules et sphères sont importantes à savoir. 

(1) Int (B(a,r)) = Bar). Six e B(a,r), nous avons d(a,x) < r. Alors la boule B(x,r—d(x, a)) 
est incluse à B(a,r), et donc x est dans l’intérieur de B(a,r). Conseil : faire un dessin. 

(2) Int (B(a,r)) = B(a,r). Par le point précédent, la boule B(a,r) est certainement dans l’in- 
térieur de la boule fermée. Il reste à montrer que les points de B(a,r) qui ne sont pas dans 
B(a,r) ne sont pas dans l’intérieur. Ces points sont ceux dont la distance à a est égale à r. 
Le résultat découle alors de la proposition 9.48. 

(3) Int (S(a,r)) = G. Si x € S(a,r), toute boule centrée en a contient des points qui ne sont pas 
à distance r de a. 

Notez que la sphère est un exemple d’ensemble non vide mais d'intérieur vide. 
A 


Définition 9.52. 
Une partie À de l’espace vectoriel normé (V,|.]) est dite ouverte si chacun de ses points est 
intérieur. La partie À est donc ouverte si A € Int(A). Par convention, nous disons que l’ensemble 
vide @ est ouvert. 

Une partie est dite fermée si son complémentaire est ouvert. La partie À est donc fermée si 
V\A est ouverte. 


Remarque : un ensemble À est ouvert si et seulement si Int(A) = A. 


Définition 9.53. 
Une partie À de l’espace vectoriel normé V est dite compacte si elle est fermée et bornée. 


Nous verrons tout au long de ce cours que les ensembles compacts, et les fonctions définies sur 
ces ensembles ont de nombreuses propriétés agréables. 
ExempleFermelntevrR 
Exemple 9.54. 
En ce qui concerne les intervalles de KR, 
— ]1,2[ est ouvert; 
— [3,4] est fermé ; 
— [5,6[ n’est ni ouvert ni fermé; 
Les intervalles fermés de R sont toujours compacts. A 
PropTopologieAx 
Proposition 9.55. 
Soit V un espace vectoriel normé. 
(1) L'ensemble V lui-même et le vide sont à la fois fermés et ouverts. 
(2) Toute union d’ouverts est ouverte. 


(3) Toute intersection finie d’ouverts est ouverte. ItemPropTopologieAxiv 


(4) Le vide et V sont les seules parties de V à être à la fois fermées et ouvertes. 


Démonstration. L’ingrédient principal de cette démonstration est que si a est un point d’un ouvert 
©, alors il existe une boule autour de a contenue dans © parce que a doit être dans l’intérieur de 


O. 


, ? " 

(1) Nous avons déjà dit que, par définition, l’ensemble vide est ouvert. Cela implique que V 
lui-même est fermé (parce que son complémentaire est le vide). De plus, V est ouvert parce 
que toutes les boules sont inclues à V. Le vide est alors fermé (parce que son complémentaire 
est V). 
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(2) Soit une famille (O;);ez d’ouverts ?#, et l’union 


O=|Jox:. (9.131) 


iel 


Soit maintenant a € ©. Nous devons prouver qu'il existe une boule centrée en a entièrement 
contenue dans ©. Étant donné que a € ©, il existe à € I tel que a € O; (c’est-à-dire que 
a est au moins dans un des ©;). Par hypothèse l’ensemble ©; est ouvert et donc tous ses 
points (en particulier a) sont intérieurs; il existe donc une boule B(a,r) centrée en a telle 
que B(a,r) c O; € ©. 


(3) Soit une famille finie d’ouverts (Ox)ge{1..ny, et a € O où 
G= flo: (9.132) 
k=1 


Vu que a appartient à chaque ouvert O4, nous pouvons trouver, pour chacun de ces ouverts, 
une boule B(a,rx) contenue dans ©. Chacun des r% est strictement positif, et nous n’en 
avons qu'un nombre fini, donc le nombre r = min{r1,...,r,} est strictement positif. La 
boule B(a,r) est inclue dans toutes les autres (parce que B(a,r) € B(a,r’) lorsque r < r’), 
par conséquent 


B(a,r) € [] B(a,rx) € (] © = 0, (9.133) 
k=1 k=1 


c'est-à-dire que la boule de rayon r est une boule centrée en a contenue dans ©, ce qui fait 
que a est intérieur à ©. 


(4) Nous acceptons ce point sans démonstration. 


La proposition dit que toute intersection finie d’ouvert est ouverte. Il est faux de croire que 
cela se généralise aux intersections infinies, comme le montre l’exemple suivant : 


(-Z | = {0}. (9.134) 


i=1 


Chacun des ensembles ]—+, 2[ est ouvert, mais le singleton {0} est fermé (pourquoi ?). 
Nous reportons à la proposition 1.444 la preuve du fait que tout ensemble borné de R possède 


un infimum et un supremum. 


Définition 9.56. 

L'ensemble des ouverts de V est la topologie de V. La topologie dont nous parlons ici est dite 
induite par la norme |.| de V (parce que cette norme définit la notion de boule et qu’à son tour la 
notion de boule définit la notion d’ouverts). Un voisinage de a dans V est un ensemble contenant 
un ouvert contenant à. 


Il existe de nombreuses topologies sur un espace vectoriel donné, maïs certaines sont plus 
fameuses que d’autres. Dans le cas de V = IR”, la topologie usuelle est celle induite par la 
norme euclidienne. Lorsque nous parlons de boules, de fermés, de voisinages ou d’autres notions 
topologiques (y compris de convergence, voir plus bas) dans R”, nous sous-entendons toujours la 
topologie de la norme euclidienne. 


Exemple 9.57. 
Les ensembles suivants sont des voisinages de 3 dans R : 


Eu 11,5f; 


24. L'ensemble 7 avec lequel nous « numérotons » les ouverts O; est quelconque, c’est-à-dire qu’il peut être N, R, 
R" ou n'importe quel autre ensemble, fini ou infini. 
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— [0,10]: 
1h 
Les ensembles suivants ne sont pas des voisinages de 3 dans R : 
— ]13[; 
LUE 
— 10,513}. 


Proposition 9.58. 
Dans un espace vectoriel normé, 


(1) toute intersection de fermés est fermée ; 
(2) toute union finie de fermés est fermée. 


Encore une fois, l'hypothèse de finitude de l'intersection est indispensable comme le montre 
l'exemple suivant : 


ÜI Li =] Lil. (9.135) 


Chacun des intervalles dont on prend l’union est fermé tandis que l’union est ouverte. 
LEMooHPQTooHKdoïiL 


Lemme 9.59. 
Soit À, une partie de l’espace vectoriel normé V. Un point a e V est adhérent” à À dans V si et 
seulement si pour tout € > 0, 

B(a,£)n A £@. (9.136) 


Un point peut être adhérent à À sans faire partie de À, et nous avons toujours À € Adh(A). 
EXo01ICLBooJZzQFNY 
Exemple 9.60. 


La terminologie « fermeture » de À pour désigner À provient de deux origines. 


(1) L'ensemble À est le plus petit fermé contenant A. Cela signifie que si B est un fermé qui 
contient À, alors À € B. Cela est fondamentalement le sens de la définition 7.19. 


(2) Pour les intervalles dans R, trouver À revient à fermer les extrémités qui sont ouvertes, 
comme on en a parlé dans l’exemple 9.54. 


A 


Exemple 9.61. 

Dans R, l’infimum et le supremum d’un ensemble sont des points adhérents. En effet si M est le 
supremum de À C R, pour tout €, il existe un a € À tel que a > M — €, tandis que M > a. Cela 
fait que a € B(M,€), et en particulier que pour tout rayon €, nous avons B(M,€) n À £ @. 


Le même raisonnement montre que l’infimum est également dans l’adhérence de À. A 
ParlerEncoredeF 


Exemple 9.62. 

Il ne faut pas conclure de l’exemple précédent qu’un point limite ou adhérent est automatiquement 
un minimum ou un maximum. En effet, si nous regardons l’ensemble formé par les points de la 
suite tn = (—1)"/n, le nombre zéro est un point adhérent et une limite, mais pas un infimum ni 
un maximum. A 


Lemme 9.63. L 
Si B est une partie fermée de V, alors B = B. 


Démonstration. Supposons qu'il existe a e B tel que a # B. Alors il n’y a pas d’ouverts autour de 
a qui soit contenu dans CB. Cela prouve que CB n’est pas ouvert, et par conséquent que B n’est 


25. Définition 7.19. 
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pas fermé. Cela est une contradiction qui montre que tout point de B doit appartenir à B lorsque 
B est fermé. 


Exemple 9.64. 
Au niveau des intervalles dans KR, prendre l’adhérence consiste à « fermer là où c’est ouvert ». 
Attention cependant à ne pas fermer l’intervalle en l'infini. 


(1) [0,2f = [0,21]. 

(2) 13,c0f = [3, of. 
Si au lieu de travailler dans R, vous travaillez dans une extension comme le compactifié d’Alexan- 
drov R (définition 7.98) ou dans la droite réelle achevée (définition 12.27), vous devez un peu 


réfléchir avant de décider si il faut fermer les intervalles en + ou en w. Bref, ne faites rien 


mécaniquement et posez vous des questions de topologie quand vous cherchez des fermetures. A 
PROPooEURXooHHpkhd 


Proposition 9.65. 
Soit V un espace vectoriel normé et a € V. Les trois conditions suivantes sont équivalentes : 


(1) ae À; 
(2) il existe une suite d'éléments xn dans A qui converge vers a ; 
(3) d(a, À) = 0. 


Notez que dans cette proposition, nous ne supposons pas que a soit dans À. 
PropComlelntBar 


Proposition 9.66. 
Pour toute partie À d’un espace vectoriel normé nous avons 


(1) V\A = Int(V\4), 
(2) V\Int(A) = V\A. 


En utilisant les notations du complémentaire (1.1.5), les deux points de la proposition se ré- 
crivent 


(1) CÀ = Int(CA), 
(2) CInt(4) = CA. 


ItemLemPropComplementiv 


Démonstration. Nous avons a € V\A si et seulement si a # À. Or ne pas être dans À signifie qu’il 
existe un rayon € tel que la boule B(a, €) n’intersecte pas A. Le fait que la boule B(a, €) n’intersecte 
pas À est équivalent à dire que B(a,£) € V\A. Or cela est exactement la définition du fait que a 
est à l’intérieur de V\A. Nous avons donc montré que a € V\A si et seulement si a € Int(V\A). 
Cela prouve la première affirmation. 

Pour prouver la seconde affirmation, nous appliquons la première au complémentaire de À : 
C(CA) = Int(CCA). En prenant le complémentaire des deux membres nous trouvons successivement 


cc(CA) = or (9.137) 


ce qu'il fallait démontrer. 


Attention à ne pas confondre CA et CA. Ces deux ensembles ne sont pas égaux. En effet, en 
tant que complément d’un fermé, l’ensemble CA est certainement ouvert, tandis que, en tant que 
fermeture, l’ensemble CA est fermé. Pouvez-vous trouver des exemples d’ensembles À tels que 


CA=CA? 
PROPooRAZUooVMxPic 


Proposition 9.67. 
Soient À et B deux parties de l’espace vectoriel normé V. 
(1) Pour les inclusions, si AC B, alors Int(A) € Int(B) et Ac B. 


(2) Pour les unions, ALB=AUBet An BC AnB. 
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(3) Pour les intersections, Int(A) n Int(B) = Int(A n B) et Int(A) L Int(B) € Int(A L B). 


Démonstration. (1) Si a est dans l’intérieur de À, il existe une boule autour de a contenue dans 
A. Cette boule est alors contenue dans B et donc est une boule autour de a contenue dans 
B, ce qui fait que a est dans l’intérieur de B. Si maintenant a est dans l’adhérence de À, 
toute boule centrée en a contient un élément de À et donc un élément de B, ce qui prouve 
que a est dans l’adhérence de B. 


(2) Nous avons À € A LU B et donc, en utilisant le premier point, À € AU B. De la même 
manière, B € A B. En prenant l'union, AU Bc AU B. 
Réciproquement, soit a e À LU B et montrons que a € À L B. Supposons par l'absurde que a 
ne soit ni dans À ni dans B. Il existe donc des rayons e1 et €2 tels que 


B(a,=1)n A=@g, 


B(a,e2) n B = @. Feel 


En prenant r = min{e,€2}, la boule B(a,r) est inclue aux deux boules citées et donc 
n’intersecte ni À ni B. Donc a & À L B, d’où la contradiction. 


(3) Si nous appliquons le second point à CA et CB, nous trouvons 


CAvtB =CAUCE. (9.139) 


En utilisant les propriétés du lemme 1.28, le membre de gauche devient 


CAUTB = An B)=CInt(AnB), Fa27OT SERGE 
tandis que le membre de droite devient 
CA UTP = Cint(4) U CInt(4) = C( Int(4) n Int(B)). ns Er 


En égalisant le membre de droite de (9.140) avec celui de (9.141) et en passant au complé- 
mentaire nous trouvons 


Int(A n B) = Int(A) nInt(B), (9.142) 


comme annoncé. 
La dernière affirmation provient du fait que Int(A) € Int(AU B) et de la propriété équivalente 
pour B. 


Remarque 9.68. 

Nous avons prouvé que À n B € An B. Il arrive que l'inclusion soit stricte, comme dans l'exemple 
suivant. Si nous prenons À = [0,1] et B = ]1,2], nous avons AN B = G et donc An B = G. Par 
contre nous avons À n B = {1}. 


Définition 9.69. 
La frontière d’un sous-ensemble À de l’espace vectoriel normé V est l’ensemble des points a € V 
tels que 

B(a;,r) 6 À £ ©, 


B(a,r) n CA #4 Z, FM 


pour tout rayon r. En d’autres termes, toute boule autour de a contient des points de À et des 


points de CA. La frontière de À se note OA. 
PropDescFrpbsmlI 


Proposition 9.70. 
La frontière d’une partie À d’un espace vectoriel normé V s'exprime sous la forme 


OA = A\Int(4). (9.144) 
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Démonstration. Le fait pour un point a de V d’appartenir à À signifie que toute boule centrée en 
a intersecte A. De la même façon, le fait de ne pas appartenir à Int(A) signifie que toute boule 
centrée en a intersecte CA. 


La description de la frontière donnée par la proposition 9.70 est celle qu’en pratique nous 
utilisons le plus souvent. Dans certains textes, elle est prise comme définition de la frontière. 


Lemme 9.71. 
La frontière de À peut également s'exprimer des façons suivantes : 


0A = AnCInt(4) = AnCA, (9.145) 


Démonstration. En partant de 0A = A\Int(A), la première égalité est une application de la 
propriété (2) du lemme 1.28. La seconde égalité est alors la proposition 9.66. 


Exemple 9.72. 
Dans R, la frontière d’un intervalle est la paire constituée des points extrêmes. En effet 


O[a, b[= [a,b[\Int ([a, b[) = [a, b]\]a, b[ = {a, b}. (9.146) 


Toujours dans R nous avons 


ÔR = R\Int(R) = R\R = @, (9.147) 
et 
0Q = Q\Int(Q) = R\Z = R. (9.148) 
A 
Exemple 9.73. 
Dans IR”, nous avons 
0B(a,r) = 8B(a,r) = S(a,r). (9.149) 


Cela est un boulot pour la proposition 9.48. Si x € S(a,r) alors tout boule autour de x contient 
des points à distance strictement plus grande et plus petite que d(a, x), c'est-à-dire des points dans 
B(a,r) et hors de B(a,r). Cela prouve que les points de S(a,r) font partie de 0B(a,r), c'est-à-dire 
que S(a,r) & 8B(a,r); et idem pour B(a,r). 

Pour prouver l'inclusion inverse, soit x € 0B(a,r). Vu que toute boule autour de x contient 
des points intérieurs à B(a,r), pour tout € > 0, d(a,x) — € < r, c’est-à-dire que d(a, x) < r. De la 
même manière toute boule autour de x contient des points hors de B(a,r) signifie que pour tout 
€, d(a,x) +e > r ou encore que d(a,x) > r. Nous avons donc d(a,x) = r. A 


Remarque 9.74. : 
Il serait toutefois faux de croire que 0A = OA pour toute partie À de R". En effet si À = R\{0} 
nous avons OA = {0} et A=R, donc 0A = G. 


9.5.3 Point isolé, point d’accumulation 
LEMooOUMVNooVB1QMD 


Lemme 9.75. 
Soit un espace vectoriel normé V ainsi qu’une partie D de V. 


(1) Un point a € D est dit isolé dans D relativement à V si il existe un € > 0 tel que 
B(a,e) n D = {a}. (9.150) 
(2) Un point a € V point d’accumulation?T de D si pour tout € > 0, 


(B(a.c)\{a}) nD2@. (9.151) 
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(e) P 
Q @ 


FIGURE 9.3: L'ensemble décrit par l’équation (9.152). Le point P est un point isolé de D, tandis 
que les points $ et Q sont des points d’accumulation. LabelFigAccumulationlsole 


Exemple 9.76. 
Considérons la partie suivante de IR? : 


D = {(x,y) tel que x? + y? < 1} LU {(1,1)}. Fa2807Bo 415 


Comme on peut le voir sur la figure 9.3, le point P = (1,1) est un point isolé de D parce qu’on 
peut tracer une boule autour de P sans inclure d’autres points de D que P lui-même. Le point 
Q = (—-1,0) est un point d’accumulation de D parce que toute boule autour de Q contient des 
points de D. 

Le point $, étant un point intérieur, est un point d’accumulation : toute boule autour de S 
intersecte D. 

Notez cependant que le point Q lui-même n’est pas dans D parce que l’inégalité qui définit D 
est stricte. PA 


Remarque 9.77. 
À propos de la position des points d’accumulation et des points isolés. 


(1) Les points intérieurs sont tous des points d’accumulation. 
(2) Les points isolés ne sont jamais intérieurs. 


(3) Certains points d’accumulation ne font pas partie de l’ensemble. Par exemple le point 1 est 
un point d’accumulation de E = ]0,1|. 


(4) Les points de la frontière sont soit d’accumulation soit isolés. 


Exemple 9.78. 
Tous les points de R sont des points d’accumulation de À parce que dans toute boule autour d’un 
réel, on peut trouver un nombre rationnel. PA 


Remarque 9.79. 
L'ensemble des points d’accumulation d’un ensemble n’est pas exactement son adhérence. En effet, 
un point isolé dans À est dans l’adhérence de À, mais n’est pas un point d’accumulation de A. 


9.5.4 Des exemples 
ItemExoEVN3i 


Exemple 9.80. 
Nous considérons l’ensemble. 


A = {(&,y)eR°| 27-57 +6 < y < 2}. (9.153) 


Si un point (x,y) € R? est tel que x? — 5x +6 < y, alors dans une boule centrée en (x, y) (de rayon 
r1), l'inégalité reste vraie (parce que la fonction x? — 5x + 6 — y est une fonction continue). De la 
même manière, si nous avons y < 2 en (x, y), alors nous avons encore l’inégalité dans une boule de 
rayon r2. En prenant r = min{r1,r2}, les deux inégalités restent vraies dans la boule de rayon r. 
Donc les points (x,y) tels que x? — 5x +6 < y < 2 sont dans l’intérieur de A1. 
Pour les mêmes raisons, autour d’un point (x, y) tel que x? — 5x +6 > y, nous pouvons trouver 
une boule dans laquelle l'inégalité reste stricte. Ces points ne sont donc pas dans l’adhérence de 


26. Définition 7.31. 
27. Définition 7.30. 
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A1. Un point qui vérifie 4? — 5x + 6 = y = 2 est par contre dans l’adhérence parce que dans toute 
boule, on pourra trouver un x tel que x? — 5x + 6 < y, et un y. L’adhérence est donc donnée par 
les inéquations 

A=2-57+6<y<2. (9.154) 


La frontière est donnée par les points de l’adhérence qui ne sont pas dans l’intérieur de A:. 
Attention : ne pas dire que la frontière est alors donnée simplement en remplaçant les inégalités 
par des égalités : A1 = x? — 5x + 6 = y = 2. Quel est cet ensemble ? 

Trouver la frontière demande un peu plus de travail. Le point marqué sur la figure 9.4 est sur 
la frontière parce que toute boule intersecte l’intérieur et l’extérieur. Cela est dû au fait que, sur 
ce point, nous ayons æ? — 5x + 6 = y en même temps que y < 2. Donc si on prend une boule assez 
petite, on conserve y < 2, mais on obtient des points tels que x? — 5x + 6 < y. 

En voyant le dessin, la chose à faire pour écrire la frontière est de trouver les deux points 
d’intersection entre la parabole et la droite horizontale. Ces points sont les points (x, y) qui satisfont 
au système 


a —5x+6—7 (9.155) 
y = 2. (9.155b) 


En substituant la seconde équation dans la première, il vient x? — 5x + 6 = 2, ce qui nous donne à 
résoudre le polynôme du second degré x? — 5x + 4 = 0. Les éventuelles solutions entières sont les 
diviseurs de 4. Par chance *, on voit que x = 1 et x = 4 sont des solutions. Le théorème 3.127 nous 
assure qu’il n’y à pas d’autres racines. Les deux points d’intersection sont les points P = (1,2) et 
Q = (4,2). Les points de la frontière de A; sont donc donnés par 


OA = {(x,y) € R? tels que 2? —-57+6—=yet1<zx<4} 


9.156 
U {(x,y) € R° tels que y = 2 et 1 < x < 4}. ) 


FIGURE 9.4: En hachuré : l’intérieur ; en trait plein : la frontière. L’adhérence est l’union des deux. 
Exemple9.80. LabelFigAdhIntFr 


Notez que les points de la parabole qui sont sur la frontière ne font pas partie de l’ensemble 
À; lui-même, tandis que ceux de la frontière qui sont sur la droite horizontale en font partie sauf 
(4,2) et (1,2). 

L'intérieur de À; n'étant pas égal à A1, cet ensemble n’est pas ouvert; de la même manière, 
vu que À # A1, l’ensemble n’est pas fermé. L'ensemble A1 est par contre borné parce qu’il est 
contenu par exemple dans la boule de centre (0,0) et de rayon 5. Les points d’accumulation de A; 


sont les points de sa fermeture. PA 
ItemExoEVN3ii 


Exemple 9.81. 
Nous étudions 
A2 = {(r,y)e R°|x+1< y < 2x}. (9.157) 


28. Sinon, il aurait fallu utiliser la proposition 10.110. 
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Pour les mêmes raisons que dans l'exemple 9.80 l’intérieur est donné par 
Int(A2) = x + 1 < y < 2x; (9.158) 


L’adhérence est donnée par 
A=xz+1<y< 27, (9.159) 


Pour la frontière, les deux droites dont il est question dans la définition de A2 (les droites y = +1 
et y = 2x) se coupent en x = 1 (refaire soi-même le dessin de la figure 9.5). Lorsque x < 1, les 
conditions x + 1 < y et y < 2x sont incompatibles : aucun point de A2 n’est dans la partie x < 1 
du plan. Lorsque x > 1, alors les points situés entre les deux droites font partie de 42. La frontière 
est donc donnée par ces deux droites pour x > 1. 

Étant donné que Int(A2) = 4», cet ensemble est ouvert (et donc pas fermé par la proposition 
9.55(4)). Il n’est par contre pas borné parce qu’il contient des point (x, y) avec des x arbitrairement 
grands. PA 


a cl 


FIGURE 9.5: Notez que le point d’angle fait partie de la frontière, mais pas de l’ensemble. Exemple 
9.81. LabelFigAdhIntFrDeux 


Proposition 9.82 ([270)). 
Tout partie de IR sans point d’accumulation est dénombrable. 


Démonstration. Soit une partie $S de R ne contenant pas de points d’accumulation. Pour chaque 
se S, il existe un €; > 0 tel que 
B(3,6)n$S = f{s}. (9.160) 


Rien ne garantit cependant que B(s,6,) n B(t,4) = @, alors que nous en aurons besoin pour la 
suite. 
Le nombre 
inf{|s — v| tel que ve S\{s}} (9.161) 


est au moins égal à €. et est don strictement positif. Nous posons 


inf {|s — v| tel que ve S\{s}} 
: : (9.162) 
et 


8 — B(3,rs). (9.163) 
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Nous avons maintenant 1, n 1, = G. Soit en effet u € I, n 14. Alors 


ks—t| <|s—ul +lu -t] (9.164a) 
£<Ts+t (9.164b) 
< 2r, (9.164c) 


où nous avons supposé r; > 74. Si ce n’est pas le cas, changer s et { dans ce qui suit ; les deux point 
ont des rôles symétrique. Nous avons donc 


inf {|s — v| tel que ve S\{s}} - |s —t| 


s—t| <2r; = 9.165 
ls 41 < 27, ; ; (9.165) 
Donc |s—t| =0et s=t. 

Cela pour dire que J, ne possède d’intersection avec 1, que si s = t. 

Nous définissons alors une application 

: S — 
7 ; (9.166) 
Sr qs 


où q; est un choix de rationnel dans 1,. C’est le lemme 1.424 qui nous permet de choisir un tel 
rationnel. 

La construction des intervalles /; garantit que 4 est une injection. Le fait qu’il existe une 
injection de À vers S et le fait que À est dénombrable impliquent que S est au plus dénombrable. 


9.6 Valeur propre et vecteur propre 


9.6.1 Généralités 


Nous savons qu’une application linéaire A: R° — IR est complètement définie par la donnée 
de son action sur les trois vecteurs de base, c’est-à-dire par la donnée de 


Ae, Ae2 et Àes. (9.167) 


La matrice d’une application À se forme en mettant simplement les vecteurs Ae:, Ae2 et Ae3 en 
colonne. Donc la matrice 


3 0 0 
EqE ] 
A= [0 0 1 REPAS TEE) 
0 1 O0 
3 0 
signifie que l’application linéaire À envoie le vecteur e; sur | 0 |, le vecteur e2 sur | 0 | et le 
0 1 
0 
vecteur e3 sur | 1 |. Pour savoir comment À agit sur n’importe quel vecteur, on applique la règle 
0 
de produit vecteur x matrice : 
1 2 3 LA T + 2y + 3z 
4 5 6|[y|l= |4r+5y+6z|. (9.169) 
7 8 9 z 7x + 8y + 9z 
Une chose intéressante est de savoir quelles sont les directions invariantes de la transformation 
1 
linéaire. Par exemple, on peut lire sur la matrice (9.168) que la direction | 0 | est invariante : elle 
0 


est simplement multipliée par 3. Dans cette direction, la transformation est juste une dilatation. 
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Afin de savoir si v est un vecteur d’une direction conservée, il faut voir si il existe un nombre À tel 
que Av = Àv, c’est-à-dire voir si v est simplement dilaté. 
L'équation Av = Àv se récrit (A — Al)v = 0, c’est-à-dire qu’il faut résoudre l’équation 


0 
(A=0 0 |. (9.170) 
0 


ù © 8 
I 


Nous savons qu’une telle équation ne peut avoir de solutions que si det(A — A1) = 0. La première 
étape est donc de trouver les À qui vérifient cette condition. 


9.6.2 Dans le vif du sujet 
DefooMMKZooVcskCc 


Définition 9.83. 

Soit un K-espace vectoriel E et un endomorphisme T': E — E. Un vecteur propre de T est un 

vecteur v £ 0 tel que T(v) = Av pour un certain À € K. Dans ce cas, À est la valeur propre de v. 
L'espace propre de T pour la valeur °° est l’ensemble des vecteurs propres de T' pour la 

valeur propre À, et le vecteur nul. 


Définition 9.84. 
L'ensemble des valeurs propres de l’endomorphisme T est son spectre et est noté Spec(T). 


Remarque 9.85. 
Le nombre zéro peut être une valeur propre; c’est le vecteur zéro qui ne peut pas être vecteur 


propre. La matrice nulle est une matrice diagonalisable. 
LEMooWHWUooFFX1ZT 


Lemme 9.86 ([271)). 
Le spectre d’une matrice est égal au spectre de sa transposée : Spec(T') = Spec(T!). 


Démonstration. Nous savons que T est inversible si et seulement si T* l’est parce que si TS = 1 
alors SÈTt = 1. Nous avons équivalence entre les énoncés suivants : 

— est une valeur propre de T 

— il existe v tel que (T — Al)v = 0 

— T — À n’est pas inversible 

— (Tt— \1) n’est pas inversible 

— il existe w tel que T'w = Aw. 


— Xest valeur propre de T*. 


LemjcztYH 
Lemme 9.87. 
Soient un espace vectoriel E, un endomorphisme T € End(ÆE), ainsi que ses sous-espaces propres 
{Ex} xeSpec(r)- Toute somme finie de la forme 


E\, + 464 8%, (9.171) 
est directe. 


Démonstration. Nous utilisons le lemme 4.140. Soient v; e E\, un choix de vecteurs tels que 


— ENooROAXOOPpEEET 


29. Nous laissons au lecteur le soin de vérifier que c’est bien un sous-espace vectoriel de E. 
30. Définition 4.138. 
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Soit un entier j9 entre 1 et p. Nous allons montrer que v;, = 0. Pour cela nous remarquons d’abord 
que, pour tout à # jo, 
E GVPY P 
[IG - 2) = 0. ERP GREEN 
k#Æjo 


Nous appliquons l'opérateur [[,,,, (1 — Ax1) à l'égalité (9.172) : 


© 
I 
M 
E 
> 
L 
= 


& 
Il 
en 
a 
# 
S. 
S 


(9.174a) 
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# 
es: 
[e] 


Justifications. 


— Pour (9.174b). Pour chaque k et à nous avons (T — Àz)u; = Tu; — Àgu; = Àju; — Agu; parce 
que v; est un vecteur propre de T' pour la valeur propre À;. 


— Pour (9.174c). Dans la somme, seul le terme à = j0 est non nul, à cause de (9.173). 


Donc vi, = 0 parce que le produit [ [,,,, (A5 — A4), lui, est non nul. 


9.7 Polynômes d’endomorphismes 
SECooUEQVooLBrRiE 
Soit À un anneau commutatif et K, un corps commutatif. L’injection canonique À —+ A[X| se 
prolonge en une injection 


M(A) — M(A[X]). (9.175) 
9.7.1 Polynômes d’endomorphismes 
Soit u € End(Æ) où E est un K-espace vectoriel. Nous considérons l’application 
pu: K[X] — End(E) EqOVKoggM ar 
Pr P(u). | 


L'image de w, est un sous-espace vectoriel. En effet si À = 4,(P) et B = v4(Q), alors À + B = 
Pu(P + Q) et ÀA = (AP)(u). En particulier c’est un espace fermé. 
Soit u un endomorphisme d’un K-espace vectoriel Æ et P, un polynôme. Nous disons que P 
est un polynôme annulateur de u si P(u) = 0 en tant qu'endomorphisme de Æ. 
LemQWvhYb 


Lemme 9.88. 
Si P et Q sont des polynômes dans K[X] et si u est un endomorphisme d’un K-espace vectoriel 
E, nous avons 


(PQ)(u) = P(u) o Q(u). (9.177) 
Démonstration. Si P = Y;;a;X° et Q = pe b;X1, alors le coefficient de XF dans PQ est 


abg_} . Eacoetfr yes, 


Par conséquent (PQ)(u) contient Y, &bx_qu*. Par ailleurs P(u) o Q(u) est donné par 


» aju? > bn) EE > abju TT (x). (9.179) 
ï j m 


Le coefficient du terme en u* est bien le même que celui donné par (9.178). 
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ThoDecompNoyayzzMWod 
Théorème 9.89 (Décomposition des noyaux ou lemme des noyaux|[272]). 
Soit u un endomorphisme du K-espace*! vectoriel E. Soit P € K[X] un polynôme tel que P(u) = 
0. Nous supposons que P s’écrive comme le produit P = P1...P, de polynômes deux à deux 
étrangers *?. Alors 


(1) 


E = ker Pi(u) ®...@ker Ph(u). (9.180) 

(2) En posant Qi = IL P;, d existe des polynômes R; tels que R1Q1 +. “rie BP hPvxux; 
(3) Les projecteurs sur ker (P;(u)) sont donnés par 

PTO Jker(P;(ù)) — (RiQi)(u). (9.181) 


Démonstration. Dans ce qui suit, nous allons beaucoup utiliser le fait que K[X] soit commutatif 
(lemme 1.357). Nous posons 


= []2: (9.182) 


JA 
(1) Utilisation de Bézout 


Par le lemme 6.48 ces polynômes sont étrangers entre eux et le théorème de Bézout (théo- 
rème 6.47) donne l'existence de polynômes R; tels que 


RO +R OT EnooMMCVoofz} ps 


(2) Une première somme, pas directe Si nous appliquons cette égalité à uw et ensuite à 
x € E nous trouvons 

. EqaVcpU 

D RQDe) = = aa 


et en particulier si nous posons E; = Image (R;Qi(u)) nous avons 


BYE (9.185) 


Cette dernière somme n’est éventuellement pas une somme directe. 


(3) Q:Q; est multiple de P Sii j, en utilisant la commutativité de K[X1], 


QiQ; = (TI) (IA) - (IA) » (r1») - LEE SiÿP, (9.186) 


ki 1£j le l£j a 


où S;; est un polynôme. Nous voyons que Q:;Q; est multiple de P. 


(4) Une somme directe Toujours avec à £ j, en utilisant le lemme 9.88, 


(RiQ:)(u) o (R;Q;)(u) = (RiQ:R;Q;)(u) = (RiR; QiQ; )(u) = (RiR;S:;;}(u) o P(u) = 0 


=S;;P 


(9.187) 
Nous pouvons voir Æ comme un K-module et appliquer le théorème 1.337. Les opérateurs 
R;Q;(u) ont l'identité comme somme et sont orthogonaux, et nous avons donc la décompo- 


sition en somme directe : L 
E = PRiQi(u)E. FQooJPALoonfeez 
i=1 


31. Le corps K est commutatif comme tous les corps dans le Frido. 
32. Définition 3.108. 
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(5) R;Qi(u)E € ker P;(u) Attention : utilisation massive du lemme 9.88. Un élément de R;Q;(u)E 
est de la forme (R;Q;)(u)x avec x € E. Nous appliquons l’endomorphisme P;(u) à cet élément, 
et nous vérifions que nous obtenons zéro : 


Pi(u)((RQ:)(u)x) = (P:RiQi)(u)x (9.189a) 
= (Ri PQ: \(u)x (9.189b) 
=P 
= (RiP)(u)x (9.189c) 
= (Ri(u)o P(u) }x (9.1894) 
=0 
= 0. (9.189e) 


Par conséquent Image(R;Q;(u)) € ker P;(u). 


(6) Et la somme qu’il nous fallait Le fait que la somme (9.188) soit directe n’est en fait pas 
crucial. En effet, vu que chacun des termes est inclus dans ker P;(u), nous avons la somme 
(pas directe à priori) 


Ê= 5 RiQi(u)E € ÿ ker P;(u). (9.190) 
= 


À = 


Mais cette fois, nous prouvons qu'elle est directe en utilisant la caractérisation du lemme 
4.140(4). Supposons que, pour un certain k, 


€ ker PK(u) n ( > ker P;(u)). (9.191) 
j#k 
Nous allons montrer que x = 0. 


(6a) Qi(u)x =0 sii£k Siik, nous avons 


Qilu)x = du P;)Pi(u)r = 0 (9.192) 
JA 
j#k 
parce que x € ker P(u). 
(6b) Qz(u)x = 0 Nous savons qu'il existe z € ker P(u) tel que x = Ÿ,,, 4. Nous avons 


alors 
Qu(u)x = (Te) Da=Y (TI 00)4 = (9.193) 
j£k L£k j£k 


l£k 


parce que parmi les P;(u) (j £ k), il y a Pj(u) qui annule 4. 


(6c) Et finalement Nous avons prouvé que Q;(u)x = 0 pour tout 4. La formule de Bézout 
(9.183) donne alors 


DE € Qu(u)r_0 = x (9.194) 


et donc x = 0. 


(7) Les projecteurs 


9.90. 

Ce résultat est utilisé pour prouver que toute représentation est décomposable en représentations 
irréductibles, proposition 16.10 ainsi que pour le théorème 9.213 qui dit que si le polynôme minimal 
d’un endomorphisme est scindé à racine simple alors il est diagonalisable. 


9.7. POLYNÔMES D'ENDOMORPHISMES 649 


CorKiSCkC 
Corolaire 9.91. 
Soit E, un K-espace vectoriel de dimension finie et f, un endomorphisme semi-simple dont la 
décomposition du polynôme minimal af en facteurs irréductibles sur K[X1 est ps = Mi +. Mer. 
Si Fest un sous-espace stable par f, alors 


F=— a M%(fPnF (9.195) 
=] 


Démonstration. Nous posons E; = ker M°*(f) et F; = E; n F. Les polynômes M" sont deux à 
deux étrangers et uf(f) = 0, donc le lemme des noyaux (9.89) s'applique et 


E-E@...@E. (9.196) 


Nous pouvons décomposer x € F en termes de cette somme : 
E | 
T=Li+'  +Tr PAT) 


avec x; € E;. Toujours selon le lemme des noyaux, les projections sur les espaces Æ; sont des 
polynômes en f. Par conséquent Fest stable sous toutes ces projections proj,: E — E;, et en 
appliquant proj, à (9.197), proj;(x) = x;. Puisque x € F, le membre de gauche est encore dans F 
et x; e En F. Nous avons donc 


T 
Fec@r. (9.198) 
i=1 


L’inclusion inverse est immédiate parce que F; € F pour chaque i. 


LemVISooHxMdbr 
Lemme 9.92. 
Si x est un vecteur propre de valeur propre À pour l’endomorphisme u et si P est un polynôme, 
alors x est vecteur propre de P(u) pour la valeur propre P(X). 


Démonstration. C’est un simple calcul de P(u)x en ayant noté P(X) = 355 cxX" : 


Piujzs = ÿ cut (x) = : cXx = P())x. (9.199) 
k=0 k=0 


9.7.2 Polynôme minimal et minimal ponctuel 


Nous avons déjà vu la définition de polynôme minimal en 6.64. Le lemme suivant permet de 


parler de polynôme minimal d’endomorphisme. 
LEMooEYPSooLCoP1Y 


Lemme 9.93 ([1]). 
Si E est un K-espace vectoriel, l’ensemble End(ÆE) des endomorphismes de E est une extension 


du corps K. 
LEMooQJQGooRcAxmJ 


Lemme 9.94. 
Soit un endomorphisme f: E — E d’un K-espace vectoriel de dimension finie. Il existe un unique 
polynôme annulateur unitaire de degré minimum". 


Tout endomorphisme de K-espace vectoriel de dimension finie possède un polynôme minimal*. 


33. En complète violation de ce qu’on disait dans 1.358. 
34. Degré minimum au sens où il existe peut-être d’autres polynômes annulateurs, mais ils seront de degré plus 
élevé. 


35. Définition 6.64. 
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Démonstration. Pour l’unicité, soient P et Q deux polynômes annulateurs de f de même degré 
minimum {V et ayant tous deux 1 comme coefficient de x". Alors P —Q est de degré N — 1 tout en 
étant encore annulateur. Vu que nous avions dit que N était le degré minimum, le seul polynôme 
annulateur de degré N — 1 est le polynôme nul. Donc P — Q = 0. 

Pour l'existence, les endomorphismes Id, f, f?, ...ne peuvent pas être tous linéairement indé- 
pendants parce que la dimension de End(E) est finie. Il existe donc un nombre N et des coefficients 
az tels que Es agf" = 0. Le polynôme P(X) = . a XF est donc annulateur de f. 

Une autre façon de le dire est que l’application linéaire 6: K[X] — End(Æ) donnée par (P) = 
P(f) est un endomorphisme d’un espace vectoriel de dimension infinie vers un espace vectoriel de 
dimension finie. Il ne peut donc pas être injectif et possède donc un noyau non réduit à zéro. 

L'existence d’un polynôme minimal est maintenant seulement dû au fait que, avec les notations 
de la définition 6.64, l'idéal 7}; n’est pas réduit à {0}. 


Remarque 9.95. 
La preuve donnée ci-dessus montre que deg(yu) < dim(Æ)?. Comme conséquence du théorème de 
Cayley-Hamilton 9.118 nous verrons qu’en réalité le degré du polynôme minimal est majoré par la 


dimension de l’espace. 
PROPooZCUSooLUUrxi 


Proposition 9.96 (Exemple en dimension infinie[1]). 
L’endomorphisme de dérivation sur l’espace des fonctions dérivables R — IR n’a pas de polynôme 
minimal. 


Dans la suite, l’endomorphisme f du K-espace vectoriel E de dimension n est fixé. Pour x € E 
nous notons 


Ey = {P(f}x tel que P e K[X]}. EgooOAYDooRpzEEe, 
Nous considérons le morphisme d’algèbres 


p: K[X] — End(E) 


(9.201) 
P+ P(f) 
et si x € E est donné nous considérons le morphisme de IK-espaces vectoriels 
.: KIX] — E 
Pa: KIX] (9.202) 
Pr P(f)x. 


Les noyaux de ces applications sont des idéaux, entre autres par le lemme 9.88. Ils ont donc un 
unique générateur unitaire (chacun) par le théorème 6.43. En termes de vocabulaire, l’ensemble 


ker(s) = {P e K|X] tel que P(f) = 0} (9.203) 


est l’idéal annulateur de f et un polynôme P tel que P(f) = 0 est un polynôme annulateur de 
: DEFooUICRooBGYhqQ 
Proposition-Définition 9.97. 
La partie ker(o+) est un idéal de K[X] qui possède un unique générateur unitaire. 

Le générateur unitaire de ker(w.) est le polynôme minimal ponctuel de f en x. Il sera noté 
Lx où x lorsque la dépendance en f est claire dans le contexte. 


Nous notons y le générateur unitaire du noyau de 4 et u, celui de w4. Puisque y € ker(w) 


pour tout x nous avons y, | d pour tout x. 
ExooDTUJooIMqSKn 


Exemple 9.98 (Pas en dimension infinie). 
En dimension infinie, il n’y a pas toujours de polynôme annulateur. Si E est un espace vectoriel 
de dimension infinie ayant une base dénombrable {e;};en alors l'opérateur donné par f(e;) = e;1 
n’a pas de polynôme annulateur. Même pas ponctuel en quel que point que ce soit. 

De même l'opérateur donné par g(e1) = 0 et g(e;) = e;ÿ-1 si à Æ 1 n’a pas de polynôme 
annulateur, mais il a un polynôme annulateur ponctuel évident en x = e. L'exemple 15.90 donnera 
un habillage à peine subtil à cet exemple. A 
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PropAnnncEcCx; 
Proposition 9.99. 
Si P est un polynôme tel que P(f) = 0, alors le polynôme minimal uy divise P. Autrement dit, le 
polynôme minimal engendre l'idéal des polynômes annulateurs. 


Démonstration. L'ensemble ker(s) = {Q € K[X] tel que Q(f) = 0} est un idéal par le lemme 9.88. 
Le polynôme minimal de f est un élément de degré plus bas dans 7 et par conséquent 1 = (ur) 
par le théorème 6.43. Nous concluons que 7 divise tous les éléments de J. 


La proposition suivante permet de caractériser le polynôme minimal. 
PROPooVUJPooMzxzjE 


Proposition 9.100 ([128]). 
Soit une application linéaire f sur un K-espace vectoriel. Il existe un unique polynôme unitaire? 
PE K[X\| tel que 

(H PU)=0; 

(2) l'application 


6 


Cp End(E£) EQoo IBHDooWraEns 


est injective. 


Démonstration. En ce qui concerne l'existence, il existe le polynôme minimal de f qui satisfait les 
conditions. Pour l’unicité nous y travaillons maintenant. 

Supposons que l'application (9.204) soit injective. Alors pour tout Q € K[X] tel que Q(f) = 0 
nous avons Q = 0, c'est-à-dire Q = PR pour un certain À € K[X]. Autrement dit : P est un 
générateur unitaire de l’idéal annulateur de f. Le théorème 6.43(3) nous dit alors que P = y parce 
que u est également générateur unitaire. 


LemSYsJJ;j 
Lemme 9.101 ([273]). 
Soit f: E — FE un endomorphisme de l’espace vectoriel E. Il existe un élément x € E tel que 


Lipz = hf: 


Démonstration. Soit une décomposition en irréductibles du polynôme minimal y = Pÿ1...Per. 
Nous notons E; = ker LE (f Je Les polynômes P,; sont étrangers deux à deux (un diviseur commun 
aurait a fortiori été un diviseur et aurait contredit l’irréductibilité). Le lemme des noyaux 9.89 nous 
donne la somme directe . 

E = Œker (P*(f)). (9.205) 

i=1 
Si x; € E; alors u,, est une puissance de P;. En effet u,, | u et est donc un produit des puissances 
des P;. Or si (QP;)(f)x; = 0 alors (P;Q)(f)x; = 0, ce qui donne Q(f}xi € E; n E; = {0} si j # 1. 
Donc u,, n’est pas de la forme QP; pour j Æ à. Nous en déduisons que 4, est une puissance de 
P; dès que x; € Fi. Nous choisissons x; € E; tel que Lx, = PP. 
Nous posons enfin a = æ1 +--:+x,; par définition du polynôme annulateur 4,4, nous avons 


0 = po(fha = pol f}æ + °°° + ha(fr. EqgooVTGGoonf eur 


Mais La(f)ti € E;, et la somme des E; est directe, donc l’annulation de la somme (9.206) implique 
l'annulation de chacun des termes : t4(f)æ; = 0 pour tout t. Cela prouve que x, | da. Mais comme 
les 4, sont premiers deux à deux (parce que ce sont les P°"*), nous concluons que le produit divise 
encore la ! 


lié | Has (9.207) 
i=1 


c'est-à-dire y | 4. Comme nous avons aussi 4, | 4, nous déduisons 4, = Lu. 


36. À mon avis, « unitaire » manque dans [128]. 
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DEFooFEIFooNSGhQE 
Définition 9.102 (Matrices, endomorphismes et vecteurs cycliques). 
Une matrice est cyclique si elle est semblable à une matrice compagnon. Un endomorphisme 
fJ:E — E est cyclique si il existe un vecteur x € E tel que Ps est une base de E. 


Un vecteur ayant cette propriété est un vecteur cyclique pour f. 
LemAGZNNa 


Lemme 9.103. 
Soit E un espace vectoriel de dimension finie et un endomorphisme cyclique®" f de E. Soit un 
vecteur cyclique v de f, alors le polynôme minimal de f est égal au polynôme minimal de f au 


point v : Lf = Ufv 


Démonstration. Montrons que y, est un polynôme annulateur de f, ce qui prouvera que y} divise 
Lf par la proposition 9.99. Étant donné que v est cyclique, tout élément de E s'écrit sous la forme 
x = Q(f)v. Prenons un polynôme P annulateur de f en v : P(f)v = 0. Nous montrons que P est 
alors un polynôme annulateur de f. En effet, nous avons 


P(F)z = (P(F) o Q(P))v = (Q(P) © P(F))v = 0 (9.208) 


où nous avons utilisé le lemme 9.88. 


LEMooOUWDAooWPbPda 
Lemme 9.104 ([273]). 
Soit a € E un vecteur cyclique pour f, tel que a = u. Alors E, est un sous-espace stable par f 
pour lequel il existe un supplémentaire stable. 


Démonstration. Soit | = deg(u) = deg(y). L'espace E, étant engendré par les f*(a) nous savons 


que e1 = à, e2 = f(a),..., e = fl (a) forment une base de E,. Nous pouvons la compléter en une 
base {e1,...,e,} de E. Et nous posons 
G={xeE tel que e (f*(x)) = 0,Vk > 0} (9.209a) 
= () ker{eï o ff} (9.209b) 
k20 
1-1 
_ R ker(e* o f*). (9.209c) 
k=0 


La dernière égalité est due au fait que / soit le degré de y. Du coup f! est une combinaison linéaire 
des f° avec i < [1 — 1. 

Nous avons f(G) € Get de plus E, n G = {0} parce qu’un élément de Æ, est une combinaison 
linéaire d'éléments de la forme f/(a) (j < {). Après application de f!-}, ces éléments obtiennent 
une composante fl(a) = e. De plus Gest un sous-espace vectoriel du fait que ej © f' est une 
application linéaire. 

Montrons enfin que dim(G) = n — !. Pour cela nous remarquons que G est une intersection 
d’hyperplans, et nous montrons que les équations définissant ces hyperplans sont linéairement 
indépendantes. Soit donc 


DE (ce : fi) +) EqgooUHESoo ÿBQ 10) 


et montrons que À; = 0 pour tout j est l’unique solution. Soit x e E et appliquons l’opération 
(9.210) au vecteur f'(x); le résultat est zéro : 


-5a (ef o flo fi) = (ef o f')P(u) (9.211) 


37. Voir la définition 9.102. 
38. ici, comme presque partout, eÿ est le dual de ey, c’est-à-dire l’application linéaire sur E donnée par e” (e;) = x, 
voir la définition 4.126. 
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où nous avons posé P(X) = ur À X J, Appliquons cela à a : pour tout à nous avons 

(ef o f')(P(F)a) = 0. (9.212) 
Mais par définition de ÆE,, l'élément P(f)a est dans E,. Nous en déduisons que 

P(fjaeGnE, = {0}, (9.213) 


c’est-à-dire que P est un polynôme annulateur de a. Mais P est de degré { —1 alors que le polynôme 
minimal de a est de degré l. Par conséquent P = 0 et À; = 0 pour tout j. 


DEFooBOHVooSOopJN 
Définition 9.105. 
L’endomorphisme f d’un espace vectoriel est semi-simple si tout sous-espace stable par f possède 


un supplémentaire stable. 
LemrFINYT 


Lemme 9.106. 

Si le polynôme minimal d’un endomorphisme est irréductible, alors cet endomorphisme est semi- 
: 39 

simple”. 


Démonstration. Soit f, un endomorphisme dont le polynôme minimal est irréductible et F', un 
sous-espace stable par f. Nous devons en trouver un supplémentaire stable. Si F = E, il n’y a pas 
de problème. Sinon nous considérons u1 € E\F et 


Eu, = {P(f)w tel que Pe K[X]}, (9.214) 


qui est un espace stable par f. 
Montrons que E,, n F = {0}. Pour cela nous étudions l'idéal 


Lu, = {P € K[X] tel que P(f)ui = 0}. (9.215) 


C’est un idéal non réduit à {0} parce que le polynôme minimal de f par exemple est dans Z,,. Soit 
P,, un générateur unitaire de 1,,. Étant donné que y f € lu, nous avons P,, divise y1f et donc, 
Pu = Hy, parce que y} est irréductible par hypothèse. 

Soit y € Eu, NF. Par définition il existe P € K[X] tel que y = P(fju et si y Æ 0, cela 
signifie que P £ L,,, c’est-à-dire que P,, ne divise pas P. Étant donné que PA, est irréductible cela 
implique que P,, et P sont premiers entre eux (ils n’ont pas d’autre pgcd que 1). 

Nous utilisons maintenant des coefficient de Bézout (théorème 6.47) À, B € K[X] tels que 


AP + BP, = 1. (9.216) 


Nous appliquons cette égalité à f et puis à u1 : 


u = A(f) 0 P(fjui +B(f)° Pa (fjui = A(F)y. (9.217) 
ne —. 


Mais y € F, donc A(f)y € F. Nous aurions donc ui € F, ce qui est impossible par choix. Nous 
savons maintenant que l’espace E,,, @ Fest stable sous f. Si cet espace est Æ alors nous arrêtons. 
Sinon nous reprenons le raisonnement avec E,, @ F en guise de F et en prenant u2 € E\(E,, @F). 
Étant donné que E est de dimension finie, ce procédé s'arrête à un certain moment et nous aurons 


E=FOEu®...0Eu (9.218) 


où chacun des Z,,, sont stables. 
ThoFgsxCE 

Théorème 9.107. 

Un endomorphisme est semi-simple si et seulement si son polynôme minimal est produit de poly- 

nômes irréductibles distincts deux à deux. 


39. Définition 9.105. 


654 CHAPITRE 9. ESPACES VECTORIELS (ENCORE) 


Démonstration. Supposons que f soit semi-simple et que son polynôme minimal soit donné par 
us = Mi... MP" où les M; sont des polynômes irréductibles deux à deux distincts. Nous devons 
montrer que à; = 1 pour tout 4. Soit à tel que a; > 1 et N € K[X] tel que ur = M°?N où l'on a 
noté M = M;. Nous étudions l’espace 


F = ker M(f) (9.219) 


qui est stable par f, et qui possède donc un supplémentaire S également stable par f. Nous allons 
montrer que MN est un polynôme annulateur de f. 
D'abord nous prenons x € $. Étant donné que F est le noyau de M(f), 


M(F)(MN(S)x) = uy(f}z = 0, (9.220) 


ce qui signifie que MN(f}x € F. Mais puisque S est stable par f nous avons aussi MN(f)x e S. 
Finalement MN(f)xe FnS = {0}. Autrement dit, MN(f) s’annule sur S. 
Prenons maintenant y € F. Nous avons 


MN(F) = N(P)(M(P)y) = 0 (9.221) 


parce que y € F = ker M(f). 
Nous avons prouvé que MN(f) s’annule partout et donc que MN(f) est un polynôme annu- 
lateur de f, ce qui contredit la minimalité de ur = M FN 
Nous passons au sens inverse. Soit my = M;...M, une décomposition du polynôme minimal 
de l’endomorphisme f en irréductibles distincts deux à deux. Soit Fun sous-espace vectoriel stable 
par f. Nous notons 
E; = ker(M,(f)) (9.222) 


et f; = f|r,. Par le lemme 9.91 nous avons 


F- OF n Ej). (9.223) 
i=1 


Les espaces E; sont stables par f et étant donné que M; est irréductible, il est le polynôme minimal 
de f;. En effet, M; est annulateur de f;, ce qui montre que le polynôme minimal de f; divise M;. Mais 
M; étant irréductible, M; est le polynôme minimal. Étant donné que y fi = M, l’endomorphisme 
ji est semi-simple par le lemme 9.106. 

L'espace FA E; étant stable par l’endomorphisme semi-simple f;, il possède un supplémentaire 
stable que nous notons S; : 


Étant donné que sur chaque $; nous avons f [8 = fi, l'espace S = S1 @...@S, est stable par f. 
Par conséquent, nous avons 


E-FE@...@OE, (9.225a) 

= (S@(FnE))8...@(S$@(FnE;,)) (9.225b) 

E (@ S;) © (® FNE;) (9.225c) 
1=1 i=1 

sHUE (9.225d) 


ce qui montre que F' a bien un supplémentaire stable par f et donc que f est semi-simple. 


Exemple 9.108 (L'espace engendré par 1, À, 4?,...). 
Soit À une matrice, et 
E = Span{Af tel que k e IN}. (9.226) 


Nous montrons que dim(Æ) est le degré du polynôme minimal de À. 
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D'abord l'idéal annulateur de À est engendré par le polynôme minimal que nous notons 
LU = Foi ay XF. La partie {1,..., 4P-l} est libre parce qu’une combinaison linéaire nulle de ces 
éléments serait un polynôme annulateur en À de degré plus petit que p. Donc dim(E) > p. 

La partie {1, 4,..., 4} est liée à cause du polynôme minimal. Isoler 4? dans (A) = 0 donne 
un polynôme f de degré p — 1 tel que 4? = f(A). 

Nous allons montrer à présent que la famille {1, A,..., 4-1} est génératrice (alors dim(Æ) < p). 
Soit un entier q > p et de division euclidienne { np + r = q avec r < p. Nous avons A9 = AP A7. 
D'une part 

ATP = (AP)T = FA)" (9.227) 


est de degré n(p — 1). Par conséquent 
A1 = f(A)"A" (9.228) 


qui est de degré n(p—1)+7 = q—n. Autrement dit il existe un polynôme g1 de degré q— n tel que 
A1 = gi(À). Si q—n > p—1 alors nous pouvons recommencer et obtenir un polynôme g2 de degré 
strictement inférieur à celui de g1 tel que A7 = g2(A). Au bout du compte, il existe un polynôme 
g de degré au maximum p — 1 tel que A9 = g(A). Cela prouve que la partie {1, AÀ,..., 4P-l} est 
génératrice de Æ. 


La dimension de Æ est donc p, le degré du polynôme minimal. PA 
PropooCFZDooROVlaA 


Proposition 9.109. 
Soit f un endomorphisme d’un espace vectoriel de dimension finie. Nous avons l’isomorphisme 
d'espace vectoriel 


(9.229) 


La dimension en est deg(ur). 


Démonstration. Notons avant de commencer que (x) est l’idéal engendré par y. Les classes dont 
il est question dans le quotient K[X]/(u) sont 


P = {P + Su}sex[x]: (9.230) 


Nous allons montrer que l'application suivante fournit l’isomorphisme : 
— — 
(4) (9.231) 


(1) + est bien définie Si Qe P alors Q = P + Sy pour un certain $ e K[X]. Du coup nous 
avons 


d(Q) = P(F) + (Su)(F). (9.232) 
Mais y1(f) = 0 donc le deuxième terme est nul. Donc #(P) est bien défini. 
(2) Injectif Si Y(P) = 0 nous avons P(f) = 0, ce qui signifie que P = Sy pour un polynôme 
S. Par conséquent P € (4) et donc P = 0. 
(3) Surjectif Soit P € K[X]. L'élément P(f) de K{[f] est dans l’image de 4 parce que c’est 
d(P). 


En ce qui concerne la dimension, le corolaire 6.44 en parle déjà : une base est donnée par les 
projections de 1,X,..., Xdee(us)—1, 


40. Proposition 9.99. 
41. Théorème 1.215. 
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9.7.3 Polynôme caractéristique 
DefOWQooXbybYD 


Définition 9.110. 
Soit un anneau commutatif À. Si u € Mn, À), nous définissons le polynôme caractéristique 


de u : 
Xu(X) = det(u — X1,). Fa 


Nous définissons de même le polynôme caractéristique d’un endomorphisme u: E — E,. 


Remarque 9.111. 
Quelques remarques à propos du signe *. 


— Certains auteurs définissent le polynôme caractéristique par det(X —u) au lieu de det(u— X). 


— Wikipédia francophone[274] prend la définition det(X — u) (donc opposée de la notre). Allez 
lire la page de discussion. 


— Sur les wikipédias en d’autres langues, ça varie. 
— Un avantage de det(u — X) est que det(u) = x4(0). 


— Un avantage de det(X — u) est qu'il est unitaire. 
LemooWCZMooZqyaHd 
Lemme 9.112. 


Le polynôme caractéristique Xx est unitaire en dimension paire et a pour degré la dimension de 


l’espace vectoriel E. 
ThoNhbrUL 


Théorème 9.113. 
Soit E un K-espace vectoriel de dimension finie n et un endomorphisme u € End(Æ). Alors 


(1) Le polynôme caractéristique divise (lu)" dans K[X]|. 
(2) Les polynômes caractéristiques et minimaux ont mêmes facteurs irréductibles dans K[X]. 
(3) Les polynômes caractéristiques et minimaux ont mêmes racines dans K[X]. 


(4) Le polynôme caractéristique est scindé si et seulement si le polynôme minimal est scindé. 


ThoWDGooQUGSTL 

Théorème 9.114. 
Soit ue End(E) et À € K. Les conditions suivantes sont équivalentes ItemeXHXhHi 
(1) XE Spec(u) ItemeXHXhHii 
(2) Xu(N) = 0 ItemeXHXhHiii 


(3) HulÀ) = 0. 


Démonstration. (1) & (2). Dire que À est dans le spectre de u signifie que l'opérateur u — A1 n’est 
pas inversible, ce qui est équivalent à dire que det(u — A1) est nul par la proposition 9.13(1) ou 
encore que À est une racine du polynôme caractéristique de u. 

(2) & (3). C’est une application directe du théorème 9.113 qui précise que le polynôme carac- 
téristique a les mêmes racines dans IK que le polynôme minimal. 


Ex1COJcFp 
Exemple 9.115. 


s 12 ; 1 0 : L Na 
Sur R?, nous considérons la matrice À = ( 1 1) qui a pour polynôme caractéristique “ le poly- 


nôme y4 = (X — 1). Le nombre À = 1 est une racine double de ce polynôme, et pourtant il n’y a 
qu’une seule dimension d’espace propre : 


G 1)6)-6) Ga 
entraine x = 0. 


Ici la multiplicité algébrique est différente de la multiplicité géométrique. A 


42. Attention : je crois qu'il y a des incohérences dans le Frido à propos de ce choix 
43. Définition 9.110. 
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La proposition suivante donne une utilisation amusante de la notion de polynôme caractéris- 
tique #1. 
PROPooKJWOoo0jSFaA 
Proposition 9.116 ([275]). 
Soit un espace vectoriel E de dimension finie pour lequel il existe un endomorphisme f: E — E 
tel que (f o f)(x) = —x pour tout x € E. Alors la dimension de E est paire. 


Démonstration. Cherchons les valeurs propres de f en résolvant l’équation f(x) = Àx. Nous ap- 
pliquons f à cette égalité : 
x = Àf(x) = Xx. (9.235) 


Donc À ne peut pas être réel. Nous avons montré que f n’a pas de valeur propre réelle. Or le 
polynôme caractéristique de f est de degré égal à la dimension. Si la dimension est impaire, le 
polynôme caractéristique est de degré impair, et possède donc une racine réelle. Autrement dit, 
l’absence de racines réelles au polynôme caractéristique indique une dimension paire. 


Une autre preuve possible est d'utiliser le déterminant : si la dimension de Æ est n nous avons : 


det(f?) = det(— Id) = (—1}". (9.236) 
Donc (—1)" est positif, ce qui montre que n est pair. 
PropNrZGhT 
Proposition 9.117 ([276]). 
Soit f, un endomorphisme de E et x € E. Alors 
(1) L'espace Efx est stable par f. ee 
(2) L'espace Ex est de dimension 
Pfax = dimEfx = deg(Hf,x) (9.237) 
où lif,x est le générateur unitaire de Tfx. Fe 
(3) Le polynôme caractéristique de f|r,, est Hz. nine 
(4) Nous avons 
Xfle,.. (f}r = ufa(f)z = 0. (9.238) 


Démonstration. Le fait que E4 soit stable par f est classique. Le point (4) est une application 
du point (3). Les deux gros morceaux sont donc les points (2) et (3). 
Etant donné que y, est de degré minimal dans 17}, l'ensemble 


B = { f(x) tel que 0 < &< pyz — 1} (9.239) 


est libre. En effet une combinaison nulle des vecteurs de B donnerait un polynôme en f de degré 
inférieur à pr, annulant +. Nous écrivons 


Pfx—l 
ba(X) = XPPE — Ya Xi. (9.240) 
i=0 


Étant donné que uy(f)x — 0 et que la somme du membre de droite est dans Span(B), nous 
avons fPf+(x) € Span(B). Nous prouvons par récurrence que fPi#+*(x) e Span(B). En effet en 
appliquant f* à l'égalité 
Pfz—1 
O= fPie(x)— Ÿ f(x) (9.241) 


i=0 


44. Définition 9.110. 
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nous trouvons 
Pf,x — 1 


Freale À af), (9.242) 


i=0 
alors que par hypothèse de récurrence le membre de droite est dans Span(B). L'ensemble B est 
alors générateur de E;, et donc une base d’icelui. Nous avons donc bien dim(£E} >) = pfx- 
Nous montrons maintenant que ur, est annulateur de f au point x. Nous savons que 


Bpa(fe = 0. (9.243) 


En y appliquant f* et en profitant de la commutativité des polynômes sur les endomorphismes 
(proposition 9.88), nous avons 


0 = (upa(P)) = hp (PS(R), (9.244) 
de telle sorte que us,(f) est nul sur B et donc est nul sur E;,. Autrement dit, 
ps (flese) = 0. (9.245) 


Montrons que ur, est même minimal pour f|# _. 

Supposons avoir Q, un polynôme non nul de degré pr; — 1 annulant f|g,,. En particulier 
Q(f)x = 0. Cela signifie que B est un système lié, alors que nous avons montré que c'était un 
système libre. Contradiction. Nous concluons que u7, est le polynôme minimal de f|x,.. 


Cette histoire de densité permet de donner une démonstration alternative du théorème de 


Cayley-Hamilton. 
ThoCalYWLbJQ 


Théorème 9.118 (Cayley-Hamlilton). 
Le polynôme caractéristique est un polynôme annulateur. 


Une démonstration plus simple via la densité des diagonalisables est donnée en théorème 13.25. 


Démonstration. Nous devons prouver que X/(f)x = 0 pour tout x € E. Pour cela nous nous fixons 
un æ € E, nous considérons l’espace E;4 et Xp», le polynôme caractéristique de f| RES Étant 
donné que E;, est stable par f, le polynôme caractéristique de f|# ra divise x, c'est-à-dire qu’il 
existe un polynôme Q, tel que 

Xf = QuXfa (9.246) 


et donc aussi 
xX()z — Qx(f) (xre(}) = {0 (9.247) 


parce que la proposition 9.117 nous indique que Xf. est un polynôme annulateur de f|# Le 


Corolaire 9.119. 
Le degré du polynôme minimal est majoré par la dimension de l’espace. 


Démonstration. Le polynôme minimal divise le polynôme caractéristique parce qu’il engendre 
l’idéal des polynômes annulateurs par la proposition 9.99. Or le degré du polynôme caractéris- 
tique est la dimension de l’espace par le lemme 9.112. 


Exemple 9.120 (Calcul de l'inverse d’un endomorphisme). 
Le théorème de Cayley-Hamilton donne un moyen de calculer l’inverse d’un endomorphisme inver- 
sible pourvu que l’on connaisse son polynôme caractéristique. En effet, supposons que 


XF(X) = D a XŸ. (9.248) 

k=0 

Nous aurons alors _ 
O=x(f)= > fr. (9.249) 
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Nous appliquons f-! à cette dernière égalité en sachant que f—1(0) = 0 : 


0 = a0f "+ D af", (9.250) 
k=1 
et donc . 
1 

fl=- "+ ML (9.251) 

det(f) D 
où nous avons utilisé le fait que ao = xy(0) = det(f). A 
PropooBYZCooBmYLSc 


Proposition 9.121. 
Si(X — 2)! (> 1) est la plus grande puissance de (X — z) dans le polynôme caractéristique d’un 
endomorphisme f alors 

1 < dim(E.) < L. (9.252) 


C'est-à-dire que nous avons au moins un vecteur propre pour chaque racine du polynôme caracté- 
ristique. 


Démonstration. Si (X — z) divise x} alors en posant x = (X — z)P(X) nous avons 
det(f—X1)=(X-—2)P(X), (9.253) 


ce qui, évalué en X = z, donne det(f — z1) = 0. L’annulation du déterminant étant équivalente 
à l’existence d’un noyau non trivial, nous avons v # 0 dans Æ tel que (f — z1)v = 0. Cela 
donne f(v) = zv et montre que v est vecteur propre de f pour la valeur propre z. Et aussi que 
dim(E,) > 1. 

Si dim(Æ,) = k alors le théorème de la base incomplète 4.13 nous permet d'écrire une base de 
ÆE dont les £ premiers vecteurs forment une base de E,. Dans cette base, la matrice de f est de la 
forme 


(9.254) 


où les étoiles représentent des blocs à priori non nuls. En tout cas, sous cette forme, il est visible 
que (X — z)f divise xy. 


9.8 Formes bilinéaires et quadratiques 


Plus à propos de formes bilinéaires dans le thème 16. 
DEFooEEQGooNiP jHz 
Définition 9.122 ([277|). 
Soient trois espaces vectoriels E, F et V sur le même corps commutatif K. Une application b: E x 
F — V est bilinéaire si elle est séparément linéaire en ses deux variables, c'est-à-dire si 


(1) b(ui + u2,v) = b(ui,v) + b(u2,v), 

(2) b(u, v1 + v2) = b(u, vi) + b(u, v2) 

(3) b(Au, v) = b(u, Av) = Ab(u,v) 
pour tout u, u,u2 € E, v,u,v2 € F' et pour tout À E K. 

(1) Dans le cas E = F et V = K, nous parlons de forme bilinéaire sur E. 

(2) Nous parlons de forme bilinéaire symétrique si de plus b(u,v) = b(v,u). 

DefBSIoouvukR 
Définition 9.123 ([278]). 
Soit un espace vectoriel E et F un corps de caractéristique différente de 2. Une forme quadratique 
sur E est une application q: E — F pour laquelle il existe une forme bilinéaire symétrique b: E x 
E — F satisfaisant q(x) = b(x,x) pour tout x € E. 
L'ensemble des formes quadratiques réelles sur E est noté Q(E). 
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La topologie sur Q(E) sera la topologie métrique donnée dans le lemme 9.138. 
DEFooJIAQooZKBtTy 


Définition 9.124 (Application bilinéaire définie positive, thème 38). 
Si b est une application bilinéaire* sur un espace vectoriel E nous disons qu’elle est 
(1) définie positive si b(x,x) > 0 pour tout x e E et b(x,x) = 0 si et seulement si x = 0. 


(2) semi-définie positive si b(x,x) > 0 pour tout x € E. Nous dirons aussi parfois qu’elle est 
simplement « positive ». 


9.125. 
Une application bilinéaire E x E — K n’est pas une application linéaire ; la distinction est impor- 
tante. La linéarité est 


b(Au, Av) = b(A(u,v)) = Abu, v) (9.255) 


et la bilinéarité est 
b(Au,v) = bu, Av) = Abu, v). (9.256) 


En réalité la seule forme qui soit à la fois linéaire et bilinéaire est la forme identiquement nulle : 
la condition 


b(Au, Av) = X'b(u,v) = Xb(u, v) (9.257) 
pour tout À € K implique b(u, v) = 0. 
EXooKFBÜooJjXZwu 
Exemple 9.126 ([279|). 
L'application 
b: M(n,K) x Min, K) — K 
(r,K) HE (9.258) 
(A,B)- Tr(AB) 
est une forme bilinéaire symétrique. 
La vérification est un calcul : 
D(BA) = S'(BA)à = S BiAui = S'ApiBix = D (AB)xx = Tr(AB). (9.259) 
i ik ik k 
A 


9.8.1 Dégénérescence d’une forme bilinéaire 


Soit b, une forme bilinéaire symétrique non dégénérée sur l’espace vectoriel Æ de dimension n 
sur K où K est un corps de caractéristique différente de 2. Nous notons gq la forme quadratique 


associée. 
DEFooNUBFooLfCqak 


Définition 9.127. 
Une forme bilinéaire est non dégénérée si b(x, z) = 0 pour tout z implique x = 0. 
LemyKJpVP 
Lemme 9.128. 
Soit b une forme bilinéaire non dégénérée. Si x et y sont tels que b(x, z) = by, z) pour tout z, alors 


T = y. 


Démonstration. C’est immédiat du fait de la linéarité en le premier argument et de la non- 
dégénérescence : si b(x, z) — b(y,z) = 0 alors 


b(x — y,z) = 0 (9.260) 


pour tout z, ce qui implique x — y = (0. 


45. Définition 9.122. 
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9.8.2 Orthogonal pour une forme bilinéaire 
DEFOoENZGooXMW£Uy 


Définition 9.129. 
Soit un espace vectoriel E et une forme bilinéaire symétrique b. Si À € E nous notons 


At={z2eE tel que b(z,x) = 0Vxe À}. (9.261) 


C’est l’orthogonal de À par rapport à la forme b. 
DEFooQQBQooKJdwx0O 


Définition 9.130. 
Soit un espace vectoriel E et une forme bilinéaire symétrique b. Le noyau est la partie 


ker(b) = {2e E tel que b(z,x) = 0Vre E}. (9.262) 
PROPooWPKRooUAnVzd 

Proposition 9.131 ([280]). 
Soit un espace vectoriel E sur le corps K. Soit une forme bilinéaire symétrique b sur E. Si A et 


B sont des parties de E nous avons : ITEMooCGETo0KpSNXS 
di ; 
(1) A- est un sous-espace vectoriel. ITEMooRRADOOTaVYgm 
: il de 
(2) Si ACB dors BC A. ITEMooBKXFo0EpObWC 
(3) A+ = Span(A)+. 
Démonstration. Point par point. 
(1) Pour (1) 
Soient x,ye At,ae Aet Àe K. Nous avons alors 
b(x + Ay,a) = b(x, a) + Ab(y, a) = 0 (9.263) 


(2) Pour (2) 
Soient x e B+ et a € A. Nous avons b(r, a) = 0 parce queae Ac Betxe Bt. 
(3) Pour (3) Deux inclusions à prouver. 
(3a) Première inclusion Nous avons À € Span(A), donc le point (2) montre que Span(A)+ & 
At. 
(3b) Deuxième inclusion Soit x € At et y € Span(A). Nous avons y = Ÿ}; ja; pour 
certains a; € À et À; € K. Alors 


b(x, y) = > Xb(x, a) = 0. (9.264) 


PROPooSACFooQTsiJL 
Proposition 9.132 ([280]). 
Soit un espace vectoriel E sur le corps K. Soit une forme bilinéaire symétrique b sur E. Si V est 
un sous-espace de E, alors : ITEMooYHJUooQnbKQc 


(1) Si by: V x V — K est la restriction de b, alors V n VE = ker(by) “S. 
(2) V+W)-=vtawt. 
Cire, 


ITEMooUZZFooDbuddF 


ITEMooSZAGooLgkzYw 


Démonstration. En plusieurs parties. 
(1) Pour (1) 
En deux parties. 


46. Définition du noyau de b, définition 9.130. 
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(la) VnVtcker(by) Soitre VnV.Sive V, nous avons b(x,v) = 0 parce que x e V+. 


(1b) ker(by) ce VnV+ Soit x e ker(by). Nous avons x € V parce que x € ker(by) € V. 
Pour montrer que x € V+ nous considérons y € V et nous remarquons que b(x,y) = 0 
parce que æ e V+. 

(2) Pour (2) En deux parties. 


(2a) (V+W)LEeVTAWT Soit x e(V+W)-.Sive V, alors ve V+W, donc f(x, v) = 0. 
Cela prouve que x € VE. Nous prouvons que x e W+ de même. 


(2b) VLhoW+c(V +W)+ Un élément de V + W est de la forme v + w avec v € V et 
we W. Nous avons 


b(x,v + w) = b(x,v) + b(x, w) = 0. (9.265) 


(3) Pour (3) Sixe V, alors b(x,z) = 0 pour tout V+. 


PROPooMAZZooRZZoH;j 
Proposition 9.133. 


Soit une forme bilinéaire non dégénérée b sur l’espace vectoriel E de dimension finie. L'application 


@: E — E* 


our (9.266) 


est un isomorphisme d'espaces vectoriels. 


Démonstration. En plusieurs parties. 
(1) Linéaire 
Le fait que w4 soit linéaire est une conséquence de la bilinéarité de b. 


(2) Injectif Si yv) = ww), alors pour tout x € E nous avons wy(v)r = py(w)r, c’est-à-dire 
b(u — w,x) = 0. (9.267) 


Vu que b est non dégénérée, cela implique v — w = 0. 


(3) Isomorphisme Nous savons que dim(Æ) = dim(Æ*) par le lemme 4.126. Une application 
linéaire injective entre espaces de même dimension est toujours une bijection par le corolaire 
4.48. 


LEMooRXMMooAvvOjF 
Lemme 9.134 ([281|). 


Soit une forme bilinéaire non dégénérée b sur l’espace vectoriel E de dimension finie. Soit un 
sous-espace vectoriel V. Nous avons 


dim(E) = dim(W} + dim(V1). EAooLF/BooNTIUGR 


Démonstration. Nous considérons les applications 


: E — E* 
1 (9.269) 
ze b(x,.). 
et l’application de restriction 
r: E* = V* 
(9.270) 
ar alr 


(1) Théorème du rang Nous appliquons le théorème du rang 4.50 à l’application r : 


rk(r) + dim (ker(r)) = dim(E). FAGOR A 
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(2) rk(r) = dim(V) 


Étant donné que r est surjective, rk(r) = dim(V*) = dim(V). La seconde égalité est l'égalité 
des dimensions du lemme 4.126. 


(3) w(V+) Cker(r) Soit x e VE. Pour tout ve V nous avons 


r(gi(x))v = pe(x)v = b(x, v) = 0. (9.272) 


Donc w,(x) € ker(r). 

(4) gr: VE — ker(r) est surjective Soit à € ker(r). Vu que y est une bijection, il existe x € E 
tel que à = wi(x), c’est-à-dire à = b(x, : ). Nous avons a(y) = 0 pour tout y € V, c'est à 
dire b(x,y) = 0 pour tout y € V, ce qui signifie que x € V+. Donc a e wy(V+). 


(5) dim(V+) = dim (ker(r)) L'application 4, étant globalement injective, elle est une bijection 


entre V+ et ker(r). Donc ces deux ont la même dimension. 


(6) Conclusion Nous pouvons reprendre l’équation (9.271) et y mettre nos découvertes : 
rk(r) = dim(V) et dim (ker(r)) = dim(V{). Cela donne la formule demandée 


dim(V) + dim(V+) = dim(E). (9.273) 


LEMooYYGLooYIDmoa 
Lemme 9.135. 
Si V est un sous-espace de E de dimension finie, alors 


(V+yL = y. (9.274) 


Démonstration. Nous avons déjà vu dans la proposition 9.132 que V € (V+)+. 
Nous écrivons maintenant la formule (9.268) pour V, et pour v+t (qui est un sous-espace 
vectoriel par la proposition 9.131(1)) : 


dim(V) + dim(V+) = dim(E) (9.275a) 
dim(V) + dim («vt)t) = dim(E). (9.275b) 


En soustrayant ces deux équations membre à membres, nous trouvons dim(V) = dim (ht). 


Vu que V s’'injecte (par l'identité) dans (V+)+ et qu’ils ont la même dimension, ils sont égaux. 


9.8.3 Formes quadratiques 
LEMooUQIDooPSOUexL 


Lemme 9.136 ([282)). 
Soit une forme quadratique Q sur E. Si F' est un sous-espace de E, alors 


dim(F)+dim(Fi) >n (9.276) 
où F+ est l’orthogonal par rapport à Q. 


Démonstration. Nous posons p = dim(F). Nous considérons une base {f};-1...n de E telle que 
{fihi=1,..p est une base de F7, Nous posons 


oE-F 
È 9.277 


i=1 


47. Théorème de la base incomplète, 4.24. 
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où B est la forme bilinéaire associée à Q. Ce @ est une application linéaire à qui nous appliquons 


le théorème du rang (4.50) : 
dim(£) = rk(6) + dim (ker(c)). FQooCLiLoofEaq 


Mais vu que l’image de ® est dans F, nous avons rk(d) < dim(F). De plus, ker() = F+. Donc 
(9.278) devient 
dim(E) < dim(F) + dim(F?). (9.279) 


LEMooU0ZOooYvEcji 
Lemme 9.137 ([282]|). 
Soit un espace vectoriel E de dimension finie et un sous-espace F sur lequel la forme quadratique 
Q est strictement définie positive ou négative. Alors 


E=F@r. (9.280) 


Démonstration. D'abord nous montrons que F n F4 = {0}. Si v £ 0 est dans F', alors Q(v) > 0, 
et donc v n’est pas dans F+. Donc F n F+ € {0}. L'inclusion inverse est immédiate. 
Nous avons vu dans le lemme 9.136 que 


dim(E) < dim(F) + dim(F+). (9.281) 


Vu que F et FE n’ont pas d’intersection autre que {0}, nous avons 


dim(E) > dim(F @ Ft) = dim(F) + dim(Ft) > dim(E). (9.282) 
Toutes ces inégalités sont donc des égalités et dim(Æ) = dim(F) + dim(F+). 
LEMooWRCIooWkMpoF 
Lemme 9.138. 
La topologie considérée sur Q(E) Ÿ est celle de la norme L'application 
N:Q(E)-R 
Q( ) FaZYBoo an 
ga sup |g(x)|, 
Ixlg=1 


est une norme. 
L'application 
N:S(n,R)—R 
Ar sup {x : Ar 


lælle=1 


EQooJ ÉTQoot) SE 


est une norme. À droite, nous trouvons le produit scalaire usuel sur IR’ et la valeur absolue usuelle 
sur R. 


Ces normes sont celles que nous considérons pour la topologie sur Q(E) et S(n,R). 
PROPooZLXVooUsXCcB 


Proposition 9.139. 
Soit une forme bilinéaire b et la forme quadratique associée q. Alors nous avons l'identité de 
polarisation : 


b(x, y) = > (at) + q(y) — q(x — y)). Fa B8E) 


Démonstration. Il suffit de substituer dans le membre de droite q(x) = b(x,x) et d'utiliser la 
bilinéarité : 


q(x) + q(y) — g(x — y) = b(x,x) + by, y) — bfx — y,x — y) (9.286a) 
= b(x,x) + by, y) — b(x, x) + b(x, y) + b(y,x) — b(y, y) (9.286b) 
= 2b(x,y) (9.286c) 


où nous avons utilisé le fait que b est symétrique : b(x,y) = b(y, x). 


48. Q(E) sont les formes quadratiques réelles sur E, définition 9.123. 
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PropFSXooRUMzdb 
Proposition 9.140 (Matrice associée à une forme bilinéaire). 
Soit {e;} une base de E. L'application 
D: QE) — S(n,R 
) ) (9.287) 
a (b(e,e;)),, 
où b est forme bilinéaire associée à q est une bijection linéaire et continue”. 
Démonstration. Si o(q) = @(q') ; alors 
q(x) = D OPE:7 _ S P(g'histit = q'(x). (9.288) 
i,j i,j 


Donc q = q'. L'application @ est donc injective 
De plus elle est surjective parce que si B € S(n,R) alors la forme quadratique 


q(x) — > B;jtit; (9.289) 
ä,3 


a évidemment B comme matrice associée. L'application @ est donc surjective. 
Notre application ® est de plus linéaire parce que l’association d’une forme quadratique à la 
forme bilinéaire associée est linéaire. 


En ce qui concerne la continuité, nous la prouvons en zéro en considérant une suite convergente 
Q(E) 7 
Gn —— 0. C'est-à-dire que 


sup |qn(x)| — 0. (9.290) 
Iæ|=1 


Nous rappelons l'identité de polarisation °° : 


bn(r,9) = 5 (an — y) — ane) — qu). (p.291) 


En ce qui concerne deux des trois termes, il n’y a pas de problèmes : 


1 1 1 
[b(an)is| = lôntes, e)| < 5 ln (ei — ej)| + 51m (es) + slm(es)|. (9.292) 


Si n est assez grand, nous avons tout de suite 


1 
CICHPIES 5 lan (ei =é)+é (9.293) 
Nous définissons e;; et a;; de telle sorte que e; — e; = œije;; avec le;;| = 1. Si à = max{a:;,1} 
alors nous avons 
Gn(ei — ej) = Q?;Qn (ei) <  Qn (ei). (9.294) 


Il suffit maintenant de prendre n assez grand pour avoir sup},|_1 [4n(x)| < & pour avoir 


\(an)iÿl < (9.295) 


NI 


49. Pour les topologies des normes données dans le lemme 9.138. 
50. Proposition 9.139. 
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9.8.4 Isotropie 
DefVKMnUEM 


Définition 9.141 (Isotropie[283]). 
Quelques définitions. 


(1) Un vecteur est isotrope pour b si il est perpendiculaire à lui-même. En d’autres termes, x 
est isotrope si et seulement si b(x,x) = 0. 


(2) Un sous-espace W € E est isotrope si W n W+ Z {0}. 


(3) Un sous-espace W € E est totalement isotrope si pour tout x, y € W, nous avons b(x, y) = 
0. 


Le cône isotrope de b est l’ensemble de ses vecteurs isotropes : 
C(b)={reE tel que b(x,x) = 0}. (9.296) 


Nous introduisons quelques notations. D’abord pour y € E nous notons 


P,:E—R 
L (9.297) 
ze b(x,y) 
et ensuite 

D:E — E* 
(9.298) 

y By. 
DEFooHKQVooPuWZiP 


Définition 9.142. 
Le fait pour une forme bilinéaire b d’être dégénérée signifie que l’application ® n’est pas injective. 
Le noyau de la forme bilinéaire est celui de ®, c’est-à-dire 


ker(b) = {2€ E tel que b(z,y) = 0Vye E}. (9.299) 
Autrement dit, ker(b) = EŸ où le perpendiculaire est pris par rapport à b. 


Notons tout de même que nous utilisons la notation L même si b est dégénérée et éventuellement 


pas positive; c’est-à-dire même si la formule (x, y) > b(x, y) ne fournit pas un produit scalaire. 
LEMooUTVGooRAUÿaD 


Lemme 9.143. 
Si E est de dimension finie, et si V est un sous-espace non isotrope®! de E, alors V+ est également 
non-isotrope. 


Démonstration. En dimension finie, le lemme 9.135 nous indique que (W+)+ = V. Si V+ était 
isotrope nous aurions V+ n(V+)1 4 G. Cela donne alors immédiatement V+ nV # @, qui serait 
que V est isotrope. 


9.9 Formes bilinéaires et quadratiques 


Plus à propos de formes bilinéaires dans le thème 16. 
LEMooLKNTooSfLSHt 


Lemme 9.144. 
Si q est une forme quadratique, il existe une unique forme bilinéaire b telle que q(x) = b(x, x). 


Démonstration. L'existence n’est pas en cause : c’est la définition d’une forme quadratique. Pour 
l’unicité, étant donné une forme quadratique, la forme bilinéaire b doit forcément vérifier l’identité 
de polarisation de la proposition 9.139. Elle est donc déterminée par gq. 


Notons la division par 2 qui est le pourquoi de la demande de la caractéristique différente de 2 
pour F dans la définition de forme quadratique. 


51. Définition 9.141. 
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DEFOooGECUooCCGVXG 
Définition 9.145. 
Soit une forme quadratique q sur E. Nous disons que v,w € E sont q-orthogonauzx si b(v,w) = 0 
où b est la forme bilinéaire associée à q par le lemme 9.144. 


9.9.1 Matrice associée à une forme bilinéaire 
DEFooAOGPooXWXUcN 


Définition 9.146. 
Soit une forme bilinéaire*? b: E x E — K et une base quelconque {f.} de E. Nous définissons les 


DONNEES EQooCUGFo0o RUE 
Bag = (fa fe), ED) 


qui forment une matrice symétrique dans M(n,K). Cette matrice est la matrice associée à la 
forme bilinéaire b. 


La matrice d’une forme quadratique est celle associée à sa forme bilinéaire associée. 
LEMooDCIOooT1VZMR 


Lemme 9.147. 
Soit une forme bilinéaire b: E x E — K et une base quelconque {f,} de E. Nous notons B la 
matrice de b (definition 9.1/6) et q la forme quadratique associée. 


Alors nous avons EQooQFMMooMCUE 
(x, y) = D Bagtays. 307) 
aB 


el 
b(x, y) = x : By. (9.302) 


où le point est le produit scalaire usuel (composante par composante). 


Démonstration. Six = 3, Tafa €t y = > Yes : 
En utilisant la convention (4.89) et les choses autour (voir aussi -2.1), 


b(x,y) = D Ta D Bagyg = D Ta(By)a =: By. (9.303) 
(02 B œ 


9.9.2 Changement de base : matrice d’une forme bilinéaire 
PROPooUKTGooUYukoB 


Proposition 9.148 ([1]). 
Soient une forme quadratique q sur IR” et une application linéaire D: IR" — IR". La matrice de 
go ® est 

Lab (9.304) 


où l’on a noté q la matrice de q et ® celle de ©. 


Démonstration. C’est un calcul direct de (go @)(x) : 


q((x)) = D sb(zhib(x), (9.305a) 
ij 
_ >», », D Gijbir TROT prop. 4.70 (9.305b) 
1j k 


E > o Éxdi6i) TkTI _ DOTE TE (9.305c) 
Hi y 


kl 


Et voila. 


52. Définition 9.122. 


668 CHAPITRE 9. ESPACES VECTORIELS (ENCORE) 


PROPooLBIOooUpzxXA 
Proposition 9.149 (Voir la section -2.1). 
Soit une forme bilinéaire®* b: V x V — K dont la matrice®* dans la base {e;} est À et celle dans 
la base {fa} est B. Nous supposons que les bases sont liées par fa = D; Qiaei. Alors 


— Q'AQ. FooZUTootiqui 


Démonstration. Soit x, x! € V de coordonnées (x;) et (x!) dans la base {e;} et (ya), (y4,) dans la 
base {f,}. Par définition de la matrice associée à une forme bilinéaire, 


b(x, x’) — >; AijTit; = » BasYaYs- (9.307) 
ij aB 


En remplaçant les x; et x! par leurs valeurs en fonction de y et Us données par la proposition 
4.115, nous trouvons 


b(x,2) = D AijQioÿaQ eus (9.308a) 
ijaf 
= D (Q'AQ)agyays (9.308b) 
ap 


où Q! désigne la transposée de la matrice Q : Qÿ; = Q;i. Vu que les nombres y, et 5 sont arbitraires 
nous déduisons ®” que B = Q'AQ. 


REMooNEJLooSqgeih 
Remarque 9.150. 
Notons que cette « loi de transformation » n’est pas la même que celle pour une application 
linéaire 6. Ici nous avons Qt alors que pour les applications linéaires nous avions QT. 

Pour cette raison, tant que nous travaillons avec des bases orthonormées, c’est-à-dire tant que Q 
est orthogonale °’, nous pouvons confondre une application linéaire avec une application bilinéaire 
en passant par la matrice. Mais cette identification n’est pas du tout canonique : elle repose sur le 
fait que les bases soient orthonormées. 

Il en découle que la réduction des endomorphismes et la réduction des formes bilinéaires ne 
sont pas tout à fait les mêmes théories. Par exemple la pseudo-diagonalisation simultanée (coro- 
laire 11.37) est un résultat de réduction de forme bilinéaire et non d’endomorphismes. 


9.9.3 Isométrie, forme quadratique et bilinéaire 


Exemple 9.151. 
La forme quadratique q(x) = x? + x3 donne la norme euclidienne. La forme bilinéaire associée est 
b(x, y) = xiy1 + toy, qui est le produit scalaire usuel. A 


Il ne faudrait pas déduire trop vite que la formule |x|? = q(x) donne une norme dès que q est 
non dégénérée. En effet q peut ne pas être définie positive. La forme q(x) = x? — x3 prend des 
valeurs positives et négatives. A fortiori d(x,y) = q(x — y) ne donne pas toujours une distance. 


DEFooECTUooRxBhHf 
Définition 9.152. 
Une isométrie pour la forme quadratique q est une application bijective f: V — V telle que 


g(z — y) = q(f(x) — f(y)). (9.309) 


Dans les cas où q donne une distance, alors c’est une isométrie au sens usuel. 


53. Définition 9.122 
54. Définition 9.300. 
55. Lemme 4.66. 

56. Proposition 4.118. 
57. Définition 4.100. 
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DEFO0IQURooMeQuqx 
Définition 9.153 (Thème 77). 
Soit un espace vectoriel E muni d’une forme bilinéaire b. Une isométrie pour b est une bijection 
J: E — E telle que 
b(F(x), f(y)) = b(x, y) (9.310) 
pour tout x,ye E. 
LemewGJmM 
Lemme 9.154. 
Soient q une forme quadratique et b la forme bilinéaire associée par le lemme 9.1/4. Une application 
J:E — E telle que f(0) = 0 est une isométrie pour b si et seulement si elle est une isométrie 
pour q. 
Démonstration. Pour une application bijective f: E — E telle que f(0) = 0, nous devons prouver 
l’équivalence des propriétés suivantes : 
(1) b(f(x), f(y)) = b(x,y) pour tout x,ye E: 


(2) q(f(x) — f(y)) = q(x — y) pour tout r,ye E. 


Dans le sens direct, en posant x = y nous trouvons tout de suite q(f(x)) = q(x); ensuite en 
utilisant la distributivité de b, 


q(f(x) — f(y)) = b(F(x) — f(y), f(x) — F()) (9.311a) 
= q(f(x ). = (x), f(y)) + a(F(u)) (9.311b) 
= q(x) + q(y) — 2b(x, y) (9.311c) 
= q(x — y). (9.311d) 


Dans l’autre sens, nous commençons par remarquer que l’hypothèse f(0) = 0 donne q(x) = 
q(f(x)). Ensuite nous utilisons l'identité de polarisation (9.285) : 


b(F(), Ju) = SLa(F(a)) + af) — (te W))] (9.312) 
= Sata) + q(y) — q(x — y)] (9.312b) 
= b(x, y). (9.312c) 


9.9.4 Isométries 


Voici un théorème pas toujours bien énoncé dans les cours de physique qui font de la relati- 
vité. Au moment de « prouver » les transformations de Lorentz ®, beaucoup oublient de justifier 


pourquoi elles devraient être linéaires. 
ThoDsFErq 


Théorème 9.155 ([284]). 
Une isométrie”®” d’une forme bilinéaire non dégénérée est linéaire. 


Démonstration. Soient une forme bilinéaire non-dégénérée b sur l’espace vectoriel Æ ainsi qu’une 
isométrie f pour icelle. Soit z € E; étant donné que f est bijective nous pouvons considérer 
l'élément f-l(2)e E et calculer 


b(f(æ + y),2) = b(f(æ + y), FF (2) (9.313a) 
= b(x+y, f (2) (9.313b) 
= b(x, f 7" (2)) + b(y, f (2) (9.313c) 
= (f(x), z) + b(F(y), 2) (9.313d) 
= b(fF(x) + F(y),2), (9.313e) 


58. Théorème 18.199. 
59. Définition 9.153. 
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donc f(x + y) = f(x) + f(y) par le lemme 9.128. 
De la même façon on trouve b(f(Ax), 2) _ b(Af(x), z) qui prouve que f(Ax) = f(x) et donc 
que f est linéaire. 


Exemple 9.156. 
Une isométrie peut ne pas être linéaire quand la forme bilinéaire est dégénérée. Par exemple pour 
la forme bilinéaire sur R? donnée par 


b((a, b), (æ, y)) — aT, (9.314) 
nous pouvons faire 


f(x, y) = e : ) (9.315) 


où À est n'importe quoi. A 
DEFooVTXWooVXfUnc 


Définition 9.157. 
Soient deux espaces vectoriels E et V. Une application f: E — V est affine si il existe une 
application linéaire u: E — V et un élément a € V tel que 


J(æ) = u(x) + a (9.316) 
pour tout x € E. 


Théorème 9.158. 
Soit un espace vectoriel E muni d’une forme quadratique q. Soit une isométrie f: E — E pour q. 
Alors 


(1) si f(0) = 0, alors f est linéaire; 
(2) si f(0) £ O alors f est affine. 
Démonstration. Nous considérons la forme bilinéaire associée b. Si f(0) = 0, nous savons par le 


lemme 9.154 que b(f(x), f(y)) = b(x, y). La proposition 9.155 nous dit alors que f est linéaire. 
Si f(0) £ 0, alors nous posons g(x) = f(x) — f(0) qui vérifie g(0) = 0 et 


q(g(æ) — g(y)) = a(f(x) — F(0) — f(y) + F(0)) = q(x — y). (9.317) 


Nous pouvons donc appliquer le premier point à g, déduire que g est linéaire et donc que f est 
affine. C’est la caractérisation du lemme 8.59 des fonctions affines. 


Nous pouvons maintenant particulariser tout cela au cas de IR”? muni du produit scalaire usuel 
et de la norme associée pour voir quel résultat nous avons à peine prouvé. 

Nous notons ici T(n) le groupe des translations sur R”. Un élément de T'(n) est une translation 
T, donnée par un vecteur v et agissant sur IR? par 


Ty: R°—R" 


TH T+UV. 


(9.318) 


Ce groupe est isomorphe au groupe abélien (R”,+), et nous allons souvent identifier 7, à v. 
Vous savez par culture générale que les isométries de IR" pour le produit scalaire usuel sont les 
matrices orthogonales. En voici une petite généralisation (pensez à 7 = 1 dans le cas du produit 


scalaire usuel). 
PROPooSYQMooEnZFdp 


Proposition 9.159. 
Soit une forme bilinéaire b sur R” de matrice symétrique n. Si À est la matrice d’une application 
linéaire R? — R' telle que 

b(Azx, Ay) = b(x, y) (9.319) 


pour tout x,y € R”, alors 
AtnA = 1. (9.320) 


60. Définition 9.157. 
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Démonstration. En suivant la formule générale (9.301), 


b(Ax, Ay) = > mij(Ax)i(Ay); —= » Nij Air A TRY. (9.321) 
1j ijkl 


En imposant que ce soit égal à D y mutxyr pour tout x,y nous avons la contrainte 


D mix Ag = Mt (9.322) 
ij 


qui signifie exactement An A = 7. 


9.10 Signature, théorème de Sylvester 

DEFooWDCLooDKkKRYLK 
Définition 9.160 (Signature[285]). 
Soit une forme quadratique®! Q sur un espace vectoriel E de dimension finie n. L'indice d’inertie 
de Q est le nombre 


qg = max{dim(F) tel que Q(v) < O Vue F\{0}}. (9.323) 
Nous définissons aussi 
p = max{dim(@) tel que Q(v) > 0 Vue G\{0}}. (9.324) 
Le couple (p,q) est la signature de Q. 
DEFooVITQooQaMaTF 
Définition 9.161 (Rang d’une forme quadratique). 
Si Q:E — K est une forme quadratique, nous considérons l'application 
: E — E* 
jo (9.325) 
ce [y B(x,y)|. 
Le rang de Q est le rang de l’application linéaire fo. 
PROPooLRZQooSfprff 


Proposition 9.162. 
Le rang d’une forme quadratique est le rang de sa matrice dans n'importe quelle base. 


Démonstration. Nous considérons une forme quadratique Q sur l’espace vectoriel E. Sa trace est, 
par définition, la trace de l’application linéaire fQ de la définition 9.161. Or cette dernière trace 
ne dépend pas des bases choisies sur Æ et E*. Nous la calculons donc maintenant. 

Soit une base {e;} de E ainsi que sa base duale {ef} de E*. Si v = ÿ , vez € E, alors 


fa(ei)v = » veB(ei, ex) = » Qikvk (9.326) 
k k 


où nous avons noté B la forme bilinéaire associée à Q et utilisé la définition 9.146 de la matrice 
associée à la forme quadratique Q. Nous avons donc fo(ei) = ÿ, Qief ou encore 


Jo(ei)r = Qix, (9.327) 


ce qui signifie, par (1) que la matrice associée à fo est la matrice Qf. 

Le rang de fQ est donc celui de Q', qui est le même que celui de la matrice Q (ici, nous 
avons noté Q la matrice de la forme quadratique Q). Le rang de fQ est celui de sa matrice par la 
proposition 4.109. 


61. Définition 9.123. 
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LEMoo1ISHCooVDJEKo 
Lemme 9.163 ([285]). 
Soient une forme quadratique Q ainsi que deux bases Q-orthogonales {e1,...,e,} et {ei,...,e}. 
Nous posons 


r = Card{e; tel que Q 
r' = Card{e; tel que Q 
s = Card{e; tel que Q 
s' = Card{e; tel que Q 


> 0} (9.328a 
> 0} (9.328b 
0) (9.328c 
< 0} (9.328d 


Ei 


! 
(SE 


PR RSR PR TR 
ue Ro No 


) 
) 
é ) 
e! ) 
Alors r =r' ets =s". 
Démonstration. Nous posons 


I = {i tel que Q(e:) > 0} (9.329a) 
J = {j tel que Q(e;) < 0} (9.329b) 


Nous commençons par prouver que {é;}ier U {e}jey est libre. Supposons pour cela que 


Dome + D yes; = 0, (9.330) 


iel jEeJ 
et posons z = Le y tie. Nous avons 


Q(:) = D x?Q(ci) > 0. RRANERE OR RE 


iel 
Mais nous avons aussi z = — De J Vie; donc 
EQooJY0OCoo 
Q() = Y'yQ(c,) < 0. CEE) 
jEJ 


Donc Q(z2) = 0. Vu (9.331), et le fait que Q(e;) > 0, avoir Q(z2) = 0 impose x; = 0 pour tout i. La 
relation (9.332) nous donne aussi immédiatement que les y; sont nuls. Donc la partie {ei}ierU{e}jey 
est libre. 

Le lemme 4.11 nous indique qu’une partie libre est toujours de cardinal plus petit ou égal à la 
dimension de l’espace 7. Tout ça pour dire que 


Card(1) + Card(J) < n, (9.333) 
. ner 


et donc r < 7”. 
Le même raisonnement, en partant de 1 = {i tel que Q(e;) < 0} et de J = {j tel que Q(ei) > 
0}, prouve que r’ < r. 
La preuve de s = 5’ est du même tonneau. 


Pour l’équivalence de formes quadratiques, voir la définition 9.246 et la proposition 9.247. 


9.11 Produit scalaire, produit hermitien 

DefVJIeTF; 
Définition 9.164. 
Un produit scalaire sur un espace vectoriel réel est une forme bilinéaire ® symétrique strictement 
définie positive °*. 


62. Ici nous utilisons l'hypothèse que V est de dimension finie. 
63. Définition 9.122. 
64. Définition 9.124. 
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La définition suivante est utile pour celles qui veulent faire de la relativité 6°. 
DEFooLPBGooXLxubc 


Définition 9.165. 


Un produit pseudo-scalaire sur un espace vectoriel réel est une forme bilinéaire et symétrique. 
DEFooZBWToolqXwRp 


Définition 9.166. 


Nous dirons que deux vecteurs sont orthogonaux lorsque leur produit scalaire 56 


est nul. Nous 
écrivons que u L v lorsque &u, v) = 0. 
Si {ei}i=1,.….n est une base de E, nous disons qu'elle est orthonormée si 


(ee = 0. (9.334) 
LEMooLPUFooVCvnwW 
Lemme 9.167. 
Un produit scalaire est toujours non dégénéré®T. 


Vu que nous allons voir un pâté d'espaces avec des produits scalaires, nous leur donnons un 


nom. 
DefLZMcvf;j 


Définition 9.168. 
Un espace vectoriel euclidien est un espace vectoriel réel de dimension finie muni d’un produit 
scalaire (définition 9.164). 


Avouez que c’est drôle qu’un espace vectoriel est euclidien lorsqu'il possède une multiplication 
alors qu’un anneau est euclidien lorsqu'il possède une division (voir la définition 1.244). C’est pas 
très profond, mais si ça peut vous servir de moyen mnémotechnique... 


PROPooSKVRooDGVCYj 
Proposition-Définition 9.169 (Produit scalaire dans R”, thème 25). 
Si x,yEe R", nous définissons 
nm 
EQooFITHoo 
ru TiYi = TiY1 + LaY2 +: + TnYn. (9335) 


i=1 


Cela est un produit scalaire. 
Ce produit scalaire est le produit scalaire qui sera toujours considéré. C’est de lui qui découle 
toujours la norme, et la topologie de R". Il sera aussi souvent noté {x, y). 


Démonstration. Il faut que b(x, y) = Ÿ;; tiyi soit bilinéaire, symétrique, strictement définie positive. 
Ce sont toutes des vérifications immédiates. Par exemple pour la symétrique, nous avons Ÿ}; tiyi = 


Calculons par exemple le produit scalaire de deux vecteurs de la base canonique : e;,e;). En 
utilisant la formule de définition et le fait que (e;)x = 054, nous avons 


(eue) = D Gide. (9.336) 
k=1 


Nous pouvons effectuer la somme sur k en remarquant qu’à cause du 6,4, seul le terme avec k = à 
n’est pas nul. Effectuer la somme revient donc à remplacer tous les 4 par des 1 : 


Ci, Ej) — O0 ji —= Ôji. 9.337 
J 1 J 


Une des propriétés intéressantes du produit scalaire est qu’il permet de décomposer un vecteur 
dans une base, comme nous le montre la proposition suivante. 


65. Voir le théorème 18.199 qui établit les transformations de Lorentz. 
66. Définition 9.164. 
67. Définition 9.127. 
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PropScalCompDec 
Proposition 9.170. 
Si nous notons v; les composantes du vecteur v, c’est-à-dire si v = Fur Vie;, alors nous avons 
Vj = Çu,e;). 


Démonstration. 


< . - Eqvejsc 
UE D (vies, ej) S » vies, ej) = >» Vi Lu (0.32 
i=1 i=1 i=1 


En effectuant la somme sur à dans le membre de droite de l’équation (9.338), tous les termes sont 
nuls sauf celui où à = j; il reste donc 
Deer. (9.339) 


Le produit scalaire ne dépend en réalité pas de la base orthogonale choisie. 
LEMooZMCWooDfbrIq 
Lemme 9.171. 


Si {e;} est la base canonique, et si {f;} est une autre base orthonormale Ÿ, alors si u et v sont 
deux vecteurs de IR”, nous avons 
D uv; _ Du! (9.340) 
ï i 


où u; sont les composantes de u dans la base {e;} et u! sont celles dans la base {f;}. 


Démonstration. La preuve demande un peu d’algèbre linéaire. Étant donné que {fi} est une base 
orthonormale, il existe une matrice À orthogonale (AA° = 1) telle que u; = }}; A;;u; et idem pour 


UV. Nous avons alors 
= S (Sa) (Gain) 


à à 
= >, À; Air 
ijk 


= NN (A) Ujvk (9.341) 


jk à 
———, — 
=6;k 


— > djRU Uk 
jk 


= D UUr. 
k 


Cette proposition nous permet de réellement parler du produit scalaire entre deux vecteurs de 
façon intrinsèque sans nous soucier de la base dans laquelle nous exprimons les vecteurs. 


9.11.1 Hermitien, unitaire, etc. 
DefMZQxmQ 


Définition 9.172 ([286]). 
Soit E est un espace vectoriel sur C. Une application <.,.»: E x E — © est sesquilinéaire à 
droite si pour tout x,y€e E et pour tout ÀEC, 


(1) Cr, y) = x, y) = (x, y), 

(2) {x +y,2) = (x,2) + y,2), 

(3) Kx,y + 2) = (x, y) + (x,2). 
Définitions supplémentaires : 


68. Définition 9.166. 
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— La forme <.,.) est hermitienne si de plus 
(y) = (y, t) (9.342) 


— Un produit hermitien est une forme hermitienne strictement définie positive, c’est-à-dire 


telle que &x,x) > 0 pour tout x e E et {x,x) = 0 si et seulement si x = 0. 
PROPooRPRRooRYEMCB 


Proposition-Définition 9.173. 
Soit un espace hermitien (E,<.,.)). Soit un opérateur linéaire À € End(£). Il existe un unique 
opérateur B € End(ÆE) tel que 

(Az, y) = (x, By) (9.343) 


pour tout x,ye E. 
L'opérateur B aïnsi défini est noté AŸ et est nommé hermitien conjugué de A. 


LEMooBOXMooSDyCfm 
Lemme 9.174. 
Au niveau des matrices, nous avons 
AÏ, = Aÿ, (9.344) 
où z* est le conjugué complexe. 
DEFooKEBHooWwCKRK 


Définition 9.175. 

Quelque définitions. 
(1) Un opérateur À est hermitien si AÏ = A. 
(2) Un opérateur À est unitaire si A = At. 


Note : le conjugué hermitien est parfois noté A* au lieu de A. 


9.176. 

Le mot « hermitien » est réservé aux opérateurs sur des espaces hermitiens, c’est-à-dire des espaces 

vectoriels sur C. Le mot « autoadijoint » par contre est plutôt utilisé dans le cadre d'opérateurs 

sur les espaces réels. En conséquence de quoi, ces deux mots sont synonymes, mais il est préférable 

d'utiliser « hermitien » lorsque l’espace vectoriel est sur € et « autoadjoint » lorsqu'il est sur R. 
L'ensemble des opérateurs autoadjoints de E est noté S(E). Cette notation provient du fait que 

dans R' muni du produit scalaire usuel, les opérateurs autoadjoints sont les matrices symétriques. 


Remarque 9.177. 
Le fait d’être hermitien n’implique en rien le fait d’être inversible. 


9.178. 
Les normes associées aux produits scalaires font intervenir une racine carré, et donc devront être 


données plus tard. Voir le thème 25. 
PROPooMWUCooMbJuaJ 


Proposition 9.179 ([1]). 
Nous considérons C” vu comme espace vectoriel de dimension n sur C. 


(1) La formule, pour x,y € C”, 
nm 
EqF S j 
(x, y) = > TKUk Pen ss | 
k=1 


définit une forme sesquilinéaire sur C7. 


(2) L'ensemble C” devient un espace vectoriel hermitien. 


9.11.2 Éléments de matrice 
PROPooZKWXooWmEzoA 


Proposition 9.180. 
Soit une application linéaire A: R° — R". Nous considérons le produit scalaire usuel®” sur R”. 
Alors : 


69. Définition 9.169. 
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(1) Les éléments de matrice de A sont donnés par Ai; = e; : Ae;. 


(2) Nous avons la formule x + Ay = dy AnTkyr. 


Démonstration. Pour Ae; nous utilisons la formule 4.88 avec des notations plus décontractées : 
Aej = ) y, Arjex. Ensuite nous faisons un calcul avec la formule (9.335) : 


Ei ‘ Ae; —Eÿ * D Arjek —= DENT = Ai. (9.346) 
k k 


La seconde formule à prouver est du même tonneau, en utilisant cette fois la formule (4.89) : 


2 Ay =) (Aus = D teAuu = D Autku. (9.347) 
P KI HI 


La proposition suivante est une version plus « pragmatique » de la proposition 4.133. 
PROPooNITTooCYcrrT 


Proposition 9.181 ([136]). 
Soient un espace euclidien ® de dimension finie V ainsi qu’un sous-espace M. Nous posons 


M ={xeV tel que x : y = 0Vye M}. (9.348) 
Alors M @ M+ = V. 


Démonstration. D'abord si x € M n M+, alors x : æ = 0 et donc x = 0. Donc nous avons déjà 


M n M+ = {0}. Nous considérons une base {b1,...,b4} de M, et nous définissons l'application 
linéaire : 
:V—R 
Ï (9.349) 
mers bi.40 + bel 


Nous avons que M+ = ker(f). Le théorème du rang 4.46 nous indique que 
dim(V) = dim (ker(f)) + dim (Image(f)) < dim(M+) +k= dim(M)+dim(M). (9.350) 


Une justification : vu que f prend ses valeurs dans RF, la dimension de son image est majorée par 
k. 
Nous en déduisons que 


dim(M) + dim(M) > dim(V), (9.351) 


et la proposition 4.141 nous permet de conclure que M @ M+ = V. 


9.11.3 Transposée : pas d’approche naïve 
SUBSECooGPXVooEYwliJ 


Il est légitime, si t: E — E est une application linéaire, de dire que sa transposée soit l’ap- 
plication linéaire t': E — E dont la matrice est la matrice transposée de celle de t. Lorsque nous 
travaillons sur IR? muni de la base canonique, cela ne pose pas de problème et nous pouvons écrire 
des égalités du type x, Ay) = {Atx, y). 

PROPooNARVooEuhweD 
Proposition 9.182 (Matrice transposée et produit scalaire). 
Soit une matrice réelle A. En utilisant l'application linéaire associée"! f4: IR" — R°, nous avons 


œ: JA(y) = far(x) : y (9.352) 


Cette formule est souvent écrite x : Ay = Atx : y ou (x, Ay) = (Aïx, y). 


70. Qui possède un produit scalaire, définition 9.168. 
71. Définition 4.67. Ici nous considérons la base canonique sur R” 
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Démonstration. Il s’agit d’un calcul utilisant la formule (4.83) et le produit scalaire (9.335) : 


2 + fa(y) = D mi (Fa(y  2iss L'Aut = D Aitig = 2 faits ty; = fax) - y. (9.353) 
i ij 


Hélas nous allons voir que cette façon de définir une transposée est mauvaise. 
Soit une application linéaire t: E — E de matrice À dans la base {e;};-1..n et de matrice B 
dans la base { fa}a=1..,n. Nous notons Q la matrice de passage d’une base à l’autre : 


Jo (9.354) 


Nous nommons # l'application linéaire associée à A! dans la base {e;} et t2 l'application linéaire 
associée à la matrice Bt dans la base {f,}. Définir la transposée d’une application linéaire comme 
étant l’application linéaire associée à la transposée de sa matrice ne sera une bonne définition que 
si til — to. 

La première chose facile à voir est 


tilei); = D (A )rlei)e = A = Aie oo EPoo RES 


ji 
k 


Pour calculer t(e;);, c'est un peu plus laborieux : 


= L@% ita(fa) = D, Qui Bis (fa) (a)s À = Di Op Ba (9.356a) 
Ba E… 

— = 2 B'Q 7" )rQjre; (9.356b) 

= D QD ES (9.356c) 


Donc to(e;); = (QB'Q"");. En tenant compte du fait que B = Q71AQ nous avons 
tes); = (QQ'A (QT) Q x. (9.357) 


Ceci est égal à l'expression (9.355) lorsque Qf = Q71. Nous voyons que confondre transposée d’une 
application linéaire avec transposée de la matrice associée n’est valable que si nous sommes certain 
de ne considérer que des changements de base par des matrices orthogonales. 

C’est la situation typique dans laquelle nous nous trouvons lorsque nous considérons des appli- 
cations linéaires sur IR? muni de la base canonique, et que nous n’avons aucune intention de changer 
de base, et encore moins de chercher une base non orthonormale. Cette situation est clairement la 
situation la plus courante. 


Exemple 9.183 ([92]). 
Soit la base canonique {e1,e2} de R?. Nous considérons l'application linéaire t: IR? — IR? définie 
par 
t(e1) = e1 (9.358a) 
t(e2) = 0. (9.358b) 


= € 1 (9.359) 


Elle est symétrique : elle vérifie A! — A. Si nous comptions sur la transposée de matrice pour 
définir la transposée de t, nous aurions t! = t. 


La matrice de t dans cette base est 
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Soit maintenant la base f1 = e1, fa = e1 + e2. Nous avons t(f1) = fi et 
t(f2) = t(e1) + t(e2) = e1 = fi. (9.360) 
Donc la matrice de t dans cette base est 
1 1 
B = ; ; 
t o (9.361) 


Et là, nous avons B*° Z B. Donc en comptant sur cette base pour définir la transposée de { nous 


aurions tt # t. VAN 
NooMZVRooExWVKJ 


9.184. 
Autrement dit, la façon « usuelle » de voir la transposée d'une application linéaire, ne fonctionne 
dans les livres pour enfants uniquement parce qu’on y considère toujours IR”? muni de la base 
canonique ou de bases orthonormées. 

Notons que nous avons tout de même les notions d’opérateur adjoint et autoadjoint pour parler 
d'application orthogonale sans passer par la transposée, voir 9.40. 


9.11.4 Transposée : la bonne approche 
DefooZLPAooKTITdd 


Définition 9.185. 
Si f: E — F est une application linéaire entre deux espaces vectoriels, la transposée est l’appli- 
cation ft: F* — E* donnée par 

Fi(w)(x) — w(f(x)). (9.362) 
pour tout we F* etxeËE,. 

LEMooEMNNooPquZMg 
Lemme 9.186. 
Soit E muni de la base £e;} et F muni de la base {g;} et une application f: E — F. Si À est la 
matrice de f dans ces bases, alors A! est la matrice de f* dans les bases {e*} et {g*} de E* et F*. 
Autrement dit, en utilisant l'application D: M — £L(F*,E*) de la proposition 4.70, 


p(A!) = ff. (9.363) 


Démonstration. Attention aux indices, ça va chauffer "?. 
Nous allons montrer que f* = (At) sur la base {g*}, et pour cela nous appliquons f{(g*) à 
xeE : 


F'(aË)z = gË(F(x)) Définition 9.185 (9.364a) 
= (D rxf(cx)) (9.364b) 
k 
— (> tr Ag) eq. (4.88) (9.364c) 
kl 
= > tk Aix gi (qu) (9.364d) 
D kAk | 
= Ÿ TAix (9.364e) 
k 
= D (A'ritk (9.364f) 
k 
= ÿ (A)reï(z). (9.364g) 
k 
Voila. Donc nous avons 
F'(gù) = DA )rief = DA) f . (9.365) 
k 


72. Et merci à Alain Vigne pour m'avoir fait remarquer qu’il fallait mettre de l’ordre dans les indices. 
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9.187. 
Intuitivement, les rangs de f et de f' sont égaux parce que le rang est donné par la plus grande 
matrice carrée de déterminant non nul. 

Nous donnons maintenant une vraie preuve de ce résultat. 


LemSEpTcW 
Lemme 9.188 ([287)). 
Si f: E — Fest une application linéaire, alors 
rk(f) = rk(f). (9.366) 
Démonstration. Soient n = dim(E) et r = dim(F). Nous posons dimker(f) = p et donc rk(f) = 
n — p. Soit {e1,...,e,} une base de ker(f) que l’on complète en une base {e1,...,e,} de E. Nous 
considérons maintenant les vecteurs 
gi = f(ep+i) (9.367) 
pour à = 1,...,n — p. C'est-à-dire que les g; sont les images des vecteurs qui ne sont pas dans le 


noyau de f. Prouvons qu’ils forment une famille libre. Si 


np 
Sax flepxe) = 0, (9.368) 
k=1 

alors f(Yy axep+x) = 0, c’est-à-dire }, axe,+r € ker(f). Comme une base de ker(f) est {e1,..., ep}, 


il existe des b, tels que D}, agep+x = D}_, der. Autrement dit, 


p 
D areprx — D de = 0, (9.369) 
k i=1 


qui est une combinaison linéaire nulle des e;. Donc ax = b = 0 pour tout k et {. Tout ça pour dire 
que les {gi}i=1...n-p est libre. 


Étant donné que les vecteurs g1,.... 9n-p Sont libres, nous pouvons les compléter en une base 
de F: 
ER (9.370) 
7 E——— —— 
images complétion 


Nous prouvons maintenant que rk( F*) > n—p en montrant que les formes {9*}i=1..n-p forment 
une partie libre (et donc l’espace image de f* est au moins de dimension n — p). Pour cela nous 
prouvons que ft(g*) = eÿ,,. En effet 


F'(gË)(ex) = gË(F(ex)), (9.371) 
Sik=1,...,p, alors f(ex) = 0 et donc g*(f(ex)) = 0; si k = p +1 alors 
Fr )(ex) = g((exu)) = gi (ge) = du = dep = Éhitpe (9.372) 


Donc f{(g*) = e* 4, Cela prouve que les formes f'(g?) sont libres et donc que 
rk(fé>n—-p=rk(f). (9.373) 
En appliquant le même raisonnement à f* au lieu de f, nous trouvons 
rk ((F9)9) > rk(f°) (9.374) 


et donc, sachant que (ft)! = f, nous obtenons rk(f) = rk(f*). 


PropW0PIooBHFDdP 
Proposition 9.189 ([288]). 
Si f est une application linéaire entre les espaces vectoriels E et F, alors nous avons 


Image( ft) = ker(f){. (9.375) 
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Démonstration. Soient donc l'application f: E — F et sa transposée f': F* — E*. Nous com- 
mençons par prouver que Image(ft) & (ker f)+. Pour cela nous prenons w € Image( ft), c'est-à-dire 
w = ao f pour un certain élément a € F*. Si z € ker(f), alors w(z) = (ao f)(z) = 0, c'est-à-dire 
que w € (ker f)+. 

Pour prouver qu'il y a égalité, nous n’allons pas démontrer l'inclusion inverse, mais plutôt 
prouver que les dimensions sont égales. Après, on sait que si À € B et si dim À = dim B, alors 
A = B. Nous avons 


dim (Image(f')) = rk(f°) (9.376a) 
= rk(f) lemme 9.188 (9.376b) 
= dim(£E) — dim ker(f) théorème 4.46 (9.376c) 
= dim ((ker f)) proposition 4.133. (9.376d) 


Lemme 9.190 ([128]). 
Soit K un corps, E et F deux K-espaces vectoriels de dimension finie et une application linéaire 
f:E — F. L'application f est injective si et seulement si sa transposée ft est surjective. 


Démonstration. Supposons que f soit injective. Alors par le lemme 4.55, il existe g: F — E tel 
que go f = Id/g. Nous avons alors aussi (go f)t = Id|g+x, mais (go f)t = fto gt, donc ft est 
surjective. 

Inversement, nous supposons que ft: F* — E* est surjective. Alors en nous souvenant que E 
et F sont de dimension finie et en faisant jouer les identifications (ft){ = f et (E*)* = E nous 
savons qu'il existe s: E* — F* tel que ft os = Id|y+x. En passant à la transposée, 


s‘of=Id|g, (9.377) 


qui implique que f est injective. 


9.11.5 Polynômes de Lagrange 


Lemme-Définition 9.191. 
Soit E = Pa(R) l’ensemble des polynômes à coefficients réels de degré au plus n. Soient n +1 réels 
distincts ao,...,an. Nous considérons les formes linéaires associées f; € P,(R}*, 


Hi(P) = P(ai). (9.378) 


La partie {f1,..., fn} est une base de P;(R)*. 
Les polynômes de Lagrange aux points (a;) sont les polynômes de la base préduale de la base 


{fi}. 


Démonstration. Nous prouvons que l’orthogonal est réduit au singleton nul : 


Span{ fo, ..…, fn}+ = {0}. (9.379) 


La proposition 4.133 conclura. Si P € Span{f;}+, alors f;(P) = 0 pour tout à, ce qui fait que 
P(ai) = 0 pour tout à = 0,...,n. Un polynôme de degré au plus n qui s’annule en n + 1 points est 
automatiquement le polynôme nul. 


Proposition 9.192. 
Les polynômes de Lagrange aux points (a;)i=1..n sont donnés par 


P= | (9.380) 


73. Définition 9.185. 
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Démonstration. Il suffit de vérifier que f;(P;) = d;,;. Nous avons 


(P\ = Pa.) — A — Ak 
Jabre) P;(a;) (gl Per (9.381) 


Si j £ à alors un des termes est nul. Si au contraire à = 7, tous les termes valent 1. 


9.11.6 Dual de Mfn,K) 


PropH0OjJpCa 
Proposition 9.193 ([103]). 
Soit K, un corps. Les formes linéaires sur M(n, K) sont les applications de la forme 
: Mn, K) — K 
fa: M(n,K) (9.382) 
M = Tr(AM). 
Démonstration. Nous considérons l’application 
: M(n,K) — M{(n,K)* 
J: M(n,K) (n, K) (0.383) 


A+ fA 


et nous voulons prouver que c’est une bijection. Étant donné que nous sommes en dimension finie, 
nous avons égalité des dimensions de M(n,K) et (M{n,K))*, et il suffit de prouver que f est 
injective. Soit donc À telle que f4 = 0. Nous l’appliquons à la matrice (E;;)m = 0x0; : 


0 = fA(E;) = D (AE;s)an = D Au(Eiÿh = D Adaôj = À;. (9.384) 
k M m 


Donc À = 0. 


Corolaire 9.194 ([103]). 
Soient un corps K ainsi qu’une application o € M(n, K)* telle que pour tout M, N E Min, K) on 
ait 

EUMN) = (NM). (9.385) 
Alors il existe À € K tel que p = À Tr. 


Démonstration. La proposition 9.193 nous donne une matrice À € M{n,K) telle que o = fA1. 
L'hypothèse nous dit que fA(MN) = fA(NM), c'est-à-dire 


T(AMN) = Tr(ANM) (9.386) 


pour toutes matrices M, N e Mn, K). L’invariance cyclique de la trace * appliqué au membre de 
droite nous donne Tr(AMN) = Tr(MAN), ce qui signifie que 


Tr ((AM — MA)N) = 0 (9.387) 


ou encore que f4m-mA = 0, et ce, pour toute matrice M. La fonction f étant injective nous en 
déduisons que la matrice À doit satisfaire 


AM = MA (9.388) 


pour tout M € M(n,K). En particulier, en prenant pour M les fameuses matrices E;; et en 
calculant un peu, 
Axiôjm = Üi1Ajm (9.389) 


pour tout 4, j,l,m. Cela implique que Ay = Amm pour tout / et m et que A;» = 0 dès que j Æ m. 
Il existe donc À € K tel que À = À1. En fin de compte, 


P(X) = fau(X) = ATr(X). (9.390) 


74. Lemme 4.64. 
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CorICUOooPsZQrg 
Corolaire 9.195 ([103]). 
Soit K un corps. Tout hyperplan de M(n,K) coupe GL(n, K). 


Démonstration. Soit H un hyperplan de Mn, K). Il existe une forme linéaire ® sur Mn, K) telle 
que H = ker(). Encore une fois la proposition 9.193 nous donne À € Mn, K) telle que = f4: 
nous notons r le rang de À. Par le lemme 4.111 nous avons À = PJ,Q avec P,Q € GL(n, K) et 


ne É à (9.391) 


Pour tout M € Min, K) nous avons 
O(M) = Tr(AM) = Tr(PJ,QM) = Tr(J,QMP), (9.392) 
la dernière égalité découlant de l’invariance cyclique de la trace ©. Ce que nous cherchons est 


M € GLin,K) telle que (M) = 0. Nous commençons par trouver N € GL(n,K) telle que 
Tr(J,N) = 0. Celle-là est facile : c’est 


N = ( . 0) (9.393) 


Les éléments diagonaux de J,.N sont tous nuls. Par conséquent en posant M = QINP-! nous 
avons notre matrice inversible dans le noyau de 6. 


9.12 Diagonalisation et trigonalisation 


Ici encore K est un corps commutatif. 


9.12.1 Matrices semblables 
DefCQNFooSDhDpB 


Proposition-Définition 9.196 (matrices semblables[1]). 
Nous définissons, sur l’ensemble M(n,K) des matrices n x n à coefficients dans K, la relation 
A = B si et seulement si il existe une matrice P e GL(n,K) telle que B = PAP. 

Cette relation est une relation d'équivalence. 


Deux matrices équivalentes en ce sens sont dites semblables. 
PROPooXGXToOoQNAAxvw 


Proposition-Définition 9.197 (Matrices équivalentes). 
Nous définissons, sur l’ensemble M(n,K) des matrices n x n à coefficients dans K, la relation 
A = B siet seulement si il existe des matrice inversibles P et Q telles que À = PBQT. 

Cette relation est une relation d'équivalence. 


Deux telles matrice sont dite équivalentes. 
PROPoo1XFSooZsFWHm 


Proposition-Définition 9.198. 
Soit un espace vectoriel E. Nous définissons sur End(£) la relation u — v si et seulement si il 
existe une application inversible A: E — E telle que v = A-louo A. 

Cette relation est une relation d'équivalence. 


Deux endomorphismes équivalents en ce sens sont dits semblables. 
PROPooBGJBooX1DYEv 


Proposition 9.199. 
Deux applications linéaires sont semblables si et seulement si leurs matrices sont semblables dans 
toute base. 


75. Lemme 4.64. 


9.12. DIAGONALISATION ET TRIGONALISATION 683 


LEMooKUHJooDfNKeg 
Lemme 9.200. 
Le polynôme caractéristique Ÿ est un invariant sous les similitudes. 


Démonstration. En effet si P est une matrice inversible, 
Xp-14P = det(P TAP - AX1) 
= det (P(P-TAP — XX1)P 1) 
= det(A — \X1) 
— XA: 


9.394a 
9.394b 
9.394c 
9.394d 


NEA REP ONE 


La permutation de lignes ou de colonnes ne sont pas des similitudes, comme le montrent les 


exemples suivants : 
1 2 2 1 
À = F À B = e À : (9.395) 


Nous avons xY4 = X?2—5X — 2 tandis que Yp = X?—5X +2 alors que le polynôme caractéristique 
est un invariant de similitude. 


9.12.2 Trace de matrices semblables 
PROPooRMYQooWkEpJJ 


Proposition 9.201 ([1]). 
Invariance de la trace par similarité. 


(1) Soit une application linéaire f. Si la matrice de f dans une base est À et est B dans une 
autre base, alors 
Tr(A) = Tr(B). (9.396) 


(2) Deux opérateurs semblables T ont même trace. 


Démonstration. Les matrices À et B sont liées par la proposition 4.118 : B = Q-1AQ où Q est la 
matrice qui lie les vecteurs des deux bases. L’invariance cyclique de la trace donnée en le lemme 
4.64 implique que 

Tr(B) = Tr(Q 7 AQ) = Tr(QQ A) = Tr(A). (9.397) 


LEMooXXEYooKHyQjb 
Lemme 9.202. 
Soit une matrice À. Nous avons 
Tr(AÏ A) = Ÿ Al. (9.398) 
ij 


Démonstration. Utilisant la proposition 9.174 pour les éléments de la matrice AŸ, nous avons 


Tr(AÏA) = D (Al A)ar = D AA = D lAnf. (9.399) 
k HI Rl 


LEMooQXFQooLGPcIt 
Lemme 9.203 ([289)). 
Si les matrice À et B sont unitairement semblables ©, alors 


SAP = Ba (9.400) 
1j 1j 


76. Définition 9.110. 
77. Opérateurs semblables, définition 9.196 
78. Définition 9.196. 
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Démonstration. Soit une matrice unitaire U telle que B = U AU‘. Nous savons par le proposition 
9.201 que des matrice semblables ont même trace. Or B'B est unitairement semblable à AÏA parce 
que 

BB = UAÏUTU AUT = UAÏ AU. (9.401) 


Donc Tr(AA) = Tr(BiB). Le lemme 9.202 conclut. 


9.12.3 Endomorphismes nilpotents 


La trace d’une matrice À € Mn, K) est la somme de ses éléments diagonaux : 
Tr(4) = D Ai. (9.402) 


Une propriété importante est son invariance cyclique. 


LemhbZTay 
Lemme 9.204. 
Quelques propriétés de la trace. 
(1) Si A et B sont des matrices carrées, alors Tr(AB) = Tr(BA). 
(2) La trace est un invariant de similitude. 
Démonstration. C’est un simple calcul : 
Tr(AB) = > AB = > AyiBig = >, BixAxi = > (BA)i = Tr(BA) (9.403) 
ik ik ik i 


où nous avons simplement renommé les indices à  k. 
En particulier, la trace est un invariant de similitude parce que Tr(ABA7!) = Tr(A-!4B) = 
Tr(B) par l’invariance cyclique démontrée en 4.64(2). 


La trace étant un invariant de similitude, nous pouvons donc définir la trace comme étant la 
trace de sa matrice dans une base quelconque. Si la matrice est diagonalisable, alors la trace est 
la somme des valeurs propres. 

LemzgNOjY 
Lemme 9.205 ([112]). 
L'’endomorphisme u € End(C”) est nilpotent si et seulement si Tr(u?) = 0 pour tout p. 


Démonstration. Supposons que u est nilpotent. Alors ses valeurs propres sont toutes nulles et celles 
de uw? le sont également. La trace étant la somme des valeurs propres, nous avons alors tout de 
suite Tr(u?) = 0. 

Supposons maintenant que Tr(u?) = 0 pour tout p. Le polynôme caractéristique (9.233) est 


Xu = (-1)'X(X — À)... (X À). Ep us 


où les À; (i = 1,...,r) sont les valeurs propres non nulles distinctes de u. 

Il est vite vu que le coefficient de X-1 dans v, est — Tr(u) parce que le coefficient de X"-! 
se calcule en prenant tous les X sauf une fois —X;. D'autre part le polynôme caractéristique de uP 
est le même que celui de u, en remplaçant À; par A; cela est dû au fait que si v est vecteur propre 
de valeur propre À, alors uv = Xv. 

Par l'équation (9.404), nous voyons que le coefficient du terme X"-1 dans le polynôme carac- 
téristique est 


0 = Tr(u?) = a XP +. + a, PAS] 
Donc les nombres (a1,...,a,) sont une solution non triviale ” du système PRE 
GR ee (9.406a) 
(9.406b) 
MR ee 0 (9.406c) 


79. Si 1 =... @r = 0, alors les valeurs propres sont toutes nulles et la matrice est en réalité nulle dès le départ. 
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Ce sont les équations (9.405) écrites pour p = 1,...,r. Le déterminant de ce système est 
1 . 1 
À À 
A...) det | . Æ 0, (9.407) 
x x 


qui est un déterminant de Vandermonde (proposition 9.15) valant 


0=M...X [[] (xi-à;). (9.408) 


1<i<j<r 


Étant donné que les À; sont distincts et non nuls, nous avons une contradiction et nous devons 
conclure que (a1,...,a,) était une solution triviale du système (9.406). 


PropMWWJooVIXdJp 


Proposition 9.206 ([290]). 
Soit un K-espace vectoriel E. Un endomorphisme u € End(E) est nilpotent si et seulement si il 
existe une base de E dans laquelle la matrice de u est strictement triangulaire supérieure. 


Démonstration. (1) = Nous faisons la démonstration par récurrence sur la dimension de E. 


Lorsque n = 1 nous avons u = (a) avec a € K. Puisque a = 0 pour un certain # nous avons 


a = 0 parce qu'un corps est toujours un anneau intègre ®0, 


Lorsque dim(Æ) = n nous savons que u a un noyau non réduit au vecteur nul (parce qu’il 
est nilpotent). Soit donc un vecteur non nul x € ker(u) et une base 


CE: (9.409) 
donnée par le théorème de la base incomplète 4.13. La matrice de w dans cette base s'écrit 


* * * 


0 

0 

; ; (9.410) 
0 


Un tout petit peu de calcul de produit de matrice montre que la matrice de u* est de la 
forme 


_ (9.411) 


0 
0 
0 
0 
Étant donné que l’endomorphisme u est nilpotent, la matrice À l’est aussi. L'hypothèse de 


récurrence dit alors que À est strictement triangulaire supérieure (ou en tout cas peut le 
devenir par un changement de base adéquat). 


(2) = Soit une base {e1,...,e,} dans laquelle la matrice de w est strictement triangulaire 
supérieure. 
Alors u(e1) = 0 et plus généralement, u(ez) € Span£e1,...,ex_1}. Voyez par récurrence que 
ul (ex) € Span{e:,.…..,ex_1}. Donc ul(e;) = 0 dès que ! > k. 
LEMooKPWKooUacXju 


Lemme 9.207 (|1]). 
Si N E M{n,C) est une matrice nilpotente d'ordre de nilpotence r, alors NP. ai est libre 
dans M(n, ©). 


80. Lemme 1.194. 
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PROPooWTFWooXH1imhp 
Proposition 9.208 (Thème 40). 
Soit E un espace de Banach (espace vectoriel normé complet*!). Si À e L(E,E) est nilpotente, 
alors (1 — À) est inversible et son inverse est donné par 


(1-4) - ÿ A7, (9.412) 


où l'infini peut évidemment être remplacé par l’ordre de nilpotence de A. 


Démonstration. En ce qui concerne la convergence de la somme, elle ne fait pas de doute parce 
que À étant nilpotente, la somme contient seulement une quantité finie de termes non nuls. 
Montrons à présent que la somme est l’inverse de 1 — À en multipliant terme à terme : 


nm nm 
D AË(I—A)= D (AË — AËTT) = 1 — AT, (9.413) 
k=0 k=0 
Par conséquent 
|1 — > AË(1 — A)| = |A47#1] = 0. (9.414) 


La dernière limite est en réalité une égalité pour n assez grand. 


9.12.4 Endomorphismes diagonalisables 
DefCNJqsmo 


Définition 9.209. 
Une matrice est diagonalisable si elle est semblable*? à une matrice diagonale. 

Une application linéaire est diagonalisable si elle est semblable*® à une application linéaire 
diagonale. 

Autrement dit, À est diagonalisable si il existe un opérateur diagonal D et un opérateur inver- 
sible P tels que PAP! = D. 


La proposition 9.199 nous assure que la notion de diagonalisabilité pour les matrices et pour 


les applications sont les mêmes. 
PROPooDEEToOoSOMiGO 


Proposition 9.210. 
Si À est un opérateur diagonalisable dont les valeurs propres sont X;, alors il existe un opérateur 
inversible Q tel que 


A=Q"!DQ (9.415) 
où D est l’opérateur diagonal contenant les À; sur sa diagonale. 
Lemme 9.211. 


Une matrice triangulaire supérieure avec des 1 sur la diagonale n’est diagonalisable que si elle est 
diagonale (c’est-à-dire si c'est la matrice unité). 


Démonstration. Si À est une matrice triangulaire supérieure de taille n telle que À;; = 1, alors 
det(A — A1) = (1 — À)”, ce qui signifie que Spec(A) = {1}. Pour la diagonaliser, il faudrait une 
matrice P e GL(n, K) telle que 1 = P-!AP, ce qui est uniquement possible si À = 1. 


LemgnaEUÜk 
Lemme 9.212. 
Soit Fun sous-espace stable par u. Soit une décomposition du polynôme minimal 


u = PM...Pr (9.416) 


81. Définition 7.255. 
82. Définition 9.196. 
83. Définition 9.198. 
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où les P; sont des polynômes irréductibles unitaires distincts. Si nous posons E; = ker P}", alors 


F=(FnÆ)@...@(FreE,). (9.417) 
ThoDigLEQEXR 

Théorème 9.213. 
Soit E, un espace vectoriel de dimension n sur le corps commutatif K et u € End(E). Les propriétés 
suivantes sont équivalentes. ItemThoDigLEQEXRiv 


(1) L'endomorphisme u est diagonalisable. TtemThoDigLEQEXRi 
(2) I existe un polynôme P € K[X] non constant, scindé sur K, dont toutes les racines sont 

simples, tel que P(u) = 0. ItemThoDigLEQEXRii 
(3) Le polynôme minimal a est scindé sur K et toutes ses racines sont srplEhoDi gLEQEXRI 11 
(4) Tout sous-espace de E possède un supplémentaire stable par u. ITEMooZNJFo0EiqDYp 


(5) Dans une base adaptée, la matrice de u est diagonale et les éléments diagonaux sont ses 
valeurs propres. 


Démonstration. Plein d’implications à prouver. 
(1) (2) implique (3) Étant donné que P(u) = 0, il est dans l’idéal des polynômes annulateurs 
de u, et le polynôme minimal uw, le divise parce que l’idéal des polynômes annulateurs est 
généré par w par le théorème 6.43. 


(2) (3) implique (1) Étant donné que le polynôme minimal est scindé à racines simples, il 
s'écrit sous forme de produits de monômes tous distincts, c’est-à-dire 


A - NA) (9.419) 


où les À; sont des éléments distincts de K. Étant donné que wy(u) = 0, le théorème de 
décomposition des noyaux (théorème 9.89) nous enseigne que 


E = ker(u — M)®...®@ker(u — À). (9.420) 


Mais ker(u — À;) est l’espace propre Ex,(u). Donc u est diagonalisable. 

(3) (1) implique (4) Soit {ei,...,e,} une base qui diagonalise u, soit F un sous-espace de ÆE 
et {f1,...,f} une base de F. Par le théorème 4.17(2), nous pouvons compléter la base de F 
par des éléments de la base {e;}. Le complément ainsi construit est stable par u. 


(4) (4) implique (1) En dimension un, tout endomorphisme est diagonalisable, nous suppo- 
sons donc que dim ÆE = n > 2. Nous procédons par récurrence sur le nombre de vecteurs 
propres connus de u. Supposons avoir déjà trouvé p vecteurs propres e1,...,e, de u. Consi- 
dérons H, un hyperplan qui contient les vecteurs e1,...,e,. Soit F un supplémentaire de H 
stable par u; par construction dim F = 1 et si e,41 € F, il doit être vecteur propre de u. 


RS 
[SA 
Le à 


(1) implique (2) Nous supposons maintenant que u est diagonalisable. Soient À1,...,Àr 
les valeurs propres deux à deux distinctes, et considérons le polynôme 


P(x) = (X — À)... (X — X,). (9.421) 
Alors P(u) = 0. En effet si e; est un vecteur propre pour la valeur propre À;, 


P(u)e; = IBIC — };)o (u — Aje; = 0 (9.422) 
JA 


par le lemme 9.88. Par conséquent P(u) s’annule sur la base {e;}. 


84. Le polynôme caractéristique, lui, n’a pas spécialement ses racines simples; il peut encore être de la forme 


T 


Xa(X) = [ [ZX - 1), (9.418) 


i=1 


mais alors dim(ÆE,,) = œ. 
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(6) (5) implique (2) Si la matrice À est diagonale alors le polynôme P = [[;_,(X — A) est 
annulateur de À. En effet, 


n nm 


P(A}ex = [ I(A — À;;)x = [I (u(ex) — Aïex) =TI( (Axrex — Ac) = 0 (9.423) 
=] 


i=1 À = 


parce que le facteur à = k est nul. 


TS 
—] 
— 


(3) implique (5) le polynôme minimal de uw s’écrit 


= (= MX) (9.424) 


et les espaces Æ; du lemme 9.212 sont les espaces propres E; = ker(u — À;). Nous avons donc 
une somme directe 


E-E@...@E. (9.425) 


Dans chacun des espaces propres, u a une matrice diagonale avec la valeur propre correspon- 
dante sur la diagonale. Une base de Æ constituée d’une base de chacun des espaces propres 
est donc une base comme nous en cherchons. 


CorQeVqssS 
Corolaire 9.214. 
Si u est diagonalisable et si F est un sous-espace stable par u, alors 


F=G@GEwrF (9.426) 
À 


où Ex(u) est l’espace propre de u pour la valeur propre À. En particulier la restriction de u à F, 
ulr est diagonalisable. 


Démonstration. Par le théorème 9.213, le polynôme y est scindé et ne possède que des racines 
simples. Notons le 


HP de res: (9.427) 


Les espaces Æ; du lemme 9.212 sont maintenant les espaces propres. 
En ce qui concerne la diagonalisabilité de u|r, notons que nous avons une base de F composée 
de vecteurs dans les espaces Ex(u). Cette base de F est une base de vecteurs propres de u. 


Lemme 9.215. 
Soient E un K-espace vectoriel et u € End(E). Si Card (Spec(u)) = dim(Æ) alors u est diagona- 
lisable. 


Démonstration. Soient À1,...,À, les valeurs propres distinctes de u. Nous savons que les espaces 
propres correspondants sont en somme directe (lemme 9.87). Par conséquent Span{ÆE,,(u)} est de 
dimension n = dim(Æ) et u est diagonalisable. 


Voici un résultat de diagonalisation simultanée. Nous donnerons un résultat de trigonalisation 


simultanée dans le lemme 12.105. 
PropGqhAMei 


Proposition 9.216 (Diagonalisation simultanée). 


Y se 5 , . : : 
Soit (ui)ier une famille d’endomorphismes qui commutent deux à deux. TtenGahAMei 


(1) Sii,j e T alors tout sous-espace propre de uw; est stable par u;. Autrement dit u; (EX(u)) = 
E, (u;). 


(2) Si les u; sont diagonalisables, alors ils le sont simultanément. 
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Démonstration. Supposons que u; et u; commutent et soit x un vecteur propre de u; : lt) = À 
Nous montrons que u;(x) € Ex(u;). Nous avons 


W(u;(r)) =u;(u;(x)) = Au;(r). (9.428) 


Par conséquent u;(x) est vecteur propre de u; de valeur propre À. 

Montrons maintenant l'affirmation à propos des endomorphismes simultanément diagonali- 
sables. Si dim E£ = 1, le résultat est évident. Nous supposons également qu'aucun des u; n’est 
multiple de l'identité. Nous effectuons une récurrence sur la dimension. 

Soit up un des uw; et considérons ses valeurs propres deux à deux distinctes À1,...,À,. Pour 
chaque k nous avons 

E, (uo) £ E, (9.429) 


sinon üQ serait un multiple de l'identité. Par contre le fait que wo soit diagonalisable permet de 
décomposer E en espaces propres de üo : 


k 


Ce que nous allons faire est de simultanément diagonaliser les (u;);er sur chacun des E\, séparé- 
ment. Par le point (1), nous avons u;: E\, (uo) — E;,(uo), et nous pouvons considérer la famille 
d'opérateurs 


CE . (9.431) 
Ce sont tous des opérateurs qui commutent et qui agissent sur un espace de dimension plus petite. 


Par hypothèse de récurrence nous avons une base de E;, (uo) qui diagonalise tous les u;. 
ExewINgYo 


Exemple 9.217. 

Soit un espace vectoriel sur un corps K. Un opérateur involutif est un opérateur différent de 
l'identité dont le carré est l'identité. Typiquement une symétrie orthogonale dans R?. Le polynôme 
caractéristique d’une involution est X? — 1 = (X +1)(X — 1). 

Tant que 1 # —1, X?—1 est donc scindé à racines simples et les involutions sont diagonalisables 
(9.213). Cependant si le corps est de caractéristique 2, alors X?—1 = (X +1)? et l’involution n’est 
plus diagonalisable. 

Par exemple si le corps est de caractéristique 2, nous avons 


À = 6 1) (9.432a) 


A? = È 1) L ( à (9.432b) 


Cette matrice À représente donc une involution, mais n’est pas diagonalisable. A 


9.12.5 Diagonalisation : cas complexe, pas toujours 


Il n’est pas vrai qu’une matrice de M(n,C) soit toujours diagonalisable. En effet le théo- 
rème 9.213(3) dit qu’une matrice est diagonalisable si et seulement si son polynôme minimal est 
scindé à racines simples. Certes sur € le polynôme minimal sera scindé, mais il ne sera pas spé- 
cialement à racines simples. 


Exemple 9.218. 
La matrice 


= È 1) (9.433) 


a pour polynôme caractéristique XA(X) = X?. C’est également son polynôme minimal, qui n’est 
pas à racine simple. 

Il est par ailleurs facile de voir que le seul espace propre de À est Span{(1,0)} (ici le span est 
sur C). Donc l’espace C? ne possède pas de base de vecteurs propres de A. A 
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Ce qui est vrai, c’est que le polynôme caractéristique a des racines, et que ces racines cor- 
respondent à des vecteurs propres. Mais il n’y a pas toujours autant de vecteurs propres que la 
multiplicité des racines. 


9.219. 
Lorsque la diagonalisation n’est pas possible, il est souvent possible de trigonaliser. Les matrices 
triangulaires ne sont pas aussi faciles à manipuler que les matrices diagonales, mais c’est toujours 
ça de pris. 

Nous étudierons ça plus tard, en 12.10.1 parce que ça va nécéssiter le théorème de d’Alembert. 


9.12.6 Diagonalisation : cas réel 
LemSchureRelnrqfiy 


Lemme 9.220 (Lemme de Schur réel). 
Soit À e M(n,R). I existe une matrice orthogonale Q telle que Q=!AQ soit de la forme 


À * * * * 
0 
0 O0 À * # E 
_ FT qMtr T 
g"4o-| 0 (e à | (D 481) 
C1 di 
as Ds 
0 0 0 0 (r: 


Le déterminant de A est le produit des déterminants des blocs diagonaux et les valeurs propres de 
À sont les À1,...,X, et celles de ces blocs. 


Démonstration. Si la matrice À a des valeurs propres réelles, nous procédons comme dans le cas 
complexe. Cela nous fournit le partie véritablement triangulaire avec les valeurs propres À1,..., À 
sur la diagonale. Supposons donc que À n’a pas de valeurs propres réelles. Soit donc & + i5 une 
valeur propre (8 Æ 0) et u + iv un vecteur propre correspondant où u et v sont des vecteurs réels. 
Nous avons 


Au +iAv = A(u+iv) = (a +ifB)(u +iv) = au — Bu + i(av + Bu), (9.435) 


et en égalisant les parties réelles et imaginaires, 


Au = au — Bu (9.436a) 
Av = av + Bu. (9.436b) 


Sur ces relations nous voyons que ni u ni v ne sont nuls. De plus u et v sont linéairement indépen- 
dants (sur R), en effet si v = Au nous aurions Au = au— Bu = (a— B\)u, ce qui serait une valeur 
propre réelle alors que nous avions supposé avoir déjà épuisé toutes les valeurs propres réelles. 

Étant donné que u et v sont deux vecteurs réels non nuls et linéairement indépendants, nous 
pouvons trouver une base orthonormée {q1,qg2} de Span{u,v}. Nous pouvons étendre ces deux 
vecteurs en une base orthonormée {q1,q2,q3,...,qn} de R”. Nous considérons à présent la matrice 
orthogonale dont les colonnes sont formées de ces vecteurs : Q = [q1 q2 ...Qn]. 

L'espace Span{e1,e2} est stable par Q7!AQ, en effet nous avons 


Q71AQe; = Q7'Aqu = Q7 (aq + bq2) = ae + beo. (9.437) 


La matrice Q-!AQ est donc de la forme 


Q7'AQ = é ) a (9.438) 
0 A 
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où C est une matrice réelle 2 x (n — 1) quelconque et A; est une matrice réelle (n — 2) x (n — 2). 
Nous pouvons appliquer une récurrence sur la dimension pour poursuivre. 

Notons que si À n’a pas de valeurs propres réelles, elle est automatiquement d’ordre pair parce 
que les valeurs propres complexes viennent par couple complexes conjugués. 

En ce qui concerne les valeurs propres, il est facile de voir en regardant (9.434) que les va- 
leurs propres sont celles des blocs diagonaux. Étant donné que Q7!AQ et A ont même polynôme 
caractéristique, ce sont les valeurs propres de À. 


ThoeTMXla 

Théorème 9.221 (Théorème spectral, matrice symétrique[103]). 
Une matrice symétrique réelle, LTEMoo JWHLooSFhNSW 
(1) a un spectre contenu dans R ITEMooMWWROOXxCONW 


(2) est diagonalisable par une matrice orthogonale. 


Si M est une matrice symétrique réelle alors IR” possède une base orthonormée de vecteurs propres 
de M. 


Démonstration. Soit À une matrice réelle symétrique. Elle agit sur l’espace C” par la définition 
4.67, et en particulier la formule 4.84. Nous munissons de plus C” de la forme sesquilinéaire définie 
en la proposition 9.179. 

Si À est une valeur propre complexe pour le vecteur propre complexe v, alors d’une part 
(Av, v) = X(v, 0) et d'autre part (Av, v) = {v, Au) = X{v, v). Par conséquent À = À, et À est réelle. 

Le lemme de Schur réel 9.220 donne une matrice orthogonale Q qui trigonalise À. Les valeurs 
propres étant toutes réelles, la matrice Q=!AQ est même triangulaire (il n’y a pas de blocs dans 
la forme (9.434)). Prouvons que Q-!AQ est symétrique : 


(Q7TAQ) = Qf4(Q7") = QT AÏQ = Q7 AQ (9.439) 


où nous avons utilisé le fait que Q était orthogonale (Q-1 = Q) et que À était symétrique (At = À). 
Une matrice triangulaire supérieure symétrique est obligatoirement une matrice diagonale. 

En ce qui concerne la base de vecteurs propres, soit {e;};-1..n la base canonique de R” et 
Q une matrice orthogonale telle que À = QtDQ avec D diagonale. Nous posons f; = Q'e; et en 
tenant compte du fait que Qt = Q71 nous avons Af; = Q'DQQ'e; = Q'\ie; = À;fi. Donc les f; 
sont des vecteurs propres de À. De plus ils sont orthonormés parce qu’en utilisant la proposition 
9.182, 


fi F5) = <Qei, Q'e;) = es, Q'Qe;) = Le, e;) = bij. (9.440) 


Le théorème spectral pour les opérateurs autoadjoints sera traité plus bas parce qu’il a besoin 


de notions sur les formes bilinéaires, théorème 11.6. 
RemGKDZfxu 


Remarque 9.222. 
Une matrice symétrique est diagonalisable par une matrice orthogonale. Nous pouvons en réalité 
nous arranger pour diagonaliser par une matrice de SO(n). Plus généralement si À est une matrice 
diagonalisable par une matrice P € GL*(n,R) alors elle est diagonalisable par une matrice de 
GL-(n,R) en changeant le signe de la première ligne de P. Et inversement. 

En effet, si nous avons PDP = À, alors en notant + les quantités qui ne dépendent pas de a, 
b ou c, 


a * * A 0 O0 a b c a * * Ma Ab Ac 
D + + 0 À 0 ke x x|]—= | D + + # # + 
C + % 0 0 À3 0 + +  * C + % + + + 


à (9.441) 
Aa +%x Ajab+x Àjac + * 
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Nous voyons donc que si nous changeons les signes de a, b et c en même temps, le résultat ne 


change pas. 
PROPooQHHPooSqpgcb 


Proposition 9.228. 


Une forme bilinéaire est non-dénénérée *” 


si et seulement si sa matrice associée est inversible. 
Démonstration. Nous savons que la matrice associée est symétrique et qu’elle peut donc être 
diagonalisée (théorème 9.221). En nous plaçant dans une base de diagonalisation, nous devons 
prouver que la forme est non-dégénérée si et seulement si les éléments diagonaux de la matrice 
sont tous non nuls. 

Écrivons b(x, z) en choisissant pour z le vecteur de base ex de composantes (ex); = ôk; : 


br.) 5 miles); = bieti = bEkTk. (9.442) 


Si b est dégénérée et si x est un vecteur non nul (disons que la composante x; est non nulle) de 
E tel que b(x,z) = 0 pour tout z € E, alors b;; = 0, ce qui montre que la matrice de b n’est pas 
inversible. 

Réciproquement si la matrice de b est inversible, alors tous les bzx sont différents de zéro, et le 
seul vecteur x tel que bz,xx = 0 pour tout k est le vecteur nul. 


9.12.7 Matrice définie positive 
DefAWAooCMPuVM 


Définition 9.224 (Matrice définie positive, opérateur défini positif). 
Un opérateur sur un espace vectoriel sur € ou R est défini positif si toutes ses valeurs propres 
sont réelles et strictement positives. Il est semi-défini positif si ses valeurs propres sont réelles 
positives ou nulles. 

Mêmes définitions pour une matrice. 


Afin d'éviter l’une ou l’autre confusion, nous disons souvent strictement défini positif pour 
positif. 
NORMooAJLHooQhwpvr 
9.225. 
Quelques ensembles de matrices symétriques. 


(1) S(n, R) est l’ensemble des matrices symétriques réelles n x n. 


(2) S*(n, R) l’ensemble des matrices réelles symétriques n x n définies positives. 


(3) STT(n,1R) le sous-ensemble de S*(n,IR) des matrices strictement définies positives. 


Remarque 9.226. 
Nous ne définissons pas la notion de matrice définie positive pour une matrice non symétrique. 


PropcnJyXZ 
Proposition 9.227. 
Soit M, une matrice symétrique. Nous avons ITEMooTJVQooYmRkas 
(1) det(M) > 0 et Tr(M) > 0 implique M définie positive", 
(2) det(M) > 0 et Tr(M) < 0 implique M définie négative, ten lun Ebt 


) 

(M) 

(3) det(M) < 0 implique ni semi-définie positive, ni définie négative 

(4) det(M) = 0 implique M semi-définie positive ou semi-définie négative. 
Lorsqu'un énoncé parle d’une matrice symétrique, le premier réflexe est de la diagonaliser : 

considérer une matrice orthogonale Q telle que QMQ = D avec D diagonale. Et les valeurs 


85. Définition 9.127. 
86. Définition 9.224. 
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propres sur la diagonale : Dyz = À4. Les matrices symétriques définies positives ont cependant des 
propriétés même en dehors de leur base de diagonalisation. 


Pour rappel, {x, y} est le produit scalaire dans R’ défini par la proposition 9.169. 
LemWZFSooYvksjw 


Lemme 9.228. 
Soit une matrice symétrique M. ITEMooSKRAooOgHbGA 
(1) Elle est strictement définie positive si et seulement si x, Mx) > 0 pour tout x non nul dans 
R7. ITEMooMOZYooWcrewZ 
(2) Elle est semi-définie positive si et seulement si {x, Mx) > O0 pour tout ren hs z 


(3) Si elle est seulement définie positive, alors {x, Mx) > X|x|? dès que À > 0 minore toutes les 
valeurs propres. 


Démonstration. Démonstration en trois parties. 


(1) @) Soit {ei};=1...n une base orthonormée de vecteurs propres de M dont l’existence est 
assurée par le théorème spectral 9.221. Nous nommons x; les coordonnées de x dans cette 
base. Alors, 


(zx,Mzx)=— D ivitei t;Me;) = D iviry(es, À er Dr Gi = Dia (9.443) 


ä,j d,j 
où les À; sont les valeurs propres de M. Le produit{x, Mx) est strictement positif pour tout 
x si et seulement si tous les À; sont strictement positifs. 


(2) (2) Nous avons encore 


(x, Max) = Ÿ xx? (9.444) 


qui est plus grand ou égal à zéro si et seulement si tous les À; sont plus grands ou égaux à 
zéro. 


(3) (3) 
Soit une matrice orthogonale T diagonalisant M, c’est-à-dire telle que T'MT = D avec D 
diagonale. Nous allons vérifier que si À < min{;}, alors 


(Ta, MT > AITx[? D PL) 


our tout x. Si nous ons sidéro ons la base de diagonalisation {e our les valeurs propres À 
P BEQSooHBIYooSpkYAl 8 { k} P Fe k 
nous avons le calcul 


&Tx, MTx) = x, T'MTx) (9.446a) 
=D (9.446b) 
_ De zx Dex) (9.446c) 
k 
E ns —7/ 
.. 
> D Xxx/? en posant} = min{;} (9.446e) 
k 


Nous avons donc 
(Ta, MTa) > D Mal = Mel? = AÏTz|?. (9.447) 
k 


Au dernier passage nous avons utilisé le fait que T est une isométrie (proposition 9.43). 
L'’inéquation (9.445) est démontrée. 
Comme T est une bijection ®’, cela implique le résultat pour tout x. 


87. Une matrice orthogonale a un déterminant qui vaut +1. 
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Les personnes qui aiment les vecteurs lignes et colonnes écriront des inégalités comme 
ziMax > xx. (9.448) 


Tout à l’autre bout du spectre des personnes névrosées des notations, on trouvera des inégalités 
comme 


MirDr) es (9.449) 


Le penchant personnel de l’auteur de ces lignes est la notation avec le produit tensoriel. Si vous 
aimez ça, vous pouvez lire la section 11.12.14 et en particulier ce qui suit (11.642). 

La notation adoptée ici avec le produit scalaire x, Mx), qui peut aussi être écrite x +: Mx est 
entre les deux. Elle a l’avantage de n'être pas technologique comme le produit tensoriel (si vous y 
mettez les pieds, vous devez savoir ce que vous faites), tout en évitant de se casser la tête à savoir 


qui est un vecteur ligne ou un vecteur colonne. 
PROPooNASKooMFRRU 


Proposition 9.229. 
Une application bilinéaire est définie positive ® si et seulement si sa matrice symétrique associée 
l’est. 


89 


Démonstration. La définition 9.124 dit que b est strictement définie positive lorsque b(x,x) > 0 et 
b(x, x) = 0 si et seulement si x = 0. 

D'autre part, le lemme 9.228 dit que la matrice B est strictement définie positive lorsque 
x Bx >0et x: Bx=0 si et seulement si x = 0. 

Le lien entre les deux est que le lemme 9.147 nous enseigne que pour tout x et y, 


bx,y) = x : By (9.450) 


où B est la matrice de b. 


PROPooCIEUooODafwm 
Proposition 9.230. 
Soit une forme quadratique qg: E — K et sa matrice ° (gi5) € Mn, K). Nous avons 


nm nm 
gx) = D > ayuit; 
i=1 j=1 


Démonstration. La première égalité est seulement l’expression de la matrice de q. Pour la seconde, 
on découpe la somme sur j en trois parties : j < 4, j =iet j >1: 


q(x) = > ” QijTitj + D it? + + > QijTiTj. RGO ORAS 


à j<i î À j>i 


n 
. it? +2 y», QijTiTj. FAO 


i=1 1<i<j<n 


Nous pouvons utiliser le lemme 1.304 en posant À = {(i,j) tel que j < 1}, B = {(i,j) tel que j > 
i}, et en considérant la bijection 
p: A—b 


Gi, 5) + (5,5). (9.453) 


Nous avons alors 


» US » QjitjTi — D dijtit;. (9.454) 


(i,7)EA (i,3)eB (i,j)eB 


La première égalité est le lemme et la seconde est la symétrie de q. Bref, dans (9.452), le premier 
et le dernier termes sont égaux. 


88. Définition 9.124. 
89. Par la proposition 9.140. 
90. Matrice associée à une forme quadratique, définition 9.146. 
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9.231. 

De nombreux auteurs préfèrent écrire des choses comme x!By ou xB‘y ou æBy' et se poser de 
longues questions sur qui est un « vecteur colonne » et qui est un « vecteur ligne », et si la matrice 
B soit être transposée ou non. Toutes ces notations servent(?) à cacher un bête produit scalaire. 


9.232. 

Notons que la matrice associée à une forme bilinéaire (ou quadratique associée) est uniquement 
valable pour une base donnée. Si nous changeons de base, la matrice change. Cependant lorsque 
nous travaillons sur R”, la base canonique est tellement canonique que nous allons nous permettre 
de parler de « la » matrice associée à une forme bilinéaire. 


Corolaire 9.233. 
Une matrice symétrique strictement définie positive est inversible. 


Démonstration. Si Ax = 0 alors {Ax,x) = 0. Mais dans le cas d’une matrice strictement définie 
positive, cela implique æ = 0 par le lemme 9.228. 


Lemme 9.234. 

Pour une base quelconque, les éléments diagonaux d’une matrice symétrique semi-définie posi- 
tive sont positifs. Si la matrice est strictement définie positive, alors les éléments diagonaux sont 
strictement positifs. 


Démonstration. Il s’agit d’une application du lemme 9.228. Si À est définie positive et que {e;} est 
une base, alors 
À; = {Ae:, ei) > Xle:|? = > 0. (9.455) 


Si À est strictement définie positive, alors À peut être choisi strictement positif. 


9.12.8 Réduction de Gauss 
THOoo0MMFooKxqICsS 


Théorème 9.235 (Réduction de Gauss[291, 292]). 
Soit une forme quadratique non nulle q sur l’espace vectoriel E sur le corps K. Il existe une base 
{li}i=1,..n de E* et des coefficients a; € K tels que 


nm 
ar) = > œli(x)?. (9.456) 
i=1 
Démonstration. Notre point de départ sont les formules (9.451) pour la forme quadratique. Nous 
allons faire la preuve par récurrence sur la dimension de l’espace. Si n = 1, alors nous avons 
seulement 
q(x) = ax? (9.457) 


et donc le théorème est fait avec (x) = x. 
Nous supposons que le théorème est prouvé pour tout espace de dimension n. Une forme 
quadratique pour un espace de dimension n + 1 s'écrit 


n+1 
q(x) = >, mur? + 2 > sms: (9.458) 
i=1 1<i<j<n+1 
Vu que q est non nulle, un des m;; est non nul. Nous allons diviser en plusieurs cas. 
— mu À 0 
— my À 0 avec k Zl 
— Mm12 £ 0 et m;; = 0 pour tout 1. 
— my Z 0 avec (k,l) Æ (1,2) et m;; = 0 pour tout 1. 


Ces cas ne sont pas exclusifs, mais ils couvrent toutes les possibilités. 
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(1) Si mu <0 Nous écrivons q sous la forme 


n+1l n n+1 
gr) = mur + D muni +23 ( D myxix;) (9.459a) 
i=2 i=1 j=i+i 
n+1 n On+l 
_ mu) + : Mit? +2 À Mas Dit 2): ui ide) (9.459b) 
i=2 j=i+1 
n+1l 
= mur + 2%: MAjTk + R(x»2, es Lis) (9.459c) 
j=2 
HÊbe 
= M] «( + 2æ%1 Ni | LR(mo: tnt) (9.459d) 
î= AU 
= M1] (& + 2%1f(x2,... “Bnsa)) + R(x2,...,Tn+1) (9.459e) 


ma (ar + f(x, \Zn41))” — muif(t2,...,Tny1)* + R(to,...,Œny1) (9.459) 


où 
— Rest une forme quadratique de n — 1 variables ; 
L +1 maj 
— nous avons noté f(r2,...,%n+1) = D Dre ÿ 
Maintenant, toute la partie — f(x2,...,24n11)?+R(x9,...,%n11) est une forme quadratique de 
n variables. Par hypothèse de récurrence, il existe des coefficients a; et des formes linéairement 
indépendantes sur K° l{(x2,...,2n+1) telles que 
n+1 
2 - à 
— f(x2,...,Æn+1) + R(t2,...,Æn+1) = D dl (To, ... ,Tn+1)*. (9.460) 
i=2 
En posant ensuite l;(4%1,...,%n41) = lite... ,Œn+1), ainsi que l1(%1,...,Tn+1) = T1 + 
f(&2,..., Tn+1), nous avons 
n+1 
q(x) = mul(x de À ail; ; (9.461) 


(2) Si mx # 0 avec k Z1 
Nous nommons k le plus petit entier pour lequel mzx Æ 0, et nous supposons que k Æ 1, 
parce que nous avons déjà couvert ce cas. Dans ce cas, nous avons 


- DA NT NN 2 4 
gx) = Mekté + MjjTÿ + 2 > ( > Mb), (9.462) 
j=k+1 il j=iti 


et tout tourne comme dans le premier cas. 


(3) mx = 0 pour tout à et m2 Æ 0 Nous écrivons q en séparant les termes mx : 


q(x) = 2 » Rte (9.463a) 
1<i<j<n+1 
= 2M12%1TX2 + 2 >. MI1jT1Tÿ + 2 Y. Mij Lit j (9.463b) 
2<j<n+1 2<i<j<n+1 
= 2M12T1T2 + 2%: MIT; + 2 D MIjL2Tÿ; + 2 MijTiT; (9.463c) 
2<j<n+1 3<j<n+1 3<i<j<n+l 


SUBEQooLBXB 
= 2M12T1%2 + dif (ts, ce eh) + x2g(t3, ne Lo) + T(x3, LE Re u RAA 


où f et g sont linéaires et Test multilinéaire. 
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À ce moment, nous tentons de factoriser toute la partie concernant x1 et x2. L'idée est 
d'utiliser ceci : 
(e1 + g)(x2 + f) = mice + dif + mag + fg, (9.464) 


mais en mettant les bons coefficients pour reproduire ce que nous avons dans (9.463d) : 


2 
(2m12 + 2g)(x2 + se = 2m12%1%2 + 271f + 2%. (9.465) 
m12 m12 
Cela pour dire que 

_ F 2f9 
g(x) = 2{miots + g)(xo + ——) - = +T (9.466) 

m12 m12 
où —2fg/m12 + T est une forme quadratique de %3,...,%n+1, c’est-à-dire de n — 1 variables. 


L'hypothèse de récurrence nous donne des formes linéaires (l;);=3...n+1 telles que 


n+1l 
—_—. T = D) (071) ;C . (9.467) 
Nous pouvons donc déjà écrire 
n+1l 
q(x) = 2i(x)B(x) + > œli(x)” (9.468) 
i=3 


où 
— Les forme /; avec à > 3 ne dépendent pas de x1 et x2, et sont donc indépendantes de {1 
et lo. 


— La forme /! ne dépend pas de %2, 
— La forme /; ne dépend pas de %1. 


Ce sont donc n + 1 formes linéaires indépendantes. Le seul problème résiduel est que les 
formes [! et l, arrivent en produit l’une de l’autre. Nous en définissons donc deux de plus : 
1 ! ! 

L(x) = 5 1 + lo) 

i (9.469) 

(a) = 5 — 8), 


qui sont linéairement indépendantes l’une de l’autre et indépendantes des /; (i > 3). Au final, 


n+1 


q(x) = dj (x) 2+ (x 24 à Qi A | - (9.470) 


(4) Si my = 0 et m2 = 0 et my £ 0 avec k <1 Nous considérons la permutation 


o:{1,...,n+1}—{1,...,n+1} 


1 sii=k 
2 si 
| =. (9.471) 
im 4k sii-=1 
| sii—2 
à sinon, 
c’est-à-dire que o permute 1 et k ainsi que 2 et /. Ensuite nous posons 
5: R°+1 — R'°+1 
(9.472) 


a > Ec(i) 
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Nous allons un peu considérer q o s, pour changer : 


(q () s)(x) _ À mijs(æ)is(x); — > To(i)Lo(j): FARM er 
1,9 1] 


parce que s(x); = Té(i)- 
Utilisons un petit abus de notation pour considérer 


o:{l1,...,n+1}x{1,...,n+1}—{1,...,n+1}x{1,...,n+1} 


(5) + (o(i),o(ÿ)). 


Cela est une bijection ; nous pouvons utiliser le lemme 1.302 pour permuter les termes dans 
(9.473) : 


(9.474) 


(q S s) (x) " » Mo(i)o(i)Loo(i)Loo(j) (9.475a) 
ij 


: ” __——. ÉQooPCTGon ARE, 


où nous avons posé Gij = Mo(i)o(s) €t Utilisé le fait que o = o-!. Le point intéressant de 
l’histoire est que dans (9.475b), a12 = my # 0. La forme gos est donc dans le cas déjà traité 
et il existe des formes linéaires /! telles que 


n+1l 


(go s)(x) = À œili(x)?. (9.476) 


i=1 


En évaluant cela en s(x), et en tenant compte de s = 57! 


q(x) = : ak o s)(x)?, (9.477) 


, nous trouvons 


de telle sorte que l; = l{ 0 s soit la réponse à notre théorème. 


9.12.9 Orthogonalité pour une forme bilinéaire 
PROPooYXMMooYIuGRd 


Proposition 9.236 ([292]). 
Soient un espace vectoriel (E,K) et une forme quadratique *! q. Une base de E est q-orthogonale °? 
si et seulement si la matrice de q dans cette base est diagonale. 


Démonstration. La matrice de q est donnée par Q;; = b(e;,e;). Donc oui, cette matrice est diago- 
nale si et seulement si les e; sont orthogonaux. 


PROPooRERSooFHwWtB 
Proposition 9.237 ([1]). 
Si b est une forme bilinéaire symétrique non dégénérée, et si q est la forme quadratique associée, 
alors il existe une base q-orthogonale. 
Les vecteurs de cette base ne sont pas isotropes ” 


Démonstration. Nous considérons une base {e;} de E. Vu que b est symétrique, elle est donnée 
par une matrice symétrique selon la formule b(x,y) = Yu Sxitxy. Le théorème 9.221 permet de 
diagonaliser S par une matrice orthogonale : il existe une matrice diagonale D et une matrice 
orthogonale À telles que S = AfDA. 


91. Définition 9.123. 
92. Définition 9.145. 
93. Définition 9.141. 


9.12. DIAGONALISATION ET TRIGONALISATION 699 


Nous posons alors 5; — Ae;, et nous vérifions que c’est bon. Nous avons : 


b(si,5;) =}, Sk(si)a(s;à (9.478a) 
kl 

= > ,Su(4e:)k(Ae;)i (9.478b) 
kl 

= > SuAkiAi (9.478c) 
kl 

= D (AS Ai; (9.478d) 

. D, (9.478e) 


Vu que b n’est pas dégénérée, les éléments diagonaux de D ne sont pas nuls. Donc les vecteurs 5; 
vérifient b(s;,s;) # 0. 


PROPooZYISooQZNgeo 
Proposition 9.238. 
Soit une forme quadratique q. Si une base (e;) de E est qg-orthogonale, alors B = £e; tel que q(e;) = 
0} est une base de ker(q). 


Démonstration. Nous considérons un vecteur de base e;, et nous montrons que g(e;) = 0 si et 
seulement si e; € ker(g). Nous savons par la proposition 9.236 que la matrice de q dans la base (e;) 
est diagonale et que les éléments diagonaux sont les q(e;). Soit K = {à tel que q(e;) = 0}. 


(1) Span{ei}ier © ker(g) Six = Ye tie, alors 


ge) = b(u,x) = À, lmil'b(eie;) = 37 Imifôija(ei) = 0 (9.479) 
i,jeK i,jeK 


parce que q(e;) = 0 dès que ie K. 


(2) ker(g) € Span{ei}iex Soit x € ker(q) et écrivons-le sous la forme x = ÿ}_, aie. Nous avons 


0 = q(x) =} IriPa(ei). (9.480) 


Mais |x;/? > 0 et q(e;) > 0, donc si q(e;) Æ 0, alors x; = 0. Donc les seules composantes non 
nulles de x sont celles sur lesquelles g s’annule. En d’autres termes x = Ÿ; vie; € Span{e;}iex. 


THOoo1IDMPooIMwkqB 
Théorème 9.239 ([292, 1]). 


Toute forme quadratique sur un espace vectoriel de dimension finie admet une base formée de 
vecteurs 2 à 2 orthogonaux (pour la forme considérée). 


Démonstration. Nous considérons la base {{;} de E* donnée par la réduction de Gauss (théorème 
9.235). La forme quadratique q s’écrit 


q(x) = 5 l;(x)?. (9.481) 
i=1 


La base préduale ** {e;} de {l;} répond aux conditions. Pour le vérifier, nous considérons la forme 
bilinéaire associée à q par l'identité de polarisation 9.139 : 


bles, ej) = 3 (a(e:) + a(es) — alei — e;)). (9.482) 


Vu que l(e;) = ôx;, nous avons 


q(ei) = ÿ al(ei)? = a. (9.483) 
k=1 


94. Définition, existence, unicité dans la proposition 4.130. 
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En utilisant la linéarité, 


q(ei — ej) = > alg(ei — e;) (9.484a) 

k 
_ » ap (ôki — 05)? (9.484b) 

k 
= : Ak(ôki + Ôpj — 20p0p) (9.484c) 
= : + a; — 20;;a. (9.484d) 

Donc 

b(e;,e;) = dj. (9.485) 


Les vecteurs {e;} sont donc bien deux à deux q-orthogonaux. 


Notons qu’en l’absence de notion de racine carrée sur K, il n’est pas possible de considérer ,/@; 


et donc de base q-orthonormée. 
PROPooPMYCooAAtHsB 


Proposition 9.240 ([1]). 
Si AE Mi(n,K) est telle que det(A) = 0, alors il existe des matrices de manipulation de lignes et 
de colonnes® G,..., G} et H1,...,H, telles que G1...GN AH:1...H, ait une colonne de zéros. 


Démonstration. Si la matrice À n’a pas de colonnes de zéros, il existe un 4 tel que À; # 0. Nous 
utilisons une matrice de permutation de ligne 1 et à : 


(S(n,i,1)4),, # 0. (9.486) 


Nous notons s ce nombre. Alors en multipliant la première ligne par 1/s nous avons un 1 dans la 
première case : 


(T(n,1,1/s)5{n,i,1)A4).,, = 1. (9.487) 


Pour la suite nous n’allons plus être aussi explicite. 

Maintenant, en faisant des combinaisons entre la première colonne et les autres, nous pouvons 
annuler toutes les autre entrées 1:;. Tout ça pour dire qu’il existe des matrices G1,...,G et 
H:1,...,H, telles que 


1 0 0 
Gi... Gp AH... Hy = AG (9.488) 
0 
Si AU) ne possède pas de colonnes de zéros, nous pouvons continuer. 
Si nous parvenons à faire n pas de la sorte, alors nous aurions 
Gi: GA 3 Hg d, (9.489) 


et donc, par le lemme 4.88, nous aurions det(G1 ... G}) det(A) det(H ... H,) = 1, ce qui est impos- 
sible lorsque det(A) = 0. Nous en concluons que le processus doit s’arrêter et qu’une des matrices 
A) doit avoir une colonne de zéros %, 


PROPooVUDJooLil jmST 
Proposition 9.241. 
Une matrice dont le déterminant est nul n’est pas inversible. 


95. Les opérations élémentaires sur les lignes sont résumées en 4.87. 
96. En réalité, le processus tel que nous l’avons décrit ne s’arrête que lorsque la première colonne est remplie de 
zéros. 
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Démonstration. Par la proposition 9.240, il existe des matrices de manipulation de lignes et de 
colonnes G1,...,G, telles que la matrice G1...G, À H1...H, ait une colonne de zéros. De là, la 
proposition 4.98 implique que la matrice 


Gi CAB. 60 ARTE) 


n’est pas inversible. Vu les déterminants des matrices G;, la proposition 4.97 implique que G1...G, 
et H1...H, sont inversibles. Si À était inversible, tout le produit serait inversible, ce qui est 
faux. 


THOooSNXWooSRjleb 
Théorème 9.242. 
Une matrice sur un corps commutatif est inversible si et seulement si son déterminant est non nul. 


Démonstration. Dans un sens c’est la proposition 4.97 et dans l’autre sens c’est la proposition 
9.241. 


PROPooHQNPooIfPEDH 
Proposition 9.248. 
Soient des matrices À et B sur un corps commutatif. Alors 


det(AB) = det(A) det(B). (9.491) 


Démonstration. Les propositions 4.101 et 4.102 ont déjà fait une grosse partie du travail. Il ne 
reste que le cas où det(A) = det(B) = 0. 

Dans ce cas, les matrices À et B ne sont pas inversibles (proposition 9.242). Le produit AB 
n’est alors pas inversible non plus °’. La proposition 9.242, utilisée dans le sens inverse, nous dit 
alors que det(AB) = 0. 

Au final dans le cas det(A) = det(B) = 0 nous avons 0 = det(AB) = det(A) det(B) = 0. 


Faisons maintenant le cas général des manipulations de lignes et colonnes. 
PROPooSLLGooSZjQrv 


Proposition 9.244. 
Soit une matrice carrée A € Mn, K). La matrice B obtenue par la substitution simultanée 


CG; — D axjCk (9.492) 
k 


a pour déterminant 


det(B) = det(a) det(A). (9.493) 


Démonstration. L'élément B;; de la matrice B est une combinaison linéaire de tous les éléments 
de sa ligne : 


Bi = D ja Aix = (Aa)ij. (9.494) 
p 


Donc B = Aa. La proposition 9.243 nous dit alors que det(B) = det(a) det(A). 


ThoQFVsBCk 
Théorème 9.245 (de Sylvester[285]). 
Soit Q une forme quadratique réelle de signature ® (p,q) sur R" (n > p + q). Alors pour toute 


Ù | sq he ; 
base Q-orthogonale {e;} de R nous avons les propriétés suivantes. ITEMooCFQHooRW£mpT 


(1) Les nombres p et q sont donnée par 


p = Card{i tel que Q(e;) > 0} Rs 
q = Card{i tel que Q(e;) < 0}. us PISE) 


97. Citez le lemme 4.94 si vous voulez justifier ça. 
98. Définition 9.160. 


702 CHAPITRE 9. ESPACES VECTORIELS (ENCORE) 


ITEMooWLPVooSTO0jL 


(2) Si À est la matrice de Q dans une base, alors il existe une matrice inversible P telle que 


—1, 
PAP = À : (9.496) 


ITEMooGOHCooPrNQwm 
(3) Le rang de Q est p + q. 


Démonstration. Soit F un sous-espace de dimension maximale q sur lequel Q est définie négative. 
Le fait que la dimension de F soit q est la définition 9.160 de la signature. Nous notons F+ sont 
Q-orthogonal, c’est-à-dire que 


Fl={veE tel que B(v,x) = 0Vre F}. (9.497) 


Le lemme 9.137 nous assure que E = F@ Ft. 

Le théorème 9.239 sur l’existence de bases Q-orthogonales nous permet de considérer une base 
Q-orthogonale de F et une de F +. En réunissant les deux, nous avons une base de E. Nous la 
notons {f1,..., fn} avec 


— La partie {f1,...,f,} est une base de F, 
— La partie {f441,..., fn} est une base de Fe 
— Remarquez cependant qu’il n’est pas dit que n = q + p. 


Notons que pour à > q, nous avons Q(f;) > 0, sinon la maximalité de F serait contredite par 


Spani Pis: as der: 


Cela prouve que 
Card{i tel que Q(f;) > 0} = p. (9.498) 


Le lemme 9.163 nous dit alors que 
Card{i tel que Q(e;) > 0} = Card{i tel que Q(f;) > 0} = p. (9.499) 


C’est l'égalité (9.495b). L'égalité (9.495a) se prouve de la même façon, en prenant F maximal pour 
la propriété que Q y est strictement définie positive. 

Le point (1) est prouvé. 

Dans une base Q-orthogonale, la matrice de Q est diagonale, et contient sur la diagonale les 
valeurs de Q(e;). Parmi celles-ci, on en a p strictement positives et q strictement négatives. Les 
n — p — q autres sont nulles. Vu que Q est à valeur réelle, nous avons une notion de racine carré, 
et nous pouvons considérer e;/1/|Q(e;)| au lieu de e;. De cette façon, Q(e;) est normalisé. Avec ça, 
la matrice de Q est 


D= L 1, | EdooLQNRooGEEAIE, 


Nous venons de prouver qu’il existe une base {e;} dans laquelle la matrice de Q est (9.500). Si À 
est la matrice de Q dans une base quelconque {f;} et si P est la matrice de changement de base 
fj = D; Pijei, la proposition 9.149 donne D = P*AP. 

Le point (2) est prouvé. 

Pour (3), la proposition 9.162 nous permet de calculer le rang de Q par le rang de sa matrice 
dans n’importe quelle base. Nous choisissons la base qui donne la matrice (9.500). Le rang est alors 
bien p + q. 
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9.12.10 Équivalence de formes quadratiques 
DEFoo0ULWYooMwhMJp 


Définition 9.246 (Équivalence de forme quadratique[278]). 
Deux formes quadratiques q et q!' sont équivalentes si il existe une application linéaire inversible 
® telle que g = go @. 

PROPooBWXMooLsgyKm 
Proposition 9.247 ([285]). 
Deux formes quadratiques sont équivalentes” si et seulement si elles ont même signature. 


Démonstration. En deux parties, et en utilisant tout le temps le théorème de Sylvester 9.245. 
Dans la suite nous allons toujours noter de la même façon les formes quadratiques, les applications 
linéaires et leurs matrices correspondantes. 


(1) = Soient deux formes quadratiques équivalentes q et q”. Nous avons une application linéaire 
o telle que g = go @. Soit une matrice inversible P telle que 


1 


PtAP = 1 EQooTCIRoo G4013 


p' 


0 


où (p’, q') est la signature de q/. Par équivalence et par le changement de base de la proposition 
9.148, nous avons qg' = dtq®, et donc 


P'd'P = (GP) a(6P). (9.502) 


Dans la base des (9 o Pje;, la matrice de q est (9.501). Donc le point 9.245(1) du théorème 
de Sylvester montre que la signature de q est également (p’, q/). 


(2) = Nous supposons que q et g' ont la même signature. Il existe donc des matrices inversibles 
P et Q telles que Ptq/ P et QfqQ aient la même forme (celle de la matrice (9.501)). Autrement 
dit, 

doP=goQ, (9.503) 


d’où nous déduisons que g = go Qo P-! parce que P est inversible. Comme l'application 
Q o Pl est inversible, les formes quadratiques q et q' sont équivalentes. 


9.12.11 Diagonalisation 
DEFOo0GVGGOooWQEIET 


Lemme-Définition 9.248. 
Soit une forme quadratique % q sur l’espace vectoriel V sur K. Soit À la matrice de q dans la base 
{e;} et B sa matrice dans la base {f,}. Nous supposons que le changement de base est orthogonal. 
Alors les valeurs propres de À et B sont les mêmes. 
Ces valeurs sont les valeurs propres de q. 


Démonstration. Nous nous rappelons de la définition 9.146 de la matrice associée à q, et à la 
proposition 9.149 qui parle de changement de base : B = QtAQ où Q est orthogonale. 

Soit un vecteur propre v de À, de valeur propre À. Alors nous prouvons que Qv est un vecteur 
propre pour B, de même valeur propre À. En effet, 


BQ'v = Q'AQQ'v = Q'Av = XQv (9.504) 


où nous avons utilisé QQ = 1 et Av = v. 


99. Définition 9.246. 
100. Définition 9.123. 
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PropFWYooQXfcvY 
Proposition 9.249. 
Dans la base de diagonalisation de sa matrice associée, une forme quadratique a la forme 


q(x) = / ir? (9.505) 


où les À; sont les valeurs propres de la matrice associée à q. 


Démonstration. Soit q une forme quadratique et b la forme bilinéaire associée. Si {f;} est une base 
de diagonalisation 1 de la matrice de b alors dans cette base nous avons 


ga) =b(s,2) = ÿ maj(f, f)= > Mr? (9.506) 


ij 


où les À; sont les valeurs propres de la matrice de b. 


Notons que si nous choisissons une autre base de diagonalisation, les À; ne changement pas (à 
part l’ordre éventuellement). 

Cela justifie la définition pour dire que nous nous permettrons de parler des valeurs propres 
d’une forme quadratique comme étant les valeurs propres de la matrice associée. 

Le théorème 9.239 a déjà donné une base orthogonale pour toute forme quadratique sur un 
espace vectoriel (E,K) de dimension finie. Dans le cas de R?, nous pouvons en donner une preuve 


basée sur le théorème spectral, c’est la proposition 9.250. 
PROPooUKRUooGRIDHt 


Proposition 9.250. 
Soit une forme bilinéaire symétrique b sur un IR". Il existe une matrice orthogonale Q telle que 
(1) D = Q‘bQ est diagonale 


(2) D(x,y) = b(Qx,Qy) pour tout x,y € R”. 

Il existe une base (fi)i=1,..n qui est b-orthogonale. 

Dans cet énoncé, nous mélangeons sans vergogne les formes et les matrices, en supposant qu’une 
base soit fixée ®. Par exemple 

D(a,y) = D Dismiys. (9.507) 
ij 

Démonstration. Pour la matrice diagonale, c’est le théorème spectral 9.221(2) qui joue parce que 
la matrice d’une forme bilinéaire symétrique est symétrique (c’est vu de la définition (9.300)). 

Pour le reste c’est un calcul : 


D(x,y) = 2 QbmQTiY; (9.508a) 
_ Dur (9.508b) 
= 5 b(Qz)k(Qy) (9.508c) 
= HO, Qy). (9.508d) 


Nous avons utilisé le produit matrice fois vecteur donné par (4.84). 
En ce qui concerne l’existence d’une base b-orthogonale, vu que D est diagonale, nous avons, 
pour à £ j que D(e;,e;) = 0. Donc en posant f; = Qe;, nous trouvons 


0 = D(ei,e;) = b(Qei, Qe;) = Uf f). (9.509) 


La base (Qe;);=1...n est donc b-orthogonale. 


101. Qui existe parce que la matrice est symétrique, théorème 9.221. 
102. Autrement dit, si vous avez en tête d’utiliser cette proposition pour R” c’est bon; mais sinon vous devez choisir 
une base et considérer toutes les matrices dans cette base. 
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9.13 Fonctions 


Sect_fonctions 

Soient (E,|.|#) et (F,|.]r) deux espaces vectoriels normés, et une fonction f de E dans F. 

Il est maintenant facile de définir les notions de limites et de continuité pour de telles fonctions 

en copiant les définitions données pour les fonctions de R dans R et en changeant simplement les 
valeurs absolues par les normes sur Æ et F. 

La proposition suivante explicite la définition 7.102 dans le cas où la topologie est donnée par 


des boules. 
PropHOCWooSzrM;j1 


Proposition 9.251 (Caractérisation de la limite). 
Soient des espaces vectoriels normés. Soit f: E — F une fonction de domaine Dom(f) € E et 
soit a un point d’accumulation de Dom(f). 


(1) SiF est séparé ® et si f admet une limite en a, alors cette limite est UPÉGUSE SUKNoOSEKGKH 


(2) La fonction f admet une limite en a € E si et seulement si il existe un élément L € F tel que 
pour tout € > 0, il existe un Ô > 0 tel que pour tout x € D = Dom(f), 


A Pr et) 


Si la limite existe et est unique, nous écrivons lim,_,4 f(x) = L et nous disons que L est la limite 
de f lorsque x tend vers a. 


Démonstration. L'unicité est la proposition 7.105. 
(1) = La définition 7.102 nous assure de l'existence d’un élément £ tel que pour tout voisinage 
S de £, il existe un ouvert U autour de a tel que f(U n D\{a}) € S. 


Soit e > 0. Nous posons $ = B(£,6). Il existe un voisinage U de a tel que f(U n D\{a}) € 
B(L,€). Puisque U est un voisinage de a, il contient une boule centrée en a (c’est dans la 
définition 7.109 de la topologie métrique). Soit donc 4 > 0 tel que B(a,ô) € U. 


Un élément de D qui est dans B(0,6)\{a} est un élément de D qui vérifie 0 < |x — a] < 6. 
Nous avons donc, pour x € D que 


O<|r—al <ô= |f(x)—4| <e (9.511) 


(2) = C’est le même raisonnement. 


Remarque 9.252. 
Le fait que nous limitions la formule (9.510) aux x dans le domaine de f n’est pas anodin. Consi- 
dérons la fonction f(x) = x? — 4, de domaine |x| > 2. Nous avons 


lim Va? — = ÿ); (9.512) 


Nous ne pouvons pas dire que cette limite n’existe pas en justifiant que la limite à gauche n’existe 
pas. Les points x < 2 sont hors du domaine de f et ne comptent dons pas dans l’appréciation de 
l'existence de la limite. 

Vous verrez plus tard que ceci provient de la topologie induite de R sur l’ensemble [2, |. 


9.14 Sous espaces caractéristiques 


Lorsqu'un opérateur n’est pas diagonalisable, les valeurs propres jouent quand même un rôle 
important. 


103. C’est le cas en dimension finie et en particulier pour R". En dimension infinie, il faut être très prudent. 
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DefFBNIooCGblix 
Définition 9.253. 
Soient E un K-espace vectoriel et f € End(E). Pour À € K nous définissons 
F\(f) = {ve E tel que (f — A1)"v = 0,ne N} (9.513) 
et nous appelons cet ensemble un sous-espace caractéristique de f. 
L'espace F;(f) est l’ensemble de nilpotence de l’opérateur f — AI et 
LemBLPooHMAoyJ 


Lemme 9.254. 
L'ensemble F\(f) est non vide si et seulement si À est une valeur propre de f. L'espace F\(f) est 
invariant sous f. 


Démonstration. Si F\(f) est non vide, nous considérons v € F\(f) et n le plus petit entier non 
nul tel que (f — ÀA)"v = 0. Alors (f — À)*-lv est un vecteur propre de f pour la valeur propre À. 
Réciproquement, si v est un vecteur propre de f pour la valeur propre À, alors v € F(f). 

En ce qui concerne l’invariance, remarquons que f commute avec f — A1. Si x € F\(f) il existe 
n tel que (f — A1)°x = 0. Nous avons aussi 


(f— XL)" F() = (Cf — A1)"æ) = 0, (9.514) 


par conséquent f(x) € F\(f). 


Contrairement à ce que l’on pourrait croire, il n’est pas vrai que toute matrice à coefficient 
réel est diagonalisable, même pas sur C. La raison est qu’une telle matrice peut très bien avoir des 


valeurs propres multiples. 
ExBRXUoo!I1UnSx 


Exemple 9.255. 
Le théorème 9.213 nous donne une façon simple de trouver des matrices non diagonalisables sur 
C : il suffit que le polynôme minimal ne soit pas scindé à racines simples. Par exemple 


re é 1) | (9.515) 


dont le polynôme caractéristique est 4 = (1 — X)?. Ce polynôme n’a manifestement pas des 
racines simples. Nous pouvons faire le calcul explicite pour montrer que À n’est pas diagonalisable. 
D'abord l’unique valeur propre de À est 1 et nous pouvons sans peine résoudre 


( 1)6)- 0) sa) 


T+Y=X (9.517a) 
y = y. (9.517b) 


qui revient au système 


La première équation donne directement y = 0. Le seul espace propre est de dimension 1 et est 


1 
engendré par ( 1) ; A 


Nous donnons maintenant un exemple un peu plus avancé de matrice réelle non diagonalisable, 
qui montre la multiplicité algébrique et géométrique d’une racine d’un polynôme caractéristique. 


RemBOGooCLMwyb 
Remarque 9.256. 
Considérons l’endomorphisme f € End(C*) donné par la matrice 
a «a BP 
0 a 7 (9.518) 
0 0 b 
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avec a £b,aÆ0,bZÆ0, a Æ 0, B et y sont des nombres complexes quelconques. Son polynôme 
caractéristique est 
xf(X) = (a X}°(b— X), (9.519) 


et les valeurs propres sont donc a et b. Nous trouvons les vecteurs propres pour la valeur a en 
résolvant 


a a B\/x ax 
D. ja lg =:l-êv (9.520) 
0 0 b z az 


La troisième équation est bz = az qui oblige z = 0 parce que a Æ# b et 0 Æ a. La première est 
ax + ay = ax qui implique y = 0 parce que & Æ 0. Enfin la première équation se réduit à ax = ax 
qui ne donne pas de contraintes sur x. En résumé : l’espace propre E,(f) est réduit à une seule 
dimension générée par (1,0,0). 

De la même façon l’espace propre correspondant à la valeur propre b est donné par le système 


a à B\ fw bx 
a Y||y|= |by (9.521) 
b z bz 
La seconde équation donne ay + yz = by, et donc 
” 
—_ 9.522 
D (9.522) 
La première équation est ax + ay + Bz = bx qui donne 
1 
x = -—(ay + Bz). (9.523) 


b—a 
En y remettant la valeur déjà trouvée de y, nous trouvons que l’espace propre pour la valeur propre 
b est engendré par le vecteur 
1 ay 
er (5 “ #) 
7 


(9.524) 


b—a 


1 
Vu que nous savons que a et b sont les seules valeurs propres et que nous venons de voir que 
leurs espaces propres sont de dimension 1, il n’y a donc pas trois vecteurs propres linéairement 
indépendants, et l’opérateur f n’est pas diagonalisable. 

Par contre nous pouvons voir que (f — al)?e> = 0. En effet : 


() 0 à BB a 0 
(f-a1}|[11=10 0 7 of={0}, (9.525) 
0 0 :0: ba 0 0 


de telle sorte que le vecteur (0,1,0) est également dans l’espace caractéristique F,(f). 
Dans cet exemple, la multiplicité algébrique de la racine a du polynôme caractéristique vaut 2 
tandis que sa multiplicité géométrique vaut seulement 1. 


9.14.1 Théorèmes de décomposition 
ThoSpectraluRMLok 


Théorème 9.257 (Théorème spectral, décomposition primaire). 
Soit E un espace vectoriel de dimension finie sur le corps algébriquement clos K et f € End(E). 


Alors 
E-P(f)®...@P,(f) FaCTFROONSGRE, 


où la somme est sur les espaces caractéristiques engendrés par les valeurs propres distinctes de f. 
Les projecteurs sur les espaces caractéristiques forment un système complet et orthogonal. 
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Démonstration. Soit P le polynôme caractéristique de f et une décomposition 
PS. A” (9.527) 
en facteurs irréductibles. Par le théorème des noyaux (9.89) nous avons 
E = ker(f — A)*@...@ker(f — À)%. FaDef SR 


Les projecteurs sont des polynômes en f et forment un système orthogonal. Il nous reste à prouver 
que ker(f — À;)% = F,,(f). L’inclusion 


E Pi 
ker(f — M)% € F(f) 50) 
est évidente. Nous devons montrer l'inclusion inverse. 
() F(f) © FE, (f) = 0 


Soit ve Fj,(f)nF,(f). Le fait que v € F,(f) implique qu'il existe n € N tel que (f—X;)"v Æ 
0et(f—À;)"+lu = 0 (éventuellement n = 0 si v est un vecteur propre). Posons v1 = (f—À;)"v. 


Étant donné que (f — À;) commute avec (f — À;), ce 1 est encore dans F,(f). En effet, si 
k est tel que (f — x;)Fv = O0, alors 


À fu = (FX — Xo = (f — XNUS — À) v = 0. (9.530) 


Il existe donc m € NN tel que (f—X;)"u1 £ Oet (f—À;)"*lus = 0. En posant w = (f—À;)"u1, 
nous avons 


Xe = (f — À)" — jte = 0 (9.531a) 
Cf Xjhu = (f — À) a = 0. (9.531b) 


Ce w serait donc un vecteur propre simultané pour les valeurs propres À; et À;. Vu que les 
espaces propres sont linéairement indépendants, les seules possibilités sont à = j ou w = 0. 


(2) Questions de dimension Etant donné que espaces F\, sont en somme directe, la somme 
de leurs dimensions est au maximum la dimension de E : 


D dim PF), (f) < dimE. (9.532) 


En tenant compte de l'inclusion (9.529) nous avons même 


dim£ = ÿ dimker(f — \)% < ) dimF;,(f) < dimE. (9.533) 


Vu qu’il y a dim(Æ) des deux côtés des inégalités, toutes les inégalités sont des égalités et 


D 'dim ker(f — X)% = Y'dim PF, (f). Sn 7 


nous avons 


L’inclusion (9.529) nous dit qu'il y a une inégalité terme à terme dans les sommes de (9.534). 
Vu qu’il y a égalité des sommes, il y a en réalité égalité de chacun des termes : dim ker(f — 
X)% = dim F;,(f) et l'égalité des deux espaces de (9.529) : 


ker(f — À)" = F,(f). (9.535) 


PROBooJRDAooEKxPbJ 
ii Avertissement /question à la lectrice !! 9.258 
Dans le cas où le corps n’est pas algébriquement clos, il paraît qu'il faut remplacer « diagonalisable » 
par « semi-simple ». 
Si vous connaissez un énoncé précis et une démonstration, écrivez-motï. 
Il y a peut-être une réponse dans [293]. 


9.14. SOUS ESPACES CARACTÉRISTIQUES 709 


Si l’espace vectoriel est sur un corps algébriquement clos, alors les endomorphismes semi- 


simples {4 sont les endomorphismes diagonaux. 
ThoRURcpW 


Théorème 9.259 (Décomposition de Dunford). 
Soit E un espace vectoriel sur le corps algébriquement clos !® K et u € End(E) un endomorphisme 
de E. 


(1) L'’endomorphisme u se décompose de façon unique sous la forme 


u=sSs+n (9.536) 


où s est diagonalisable, n est nilpotent et [s,n] = 0 1%. 


(2) Les endomorphismes s et n sont des polynômes en u et commutent avec UTtemThoRURcpWii ii 


(3) Si notons {Xi} les valeurs propres distinctes de u, et F\,(u) les espaces caractéristiques cor- 
respondants, alors les parties s et n sont données par 


— > XD: (9.537a) 


= DXE — À;1)p: (9.537b) 


U 


pi: E — F,,(u) est la projection de E sur F),(u). 


Démonstration. Le théorème spectral 9.257 nous indique que 
E=ŒOF,(f). (9.538) 
i 


Nous considérons l’endomorphisme s de Æ qui consiste à dilater d’un facteur À; l’espace caracté- 
ristique F\,(f) : 
— > XD: (9.539) 
i 


où p;: E — F,,(u) est la projection de E sur F\,(u). 
Nous allons prouver que [s, f] = 0 et n = f — s est nilpotent. Cela impliquera que [s,n] = 0. 
Si x € F\(f), alors nous avons sf(x) = Af(x) parce que f(x) € F\(f) tandis que fs(x) = 
f(x) = Àf(x). Par conséquent f commute avec s. 
Pour montrer que f — s est nilpotent, nous en considérons la restriction 


FRA = (9.540) 


Cet opérateur est égal à f — ÀÏ et est par conséquent nilpotent. 

Prouvons à présent l’unicité. Soit u = 5’ + n/ une autre décomposition qui satisfait aux condi- 
tions : s’ est diagonalisable, n’ est nilpotent et [n’, s/] = 0. Commençons par prouver que s/ et n’ 
commutent avec u. En multipliant u = s/ + n/ par s’ nous avons 


s'u= 82 +sn = s? + ns = (s + n'}s = us’, (9.541) 


par conséquent [u, s/] = 0. Nous faisons la même chose avec n/ pour trouver [u, n’] = 0. Notons que 
pour obtenir ce résultat nous avons utilisé le fait que n’ et s’ commutent, mais pas leur propriétés 
de nilpotence et de diagonalisibilité. 

Si s'+n = s + n est une autre décomposition, s/ et n/ commutent avec u, et par conséquent 
avec tous les polynômes en u. Is commutent en particulier avec n et s. Les endomorphismes 5 


104. Définition 9.105. 

105. Je crois quo'n peut remplacer l'ypothèse de corps alébriquement clos par une hypothèse de polynôme caractéristique 
scindé. Écrivez-moi si vous avez une idée à ce propos. 

106. Lorsque a et b sont des opérateurs, la notation [a, b] signifie le commutateur entre a et b, c’est-à-dire aob—boa. 
Dire que [a, b] = 0 signifie que ab = ba. 
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et s’ sont alors deux endomorphismes diagonalisables qui commutent. Par la proposition 9.216, 
ils sont simultanément diagonalisables. Dans la base de diagonalisation simultanée, la matrice de 
l'opérateur s/ — s = n — n’ est donc diagonale. Mais n — n’ est également nilpotent, en effet si A 
et B sont deux opérateurs nilpotents, 


A+ By = Ÿ (")Argn-r 9.542 
a+Bre À () (2.54) 


Si n est assez grand, au moins un parmi À ou BF est nul. 
Nous savons que n — n’ est diagonal et nilpotent. Le seul opérateur diagonal à être nilpotent 
est l'opérateur nul 107. Nous en déduisons que n = n’. Nous avons alors immédiatement aussi 
! 

8 = 5". 


9.260. 
Le théorème 12.423 montrera que 4x — 0 pour tout x si et seulement si p(A) < 1, mais ça 
demande un résultat de vitesse comparée entre l’exponentielle et la puissance. 


Une application de la décomposition de Jordan est l’existence d’un logarithme pour les ma- 
trices. La proposition suivante va d’une certaine manière donner un logarithme pour les matrices 
inversibles complexes. Dans le cas des matrices réelles m telles que |m — 1] < 1, nous donnerons 
au lemme 15.150 une formule pour le logarithme sous forme d’une série ; ce logarithme sera réel. 


9.14.2 Valeurs singulières 
DEFooZSCYooQnBzix 


Définition 9.261. 
Soit M une matrice m x n sur K (K est R ou C). Un nombre réel o est une valeur singulière 
de M si il existe des vecteurs unitaires u € K°”°, ve K” tels que 


Mv = ou (9.543a) 
Mu = ov. (9.543b) 
THOooSCOLooSK1Vvd 


Théorème 9.262 (Décomposition en valeurs singulières). 
Soit M E M(m x n,K) où K =R,C. Alors M se décompose en 


M = ADB (9.544) 
où il existe deux matrices unitaires À € U(m x m), BE U(nxn) et une matrice (pseudo)diagonale 
D E M(m x n) tels que 

(1) AEU(m x m), BE U(n x n) sont deux matrices unitaires, 
(2) D est (pseudo )diagonale, 


(3) les éléments diagonaux de D sont les valeurs singulières de M, 


(4) le nombre d'éléments non nuls sur la diagonale de D est le rang! ® de M. 


Corolaire 9.263. 
Soit M E Mn, C). Il existe un isomorphisme f: C" — C" tel que fM soit autoadjoint. 


Démonstration. Si M = ADB est la décomposition de M en valeurs singulières, alors nous pouvons 
st | NE ; ee : u in 

prendre f = B Al qui est une matrice inversible. Pour la vérification que ce f répond bien à la 

question, ne pas oublier que D est réelle, même si M ne l’est pas. 


107. Parce qu’une puissance d’un opérateur diagonal est diagonal. 
108. Définition 4.45. 
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9.15 Extension du corps de base 
SECooAUDOWooNdYTZf 
Nous avons discuté dans la section 6.4 de ce qui arrive au corps lorsqu'on l’étend. Dans cette 
section nous allons étudier ce qui arrive aux applications linéaires entre deux IK-espaces vectoriels 
lorsque nous étendons le corps K en un corps L. 
Soient K un corps (commutatif) et une extension L de K. Soient Æ et F, des K-espaces 
vectoriels de dimension finie, et entrons dans le vif du sujet 10°. 


9.15.1 Extension des applications linéaires 


Définition 9.264 ([294|). 
L'espace vectoriel obtenu par extension du corps de base de E est l’espace vectoriel 


Er = L@xk E. (9.545) 


Ce dernier est le quotient L @x E = (L x E)/ — par la relation d'équivalence 
1 
(A, v) + (ax, -v) (9.546) 
a 


pour tout a € K\{0}. Nous noterons [À,v] ou À @ v ou encore À @x v la classe de (À,v) pour la 
relation d'équivalence — : 


[À, v] = {(u,w)e L x E tel que (u,w) — (À,v)}. (9.547) 


Un élément de Er est de la forme D ,[Ax, vx] avec À € L et vg € E. Si f: E — Fest une 
applications linéaire, nous définissons 


fr: Er — Fr EQo0YGVHOOfY MEL 
De (fil TE) 


Remarque 9.265. 
Si deux vecteurs de Ex sont linéairement indépendants pour K, ils ne le sont pas spécialement 
pour L. Par exemple si € est vu comme R-espace vectoriel, alors {1,1} est une partie libre. Mais 
dans C, vu comme C-espace vectoriel, la partie {1,1} n’est pas libre. 

LEMooJIGTooMqiJSN 
Lemme 9.266. 
Soient trois K-espaces vectoriels E, F et G ainsi que deux applications linéaires f: E — F' et 
g:G—E. Si L est une extension de K, alors 


ÎL ° gr = (f og). (9.549) 
Démonstration. Il suffit de composer la définition (9.548) : 

(fx ° g1) (LA, v]) = fL([A,g(v)l) (9.550a) 
= [A, (Jo g)(v)] (9.550b) 
= (fo gm. (Av). (9.550c) 

Nous définissons aussi l’injection canonique 
T: E — Er, 
(9.551) 
ve [1,vl. 
PropooWECLooHPzIHw 


Proposition 9.267 ([128]). 
Injectivité et surjectivité respectées. 


109. Le sujet étant le corps étendu. 
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(1) L'application fx est injective si et seulement si f est injective. 


(2) L'application fL est surjective si et seulement si f est surjective. 


Démonstration. En plusieurs parties. 


(1) Si fx est injective Supposons pour commencer que fr, soit injective. Le diagramme 


er (9.552) 
RE 
est un diagramme commutatif. En effet 
(ro f)(v) = [1 f(v)] (9.553) 
tandis que 
(fz ° r)(v) = LIL, v] = [1, f(v)]. (9.554) 


Donc si f(v) = 0 avec v £ 0 nous aurions (ro f)(v) = 0 et donc aussi (fr o r)(v) = 0, alors 
que 7(v) £ 0 dans Er. 


(2) Si f est injecive 


Nous supposons que f est injective et que fL(Qv) = fL(1@w). Cela signifie que À@ f(v) — 
1 ® f(w), ou encore qu’il existe a £ 0 dans K tel que 


ui = aÀ (9.555a) 
J(w) = F(0) (9.555b) 


Par linéarité de f, f(v) = f(aw) et par injectivité de f, nous déduisons que v = aw. Enfin 
nous avons l’injectivité de fr, parce que 


H@w=a18- =). (9.556) 


PROPooMHARooUycAts 
Proposition 9.268 ([1, 295]). 
Soit {e;};=1.….» une base de E. Alors {1@e;}; est une base de Er, = L@x E. 


Démonstration. L'espace vectoriel E peut être écrit comme somme directe £ = @,Ke;. Si\eL 


et k € K nous avons x x 
\@ ke; — x ® 6 — TU @ «). (9.557) 


Cela pour introduire l’application 
v: L@r E — OL(1@ ei) 
‘ (9.558) 
D ® Up > Où D (vi) (1 ® es) 
k k 


OÙ Ux = D, Vixei avec vix € K, qui représente un isomorphisme de L-espaces vectoriels. La surjec- 
tivité est facile. En ce qui concerne l’injectivité, si 


DD Ouvix)(1@ ei) = 0 (9.559) 
4 k 


alors les quantités suivantes sont nulles également : 


DDR) ® ei) = D ® vires) = Dr ® D virei) = D (x QU). (9.560) 
à k î 


ik k k 


La dernière est l’argument de #. Le fait qu’il soit nul implique que # est injective. 
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Remarque 9.269. 
Nous n’avons pas dû prouver que chacun des À © vx était nul. Et encore heureux, parce que cela 
pouvait très bien être faux, puisqu'il y a plusieurs façons de noter un élément de Er, sous la forme 


de tels termes. 
CORooTQGHoo!IKhNtr 


Corolaire 9.270. 
La L-dimension de Er, est égale à la K-dimension de E. 


9.15.2 Projections 


ii Avertissement /question à la lectrice !! 9.271 

Nous allons définir proj: L(Er., Fr) — L(E,F) en faisant appel à des bases et en prouvant que les 
quantités définies ne dépendent pas des bases choisies. Il y a surement une façon plus « intrinsèque » 
de faire. 


Nous savons que L est un K-espace vectoriel dans lequel nous pouvons voir K comme un 
sous-espace (lemme 6.60). Dans cette optique nous choiïsissons dans L un supplémentaire de K, 
c’est-à-dire un sous-espace vectoriel de L tel que 


L=K@V. (9.561) 


Nous avons alors naturellement une projection proj: L — K. 

Soit {e;} une base de E et {e,} une de F. Nous noterons également e; et e, les éléments 7(e;) 
et T(e,) correspondants. Grâce à la proposition 9.268, ce sont des bases de Er et Fr. Si la fonction 
f: Er — Fr s'écrit dans ces bases comme 


(ei) = >, Jaiea (9.562) 


alors nous définissons proj(f) par 


(proj fe: = D proj(fai)es. Ds à 2) 


PROPooOUEHTooHyjuZQ 
Proposition 9.272 ([1]). 
L'application proj définie en (9.563) est indépendante du choix des bases. 


Démonstration. Notons que dans ce qui suit, les sommes sur a ou b et celles sur à ou j ne vont 
pas jusqu’au même indice (dimensions de Æ et F). De plus nous manipulons deux quantités qui 
se notent proj. La première est la projection proj:L — IK qui ne dépend que d’un choix de 
supplémentaire et que nous supposons fixée ici. D’autre part il y a proj: Ex — E qui dépend à 
priori des bases choisies. 

Nous choisissons de nouvelles bases qui sont liées aux anciennes bases par 


ey = : Pie (9.564a) 
a 
e —= * Aie. (9.564b) 
i 
Les matrices À et B sont dans GL(K). Nous allons écrire l’opérateur proj” qui correspond à ces 


bases et montrer que pour toute application linéaire f: Er, — FL nous avons proj(f) = proj/(f). 
Nous avons : 


f(5) = X Asif(ei) (9.565a) 
2 NA AE je (9.565b) 

a bi 
=) (y Ajifai(B" va) cb, (9.565c) 

b ai 
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ce qui donne 


(proj’ fe; — > (pro; (Ajifai(B7 Jon) } FRooPANRoO TER 


b 


Nous calculons maintenant (proj’ fe; en substituant e; = Y},(A7l)yje, et en utilisant (9.566), la 
linéarité de proj’ et la K-linéarité de proj: L — K : 


(ro (DA er) = DA 5 > D proj (Ari fai(B?)pa) €b (9.567a) 


l l b ai 
— Ÿ_ pro; (ares (9.567b) 


= (proj f)e;. (9.567c) 


Donc proj = proj/. 


Note au passage : il y a un abus systématique de notation entre e; € E et T(e;) = 1@e; € Er. 
REMooBEXGooLgpHzg 


Remarque 9.273 ([1]). 
L'opération proj: £L(Er, Fr) — L(E,F) ne dépend pas des bases choisies un peu partout. Mais 
elle dépend de l’application proj: L — K déjà construite. Et celle-là dépend du choix d’un sup- 
plémentaire V qui fournit L = K@ V. 

Si proj(À) = 0 pour un de ces choix, cela n'implique nullement que À = 0. Penser à à € © si la 
projection proj: € — R est l'application (x + iy) - x parallèle à l’axe des imaginaires. 

Par contre si proj(À) = 0 pour tout choix de V, alors nous avons bien À = 0. Dans la suite 
nous « fixons » un choix de V générique, et lorsque nous rencontrerons l'égalité proj(À) = 0 nous 


en déduirons À = (0. 
PROPooPWDKooFNFWRI 


Proposition 9.274. 
Si f: E — F'et si fr(e;) = >, (fn )ajea et st f(e;) = >, fajea alors 


(1) proj fr = f, ITEMooNMPYooXosGhI 


(2) (fn)aj = fa € K: 


Démonstration. Nous avons 


fi. (ei) æ > Fall (eo) Ca) = > ler (9.568) 


donc 


(proj f)ei = D'proj(fai)ea = Ÿ° faica = (ci). (9.569) 


Cela prouve que proj fL = f. 
Par ailleurs, 


fu(r(ei)) = fL(1@ ei) = 1@ f(ei) = r(f(ei)) = D fair(ee) 70) 


alors que par définition, 


fu(r(ei)) = S(fL)air (ea). RON Et) 


a 


Les éléments r(e,) formant une base !10, la comparaison de (9.570) avec (9.571) donne (fL)ai = 
J ai € K. 


LEMooWZGSooONEn;jZ 
Lemme 9.275. 
Soient des espaces vectoriels E, F et G ainsi que des applications linéaires 


COR 


110. Encore la proposition 9.268. 
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(2) h: GL + Er. 
Alors nous avons 
proj(fr © h) = proj(fi.) © proj(h). (9.572) 


De mêmelll S f:E—Feth:F 


— Gr, alors 


IL 


proj(h & f.) = proj(h) o proj(f1.). (9.573) 


Démonstration. Nous considérons une base {e;} de E, une base {e,} de F, et une base {e,} de G. 
Pour écrire proj(f1r © h) à partir de la définition (9.563) nous commençons par écrire 


(fL © h}ea = D (JL © Raata = D FL)ai(R) és D (2 fn ia ) Ca (9.574) 


a at 


où nous avons utilisé le fait que (fL)ai = fai. Donc, en utilisant la K-linéarité de pro)j, 
— 
proj(fi o h)e Pr (ai(A jalee 22 fai proj (ie (R): LATE) 


D'autre part, 
proÿ(fi.) o proj(fea = proj(fr) Yproj (ia )e: 


= Dproj (ia) L faia (9.576) 
= = pros (| (CG de. 


et c’est égal à (9.575). 


Remarque 9.276. 
Nous n’avons en général pas proj(xy) = proj(x) proj(y) pour tout x, y € L. Par exemple si K = R 
et L = € avec la projection canonique, 


proj(i : à) = proj(—1) = —-1 (9.577) 


alors que proj(i) = 0. 
PROPooHJJCooTX1zdH 
Proposition 9.277. 
Soient trois K-espaces vectoriels E, F' et G. Nous considérons deux applications linéaires f: E — F 
eg: EG. 
Il existe une application linéaire h: F — G telle que g = ho f si et seulement si il existe une 
application linéaire h: Fr, — Gr telle que gr, = ho fr. 


Démonstration. Dans le sens direct, il suffit de poser À = Ar, et d’invoquer le lemme 9.266. 


Dans le sens inverse, si nous avons h: Fr, — Gr, tel que gr, = ho fr, alors en appliquant pro) 
des deux côtés et en utilisant le lemme 9.275, 


proj(gr.) = proj(k) o proj(fr.) (9.578) 


c’est-à-dire 
g = proj(h) Gif, (9.579) 


c’est-à-dire que l’application proj (h) : F — Gest la réponse à la proposition. 


111. Je n'ai pas vérifié cette deuxième partie. Soyez prudent. 
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9.15.3 Rang, polynôme minimal, polynôme caractéristique 


PROPooJFQDooZSsxMf 
Proposition 9.278 (Stabilité du rang par extension des scalaires[128]). 
Si f: E — F est linéaire alors nous avons 
1k(f) = rk(fr.). (9.580) 


où à droite nous considérons le rang de l’application L-linéaire fr,: Er, — Fr. 


Démonstration. Il existe un supplémentaire V tel que E = ker(f) @ V avec dim(V) = rk(f). Nous 
pouvons factoriser f en 


f=f8 (9.581) 


avec f1: E — V est la projection parallèle à ker(f) et est surjective (vers V) parce que dim(V) = 
rk(f) = dim (Image(f)). De plus f2: V — Fest injective parce que si v € V est tel que fo(v) = 0 
alors on aurait 


Fu) = (f20 f1)(v) = fofo) = 0. (9.582) 


Cela donne v € ker(f) n V = {0}. Par la proposition 9.267, les applications (f1)1 et (f2)1 sont 
respectivement surjective et injective. 
L'application (f2)1: VL — F1 est forcément surjective sur son image, donc 


(f2)1: VL — Image(fr) (9.583) 
est un isomorphisme de L-espaces vectoriels. Nous avons alors les égalités 
dimr, (VW) = dimy, (Image(fr,)) = rk(f1.). NOT RE) 
Mais aussi, par les définitions posées plus haut, 
dim(V) = rk(f) = dim (Image(f)). Se S IRe) 


Mais le corolaire 9.270 nous dit que dimy (Vr) = dimx(V). Donc il y a égalité des deux lignes 
(9.584) et (9.585), ce qui donne rk(f) = rk(fr.). 


PROPooZAZFooUFdCUv 
Proposition 9.279. 
Nous avons 


(1) det(f) = det(fr.) 
(2) XF =Xh- 


Démonstration. Dès que l’on a des bases nous avons (fL)ai = fai par la proposition 9.274(2). Le 

nombre det(f) € K est un polynôme en les f,;. Entendons nous : il existe un polynôme indépendant 

de f et de K et de L donnant le déterminant de n'importe quelle matrice. Donc det(f) = det(f1.). 
Même chose pour le polynôme caractéristique (définition 9.110) : les coefficients de ce polynôme 

sont des polynômes en les f,; qui sont indépendants de L, de K et de f. 
Notons que *X7,, est un polynôme à coefficients dans K. 


La situation est très différente avec le polynôme minimal !!?, Autant il existe une « recette » 
pour créer le polynôme caractéristique, il n’en n’existe pas pour le polynôme minimal (ou en tout 
cas, il ne suffit pas d’appliquer des polynômes en les coefficients de la matrice). La proposition 
suivante montre que le polynôme minimal est conservé par extension de corps, mais que pour le 


savoir, il faut travailler plus. 
PROPooXVZMooXcJrsJ 


Proposition 9.280 ([128, 1]). 
Soit L une extension du corps K et une application linéaire f: E — F' entre deux K-espaces 
vectoriels. Alors dy = Hifi 


112. Définition 6.64. 
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Démonstration. Nous allons montrer que l’application 


L[X 
LE Al — End(Er) 
(4) (9.586) 
[PJ P(fL) 
est bien définie et injective. La proposition 9.100 nous dira alors que y: est le polynôme minimal 


de ÎL. 
Pour prouver que l'application ÿ est bien définie, nous commençons par prouver que P(fr) = 


PF 


P(fL)À@ v = D arf À @ v (9.587a) 
k 
= 1@Y arf"(v) (9.587b) 
k 
= 1@ P(fjv (9.587c) 
= P(f)LA@ v. (9.587d) 


Par conséquent (fr) = 0 et l’application est bien définie. 

Sur L{[X]/(4) nous considérons la base {1,[X],...,[X4#(4)-1]}, et sur End(Æxr) nous considé- 
rons une base qui commence 1 par { fn) k=0,..,deg(u)—1* Montrons tout de même que cette partie 
est libre (sinon le théorème de la base incomplète ne s’applique pas) : si D À ie = 0 alors 


Sproj (uf#) =, FGooSFHVOoRqUER 


Pour détailler ce que cela implique, nous calculons ceci : 


(XL) (r(e:)) = Af.(r(ei)) = D Mfaitas (9.589) 
par conséquent proj(Afn)e; = >, proj(Afai)ea, et comme proj est K-linéaire et que fai € K, 


proj(Xfi.)e; = proj(à) À faica = proj(A)proj(f)ei = proj(A)f(ei). (9.590) 


Appliquer la projection proj à l'équation (9.588) donne alors Y, proj(A)xf" = 0. Mais comme les 
f* sont linéairement indépendants sur K nous avons pour tout k : proj(\z) = 0 (égalité dans K). 
En nous souvenant de la remarque 9.273 nous en déduisons À = 0 dans L. 

Dans les choix de bases effectués, l'application ÿ a la forme 


1 
1 
g = : (9.591) 
g E * * * d ° 
* * * 
* * * 
qui est injective. 
Puisque g est injective, 1 est le polynôme minimal de fx et donc 1 = jy. 
9.16 Frobenius et Jordan 
9.16.1 Matrice compagnon 
DEFoo0USVAooGevsda 
Définition 9.281. 
Soit le polynôme P = X" — an 13X"- 1... — a1X — ao dans K[X]. La matrice compagnon de 


113. Théorème de la base incomplète 4.13(2). 
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P est la matrice donnée par 


0 0 0  «o 
1 0 0 a 

C(P)= [0 1 :: 0 @ (9.592) 
0 O0 1 ah-1 


sin >2 et par (ao) sin = 1. 
Une matrice est dite compagnon si elle a cette forme. 


PROPooNDCLooYMGHmX 
Proposition 9.282. 
Si f est l’endomorphisme associé à la matrice C(P) nous avons 
ei sil<i<n 
f(ei) = 407 L (9.593) 
(dissssos) re. 
De plus l’endomorphisme f vérifie P(f)e1 = 0. 
LemkVNisk 


Lemme 9.283 ([296]). 
Un polynôme sur un corps commutatif est le polynôme caractéristique de sa matrice compagnon. 
En d’autres termes nous avons Xc(p) = P. 


Démonstration. Nous notons f l’endomorphisme associé à C(P). La propriété P(f)e1 = 0 nous 
indique que le polynôme minimal ponctuel de f en e1 divise P. L'ensemble des puissances de f 
appliquées à e1, ( f"(e1)) k-1 nn 1 st libre, donc le polynôme minimal ponctuel en e1 est de degré 
n au minimum. En reprenant les notations du théorème 6.43, nous avons L, = (P) parce que P 
est de degré minimum dans 1,, et x € I... . 

Donc P divise x et est de degré égal à celui de x. Etant donné qu'ils sont tous deux unitaires, 
ils sont égaux. 


RemmQ jZOA 
Remarque 9.284. 
Les matrices compagnons ne sont pas les seules dont le polynôme caractéristique est égal au 
polynôme minimal. En fait les matrices dont le polynôme caractéristique est égal au polynôme 
minimal sont denses dans l’ensemble des matrices. En effet une matrice dont le polynôme minimal 
n’est pas égal au polynôme caractéristique a un polynôme caractéristique avec une racine double. 
Il est possible, en modifiant arbitrairement peu la matrice, de séparer la racine double en deux 
racines distinctes. 


9.16.2 Réduction de Frobenius 


Lemme 9.285. 
Soit un endomorphisme f: E — E sur l’espace vectoriel de dimension finie n. Nous notons 1 et 
x les polynômes minimal et caractéristique. Si f est cyclique, alors = x. 


LEMooKUQDooKFeIYq 


Le théorème 9.298 donnera une version plus complète de ce lemme. 


Démonstration. Soit uv un vecteur cyclique de f, c’est-à-dire que {f*(v)}x-0...n-1 est libre. Donc 
si P est un polynôme de degré jusqu’à n — 1 nous ne pouvons pas avoir P(f) = 0 parce que, 
appliqué à v, ce serait une combinaisons nulle non triviale des f*(v). Donc le polynôme minimal 
est au minimum de degré n. Mais le polynôme caractéristique est annulateur de degré n (Cayley- 
Hamilton 9.118), donc il est le polynôme minimal. 


THOo0oDOWUoo0zxzxm 
Théorème 9.286 (Réduction de Frobenius [297, 298, 299]). 
Soit E, un K-espace vectoriel, et f € End(Æ). Alors il existe une suite de sous-espaces E1,...,E, 
stables par f tels que 
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Itemmpwjnss 
(1) E = Din Ei; 
(2) pour chaque E;, l’endomorphisme restreint f; = f|r, est cyclique ; 
3) si u; est le polynôme minimal de f; alors u;+1 divise ju ; 
mn 


Une telle décomposition vérifie automatiquement j1 = pif et pi1---uy = Xp, et la suite CAPES 
ne dépend que de f, et non du choix de la décomposition du point (1). 


Les polynômes 4; sont les invariants de similitude de l’endomorphisme f. 


/ : : P us ; subEqzcGouz 
Démonstration. Nous commençons par montrer que si une telle décomposition existe, alors | 


XF — [il Hi Faresan 
i=1 
Up = (9.594b) 


où x est le polynôme caractéristique de f et u# est le polynôme minimal. D'abord le polynôme 
caractéristique de f devra être égal au produit des polynômes caractéristiques des f|r,, mais ces 
derniers endomorphismes étant cycliques 14, leurs polynômes caractéristiques sont égaux à leurs 
polynômes minimaux (lemme 9.285). Cela prouve l'égalité (9.594a). Ensuite tous les y; doivent 
diviser le polynôme minimal, donc ppem(uw1,...,m#) divise ur. Cependant le polynôme minimal 
doit contenir une et une seule fois chacun des facteurs irréductibles du polynôme caractéristique, 
et chacun de ces facteurs sont dans les polynômes 15. Par conséquent ppem(u,...,p) = pi. Mais 
par ailleurs 41 = ppem(y1,...,p47) parce qu’on a supposé ui+1 | di, donc ui = ur. 

Soit d, le degré du polynôme minimal de f et y € E tel que us = puy (voir lemme 9.101). Le 
plus petit espace stable sous f contenant y est 


E, = Span{y, f(u),.…, FT (u)}. (9.595) 


Nous notons e; = f-!(y). Notons que les vecteurs donnés forment bien une base de E,, parce que 
si les e; n’était pas linéairement indépendants, alors nous aurions des ax tels que ÿ}, axex = 0 et 
avec lesquels 


(CO aX")(Py = 0, (9.596) 
k 


ce qui contredirait la minimalité de u1f,y. 

La difficulté du théorème est de trouver un complément de E,, qui soit également stable sous f. 
Nous commençons par étendre {1° {e,...,e4} en une base {e1,...,e,} de E. Ensuite nous allons 
montrer que 


E-E,@F (9.597) 


avec 


F={xeE tel que ei(f"(x)) = 0,Vk e N}. (9.598) 


qui fait appel aux définitions d’espace dual (définition 4.125) et de base duale (définition 4.126). 
Par construction, F est invariant sous f. Montrons pour commencer que E, n F = {0}. Un 
élément de E, s’écrit 
z2 = 4e +: + axe (9.599) 


avec k < d. Étant donné que f décale les vecteurs de base, nous avons ef ( MCE) — ag. Du coup 
ze F si et seulement si ai = ...= ag = 0, c'est-à-dire que E,, n F = {0}. 
Nous montrons maintenant que dim F = n — d. Pour cela nous considérons l’application 


FRA] +E" 


: (9.600) 
gr €e30g. 


114. Définition 9.102. 
115. Pour autant que j'aie compris, cette extension manque dans [297]. Corrigez-moi si je me trompe. 
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Cette application est injective. En effet un élément général de K{[f] est 
g = a ld+aof +:::+ apfr7} (9.601) 
avec p < d. Si T(g) = 0, alors nous avons en particulier 
0 = T(gjed-p+1 = eg(aiea p+1 + G2Ed-p+2 + *** + apEg) = Ap. (9.602) 


Donc a, = 0 et en appliquant maintenant T(g) à eq_, nous obtenons a,_1 = 0. Au final nous 
trouvons que g = 0 et donc que T'est injective. 

Étant donné que dim K|[f] = d et que T est injective, dim Image(T) = d. Étudions l’orthogo- 
nal 16 de l’image de T : 


(Image(T))+ = {x e E tel que T(g)x = 0,Vge K[f]} (9.603a) 
= {x e E tel que ef (g(x)) = 0,VgeK{[f]} (9.603b) 
_F. (9.603) 


Par conséquent F+ = Image(T). Puisque dim Image(T) = d, nous avons donc dim F = n — d et il 
est établi que E = E,@F. 

Nous avons donc trouvé F, stable par f et tel que E = E,,@ F'. Nous devons maintenant nous 
assurer que cette décomposition tombe bien pour les polynômes minimaux. Si P, est le polynôme 
minimal de f|r,, alors par le lemme 9.103 nous avons Pi = y, = uf parce que f|#, est cyclique 
sur E,,. Mettons P», le polynôme minimal de f|r. Étant attendu que F est stable par f, le polynôme 
P; divise P,. En recommençant la construction sur F', nous construisons un nouvel espace F” stable 
sous Fet vérifiant 1, = Po, etc. 

Nous passons maintenant à la partie unicité du théorème. Soient deux suites Æ1,...,F, et 
G1,...,G, de sous-espaces stables par f et vérifiant 

({) E=@; Fr, 

(2) fr, est cyclique, 

(3) Hfrs divise Lf|7 ; 
et, mutatis mutandis, les mêmes conditions pour la famille {G;}. Nous posons P; — }1$l r, € Q; = 
Lfle,- Nous allons montrer par récurrence que P; = Q; et dim F; = dim G;. Il ne sera cependant 
pas garanti que F; = G;. D'abord, P, = Q; parce qu'ils sont tous deux égaux à 41} par les relations 
(9.594). Nous supposons que P; = Q; pour 1 << j — 1 et nous tentons de montrer que P; = Q;. 

Nous avons 
P;(f) = P;(Pln ©...@ Pr FATOUA) 

En effet étant donné que P;,4 divise P;, il existe un polynôme À tel que P; = AP;,}7, et donc 
tel que! P;(f) = A(f) o P;sg(f), mais P;rg(f)F;4x = 0, donc P;(f)F;1x = 0. Les espaces G; 
n'ayant à priori aucun rapport avec les polynômes P;, nous écrivons 


P;(f) = P(Pla ©..6 PP, © Pile, ®..@ P(fle.. Fa 60b) 


Pour 1 << j—1, nous avons supposé P; = Q;. Étant donné que la matrice de f |r, est semblable 
à CP, et celle de fl, est semblable à Co,, la matrice de f|r, est semblable à la matrice de f|G,. 
En particulier, 


dim P;(f)F; = dim P;(f)Gi. (9.606) 
En prenant les dimensions des images dans les égalités (9.604) et (9.605), nous trouvons que 
Flers Eee 0: (9.607) 


Par conséquent P; est annulateur de f|G;, et il divise donc Q;, qui est générateur de lidéal des 
polynômes annulateurs de f|c;. La situation étant symétrique entre P et Q, nous montrons de 
même que Q; divise P; et donc que P; = Q;. 

Ceci achève la démonstration du théorème de réduction de Frobenius. 


116. Définition 4.132. 
117. En vertu du lemme 9.88. 
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REMooPVLEooYDRXQI 
Remarque 9.287. 
Sous forme matricielle, ce théorème dit que toute matrice est semblable à une matrice de la forme 
bloc-diagonale 


Cu 
f = d (9.608) 
C 


T 


où les C,, sont des matrices compagnons (définition 9.281). 
En particulier, et ceci est très important, deux applications sont semblables si et seulement si 
elles ont même suite d’invariants de similitude. 


Remarque 9.288. 

Si nous travaillons sur KR, la réduite de Frobenius restera une matrice réelle, même si les va- 
leurs propres sont complexes. En effet le procédé de Frobenius ne regarde absolument pas les 
valeurs propres, mais seulement les facteurs irréductibles du polynôme caractéristique. La réduite 
de Frobenius ne tente pas de résoudre ces polynômes, mais se contente d’en utiliser les matrices 
compagnon. 


La situation sera différente dans le cas de la forme normale de Jordan. 


9.16.3 Forme normale de Jordan 


Il existe une preuve directe de la réduction de Jordan ne nécessitant pas la réduction de 
Frobenius[300]. Cette dernière passe par les espaces caractéristiques et est à mon avis plus 
compliquée que la démonstration de Frobenius elle-même. Nous allons donc nous contenter de 


donner la réduction de Jordan comme un cas particulier de réduction de Frobenius. 
ThoGGMYooPzMVpe 


Théorème 9.289 (Réduction de Jordan). 

Soit E un espace vectoriel sur K, et f € End(ÆE) un endomorphisme dont le polynôme caracté- 
ristique Xy est scindé 9. Il existe une base de E dans laquelle la matrice de f s'écrit sous la 
forme 


mi) À 
M = 0 en, (9.609) 


où les À; sont les valeurs propres de f (avec éventuelles répétitions) et Jh,(À) représente le bloc 
Ni X Ni 
À 1 0 
À 1 0 
3.012 À . (9.610) 


En d’autres termes, Ju, (Ai = À et Ji 15 = 1. 


Démonstration. Nous commençons par le cas où f est nilpotente ; nous notons M sa matrice. Dans 
ce cas la seule valeur propre est zéro et le polynôme caractéristique est X°”* pour un certain m. 
Nous savons par le lemme 9.283 que (la matrice de) f est semblable à sa matrice compagnon. En 


118. Aussi appelés « espaces propres généralisés ». 
119. C’est à cause de cette hypothèse que K = R n’est pas le bon exemple de contexte de travail. 
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l'occurrence pour f nous avons 


0 0 
LL, ; 
ee “+ (9.611) 
1 O0 
Ensuite le changement de base (qui est une similitude) (e1,e2,...,en) > (en,...,€2,€1) montre 


que C'xm est semblable à un bloc de Jordan J,,(0). 

Supposons à présent que f ne soit pas nilpotente. Par l'hypothèse de polynôme caractéristique 
scindé, nous supposons que f a m valeurs propres distinctes et que son polynôme caractéristique 
est 


x = (XX)... (X — An). (9.612) 
Le lemme des noyaux (théorème 9.89) nous enseigne que 
mm 
E = @ker(f — X1)". (9.613) 
Rs 
F; 


La restriction de f — À;1 à F; est par construction un endomorphisme nilpotent, et donc peut 
s’écrire comme un bloc de Jordan avec des zéros sur la diagonale. En utilisant la décomposition 


Île = (— X)}r, + Xlr,, (9.614) 


nous voyons que f|r, s'écrit comme un bloc de Jordan avec À; sur la diagonale. 


Remarque 9.290. 
Nous pouvons calculer la forme normale de Jordan pour une matrice complexe ou réelle, mais 
dans les deux cas nous devons nous attendre à obtenir une matrice complexe parce que les valeurs 
propres d’une matrice réelle peuvent être complexes. Cependant nous demandons que le polynôme 
caractéristique de f soit scindé sur K. En pratique, la décomposition de Jordan n’est garantie que 
sur les corps algébriquement clos, c’est-à-dire sur C. 

La suite des invariants de similitude sur laquelle repose la réduction de Frobenius, elle, est 
disponible sur tout corps, y compris IR. 


9.17 Commutant et endomorphismes cycliques 


9.17.1 Endomorphisme cyclique 
LemSGmdnE 


Lemme 9.291. 
Si À est la matrice de l’endomorphisme f alors nous avons équivalence des propriétés suivantes : 


(1) La matrice À est cyclique. 
(2) L'endomorphisme f est cyclique. 


Si f est un endomorphisme de l’espace vectoriel Æ et si x € FE, nous notons 


Efz = Span{f"(x) tel que ke N}. (9.615) 
DEFooIDMMooHIpUmT 
Définition 9.292 (Commutant C(f) de f). 
Soit E un espace vectoriel de dimension finie sur un corps K et un endomorphisme f: E — E. Le 
commutant de f est l’ensemble des endomorphismes de E qui commutent avec f : 


C(f) = {ge L(E,E) tel que go f = fog}. (9.616) 


Il n’est pas très compliqué de vérifier que C(f) est un sous-espace vectoriel de L(E, E). 
Notons l'inclusion évidente K][f] € C(f). L’inclusion inverse va un peu nous occuper durant 
les prochaines pages. 
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9.17.2 Commutant : cas diagonalisable 
PROPooRHHE00!IRGmtl 


Proposition 9.293 ([301]). 
Si f est diagonalisable, alors 


dim(C(f))= Y dim(E) SE 6) 


XeSpec(f) 
où les E\ sont les espaces propres de f. 


Démonstration. D'abord, soit g € C(f) alors Ex est stable par g. En effet si v € E, alors f(g(v)) — 
g(f(v)) = g(Av) = Àg(v), ce qui montre que g(v) est un vecteur propre de f pour la valeur propre 
À, et donc que g{v) € Ex. 

Nous considérons ensuite l'application 


Y: C(f) — End(Æi) x … x End(E,) 


(9.618) 
g gl X... x gl, 


qui est bien définie parce que g se restreint aux espaces propres de f. Nous allons noter 4(g) la 
restriction de g à E. 


(1) Ÿ est injective 


Supposons que g,h € C(f) tels que #(g) = Y(h). Puisque f est diagonalisable nous pouvons 
décomposer x € E en ses composantes sur les espaces propres ? : 


g= Ÿ, (9.619) 
XeSpec(f) 
avec xx € Ex. Nous avons alors 
ge) = D ge) = D D(g)x(œx). (9.620) 
x x 


Par hypothèse nous avons #(g)1 = #(h)x, et donc aussi 
g(æ) = D (g)x(x) = D b(h}a(æx) = D Rx) = A(x). (9.621) 
À À 


Cela prouve g = h et donc que Ÿ est injective. 


(2) d est surjective Si nous avons pour chaque À € Spec(f) un endomorphisme g) de E, alors 


en posant 
g(x) = > g\(x)) (9.622) 
XeSpec(f) 
nous avons bien 
D(g) = (gu,...,9x). (9.623) 
Nous pouvons donc conclure en écrivant 
dim(C(f))=  ÿ, dim(End(F;))= ÿ, dim(E)). (9.624) 
XeSpec(f) XeSpec(f) 
REMooUGFQooVzCOvVv 
Remarque 9.294. 
Nous avons alors immédiatement 
dim (C(f)) > dim(E) (9.625) 


lorsque f est diagonalisable. 


120. Théorème 9.213(5). 
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En suivant la notation (9.200), un endomorphisme est cyclique lorsqu'il existe x € E tel que 
E; = E. 


PropooQALUooTluDif 


Proposition 9.295 ([301]). 
Si f est un endomorphisme diagonalisable d’un espace vectoriel E de dimension n. Nous avons 


équivalence des points suivants. 
(1) Le polynôme minimal est égal au polynôme caractéristique : ui} 


(2) L'’endomorphisme f est cyclique. 


ITEMooSOYYooZVibjrii 


— À ITEMooSOYYooZVibjrvi 


ITEMooSOYYooZVibjrv 
(3) C(F) = KÏf] de ITEMooSOYYooZVibjriv 
(4) dim (C(F)) =n ITEMooSOYYooZVibjriii 
(5) L’endomorphisme f possède n valeurs propres distinctes. ITEMooSOYYooZVibjri 


(6) dim (K{f]) =n 


Démonstration. Le point important de cette proposition réside dans les équivalences (1)-(3). Les 
autres sont des résultats intermédiaires. En particulier, dans le cas diagonalisable, nous allons voir 
que le point (5) est essentiellement une reformulation de (1). 


(1) (4) implique (5) Par la formule (9.617), les espaces propres de f ont tous une dimension 


de 1. Par conséquent f possède n valeurs propres distinctes. 


(5) implique (6) Le théorème 9.213 nous dit que le polynôme minimal est scindé à racines 
simples. Puisque f possède n valeurs propres distinctes, 4 est de degré n. Par l’isomorphisme 
K{f] = K[X]/(u) de la proposition 9.109 nous avons dim (K{f]) = deg(u) = n par la 
proposition 6.44. 


(6) implique (1) Par l’isomorphisme K{[f] = K[X]/(x4) de la proposition 9.109 et la pro- 
position 6.44 nous avons n = dim (K[f]) = deg(yu). Comme y est un polynôme annulateur 
(Caley-Hamilton 9.118), il est divisé par u. Maintenant y et x sont des polynômes unitaires 
de degré n et u divise x. Ils sont donc égaux. 


(1) implique (2) Le fait que f soit diagonalisable permet d’utiliser le théorème 9.213 pour 
dire que u est scindé à racines simples. L’égalisation avec y nous permet de dire que f possède 
n valeurs propres distinctes. Soient {e1,...,e,} une base de diagonalisation, et prouvons que 
le vecteur v = ej +---+e, est cyclique. Nous avons 


f*(v) = ÿ XF es. (9.626) 
i=1 


Pour prouver que cette famille (avec k = 0,...,n — 1) est libre !?? nous en prenons une 
combinaison linéaire nulle et nous prouvons que les coefficients sont tous nuls. Soit donc 


n—1 n—1l n n n—1l 
0 — . a fl(v) = >, a >, Xe; = + ( 5 ax) ei. (9.627) 
1=0 I=0 i=1 i=1 ‘1=0 
Par hypothèse, la double somme est nulle, et nous avons pour tout 1 : 
n—1 
D œA = 0. (9.628) 
1=0 


En posant la matrice À;; = X, cela revient à étudier le système >; Aija; = 0. Ce système 


n’a des solutions non nulles que si det(A) = 0; sinon il possède une unique solution qui est 


121. Rappel : C(f) est le commutant de f, définition 9.292. 
122. Ce sera alors une base parce que n vecteurs libres dans un espace de dimension n est toujours une base 
proposition 4.18. 
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a; = 0 pour tout j. Nous devons donc calculer le déterminant 


É Ai À Ge AU 
det |: : : : (9.629) 
É cA A ce A 


Il s’agit du déterminant de Vandermonde déjà étudié par la proposition 9.15. Nous avons 
det(A) = [Tié;c;en(A; — À). Ce déterminant est bien non nul parce que toutes les valeurs 
propres sont distinctes. 


(5) (2) implique (3) Soit v un vecteur cyclique l?* de f. Si g est un endomorphisme, nous 
définissons des coefficients (az(g))x=0,..n-1 Par 


n—1 
go) = D a(g)f*(v). (9.630) 
k=0 


C’est une bonne définition parce que {f"(v)} est une base. 


Nous définissons alors l’application 
+ (9.631) 


C’est une application injective parce que si (g) = 0 alors g(v) = 0 et pour tout k nous avons 
g(f"(v)) = ff (g(v)) = 0. L’endomorphisme g s’annulant sur une base, il est nul. 


L'application Ÿ est surjective. En effet si un polynôme P — à ax f” est donné, il suffit de 


poser 
g(æ) = Dax f(x) (9.632) 
k 
pour avoir Ÿ(g) = P. 
(6) (3) implique (4) Si n1,...,n, sont les dimensions des différents espaces propres de f, 
nous avons les inégalités 
dim (K[f]) = deg(u) <n=m+...+n, <ni+...+nf = dim (C(f)). (9.633) 


Par hypothèse d'égalité entre le premier et le dernier terme de cette suite d’inégalités, toutes 
les inégalités sont des égalités et en particulier dim (C(f)) = n. 


Nous avons fini de prouver toutes les équivalences demandées. 


Exemple 9.296. 
Pour mieux comprendre pourquoi le fait d’avoir n valeurs propres distinctes est équivalent à être 
cyclique, notons que si deux valeurs propres sont identiques, alors un morceau de la matrice 


2 
de f serait par exemple ( ; 


proportionnelle à elle-même après application de f. Si nous avons des valeurs propres différentes 


): et dans ce cas n'importe quelle combinaison ae; + be; reste 


1 0 
0 à qui donne f(e1 + e2) = e1 + 262. 
La partie {ei + e2,e1 + 2e2} est une base. VA 


par contre, nous avons par exemple dans R? la matrice 


123. Définition 9.292. 
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9.17.3 Commutant : cas général 


Nous considérons encore un espace vectoriel E de dimension finie n et un endomorphisme 


J: E — E. Nous notons y son polynôme minimal et u, le polynôme minimal ponctuel en x. 
LEMooDFFDooJTQkRu 


Lemme 9.297 (1302, 297, 128]). 
Nous avons 


dim (C(f)) > dim(E) (9.634) 


Démonstration. Si f est donnée, l’espace C(f) est l’espace des solutions de fg = gf. Supposons 
avoir choisi une base de E et notons À la matrice de f et X celle de g. L'équation est AX — X À = (. 


(1) Si À est trigonalisable Nous supposons avoir choisi la base de telle sorte que À soit 
triangulaire supérieure, et nous allons nous contenter de chercher les solutions X qui sont 
également triangulaires supérieure. Si il y en a déjà plus que n, a fortiori le résultat sera vrai. 


Le produit de deux matrices triangulaires supérieures étant une matrice triangulaire supé- 
rieure, l’équation AX — X À contient, pour les coefficients de X, n(n + 1)/2 équations. Mais 
il se fait que les termes diagonaux ne sont pas de vraies équations parce que 


(AX — X Apr = D (AniXix — XniAix) = D (AniXin — XpiAix) = 0. (9.635) 


î k<i<k 
Nous avons donc au maximum 
n(n +1) 
2 
équations linéairement indépendantes pour un minimum de n{n + 1)/2 inconnues. L'espace 
des solutions est donc de dimension au minimum n. 


_n (9.636) 


Cela a l’air d’être une majoration assez large, mais il existe des cas d'égalité. 


(2) Si À n’est pas trigonalisable 


La preuve que nous donnons ici est valable même pour les endomorphismes trigonalisables. 
Nous considérons le résultat de Frobenius 9.286. Nous avons donc la structure suivante : 

— une décomposition en somme directe E = E@...@E,, 

— les espaces ÆE; sont fixés par f, 

— les endomorphismes f; = f|#, sont cycliques 

— le polynôme minimal de f; est y; et [ [5 ju = xp. 
Les endomorphismes f* commutent évidemment avec 5, et la partie { he Seti est 


libre. Libre en tout cas en tant que partie de End(Æ;). Mais en prolongeant par 0 sur E, ça 
reste libre en tant que partie de End(E). 


Bien entendu les fF et les fF (i £ j) sont linéairement indépendants dans End(ÆE) parce qu'ils 
n’agissent pas sur les mêmes vecteurs. Donc les endomorphismes Fe ‘avec k; = 0,...,deg(u;)— 
1 forment une partie libre de End(Æ) composée d’endomorphismes qui commutent avec f. Il 
y en à en tout 


D deg(yi) = deg(xr) = n. (9.637) 
i=1 


Par conséquent dim (C(f)) > dim(E). 


THOo0GLMSooYewNx\W 
Théorème 9.298 ([273]). 
Soit un endomorphisme f: E — E sur l’espace vectoriel de dimension finie n. Nous notons 1 et 
x les polynômes minimal et caractéristique. Nous avons équivalence entre les pets AHTURÉE Ya Ji 


(1) H— X; ITEMooLRXIooLWaYqJii 
(2) f est cyclique, 
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ITEMooLRXIooLWaYqJiii 
(3) C(F) = K{F]. 


Démonstration. Plusieurs implications. Notons que (2) implique (1) a déjà été démontré par le 
lemme 9.285. 


(1) (1) implique (2) Conformément à ce que nous permet le lemme 9.101 nous choisissons !?4 
a € E de telle sorte à avoir y = 1. De plus pour x € E nous considérons l’application 
: K[IX|—-E 
PE (9.638) 
Pr P(f)x. 


Nous avons @a(P) = P(f)a. Étant donné que E, est engendré par les ff(a) nous avons 
Pa (K[X]) = E,. De plus l'application 4, passe aux classes pour (y4,). Pour rappel, un 
élément de K[X]|/(u) est de la forme 


[PT = {P + Qha}Qek(x]- (9.639) 


Nous considérons donc l’application quotient 


K[AT  k 
(Ha) ° (9.640) 
[PT pa(P), 


d: 


et nous prouvons que c’est un isomorphisme d’espace vectoriel. 

(la) Linéaire Parce que (AP + Q)(f) = (AP)(f) + Q(f). 

(1b) Injectif Si Y([P]) = 0, alors wa(P) = 0, c’est-à-dire que P € ker(a). Mais, par 
définition 9.97 du polynôme minimal ponctuel, 4, est générateur de ker(Y,); done il 
existe Q € K[X] tel que P = Qu. Par conséquent [P] = 0, ce que nous voulions. 


(1c) Surjectif Sixe E, alors il existe des coefficients xx € K tels que x = D ze. f" (a), 
c'est-à-dire x = P(f)a = ga(P) = Y([P]). 

Mais par hypothèse et par choix de a nous avons y, = pu = X, donc en fait E, = K[X|/(x). 

Nous savons aussi que deg(x) = dim(Æ) et que dim(K[X]/P) = deg(P) par la proposi- 

tion 9.109. Au final nous avons dim(Æ,) = deg(x) = dim(Æ). Et par conséquent ÆE, = E. 

Cela prouve que a est un vecteur cyclique pour f. 


TS 
ND 
nr 


(2) implique (3) Soit g € C(f):; nous devons prouver que g est un polynôme de f. Par 
hypothèse nous avons un vecteur cyclique que nous notons v. Nous avons un polynôme P 
(dépendant de g) tel que g(v) = P(f)v. Nous allons voir que g = P(f). Soient y e E et Q 
un polynôme tels que y = Q(f)v; en notant que g commute avec P(f) nous avons 


g(y) = g(Q(Fv) = Q(P)(g(v)) = Q(F)(P(Pv) = P(PQ(F)v = P(f)y. (9.641) 
Donc g = P(f). 


(3) (3) implique (1) 
Nous avons les inégalités : 


n < dim (C(f)) = dim (K[f]) = deg{(u) < deg(x) = n. (9.642) 


La première inégalité est le lemme 9.297. Ensuite, toutes les inégalités se trouvent être des 
égalités. En particulier deg(yu) = n, ce qui signifie que y = x parce que y est un polynôme 
diviseur de x, de même degré que x et unitaire tout comme x. 


124. Dans toute la suite, nous devrions écrire uf et L,A4 Mais nous omettons d’indiquer explicitement la dépendance 


en f. 
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CORooAKQEooS1iXPp 
Corolaire 9.299 ([128]). 
En suivant les notations sur les extensions de corps de base de la section 9.15, l’endomorphisme 
f:E — Fest cyclique si et seulement si l’endomorphisme fr: Er, — FT est cyclique. 


Démonstration. Nous savons par le théorème 9.298 qu’un endomorphisme est cyclique si et seule- 
ment si son polynôme minimal est égal à son polynôme caractéristique. Or par les propositions 9.279 
et 9.280, nous savons que ces polynômes sont identiques pour f et pour fr. 


THOooHUFBooReKZWG 
Théorème 9.300 (Similitude et extension de corps[128]). 
Les applications linéaires f,g: E — E sont semblables si et seulement si fx et gx le sont. 


Démonstration. En ce qui concerne le sens direct, si il existe m € GL(E) tel que f = mgm! alors 
il suffit d'appliquer le lemme 9.275 pour avoir fr, = MLILME |. 

Nous considérons les invariants de similitude de f du théorème 9.286. Il existe une unique 
suite de polynômes unitaires u; (à = 1,...,s) tels que H;41 | 3 et pour laquelle nous avons une 
décomposition £ = Æ1@...@E, pour laquelle f|g,: E — E; est cyclique et de polynôme minimal 
Hi. 

Nous avons aussi Er, = (E1)1@...@(E,.)x et les (E;)r sont stables sous fr, qui y sera également 
cyclique (corolaire 9.299). De plus le polynôme minimal de fr|(#,,, est également y. 

Autrement dit, la suite u; est également la suite des invariants de similitude de fr. La re- 
marque 9.287 nous permet de conclure que f et g sont semblables si et seulement si fr et gx le 
sont. 


9.18 Hyperplans et formes linéaires 

DEFooEWDTooQbUQws 
Définition 9.301. 
Si E est un espace vectoriel de dimension n, un hyperplan de E est un sous-espace vectoriel de 


dimension n — 1. 
PROPooVYJUooAWDQrZ 


Proposition 9.302 ([303]). 
À propos d’hyperplans et de formes linéaires sur un espace vectoriel E sur le corps K. 
(1) Si est une forme linéaire non nulle, alors ker(ç) est un hyperplan. 


(2) Si H est un hyperplan de E, il existe une forme linéaire dont H est le noyau : 
H = ker(y). (9.643) 


Démonstration. En deux parties. 


(1) Soit un supplémentaire À de H. Nous considérons la restriction 64: À — K. Vu que les 
éléments non nuls de À sont hors de H, nous avons w(x) # 0 dès que x est non nul dans À. 
Cela implique que A est surjective. 

D'autre part, wA est également injective : si &4(x) = wA(y), alors wA(x — y) = 0, ce qui 
signifie que x — y = Ü ou encore que # = y. 

Donc GA est un isomorphisme de K-espaces vectoriels; nous en déduisons par le corolaire 
4.44 que À est de dimension 1 sur K, parce que K est de dimension 1. 

(2) Nous utilisons le théorème de la base incomplète 4.13(4) pour considérer une base {e;}i=1..m 
de E telle que Span{e1,...,en-1} = H. Nous pouvons alors considérer la forme linéaire 
définie par 


D A 
= À (9.644) 


Cette forme vérifie ker(s) = H. 
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Proposition 9.303 ([127]). 
Soit un espace vectoriel E de dimension finie n > 2. Soit un sous-espace vectoriel V de E de 
dimension s. Alors V est une intersection de n — s hyperplans de E. 


Démonstration. Nous considérons une base de V que nous complétons l en une base de E : si 
T — . Tie;, nous avons x € V si et seulement si xs: = ... = xn — 0. Nous considérons les 
formes linéaires 
G:E—R 
(9.645) 
TH Li, 


et nous considérons les parties A; = ker(y;) qui sont de hyperplans par la proposition 9.302. Les 
H; avec s +1 <i< n sont une famille de n — s hyperplans qui vérifient 


n 


V = R ker(w;) (9.646) 


i=s+1 


parce que x € ker(w;) si et seulement si x; = 0. 
Donc V peut être écrit comme intersection de n — s hyperplans de E. 


PROPooRCLNooJpIMM1 
Proposition 9.304 ([127]). 
Soit un K-espace vectoriel E de dimension finie n > 2. Si H; sont des hyperplans de E, alors 


dim ( a Hi) >n—m. (9.647) 
i=1 


Démonstration. N'oubliez pas de prouver que (7, H; est un espace vectoriel. À part ça, nous 
faisons une petite récurrence. 


(1) Pour m=2 Nous savons déjà par la proposition 4.47 que 
dim(H; + H) = dim(H:) + dim(Æ) — dim(AH; A] H). (9.648) 
De plus dim(H; + H2) < n. En remplaçant, par les valeurs, 


dim(AH; a H) = dim(A;) + dim(Æo) — dim(AH; + H2) 
=n—1l+n—1-dim(H; + H) 


>2n—-2—-n 


9.649a 
9.649b 
9.649c 
9.649d 


Ds PTS LS 


= n— 2. 


TR 
Res RE REA RP 


Donc dim(A; n H2) > n —2. 


(2) La récurrence Nous calculons dim(Æi nn..." Hy N Hm+1) en commençant encore par la 
proposition 4.47 : 


dim(H n...0 Hy N Hu) = dim(Hn...n Hy)+dim(Hh+1) (9.650a) 
— dim ((Hi NH) + Hmt1) (9.650b) 
sr 
>n-m+(n—-1)-n (9.650c) 
es (9.650d) 


C’est bon pour la récurrence. 


125. Théorème de la base incomplète, 4.13(4). 
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9.18.1 Trouver la matrice d’une symétrie donnée 
SubSecMtrSsym 


Les notions de déterminants, produit scalaire et vectoriels 6 donnent une bonne intuition 
géométrique des matrices. Nous pouvons alors chercher les matrices de quelques symétries dans 
R? ou R°. 


9.18.1.1 Symétrie par rapport à un plan 


Comment trouver par exemple la matrice À qui donne la symétrie autour du plan z = 0? La 
définition d’une telle symétrie est que les vecteurs du plan z = 0 ne bougent pas, tandis que les 
vecteurs perpendiculaires changent de signe. Ces informations vont permettre de trouver comment 
À agit sur une base de RŸ. En effet : 


1 
(1) Le vecteur | 0 | est dans le plan z = 0, donc il ne bouge pas, 
0 
0 
(2) le vecteur | 1 | est également dans le plan, donc il ne bouge pas non plus, 
0 
0 
(3) et le vecteur | 0 | est perpendiculaire au plan z = 0, donc il va changer de signe. 
1 
Cela nous donne directement les valeurs de À sur la base canonique et nous permet d'écrire 
1 O0 O0 
A=|[0 1 O |. (9.651) 
0 O0 —-1 


Pour écrire cela, nous avons juste mis en colonne les images des vecteurs de base. Les deux premiers 
n’ont pas changé et le troisième a changé. 

Et si maintenant on donne un plan moins facile que z = 0 ? Le principe reste le même : il faudra 
trouver deux vecteurs qui sont dans le plan (et dire qu’ils ne bougent pas), et puis un vecteur qui 
est perpendiculaire au plan !?”, et dire qu’il change de signe. 

Voyons ce qu’il en est pour le plan x = —z. Il faut trouver deux vecteurs linéairement indépen- 
dants dans ce plan. Prenons par exemple 


0 1 
E 
0 —] 
Nous avons ” 
fe (9.653) 
Af2 = f2. 
Afin de trouver un vecteur perpendiculaire au plan, calculons le produit vectoriel : 
€ €2 €E3 —] 
B=h*h=t 1 Ds-gés=| dk (9.654) 
1 0 —1 —1 
Nous avons 
Af3 = —f3. (9.655) 


Afin de trouver la matrice À, il faut trouver Ae1, Ae2 et Aez. Pour ce faire, il faut d’abord écrire 
{e1,e2,e2} en fonction de {f1, f2, f3}. La première des équations (9.652) dit que 


fi = €. (9.656) 


126. Définitions 9.12, 9.164 et 11.25. 
127. Pour le trouver, penser au produit vectoriel. 
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Ensuite, nous avons 
f2 = 1 —e3 


(9.657) 
= Sri, 
La somme de ces deux équations donne —2e3 = f2 + f3, c’est-à-dire 
= 2 +R (9.658) 
Et enfin, nous avons 
ne . (9.659) 
Maintenant nous pouvons calculer les images de e1, e2 et e3 en faisant 
0 0 
Afo — À 1 
je he # _: o |=-{ol. 
—2 —] 
0 
Ae2 EE Afi — Ji D 1 ; (9.660) 
0 
2 —1 
— 1 
A = h ; = | 0 
0 0 
La matrice À s'écrit maintenant en mettant les trois images trouvées en colonnes : 
0 O0 —1 
A= | 0 1 O0 |. (9.661) 
—1 0 O0 


9.18.1.2 Symétrie par rapport à une droite 


Le principe est exactement le même : il faut trouver trois vecteurs f1, f2 et f3 sur lesquels on 
connaît l’action de la symétrie. Ensuite il faudra exprimer e1, e2 et e3 en termes de fi, f2 et fs. 

Le seul problème est de trouver les trois vecteurs f;. Le premier est tout trouvé : c’est n'importe 
quel vecteur sur la droite. Pour les deux autres, il faut un peu ruser parce qu’il faut impérativement 
qu’ils soient perpendiculaire à la droite. Pour trouver f2, on peut écrire 


1 
=: |01; (9.662) 
TX 


et puis fixer le x pour que le produit scalaire de f2 avec f1 soit nul. Si il n’y a pas moyen (genre 
x 

si f1 a sa troisième composante nulle), essayer avec | 1 |. Une fois que f2 est trouvé (il y a des 
0 

milliards de choix possibles), trouver f3 est super facile : prendre le produit vectoriel entre f1 et 


2. 


9.18.1.3 En résumé 


La marche à suivre est 


(1) Trouver trois vecteurs f1, f2 et f3 sur lesquels on connaît l’action de la symétrie. Typique- 
ment : des vecteurs qui sont sur l’axe ou le plan de symétrie, et puis des perpendiculaires. 
Pour la perpendiculaire, penser au produit scalaire et au produit vectoriel. 


(2) Exprimer la base canonique e1, e2 et e3 en termes de f1, f2, fs. 


(3) Trouver Ae:, Ae2 et Aez en utilisant leur expression en termes des f;, et le fait que l’on 
connaisse l’action de À sur les f;. 


(4) La matrice s'obtient en mettant les images des e; en colonnes. 
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9.19 Théorème de Burnside 


LemwXXzIt 
Lemme 9.305. 
Soit P, un polynôme sur K. Une racine de P est une racine simple si et seulement si elle n’est 


pas racine de P. 
ThoBurnsideoPuCtS 


Théorème 9.306. 
Toute représentation‘? d’un groupe abélien d’exposant fini sur C" a une image finie. 


Démonstration. Étant donné que G est d’exposant fini, il existe à € N* tel que g° = e pour tout 
g € G. Le polynôme P(X) = X®% — 1 est scindé à racines simples. En effet tout polynôme sur C 
est scindé. Le fait qu’il soit à racines simples provient du lemme 9.305 parce que si a°* = 1, alors 
il n’est pas possible d’avoir aa°71 = 0. 

Par ailleurs P(g) = 0. Le fait que nous ayons un polynôme annulateur de g scindé à racines 
simples implique que g est diagonalisable (théorème 9.213). Le fait que G soit abélien montre 
qu’il existe une base de C” dans laquelle tous les éléments de G sont diagonaux. Nous devons par 
conséquent montrer qu'il existe un nombre fini de matrices de la forme 


À 
(9.663) 
An 


Nous savons que À = 1 parce que g* = 1, par conséquent chacun des À; est une racine de l’unité 
dont il n’existe qu’un nombre fini. 


ThooJLTit 
Théorème 9.307 (Burnside[112, 304]). 
Un sous-groupe de GL(n, C) est fini si et seulement si il est d’exposant !?° fini. 


Démonstration. Soit G un sous-groupe de GL(n, €). Si G est fini, l’ordre de ses éléments divise |[G| 
(corolaire 2.14 au théorème de Lagrange) et l’exposant est le PPCM qui est donc fini également. 
Le théorème est déjà démontré dans un sens. 

Dans l’autre sens, nous notons e < © l’exposant de @, et nous allons prouver que l’ensemble G 
est fini. Nous commençons par remarquer que tous les éléments de G sont des racines du polynôme 
X° — 1, et ensuite nous nous lançons dans le travail. 


(1) Générateurs 
Le groupe G est une partie de M(n, €) dont nous considérons l'algèbre engendrée 1% G. Soit 
Ci,...,C, une famille génératrice de G constituée d'éléments de G et la fonction 


T:G—C" 


Am (Tr(AGi),.…., Tr(AC,)). (9.664) 


(2) 7 est injective Soient À,B € G tels que 7T(A) = r(B). Si C; est un générateur de G, nous 
avons Tr(AC;) = Tr(BC;) et par la linéarité de la trace, nous avons 


Tr(AM) = Tr(BM) FT GES 


pour tout M € G. Notons par ailleurs 


N=AB !-1, (9.666) 


qui est diagonalisable parce que AB! € G'et donc est annulé par le polynôme X°— 1 qui est 
scindé à racines simples. Du coup AB! est diagonalisable ; posons PAB-1P-1 = D), alors 
P(AB”1 — 1)P°1 — D — 1 qui est encore diagonale. Donc N est diagonalisable. 


128. Définition 4.134. 
129. Définition 1.264. 
130. Définition 1.342. 
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Par ailleurs nous avons 


Tr ((4B71)P) = Tr (AB (AB) ?) (9.667a) 
= Tr(BB- (AB 1) 1) (9.665) (9.667b) 
= Tr((AB PT). (9.667c) 

En continuant nous obtenons 
Tr ((AB TP) = Tr(1) = n. (9.668) 
D'autre part, 
k 
Nt=(AB 1-1 - L (5) (—-1)f-P(AB-1ÿP (9.669) 


En prenant la trace, et en tenant compte du fait que Tr ((4B71)P) = n, 


k 

THNE) = S (7) (C1 —Pn = n(1— 1) = 0. (9.670) 
p=0 

Donc la trace de NF est nulle et le lemme 9.205 nous enseigne que N est alors nilpotente. 

Étant donné qu’elle est aussi diagonalisable, elle est nulle. Nous en concluons que AB! = 1 

et donc que À = B. La fonction 7 est donc injective. 


(3) Nombre fini de valeurs 
Les éléments de G sont annulés par X° — 1 qui est un polynôme scindé à racines simples. 
Dons le polynôme minimal d’un élément de G est (a fortiori) scindé à racines simples et le 
théorème 9.213 nous assure alors que ces éléments sont diagonalisables. Du coup les valeurs 
propres des matrices de G sont des racines eièmes de l’unité. Par conséquent les traces des 
éléments de G ne peuvent prendre qu’un nombre fini de valeurs : toutes les sommes de n 
racines eièmes de l’unité. Mais vu que les C; sont dans @, nous avons 


Image(r) = {Tr(A) tel que AE G}”, (9.671) 


qui est un ensemble fini. Par conséquent G est fini parce que 7 est injective. 


9.20  Ellipsoïde 

LemYVWoohcjIX 
Lemme 9.308. 
Toute matrice peut être décomposée de façon unique en une partie symétrique et une partie anti- 
symétrique. Cette décomposition est donnée par 


S M + M! A M — Mt subEqHIQonyh ii 


DT NT 
Démonstration. L'existence est une vérification immédiate de S + À = M en utilisant (9.672). 
Pour l’unicité, si S + A = S’ + À’ alors S — S’ = À — À’. Mais S — S’ est symétrique et À — 4’ 
est antisymétrique ; l'égalité implique l’annulation des deux membres, c’est-à-dire S = S’ et À = 
A. 


DefOEPoogfXsE 
Définition 9.309. 
Un ellipsoïde dans R" centré en v est le lieu des points x vérifiant l’équation 


{æ—v, M(æ-))=1 FasoR67E) 


où M est une matrice symétrique strictement définie positive 1. 
Lorsque nous parlons d’ellipsoide plein, i suffit de changer l'égalité en une inégalité. 


131. Définition 9.224. 
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Remarque 9.310. 

Le fait que M soit symétrique n’est pas tout à fait obligatoire ; la chose important est que toutes les 
valeurs propres soient strictement positives. En effet si M a toutes ses valeurs propres strictement 
positives, nous nommons $ la partie symétrique de M et À la partie antisymétrique (lemme 9.308). 
Alors pour tout x € IR" nous avons 


m'Ax = (x, Ar) = (AËx, x) = —(Ax, x) = —({x, Ar), (9.674) 


donc z'Ax = 0. L'équation x'Mx = 1 est donc équivalente à x!Sx — 1 (elles ont les mêmes 
solutions). 
De plus S reste strictement définie positive parce que pour tout x € IR” nous avons 


0 < r'Mx = x Sx. (9.675) 
PropWDRooQdJilr 


Proposition 9.311. 
Si € est un ellipsoide centrée à l’origine, il existe une base de R" dans laquelle son équation est : 


= 1. (9.676) 


(bee 
5] ns 


Il 
En 


Démonstration. Nous avons une matrice symétrique strictement définie positive $ telle que l’équa- 
tion soit x, Sx) = 1. Le théorème spectral 9.221 nous fournit une base orthonormale {e;} dans 
laquelle Se; = Àje; avec À; > 0. En substituant dans l'équation {x, Sx) = 1 nous trouvons l’équa- 
tion 


Ne (9.677) 


En posant a; = nous trouvons le résultat. Cette définition des a; est toujours possible parce 


que À; > 0. 


1 
VX? 


CorKGJooUmcBzh 
Corolaire 9.312. 
Un ellipsoïde plein centré en l’origine admet une équation de la forme q(x) < 1 où q est une forme 
quadratique strictement définie positive. 


Pour rappel de notation, l’ensemble des formes quadratiques strictement définies positives sur 
l’espace vectoriel Æ est noté QŸTT(E). 


Démonstration. Soit {e;} une base de R” telle que l’ellipsoïde £ ait pour équation 


nm x? 
> —<l. (9.678) 
A G° 
i=1 !? 
Nous considérons la forme quadratique 
g:R'—-R 
n 2 
(tr, ei) (9.679) 
i=1 ? 
Nous avons évidemment € = {x € R” tel que qg(x) < 1}. De plus la forme q est strictement 


définie positive parce que dès que x £ 0, au moins un des produits scalaires {x,e;) est non nul et 
qg(x) > 0. 
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9.21 Système d'équations linéaires : méthode de Gauss 


Pour résoudre un système d'équations linéaires, on procède comme suit : 


(1) Écrire le système sous forme matricielle. 
| 2x + 3y te) 
ns z+2y —=4 1 2]}4 


(2) Se ramener à une matrice avec un maximum de 0 dans la partie de gauche en utilisant les 
transformations admissibles : 


(2a) Remplacer une ligne par elle-même + un multiple d’une autre; 


DIN Dre 0 #1 
—> 
4 Li 2 


(2b) Remplacer une ligne par un multiple d’elle-même ; 


0 —1[-38\ m4 f0 1}3 
PU 1 214 


(2c) Permuter des lignes. 


0 1/3 \artpatlsti [1 0|-2 
ER mn de O4 "3 


(3) Retransformer la matrice obtenue en système d'équations. 


" RUE ER Re Das 
p.ex. |, | 3 es 


Remarque 9.313. — Si on obtient une ligne de zéros, on peut l’enlever : 
3 4 —21)2 à À io 
p.ex. 4 1 3 0 | = 4 1 3 lo 
0 0 0 |0 


— Si on obtient une ligne de zéros suivie d’un nombre non-nul, le système d’équations n’a pas 
de solution : 


3 4 212 
p.ex. 4 —1 3 10 | = 4... —= Impossible 
0 0 0 |7 Ox + Oy + 0z = 7 


— Si on a moins d'équations que d’inconnues, alors il y a une infinité de solutions qui dépendent 
d’un ou plusieurs paramètres : 


z—=2+2À 
1 0 —-2 2 xæ—22z=2 Le 20 
P-EXx. A 3 << . 
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Chapitre 10 


Analyse réelle : topologie et 
continuité 


10.1 Intervalles 


DEFooKRRYooZ1wiEo 
Définition 10.1 (Intervalle). 
Une partie TI de R est un intervalle si pour tout a,b € I nous avons t € T dès que a <t< b. 


PROPooJJRZooACUmWN 
Proposition 10.2. 
À propos d’intervalles. 
Un intervalle! est ouvert si il est de la forme Ja, b[ avec éventuellement a = —o ou b = +00. 


Un intervalle est fermé si il est de la forme [a,b] ou [—-0,b] ou [a, +o[ avec a, be R. 


Remarque 10.8. 
L'ensemble R ne contient pas +00 et —00. L’intervalle [—00,5] par exemple, n’est pas une partie 
de R. 


Exemple 10.4. (1) Les ensembles [3,7[ et |—00,7| sont des intervalles ouverts. 
(2) Les ensembles [10,15] et [—-1,+0|[ sont des intervalles fermés. 
(3) L'ensemble ]|—4, —2[ U ]2,9[ n’est pas un intervalle (il y a un « trou » entre —2 et 2). 


(4) L'ensemble R lui-même est un intervalle; par convention, il est à la fois ouvert et fermé. 
Un intervalle peut n'être ni ouvert ni fermé; par exemple [4,8]. Cet intervalle est « ouvert en 
4 et fermé en 8 ». VAN 


Définition 10.5 (Fonction, domaine, image, graphe). 
Soient X et Y deux ensembles. Une fonction f définie sur X et à valeurs dans Y est une partie 
de X x Y telle que pour tout x € X, il existe un unique y € Y tel que (x, y) € f. 


10.6. 
Notons qu’il n’est pas demandé que pour tout y, il existe x tel que (x,y) € f. Autrement dit, la 
notation « f: X — Y » ne suppose pas que f est surjective sur Y. Mais elle doit être définie sur 
tout X. 

Nous écrivons y = f(x) pour dire (x,y) € f. 


— La partie de X qui contient tous les x sur lesquels f peut opérer est dite domaine de f. Le 
domaine de f est indiqué par Domaine f. 


— L'élément de y € Ÿ associé par f à un élément x € Domaine f (c'est-à-dire f(x) = y) est 
appellé image de x par f. L'image de la fonction f est la partie de ŸY qui contient les images 
de tous les éléments de Domaine f. L'image de f est indiquée par Sf. 


1. Définition 10.1. 
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— Le graphe de f est l’ensemble de tous les couples (x, f(x)) pour x € Domaine f. Le graphe 
de f est une partie de l’ensemble noté X x Y et il est indiqué par Graph f. Dans ce chapitre 
X =Ret Ÿ =R, donc le graphe de f est contenu dans le plan cartésien. 


Définition 10.7 (Fonction croissante, décroissante et monotone). 
Soit f: R — IR une fonction définie sur un intervalle I € R. 
(1) La fonction f est croissante sur I si pour tout x < y dans I nous avons f(x) < f(y). Elle 
est strictement croissante si f(x) < f(y) dès que x < y. 
(2) La fonction f est décroissante sur T si pour tout x < y dans T nous avons f(x) > f(y). 
Elle est strictement décroissante si f(x) > f(y) dès que x < y. 


(3) La fonction f est dite monotone sur I si elle est, soit croissante, soit décroissante, sur I. 


Exemple 10.8. 
La fonction x + x? est décroissante sur l'intervalle ]—00, 0] et croissante sur l'intervalle [0, [. Elle 
n'est par contre ni croissante ni décroissante sur l'intervalle [—4, 3]. a 


10.2 Application réciproque 


10.2.1 Définitions 


Les définitions d’injection, surjection, bijection et d’application réciproque sont les défini- 


tions 7.202 et 7.203. 
EXooCWYHooLEciV; 


? n’est pas une bijection de R vers R parce qu’il n’existe 


Exemple 10.9. (1) La fonction x + x 
aucun x tel que x? = —1. 


(2) Nous verrons un peu plus tard (12.390) que la fonction 


f: [0,+o0[ — [0,+o0[ 


tre 2 


(10.1) 


est une bijection. Notez que c’est la même fonction que celle de l’exemple précédent. Seul 
l'intervalle sur lequel nous nous plaçons a changé. 


(3) La fonction 


f: R— [0,00 
0, (10.2) 
Te x 
n’est pas une bijection parce qu’il existe plusieurs + pour lesquels f(x) = 4. 
En conclusion : il est très important de préciser les domaines des fonctions considérées. A 


Remarque 10.10. 
Dire que la fonction f: 1 — J est bijective, c’est dire que l’équation f(x) = y d’inconnue x peut 


être résolue de façon univoque pour tout y € J. 
LEMooSDMMooYYDDLs 


Lemme 10.11. 
Toute fonction strictement monotone sur un intervalle T est injective. 


Exemple 10.12. 
Trouvons la fonction réciproque de la fonction affine f: IR —RR, x + 3x —2. SiyeRR, le nombre 
f7 (y) est la valeur de x pour laquelle f(x) = y. Il s'agit donc de résoudre 


3T—2=7y (10.3) 
par rapport à x. La solution est x — He et donc nous écrivons 


__y+2 


= (10.4) 


F (y) 
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10.2.2 Graphe de la fonction réciproque 


Par définition le graphe de la fonction f est l’ensemble des points de la forme (x,y) vérifiant 
y = f(x). Afin de déterminer le graphe de la bijection réciproque nous pouvons faire le raisonnement 
suivant. 

Le point (x, yo) est sur le graphe de f 


La relation f(xo) = yo est vérifiée 
La relation xo = f_!(y0) est vérifiée 
ES 
Le point (yo, ro) est sur le graphe de f-1. 


À retenir 10.13 
Dans un repère orthonormal, le graphe de la bijection réciproque est obtenu à partir du graphe 
de f en effectuant une symétrie par rapport à la droite d’équation y = x. 


Le dessin suivant montre le cas de la courbe de la fonction carré comparé à celle de la racine 
carrée. 


10.3 Topologie sur l’ensemble des réels 
SECooGKHYooMwHQaD 

Nous allons à présent donner la topologie sur LR et ainsi résoudre les questions laissées en 
suspens lors de la construction des réels, voir 1.399. 

Afin de pouvoir étudier la topologie des espaces métriques, il faut connaître quelques propriétés 
des réels, parce que nous allons étudier la fonction « distance » qui est une fonction continue à 
valeurs dans les réels. 

La valeur absolue de la définition 1.367(2) permet de définir une norme sur R. 

LEMooBNAPooBTtXnX 
Lemme 10.14. 
L'application 
ze |x| (10.5) 


est une norme ? sur R. 


Démonstration. Grâce au lemme 1.371 et à la remarque 1.372, on a, pour tous x, y, À€ER : 


(1) [x] = 0 implique x = 0, 


2. Définition 7.149. 
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(2) lAxl = x}, 
(3) Lx + yl < xl + lyl, 


et donc, les conditions de la définition 7.149 sont immédiatement vérifiées. 


DEFooNYGIooVGHSIA 
Définition 10.15 (Topologie sur R et sur Q). 
Le lemme 10.14} donne une norme sur R et Q à partir de la valeur absolue. La définition 7.109 
donne alors une structure d’espace topologique. Hors cas rarissimes qui seront signalés, nous uti- 


liserons toujours cette topologie sur R et sur Q. 
PropooUHNZooOUYIkn 


Proposition 10.16. 
Les rationnels sont denses dans les réels. 


Démonstration. Soient x € R et € € R*. Nous devons prouver l'existence d’un rationnel dans 


B(x, €). Le lemme 1.424 dit qu'il existe un rationnel dans [x —e/2,x+6€/2[ et donc dans B(x, €). 
PropSLCUooUFgisR 


Proposition 10.17 ([1]). 
Quel que soit le réel x, il existe une suite croissante de rationnels convergente vers x. 


Démonstration. Soient x € R et d € IR; comme x — Ô et x sont des réels, le lemme 1.424 donne un 
élément q5 € Q tel que 
LE 0 < dé <T (10.6) 


Il suffit alors de pêcher parmi ces q5s pour trouver une suite croissante, et on montrera que cette 
suite converge vers x. 
Soit xo un rationnel plus petit que x. Nous posons 00 = x — x0 et ensuite : 


G=T—T; (10.7a) 
Ti+1 — 6;/2 € Q. (10.7b) 


Ainsi nous avons pour tout à les inégalités 


fi. 
Ti=Lt—-d<X ; < Tii1 < TX. (10.8) 
La suite (x;) est donc une suite de rationnels, croissante et toujours plus petite que x. Mais nous 


avons à chaque étape d;11 < + ce qui implique que la suite des 0; converge vers 0. Soit e > 0. Il 
existe ko tel que pour tout k > ko, Ô < €. Pour un tel k, nous avons alors 


zk+1 € B(x, à) c B(x,€). (10.9) 


Tous les x}, pour k > ko + 1, sont tels que |x — x] < € : la suite des x} converge donc vers x. 


10.3.1 Compacité pour les réels 
PROPooBFSAooKSugM;j 


Proposition 10.18. 
Les parties compactes de R sont fermées et bornées. 


Démonstration. Prouvons d’abord qu’un ensemble compact est borné. Pour cela, supposons que 
K est un compact non borné vers le haut ©. 

Nous posons A9 = [—-0,1[ et 4, = ]n — 1,n +1[. Ces ouverts recouvrent R et donc X. Hélas 
tout choix d’un nombre fini des 4, est borné, et ne recouvre donc pas K. Les {A;};-0.. forment 
un recouvrement de À par des ouverts dont on ne peut pas extraire un sous-recouvrement fini. 

Cela prouve que K doit être borné. 


3. Pour les topologies usuelles données en la définition 10.15. 
4. Définition 7.74. 
5. Nous laissons à titre d'exercice le cas où À est borné par le haut et pas par le bas. 


10.3. TOPOLOGIE SUR L'ENSEMBLE DES RÉELS 741 


Pour prouver que K est fermé, nous allons prouver que le complémentaire est ouvert. Et pour 
cela, nous allons prouver que si le complémentaire n’est pas ouvert, alors nous pouvons construire 
un recouvrement de X dont on ne peut pas extraire de sous-recouvrement fini. 

Si R\Æ n’est pas ouvert, il possède un point, disons x, tel que tout voisinage de x intersecte 
K. Soit B(x,e1), un de ces voisinages, et prenons k1 € K n B(x,61). Ensuite, nous prenons € 
tel que k1 ne soit pas dans B(x,62), et nous choiïsissons k2 € K n B(x,e2). De cette manière, 
nous construisons une suite de k; € K tous différents et de plus en plus proches de x. Prenons 
un recouvrement quelconque par des ouverts de la partie de K qui n’est pas dans B(x,6e1). Les 
nombres k; ne sont pas dans ce recouvrement. 

Nous ajoutons à ce recouvrement les ensembles © =]k;, k;,1[. Le tout forme un recouvrement 
(infini) par des ouverts dont il n’y à pas moyen de tirer un sous-recouvrement fini, pour exactement 
la même raison que la première fois. 


ThoBÜrelLebesgue 
Théorème 10.19 (Borel-Lebesgue). 
Un intervalle de R est compact si et seulement si il est de la forme [a, b]. 


Démonstration. Tous les intervalles de IR sont listés dans la proposition 1.449. Un compact est 
fermé et borné (proposition 10.18). Donc les intervalles dont une borne est +0 ne sont pas com- 
pacts. Parmi les intervalles ]a, b[, ]a, b], [a, b[ et [a, b], seul le dernier est fermé. Nous avons prouvé 
que si un intervalle est compact, alors il est de la forme [a., b|. 

Nous prouvons à présent l'implication inverse : tous les intervalles de la forme [a,b] sont com- 
pacts. 

Soit (, un recouvrement du segment |a,b] par des ouverts, c’est-à-dire que 


[ab] |] ©. (10.10) 


OEen 


Nous notons par M le sous-ensemble de [a,b] des points m tels que l’intervalle [a, m] peut être 
recouvert par un sous-ensemble fini de Q. C'est-à-dire que M est le sous-ensemble de [a,b] sur 
lequel le théorème est vrai. Le but est maintenant de prouver que M = [a,b|. 


M est non vide En effet, a € M parce qu’il existe un ouvert © € Q tel que a € ©. Donc © tout 
seul recouvre l'intervalle [a, a]. 


M est un intervalle Soient m1, m2 € M. Le but est de montrer que si m’ € [m1,m2|, alors 
m' € M. Il y a un sous-recouvrement fini de l'intervalle [a, m2] (par définition de m2 € M). 
Ce sous-recouvrement fini recouvre évidemment aussi [a,m/] parce que [a,m’] € [a, mo], 
donc m/ € M. 


M est un ensemble ouvert Soit m € M. Le but est de prouver qu'il y a un ouvert autour de 
m qui est contenu dans M. Admettons que (/ soit un sous-recouvrement fini qui contienne 
l'intervalle [a,m|. Dans ce cas, on a un ouvert © € Q/ tel que m € ©. Tous les points de © 
sont dans M, puisqu'ils sont tous recouverts par Q/. Donc © est un voisinage de m contenu 
dans M. 


M est un ensemble fermé M est un intervalle qui commence en a, en contenant a, et qui finit 
on ne sait pas encore où. Il est donc soit de la forme [a,m|, soit de la forme [a,m{. Nous 
allons montrer que M est de la première forme en démontrant que M contient son supremum 
s. Ce supremum est un élément de [a,b], et donc il est contenu dans un des ouverts de (1. 
Disons s € OS. Soit c, un élément de O, strictement plus petit que s; étant donné que s est 
supremum de M, cet élément c est dans M, et donc on a un sous-recouvrement fini Q’ qui 
recouvre |[a,c]. Maintenant, le sous-recouvrement constitué de (/ et de O, est fini et recouvre 
[a, s]. 

Nous pouvons maintenant conclure : le seul intervalle non vide de [a, b] qui soit à la fois ouvert et 

fermé est [a,b] lui-même (proposition 7.68), ce qui prouve que M = [a,b], et donc que [a, b] est 

compact ê 


6. Si vous n'aimez pas le coup du fermé et ouvert, le lemme 10.20 donne une autre preuve. 
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LemOACGWxV 
Lemme 10.20 ([305]). 
Sia<beR alors le segment [a,b] est compact". 
Démonstration. Soit {O;};er un recouvrement de [a, b] par des ouverts. Nous posons 
M = {x € |a,b] tel que [a, x] admet un sous-recouvrement fini extrait de {O;}ier}. (10.11) 


Notre but est de prouver que be M. 


(1) a est dans M Le point a est naturellement dans un des ©;. L’intervalle [a, a] est donc 
recouvert par un seul des O;. 


(2) M est un intervalle Soient me M et m’ e [a, ml]. Le sous-recouvrement fini qui recouvre 
[a,m] recouvre a fortiori [a,m’]. 


(3) Les trois possibilités restantes À ce niveau de la preuve, il reste trois possibilités pour 
M soit il est de la forme [a, c] ou [a, c[ avec c < b, soit il est de la forme [a,b]. Nous allons 
maintenant éliminer les deux premiers cas. 


(4) Ce que M n’est pas D'abord M n’est pas de la forme [a, c[ avec c < b. Par l’absurde, 
commençons par considérer O;, un ouvert du recouvrement qui contient c; choisissons m € 
O; tel que m < c. Alors m € M, et, si nous joignons O;, à un recouvrement fini de [a,m| 
alors nous avons un recouvrement fini de [a,c|. On en déduit ce M. 


Ensuite M n’est pas de la forme [a,c] avec c < b. En effet si on a un recouvrement fini de 
[a,c| par des ouverts, alors un de ces ouverts contient c et donc contient des éléments de 
[a,b] plus grands que c. 


Nous déduisons que M = [a,b] et qu’il est possible d’extraire un sous-recouvrement fini recouvrant 


[a, b]. 


LemCKBooXkwkte 
Lemme 10.21 ([1|). 
Si K1 et K2 sont des compacts dans R alors K1 x K2 est compact dans R2. 


Démonstration. Soit {O;};er un recouvrement de X1 x K2 par des ouverts ; grâce au lemme 7.89 
nous pouvons supposer que ce sont des carrés. Pour chaque x € K3, l’ensemble {x} x K2 est compact 
et donc recouvert par un nombre fini des O;. Soit R; un ensemble fini des O; recouvrant {x} x K2. 
Comme À, est une collection finie de carrés, nous pouvons considérer m4, le minimum des 
rayons. L'ensemble X1 est recouvert par les boules B(x,m,) et il existe donc une collection finie 
de {ri}; tels que B(x;,mx,) recouvre K1. 
Alors {R,,}ieA recouvre K1 x K2 parce que R,, recouvre l’ensemble B(x;,mx,) x {Ko}. 


DEFooCNCJooWgCCrF 
Définition 10.22 (Partie inductive[306, 307]). 
Soient a < b dans R. Une partie S de [a,b] est inductive si 
(1)jaëes, 
(2) Sia<r<betsixeS alors il existe y > x tel que [r,yleS. 
(D) Ma<rs<béanl[ar| ES, dorsres. 
PROPooQVQKoo!jWBrk 


Proposition 10.23 ([306]). 
L'unique partie inductive® de [a,b] est [a,b] lui-même. 


Démonstration. Le fait que [a, b] soit inductif dans [a,b] est immédiat. Nous prouvons que c’est 
la seule. Soit S inductif dans [a,b]. Nous posons S’ = [a,b]\S. Si S’ est non vide, nous pouvons 
considérer le nombre inf(S’). 


7. Définition 7.74 
8. Définition 10.22. 
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(1) Nous avonsinf(S’) > a D'abord nous savons que inf(S’) > a parce que S’ est une partie 
de [a,b]. De plus, vu que a € S il existe y > a tel que [a, y] € S. Donc $’ € |y,b], de telle 
sorte que inf(S”) > y > a. 

(2) Siinf(S')eS Siinf(S’) = b alors S = {a,b] et la preuve est faite. Supposons inf(S”) < b. 
Le nombre inf(S’) vérifie a < inf(S”’) < b et inf(S”) € $. Il existe donc y > inf(S") tel que 
[inf(S”),y] € $S. Nous avons alors [a, y] € S et donc inf(S") > y. Contradiction. 

(3) Siinf(S')e S' Dans ce cas [a,inf(S")[ € S, et vu que S est inductif, inf(S”) € S, contradic- 
tion. 


Toutes les possibilités (à part S$’ = ) portant à des contradictions, nous déduisons que S' = 
et donc que S = [a, b]. 


10.3.2 Conséquence : les fermés bornés sont compacts 
ThoXTEooxFmdlI 


Théorème 10.24 (Théorème de Borel-Lebesgue). 
Une partie d’un espace vectoriel normé réel de dimension finie est compacte si et seulement si elle 
est fermée et bornée. 


Démonstration. Sens direct. 


(1) Compact implique borné En effet si K est non borné dans Æ alors X contient une suite 


(tn) avec |æ,| > n. Les boules B;(xi, À) sont disjointes. On pose Oo = CU, B(xi, à), qui est 
ouvert comme complément d’un fermé. Pour à > 1 nous posons ©; = B(x:, 1). Nous avons 


Ke{Jo: (10.12) 
ieN 


mais puisque x; est uniquement dans ©;, nous ne pouvons pas extraire de sous-recouvrement 


fini. 
(2) Compact implique fermé C’est le lemme 7.91(2). 


Sens réciproque. 


(1) Un intervalle fermé et borné est compact dans R C'est le lemme 10.20. 


(2) Un produit de segments est compact Le produit de deux compacts de R est un com- 
pact dans R? par le lemme 10.21. 


(3) Un fermé et borné est compact Soit K fermé et borné. Puisque K est borné, il est 
contenu dans un produit de segments. L'ensemble X est donc compact parce que fermé dans 
un compact, lemme 7.91. 


Exemple 10.25 (Compacité de la boule unité). 
La boule unité fermée B(0,1) d’un espace vectoriel normé de dimension finie est compacte parce 
que fermée et bornée. En dimension infinie, cela n’est plus le cas. Certes la boule unité est encore 
fermée et bornée, mais elle n’est plus compacte. En effet nous allons donner un recouvrement par 
des ouverts duquel il ne sera pas possible d'extraire un sous-recouvrement fini. 

Autour de chacune des extrémités des vecteurs de base, nous considérons la boule À; = B(e;, à). 
Ensuite nous considérons aussi l’ouvert 


B(0,1\[JZ(, D (10.13) 


Le tout recouvre B(0,1) mais toutes les premières boules sont nécessaires. A 


Le théorème de Bolzano-Weierstrass 7.275 nous permettra de prouver plus simplement la non 
compacité en dimension infinie. Voir l’exemple 7.137. 
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10.3.3 Suites et limites dans les réels 
10.3.3.1 Limites, convergence 

PROPooUSXCooJWXKWH 
Proposition 10.26. 
Une suite (xn) dans un espace vectoriel normé E est convergente” si et seulement si il existe un 
élément Le E tel que 


Ve>O0,2NEN tel quen>zN= x -4{| <e. FAO RAF On EEREnr 


Dans ce cas, L est la limite de la suite (th). 


Démonstration. En deux parties. 


(1) Sens direct Si xn — {et si e > 0 il existe N° tel que pour tout n > N nous avons 
Zn € B(L,e) (parce que cette boule est un ouvert contenant /). Considérant la définition 
d’une boule, cette condition s'écrit bien |x, — {| < €. 

(2) Sens inverse Dans l’autre sens, soit © un ouvert contenant {. Par définition de la topologie, 
il existe € > 0 tel que B(L,e) € ©. La condition (10.14) nous assure qu'il existe N. tel que 
pour tout n > N; nous ayons 

In € B(£,e) cO, (10.15) 


ce qui assure que la suite (x,) converge vers £ pour la topologie métrique de E. 


Une façon équivalente d'exprimer le critère (10.14) est de dire que pour tout € positif, il existe 
un rang NE R tel que l'intervalle [£ — €, { + €] contient tous les termes x, au-delà de N. 

Il est à noter que le rang N dont il est question dans la définition de suite convergente dépend 
de €. 


10.3.4 Opérations sur les limites 
PROPo01QUAooJPMoDD 


Proposition 10.27 ([1]). 
Soient des suites à valeurs réelles (a;) et (b;). Si elles sont convergentes, alors la suite ab est 


convergente et 
(lim a) (lim b;) = lim(æb;). (10.16) 
U 3 à 


Démonstration. Nous nommons a et b les limites des suites (a;) et (b;). Soit e > 0 ainsi quete N. 
Nous avons la majoration 


lab; — ab| aid; — ab] + la;b — ab (10.17a) 


< | 
< laillbi — 6] + Jb[la; — al. (10.17b) 


Comme la suite (a;) est convergente, elle est bornée {°. Nous pouvons donc majorer |a;| par R > 0 
qui ne dépend pas de 1. Soit 7 > 0 tel que (R + b}n < €. Alors en prenant 4 assez grand pour que 
1b; — b] < n et |a; — a] < n, nous avons bien 


lab; — ab| < (R + b)n < €. (10.18) 


PROPoo1ICZMooGfLdPc 
Proposition 10.28. 


Soient des suites (xn) et (Yn) dans un espace vectoriel normé E. Si tn EE, » et yn > y, alors 


Zn + Un ET + y. (10.19) 


9. Définition 7.13. 
10. Par 7.112. Attention : soyez capable d'adapter au cas présent. 
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Démonstration. Soit € > 0. Nous considérons N tel que si n > N, alors |x, —x| < eet |yy —y| < €. 
En utilisant l'inégalité 7.149(4), 


lty + Un — (r +) < Âtn — x] + un — v| < 2e. (10.20) 
Donc la suite (tn + Yn) converge vers x + y. 
LEMooGKIPooWgpFTB 
Lemme 10.29. 
La fonction 
:RxXR—R 
Ï (10.21) 
(ay) x+y 


est continue. 


Démonstration. Pour rappel, la topologie considérée sur IR” est celle de la définition 7.216. En 
vertu de la proposition 7.245, il est suffisant de prouver la continuité séquentielle. Soit donc une 
suite convergente 


(ns Un) TT (x, y). (10.22) 
Nous devons prouver que 
R 


La proposition 7.60 nous permet de déduire la convergence composante par composante : x» RE, , 
et Un RE, ÿ. En permutant somme et limite (proposition 10.28) nous avons le calcul 


Fans Un) = En + Un r+y= f(r,Y). (10.24) 


D'où la convergence demandée. 


10.3.5 Exemples 
LEMooNDSKooMsex0Oq 


Lemme 10.30. 
Quelques suites usuelles. 


(1) La suite zn = À converge vers 0. 


(2) La suite xn = (—1)" ne converge pas. 


10.3.6 Limites infinies 


Deux limites pour voir comment ça fonctionne. 
LEMooWCRSooWXVvcc 
Lemme 10.31. 
Sir > 1 nous avons : 
CL) pe. 


D) ne 


Démonstration. Puisque r > 1 nous pouvons écrire r = 1 + Ô avec 0 > 0. La formule du binôme 
de Newton (3.78) nous donne 


+= ù () > (re = n6. (10.25) 


La proposition 1.423 (R est archimédien) nous indique que no est arbitrairement grand lorsque n 
est grand, quelle que soit 0 > 0. Cela finit la preuve de la première limite. 
Pour la seconde, nous posons ay — .. Nous avons 
An+1 nm 


= . 10.26 
An n + 1” ( 
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Comme 5 — 1, la suite Tr tend vers r > 1, et en particulier pour tout Ô > O0 tel que r > 1+6, 


il existe N € NN tel que, pour tout n > N, 


ne (10.27) 


Soit maintenant k € N. En utilisant un produit télescopique, 


ho = ie COR sn (10.28) 


AN GAN+1 AN+k—1 


Or (1 + 6)*-1 tend vers oo lorsque k — © par le premier point. Donc nous avons limy_ r"/n = 
O0. 


DEFooEWRTooKgShmT 
Définition 10.32. 
Nous disons que deux suites (ux) et (v,) sont équivalentes si il existe une application a: N —R 


telle que 
(1) pour tout n à partir d’un certain rang, Un = VnA(n) 
(2) a(n) — 1. 
10.3.7 Topologie et matrices 
DEFooCQHDooYpUAhG 
Lemme-Définition 10.33 (Topologie sur les matrices). 
Si K est un corps valué!!, alors l'opération 
mm: M(n x m,K) — R° 
(10.29) 


M + max Ml. 


est une norme !?. 


Cette norme est appelée norme maximum et nous considérons sur M(n x m, K) la topologie 


associée à cette norme !° 
PROPooUEETooPhqWuf 
Proposition 10.34. 
La multiplication matricielle 
m: M{n,s) x Mfs,i) — Min! 
(n,8) x M(s,1) — M(n,D 


(A,B)+ AB 


est une opération continue |*. 


Démonstration. D’après la proposition 7.215, nous pouvons tout faire avec la métrique produit. 
M(n,s) x M(s,l 

Supposons que (Ax, By) FERA Min, li), et montrons que |m(Az, Bx) — m(A, B)| — 0. Notre 

hypothèse nous dit que 


1(Ax — À, Bx — B)| — 0, (10.31) 


c’est à dire (métrique produit) 
max {| A4 — A], | Bx — B|} — 0, (10.32) 


et donc Az — A et By — B séparément. La définition 10.33 nous dit alors que pour tout (ij) nous 
avons 


(Ax)ij — Aij 


(10.33) 
(Bxij — Bis. 


11. Définition 1.458. 
12. Définition 7.149. 
13. Définition 7.155. 
14. Topologies de la norme 10.33. 
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SUBEQSooHPHLooXdtxYY 
Nous avons | 


(Ar, B) — m(A,B)) = (AkBiis — (AB); (10.34a) 


=) (CAx)u(B — AuBi). (10.34b) 
l 


Soit € > 0. Par la proposition 10.27, pour chaque triple (4, 5,1), il existe un uw;jx € IN tel que si 
k > u;j nous avons 


[(Ax)a(Brhi5 — AuBi] < €. (10.35) 


Nous pouvons reprendre (10.34) avec un tel k. Nous avons : 


I(AxnBx) — (4, B)| < de < se. (10.36) 
l 


10.3.8 Suites croissantes et bornées 


Une suite est dite contenue dans un ensemble À si x, € À pour tout n. Une suite est bornée 
supérieurement si il existe un M tel que x, < M pour tout n. De la même manière, la suite est 
bornée inférieurement si il existe un m tel que x, > m pour tout n. 

Le lemme suivant est souvent utilisé pour prouver qu’une suite est convergente. Une version 


pour les fonctions f: IR — KR sera la proposition 12.39. 
LemSuiteCrBorncv 


Lemme 10.35 ([1]). 
Une suite croissante et bornée supérieurement converge. Une suite décroissante bornée inférieure- 
ment est convergente. 


Démonstration. Supposons que (x,) soit une suite croissante non convergente. En particulier, par 
le théorème 7.272, cette suite n’est pas de Cauchy et il existe € > 0 tel que pour tout N € NN, il 
existe p > N vérifiant 

[Xp — EN] > €. (10.37) 


Vu que p > N, et vu que la suite est croissante, nous pouvons récrire cette condition sous la forme 
Tp 2 TN +E. 
Nous définissons ainsi une application p: N — N telle que 


Ep(N) > EN + €. (10.38) 


Une telle application n’est pas du tout unique, mais nous en considérons une telle. 
Il est vite vu par récurrence que 
Thk(o) À Lo + Ke. (10.39) 


La suite n + Zyn(p) est donc une sous-suite qui tend vers l'infini. Or cela n’est pas possible 
parce que la suite (x,) est bornée. Donc contradiction, donc (x,) est convergente. 


Une erreur courante est de croire que la borne est la limite : le lemme n’affirme pas ça. Par 


contre il est vrai que la borne donne .. .hum .. .une borne inférieure (ou supérieure) pour la limite. 
PropCvRpComposante 


Proposition 10.36. 
Une suite (xn) dans R°”? est convergente dans R°”° si et seulement si les suites de chaque composante 
sont convergentes dans IR. Dans ce cas nous avons 


line, = (im (an), Tim(a)2, .. lim(an)m) (10.40) 


où (tn)x dénote la k-ième composante de (tn). 
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Exemple 10.37. 
La suite zh — (&, 1 — 1) converge vers (0,1) dans R?. En effet, en utilisant la proposition 10.36, 
nous devons calculer séparément les limites 


(10.41) 


a 


Exemple 10.38. 
Étant donné que la suite (—1)” n’est pas convergente, la suite x, = ((—1)", 2) n’est pas convergente 
dans R?. PA 


10.3.9 Suites adjacentes 
DEFooDMZLooDtNPmu 


Définition 10.39 ([308]). 


Les suites (an) et (bn) sont adjacentes si l’une est croissante, l’autre décroissante et si an—bn — 0. 
THOooZJWLooAtGMxD 


Théorème 10.40 (Théorème des suites adjacentes). 
Nous considérons des suites adjacentes (an) et (bn) avec (an) croissante et (b) décroissante. Alors 


(1) bn > an pour tout n, 
(2) an < b4 pour tout n et q. C'est-à-dire que toute la suite a est plus petite que toute la suite b. 
(3) les suites a et b sont convergentes, 
(4) les suites a et b convergent vers la même limite, notée L, 
(5) nous avons an < L < bn pour tout n. 
Démonstration. La suite n + b, — an est décroissante parce que b, — an > by11 — an+11. Comme 


en plus b, — an — 0 nous avons 
bd 0 (10.42) 


pour tout n € N. De plus a, < bo pour tout n parce que si an > bp alors, b étant décroissante, 
an > bo > bN qui est contraire à ce que nous venons de prouver. La suite a étant croissante et 
majorée, elle est convergente !” ; notons L sa limite. 

La suite b peut maintenant être écrite par 


qui est une somme de deux suites convergentes. Elle est donc convergente et sa limite est la somme 
des limites !6, donc 
lim b, = lim (b, — an) + lim a =0+4—£4. (10.44) 
n—00 n— 00 n—00 


Voilà. Donc les suites a et b convergent et ont la même limite. 
Pour tout n,q € N nous avons l'inégalité an < b4. En prenant la limite n — © nous trouvons 


L< bg (10.45) 
pour tout q. Et de la même façon, b, > a, donne £ > a;. L'un avec l’autre donne 


a << (10.46) 


pour tout qe N. 


15. Proposition 10.35. 
16. Proposition 10.28. 
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PROPooX00CooGMqJNe 
Proposition 10.41 ([309]). 
Soit une suite (a,) dans R. Nous supposons que les suites extraites (a2n) et (a2n+1) convergent 
vers la même limite notée L. 
Alors an — L. 


Démonstration. Soit € > 0. Il existe N; tel que [an — | < € dès que n > M1. I existe également 
N2 dès que |a2n+1 — {| < e dès que n > M. 
Nous posons N = max{2N,,2N: + 2} et nous avons, pour tout n > N : 


lan — £| €, (10.47) 


c’est-à-dire que a — £. 


10.3.10 Limite supérieure et inférieure 


ooMVZAooVVCOnP 
Lemme-Définition 10.42. : 
Soit (an) une suite dans R. Les limites suivantes existent dans R 
limsupa, = lim (supay) (10.48) 
n—>00 ND kon 
el 
lim inf ün = Jim (inf de (10.49) 


Elles sont nommées limite supérieure et limite inférieure de la suite (an). 


Démonstration. Pour la limite supérieure, l’ensemble des £ > n est de plus en plus petit lorsque 
n grandit. Donc les ensembles À, = {ax tel que k > n} sont emboîtés et la suite n — sup À, est 


une suite décroissante. Elle a donc une limite dans R. 


00EEQJooRMFzVR 
10.43. 
En ce qui concerne les suites d’ensembles, utiles en théorie des probabilités, nous définissons de 
même. Si les 4, sont des parties d’un ensemble Q, nous définissons la limite supérieure et la 
limite inférieure de la suite À, par 


lim sup An = MN U Ak (10.50) 
Lu n>1 k>xn 
et 
iminf 4, = L] (9 4x (10.51) 
n>lk>n 
Nous avons 
lim sup An = {w € Q tel que w € À, pour une infinité de n}. (10.52) 
00AQTEOOYDBovS 
Lemme 10.44. 


Nous avons les formules pratiques suivantes : 


lim sup ay = inf (sup ak) (10.53a) 
lim inf ay = inf À 10. 
im inf an cb (inf ak) (10.53b) 


Démonstration. La suite n + sup,, ak est une suite décroissante, donc la limite est l’infimum. 
Même argument pour l’autre. 
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001IQIKooXWwAmM 
Lemme 10.45. 
La suite (an) dans R converge si et seulement si 


lim sup an = liminf a». (10.54) 
Dans ce cas, lim a, = limsup a, = liminf a. 


Démonstration. Nous commençons par supposer que limsup a, = liminf a, = l, et nous prouvons 
que lim a, existe et vaut {. Soit e > 0. Il existe N tel que si n > N nous avons 


|sup ax — 1] < € (10.55) 
kzn 
et 
inf ax — : À 
| jf ax —l|<e (10.56) 


Sii> N, alors !7 a; < supy-n(ax) < {+Ee, et à > infr>n(ax) > {—e. Cela signifie que a, € B(l,e), 
c’est-à-dire ax — { par la proposition 10.26. 

Dans l’autre sens, nous supposons que lim, a, = l et nous prouvons que la limite supérieure 
est égale à 118, Soit e > 0 et NN. tel que [an — 1] < € pour tout n > N.. Sin > N. nous avons 


| sup A — Il £ € (10.57) 


k>n 


et donc la limite de supz>, ax lorsque n — 00 est bien [. 


LEMooHGJVooCbgOEK 
Lemme 10.46. 
Soit une suite (a;) dans R. Notons L = limsup;(a;). Pour tout € > 0, l’ensemble 


Se ={ne N tel que an > L+e} (10.58) 
est fini. 


Démonstration. Nous y allons par récurrence. Juste pour le sport, nous allons au passage montrer 
en détail comment on utilise le théorème 1.47. 

Supposons que $ est infini. Alors pour tout n, la partie 5.\{0,...,n} est non vide (lemme 
1.123) et nous pouvons considérer l’application 


g: Se — Se 


ne min (S\{0,...,n}). (10.59) 


Nous prenons b > 1 dans $: et considérons la fonction f : N — S: donnée par le théorème 1.47. 
L'application f est strictement croissante parce que f(n +1) = g(f(n)) € N\{0,..., f(n)}. En 
particulier f(n) > n parce que nous avons décidé de commencer avec f(0) = b > 1. 
Nous sommes maintenant armés pour contredire la définition 10.42 de la limite supérieure. Soit 
ne N. Vu que f(n) € Se nous avons 
Af(n) À? L+e, (10.60) 


et donc Supy>n @k > @f(ny 2 L + € parce que f(n) > n. 
Nous avons prouvé que supy>, ax Z L + € pour tout n, donc 


lim (supa) > L+e>L. (10.61) 


Voila. Donc si Se est infini, limsup, a; > L+e> L. 


17. Voir le lemme 1.373(1). 
18. Je vous laisse faire la démonstration correspondante pour la limite inférieure. Contactez-moi si ça pose un 
problème. 
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LEMooMTRDooBMxFmn 
Lemme 10.47. 
Si (an) est une suite réelle, 
lim sup(an) = —liminf(—a,). (10.62) 
n— 00 n—?00 
Démonstration. En utilisant le lemme 1.446, nous avons 
lim sup(an) = Jim (sut) _ Jim ( inf ( ax)) = —liminf(—a:). (10.63) 


10.3.11 Ouverts, voisinage, topologie 


Lorsque x € E, nous rappelons qu’un voisinage l° de x est n'importe quel sous-ensemble de E 
qui contient une boule ouverte centrée en x. La proposition 7.8 nous dit qu’un ensemble est ouvert 
si il contient un voisinage de chacun de ses points. Au passage, rappelons que l’ensemble vide est 
ouvert. 

Pour rappel, la proposition 7.110 dit que l’ensemble des boules ouvertes d’un espace métrique 
génère la topologie de l’espace. 


20 si il existe une boule ?! 


Nous rappelons qu’une partie À d’un espace métrique est dite bornée 
qui contient À. 


Mais revenons à IR... 
LemSupÜuvPas 


Lemme 10.48. 
Une partie ouverte de R ne contient pas son supremum. 


Démonstration. Soit ©, un ensemble ouvert et 5, son supremum. Si s était dans ©, on aurait un 
voisinage B = B(s,r) de s contenu dans ©. Le point s + r/2 est alors à la fois dans © et plus 
grand que s, ce qui contredit le fait que s soit un supremum de ©. 


Par le même genre de raisonnement, on montre que l’union et l'intersection de deux ouverts, 
sont encore des ouverts. 


Remarque 10.49. 
L’intersection d’une infinité d’ouverts n’est pas spécialement un ouvert comme le montrent les 


parties {Og}rken+ donnés par 


1 
Or=11,2+ (10.64) 


Tous les ensembles OZ contiennent le point 2 qui est donc dans l’intersection. Mais nous allons 
montrer que pour tout € > 0, il existe n tel que 2 + e € O,. Il suffit de prendre n tel que 1 < € 
(lemme 1.424(2)). 

PROPooANIOoo!IJHe1lx 
Proposition 10.50. 
Quelles que soient les parties À et B de R, nous avons 


sup(A n B) < sup À < sup(A LU B). (10.65) 


Démonstration. En deux parties. 


(1) sup(A nr B) < sup(A) Soit s = sup(À). En particulier, s est un majorant de À. Six e AnB, 
alors x € À et s > x. Donc s est également un majorant de À n B. Le lemme 1.445 conclut 
que s > sup(An B). 


19. Définition 7.4. 

20. Définition 7.132. 

21. À titre d'exercice, convainquez-vous que l’on peut dire boule ouverte ou fermée au choix sans changer la 
définition. 
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(2) sup(A) < sup(A LU B) Soit s = sup(A L B). Par définition, s est un majorant de À L B. A 
fortiori, s est un majorant de À et donc est plus grand ou égal à sup(A). 


10.3.12 Intervalles et connexité 


Nous allons déterminer tous les sous-ensembles connexes ?? de R. Pour cela nous relisons 
d’abord la notion d'intervalle donnée en 1.21 ainsi que la proposition 1.449 qui liste tous les 
intervalles de R. La partie 1 € KR est un intervalle si pour tout a,b € 1, tout nombre entre a et 
b est également dans 1. Cette définition englobe tous les exemples connus d’intervalles ouverts, 
fermés avec ou sans infini : [ab], [a,b[, | — ©,a|, ...L’ensemble R lui-même est un intervalle. 


Si I est un intervalle, les nombres inf(1) et sup([) sont les extrémités de 1. 
DefLISOooDHLQr1l 


Définition 10.51. 

Étant donnés deux points a et b dans R? on appelle segment d’extrémités a et b, et on note [a, b], 
l’image de [0,1] par l'application s : [0,1] — R?, s(t) = (1 —-t)a + tb. On pose |a,b[= s(]0,1[), et 
la,b] = s(10,1]). 


Il faut observer que le segment [a,b] est une courbe orientée : certes en tant que ensembles, 
[a,b] = [b,a|, mais si nous regardons la fonction de t correspondante à [b, a], nous voyons qu’elle 
va dans le sens inverse de celle qui correspond à [a,b]. Nous approfondirons ces questions lorsque 
nous parlerons d’arcs paramétrés autour de la section 21.7. 

Le segment [b, a] est l’image de l’application r: [0,1] — R? donnée par r(t) = (1 —t)b + ta. 

ProplnterssiConn 
Proposition 10.52. 
Une partie de R est connexe si et seulement si c’est un intervalle °*. 


Démonstration. La preuve est en deux parties. D'abord nous démontrons que si un sous-ensemble 
de R est connexe, alors c’est un intervalle; et ensuite nous démontrons que tout intervalle est 
connexe. 

Afin de prouver qu’un ensemble connexe est toujours un intervalle, nous allons prouver que si 
un ensemble n’est pas un intervalle, alors il n’est pas connexe. Prenons À, une partie de R qui 
n’est pas un intervalle. Il existe donc a, b € À et un #0 entre a et b qui n’est pas dans À. Comme le 
but est de prouver que À n’est pas connexe, il faut couper À en deux ouverts disjoints. L'élément 
zo qui n’est pas dans À est le bon candidat pour effectuer cette coupure. Prenons M, un majorant 
de À et m, un minorant de À, et définissons 


Oï =]m, ol 
O2 =]x0, MT. 


Si À n’a pas de minorant, nous remplaçons la définition de O1 par | — ©,x0{, et si À n’a pas 
de majorant, nous remplaçons la définition de ©2 par [x0,%[. Dans tous les cas, ce sont deux 
ensembles ouverts dont l’union recouvre tout À. En effet, ©; L O: contient tous les nombres entre 
un minorant de À et un majorant sauf xp, mais on sait que xo n’est pas dans À. Cela prouve que 
À n’est pas connexe. 

Jusqu'à présent nous avons prouvé que si un ensemble n’est pas un intervalle, alors il ne peut 
pas être connexe. Pour remettre les choses à l’endroit, prenons un ensemble connexe, et demandons- 
nous si il peut être autre chose qu’un intervalle? La réponse est non parce que si il était autre 
chose, il ne serait pas connexe. 

Prouvons à présent que tout intervalle est connexe. Pour cela, nous refaisons le coup de la 
contraposée. Nous allons donc prendre une partie À de R, supposer qu’elle n’est pas connexe et 


22. Définition 7.64. 

23. Qui existent par la proposition 1.444, quitte à poser +00 comme infimum et supremum lorsque 1 n’est pas 
borné. 

24. Définition 1.21. 
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prouver qu'elle n’est alors pas un intervalle. Nous avons deux ouverts disjoints O1 et O2 tels que 
A € Où LÜ O. Notons A1 = À n Oi et À = À n Où; et prenons a € À; et bE A». Pour fixer les 
idées, on suppose que a < b. Maintenant, le jeu est de montrer qu’il existe un point x9 entre a et 
b qui ne soit pas dans À (cela montrerait que À n’est pas un intervalle). Nous allons prouver que 
c’est le cas du point 

xo = sup{x € O: tel que x < b}. 


Étant donné que l’ensemble À = {x € Où tel que x < b} est ouvert ?, le point xg n’est pas dans 
l’ensemble par le lemme 10.48. Nous avons donc 


— soit zo n’est pas dans O1, 
— soit zo < b, 
— soit les deux en même temps. 


Nous allons montrer qu’un tel xo ne peut pas être dans À. D'abord, remarquons que sup À < sup O: 
parce que À est une intersection de © avec quelque chose. Ensuite, il n’est pas possible que x9 soit 
dans O2 parce que tout élément de O2 possède un voisinage contenu dans O2. Un point de © est 
donc toujours strictement plus grand que le supremum de O1. 

Maintenant, en remarquant que si æ0 & b, alors x0 = b sinon b serait un majorant de À plus 
petit que xo, ce qui n’est pas possible puisque xo est le supremum de À et donc le plus petit 
majorant. Oui mais si xp = b, c’est que x0 € Oo, ce qu’on vient de montrer être impossible. Nous 
voilà déjà débarrassés des deuxièmes et troisièmes possibilités. 

Si la première possibilité est vraie, alors xo n’est pas dans À parce qu’on a aussi prouvé que 
xzo € O2. Or n'être ni dans ©; ni dans © implique de ne pas être dans À. Ce point x0 = sup À est 
donc hors de À. 

Oui, mais comme a € À, on a obligatoirement xo > a. Mais par construction, on a aussi xo < b 
(ici, l'inégalité est même stricte, mais ce n’est pas important). Donc 


a < Xo < b 


avec à, be À, et xo € À. Cela finit de prouver que À n’est pas un intervalle. 


Le lemme suivant dit que si on recouvre un intervalle avec des ouverts, alors on peut ordonner 
ces ouverts de telle sorte qu'ils s’enchainent bien : on peut sauter de l’un à l’autre en passant par 


les intersections. C’est donc un lemme qui permet de passer du local au global. 
LEMooNMGWooT£QDe0O 


Lemme 10.53. 
Soient un intervalle 1 de R ainsi qu'un recouvrement {O;};-1...n de 1 par des ouverts connexes 
tels que O; NI Z @ pour tout i$. Alors il existe une bijection D: {1,...,n} — {1,...,n} telle que 


(1) 


BIT (10.66) 
i=1 
est connexe pour tout m. 
(2) 
m—1 
Oy(m) a Oy(i) FD. (10.67) 
i=1 


Démonstration. Nous allons construire Ÿ par récurrence ; plus précisément nous allons construire 
des applications #4: {1,...,k} — {1,...,n} telle que 


(1) Ÿy est injective. 
(2) Si i < k alors Yi) = vi). 


25. C’est l'intersection entre l’ouvert O1 et l’ouvert {x tel que x < b}. 
26. Il est cependant possible que les O; ne soient pas inclus dans 1. 
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(3) La partie 


Ü Out EooAMAGoopHy GR 
i=1 


est connexe pour tout m < k. 


(4) Nous avons 


m—1 | 
Ori) © U Oo É# À “ARoONA RE 


pour tout m < k. 


Nous commençons en douceur par 


V1: {1} — {1,...,n} 


10.70 
1e 1. ) 


Ai-je besoin de vous prouver que c’est injectif ? 
Nous supposons que les applications v; sont correctement définies pour à < k, et nous construi- 
sons #11. Nous posons 


À = Y({1,...,k}) (10.71a) 
B=4{1,...,n}\A (10.71b) 
k 
P=[JO« (10.71c) 
i=1 
Ü Ou ti) (10.714) 
i=k+1 


En tant qu’unions d’ouverts, les parties P et Q sont ouvertes dans R. Elles recouvrent l’intervalle 
T qui est connexe par la proposition 10.52. De plus PNn1I Z Get QNI Z ©; donc, par définition 
de la connexité nous avons PR Q £ G. 

Il existe donc 19 € B tel que P n O;, Æ @. Nous posons 


Vk+1 : ssl en) 


fi) sSi£k+1 (10.72) 
1 
io sii=k+l. 


Vérifions que ce V%:1 vérifie les conditions. 

(1) Ÿx1 est injective. Soient à, 7 tels que Vyr1(i) = Vrr1(9). Si i = k +1 et j Æ k + 1 alors 
Vk+1(i) = 0 € B, alors que Vx41(3) = Yx(j) € À. Donc le cas à = k +1, j Æ k + 1 n’est pas 
possible. 

Sii,j Æ k +1, alors Yyr1(i) = Vyli) et Vr:1(3) = Vx(j). L'injectivité de y implique que 
=. 

(2) Sii< k, nous avons Yx+1(i) = Yx(i) = Wi(i) en utilisant la récurrence. 

(3) Nous séparons les cas m = k+1 et m Z£ k+1. Sim Æ k+1 alors tous les 4,1 dans (10.68) ?" 
sont des 4, et la récurrence fonctionne. Si m = k + 1 alors 


k+1 
e) Oil = U Oté) LU Opysitk+1) = PU O5: (10.73) 


i=1 


Le nombre io à été choisi pour avoir O;, n P # @. Comme O;, et P sont des connexes, la 
proposition 7.70(1) implique que P L O;, est connexe. 


27. Nous sommes en train de parler de cette équation avec k + 1 au lieu de k, parce que nous sommes dans un 
processus de récurrence. Il est donc normal de dire qu’il y a des #%+1 dans cette équation. 
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(4) Encore une fois, si m # k +1, tous les 4,1 de (10.69) deviennent des #4 et la récurrence 
fonctionne. Avec m = k + 1 nous avons 


k 
Ous1(k+1) N U at OP (10.74) 
=] 


1—= 


Cette intersection est non vide, par choix du to. 


Quand tous les dy (k = 1,...,n) sont construits, en posant d = 4, nous avons le résultat annoncé. 


ThoMKKooAbHaro 
Théorème 10.54 (Théorème des bornes atteintes). 
Une fonction à valeurs réelles continue sur un compact est bornée et atteint ses bornes. 
C'est-à-dire qu'il existe xo € K tel que f(xo) = inf{f(x) tel que x € K} ainsi que x1 tel que 
f(x1) = sup{f(x) tel que x € K}. 


Démonstration. Soient un espace topologique compact À et une fonction continue f: K — IR. 
Alors le théorème 7.211 indique que f(K) est compact. Par conséquent f(K) est un fermé borné 
de R par le théorème de Borel-Lebesgue 10.24. Puisque f(X) est borné, la fonction f est bornée. 

De plus f(K) étant fermé, son infimum est un minimum et son supremum est un maximum : 
il existe x € K tel que f(x) = sup f(K) et il existe y € K tel que f(y) = inf f(K). 


Le théorème suivant est essentiellement inutile pour les raisons suivantes : 


— Ilest un cas particulier du théorème 7.136 qui donne pour tout espace métrique, l’équivalence 
entre la compacité et la compacité séquentielle. 


— Il est un cas particulier du théorème 7.275 qui le donne pour tous les espaces compacts. 


Bref, nous ne le laissons que pour le lecteur qui n’aurait pas en tête d’autres définitions de « com- 


pact » à part « fermé borné ». 
ThoBolzanoWeierstrassRn 


Théorème 10.55 (Théorème de Bolzano-Weierstrass). 
Toute suite contenue dans un compact de R'"” admet une sous-suite convergente. 


Démonstration. Nous rappelons qu’une partie compacte de IR”? est fermée et bornée par le théo- 
rème de Borel-Lebesgue 10.24. 

Soit (x) une suite contenue dans une partie bornée de R’”. Considérons (a), la suite réelle 
des premières composantes des éléments de (x,) : pour chaque n € N, le nombre a, est la première 
composante de x. Étant donné que la suite (x,) est bornée, il existe un M tel que |x,| < M. La 
croissance de la fonction racine carrée donne 


lan| < |tn| < M. (10.75) 


La suite (a,) est donc une suite réelle bornée et donc contient une sous-suite convergente par le 
théorème correspondant dans R : 7.136. Soit ar, une sous-suite convergente de a,. Nous considérons 
maintenant x7,, c’est-à-dire la suite de départ dont on a enlevé tous les éléments qu’il faut pour 
qu’elle converge en ce qui concerne la première composante. 

Si nous considérons la suite by, des secondes composantes de #7,, nous en extrayons, de la 
même façon que précédemment, une sous-suite convergente, c’est-à-dire que nous avons un bb € 1; 
tel que br, est convergent. Notons que ay, est une sous-suite de la (sous) suite convergente x17,, et 
donc ar, est encore convergente. 

En continuant ainsi, nous construisons une sous-sous-sous-suite x, telle que la suite des troi- 
sièmes composantes est convergente. Lorsque nous avons effectué cette procédure m fois, la suite 
1, est une suite dont toutes les composantes convergent, et donc est une suite convergente par la 
proposition 10.36. 
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Le tableau suivant donne un petit schéma de la façon dont nous procédons. Les + sont les 
éléments de la suite que nous gardons, et les x sont ceux que nous « jetons ». 


TN e e e e. ee ee e CC 
TI; X e e X ee XX X e. ee ee 
TI X e X X ee X X ee ee X ... (10.76) 


La première ligne, xx, est la suite de départ. 


CorFHbMqGGyi 
Corolaire 10.56. 
Si une suite est croissante et bornée alors elle est convergente. 


Démonstration. Nous nommons (x,) la suite et nous prenons un majorant M. Toute la suite est 
alors contenue dans le compact [x0, M], ce qui donne une sous-suite (r,{1)) convergente par le 
théorème de Bolzano-Weierstrass 7.275. Si £ est la limite de cette sous-suite alors nous avons 
{> xh pour tout n. 
Pour tout € > 0 il existe K tel que si n > K alors [{ — x,(,,| < €. Comme { majore la suite 
nous avons même 
Lan) F6 (10.77) 


Puisque la suite est croissante pour tout m > a(K) nous avons 4» + € > L, ce qui signifie 
[Tm — | < €. 


Nous aurons une version pour les fonctions croissantes et bornées en la proposition 12.59. 

La proposition suivante dit que la notion d'ensemble non dénombrable ne prend pas réellement 
de force entre R et R” : il n’y à pas moyen de caser IR dans R”? de façon à ce qu'il y tienne à son 
aise. 


Proposition 10.57. 
Une partie non dénombrable de R" possède un point d’accumulation *. 


Démonstration. Soit une partie À € R”" sans point d’accumulation. Nous allons prouver que À est 
dénombrable. 

Soient les compacts K, = B(0,n). La partie À n K, est finie ; sinon elle aurait une partie en 
bijection avec N (proposition 1.138) et donc une suite. Or une suite dans un compact possède un 
point d’accumulation par le théorème 7.275. 

Donc tous les À n X, sont finis. Puisque À = [J, À n K», l’ensemble À est une réunion 
dénombrable d’ensembles finis. I est donc dénombrable. 


10.3.13 Recouvrement par des intervalles ouverts 


Soit un ensemble E et un ensemble À de parties de Æ. Soit À € À. Nous aimerions savoir quels 
sont les éléments de À qui sont atteignables en partant de À et en ne « sautant » que d’intersection 
en intersection. 

Nous notons À = {B;};jer où I est un ensemble d’indices (un ensemble quelconque). 


s1(4) = {ie I tel que B; n À 4 G} (10.78a) 
c1(4)= |] 2. (10.78b) 
Besi1(A) 
Et ensuite : 
sk+1(4) = {ie I tel que B; n ox(À) # D} (10.79a) 
ckn(4)= |] B (10.79b) 
Bészx+1(4) 


28. Définition 7.30. 
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LEMooJHMTooXwxSAa 
Lemme 10.58. 
Soient un intervalle À de R et A = {li};-1..N un recouvrement de À par des intervalles ouverts. 
Si ln À £ © alors 


(1) a =0onNu 
(2) AC on(li). 


Démonstration. Si 6x:1 = 04, alors tous les 64: sont identiques. De plus si 07x11 Æ 0%, alors 
Og+1 Contient au moins un élément de plus que 04. Donc Card(ox) > k et en particulier N < 
Card(on) < N. Cela prouve le premier point. 

L'ensemble on(1) est une union d’ouverts et est donc un ouvert. Quitte à renuméroter, nous 
écrivons 


ent) ir... (10.80) 
L'ensemble 
N 
r= (J & (10.81) 
k=n+1 


est ouvert et est disjoint de on(li) parce que si Z; (1 > n + 1) intersectait on(l1), nous aurions 
LE sN+1 ou encore 1 € on+1\0N. 

Donc 7 et on sont deux ouverts disjoints qui recouvrent À. Puisque À est un intervalle, il 
est connexe ?”. Donc, soit À © r, soit À € on. Comme 11 n À # QG nous sommes dans le cas 
AC N: 


LEMooGHPTooKgFvGb 
Lemme 10.59. 
Soit x e R. Si À = {I;}ses est un ensemble d’intervalles contenant x, alors 1 = US 1, est un 
intervalle 0. 


Démonstration. Soient a, b € I (nous supposons a < b). Nous devons prouver que [a,b] € I. Pour 
cela nous considérons y € [a,b]; il y a deux possibilités : soit y < x soit y > x (si y = x alors 

yE Li). 
Si y < x, alors a < y < x et donc y =E I. Si y > x, alors x <y LbetyeE I. 
PROPooTXMBooZaSKFF 


Proposition 10.60 ([310, 311]). 
Un ouvert de R peut s’écrire comme union au plus dénombrable d’intervalles ouverts disjoints. 
Plus précisément, si © est un ouvert de R, il existe un ensemble F = {Ii}ses où 


(1) Chaque I; est un intervalle ouvert contenu dans ©, 
(2) Pour s,teS, sil; # 1, alors 1, n L = G. 
(3) S est dénombrable, 


Démonstration. Pour x € ©, nous définissons J, comme étant l’union de tous les intervalles ouverts 
contenus dans © et contenant x. Les J, ne sont pas vides parce qu’ils contiennent toujours une 
boule centrée en x °!. 

En tant qu’union d’intervalles, J; est un intervalle par le lemme 10.59. De plus, J, est ouvert 
parce que toute union d’ouverts est ouverte F4, 

Nous notons À l’ensemble des intervalles ouverts contenus dans ©, et 


Az = {1e Atelquezel}. (10.82) 


29. Définition 7.64 et proposition 10.52. 

30. Définition 1.21. 

31. C’est la définition 7.101 de la topologie métrique. 
32. C’est dans la définition 7.1 d’une topologie. 
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(1) Si ye J>, alors J; = J, Puisque y € J,, nous pouvons considérer J = 4, n4,. Nous avons 


Aer turelLires (10.83) 
IEAy IEAy eds IEA> 


L’inclusion dans l’autre sens s’obtient en écrivant la même équation en échangeant x et y. 


(2) Les J, sont disjoints Nous prouvons à présent que pour #,y € ©, nous avons J; = J, ou 
Jr © Jy = ©. En effet si ae J, N J,, alors J, = J; et Ja = Jy. Donc J; = J,. 


(3) Dénombrable C’est le moment d'écrire F = {J;}:e0. Comme tout intervalle contient au 
moins un rationnel (proposition 10.16), nous avons aussi 


F = {etat = {Ja}aQnO. (10.84) 


Cet ensemble F vérifie les conditions demandées. 


10.4 Connexité par arcs 

DEFooUXVCooBizpgk 
Définition 10.61. 
Une partie À d’un espace topologique est connexe par arcs si pour tout a,b € À, il existe une 
application continue 7: [0,1] — À telle que y(0) = a et y(1) = b. 


10.62. 
Un exemple d’ensemble connexe mais pas connexe par arcs est donné par la proposition 21.56. 
L'idée de cet exemple est de construire un ensemble en deux parties reliées par un chemin de 
longueur infinie. 

Un espoir fou nous prend alors de croire que nous pouvons produire un exemple plus simple 
avec R LU {+00} parce que, dans cet ensemble, 1 et +0 sont reliés par un chemin de longueur 


infinie. La proposition 12.60 nous montrera que non. 
LEMooQPYMooRKVSrv 


Lemme 10.63. 
Une partie connexe par arcs est connexe. 


Beaucoup d’espaces connexe sont connexes par arcs. La proposition suivante couvre entre autres 


le cas de tout ouvert connexe d’un espace vectoriel normé comme l’espace euclidien. 
PROPooYFDBooHbBjzF 


Proposition 10.64 ([312]). 


Tout espace connexe et localement connexe par arcs est connexe par arcs. 
LEMooTVQMooFxrFaT 


Lemme 10.65. 
Soient deux espaces topologiques E et F', et f : E — F un homéomorphisme. E est connexe par 
arcs si et seulement si F l’est. 


10.66. 
Voici une idée de la preuve. 

On montre en réalité que l’image d’un connexe par arcs par une application continue est un 
connexe par arcs, ce qui implique chaque sens de l’équivalence de l’énoncé. 

Soient p et q des points de F'. Il existe un chemin reliant un antécédent de p et un antécédent 
de q (dans E). L'image de ce chemin est un chemin reliant p et q (dans F) puisque composé 


d'applications continues. 
LEMooQFQFooD1lxkrw 


Lemme 10.67. 
Une sphère de IR” est connexe par arcs si n > 1 


33. Définition 10.61 
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10.68. 
Une idée de la preuve. 

On voit qu’un cercle est connexe par arcs car on a un paramétrage en sinus et cosinus. Pour 
une sphère S de centre a en dimension n > 2, on se donne p et q sur S et on définit P le plan 
affine passant par a, p et q. Alors P n $ est un cercle, donc on peut relier p à q par un chemin 
dans cette intersection. 

Pour voir sur une formule que P n S est un cercle, on peut écrire x — a = À(a — p) + (a — q) 
l'équation (en +) du plan P, et [x — a? = R? l'équation (en x) de la sphère. En injectant, on obtient 
une équation du second degré en À, u qui se révèle être l’équation d’un cercle à une transformation 


affine près. 
LEMooDYNSooUmJbYq 


Lemme 10.69. 
Un ouvert connexe par arcs dans R° (n > 2) reste connexe par arcs même si on lui enlève un 
point. 


10.70. 
Une idée de la preuve. 

En effet, soit U un tel ouvert connexe par arcs, et p un point de U. Soient x et y sur U\{p}. 
Il existe un chemin 7 de x à y. Si le chemin ne passe pas par p, c’est gagné. Si il passe par p, 
on choisit une boule B fermée (de rayon non-nul) centrée en p qui ne contient ni x ni y. On note 
E = y 1(B) € [0;1] c'est un ensemble compact (fermé, par continuité de +, et borné) dont on 
regarde le maximum t et le minimum ft. 


Il reste enfin à définir un chemin entre p et q par morceaux 
(1) Les points p et y({t) sont reliés par , 
(2) Par connexité par arcs, il existe un chemin sur la sphère qui relie y(t) à +(t), 


(3) et enfin y(t) et q sont reliés via 7: 
ce qui achève la construction d’un chemin continu entre p et q. 
Pour conclure l’exercice, par l’absurde, on prend un voisinage connexe et ouvert V de 0 dans le 
cône, homéomorphe à un ouvert connexe U de IR2. Or V\{0} n’est pas connexe par arcs, alors que 


l’ouvert dont on retire un point reste connexe par arcs. C’est impossible, donc l’homéomorphisme 
n'existe pas, et le cône n’est pas une variété de dimension 2. 


10.4.1 Des exemples 


Exemple 10.71. 
Nous étudions l'exemple suivant : 


A = {(x,y)e R°| 2y? + 4y + 2 < x < V4 — y, ye [—1.5,0.5[}. (10.85) 


On commence par tracer la parabole x = 2y? + 4y +2, la circonférence x? + y? = 4 et les droites 
y = —1.5 et y = 1/2. On voit tout de suite que l’aire délimitée par les quatre courbes est donnée par 
l'union de deux parties. Dans la première 4/4 — y? < x < 2y? + 4y + 2, ye [0,0.5] et dans l’autre 
2y? + 4y +2 < x < W4—yY?, y € [—-1.5,0]. L'ensemble A1 est contenu dans la deuxième, 10.1. 
L'intérieur de A1 est donné par Int( A1) = {(x,y) € IR? | 2y?+4y+2 < x < 4/4— y?, ye]—1.5,0[}, 
et sa frontière est l’union de 3 morceaux de courbe #1, Lo, l3 : 


& = {(x,y)|x = 2y? + 4y + 2, ye [—1.5,0]} 
L = {(x,y)|x = 4— y?, yEe[-—1.5,0]} (10.86) 
ls = {(a,y)|x € [0.5,/7/4] y = —-1.5}. 
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FIGURE 10.1: LabelFigLAfWmaN 
EXo0EJWBooDjB£fKV 
Exemple 10.72. 
Nous étudions 
A3=NxQ=/{(xy)eR?|reN,ye Q}. (10.87) 


L'ensemble 43 n’est pas ouvert, ni fermé, ni borné dans la topologie de R?. Le lemme 7.27 dit que 
À a un intérieur vide et sa fermeture est IR. L'ensemble N, par contre est fermé et non borné. On 
peut remarquer que tous les points de N sont points isolés. La fermeture de A3 est alors N x R et 
son intérieur est vide. On peut dessiner la fermeture de cet ensemble comme une famille de droites 
verticales x = n, pour tout n dans N. A 


Exemple 10.73. 
Nous étudions l’ensemble 
A3 = {(t,2t)eR?|te [0,1] }. (10.88) 


L'ensemble A3 est un petit segment de droite. Son intérieur est vide parce que toute boule 
centrée en un point de la droite intersecte l’extérieur de la droite. Son adhérence et sa frontière 
sont A3 lui-même parce que nous considérons les valeurs de t dans [0,1] qui est un intervalle fermé. 
Si l'intervalle avait été ouvert, l’adhérence et la frontière auraient été trouvés en fermant : 


{(4,2t) tels que t € [0,1[ } = {(4,2t) tels que t € [0,1]} (10.89) 


Étant donné que son adhérence est égal à lui-même, cet ensemble est fermé (et donc pas ouvert). 
Il est également borné parce qu'il est contenu dans une boule de rayon 3. PA 


Exemple 10.74. 
Nous étudions l’ensemble 


A=QxQ={(xYyeR|reQyeQ). (10.90) 


Dans R nous savons que Q = R, Int(Q) = et 0Q = R parce que toute boule centrée en un 
rationnel contient un irrationnel, et inversement, toute boule centrée en un irrationnel contient un 
rationnel. Dans IR? nous avons le même phénomène parce dans la boule B((p»; q); r) avec (p,q) € 
Q x Q, se trouvent en particulier les points de la forme (p,x) avec x € B(q,r) & R. Évidement, 
certains de ces x ne sont pas dans Q et par conséquent, la boule B((p, q);r) contient les points 
(p,æ) # Q x Q. 

De la même manière, si (x,y) est un point de R?, dans toute boule centrée en (x, y), il y aura 
un élément de Q?. 

Par conséquent, Int(Q x Q) = Z, Q x À = R x R et (Q x Q) = R2. 

Il n’est ni ouvert ni fermé (parce qu’il n’est égal ni à son intérieur ni à sa fermeture). Il n’est 
pas borné non plus parce qu’il existe des nombres rationnels arbitrairement grands. A 


Exemple 10.75. 
Nous étudions l’ensemble 


A5 = {(x,y)e R?|xE€]0,1[,sin = De 3}. (10.91) 
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La fonction x + sin() est une des fonctions dont le graphe doit être connu. La figure 10.2 
montre la situation. Comme d'habitude, il est fortement recommandé de refaire le dessin soi-même. 


FIGURE 10.2: Les points qui sont sur l’axe vertical entre 0 et 3 sont sur la frontière, mais pas dans 
l’ensemble 45. LabelFigAdhIntFrTrois 


L'ensemble A5 est ouvert parce que les conditions x € ]0,1[ et sin L < y < 3 sont des conditions 
« ouvertes » au sens où si un point les vérifient, alors on peut trouver une boule dans lequel ces 
conditions restent vérifiées. Cela prouve que Int(A;) = A5. 

La fermeture de A; contient en outre les points tels que sin À : 
bornes étant incluses) ainsi que les points des trois segments de droites suivants : 


{(0,y) tels que ye [—1,3]} 
{(x,3) tels que x € [0,1]} (10.92) 
{(1, y) tels que y e [sin(1),3]}. 
La frontière est composée de ces trois segments et du graphe de la fonction sin À entre 0 et 1. 


L'ensemble A; est borné parce qu’il est contenu par exemple dans la boule centrée en (0,0) et 


de rayon 10. Il est ouvert et donc pas fermé. PA 
ItemexoEspVectoNorme0003iv 


y entre x = 0 et x = 1 (les 


Exemple 10.76. 
Nous étudions l’ensemble i 
A6 = (J{(Sylyelo,1}. (10.93) 
n 
neNo 
L'ensemble À6 est une union infinie de segments de droites verticaux, voir figure 10.3 


À 


1- 


% 


FIGURE 10.3: Le segment sur l’axe vertical entre y = 0 et y = 1 fait partie de l’adhérence et de la 
frontière, mais pas de l’ensemble 46 lui-même. LabelFigAdhIntFrSix 


L'intérieur est vide parce qu’autour de tout réel de la forme 1, il y a un réel qui n’est pas de 
cette forme. En ce qui concerne la frontière et l’adhérence, il s’agit de l’union de tous ces segments 
plus le segment en x = 0. 
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En effet, la boule de rayon r autour du point (0,y) contient le point (à, y) avec n assez grand 
pour que 1 <T. A 


10.4.2 Quelques mots à propos de la droite réelle achevée 


Définition 10.77. 
La droite réelle achevée est l’ensemble R LU {+ow} où +oo sont deux nouveaux éléments. Nous 
la notons R pour des raisons que nous verrons à peine plus bas. 


Cette définition ne servirait à rien si nous n’y mettions pas une topologie pour positionner les 
éléments +00 par rapport à ceux qui existaient déjà dans KR. 


Définition 10.78 (Topologie sur R). 
La topologie sur R est celle sur R à laquelle nous ajoutons les voisinages de +oo de la façon 
suivante. Une partie V de R est un voisinage de +00 si il existe m > 0 tel que Ïm, +] € V. 
Le lemme suivant justifie la notation R pour la droite réelle achevée °{. 
LEMooPZXHooEEXSTC 
Lemme 10.79. 
L'adhérence® de R dans R est R. 


Démonstration. Il suffit de prouver que +00 et —0 sont dans l’adhérence de R. Nous le faisons 
pour +00. Ce n’est pas très compliqué : si À est un ouvert contenant +00, il contient une partie 
de la forme ]a, +], et donc contient des éléments de R. 


Pour la suite nous utilisons la notation (pratique en probabilité) 


{f<a}={xes tel que f(x) < a}. (10.94) 


10.5 Continuité 


La définition de fonction continue est la définition 7.32. 


(1) Dans le cas d’une fonction f: R — R, la définition de la continuité devient la proposition 
10.80. 


(2) Une application continue vers un espace normé est localement bornée, proposition 7.113. 
PROPooVNGEooPwbxXP 
Proposition 10.80. 
Soient ACRetae A. La fonction f: À — R est continue en a si et seulement si pour tout 
e > 0, il existe un 8 > 0 tel que si x € B(a, 6) n À alors | f(x) — f(a)l| < €. 


Démonstration. En deux parties. 


(1) Si f est continue Soit € > 0. L’ouvert W = B(f(a),e) contient f(a). La définition de la 
continuité en a dit qu’il existe un ouvert V de A contenant a et tel que f(V) € B(f(a),e). 


Vu que V est un ouvert de A7, il contient une partie de la forme B(a,ô) n A pour un certain 
5 > 0. Pour ce 6, nous avons bien que f(x) € B(f(a), €) dès que x € B(a,o) n A. 


(2) Si f dans l’autre sens Soit un ouvert W de R contenant f(a). Nous avons un € > 0 tel 
que B(f(a), €) € W. Il existe donc un Ô > 0 tel que 


f(B(a, 6) n À) € B(f(a),e) c W. (10.95) 


La partie B(a,ô) n À est un voisinage de a dans À. 


34. Notez que l’espace métrique R est déjà complet. Il ne s’agit donc pas d’une completion. 
35. Définition 7.19. 

36. Définition 7.32(1). 

37. Topologie induite et tout ça. 
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Nous allons maintenant étudier quelques conséquences de la continuité sur KR. 


(1) D'abord on voit que la continuité n’a été définie qu’en un point. On peut dire que la fonction 
f est continue en tel point donné, mais nous n’avons pas dit ce qu'est une fonction continue 
dans son ensemble. 


(2) Le théorème 7.196 nous précise que si Z est un intervalle de R, la fonction f est continue sur 
T si et seulement si elle est continue en chaque point de 1. 


(3) Comme la définition de f continue en a fait intervenir f(x) pour tous les + pas trop loin 
de a, il faut au moins déjà que f soit définie sur ces x. En d’autres termes, dire que f est 
continue en a demande que f existe sur un intervalle autour de a. 


Ceci couplé à la définition précédente laisse penser qu’il est surtout intéressant d'étudier les 
fonctions qui sont continues sur un intervalle. 


(4) L’intuition qu’une fonction continue doit pouvoir être tracée sans lever la main correspond 
aux fonctions continues sur des intervalles. Au moins sur l’intervalle où elle est continue, elle 
devrait être traçable en un coup. Cette intuition est complètement fausse (comme pratique- 
ment toutes les intuitions), comme le montre l’exemple 10.81. 


EXooJBGSooBOGSse 
Exemple 10.81. 
Il est très possible d’être continue en un seul point. Par exemple la fonction 
f(æ) = #(1 — 1x) (10.96) 
où IQ est la fonction indicatrice de Q dans R. A 
PROPooUBUAooNIxjfg 


Proposition 10.82. 
Si f:R—R est continue au point ae R et si f(a) Æ 0, alors il existe un voisinage de a sur lequel 
f ne s’annule pas. 


Démonstration. Si f s’annulait sur tout voisinage de a (mais pas en a lui-même), nous aurions, 
pour tout n un réel 
1 
Tn € B(a, —)\{a} (10.97) 
n 


tel que f(x) = 0. Cela donnerait une suite x, — a avec f(x») — 0, ce qui contredit la continuité 
de f en a en vertu de la proposition 7.240 sur la continuité séquentielle en un point. 


Notons que ce résultat se généralise : si f est continue et pas égale à r en a, alors il existe un 
voisinage de a sur lequel elle ne prend pas la valeur r. 


10.5.1 Opération sur la continuité 


Nous allons démontrer maintenant une série de petits résultats qui permettent de simplifier la 
démonstration de la continuité de fonctions. 


Théorème 10.83. 
Si la fonction f est continue au point a, alors la fonction Àf est également continue en a. 


Démonstration. Commençons par exprimer la continuité de f en a. Soit € > 0. Il existe 01 > 0 
tel que 


(x — al < à) = [f(x) — f(a)l < &. 


En travaillant avec Àf au lieu de f, 


(kr — al < à) = [(A)(x) — (AP) (a)l < Ale. (10.98) 
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Passons à la continuité de Àf. Soit € > 0. Nous posons € = e/|À] et nous considérons le ô1 
correspondant : 


(x — al < à) = [(AF)(x) — QP)(a)l< Me = € 


Ce 1 est celui que l’on cherchait. 


Théorème 10.84. 
Si f et g sont deux fonctions continues en a, alors la fonction f + g est également continue en a. 


Démonstration. La continuité des fonctions f et g au point a fait en sorte que pour tout choix de 
e1 et €», il existe 01 et 02 tels que 


(x — al < à) = [f(x) — f(a)l < a. 


et 
(Ir — a] < 02) = [g(x) — g(a)| < e2. 


La quantité que nous souhaitons analyser est | f(x) + g(x) — f(a) — g(a)|. Tout le jeu de la démons- 
tration de la continuité est de triturer cette expression pour en tirer quelque chose en termes de €; 
et €. Si nous supposons avoir pris [x — a] plus petit en même temps que 01 et que 02, nous avons 


f(x) + g(x) — (a) — g(a)l < 1f(x) — g(x)} + Ig(x) — g(a)l < & + € 


en utilisant la formule générale |a + b] < [a] + |b]. Maintenant, si on choisit € et €2 tels que 
€ + €2 < e, et les 01, d2 correspondants, on a 


LF(x) + g(x) — f(a) — g(a)l < e, 


pourvu que [x — a| soit plus petit que 01 et 02. Le bon 6 à prendre est donc le minimum de 61 et 
02 qui eux-mêmes sont donnés par un choix de €: et e2 tels que €1 + €2 < €. 


Pour résumer ces deux théorèmes, on dit que si f et g sont continues en a, alors la fonction 


af + Bg est également continue en a pour tout à, BE R. 
PROPooVNKVooJvxarf 


Proposition 10.85. 
Soient des parties (y et Q, dans R. Soient f: Q7 — R ainsi que g: Q, — R telles que 


(1) g est continue en a et vaut g(a) = L. 
(2) f est continue en L et vaut f(£) = b. 


(3) 9(Qg) € A. 
Alors f o g est continue en a. 


Démonstration. Soit e > 0. La continuité de f dit que il existe 7 > 0 tel que 
yeB(mnQ; = |f(y) - FOI <e (10.99) 
La continuité de g donne Ô > 0 tel que 
xe B(a,d)n (= |g(x) — g(a)| < n. (10.100) 
Si x e B(a,6) n Q,, alors g(x) € B(£,n) n (y. Donc 


[CF 0 g)(x) — FCO] < €. (10.101) 


Mais f(£) = (f o g)(a). Tout cela est la continuité de f o g en a. 


Parmi les propriétés immédiates de la continuité d’une fonction, nous avons ceci qui est souvent 
bien utile. 
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CorNNPYooMbaYZg 
Corolaire 10.86. 
Si la fonction f est continue en a et si f(a) > 0, alors f est positive sur un intervalle autour de a. 


Démonstration. Prenons € < f(a) et voyons Ÿ ce que la continuité de f en a nous offre : il existe 
un 6 tel que 


(x — al < 6) = [f(x) — f(a)l < e< f(a). 


Nous en retenons que sur un intervalle (de largeur 0), nous avons |f(x) — f(a)| < f(a). Par 
hypothèse, f(a) > 0, donc si f(x) < 0, alors la différence f(x) — f(a) donne un nombre encore plus 
négatif que —f(a), c’est-à-dire que | f(x) — f(a)| > f(a), ce qui est contraire à ce que nous venons 
de démontrer. D’où la conclusion que f(x) > 0. 


10.5.2 La fonction la moins continue du monde 


Parmi les exemples un peu sales de fonctions non continues, il y a celle-ci : 


et = si æ € Q 


0 sinon. 


Par exemple, xa(0) = 1, et* xa(T) = xa(V2) = 0. Bien que x@(0) = 1, il n'existe aucun 
voisinage de 1 sur lequel la fonction reste proche de 1, parce que tout voisinage va contenir au 
moins un irrationnel. À chaque millimètre, cette fonction fait une infinité de bonds! 

Cette fonction n’est donc continue nulle part. 

À partir de là, nous pouvons construire la fonction suivante qui n’est continue qu’en un point : 


f(x) = axa(a) = " 
0 sinon. 

Cette fonction est continue en zéro. En effet, prenons ô > 0; il nous faut un € tel que |x| < € 
implique f(x) < 8 parce que f(0) = 0. Bon ben prendre simplement € = 0 nous contente. Cette 
fonction est donc très facilement continue en zéro. 

Et pourtant, dès que l’on s’écarte un tant soit peu de zéro, elle fait des bons une infinité de 
fois par millionième de millimètre! Cette fonction est donc la plus discontinue du monde en tous 
les points, sauf un (zéro), où c’est une fonction continue! 


10.5.3 Approche topologique 


Nous avons vu que sur tout ensemble métrique, nous pouvons définir ce qu’est un ouvert : c’est 
un ensemble qui contient une boule ouverte autour de chacun de ses points. Quand on est dans un 
ensemble ouvert, on peut toujours un peu se déplacer sans sortir de l’ensemble. 

Le théorème suivant est une très importante caractérisation des fonctions continues (de R dans 
R) en termes de topologie, c’est-à-dire en termes d’ouverts. 


ii Avertissement /question à la lectrice !! 10.87 
Le théorème suivant n'a aucun sens parce que c’est pratiquement la définition de la continuité 
d’une fonction, définition 7.32. Peut-être que ce qu’on a en tête est la proposition 7.33 qui donne 


l’équivalence entre application continue et continu en chaque point. 
ThoContInvOuvert 


Théorème 10.88. 
Si I est un intervalle ouvert contenu dans dom f, alors f est continue sur I si et seulement si pour 
tout ouvert O dans R, l’image inverse fl" (©) est ouvert. 


38. ici, nous insistons sur le fait que nous prenons € strictement plus petit que f(a). 
39. Pour prouver que 42 n’est pas rationnel, c’est pas trop compliqué, mais pour prouver que x ne l’est pas non 
plus, il faudra encore manger de la soupe. 
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Démonstration. Dans un premier temps, nous allons transformer le critère de continuité en termes 
de boules ouvertes, et ensuite, nous passerons à la démonstration proprement dite. Le critère de 
continuité de f au point x dit que 


EqDE 
Vô > 0,1e > 0 tel que (x — a] <e) = |f(x) — f(a)| < à. À U0410% 
Cette condition peut être exprimée sous la forme suivante : 
Vô > 0,1 tel que a € B(x,e) = f(a) € B(f(x),6), 


ou encore 


Vô > 0, 1e tel que f(B(x,e)) € B(f(x),6). FAReder Gone 


Jusque ici, nous n'avons fait que du jeu de notations. Nous avons exprimé en termes de topologie 
des inégalités analytiques. La condition (10.103) est le plus souvent utilisée comme définition de la 
continuité d’une fonction en x, lorsque le contexte ne demande pas de définitions plus générales. 
Si tel est le choix, il faut pouvoir retrouver (10.102) à partir de (10.103). 

Passons maintenant à la démonstration proprement dite du théorème. 

D'abord, supposons que f est continue sur 1, et prenons ©, un ouvert quelconque. Le but 
est de prouver que f (0) est ouvert. Pour cela, nous prenons un point 0 € f F0) et nous 
allons trouver un ouvert autour de ce point, contenu dans f|; (©). Nous écrivons yo = f(æo). 
Évidemment, yo € ©, donc on a une boule autour de yo qui est contenue dans ©, soit donc 6 > 0 
tel que 

B(yo, 5) € ©. 


Par hypothèse, f est continue en +0, et nous pouvons donc y appliquer le critère (10.103). I existe 
donc € > 0 tel que 


F(B(xo,e)) € B(f(x0),6) « ©. 


Cela prouve que B(x0,€) € fl; (O). 
Dans l’autre sens, maintenant. Nous prenons x0 € I et nous voulons prouver que f est continue 
en xo, c’est-à-dire que pour tout Ô, nous cherchons un € tel que f(B(xo, €)) = B(f(xo), 6). Oui, 


mais B(f(xo). 6) est ouverte, donc par hypothèse, ir (8 (f(xo). 5)) est ouvert, inclus dans Î et 
contient xo. Donc il existe un € tel que 


B(&o,9) € flr' (B(F(0),5)), 


et donc tel que 


f(B(x,0)) € B(f(x0),6), 


ce qu'il fallait prouver. 


ThoVallnter 
Théorème 10.89 (Théorème des valeurs intermédiaires). 
Soit f, une fonction continue sur [a,b], et supposons que f(a) < f(b). Alors pour tout y tel que 
f(a) < y < f(b), il existe un x € [a, b] tel que f(x) = y. 


Démonstration. Nous savons que [a, b] est connexe parce que c’est un intervalle (proposition 10.52). 
Donc f([a,b]) est connexe (lemme 7.209) et donc est un intervalle (à nouveau la proposition 10.52). 
Étant donné que f ([a, b]) est un intervalle, il contient toutes les valeurs intermédiaires entre n’im- 
porte quels deux de ses éléments. En particulier toutes les valeurs intermédiaires entre f(a) et 


F(b). 


10.90. 
Une façon classique d'utiliser le théorème des valeurs intermédiaires 10.89. Si f: [0,00[ — [0, 
est continue et vérifie f(0) = 0 et limz_,4 f(æ) = ©, alors f est surjective. 

En effet si y € [0, |, alors il existe a € [0, 0! tel que f(a) > y. Donc il existe x € [0, a] tel que 


f(x) = y. 


NORMooTQWWooQVPWI J 
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CorlmIinterInter 
Corolaire 10.91. 
L'image d’un intervalle par une fonction continue est un intervalle. 


Démonstration. Soient 7 un intervalle, a < B € f(1) et y € ]a, 5[. Nous considérons à, b € I tels 
que a = f(a) et B = f(b). Par le théorème des valeurs intermédiaires 10.89, il existe t € Ja, b[ tel 
que f(t) = y. Par conséquent y € f(1). 


DEFooGQTYo0o0URuvQb 
Corolaire-Définition 10.92 (Existence de la racine carrée). 
Si x > 0 dans R alors il existe un unique réel y > 0 tel que y? = x. Ce nombre est noté 4/x et est 
nommé racine carrée de x. 


Démonstration. La fonction f : {+ t? est continue et strictement croissante. Nous avons f(0) = 0 
et f(x +1) > x. Donc le théorème des valeurs intermédiaires 10.89 nous assure qu’il existe un 
unique y € [0,x + 1] tel que f(y) = x. 


LEMooWSVNooKsymDy 
Lemme 10.93. 
Quelques formules. 
(A) Vay = Va y si s,y > 0. ITEMooEPHBooCEe JOD 
(2) VXx = Az six > 0. 
LEMooSBOAoo00OIotR 


Lemme 10.94. 
La fonction racine carrée est strictement croissante. 


Démonstration. Supposons que x < y. Si V/x > ,/y, alors la croissance de la fonction carré donne 
æ > y qui est contraire à l’hypothèse. 


10.5.4 Module sur les nombres complexes 
LEMooVHDAooJyoakR 


Lemme-Définition 10.95. 
Si ze ©, alors zZ est un réel positif. 


Nous définissons le module sur C par“! 


| = Ve (10.104) 
Démonstration. Prouvons que zZ est un réel positif. En effet si z = a + bi alors 


23 = (a+ bi)(a — bi) = a? — abi + abi + b? = a? + b? > 0. (10.105) 


LEMooJRLWooScVrkG 
Lemme 10.96. 


Si ze C nous avons 
E DGT jP 
z+z=2Re(z). POP FE TO 


Démonstration. Soit z = a + bi avec a, b € R. Nous avons 


2+23= a+ bi+a—bi=2a=2Re(z). (10.107) 


PROPooUMVGooïrhZZg 
Proposition 10.97. 
_ : / 
Pour tout nombres complexes z = a + bi et z', nous avons ITEMooYBJVooGXiDSd 


(1) zz=& +b); 


40. Faites deux cas suivant x > 1 ou non si vous le voulez, moi je prends x + 1. 
41. Définition de la racine carrée : 10.92. 
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ITEMooCGLSooKHbzkn 
(2) Z2=2; ITEMooDKWDooU jEuZA 
(3) ll = 12; ITEMooFXKYooUOXbwH 
(4) lez = 1241171; ITEMooUJHPooUFdvqB 
(5) lz+21= VIP +171 +2Re(27). ITEMooDVMDooFDmOur 
(6) 121 + 221 < [al + 22] ITEMooHBIEooEhzlul 
(7) |z1 + 20] = |21l + |20] sû et seulement si 2122 € R*. ITEMooMCAAooTuUxL.V 


(8) Nous avons | Re(z)| < |z| et nous avons l'égalité si et seulement si z € R. 


Démonstration. En plusieurs points. 


(1) Pour (1) Calcul direct : 
27 = (a+ bi)(a — bi) = a? — abi + abi + b? = a? + b. (10.108) 


(2) Pour (2) Ona: 


Z = (a — bi) = a + bi. (10.109) 


(3) Pour (3) Même calcul que pour (1). 


(4) Pour (4) Puisque les deux membres de légalité à prouver sont positifs, il est suffisant de 
prouver l'égalité des carrés (lemme 10.94). Nous avons 


22 = (a+ bi)(a’ + b'i) = aa’ — bb! + i(ab' + ba’), (10.110) 
donc 


10.111a 
10.111b 
10.111c 
10.111d 


aa — bb’)? + (ab! + ba’)? 

aa’)? + (bb')? — 2aa/bb° + (ab')? + (ba! )? + 2ab'ba! 
(a) + D da) 

2+b)(a? +07). 


lé = ( ) 
= ( ) 
= à ( ) 
= (a ( ) 
D'autre part, 


(14121)? = 122122 = (a? + 02)(a2 + 2). FORTE 


(5) Pour (5) En utilisant la formule (10.106) pour z/z, nous avons : 


l2+2P=(2+2)(3+7)=27+27 +224 72 = | +172 +2Re(z7). (10.113) 


(6) Pour (8) En plusieurs points. 


(6a) L’inégalité Par croissance de la fonction racine carrée nous avons, en posant z — 
a + bi : 


[Re(z)| = la] = ai < Via + be =14. RATS) 


(6b) Égalité dans un sens Si |Re(z)| = |z|, alors toutes les inégalités dans (10.114) sont 
des égalités. En particulier 


Vial = {af + ef. (10.115) 


Par stricte croissance de la fonction racine carré, nous déduisons que |b[? = 0 et donc 
que b = 0. 


(6c) Égalité dans l’autre sens Size R, alors Re(z) = z, et nous avons légalité. 
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(7) Pour (6) Nous posons 21 = ai + bii et 22 = a2 + bai. Ensuite nous calculons, en utilisant 
(10.112) : 


(al + 121)° = a + [20/7 + 2a1ll20l = a? + 62 + a + 0 + 2/(a? + b?)(a3 + b2). (10.116) 


et 
[21 + 2/? — [ar + a)? + i(b1 + b2)|? (10.117a) 
— (ai + a2)? + (b1 + b2)? (10.117b) 
= af + a2 + 2a1a2 + b£ + b2 + 2b1b2. (10.117c) 


En faisant la différence, 


(ll + |2l)° —_ [21 + 2[? = 2/(a? + b?)(a3 + bà) = 2(aja2 + b1b2). (10.118) 


Pour prouver que cette différence est positive, nous comparons les carrés des deux termes : 


A = (af + b?)(a + bà) (10.119a) 
B = (ajaz + b1b2)°. (10.119b) 
Nous avons : 
A = a?a2 + a2b2 + bai + b?bè (10.120) 
et 
B = a?a2 + bŸbè + 2aa2bibo. (10.121) 


Et un petit calcul montre enfin que 


A-—B = aïbi + be — 2a1a2b1b2 = (a1b2 . b1a2)? > (0. (10.122) 
LEMooNIXZooDxfpNM 

Lemme 10.98. 
Soient des réels strictement positifs a;; et des complexes 2; e € tels que pour tout j = 1,...,n nous 


ayons 
nm 
D ailzil = | D œyzl. (10.123) 
1=1 à 


Alors les z; sont colinéaires au sens où il existe des nombres réels positifs s; et un 20 € © tels que 
Zi — Si20- 

LEMooXJBJooFDmhnV 
Lemme 10.99. 
Si deux nombres complexes a,b e C vérifient ab € IR, alors nous sommes dans un des deux cas 
suivants : 


— b=0 
— il existe ÀE R tel que a = Xb. 


De façon équivalente, il existe a, 8 € R non tous deux nuls tels que aa + Bb = 0. 


Démonstration. Nous écrivons a = a + ia2 et b = b1 + ib2 avec a;, b; € R. Nous supposons b # 0. 
Nous effectuons la multiplication ab = (a1 + ia2)(b1 — ib2) et nous annulons la partie imaginaire : 


a2b1 — a10 = (0. (10.124) 


Si bi = 0 alors a1b2 = 0 avec b2 Æ 0, ce qui implique a; = 0. Donc a = ia2, b = ibs. Résultat 
obtenu. 
Si b1 £ 0 alors 
a102 


nu) (10.125) 
bi 
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et nous avons alors : 
a = —b. (10.126) 
bi 
Mission accomplie. 
Nous prouvons à présent la formulation équivalente. Si b = 0 il suffit de prendre & = 0. Si 
a = Àb il faut prendre a = B/À. 
Dans l’autre sens, si à £ 0 alors a = —(B/a)b et si à = 0 alors B Æ 0 et il reste b = 0. 
PROPooZJAXooYwSSvo 


Proposition 10.100. 
La paire (C,|.|) est un espace vectoriel normé*?. 


Démonstration. Nous devons prouver les différents points de la définition 7.149. 
(1) |z| > 0 parce que la racine carrée prend ses valeurs dans R*. 


(2) Si [2] = 0, alors, en notant z = a + bi nous avons a? + b? = 0. Cela implique a = b = 0 (vous 
pouvez soit invoquer le lemme 1.417, soit ne rien dire et faire comme si c'était évident). 


(3) Si ER, alors (Àz)(Àz) = X2zz et nous avons 
[x] = VX222 = [AV 22 = A]f2|. (10.127) 


(4) L'inégalité |x + y| < [x] + |y| est la proposition 10.97(7). 


PROPooXLARooYSDCsF 
Proposition 10.101. 
Si z1 et z2 sont des nombres complexes, alors 


[212 = [2112]. (10.128) 


"2 |. EooATTRoppp{86s 


Démonstration. D'abord (a + bi)(c + di) = ac — db + (ad + bc)i, de telle sorte que 
[(a + bi)(c + di)? = (ac — bd)? + (ad + bc)°. (10.130) 


Nous avons aussi, pour tout n € N, 
|z 


Mais en calculant d'autre part [a + bil?|c + di[?, nous tombons sur la même valeur. 


Une simple récurrence permet de conclure que |z°| = |2}7. 


Voilà. Vous êtes déjà content d'apprendre que l’on peut démontrer |z”°| = |z|"° sans faire appel 


à la forme trigonométrique des nombres complexes. 
LEMooONLNooXLNbtB 


Lemme 10.102. 
Pour tout ze © nous avons 2z = 2z = |2/?. 


10.5.5 Théorème de Perron-Frobenius 


Définition 10.103. 
Pour une matrice carrée T, nous notons T > 0 siT;; > 0 pour tout à et j. Dans ce cas nous disons 
que T est positive. 


Une matrice carré positive est primitive si il existe un entier k > 0 tel que T* > 0. 
DEFooRFQCooQrLPVw 


Définition 10.104. 
Si T' est une matrice n x n et si x € IR", nous notons 


1) He, (10.131) 
ij 
Et nous disons que x € R" est un vecteur propre à gauche pour la valeur propre à gauche À e Ü 
si xT = Àt. 
42. Définition d’une norme : 7.149. 
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THOooRSP JooMCFeeP 
Théorème 10.105 (Perron-Frobenius[313]). 
Soit une matrice positive et primitive T. Il existe une valeur propre p telle que 
(1) p>0, 
(2) La matrice T a des vecteurs propres strictement positifs à gauche et à droite pour la valeur 
propre p. 
(3) Pour toute valeur propre À Æ p nous avons p > |A] 


(4) Les espaces propres à gauche et à droite de T pour la valeur propre p sont de dimension 1. 


Démonstration. Nous divisons la preuve en trois parties. La première va tout démontrer pour les 
vecteurs propres à gauche, la seconde fera la même chose pour les vecteurs propre à droite, et la 
troisième fera la synthèse. 


— À gauche — 


Soit D = {x e R” tel que x £ 0,x > 0}. Nous considérons l’application 


r: DR 
; 10.132 
Tr min GT); 
J Tj 


où la fraction vaut 00 si x; = 0. 


(1) r est majorée supérieurement Pour chaque j (y compris ceux pour qui x; = 0) nous 


avons l'inégalité suivante dans R : 
mr(e) SET); (10.133) 


En multipliant par e; et en faisant la somme, r(x)x < xT. Nous posons u = Ÿ,e; et nous 
prenons le produit scalaire : 


B 
ra al =: TE ee RRSoPTE TEA ) 
En posant K = max; ÿ;;T;; nous avons Tu < Ku parce que 
(Tu)e = D Tu =) Tu < K = (Kuk. (10.135) 
l BA l 


Pour tout x € D nous avons r(x) < K. Nous utilisons ça pour continuer (10.134) : 
HD UT er ETS 0. (10.136) 


Vu que x > 0 et u > 0, nous avons x : u > 0 nous nous pouvons simplifier : r(x) < K pour 
tout x e D. 


(2) Une minoration Nous savons que T est une matrice positive et même primitive, de telle 


sorte que T n'ait aucune colonne nulle. Donc 


r(u min = min » T;; > 0. 10.137 
Qu) = min AU = mn DT (10.137) 
Nous avons donc 
r(u) > 0. (10.138) 
(3) Définition de p Nous posons 
p = supr(x). (10.139) 
xeD 


Vu que que nous avons déjà prouvé nous avons 0 < p < K. 
Notons que si À€ R, nous avons r(x) = r(\x), de telle sorte que 
p = sup r(x). (10.140) 


xeD 
Iæ|<1 
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(4) Un compact En posant 


D'=(DnB(0,1))\B(0,e) (10.141) 


avec € < 1, nous avons r(D') = r(D) parce que r(x) = r(\x). La partie D’ est évidemment 
bornée. 


Vu que D et B(0,1) sont fermés, l'intersection est fermée (lemme 7.6(1)). La différence entre 
un fermé et un ouvert est fermée (lemme 7.7). Donc D’ est fermé. Le théorème de Borel- 
Lebesgue 10.24 nous dit alors que D’ est compact. 


(5) r est continue Sur D’, chacune des applications x + (xT);/x; est continue. Donc le 
minimum est continu et r: D’ — R est une application continue sur un compact. 


(6) v et p Le théorème de Weierstrass 7.138 nous indique que r est bornée et atteint ses bornes 
sur D’. Il existe v € D’ tel que r(v) > r(x) pour tout x € D’. Vu que par définition 


p = sup r(x) = sup r(x), (10.142) 
xeD xeD' 
Ixl<1 
nous avons en fait r(v) = p. 
. : ITEMo9BKGPooQDQWak ; : _—— . 
(7) Un mini sous-résultat Nous RAT OM LU sous-résultat qui sera utilisé quelques fois 


dans la suite. Si x € R” vérifie x > 0 et (xT'); > px; pour tout j, alors 
(7a) xT = px, c’est-à-dire que x est un vecteur propre à gauche de T. 
(Th) &> 0. 


Par hypothèse du théorème, il existe k > 0 tel que T* > 0. Nous posons y = 1%. Alors, si 
xT — px Z 0Ü nous avons 
YT — py = (aT — px)T* > 0. (10.143) 


La dernière inégalité est parce que xT — px > 0 et T* > 0. En développant, cette inégalité 
signifie que pour tout 7, 
Du > pu: (10.144) 
i 


ou encore que p < pour tout j. En particulier pour le j qui réalise le minimum, 


D YiTi 
y 
p < r(y), ce qui contredit ma maximalité de p. Nous en déduisons que xT — px = 0. 
À partir de là, nous déduisons que x > 0. En effet, en appliquant k fois légalité xT = pr, 
nous avons æT* = px. Comme x >0et T* > 0, nous avons xTE > 0. Vu que p Æ OÙ nous en 
déduisons que x > 0. 

(8) v et p, suite Nous avons r(v) = p. En particulier pour tout j nous avons pu; < D, wiTi;. 
Et comme v € D' nous avons aussi v > 0. En vertu de notre sous-résultat, nous déduisons 
que v est un vecteur propre à gauche de T': vuT' = pv, et que v > 0. 

Cela prouve que T a un vecteur propre à gauche strictement positif. 


(9) Le plus grand Nous prouvons que pour toute valeur propre À € ©, nous avons p > |À|. 
Soit une valeur propre À € C. Vu que le spectre « à gauche » et le spectre « à droite » sont 
identiques , T' possède un vecteur propre à gauche : xT = \x. Pour chaque j nous avons 


D Hri= he (10.145) 
À 


et en passant au module, [Ax;| < |x:|T;;. En posant y = Ÿ; |xile; nous avons y > 0 et 


Aus < D yiT, (10.146) 
À 
et donc . 
ji < DE (10.147) 
5 1} 


43. Lemme 9.86. 
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En passant au minimum sur j, cela donne |À| < r(y) < p. 


Nous avons montré que |A] < p. Nous prouvons à présent que |À| Æ p en supposant que 
[A] = p. Toujours en posant y; = |x;|, nous avons 


Pyj < te = (yT);. (10.148) 
À 


Le sous-résultat (7) nous indique qu’alors y est un vecteur propre à gauche de T pour la 
valeur propre p : yT'= pu. En itérant et en déballant, pour chaque j nous avons 


D ilTÉ = px]. FAO 0T da0) 
î 


En faisant de même à partir de xT* = XFx, nous trouvons 


DENT nt 0 


Vu que |A] = p, nous pouvons égaliser les membres de droite de (10.149) et (10.150) : 


Dirt = D mTÉ|. (10.151) 
i 


t 
Le lemme 10.98 nous indique que les x; sont colinéaires (dans C), c’est-à-dire qu’il existe des 
réels 5; > 0 et z0 € © tels que x; = 5;z0 pour tout i. 
En utilisant ce fait dans l'équation xT = Àx, nous trouvons 1:15; = À; et 


D Ts _ Às. ROME TE) 


Cela prouve que À est réel et positif parce que l’équation (10.152) est valable pour tout j 
et qu'il y en a bien un pour lequel s; # 0. Le nombre réel positif À vérifiant |A] = p, nous 
déduisons que À = p. 


(10) Espace propre de dimension 1 Nous avons déjà la vecteur propre v : vT = pv. Consi- 


dérons un second vecteur propre à gauche y # 0 : yT' = py. Supposons que y et v ne sont 
pas colinéaires et voyons les fonctions 


mm: R—R 


AS (10.153) 


Pour tout à nous avons 7,(0) = v; > 0. Supposons pour fixer les idées qu’au moins un des y; 
est positif. Alors pour chaque à, il existe un c; > 0 tel que v; — cy; = 0. Nous prenons pour 
valeur de c le plus petit de ceux-là. Nous avons donc 


n=v-—cy2> 0, (10.154) 


alors qu’au moins une des composantes de 7 est nulle. Et en plus 77° = pn. Notre sous-résultat 
préféré nous dit qu’alors 7 > 0. Ah tiens, ça c’est une contradiction. Nous en déduisons que 
v et y sont colinéaires dans IR”. 


Nous avons terminé de prouver tout ce que nous devions faire « à gauche ». 
À droite 
En reprenant exactement les mêmes étapes #, nous prouvons qu’il existe une valeur propre à droite 
p' telle que 
(1) p°>0 


(2) p' a des vecteurs propres strictement positifs à droite. 


44. Je n'ai pas vérifié; écrivez-moi si cela pose problème. 
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(3) p' > |A] pour toute valeur propre À # p/. 
(4) L'espace propre à droite pour la valeur propre p' est de dimension 1. 
Conclusion 
Les nombres réels strictement positifs 9 et p' sont des valeurs propres. Si p # p', alors les propriétés 


de p disent que p > pl. De même les propriétés de p’ disent que p’ > p. Bref p = p'. 
Le nombre p vérifie toutes les propriétés du théorème. 


10.6 Norme à partir d’un produit scalaire 

PROPooJLWSooNicxQV 
Proposition 10.106 ([1]). 
Soit un espace vectoriel complexe E muni d’une forme sesquilinéaire <.,.» telle que la forme qua- 
dratique réelle x + {x,x) soit définite positive. La formule * 


ll = Va POP LUS) 


est une norme sur E. 
DEFooGUXNooXwCsrq 


Définition 10.107. 
Dans le cas de C”, nous considérons toujours la norme associée à la forme (9.345) par la propo- 
sition 10.106, c’est-à-dire, pour rappel : 


nm 
Qu) = D axe, (10.156) 
k=1 


et 
Ix| = 4/<x,æ) (10.157) 


pour tout x € C?. 


10.6.1 Continuité de la racine carrée, invitation à la topologie induite 


Pourquoi nous intéresser particulièrement à la fonction racine carrée ? Parce qu’elle à une sale 
condition d'existence : son domaine de définition n’est pas ouvert. Or dans tous les théorèmes de 
continuité d'approche topologique que nous avons vus, nous avons donné des conditions pour tout 
ouvert. Nous nous attendons donc à avoir des difficultés avec la continuité de 4/x en zéro. 

Prenons 1, n'importe quel intervalle ouvert dans R*, et voyons que la fonction 


f:R'-R? 
ze x 


est continue sur /. Remarquons déjà que si Z est un ouvert dans R*, il ne peut pas contenir zéro. 
Avant de nous lancer dans notre propos, nous prouvons un lemme qui fera tout le travail 47. 


(10.158) 


Lemme 10.108. 
Soit O, un ouvert dans R*. Alors O? = {x? tel que x € O} est également ouvert. 


Démonstration. Un élément de ©? s'écrit sous la forme x? pour un certain x e ©. Le but est de 
trouver un ouvert autour de +? qui soit contenu dans ©?. Étant donné que © est ouvert, on a une 
boule centrée en x contenue dans ©. Nous appelons 6 le rayon de cette boule : 


B(x,6) € O. 


45. Pour la racine carrée, définition 10.92. 
46. La racine carrée est définie en 10.92. 
47. C’est toujours ingrat d’être un lemme : on fait tout le travail et c’est toujours le théorème qui est nommé. 
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Étant donné que cet ensemble est connexe, nous savons par le lemme 7.209 que B(x,6)? est 
également connexe (parce que la fonction x ++ x? est continue). Son plus grand élément est 
(x + 6)? = x? + 62 + 2x6 > x? + 62, et son plus petit élément est (x — 6)? = x? + 6? — 2x6. 

Ce qui serait pas mal, c’est que ces deux bornes entourent x? ; de cette façon elles définiraient 
un ouvert autour de x? qui soit dans ©?. Hélas, c’est pas gagné que x? + 6? — 2x6 soit plus petit 
que æ?. 

Heureusement, en fait c’est vrai, parce que d’une part, comme © € R*,ona x > 0, et d’autre 


part, pour que © soit positif, il faut que Ô < x. Donc on a évidemment 0 < 2x, et donc 
x? + 87 — 2x0 = x? + 6 (8 — 2x) < r?. 
en, — 
<0 
Et nous en avons fini : l’ensemble 
B(x, 6)? =]x? + 62 — 2x6, x? + 6? + 2r6[c O? 


est un intervalle qui contient x?, et donc qui contient une boule ouverte centrée en x°. 


Maintenant nous pouvons nous attaquer à la continuité de la racine carrée sur tout ouvert 
positif en utilisant le théorème 10.88. 


Proposition 10.109. 
L'application 
f: [0,0[ — R 


ee (10.159) 


est continue. 


Démonstration. Soit un ouvert © de R. Il existe un r > 0 tel que B(y,r) € ©. Nous allons 
restreindre plus fortement r plus tard. Soit x € f (©); nous allons prouver que B(x,e) n [0, [ € 
f7!(O) pour un € assez petit. Le théorème 7.8 dira alors que f (©) est ouvert. 

Nous notons y = f(x). Par croissance de la fonction racine carrée, nous avons 


/(B(, 9) re vrrdl. (10.160) 


Pour avoir f (8 (x, 9) € ©, nous devons avoir 


Vr—-e>y-r (10.161a) 
VT+E<y+T. (10.161b) 


La première condition donne x — € > (y — r)?. En développant le carré et en tenant compte de 
y? = x nous demandons 


e < 2ry— r?. (10.162) 


Nos choix sont donc de demander 0 < r < 2y, et ensuite 0 < € < 2ry— r?. Le premier est fait pour 
avoir 2ry — r? > 0. 


10.6.2 Second degré 


Nous résolvons à présent le polynôme du second degré. 
PROPooËZIKooKjJroH 


Proposition 10.110 ([314]). 
Soit la fonction 
J:R—-R 


; (10.163) 
zx ar +bxr+c 


avec a £ 0. Nous notons À = b? — 4ac. 
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ITEMooMKUSooWwNTba 
(1) Nous avons la formule 

b De EQooFKPO Ê 
f(x) = a(x + CT Lo. du PÉD TEA 
4 dl ITEMooHQTBooZuaPAs 
(2) Si a > 0, alors f a un minimum global en ïm = —b/2a. ITEMooQMXVooWsqiXz 
(3) Si a <0, alors f a un maximum global en xy = —b/2a. ITEMooMAMHOONWZVQI 
(4) Si À <0 alors f ne possède pas de racine réelle. LTEMooKUUJooTsIHhI 
(5) Si A = 0, alors f possède une unique racine xo = —b/2a. ITEMooQZGFooEGHMkX 


(6) Si À > 0 alors f possède exactement deux racines distinctes données par 


= = EQooGHDPooV 
_=b+vVA , _-b-vA 10465) 


24 : 2a 


T1 


Démonstration. En plusieurs parties. 


(1) Pour (1) C’est un calcul immédiat. 


(2) Pour (2) Nous partons de la a du point (1). Puisque c — È est constant, minimiser 
J revient à minimiser æ + (x + à) . Comme cette dernière fonction est toujours positive, 
elle a un minimum global là où elle est nulle, c’est-à-dire en zy, = —b/2a. 


(3) Pour (3) Idem que pour (2). 
Pour la suite nous effectuons quelques manipulations à partir de (10.164). Nous avons f(x) = 0 
lorsque 


2 _ 
2. __b = EQooRHNGo Fr 


(1) Pour (4) À gauche de (10.166) nous avons un nombre toujours positif ou nul. À droite, 


4a? > 0. Donc si b? — 4ac < 0, l'égalité est impossible et il n’y a pas de x vérifiant f(x) = O. 
(2) Pour (5) Si b? — 4ac = 0, alors la condition (10.166) devient 


b 2 
(: ” =) _ 0, (10.167) 


et donc x = —b/2a est l’unique solution. 


(3) Pour (6) Sib?—4ac > 0, nous pouvons prendre la racine carré des deux côtés de (10.166), 
et la condition devient 


b b? — 4ac 
— + 10.1 
+ + 12 (10.168) 
ce qui donne 
—_b + 4/p2 — 
Pa (10.169) 
2a 
Ce sont là les deux seuls candidats pour vérifier f(x) = 0. 
Un calcul direct montre que 
—b + V0? —4 
Al 2 «) 0 (10.170) 
2a 
et que 
SU ET 
il : æ) = (10.171) 


Donc ce sont bien des racines de f et ce sont les seules. Notez aussi qu’elles sont distinctes 
parce que À Æ 0. 


48. Définition 10.92. 


Chapitre 11 


Espaces vectoriels normés 


Plusieurs notions sur les espaces vectoriels normés (dont la définition 7.149) ont déjà été abor- 
dées dans la section 7.14. Voir aussi le thème 25. 


11.0.1 Norme, produit scalaire et Cauchy-Schwarz (cas réel) 


Dans la suite, le produit scalaire de x et y pourra être noté indifféremment par x : y, {x, y) ou 
b(x, y) lorsque une forme bilinéaire est donnée. 

Nous rappelons au passage que les espaces vectoriels réels sont susceptibles de recevoir un 
produit scalaire, alors que les espaces vectoriels complexes sont susceptibles de recevoir un produit 
hermitien. Bien que de nombreux résultats soient identiques ou très similaires, ces deux notions 
sont à ne pas confondre. 

Nous commençons par prouver qu’un produit scalaire étant donné, nous pouvons définir une 


norme par la formule |x|? = {x, x). Pour cela nous aurons besoin de l'inégalité de Cauchy-Schwarz. 
ThoAYfEHG 


Théorème 11.1 (Inégalité de Cauchy-Schwarz, cas réel). 
Soit un espace vectoriel réel E muni d’un produit scalaire! (x, y) > x : y. Nous posons 


Lx] = Va x. (11.1) 


2 


Alors : 
1) Il l’inégalité 
( ) HER PROS 
le: yl < Ixllyl:. 112) 
pour tout x,y € E. 
(2) I y a égalité |x + y| = Ix]lyl. si et seulement si x et y sont multiples l’un de l’autre. 


(3) L'opération |.| est une norme*. 


(4) Cette norme vérifie l'identité du parallélogramme : 


EqYCLt 
le — y? + fe + y? = 2|ef? + 2lyf2. HT8) 


Démonstration. Étant donné que les deux membres de l’inéquation sont positifs, nous allons tra- 
vailler en passant au carré afin d'éviter les racines carrés dans le second membre. 
Nous considérons l’application 
P:R—Rt 


(114) 
te x +tyl, 


1. Produit scalaire, définition 9.164. 

2. Attention à la notation : pour l’instant nous ne savons pas que c’est une norme; c’est justement un des points 
de ce théorème. Par ailleurs, la racine carrée est définie par 10.92. 

3. Définition 7.149. 
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et nous calculons un peu : 


0 < |r + ty|? (11.5a) 
= (x +ty) : (x +ty) (11.5b) 
=gc+e-ty+ty c+Ëy y (11.5c) 
= |y#e + 2x + y)t + fx. (11.54) 


Nous avons utilisé la bilinéarité (pour sortir les t) et la symétrique du produit scalaire. 

Nous voyons que P est un polynôme du second degré en t à valeurs dans [0,001[. Par la pro- 
position 10.110 nous en déduisons que le fameux b? — 4ac doit être négatif ou nul. Nous avons 
donc 


A =A4(x : y) —4xf°|yl? < 0, (11.6) 

ce qui donne immédiatement 
(x - y) < fx lyf. (11.7) 
En ce qui concerne le cas d'égalité, si nous avons x : y = |x||y|, alors le discriminant A 


ci-dessus est nul et le polynôme P admet une racine double to. Pour cette valeur nous avons 
P(to) = |x + toy| = 0, (11.8) 


ce qui implique x + toy = 0 et donc que x et y sont liés. 


(1) C’est une norme Nous allons nous contenter de prouver l'inégalité triangulaire. Si x, y € 
E, nous avons 


le + | = Ve + Tu + 2x - y (11.9a) 
SUBEQooRISGooRU ] 
< Vel? + ul? + 2x * y AP) 
SUBEQooPQPYoo 
< Vel + [ul + 2[ellul CPE) 
2 
= (ll + lyl) (11.94) 
= |el + |yl. (11.9e) 


Justifications. 
— Pour (11.9b). La fonction racine carrée est croissante, lemme 10.94. 
— Pour (11.9c). Inégalité de Cauchy-Schwarz 11.1. 


(2) Inégalité du parallélogramme Cette assertion est seulement un calcul : 


le — {7 + le + gl? = (x — 9) * (y) + (x +9 : (+) 
=T TT T° Y Y°LT+Y:Y 
+HT'T+T Y+Y T+Y'Y (11.10) 
= 2x T+2y: y 
= 2|x|° + 2|yl°. 


Toute norme dérivant d’un produit scalaire vérifie l'identité du parallélogramme. Ce résultat 
sert souvent à prouver que des normes ne dérivent pas d’un produit scalaire. C’est le cas de la 
norme N(x,y) = |x| + |y| du lemme 11.12 ainsi que du théorème de Weinersmith 27.45. 

PROPooVSVMooZrqxdc 
Proposition 11.2. 
La norme euclidienne* a les propriétés suivantes : 


4. Un espace euclidien est un espace vectoriel muni d’un produit scalaire, définition 9.168. Ici nous considérons 
la norme associée par le théorème 11.1. 
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(1) Pour tout vecteur x et réel X, 
lAæ| = TAx] (11.11) 


(2) Pour tout vecteurs x et y, 
I + ul < Ix + lvl (11.12) 


Démonstration. Un produit scalaire est en particulier une forme bilinéaire, et vérifie les conditions 
de la définition 9.122. 
Pour le premier point nous avons 


[x = 4/07) - (x) = VXz : x = JAI]. (11.13) 


Nous avons utilisé la formule du lemme 10.93(2). 
Pour le second point, nous avons les inégalités suivantes : 


le + y? = el? + ul + 2x : y (11.14a) 
< ||? + y? + 2x + y (11.14b) 

2 
< |el° + ul? +2lællgl = (el + lu) (11.14c) 


Nous avons utilisé d’abord la majoration |x| > x qui est évidente pour tout nombre x; et ensuite 
l’inégalité de Cauchy-Schwarz 11.1. 


DEFooJAGXooMgaUsR 
Définition 11.3 (Norme sur R”). 
Sauf mention du contraire, nous considérons toujours sur R" la norme (et donc la topologie) 
associée au produit scalaire de la proposition 9.169 par le théorème 11.1, c’est à dire 


le] = DE | (11.15) 


PropHIW;jdMXx 
Proposition 11.4 ([315]). 
Soit b une forme bilinéaire et symétrique. Alors 


(1) ker(b) € C{(b) (cône d'’isotropie, définition 9.1/1) 
(2) si b est positive alors ker(b) = C(b). 
Démonstration. En deux parties. 


(1) Si z € ker(b) alors pour tout y € E nous avons b(z,y) = 0. En particulier pour y = z nous 
avons b(z,z) = 0 et donc z € C(b). 


(2) Soit b positive et x € C(b). Par l'inégalité de Cauchy-Schwarz (proposition 11.1) nous avons 
lb(x, y)| < 4/b(x,x)b(y, y) = 0. (11.16) 


Donc pour tout y nous avons b(x,y) = 0. 


LEMooEZFIooXyYybe 
Lemme 11.5. 


Soit un espace vectoriel euclidien® E. Si {e;}i=1,..n est une base orthonormée de E et si f: E— E 
est un endomorphisme, alors 


det(f) = > « ATK e L 


CESn 


5. C'est-à-dire qu’il possède un produit scalaire, voir la définition 9.168. 
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Démonstration. Nous utilisons la définition 9.12 du déterminant d’un endomorphisme det(f) = 
detg (f(B)) en prenant la liste des vecteurs {e;} comme B. En l’occurrence, le i° vecteur de la 
famille f(B) est f(e;). 

Puisque la base est orthonormée, nous avons eX(v) = <ez,w) et donc aussi 


etytui) = ect): Fei)). (11.18) 


Et si vous avez tout suivi, vous aurez remarqué que les produits scalaires impliqués dans la 
formule (11.17) sont les éléments de la matrice de f dans la base {e;} parce que <e;, f(e;)) est la 
composante + de l’image de e; par f. Si la matrice est composée en mettant en colonne les images 
des vecteurs de base, le compte est bon. 


11.1 Théorème spectral autoadjoint 

ThoRSBahHH 
Théorème 11.6 (Théorème spectral autoadjoint). 
Un endomorphisme autoadjoint d’un espace euclidien 


(1) est diagonalisable dans une base orthonormée, 


(2) a son spectre réel. 


Démonstration. Nous procédons par récurrence sur la dimension de FE, et nous commençons par 
n = 15. Soit donc f: E — E avec (f(x), y) = (x, f(y)). Étant donné que f est également linéaire, 
il existe À € R tel que f(x) = Àx pour tout x € E. Tous les vecteurs de Æ sont donc vecteurs 
propres de f. 

Passons à la récurrence. Nous considérons dim(Æ) = n +1 et f € S(E). Nous considérons la 
forme bilinéaire symétrique ®; et la forme quadratique associée @7. Pour rappel, 


Dr(x,y) = €x, f(y)) (11.19a) 
Pr(x) = Py(x, x). (11.19b) 


Et nous allons laisser tomber les indices f pour noter simplement ® et 6. Étant donné que B (0,1) 
est compacte et que @ est continue, il existe x0 € B(0, 1) tel que 


À = (ro) = sup _d(r). (11.20) 
xeB(0,1) 


Notons aussi que |xo] = 1 : le maximum est pris sur le bord. Nous posons 


g=AÏd=F (11.21) 


ainsi que 
Pi(x, y) = (x, g(y)). (11.22) 


C’est une forme bilinéaire et symétrique parce que 


P1(y,x) = (y, g(x)) = <g(y),x) = x, g(y)) = P1(x, y) (11.23) 


où nous avons utilisé le fait que g était autoadjoint et la symétrie du produit scalaire. De plus ®;: 
est semi-définie positive parce que 


D1(x,r) = x, Àx — f(x)) = Ax|? — d(x). (11.24) 


6. Dans [103], l’auteur commence avec n = 0 mais moi je n’en ai pas le courage. 
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Puisque À est le maximum, nous avons tout de suite D1(x) > 0 tant que [x] = 1. Et si x n’est 
pas de norme 1, c’est le même prix parce qu’on se ramène à |x| = 1 en multipliant par un nombre 
positif. Attention cependant : 


&1(œ0, ro) = Afxo|” — d(xo) = 0. (11.25) 


Donc ®; a un noyau contenant x par la proposition 11.4. Nous en déduisons que Image(g) #4 E 
en effet, to € Image(g)+, mais nous avons la proposition 4.133 sur les dimensions : 


dim E = dim(Image(g)) + dim(Image(g)+). (11.26) 


Comme Image(g)+ est un espace vectoriel non réduit à {0}, la dimension de Image(g) ne peut pas 
être celle de Æ. L’endomorphisme g n'étant pas surjectif, il ne peut pas être injectif non plus parce 
que nous sommes en dimension finie; il existe donc e1 € E tel que g(e1) = 0 et tant qu’à faire nous 
choisissons |e1| = 1 (ici la norme est bien celle de l’espace euclidien considéré). Par définition, 


f(e1) = Ae, (11.27) 


c'est-à-dire que À € Spec(f). Et @ étant une forme quadratique réelle nous avons À € R. 
Nous posons à présent H = Span{e}-. C’est un sous-espace stable par f parce que si x € H 
alors 


(er, f(æ)) = Cf(e1),x) = Xe1,x) = 0. (11.28) 


Nous pouvons donc considérer la restriction de f à H : fx: H — H. Cet endomorphisme est 
bilinéaire et symétrique sur l’espace H de dimension inférieure à celle de Æ, donc la récurrence 
nous donne une base orthonormée 

{e2,..., En} (11.29) 


de vecteurs propres de fx. De plus les valeurs propres sont réelles, toujours par récurrence. Donc 
Spec(f) = {A} L Spec(fx) € R. (11.30) 

Notons pour être complet que si 4 > 2 alors 
e1,e;) = 0 (11.31) 


parce que le vecteur e; est par construction choisi dans l’espace H = e+. Nous avons donc bien 
une base orthonormée de Æ construite sur des vecteurs propres de f. 


CorSMHpoVKk 
Corolaire 11.7. 
Soit E un espace vectoriel ainsi que des formes bilinéaires D et d sur E. Si est définie positive, 
alors il existe une base d-orthonormale dans laquelle est diagonale. 


Démonstration. Il suffit de considérer l’espace euclidien Æ muni du produit scalaire {x,y) = 
Y(x, y). Ensuite nous diagonalisons la matrice (symétrique) de @ pour ce produit scalaire à l’aide 
du théorème 11.6. 


DefNormeEucleApp 
Définition 11.8. 
La norme euclidienne d'un élément de R" est définie par |u| = Vu - u”. 


Cette définition est motivée par le fait que le produit scalaire u + u donne exactement la norme 
usuelle donnée par le théorème de Pythagore : 


mm mm 
uou= du) = ui +ui+...+ur. (11.32) 
i=1 i=1 


Le fait que e; : e; = à;; signifie que la base canonique est orthonormée, c’est-à-dire que les 
vecteurs de la base canonique sont orthogonaux deux à deux et qu'ils ont tout 1 comme norme. 


7. La racine carrée est définie en 10.92. 
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LemSciNormexi 
Lemme 11.9. 
Pour tout ue R”°, il existe un £ € R"" tel que |u| = £ : u et |£] = 1. 
Démonstration. Vérifions que le vecteur £ = u/|u| ait les propriétés requises. D'abord |£| = 1 
parce que u : u = |u|?. Ensuite 
u:u _ [ul” 
RE = = [u||. (11.33) 
lul lu] 


11.1.1 Inégalité de Minkowski 


Ce qui est couramment nommé « inégalité de Minkowski » est la proposition 27.38 dans les 


espaces L?. Nous allons en donner ici un cas très particulier. 
PropACHooLtsMUL 


Proposition 11.10. 
Si q est une forme quadratique® sur R° et si x,y e R° alors 


V'a(x + y) < Va(x) + V/a(y). (11.34) 


Démonstration. La proposition 9.249 nous permet de « diagonaliser » la forme quadratique q. 
Quitte à ne plus avoir une base orthonormale, nous pouvons renormaliser les vecteurs de base pour 
avoir 


q(x) = Dirt (11.35) 


Le résultat n’est donc rien d’autre que l’inégalité triangulaire pour la norme euclidienne usuelle, 
laquelle est démontrée dans le théorème 11.1. 


11.11. 

Un produit scalaire fournit donc toujours une norme et donc une topologie. Il ne faudrait cependant 
pas croire que toute norme dérive d’un produit scalaire, même pas en dimension finie. Et ce, malgré 
l’équivalence de toutes les normes du théorème 11.46 dont vous avez déjà peut-être entendu parler. 


L'intérêt du lemme suivant sera apparent en 11.48. 
LEMooRWJYooUIJkZc 


Lemme 11.12. 
Sur R?, l'application N(x, y) = |x| +|yl est une norme” qui ne dérive pas d’un produit scalaire !°. 


Démonstration. Nous commençons par montrer que N est une norme. Il faut vérifier les trois 
conditions de la définition 7.149. 
(1) Il faut utiliser le lemme 1.371(1) dans les deux sens. Si (x,y) = (0,0), alors évidemment 
N(x,y) = 0. Dans l’autre sens, si N(x,y) = 0 nous avons 
O= [x] + [y] > |xl. (11.36) 
Donc |x| < 0, mais comme |x| > 0, nous avons |x| = 0 et donc x = 0. Le même raisonnement 
tient pour y. 
(2) En tenant compte du fait que |Ax] = [A||x|, nous avons 
NO(&,y)) = N(x, y) = [Ar] + ANgl = Al + [gl) = AIN (x, 2). (11:37) 
8. Définition 9.123. 


9. Définition 7.149. 
10. La norme d’un produit scalaire est le théorème 11.1. 


H 


& 
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(3) Nous avons le calcul 


N{(x,y) + (a,b)) = N(x + a,y +b) (11.38a) 
= |&+a|+1]y+bl _ (38) 
< [el + lal + [ul + lb] = Ne, 9) + No bp ETES) 


Justification : pour (11.38c) nous avons utilisé |a + b| < |a| + |b|, du lemme 1.371. 
Pour voir qu’elle ne dérive pas d’un produit scalaire, nous montrons qu’elle ne vérifie pas l’identité 
du parallélogramme du théorème 11.1. 
Voici un petit bout de code qui nous permet de ne pas faire de recherches à la main : 


# Dans un cas réel, vous avez nettement intérêt à 


# créer une classe ?’Vecteur’ qui implémente somme, différence 


3l# et norme. 


def N(v): 
return abs( v[O] )+abs(v[1]) 


def parall(v,w): 
# La différence v-w 
d=( v[O]-w[0],v[1]-w[1] ) 
# La somme v+w 


s=( v[O]l+w[0],v[1]+w[1] ) 


return N(d)x*x2+N(s)xx2-2%xN(v) xx2-2%XN (uw) *x2 


tex/sage/sageSnip018.sage 


Il est vite vu qu'avec v = (—1,1) et w = (1,1), l'identité du parallélogramme n’est pas vérifiée. 


LemLPOHUme 
Lemme 11.13 ([103]). 
Soit V un espace vectoriel muni d’un produit scalaire |! et de la norme associée. Si x, y € V satisfont 
à ke + y| = |x] + |yl, alors il existe À > 0 tel que x = Ày. 


Démonstration. Quitte à raisonner avec x/|x| et y/|y|, nous supposons que |x| = |y| = 1. Dans 
ce cas l'hypothèse signifie que |x+y|? = 4. D'autre part en écrivant la norme en termes de produit 
scalaire, 

le + gl = lel? + ul + 2x9), (11:39) 


ce qui nous mène à affirmer que {x,y) = 1 = |x|]y|. Nous sommes donc dans le cas d'égalité 
de l'inégalité de Cauchy-Schwarz !?, ce qui nous donne un À tel que x = Ày. Étant donné que 
Ix| = ]y| = 1 nous avons obligatoirement À = +1, mais si À = —1 alors {x,y) = —1, ce qui est 
le contraire de ce qu’on a prétendu plus haut. Par souci de cohérence, nous allons donc croire que 
À= 1. 


PropVectsOrthLibres 
Proposition 11.14 ([316]). 
si V1, ,Ux sont des vecteurs non nuls, orthogonaux deux à deux, alors ces vecteurs forment une 
famille libre. 


/ é n ‘ a Re k 3 ä 
Démonstration. Soit une combinaison linéaire nulle des w; : ÿ};_, Av; = 0. Nous multiplions sca- 
lairement par V4 : 


O= D Av © ù = D Mômuif = Akloxl?. (11.40) 


Donc Àg = (0. 


11. Définition 9.164. 
12. Théorème 11.1. 


784 CHAPITRE 11. ESPACES VECTORIELS NORMÉS 


LEMooYXJZooWKRFRu 
Lemme 11.15. 
Une isométrie d’un espace euclidien fixe l’origine. 


Démonstration. Soit une isométrie f d’un espace euclidien : f(x) + f(y) = x : ypourtout x,ye E. 
En particulier pour + = 0 nous avons 


(0) : f(y) = 0 (11.41) 


pour tout y. Parce que f est une bijection, nous avons f(0) : x = 0 pour tout x. Comme le produit 
scalaire est non dégénéré !* cela implique que f(0) = 0. 


11.1.2 Cauchy-Schwarz etc. cas complexe 
THOooSUCBooFnpkaF 


Théorème 11.16 (Inégalité de Cauchy-Schwarz, cas complexe[317]). 
Soit un espace vectoriel complexe muni d’un produit hermitien <.,.». Alors pour tous vecteurs x, y 
nous avons 


Ge, y) < || (11.42) 
x| = V<x,æ). 


Démonstration. Si {x,y) = 0, le résultat est évident. Nous nous concentrons donc sur le cas où 
{x, y) Æ 0. Nous posons 


où nous avons posé 


__(æ,y) 
ne (11.43) 


C’est un élément de € de norme 1. Nous avons 


1 Gr, y)l 
(gT:9) (ay 


où le symbole « > » signifie « est réel et positif ». Nous posons x’ = x et nous considérons t € R. 
Remarquons que |x’|? = |x|? : 


Gæ,y) = |, y)| > 0 (11.44) 


1 
le = ea) = 2e, æ) = el” (11.45) 


parce que |0| = 1. 
En utilisant le fait que a, b) + (b,a) = Re(<a,b)) nous avons : 


0 < fa’ +tyf = [a]? + é<a', y) + Eu,» + ul? (11.46a) 
= y? + 2Re(<z’, yy}t + |x'|?. (11.46b) 


C’est un polynôme de degré 2 en t qui n’est jamais strictement négatif. Autrement dit, il a au 
maximum une seule racine, ce qui signifie que son discriminant est négatif ou nul : 


Re(Çz', y»)? — [ylx'|? < 0. (11.47) 
Mais nous avons choisi x’ de telle sorte que x’, y» = [{x,y)| e R et |x’|? = x]? ; nous avons donc 


Ke, < Ixl°lyl?, (11.48) 


comme il se devait. 


PROPooSSYJooHAXAnC 
Proposition 11.17 (Identité du parallélogramme[318]). 
Soit un espace vectoriel complexe E muni d’un produit hermitien <.,.». Nous posons |x| = 4/<x,x). 
Nous avons 


(1) |.| est une norme. 


13. Lemme 9.167. 
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(2) Elle vérifie l’identité du parallélogramme : 
le + 4? + x — y = 21xlÀ + 2lyl? (11.49) 
pour tout x,ye E. 


Démonstration. En ce qui concerne le fait que |.|] soit une norme, tout est essentiellement dans la 
définition 9.172 d’un produit hermitien. Voyons tout de même l’inégalité triangulaire. Nous avons : 


le + gl? = x + gx + y) (11.50a) 
= [27 + y? + x, y) + y, 2) (11.50b) 
= ka? + |y[? +2R(<x, y) (11.50c) 
< |x{? + |yl? +21R(<x, y) (11.50) 
< ||? + |yf? + 21<x, pl (11.50e) 
< [x 2 + y 2 + 2|x[|yl RCPAONESEEERE 
= (ll + ll)”: (11.508) 


Pour (11.50f) nous avons utilisé Cauchy-Schwarz 11.16. 


11.1.3 Diagonalisation : cas complexe, ce qu’on a 
LEMooVCEUoo!IXnTpp 


Lemme 11.18 (Théorème spectral hermitien). 
Nous considérons un espace vectoriel complexe hermitien. Pour un opérateur hermitien !*, 


(1) le spectre est réel, 


(2) deux vecteurs propres pour des valeurs propres distinctes sont orthogonaux |°. 


Démonstration. Soit v un vecteur de valeur propre À. Nous avons d’une part 
(Av, v} = Xu, v} = Xfu|?, (11.51) 
et d'autre part, en utilisant le fait que À est hermitien, 
(Av, v> = {v, Av) = {v, Avÿ = Xlv|?, (11.52) 


par conséquent À = À parce que v # 0. 
Soient À; et vu; (i = 1,2) deux valeurs propres de À avec leurs vecteurs propres correspondants. 
Alors d’une part 


{Av1, V2) = Avi, V2), (11,53) 
et d'autre part 
{Av1, va) = {v1, Av) = A Ur, U2). (11.54) 
Nous avons utilisé le fait que À2 était réel. Par conséquent, soit A1 = 2, soit (ui, v2) = 0. 
REMooMLBCooTuKFmz 


Remarque 11.19. 
Un opérateur de la forme A*A est évidemment hermitien. De plus ses valeurs propres sont toutes 
positives parce que si ÀA* Av = Àv alors 


0 < {Av, Av) = {A* Av, vu) = Av, v). (11.55) 


Donc À > 0. 


14. Définition 9.175. 
15. Pour la forme (9.345). 
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11.1.4 Projection et orthogonalité 


La définition du produit scalaire dans IR” est 9.169 et le lien avec la matrice d’une application 
linéaire est la proposition 9.180. 


Remarque 11.20. 

Outre l’orthogonalité, le produit scalaire permet de connaître l’angle entre deux vecteurs à tra- 
vers la définition 18.52. D’autres interprétations géométriques du déterminant sont listées dans le 
thème 44. 


Nous sommes maintenant en mesure de déterminer, pour deux vecteurs quelconques u et v, la 
projection orthogonale de u sur v. Ce sera le vecteur ü parallèle à v tel que u — ü est orthogonal à 
v. Nous avons donc 

ä = X (11.56) 


et 
(u — Àv) : vu =0. (11.57) 


La seconde équation donne u + vu — Av - vu = 0, ce qui fournit À en fonction de u et v : 


uv 
__.. (11.58) 
lv]? 
Nous avons par conséquent 
de (11.59) 
lvl? 


Armés de cette interprétation graphique du produit scalaire, nous comprenons pourquoi nous 
disons que deux vecteurs sont orthogonaux lorsque leur produit scalaire est nul. 

Nous pouvons maintenant savoir quel est le coefficient directeur d’une droite orthogonale à une 
droite donnée. En effet, supposons que la première droite soit parallèle au vecteur X et la seconde 
au vecteur Ÿ. Les droites seront perpendiculaires si X + Y = 0, c’est-à-dire si 


o : (u) = 0. (11.60) 


T1Y1 — —T2U2. Épuyokniess 


Le coefficient directeur de la première droite est #2. Isolons cette quantité dans l’équation (11.61) : 


Cette équation se développe en 


ne (11.62) 


T1 U2 
Donc le coefficient directeur de la première est l’inverse et l’opposé du coefficient directeur de la 
seconde. 


Exemple 11.21. 
Soit la droite d = y = 2x + 3. Le coefficient directeur de cette droite est 2. Donc le coefficient 
directeur d’une droite perpendiculaires doit être — À. PA 


Preuve alternative. La preuve peut également être donnée en ne faisant pas référence au produit 
scalaire. 1 suffit d'écrire toutes les quantités en termes des coordonnées de X et Y. Si nous posons 


T1 Y1 
X = TX) |, Y = U2 |, (11.63) 
T2 y3 


l'inégalité à prouver devient 


(aiy1 + Togo + ray) < (xŸ + 25 + a) (y + 5 + ys). (11.64) 
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Nous considérons la fonction 
QE) = (ei + ty)? + (mo + tgo)? + (xs + ty2)? (11.65) 
En tant que norme, cette fonction est évidemment positive pour tout t. En regroupant les termes 
de chaque puissance de t, nous avons 
Ut) = (y? + v2 + me)? + 2(aigr + royo + œaya)t + (a? + x3 + xd). (11.66) 


C’est un polynôme du second degré en t. Par conséquent le discriminant doit être négatif !6. Nous 
avons donc 
Aœiyr + toge + days) — (ai + 29 + a$)(yt + 2 + y4) < 0. (11.67) 


La thèse en découle aussitôt. 


11.1.5 Théorème de Pythagore 
THOooHXHWooCpcDan 


Théorème 11.22 (Pythagore|1]|). 
Soient un espace euclidien 7 E ainsi que trois points a,b,ce E formant un triangle rectangle en 


a, c’est-à-dire tel que ERooRAHAoOxIREZ 
Alors 

le— cf? = |b— af? + la — d°. (11.69) 
Démonstration. D'abord pour développons l'hypothèse (11.68) : 

b:a—b:c—{|al?+a:c=0, (11.70) 
et nous isolons un bout qui va nous servir plus tard : 


b'a+a:c=b:c+|al". FRooNPUZOoEIETE 


Maintenant nous calculons un peu : 


lb — af? + Ja — ef? = Jo? — 26 : à + al? + af? — 2a + c+ cf? (11.72) 
= 2Jal2 + (62 + (ef? — 206 - + af?) ERA PSE) 
= 62 + ef? — 26 - c (11.720) 
= |b— cf. (11.724) 


Pour (11.72b), nous avons substitué (11.71). 


11.253. 
Je profite de l’occasion pour montrer mon scepticisme quant aux preuves de Pythagore basées sur 
différents pliages et découpages des carrés construits sur les côtés du triangle. 

Si, comme ici, nous considérons la géométrie dans R? muni de son produit scalaire, alors le 
théorème 11.22 est le théorème de Pythagore et il n’est pas loin d’être la définition de la distance 
entre deux points. Ce serait exactement la définition pour le triangle À = (0,0), B = (a,0), 
Cab). 

Pour autant que je le sache, la géométrie dans « le plan » (celle du collège) ne définit pas 
« longueur » et « aire ». Donc bon ...[l y a peut-être un moyen de s’en sortir, mais je ne le connais 
pas. 

Bref, soit on se met d’accord sur les définition (et dans ce cas je serais étonné qu’il existe une 
démonstration de Pythagore très différente de ce qu’on a ici), soit il faudrait se calmer avec les 


soi-disant preuves du théorème de Pythagore. 
LEMooKDGRooMmJqnn 


Lemme 11.24. 
Soit un carré de côté c. Alors deux points du carré sont au maximum éloignés d’une distance égale 
à cv 2. 


16. Proposition 10.110. 
17. Définition 9.168. 
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11.1.6 Produit vectoriel 
DEFooTNTNooRjhuJZ 


Définition 11.25. 
Soient u et v, deux vecteurs de R°. Le produit vectoriel de u et v est le vecteur u x v défini par 


uxu=det{u ue us RE 


U1 V2 V3 


où les vecteurs e1, e2 et ex sont les vecteurs de la base canonique de R°. 
LEMooYKNPooGVMuse 


Lemme 11.26. 


: : / ue EQSoo0WGZooNYruo 
Le produit vectoriel u x v est également exprimé par | ï À 


SEBE VROK I 
u X U = (uauz — ugv2)es + (ugv1 — uiU3)e2 + (uiv2 — uavi)e3 19e EPPIES 
— + EijkViV jEk (11.74b) 
ä,9,k 


où E;jr est défini par éxyz = 1 et ensuite €,5x est 1 ou —1 suivant que la permutation des x, y et 
z est paire ou impaire. C'est-à-dire que €;;4 est la signature de la permutation qui amène (1,2,3) 
sur (2,7,k). 


Démonstration. Il s’agit seulement de développer explicitement le déterminant (11.73). 
NORMooARQCooCAapiy 


11.27. 

Admettons que a x b = v. En calculant le même produit vectoriel dans la base f; = —e;, les 
composantes de a et b changent de signe et la formule (11.74) dit que le produit vectoriel ne 
change pas. On serait tenté d'écrire, dans la base {f;} 


(—a) x (—b) = v, (11.75) 


tout en pleurant parce que dans la base des f;, le vecteur v devient —v. 

Il y a des personnes que cela tracasse tellement qu’on entend parler de « le produit vectoriel 
est un pseudo-vecteur sous SO(2) ». Les physiciens en théorie quantique des champs sont terribles 
sur ce sujet ?. 

Il suffit d'être clair. Le produit vectoriel n’est défini que sur R°, et est défini par sa formule 
dans la base canonique, point barre. Si vous avez des vecteurs a et b dont vous connaissez les 
composantes dans une autre base, vous devez calculer les composantes dans la base canonique, 
utiliser la formule pour trouver les composantes de a x b dans la base canonique. Ensuite, si ça 
vous chante, vous pouvez calculer à nouveau les composantes de a x b dans une autre base. 

Tout cela pour dire que le produit vectoriel n’est pas une opération très généralisable. Il est 
possible, pour sembler plus intrinsèque, de tenter cette définition : le produit vectoriel a x b est le 
vecteur perpendiculaire à a et b, de longueur égale à l’aire du parallélogramme construit sur a et 
b. 


Cette « définition » a plusieurs inconvénients. 
— Elle demande quand même un produit scalaire et des aires; bref, elle demande une structure 
métrique, 


— Elle ne donne pas le sens. En effet, dans R, il y a deux vecteurs de longueur donnée per- 
pendiculaires à a et b. Il faut donc préciser le sens. Cela revient à donner une orientation et 
donc, fondamentalement, à choisir une base. 


Bref, on retiendra que le produit vectoriel est une opération accrochée à IR? et à sa base 
canonique. 


18. D'autant plus que, au lieu d’écrire un produit scalaire a : b, il écrivent a;b° en disant que b° est un covecteur. 
Avec toutes les complications que ça implique sur les « lois de transformation » d’un covecteur sous tel ou tel groupe. 
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Lemme-Définition 11.28. 
Nous avons l'égalité suivante pour tout u,v,w e R° : 


ui U2 Uu3 
EQooKJYU 
(u x v) - w = det | vi va 3 |. . CRETE) 
Wi W2 W3 


Le résultat est nommé le produit mixte de trois vecteurs de RŸ. 


11.29. 
Nous avons donné un nom à la combinaison (u x v) : w. J'imagine que vous voyez pourquoi nous 
ne considérons pas la combinaison (u : v) x w. 


Le lemme suivant donne un moyen compliqué et peu pratique de calculer la valeur absolue 
du produit mixte. La formule (11.77) ne sera utilisée que pour faire le lien entre un jacobien et 
un élément de volume en dimension trois lorsque nous verrons les intégrales sur des variétés. Voir 
l'équation (20.38). 

LEMooSMWNooCmEZeY 
Lemme 11.30 ([1]). 


Le produit mixte peut également être exprimé par 
E WZU d 
[(u x v) - wl? = det | vu -u {v]? v -w |. Le Qootyp a 


Démonstration. Si nous notons 


a= | v1 va 3 |, (11.78) 


il faut simplement remarquer que 


Quf? u-v u:w 
vu ul? v:w|=aaf. (11.79) 


w-u w:v |wl|? 
Donc au niveau des déterminants, en utilisant les propositions 9.243 et le lemme 4.80 nous avons 
Jul? u-v u:w 


det | vu:u {v|? vw: uw |= det(aat) = det(a) det(at) = det(a)?. (11.80) 
w:u w:v |wl|? 


Et maintenant, par définition, det(a) = (u x w) : w. Donc le résultat annoncé. 


PropScalMixtLin 
Proposition 11.31. 
Les applications produit scalaire, vectoriel et mixte sont multilinéaires. Spécifiquement, nous avons 
les propriétés suivantes. 


(1) Les applications produit scalaire et vectoriel sont bilinéaires. C'est-à-dire que pour tout vec- 
teurs a, b, c et pour tout nombre a et B nous avons 


a x (ab + Bc) = a(a x b) + Ba x c) 


(aa + Bb) x c = a(a x c) + B(b x c (11.81) 


(2) Le produit mixte est trilinéaire. 
(3) Le produit vectoriel est antisymétrique, c’est-à-dire u x v = —v x u. 


(4) Nous avons u x v = 0 si et seulement si u et vu sont colinéaires, c’est-à-dire si et seulement 
si l'équation au + Bv = 0 a une solution différente de la solution triviale (a, B) = (0,0). 
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PROPooMXAIooJureOUD 
Proposition 11.32 (Identité de Lagrange[319]). 


Si x,y € R", alors 
lel*lal? — = DD Gus — ju). (11.82) 
j i<j 
Et sin = 3 alors 
le x y = el” lgl? — (x: y)? (11.83) 


Démonstration. C’est un calcul. D'abord nous avons 
leg — Ce 2 = Sat S 2 — (SO œxye)” = si Yi — DT (11.84) 
E j k 


Ensuite nous coupons les sommes de la façon suivante 


2= 221+26-5 +DY (11.85) 


j i<j ] J 1>j 
pour obtenir 
leg? — (x + y) = DD au + dis +) Dry 
1 . (11.86) 
_ D TRYRTIYI — DE TRUE — à TEURTIVI. 
k<I k>1 


Il y à deux termes qui se simplifient. Notez que si Ax est symétrique en kl nous avons 
Se He de (11.87) 
L k<l k 1<k k 1<k 


La première égalité était seulement un renommage des indices. Le coup des indices symétriques 
est justement ce qu'il se passe dans les deux termes enxz;yktiy, donc nous les regroupons : 


ll”? — (+ w)° = x Data? + Da 2 ays;y;) (11.88a) 


i<j i>j i>j 
_ > x (auf + fut — 2rivit sus) (11.88b) 
j i<j 
_ ; D (y — ty)”. (11.88c) 
j i<j 


Voilà qui prouve la première formule. Pour la seconde, il faut seulement poser n = 3 et écrire les 
sommes explicitement. 


— Pour j = 1, la somme sur 4 est ÿ c’est-à-dire aucun termes. 


i<1? 
— Pour j = 2, il y a seulement à = 1, donc le terme (x1y2 — xoy1)?. 
— Pour j = 3, il y a les termes à = 1 et à = 2, donc les termes (x1y3 — z3y1)? + (toys — x3yo)?. 
Ces trois termes collectés sont justement les composants (au carré) de x x y données dans la formule 
(11.74a). 


Les trois vecteurs de base e,, e, et e, ont des produits vectoriels faciles à retenir : 
Ex X Ey = Ez 
Ey X Ex = Ex (11.89) 
Ez X Ex = €y 
Les deux formules suivantes, qui mêlent le produit scalaire et le produit vectoriel, sont souvent 
utiles en analyse vectorielle : 
U XV): W—=U: (VX w EqFormE 
ee .. aFornExE AE 
(u x v) x w = —(v - wju +(u : w)v 


pour tout vecteurs u, v et w dans R°. Nous les admettons sans démonstration. La seconde formule 
est parfois appelée formule d’expulsion. 
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Exemple 11.33. 
Calculons le produit vectoriel v x w avec 


vu= |-1| w= | 2 |. (11.91) 


Les vecteurs s’écrivent sous la forme v = 3e, — e, + e, et w = ex; + 2ey — e,. Le produit vectoriel 
s'écrit 
ee, Fée) x (ete, 2e) bé Ke, JéXx E, 
— Ey X Ex + Ey X Ez 
exe +26 x, (11.92) 
= 6e, + 3ey + €: + Ex + Ey — 2€x 
= —ex + 4ey + 7ez. 


11.1.7 Produit mixte 


Si a, bet c sont trois vecteurs, leur produit mixte est le nombre a : (b x c). En écrivant le 
produit vectoriel sous forme de somme de trois déterminants 2 x 2, nous avons 


a: (bx c) 
ba b b1 b b1 b 
= (aiez + a2ey + a3ez) : | ne “bé È 1) 
C2 C3 C1 C3 C] © 
bo b b1 D b1 b 
pie 6) Gels A 2 (11.93) 
C2 C3 C1 C3 €] © 
ai 2 a3 
= |b1 bo bal. 
C1 C2 C3 
Le produit mixte s'écrit donc sous forme d’un déterminant. Nous retenons cette formule : 
ai G2 3 FE 
EqgProduitMixt 
a-(bxc)=|b1 b2 b3|. ProQuItH EU 
C1 C2 C3 


Un grand intérêt du produit vectoriel est qu’il fournit un vecteur qui est simultanément per- 
pendiculaire aux deux vecteurs donnés. 
PROPOooTUVKooOUQXKK1 
Proposition 11.34. 


Le produit vectoriel? a x b est un vecteur orthogonal à a et b. 


Démonstration. Vérifions que a L (a x b). Pour cela, nous calculons a + (a x b), c’est-à-dire le 
produit mixte 


aj a2 a3 
a: (axb)={|ai a2 a3] = 0. (11.95) 
bi b2 3 


L’annulation de ce déterminant est due au fait que deux de ses lignes sont égales. 


Ces résultats admettent une intéressante généralisation. 
LEMooFRWKooV1oCSM 
Lemme 11.35. 


Soit X € R° ainsi que v1,...,Un_1 € R”?. Alors 


19. Définition 11.25. 
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(1) Nous avons 


det(X,u1,...,Un_1) = À : det + OMR 


(2) Le vecteur 


det | (11.97) 


est orthogonal à tous les v. 


Démonstration. Puisque les deux côtés de (11.96) vus comme fonctions de X, sont des applications 
linéaires de R” dans R, il suffit de vérifier l'égalité sur une base. 
Nous posons 7;: R° — R"-!, 


U sik <i 
rte = {7 a (11.98) 
Ur] Sik Zi. 
et nous avons d’une part 
€1 …. En 
TEUI 
V1 
eg * det | = det : (11.99) 
j TkUn—1 
Un—1 
et d’autre part, 
0 
détlég) is s Un 1) = dét LI y ++ 01 | = dti... mu 1) (11.100) 
0 


La première assertion est démontrée. 
En ce qui concerne la seconde, il suffit d'appliquer la première et se souvenir qu’un déterminant 
est nul lorsque deux lignes sont égales ?. En effet : 


€] ... En 


U 
uk * det . = det(vg, U1,..., Un) = 0. (11.101) 


11.1.8 Procédé de Gram-Schmidt 
PropUMtEqkb 


Proposition 11.36 (Procédé de Gram-Schmidt). 
Un espace euclidien possède une base orthonormée. 


20. Corolaire 4.83. 
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Démonstration. Soit E un espace euclidien et {v1,...,v,}, une base quelconque de E. Nous posons 
d’abord 
li 
Het eee (11.102) 
| F1] 
Ensuite f 
2 
Ja = va — (ua, e1)er, €2 = LT (11.103) 


Notons que {e1,e2} est une base de Span{w, vw}. De plus elle est orthogonale : 


(e1; f2) = (e1, V2) — (v2,e1)e1,e1) = 0. (11.104) 
Sn, —7 
=1 
Le fait que |e:| = |e2| = 1 est par construction. Nous avons donc donné une base orthonormée de 
Span{v1,v2}. 
Nous continuons par récurrence en posant 
k—1 pe 
fe = Uk — D Cum ei)es, ER = ——. (11.105) 
= \fel 
Pour tout j < k nous avons 
k—1 
Ces fh) = Ej Uk) — D Ce ei) (ei, e;) = 0 (11.106) 
i=1 ns 
7 


Cet algorithme de Gram-Schmidt nous donne non seulement l'existence de bases orthonormée 
pour tout espace euclidien, mais aussi le moyen d’en construire à partir de n’importe quelle base. 


11.1.9 Pseudo-réduction simultanée 
CorNHKnLVA 


Corolaire 11.37 (Pseudo-réduction simultanée[320]). 
Soient À, B € S(n,R) avec À définie positive?!. Alors il existe Q € GL(n, R) telle que Q'BQ soit 
diagonale et Q'AQ = 1. 


Démonstration. Nous allons noter x - y le produit scalaire usuel de R” et {e;};-1..n sa base 
canonique. 

Comme À est définie positive, l'expression {x, y) = x : Ay donne un produit scalaire sur R?. 
Nous avons donc deux produits scalaires sur R”, et nous allons travailler avec les deux. 

La proposition 11.36 appliquée à l’espace euclidien (R”,<.,.)) dit qu’il existe une base de R? 
orthonormée (f;);=1...n pour ce produit scalaire. Nous considérons l’application linéaire P définie 
par 

Pei= fi. (11.107) 


Nous démontrons à présent que PAP = 1. Pour cela, nous calculons 


BE ZD N 
dj = fi, F5) a) 
= ji: Aj; (11.108b) 
— Pe; : APe; (11.108c) 
_.. PtAPe: En 
T Éz ÿ . 
_ (PAP). SUBEQoo1TBK PPTERES 


Justifications : 


21. Définition 9.224. 
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— Pour (11.108a), la base (f;) est orthonormée pour le produit scalaire ., .). 
— Pour (11.108d), la proposition 9.182 sur la transposée. 


— Pour (11.108e), la formule du produit scalaire usuel pour avoir les éléments de matrice, 
proposition 9.180. 

La matrice P‘BP est une matrice symétrique, donc le théorème spectral 9.221 nous donne une 

matrice RÀ € O(n,R) telle que RtP'BPR soit diagonale. En posant maintenant Q = PR nous 

avons la matrice cherchée. 


REMooDDUEooJXZIfE 
Remarque 11.38. 
Plusieurs remarques 


(1) Nous n’avons pas prouvé l'existence d’une matrice P telle que P-1BP et P-!AP soient 
diagonales. Au contraire, nous avons Q'BQ et Q'AQ qui sont diagonales. Tant que Q n’est 
pas orthogonale, ce n’est pas la même chose. 

Autrement dit, nous n’avons pas ici une vraie diagonalisation, parce que les matrices À et B 
ne sont pas semblables à des matrices diagonales. Voir les définitions 9.209 (diagonalisable) 
et 9.196 (semblable). 

C’est pour cela que nous parlons de pseudo-diagonalisation. 


(2) Dans le même ordre d’idée, la démonstration de la pseudo-diagonalisation simultanée parle 
clairement de formes bilinéaires, et non d’endomorphismes. Or en comparant les lois de 
transformations (4.233) et (9.306), nous voyons bien que la réduction en passant par QfAQ 
est bien une réduction de forme bilinéaire et non une réduction d’endomorphismes. 


(3) Nous avons prouvé la pseudo-réduction simultanée comme corolaire du théorème de diago- 
nalisation des matrices symétriques 9.221. Il aurait aussi pu être vu comme un corolaire du 
théorème spectral 11.6 sur les opérateurs autoadjoints via son corolaire 11.7. 


11.2 Approximations 


Le lemme suivant est surtout intéressant en dimension infinie. 


Lemme 11.39. 
Soit un espace vectoriel normé V et un sous-espace vectoriel dense À. Soit v € V ; il existe une 


suite (un) dans À telle que vn y et fun] < [ul pour tout n. 


Démonstration. Puisque À est dense, il existe une suite a, dans À telle que a, — v. Ensuite il 


suffit de poser 
n_ lvl 
Un = An 11.109 
T n+1lar| ” 


Par construction nous avons toujours 


lun] = ul < ll. (11.110) 


Et de plus, la norme étant continue ??, 


cn …. [El & : 
in Un ER PATES Qt) 


Le fait que v, soit dans À est dû au fait que À soit vectoriel. 


PROPooVEMGooYKRhMF y 
Proposition 11.40. 
Soit un espace vectoriel normé V et un sous-espace vectoriel dense A. Soit v € V. Nous avons 


sup{|v : a| tel que a € À et al < À} = Àlv|. (11.112) 


22. Où dans le calcul suivant utilisons-nous la continuité de la norme ? Posez vous la question. 
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Démonstration. D'abord pour tout a € À vérifiant |a| < À linégalité de Cauchy-Schwarz 11.1 
donne 
ju * al < fullal < Al]. (11.113) 


Donc le supremum dont on parle est majoré par A|v|. 
Il nous faut l’inégalité dans l’autre sens. Par densité nous pouvons choisir une suite v, € À tel 
que Un — v. Ensuite nous posons 


À 


An = — Un. (11.114) 
lun| 
Nous avons |a,| = À pour tout n et 
[u + an] = ——[v : val, (11.115) 
lun| 
et en passant à la limite, 
À 
lim fu : an] = —{u : v] = Àlu|. (11.116) 
Re ul 


Donc l’ensemble sur lequel nous prenons le supremum contient une suite convergente vers X|v|. Le 
supremum est donc au moins aussi grand que cela. 


11.2.1 Quelques exemples de normes sur R” 


Il est possible de définir de nombreuses normes sur IR”. Citons-en quelques-unes parmi les 
normes |.|,. Le cas général p > 1 sera fait dans 17.108. 


PROPooCLZRoo!IRxCnZ 
Proposition-Définition 11.41 ([321, 213]). 
Les formules suivantes définissent des normes’* sur R”. ITEMooQBLGooPQKSev 
(1) lei = 252 lil, ITEMooXQUFooLHrITI 
- mn 2 
(2) ele = V2 %; ITEMooSOVDooTuhEik 
(3) Ita = max; |. 
La norme |.|, est nommée norme supremum. 
Démonstration. Point par point. 
(1) Pour (1) Déjà fait dans le lemme 11.12. 
(2) Pour (2) Le cas p = 2 provient de l'inégalité 
V/{a + b}? < Va? + Vb, (11.117) 


laquelle se démontre en passant au carré : 


(a+ 0)2 = a? + 62 + 2ab < a? + 82 + Ja] = (Va + VE) FEES 


(3) Pour (3) Pour l'inégalité triangulaire, nous faisons 
le + yo = max frs + gi] < max (Ixi| + ail) < max fré| + max fui] = eo + |yloo. (11.119) 


Les autres points de la définition 7.149 sont faciles quand on se rappelle que æ = 0 si et 
seulement si x; = 0 pour tout 1. 


23. Définition 7.149. 
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Parmi ces normes, celles qui seront le plus souvent utilisées sont les normes |.|; et |.|2 qui 
: 
pour des raisons que nous verrons beaucoup plus tard ?* sont souvent notées |.|1» : 


n 


ll = À lil, 


i=1 


. . (11.120) 
lelze = (D) 

i=1 
4 (A5, A) C 
4 ] 
3 + 
2 + 
1+ (Bx, By) 

UE 


FIGURE 11.1: La norme euclidienne induit la distance euclidienne. D’où son nom. Le point C' est 


construit aux coordonnées (A3, By). LabelFigDistanceEuclide 


Soient À = (4,,A,) et B = (B;, By) deux éléments de IR?. La distance ? euclidienne entre A 
et B est donnée par | A — B|2. En effet, sur la figure 11.1, la distance entre les points À et B est 
donnée par 

AB? = [ACF +|CBF = | A5 — Bal? + |Ay — Byl” (11.121) 


par conséquent, 


LAB] = 4/1 4e — Bel? + |A — B,l = |A — Bi. (11.122) 


Remarque 11.42. 

Si À, B et C' sont trois points dans le plan R?, alors l'inégalité triangulaire [AB| < |AC| + |CB]| 
est précisément la propriété (4) de la norme (définition 7.149). En effet l'inégalité triangulaire 
s'exprime de la façon suivante en termes de la norme ||.|2 : 


LA — Ble < |A — C2 + |C — Bl. Per ESS 


En notant u = A—C'et vu = C—B, l'équation (11.123) devient exactement la propriété de définition 
de la norme : 
ju + vl2 < fu2 + ful2. (11.124) 


Ceci explique pourquoi cette propriété des normes est appelée « inégalité triangulaire ». 


11.3 Equivalence des normes 
normes_equiv 
Au premier coup d’œil, les notions dont nous parlons dans ce chapitre ont l’air très générales. 
Nous prenons en effet n’importe quel espace vectoriel V de dimension finie, et nous le munissons 
de n'importe quelle norme. Rien que dans IR?” nous allons en définir une infinité par l’équation 
(17.439)). À partir de ces données, nous définissons les boules, la topologie, l’adhérence, etc. 


24. La proposition 27.16, par exemple. 
25. Ne pas confondre « distance » et « norme ». 
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11.3.1 En dimension finie 


Dans R”, les normes |.|z1, |.]z2 et |.]X ne sont pas égales. Cependant elles ne sont pas 
complètement indépendantes au sens où l’on sent bien que si un vecteur sera grand pour une 
norme, il sera également grand pour les autres normes; les normes « vont dans le même sens ». 


Cette notion est précisée par le concept de norme équivalente. 
LEMooBâfEquidNbÂäñ 


Proposition-Définition 11.43 ([322]). 
Soient deux normes N; et N2 sur l’espace vectoriel E de dimension finie. Nous disons que Ni - N: 
si et seulement si il existe des réels strictement positifs k1, k2 tels que 


kiM(x) < N(x) < k2Ni(x). (11.125) 


La relation — est une relation d'équivalence sur l’ensemble des normes de E. 


Si Ni — N2 nous disons que les normes Ni et N2 sur R”' sont équivalentes. 
Démonstration. Vu que tous les nombres sont strictement positifs, nous pouvons multiplier et 
diviser sans changer le sens des inégalités. Gardant cela en tête, nous faisons les trois vérifications. 

(1) réflexive Nous avons M — Ni avec ki = k2 = 1. 


(2) Symétrique Supposons avoir k1, k2 tels que k1Ni(x) < No(x) < k2Ni(x). Alors nous avons 


aussi 1 1 
ko ki 
(3) Transitive Supposons MN, + N2 et N2 — N3. Nous avons donc des nombres k1, ko, l1 et lo 
tels que 
kiN1(x) < N(x) 
N(x) < k2Ni(x 
2(x) 2N1(x) (11.127) 
hNo(x) < N3(x) 
N3(x) < BNa(x) 
En combinant, 
ki Ni(x) < hNo(x) < N3(x) < Nix) < lkoNi(x). (11.128) 
En particulier, ki N1(x) < N3(x) < lokoNi(x). 
PropLJEJooMOWPNi 
Proposition 11.44. 
Pour R”, nous avons les équivalences de normes |.|r1 + |.]z2, |.]r1 + lo et |.Ir2 + [lo Plus 
précisément nous avons les inégalités ?? ItemABSGooQODmLNi 
(1) rl < lei < Valrl2 ItemABSGooQODmLNi i 
(2) Itlo < xl < rftllo ItemABSGooQODmLNiii 
(3) Itlæ < [rl2 < VAT 


Démonstration. En mettant au carré la première inégalité nous voyons que nous devons vérifier 
l'inégalité 
2 2 2 
ll +++ eff < (mil + + + tal) (11.129) 
qui est vraie parce que le membre de droite est égal au carré de chaque terme plus les double 
produits. La seconde inégalité provient de l’inégalité de Cauchy-Schwarz (théorème 11.1) sur les 
vecteurs 
1/n EN 
=) © | Il (11.130) 
1/n 7 


26. Définition 1.31. 
27. Les racines carrés sont définies en 10.92. 
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1 1 
D Ii <A/n- = DE (11.131) 
t ? 


Di] < Vn|2. (11.132) 


t 


Nous trouvons 


et par conséquent 


La première inégalité de (3) se démontre en remarquant que si a et b sont positifs, a < Va? + b. 
En appliquant cela à a = max; |x;|, nous avons 


max |r;| < 4/21[2 +--- + [x [2 (11.133) 
t 


parce que max; |x;| est évidemment un des termes de la somme. Pour la seconde inégalité de (3), 
nous avons 


1/2 
D læel? < (East) = Vnlt|o. (11.134) 
E t 


k 


Pour obtenir cette inégalité, nous avons remplacé tous les termes |x4| par le maximum. 


Pour les autres normes |.|,, il y a des inégalités dans 17.109 et 17.101 ; voir aussi le thème 25. 
Une dernière avant l’équivalence de toutes les normes. 


Proposition-Définition 11.45. 


Les topologies suivantes sont égales sur R. ITEMooWACPooFBAWhx 
(1) La topologie produit R x ... x R des espaces topologiques (R, |.|), ITEMoo JP JHooGTuLen 
(2) La topologie de la norme 

IGar,...,æn)o = max{æil}, (11.135) 
ITEMooEBYQooXi00tb 


(3) La topologie de la norme 


es. ;æn)lla = 4/3 2. (11.136) 
i=1 


Elle est la topologie que nous allons toujours considérer sur R'" {sauf mention très explicite du 
contraire). 


Démonstration. Les topologies (1) et (2) sont identiques par le lemme 7.217. Les topologies (2) et 
(3) sont identiques par la proposition 11.44. 


En réalité, toutes les normes |.» et |.]. sont équivalentes et, plus généralement, en dimension 


finie, toutes les normes sont équivalentes. 
ThoNormesEquiv 


Théorème 11.46 ([323, 324]). 
Sur un espace vectoriel de dimension finie, toutes les normes sont équivalentes. 


Démonstration. Soit un espace vectoriel V de dimension finie. Nous allons montrer que toutes les 
normes sont équivalentes à la norme |.|.. Soit donc une norme N sur V. 


(1) Inégalité dans un sens Vu que V est de dimension finie, il accepte une base {e1,...,e,}. 
En posant D = ÿ#_, N(e;), nous avons 


U 


N(x) = N(y, tiei) < D |tiIN(ei) < n[zloD. (11.137) 


Nous avons donc l'inégalité ?® 
N(x) < nD|x|oo- (11.138) 


28. Dans 11.46, le n n'apparaît pas dans la majoration. C'est lui ou moi qui fait une erreur? Pourquoi ? 
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(2) Dans l’autre sens La proposition 7.150 donne 


IN (x) — N(y)l < N(x — y) < Dnlz — ylo- (11.139) 
Donc l’application N': (V,|.|x) — R est continue. Vu que la sphère 
S = {x € V tel que xls = 1} (11.140) 


est compacte ?*, la fonction continue N y prend un minimum , Il existe donc m > 0 tel que 
m < N(x) pour tout xesS. 


Soit x € V. Nous avons x/|x|s € S, de telle sorte que 


T 1 
î 


N(x). (11.141) 


lo 


ou encore N(x) > mlxt|. 


(3) Conclusion Pour tout x € V nous avons les inégalités 
mtlo < N(x) < nD|xl. (11.142) 


Donc toutes les normes sont équivalentes à la norme |.|+. 


Comme l’équivalence de norme est transitive, toutes les normes sont équivalentes. 


CORooBRDYooLmGJDE 
Corolaire 11.47. 
Soit V un espace vectoriel de dimension finie et |.l1, |.]2 deux normes sur V. Alors l'identité 
i: V — V est un isomorphisme d'espace topologique (V, |.|1) — (V,{|.Î2). 
De plus les ouverts sont les mêmes : une partie de V est ouverte dans (V,|.]1) si et seulement 
si elle est ouverte dans (V, |.|2). 


Démonstration. Le théorème 11.46 nous dit qu’il existe des nombres @, 8 > 0 tels que 


all < [ele < Br (11.143) 


pour tout æ € V. Soit un 2-ouvert ©. Nous prouvons que à-1(O) = © est un 1-ouvert. Pour 
cela, soit a € ©. Vu que © est un 2-ouvert, il existe r > 0 tel que Ba(a,r) € ©. Prouvons que 
Bi(a,r/B) € Bo(a,r). En effet si y € Bi(a,r/5), alors 


ly — al2 < By — al1 <r. (11.144) 


Nous avons donc 
Bi(a,r/B) « Bo(a,r) < O = i t(O). (11.145) 


Donc à 1(O) contient un 1-ouvert autour de chacun de ses points. Il est donc 1-ouvert. 


Pour prouver que à! est continue, c’est la même chose. 


NORMooNKBCooKzilTjx 
11.48. 
Le lemme 11.12 donnera une norme sur IR? qui ne dérive pas d’un produit scalaire. Vu que toutes 
les normes sur IR? produisent la même topologie (c’est le corolaire 11.47), il y a parfaitement moyen 
pour deux espaces vectoriels topologiques d’être isomorphes alors que l’un a une norme dérivant 
d’un produit scalaire et l’autre non. 


29. La partie S est fermée et bornée de (V, |.|4), voir le théorème 10.24. 
30. Théorème de Weierstrass 7.138. 
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11.49. 
Le théorème d'équivalence de norme sera utilisé pour montrer que l’ensemble des formes qua- 
dratiques non dégénérées de signature (p,q) est ouvert dans l’ensemble des formes quadratiques, 
proposition 17.120. Plus généralement il est utilisé à chaque fois que l’on fait de la topologie sur 
les espaces de matrices en identifiant M(n,R) à R", pour se rassurer en se disant que ce qu’on 
fait ne dépend pas de la norme choisie. 

Voir aussi ce qu’on en fait en 12.303 pour démontrer la différentiabilité à partir des dérivées 


partielles. 
PROPooNTCFooEcwZwt 


Proposition 11.50 ([1]). 
Soit un espace vectoriel V de dimension finie sur ©. Pour une base B = {e;} de V nous définissons 


DRTTE Em EQooEGXVoRLAAQE 


(1) La formule (11.146) définit une norme sur V. 


(2) Si B et B' sont des bases de V, alors les topologies induites par le norme |.|8 et |.]s sont 


égales. 
Démonstration. Nous commençons par fixer une base B = {e;};-1..n de V. Cette base nous 
permet de définir 
p:V—C" 
Due CE (11.147) 
k 
Cette application linéaire permet d’écrire 
lulv = Ip(v)lor. (11.148) 


À partir de là, la vérification des propriétés de la définition 7.149 est immédiate. Par exemple : 


lo +w] = lp(v +w)| = po) + e(w)l < le(v)] + le(w)l = lol + lol. (11.149) 


En ce qui concerne la seconde assertion, c’est le théorème 11.46. 


11.3.2 Contre-exemple en dimension infinie 
SubSecPÜlynomesCE 


Lorsque nous considérons des espaces vectoriels de dimension infinie, les choses ne sont plus 
aussi simples. Nous voyons ici sur l’exemple de l’espace des polynômes que le théorème 11.46 n’est 
plus valable si on enlève l’hypothèse de dimension finie. 

On considère l’ensemble des fonctions polynomiales à coefficients réels sur l’intervalle [0, 1]. 


Pr([0,1]) = {p:[0,1]—R|p:x- a0 + aix + ar? +... ,& ER, Vie N}. (11.150) 


Cet ensemble, muni des opérations usuelles de somme entre polynômes et multiplications par les 
scalaires, est un espace vectoriel. 
Sur P(R) on définit les normes suivantes 


pl = sup {p(x)}, 
xe[0,1] 


LS 


1 
1 = [ Ip(æ)| dx, (11.151) 


— ([ ptdr) . 


"S 
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Les inégalités suivantes sont immédiates 


1 
lola = [ Ip(x)| de < lp, 


| 7 (11.152) 
bla = Cf pt)? de)  < In 
mais la norme | - | n’est équivalente ni à | + 1, ni à | : |2. Soit pz(x) = x*. Alors 
Ipkllo = 1, 
. k 
= di =, 
Ipxla | Lun 7 (11.153) 


Pour k — © les normes |p4|1, |prkl2 tendent vers zéro, alors que la norme |pg|x est constante, 
donc les normes ne sont pas équivalentes parce que il n’existe pas un nombre positif m tel que 


m|Px | AFE 


< 
| (11.154) 
mpxlo < px. 


uniformément pour tout k dans N. 


11.4 Norme opérateur 


La proposition suivante donne une norme (au sens de la définition 7.149) sur £L(V, W) dès que 


V et W sont des espaces vectoriels normés. 
DefNFYUooBZCPTr 


Proposition-Définition 11.51 (Norme opérateur|[325], thème 39). 
Soient des espaces vectoriels normés (V, |.|w) et (W, |.lw). Soient une application linéaire T: V — 


W, et le nombre 
IT (x) Îw 


(11.155) 
Ixv 


IT\c = sup 
xeV 
ITEMooGIPIooUvVBIv 
(1) Si V est de dimension finie, alors |T|£ < 00. 
(2) L'application T + |T|£ est une norme sur l’espace vectoriel des applications linéaires V — 


W. ITEMooUQPRooYQGZzu 
(3) Nous avons la formule 


T(x)lw EqFZPoolo 
Te = sup TO L sup (TG) ep eg 
xeV TV lzlv=1 


Le nombre |T|£ est la norme opérateur de T. Nous disons que cette norme est subordonnée 
aux normes choisies sur V et W. 


Démonstration. Si V est de dimension finie alors l’ensemble {|x|] = 1} est compact par le théorème 
de Borel-Lebesgue 10.24. Alors la fonction 


IT(x)] 
I] 


(11.157) 


est une fonction continue sur un compact. Le corolaire 7.280 nous dit alors qu’elle est bornée. Le 
supremum est donc un nombre réel fini. 
Nous vérifions que l’application |.| de £L(V, W) dans R ainsi définie est effectivement une norme. 
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(1) IT}£ = 0 signifie que |T(x)| = 0 pour tout x dans V. Comme | : |w est une norme nous 
concluons que T(x) = 0 pour tout x dans V, donc T est l’application nulle. 


(2) Pour tout À€ R et tout T dans £L(V, W) nous avons 


AD LITE 


[AT IL = sup = [AIT £. (11.158) 
xeV [tv I] 
æx%0 
(3) Pour tous Ti et T2 dans L(V,W) nous avons 
T T° 
(+ Tale = so OR O (11.159a) 
xeV T| 
æZ0 
T T' 
< sup AE) +R) (11.159b) 
x 
SE T° 
an (HI EI) (111500 
FE x 
T T° 
. Po, El (11.159d) 
F x 


Enfin nous prouvons la formule alternative (11.156). Nous allons montrer que les ensembles sur 
lesquels ont prend le supremum sont en réalité les mêmes : 


Ax 
= — {| Ax| tel que |x| = 1}. (11.160) 
x —————— ———— 
#0 . 
A 


Attention : ce sont des sous-ensembles de réels; pas de sous-ensembles de M(R) ou des sous- 
ensembles de R”. 

Pour la première inclusion, prenons un élément de À, et prouvons qu’il est dans B. C'est-à-dire 
que nous prenons + € V et nous considérons le nombre | Ax|/|x|. Le vecteur y = x/|x| est un 
vecteur de norme 1, donc la norme de Ay est un élément de B, mais 


|Ax| 


lAyl = : 
I] 


(11.161) 


Nous avons donc À € B. 
L’inclusion B € À est immédiate. 


LEMooHGCKooBzfAtg 
Lemme 11.52. 
Si À est une matrice bloc-diagonale formée des sous-matrices (A;), alors AF (k e 7%) est une 
matrice bloc-diagonale formée des sous-matrices (A;)*. 

PROPooJUYCooHnlFef 
Proposition 11.53 ([1]). 


Si À est une matrice bloc-diagonale, alors la norme de À majore la norme de chacun de ses blocs. 


En d’autres termes, il y a autant de normes opérateur sur £L(E, F) qu’il y à de paires de choix 
de normes sur E et F. En particulier, cela donne lieu à toutes les normes | A|, qui correspondent 
aux normes |.|, sur R. 

EXooXPXAooYyBwMX 
Exemple 11.54. 
Voyons la norme opérateur subordonnée à la norme fx], = max;/x;| sur C”. Par définition (et 
surtout par la propriété 11.51(3)), 


lAlx = sup |Axloo. (11.162) 


too =1 
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Vu que (Ar); = D x Aixtr, lorsque xls < 1 nous avons [(Ax);| < ÿ},|A;x|. Donc nous avons 
toujours ee 
|A < max DA. PRE EEE) 
v 
k 


A 


Définition 11.55. 
La topologie forte sur l’espace des opérateurs est la topologie de la norme opérateur. 


Lorsque nous considérons un espace vectoriel d'applications linéaires, nous considérons tou- 
jours °! dessus la topologie liée à cette norme. 


11.4.1 Norme d’algèbre 
Def JWRWQue 


Définition 11.56 (Norme d’algèbre[325]). 
Si A est une algèbre *?, une norme d’algèbre sur À est une norme telle que pour toute x,y € À, 


Ixy| < Ixllyl. (11.164) 


La norme opérateur est une norme d’algèbre, comme nous le verrons dans le lemme 11.61. 
Un des intérêts d'utiliser une norme d’algèbre est que l’on a l'inégalité |x"*| < |x|F. Cela sera 


particulièrement utile lors de l’étude des séries entières, voir par exemple 15.13. 
DEFooEAUKooSsjqaL 


Définition 11.57 ([326]). 
Le rayon spectral d’une matrice carrée A, noté p(A), est défini de la manière suivante : 


p(A) = max [x] D Lo Eu 2 


où les À; sont les valeurs propres de À. 


11.58. 
Quelques remarques sur la définition du rayon spectral. 


— Même si À est une matrice réelle, les valeurs propres sont dans C. Donc dans (11.165), |À;| 
est le module dans € de À,;. 
— Puisque les valeurs propres de A sont les racines de son polynôme caractéristique (théo- 
rème 9.114), il y en a un nombre fini et le maximum est bien défini. 
— La définition s'applique uniquement pour les espaces de dimension finie. 
LEMooIBLEooLJczmu 
Lemme 11.59. 
Soient des espaces vectoriels normés E et F, sur les corps R ou C. Pour tout A € L(E,F), et 
pour tout u € E nous avons la majoration 


1Aul < |Allul (11.166) 


où la norme sur À est la norme opérateur subordonnée à la norme sur u. 


Démonstration. Si u € E alors, étant donné que le supremum d’un ensemble est plus grand ou égal 
à chacun des éléments qui le compose, 


LA = sup JA, 14 
ee Ir ” | 


€eE 


(11.167) 
lu 


donc le résultat annoncé : | Au] < | A||u|. 


31. Sauf lorsque les événements nous forceront à trahir. 
32. Définition 1.340. 
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Le lemme suivant est valable en dimension infinie. Nous en toucherons un mot dans l’exemple 


11.66. 
LEMooWFNXooLyTyyX 


Lemme 11.60. 
Soient des espaces vectoriels normés E et F'. Soit x € E. Alors l'application d'évaluation 


eur: L(E,F)—F 


fo flo (11.168) 


est continue. 


Démonstration. Si x = 0, alors par linéarité de f nous avons evo(f) = 0 pour tout f. Donc d’accord 
pour la continuité. 


L(E,F " 
Soit une suite convergente fx Er) f. Nous voulons prouver que eux( fx) re eUx(f), c'est-à- 
dire que 
Jim |Lfe() — f(a)| = 0. (11.169) 


Par hypothèse si k est grand, alors | f£ — f|L(p,r) < €, c’est-à-dire que . 


Le (y) = fG)1 L 


sup (11.170) 
yeË ll 
En particulier pour notre x nous avons 


1x] 


c’est-à-dire | f£(x) — f(x)| < [xle. Vu que |x|] est une simple constante et que € est arbitraire, cela 
implique f(x) — f(x). 


11.5 Application linéaire continue et bornée 
LEMooFITMooBBBWGI 
Lemme 11.61 (La norme opérateur est une norme d’algèbre[1]). 
Soient des espaces vectoriels normés E, F et G. Soient des opérateurs linéaires bornés B: E — F, 
A: F — G. Alors 
AB] < |AÏ}B1. (11.172) 


C'est-à-dire que la norme opérateur est une norme d’algèbre **. 


Démonstration. Nous avons les (in)égalités suivantes : 


AB 
|AB] = sup FP2Ie (11.173a) 
E (xl 
ABx||Bx|r 
= sup (11.173b) 
|| |Bx|r 
Bx#0 
ABx| |Bx| 
= sup (11.173c) 
s<E |Bx| |x| 
Bx#0 
AB B 
< sup _ sup IBæl (11.173d) 
ce |Bt| er |yl 
BxZ0 By#0 
——, ——— 
<lAI =|B1 
< |A] 21: (11.173e) 


33. Définition 11.51 de la norme sur £L(E, F). 
34. Définition 11.56. 
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La dernière inégalité provient que dans sup «eg |ABx|/|x|, le supremum est pris sur un ensemble 


HA 
plus petit que celui sur lequel porte la définition de la norme de À : seulement l’image de B au 
lieu de tout l’espace de départ de À. 


PROPooQZYVooYJV1Bd 
Proposition 11.62 (Bornée si et seulement si continue[327]|). 
Soient E et F des espaces vectoriels normés. Une application linéaire E — F' est bornée si et 
seulement si elle est continue. 


Démonstration. Nous commençons par supposer que À est bornée. Par le lemme 11.61, pour tout 
æ,y€ E, nous avons 


lA(x) — A(y)] = 1A(x — y)] < 1 Alix — yl. (11.174) 
En particulier si x, ÆE, » alors 
0 < |A(xn) — A(x)| < |Af]tn — x] — 0 (11.175) 


et À est continue en vertu de la caractérisation séquentielle de la continuité, proposition 7.129. 

Nous supposons maintenant que | A| n’est pas borné : l’ensemble {| A(x)| tel que |x] = 1} 
contient des valeurs arbitrairement grandes. Alors pour tout 4 > 1 il existe xx € B(0,1) tel que 
|A(xz)] > k. La suite x},/k tend vers zéro parce que |x4| = 1, mais | A(x;)] > 1 pour tout k. Cela 
montre que À n’est pas continue. 


Nous avons vu dans la proposition 11.62 que pour une application linéaire, être bornée est 
équivalent à être continue. Nous allons maintenant voir un certain nombre d'exemples illustrant 


ce fait. 
ExHKslel1G 


Exemple 11.63 (Une application linéaire non continue). 

Soit V l’espace vectoriel normé des suites finies de réels muni de la norme usuelle |e| = 4/57 9 |cil? 
où la somme est finie. Nous nommons {eg}ren la base usuelle de cet espace, et nous considérons 
l'opérateur f : V — V donnée par f(ez;) = key. C’est évidemment linéaire, mais ce n’est pas continu 
en zéro. En effet la suite ux = ex/k converge vers 0 alors que f(ux) = ex ne converge pas. A 


Cet exemple aurait pu également être donnée dans un espace de Hilbert, mais il aurait fallu 


parler de domaine. 

EXooDMVJooAJywMU 
Exemple 11.64 (Une autre application linéaire non continue[328]). 
En dimension infinie, une application linéaire n’est pas toujours continue. Soit Æ l’espace des 
polynômes à coefficients réels sur [0,1] muni de la norme uniforme. L'application de dérivation 
p: E—E, o(P) = P' n’est pas continue. 

Pour la voir nous considérons la suite P, — 1x ®, D'une part nous avons P, — 0 dans E 
parce que P,(x) = _e avec x € [0,1]. Mais en même temps nous avons w(P,) = X"-! et donc 
le(PA)| = 1. 

Nous n’avons donc pas limy-_,0 @(Pn) = @(limy_ Ph) et l'application 4 n’est pas continue en 
0. Elle n’est donc continue nulle part par linéarité. 

Nous avons utilisé le critère séquentiel de la continuité, voir la définition 7.199 et la proposi- 
tion 7.129. A 

RemOAXNooSMTDuN 


Remarque 11.65. 

Cette proposition permet de retrouver l’exemple 11.63 plus simplement. Si {e;}£en est une base 
d’un espace vectoriel normé formée de vecteurs de norme 1, alors l’opérateur linéaire donné par 
u(ex) = keg n’est pas borné et donc pas continu. 


C’est également ce résultat qui montre que le produit scalaire est continu sur un espace de 


Hilbert par exemple. 
EX00TQPEooRRdddt 
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Exemple 11.66. 
Nous avons vu dans le lemme 11.60 que pour un x € E donné, l’application 
eur: L(E,F)—F 
fe f(x) 
est continue. Puisque ev, est linéaire, la proposition 11.62 nous indique que ev, est bornée. 


Vérifions-le directement. Le calcul n’est pas très compliqué : 


levz| = sup lev:(f)] = sup lf(x)] < sup Ix|| fl = lxl (11.177) 
lfI=1 lf1=1 FI 


où nous avons utilisé le lemme 11.59 en passant. Donc la norme de ev, est majorée par |x|. 
Elle est même égale à |x|. En effet, pour chaque f € L(E, F) tel que | f| = 1, nous avons 


(11.176) 


leve] > leve(#)1 = 1f(æ)|. (11.178) 

En prenant f = Id nous trouvons |ev,| > |x|. A 
11.5.0.1 Mini bonus 

NORMooUDZOooKxAPit 


11.67 ([217]). 
Vous vous souvenez de la définition 7.166 d’une somme directe topologique ? Si V est normé, il 
existe une façon plus directe (mais pas spécialement plus simple) de prouver l'implication (1) = 
(2), et en particulier la continuité de s—!. Rappelons que dans le cas normé, nous avons plusieurs 
facons équivalentes de décrire les topologies *. 
— Sur VW et V2 nous avons la topologie induite, définition 7.24, qui est la même que celle de la 
restriction de la norme de V (lemme 7.114). 
— La topologie sur V1 x V2 est la définition 7.15. C’est la même que celle de la norme produit 
par le lemme 7.217. 
— La topologie sur V/Vi est la topologie quotient 7.44. La proposition 7.342 dit que la norme 
induite donne la même topologie. 
L'espace Vi x V2 est muni de sa norme produit de la définition 7.217: |(w1,v2)| = max{lui|, |vl}. 
Par hypothèse #71: V @V2 — Vi x V2 est linéaire et continue. La proposition 11.62 nous indique 
qu’elle est alors bornée. Il existe donc un nombre C € R* tel que 


D (ui + v2)] = max{lui, val} < Clur + vol. (11.179) 


V/V 


36 en partant d’une suite an —— 0. 


Nous allons montrer que s7! est séquentiellement continue 
En vertu de la proposition 7.342, nous avons d(a», Vi) RE 

Chacun des a, contient un unique élément x, de V1, qui est donné par 57 
Nous avons 


D D 


lan] = jf ul = inf fon + ol. (11.180) 
Vu que |a,| est donné par un infimum, nous pouvons, pour chaque n, choisir v € VA de telle sorte 
que Zn + Un ne soit pas trop loin d’être l’infimum : 
1 
[tn + v — lanfl < = (11.181) 


Un tel choix nous donne une suite (v,) dans V telle que 
[tr + Un — lanf| — 0. (11.182) 


Vu que Jan] — 0, cela implique [tx + un| — 0. 
En remettant tout ensemble, 


In <max{{ænl|, lon} < Clrn + vn| — 0. (11.183) 


Donc s-l{a») = æn — 0, et s_! est séquentiellement continue. 


35. Voir le thème 27. 
36. Définition 7.199. La continuité séquentielle est équivalente à la continuité par la proposition 7.245. 
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11.5.1 Suites 


Nous allons maintenant parler de suites dans V x W. Nous noterons (v,,w,) la suite dans 
V x W dont l'élément numéro n est le couple (un, um) avec un € V et wn € W. La notion de 
convergence de suite découle de la définition de la norme via la proposition 10.26. Il se fait que 
dans le cas des produits d’espaces, la convergence d’une suite est équivalente à la convergence des 


composantes. Plus précisément, nous avons le lemme suivant. 
LemCvVxWcvV\W 


Lemme 11.68. 
La suite (vn, Wa) converge vers (v,w) dans VX W si et seulement les suites (v,) et (w,) convergent 
séparément vers v et w respectivement dans V et W. 


Démonstration. Pour le sens direct, nous devons étudier le comportement de la norme de (v,, wn)— 
(v, w) lorsque n devient grand. En vertu de la définition de la norme dans V x W nous avons 


| (un, un) — CT) = max {{v, — uv, fwn — ww }. (11.184) 


Soit € > 0. Par définition de la convergence de la suite (v,,w,), il existe un N € N tel que n > N 
implique 
max {lon — v|v, [un — ww} < €, (11.185) 


et donc en particulier les deux inéquations 
fun — v| < € (11.186a) 
fwn — wl < €. (11.186b) 
De la première, il ressort que (v,) — v, et de la seconde que (w,) — w. 
Pour le sens inverse, nous avons pour tout € un N; tel que fu, — v|y < € pour tout n > Ni et 


un M, tel que |w, — ww < € pour tout n > N2. Si nous posons N = max{N,, N} nous avons les 
deux inégalités simultanément, et donc 


max {ur — v|y, ur — ww} < €, (11.187) 


ce qui signifie que la suite (v,,w,) converge vers (v,w) dans V x W. 


PROPooKDGOUooDjWQct 
Proposition 11.69 ([1]). 
Soit un espace V muni d’un produit scalaire à valeurs dans K (si K = © nous supposons le produit 
hermitien, mais ce n’est pas très important ici). Alors l'application 
a: VxV—-K 
(11.188) 
(x,y) = x, y) 


est continue. 


Démonstration. Nous ne disons pas que l’espace V x V est muni d’un produit scalaire. Mais en 
tout cas c’est un espace métrique, et K l’est aussi. Donc a est une application entre deux espaces 
métriques et elle sera continue si et seulement si elle est séquentiellement continue (propositions 
7.129 et 7.240). 


Soit donc une suite convergente dans V x V, c’est-à-dire (xy,yx) a (x, y). Nous devons 
démontrer que {xg, yk) EL, {æ, y). Les majorations usuelles donnent 
Le, ve) — Ce, y] < (éme, ve) — Ka, ue) + (Cr, ve) — x, y (11.189a) 
= Kex — 2, u)) + Ka vx — |. (11.189b) 
Nous savons du lemme 11.68 que les suites (x4) et (yk) sont séparément convergentes : xx V, x 
et Yx a y. En utilisant l'inégalité de Cauchy-Schwarz 11.2 nous trouvons 
Ka — au) < lex — æluel. (11.190) 


Nous avons |xx — x| — 0 et |yx| — |yl|, et par la règle du produit de limites dans R nous avons 
que |{œx — æ,yr)| — 0. 
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RemTopoProdPasRm 
Remarque 11.70. 
Il faut remarquer que la norme (7.192) est une norme par défaut. C’est la norme qu’on met quand 
on ne sait pas quoi mettre. Or il y a au moins un cas d’espace produit dans lequel on sait très bien 
quelle norme prendre : les espaces R”?. La norme qu’on met sur R? est 


l(x, y) = Va? + y, (11.191) 


et non la norme « par défaut » de R? = R x R qui serait 
IG, y)] = max{ix|, |y|}. (11.192) 


Les théorèmes que nous avons donc démontré à propos de V x W ne sont donc pas immédiatement 
applicables au cas de R?. 

Cette remarque est valable pour tous les espaces R’”. À moins de mention contraire explicite, 
nous ne considérons jamais la norme par défaut (7.192) sur un espace R/”. 


Étant donné la remarque 11.70, nous ne savons pas comment calculer par exemple la fermeture 
du produit d'intervalle 10, 1,[ x [4,5[. Il se fait que, dans R””, les fermetures de produits sont quand 


même les produits de fermetures. 
PropovlAxBbarAbraB 


Proposition 11.71. 
Soient des espaces vectoriels normés V et W. Soient AC V et B€W. Alors 


AxB=AxB (11.193) 


pour la norme produit" sur V x W. 


Démonstration. Nous commençons par prouver que À x B € A x B. Soit donc (x, y) € À x B. La 
proposition 7.242 nous assure de l’existence d’une suite dans À x B convergent vers (x,y). Nous 
considérons donc une suite (z,,y.) dans À x B telle que 


(ns Un) 2 (x, y). (11.194) 
Soit € > 0. Si n est assez grand nous avons 
|(Gn;ÿn) — (x, y) < €. (11.195) 
Mais 
l(&n, Un) — Ce, Y)| = en — Lan — y)] = max (les — 2fv, lan — ylw). (11.196) 


Donc pour ce n nous avons [2h — x| < € et |yn — y| < €. Nous en déduisons que æ» TV, zet 


Un > y. Donc re Aet ye B. Cd 
Dans l’autre sens maintenant. Soit (x,y) € À x B. Nous considérons deux suites (x,) dans À 


et (yn) dans B telles que x, V, xet Un F, y. Soit n suffisamment grand pour que |x, — x| < € 
et |yn — y| < €. Nous avons alors 


1@n; Un) — (x, y)| = max{ltr — x], |gn — y} < € (11.197) 


exoEspVectoNorme0002 
Proposition 11.72. 
Soit À = {(x,y)e R?|x > 0,y > 0}. 
(1) La partie À est ouverte dans R?. 
(2) L'’adhérence de À est donnée par 


A = AU {(x,0) tels que x > 0} U {(0,y) tels que y > 0}. (11.198) 


37. Définition 7.217. 


11.5. APPLICATION LINÉAIRE CONTINUE ET BORNÉE 809 


(3) La frontière de À est donnée par 
OA = {(x,0) tels que x > 0} L {(0,y) tels que y > 0}. (11.199) 


Démonstration. Point par point. 


(1) Prenons (x, y) € À, et tâchons de trouver une boule autour de (x,y) qui soit contenue dans 
A. Par définition, x > 0 et y > 0. Donc si nous prenons r = min{x, y}/2, la boule B((x, y), r) 


est encore contenue dans À. 


Notez que l’ensemble des boules du type O(xy) = B((x, y), Heu 


À par des ouverts. 


) est un recouvrement de 


(2) L’adhérence est constituée des points qui « touchent » presque l’ensemble. Intuitivement, 
nous devinons que l’adhérence de À va être l’ensemble des points (x,y) tels que x > 0 et 
y > 0. D'abord, un point (a,b) avec a < 0 n’est pas dans À parce qu’il existe une boule 
autour de (a,b) telle que x < 0 pour tout (x,y) dans la boule (même chose pour les points 
avec y < 0). 
Ensuite, prouvons que les points de la forme (0,y) et (x,0) avec x,y > 0 sont dans À. Pour 
cela, rien de tel qu’une suite. La suite (&, y) avec y > 0 est contenue dans À, et sa limite est 
clairement le point (0,y). Nous en concluons que (0,y) est un point de À. 


De la même façon, la suite (x, À) montre que le point (x,0) est dans À. Donc 


À = AU {(x,0) tels que x > 0} L {(0,y) tels que y > 0}. (11.200) 


En particulier, le point (0,0) est dans A. 
(3) En ce qui concerne la frontière, nous utilisons la caractérisation 0A = A\Int(A). Étant donné 


que À est ouvert, Int(A) = À. Les points qui sont dans À et pas dans À sont les points avec 
x = 0 ou y = 0. Donc 


OA = {(x,0) tels que x > 0} L {(0,y) tels que y > 0}. (11.201) 


L’adhérence peut aussi être trouvée en utilisant la proposition 11.71. Nous avons À = ]0, 0] x 
10,00, et par conséquent, la fermeture de À est la produit des fermetures : 


À = [0, co] x [0, co. (11.202) 


Nous insistons sur le fait que la fermeture de ]0,0![ n’est pas [0,0]. Ce dernier ensemble n’est pas 
une partie de R. 


11.5.2 Continuité du produit de matrices 
SUBSECooUAWAooFcyUfI 


Nous avons introduit des normes sur M(n,K), entre autres la norme opérateur de la défi- 
nition 11.51. Qui dit norme dit topologie. Il advient alors la question évidente : est-ce que des 
opérations aussi élémentaires que le produit de matrices sont continues pour ces topologies ? 

Une façon simple de répondre à cela est d'introduire sur M(n,K) une nouvelle norme très 
simple : celle de K”. C’est la topologie par composante. Pour cette topologie, il est simple de 
voir que le produit matriciel est continu parce que les éléments de AB sont des polynômes en les 
éléments de À B. Ensuite il suffit d’invoquer l’équivalence de toutes les normes (théorème 11.46). 

Voyons comment montrer cela de façon plus directe (bien que le raisonnement précédent soit 
une démonstration qui devrait déjà avoir convaincu les plus sceptiques). La preuve suivante va 


donc s’amuser à bien préciser les topologies et caractérisations utilisées. 
LEMooRGNRooPovBQuw 


Lemme 11.73. 
Si |.| est une norme algébrique sur Mn, K) (K est R ou C) alors l’application 


p: M(n,K) x M(n,K) — M{n,K) 


oies (11.203) 


est continue. 
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Démonstration. L'espace M(n, K) x M{n, K) est métrique (définition 7.216), donc la caractéri- 
sation séquentielle de la continuité (proposition 7.245) s'applique. Nous considérons donc une 
suite (4;,Bz) dans Min, K) x M{n,K) convergente vers (A,B), et nous allons prouver que 
P(Ar, Bx) — p(4,B). 

Nous savons que la topologie sur M(n, K) x Min, K) est la topologie produit (lemme 7.216) 


et que celle-ci donne la convergence composante par composante dès que nous avons convergence 
: se M{n,K M{n,K 
d’une suite ; c’est la proposition 7.60. Nous avons donc A4 su A et By A où B. 


Voilà pour le contexte. Maintenant, la preuve de la continuité. Nous effectuons les majorations 
suivantes : 


Ip(Ax, Bk) — AB] < |p(Ar, Bx) — p(4r, B)| + |p(4r, B) — AB] (11.204) 
= | 4,Bx — AkB| + |A:B — AB] (11.204b) 
= | 4(Bx — B)|] + |(4x — 4)B| (11.204c) 
< Az] |Bx— B|+1]Ax-— A) 121. (11.204d) 

nr LE, —— 
—1A| +8 A 
11.6 Applications multilinéaires 
Voir la définition 9.2 des applications multilinéaires. 
DefkKPBYeyG 
Lemme-Définition 11.74. 
Pour T € Ly(E1,...,Ey,F) nous posons 
IT = Fu IT(v1,..., vx) lw. (11.205) 
Vi =1 
Cela définit une norme. 
PropUAD1SMg 
Proposition 11.75. 
Soient des espaces vectoriels normés E; et F. Une application n-linéaire * 
T'EAx...xE —F (11.206) 
est est continue si et seulement si il existe un réel L > 0 tel que 
limitat 
IT, ,an)lr < Ljailm--(ænle, Vie Ex. C6) 
Démonstration. Pour simplifier l'exposition nous nous limitons au cas n = 2 et nous notons 


T(&,y) =x+y 
Supposons que l'inégalité (11.207) soit satisfaite. 
Ie + y — 20 + yol = |(x — To) + y — To + (y — yo)| — 
1m 
< |(& — 20) « y| + |kro * (y — wo) (PLUS 
< Lx — xo| y] + Z]xol|y — vol. 
Si x — zoo et y — Yo on voit que T'est continue en passant à la limite aux deux côtés de l'inégalité 
(11.208). 
Soit T' continue en (0,0). Évidemment * 0 «0 = 0, donc il existe 6 > 0 tel que si x € Bx, (0,6) 


et yE Br, (0,0) alors |x x y| < 1. En particulier si (x,y) € Br, x#, (0,0) nous sommes dans ce cas. 
Soient maintenant x € E1\{0} et y € E2\{0} 


x] a) (E s) Ixly] (a) (à) 
TZ #Y = + — * $ (11.209) 
( ô |x| ô |yl 62 \lx| y] 
38. Définition 9.1. 


39. Dans la formule suivante, les trois zéros sont les zéros de trois espaces différents. 
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On remarque que ô6x/|x|l» est dans la boule de rayon Ô centrée en 0,, et que ôy/|ylA est dans la 
boule de rayon 6 centrée en 0,. On conclut 


AE 


TXY< ED) 


Il faut prendre L = 1/62. 


PROPooUPCVooEWeWha 
Proposition 11.76. 
Si Test une application 2-linéaire, nous avons 


IT(u,v)| < IT{Ielfv. FATRTO) 


Et nous notons que cette norme est uniquement définie pour les applications linéaires continues. 
Ce n’est pas très grave parce qu’alors nous définissons |T| = 0 si T n’est pas continue. Cela pour 
retrouver le principe selon lequel on est continue si et seulement si on est borné. 
1som_1som 
Proposition 11.77. 
On définit les fonctions 


wWy: L(RTxR?,R?) — £L(R?,£L(R?,R?)), (11.211) 
wa: L(R"XxR?,R?) — £L(R’,L(R?",R?)), . 
par 
wy(T)(x) = T(x, : ), VreR”, 
et 
wa(T)(y) = T(:,y),  VyeR”. 
Les fonctions w, et wa sont des isomorphismes qui préservent les normes. 
11.7 Séries 
SECooYCQBooSZNXhd 


La notion de somme sur un ensemble infini est donnée en 11.99, voir aussi le thème 52 pour 


plus de notions de sommes finies et infinies. 
DefGFHAaOL 


Définition 11.78. 
Soit (ax) une suite dans un espace vectoriel normé (V,|.|). La suite des sommes partielles 
associée est la suite (sx) définie par 


k 
= Da (11.212) 
i=0 


La série associée est la limite des sommes partielles 


(ce) n 
D,ax= lim D, ar (11.213) 
k=0 k=0 


si elle existe. 
Si une telle limite existe nous disons que » ax converge dans V. Si la limite de la suite 
des sommes partielles n'existe pas nous disons que la série diverge. 


Remarque 11.79. 

Si la limite de la suite des sommes partielles n’existe pas dans V, alors elle peut parfois exister dans 
des extensions de V. Par exemple une série de rationnels convergeant vers 42 dans R ne converge 
pas dans Q. Autre exemple : avec une bonne topologie sur R, une série peut ne pas converger dans 
R mais converger vers +0 dans R. 


Dans le cas des espaces de fonctions, nous avons une norme importante : la norme uniforme 
définie par | fl = sup{f(x)} où le supremum est pris sur l’ensemble de définition de f. 
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LEMooHUZEooSyPipb 
Lemme 11.80. 
. . / . 40 Je 
Soit une suite (ay) dans un espace métrique complet” dont la série CONVETT ET EMooPFSQoODHKFCL 
(1) Pour tout N nous avons 
00 N 00 
Da at D, (11.214) 
k=0 k=0 k=N+1 
ITEMooQNHMooUP jupB 
(2) La suite des queues de série converge vers 0, c’est-à-dire que 
Le] 
li = (. | 
dim m0 (11.215) 
L= 
Démonstration. Voici un petit calcul : 
. e L SUBEQooZRSH0oS 
Jin Dam (La+ À œ) EL) 
0 k=0 k=N+1 
N 
SUBE TLVK 
— Jim 2 ak + Jim 5 ak . 5168) 
FEENII 
= > ar + D ak. (11.216c) 


Justifications : 


— Pour (11.216a). Pour chaque n, la somme est finie et nous pouvons la décomposer. Si vous 
voulez vraiment couper les cheveux en quatre, vous devez fixer un €, et un n de telle sorte à 
avoir n > N, parce que N est fixé dans l’énoncé du lemme. 


— Pour (11.216b). Nous sommes dans un cas limy_,œ(ün + Un) où (un) est constante et où 
(un + Un) converge. Nous pouvons donc permuter limite et somme “|. 


Voilà que (1) est prouvé. 

Nous écrivons sn = Y_0 @&x ; l'hypothèse est que la suite (s,) est une suite convergente dans 
un espace métrique. Elle est donc de Cauchy par la proposition 7.259. 

Soit e > 0. Il existe N € N tel que pour tout p,q > N, nous ayons |s, — s,| < €. Soit p > N\. 
Pour tout n > 0 nous avons 


p+n 
€> [span — Sp+il = | D, all. (11-217) 
k=p 
En prenant la limite n — 0 nous avons 
Le] 
[D æl< €. (11.218) 
k=p 


Nous avons donc démontré qu'il existe N tel que si p > N, alors | D. ax] < €. Cela signifie 


exactement que limy-,%0 D, ax = 0. 


11.7.1 Les trois types de convergence 


Trois notions de convergence à ne pas confondre : 
(1) La convergence absolue, 


(2) la convergence normale. C’est la même que la convergence absolue, mais dans le cas particulier 
d’un espace de fonctions muni de la norme uniforme. 


40. Définition 7.253. 
41. Pour rappel, la proposition 10.28 demande la convergence des deux suites pour fonctionner. 
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(3) la convergence uniforme. 
Voici les définitions. 
DefVFUIXwU 
Définition 11.81 (Convergence absolue). 
Nous disons que la série BH än dans l’espace vectoriel normé V converge absolument si la 


série 350 [lan converge dans R. 
DefVBrJUxo 


Définition 11.82 (Convergence normale). 
Une série de fonctions Ÿ,,,-.ù Un converge normalement si la série de nombres ÿ, |un| converge. 


C'est-à-dire si la série converge absolument pour la norme | fl. 
DEFooPABSooPMXMOV 


Définition 11.83 (Convergence uniforme). 
La somme Ÿ,,, fn converge uniformément vers la fonction F si la suite des sommes partielles 
converge uniformément, c’est-à-dire si 


N 
| : EgLNCJooVCTi 
Jim | > fa — Fe = 0. OL) 


LEMooJZTBoolopLok 
Lemme 11.84. 
Soient un espace topologique X, un espace vectoriel normé, et une suite de fonctions fn: X — V. 
Si la série Ÿ,,, fn converge normalement, alors elle converge uniformément. 
PropAKCusNM 


Proposition 11.85. 
Une série absolument convergente dans un espace de Banach*? y converge au sens usuel. 


Démonstration. Soit (ax) une suite dans un espace vectoriel normé complet dont la série converge 
absolument. Nous allons montrer que la suite des sommes partielles est de Cauchy. Cela suffira à 
montrer sa convergence par hypothèse de complétude. 

Nous avons 


p p 
Is sl = | >, &l< D, laxl= 5-3 (11.220) 
k=1+1 k=1+1 
Où 5h = > 0 |lar| est la suite des sommes partielles de la série des normes (qui converge). Vu que 
la suite (5,) converge dans R, elle y est de Cauchy par la proposition 1.390. Donc il existe un N 
tel que p,l > N implique 
Sp — Si = 59 — 4 < €. (11.221) 


Cela signifie que (s,) est une suite de Cauchy et donc convergente. 


Exemple 11.86 (Si l’espace n’est pas complet[1]). 
Dans un espace qui n’est pas complet, il est possible de construire un série qui converge absolument 
sans converger au sens usuel. 

Nous allons trouver dans Q une série qui converge simplement vers 42 (et donc ne converge 
pas dans À) mais absolument vers 4. 

La base est que si À, B € À avec À < B il est possible de résoudre 


{ T1 +79 = À (11.222a) 
rl + Irel = B (11.222b) 


pour r1,72 € À. Ce n’est pas très compliqué : la solution est r1 = (A+ B)/2 et r2 = (A — B)/2. 

Nous considérons l’espace À qui n’est pas complet dans R. Soit une série (ax) dans À qui 
converge vers 2 (convergence dans IR) nous nommons (54) la suite des ses sommes partielles. Soit 
aussi la suite (b;) qui converge vers 4 (zéro serait encore plus facile mais bon, juste pour faire un 
peu de généralité). 


42. Un espace vectoriel normé complet. Typiquement R. 
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Nous supposons que ay < b4; pour tout k et que les deux suites sont constituées de rationnels 
positifs. Nous nommons (54) et (s,) les sommes partielles. En particulier s, < s°, et ce sont des 
suites croissantes. 

Nous savons comment trouver r1,r2 € Q tels que r1+r2 = s1 et [r1|+|r2| = 81. Par récurrence, 
si nous savons r1,...,77 tels que 


T1 + TE = Sn (11.223a) 
lral+...+lrel = 5, (11.223b) 


(avec, soit dit en passant £ = 2n), alors nous pouvons trouver des rationnels rx41, rx+2 tels que 


{ Tite. HT + Tri + TRE = Sn+1 (11.224a) 
ral +... + {rel + Iresal + resol = 54:21 (11.224b) 


en effet il s’agit de résoudre 


{ Thil + Tki9 = Snt1 — T1 — Th = 8n+1 — Sn > Ù (11.225a) 


[re1| + [rl = su fr | ses re | = Ce s > 0. (11.225b) 


Cela se résout comme ci-dessus. Au final nous pouvons construire une suite (rx) dans Q telle que 


2n 
ne (11.226) 
k=0 
et 
2n 
> als; (11.227) 
k=0 
A 


Remarque 11.87. 

Nous savons que sur les espaces vectoriels de dimension finie toutes les normes sont équivalentes 
(théorème 11.43). La notion de convergence de série ne dépend alors pas du choix de la norme. 
Il n’en est pas de même sur les espaces de dimension infinie. Une série peut converger pour une 
norme mais pas pour une autre. 


Lorsque nous verrons la convergence de séries, nous verrons que la convergence normale est la 


convergence absolue pour la norme uniforme. 
LemCAIPooPMNbXg 


Lemme 11.88. 
Si E et F sont des espaces de Banach“*, l’espace L(E, F) est également de Banach. 


Démonstration. Soit (u,) une suite de Cauchy dans £L(E, F); si x € E il existe N tel que si 
l,m > N alors [uw — um| < €, c’est-à-dire que pour tout |x| = 1 on a |uw(x) — u\(x)| < €. Cela 
signifie que w,(x) est une suite de Cauchy dans l’espace complet F. Cette suite converge et nous 
pouvons définir l'application u: E — F par 

u(x) = Jim ün(T) (11.228) 
Il suffit maintenant de prouver que u est linéaire, ce qui est une conséquence directe de la linéarité 


de la limite : 
u(ax + By) = Jim (aun(x) + Bun(y)). (11.229) 


PROPooYDFUooTGnYQg 
Proposition 11.89. 
Si une série converge dans un espace complet, la norme de son terme général converge vers 0. 


43. Je crois qu'il ne faut pas que Æ soit complet. 
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Démonstration. Soit une suite (a,) dont la série converge vers s. Soit € > 0. La suite des sommes 
partielles (s,) est de Cauchy et converge vers 5 : 8, — s. En particulier il existe un N tel que si 
n > N, nous avons |s, — 8,_1| < e. Pour de telles valeurs de n nous avons : 


lan = Î8n — 8n-11 < €. (11.230) 


Cela prouve que an — 0. 


Dans le même ordre d’idée nous avons la convergence des queues de suites. 
LEMooFUCOooCOqLRj 


Lemme 11.90 ([1]). 
Soit une suite a: N — V où V est un espace vectoriel normé. Si » ag converge, alors 


Le) 
Jim ÿ ar = 0. (11.231) 
k= 
Démonstration. Ne nous en voulez pas si on décale l’énoncé de 1 : nous allons prouver que 


Dnsiax — 0. Nous nommons (s,) la suite des sommes partielles de a : sn = Yj_p ar. Soit 
n fixé dans N; pour tout N > n nous avons 


N N 
D GR=Snt+ D, a (11.232) 
k=0 k=n+1 


00 N ce 
5 A = Sn + im > Ak = Sn + 2 die (11.233) 
k=0 k=n+1 k=n+1 


Cela étant valable pour tout n, nous prenons la limite n — 00. Par définition s, — > ax ; pour 
le reste 


O0 O0 oo 
Da d a+ lim >, de (11.234) 
k=0 k=0 h k=n+1 


La dernière somme est donc nulle et nous avons prouvé le lemme. 


PROPooUEBWooUQBQvP 
Proposition 11.91. 
Si la série converge alors la somme est associative : Y,(ar + bx) = D ax + D gb. 


Démonstration. Supposons que Ÿ}, ax et >}, bx convergent tous deux. Alors nous avons pour tout 


N\ : 
N 
D (ax + be) = > Fr >: br. (11.235) 
k=0 


Mais si deux limites existent alors la somme commute avec la limite. C’est le cas pour la limite 
N — ©, donc 


N N N 00 00 
lim Ÿ (ax + 0x) = fm 2 ax + Fa = 2% + 2e (11.236) 
=0 = = = 


N 
TPE 


ii Avertissement /question au lecteur !! 11.92 
Je n'ai pas vérifié la proposition suivante. Ecrivez-moi pour m'envoyer une preuve, ou pour me 


dire qu’elle n’est pas correcte. En tout cas ne la prenez pas comme vraie trop facilement. 
PROPooQCOBooAMn]1;j;j 


Proposition 11.93. 
Si an > 0 et bn > 0 alors 


Lee. 


on + D, = (an + bn). (11.237) 
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11.7.2 Séries dans une algèbre normée 


Nous allons parler d’exponentielle de matrice. Avant cela, quelques propriétés qui sont valables 
sur des algèbres normées. Le principal exemple que nous avons en tête est À = Min, C). 
PROPooMZZQooEhQsgQ 


Proposition 11.94 (Distributivité de la somme infinie[1]). 
Soit une algèbre normée À. Soient une suite d'éléments A, € À et un élément B. Nous supposons 
que la somme + Ax converge. Alors 


FD = x BA}). (11.238) 


Démonstration. Soit N € N. Nous avons : 


| >: BA, - B 5 Al = |B 5 Aë] SUBEQooDTNE RAS 


k=N+1 


” |B1| > Aël de à 29460) 


k=N+1 


Justifications : 


— Pour (11.239a). Linéarité du produit matriciel. 


— Pour (11.239b). La norme est une norme d’algèbre 4 
À droite, la limite N — 0 donne zéro car |B|| est un simple nombre, et | XX y, Ax| est une 


queue de suite convergente par hypothèse. 


Nous avons donc bien convergence 


dim » BAz = B > Aÿ. (11.240) 


PROPooFMEXooCNjdhsS 


Proposition 11.95 (Produit de Cauchy dans une algèbre norméel1]). 
Soient une algèbre normée À, un élément À € À, ainsi que des séries convergentes » ay AF et 
XEotA!. Alors 


m=0 


44. Définition 11.56. Pour rappel, la norme opérateur en est une par le lemme 11.61. 
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Démonstration. Un calcul : 


5 7) où 2) _ x D bi A!) ax A APRES ES 
_ ÿ bag AE) A | PHASE) 


k l 
K L 
k : k+l 
= lin D one 1) (11.242c) 
ee SUBEQoo1SSHooJ 
5 : k+l 
= Jim lim > » bag AË+ ST 
da ee - _, ArSUBEGo0ANUQp eZ GATE 
C _ SUBEQooUVOBooSPG; 
= Jim D Le ab A PPPOT 
00 n 
Na à À SUBEQOCGRGROGIDENT 
n=0 m=0 


Justifications : 


— Pour (11.242a), la proposition 11.94 nous permet d'entrer l'élément ÿ} bA! e À dans la 
somme sur k. 


— Pour (11.242b), c'est la même chose. 


— Pour (11.242d), la somme sur k étant finie (pour chaque K), elle commute avec la limite sur 
L. 


— Pour (11.242e), c'est une manipulation de sommes finies. On regroupe les termes selon les 
puissances de À. 


— Pour (11.242f), c’est effectuer la limite sur L pour K fixé. 


— Pour (11.242g), l'expression dans la limite sur K ne dépend pas de K. Donc nous pouvons 
simplement supprimer la limite. 


11.8 Sommes de familles infinies 
SECooHHDXooUgLhHR 


11.8.1 Convergence commutative 
DEFooURAGooZs1lkys 


Définition 11.96. 
Soit xx une suite dans un espace vectoriel normé E. Nous disons que la suite converge commu- 
tativement vers x € E si limh_, tn — x] = 0 et si pour toute bijection Tr: N — N nous avons 
aussi 

Jim ITr(ny — | = 0. (11.243) 


La notion de convergence commutative est surtout intéressante pour les séries. La somme 
Le] 
D % (11.244) 
k=0 


converge commutativement vers x si limn_0 [2-3 3 0#| = 0 et si pour toute bijection Tr: N — N 
nous avons 


dim x D (| = 0. (11.245) 
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PopriXWvIY 
Proposition 11.97. 
Soit (a;)ien une suite absolument convergente % dans C. Alors elle converge commutativement. 


Démonstration. Soit € > 0. Nous posons 7, a; = a et nous considérons N tel que 
N 
DIETES (11.246) 


Étant donné que la série des lai| converge, il existe M tel que pour tout p,q > Ni nous ayons 
2. la;l < €. Nous considérons maintenant une bijection 7: N — IN. Prouvons que la série 
Dico larçcyl converge. Nous choisissons M de telle sorte que pour tout n > M, r(n) > Ni. Si 
sx est la somme partielle de la suite (a;(;))ien et si M < p < q nous avons 


q q 
|Sq En Sp| on | » ar(i)| < » las (il < €. (11.247) 
i=p i=p 


Cela montre que (54) est une suite de Cauchy. Elle est alors convergente et nous en déduisons que 
la série 


D art) (11.248) 


converge. Nous devons montrer à présent qu’elle converge vers la même limite que la somme 
| N 
« usuelle » limnw_,œ D 0 @. 
Soit n > max{ M, N}. Alors 


» Ar(k) — ja dk — > Ar(k) — 
k=0 k=0 k=0 


n 


+ D eu — Ù, &. (11.249) 
M+ 


k=N+1 
ee 
<E <E 


1e 


Par construction les deux derniers termes sont plus petits que € parce que M et N sont les 
constantes de Cauchy pour les séries Ya,(;) et Ya;. Afin de traiter les deux premiers termes, 
quitte à redéfinir M, nous supposons que {1,...,N} € r{1,..., M}; par conséquent tous les a; 
avec à < N sont atteints par les a;{;) avec à < M. Dans ce cas, les termes qui restent dans la 


différence 
N 
Da — D, a (11.250) 
k=0 k=0 


sont des ax avec k > N. Cette différence est donc en valeur absolue plus petite que €, et nous avons 
en fin de compte que 


(11.251) 


n nm 
T(k) — >. ak| < € 
k=0 k=0 


PropyFJXpr 
Proposition 11.98 ([329]). 
Soit > ax une série réelle qui converge mais qui ne converge pas absolument. Alors pour tout 
bER, il existe une bijection T: N — N telle que DE 0 di = be: 


Pour une revue des définitions de sommes dans le cas de {0,...,n}, des ensembles finis quel- 
conques, voir le thème 52. Maintenant nous donnons la définition pour une somme sur un ensemble 
infini. 


45. Définition 11.81. 
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DeflkoheE 
Définition 11.99. 
Si {vi}ier est une famille de vecteurs dans un espace vectoriel normé indexée par un ensemble 
quelconque I. Nous disons que cette famille est sommable de somme v si pour tout € > 0, il existe 
un Jo fini dans I tel que pour tout ensemble fini K tel que Jo € K nous avons“ 


[Du-vl<e. (11.252) 
jeK 


Si tel est le cas, nous notons 


TN (11.253) 

iel 
Dans cette définition, il faut comprendre que Ji est l’ensemble minimum de termes qu’il faut 
prendre pour être e-proche de v. Ensuite, K est là pour dire qu’en prenant plus de termes, on ne 


s’éloignera pas tellement. 
LEMooHFNXooFH£wzf 


Lemme 11.100. 
Soit une famille sommable (v;);er dans un espace vectoriel normé sur ©. Pour tout À € ©, la 
famille (Avi)ier est sommable et 


REED (11.254) 
iel iel 
LEMooSBYEooNXzqJU 
Lemme 11.101. 
Soit une famille sommable (a;)ier. Si J € I, alors la famille (aj)jez est sommable 
LEMooAYFUooLMBBDn 


Lemme 11.102. 
Soit une famille sommable (a;);er de réels positifs. Si J € I, alors la famille (aj)jez est sommable 


et 
Die) UE (11.255) 


jeJ iel 


Dans le cas de familles de nombres réels positifs, nous avons une caractérisation plus commode. 
PROPooUYNRooQFpBly 


Proposition 11.103 (Somme de réels positifs[1]). 
Soit (ai)ier une famille de nombres réels positifs indexés par un ensemble quelcopgu£ dayekoovxxp 


: ne 48 “ 
LA 
(1) La famille (ai)ier est sommable® si et seulement si 
sup Ÿ a; < oo. (11.256) 
J fini dans lies 
ITEMooSDCYooNsbHez 


(2) Si la famille est sommable, alors 


» Gi = Sup > VER (11.257) 
=: J fini dans leg 
Démonstration. En plusieurs parties. 


(1) Pour (1), = Soit v comme dans la définition. Soit € > 0. Nous considérons une partie finie 
Jo € T1 comme il faut. Vu que tous les termes sont positifs, 


sup Gj = SUP da (11.258) 
J fini dans 1 ; J fini dans 1 ; 
jeJ Het jeJ 


46. La somme sur la partie finie K est la définition 1.302. 
47. Attention que pour définir ça, il faut prouver l'unicité ; je n'ai pas vérifié. Écrivez-moi si vous avez une preuve. 
48. Définition 11.99. 
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Pour chaque J fini contenant J, dans 7 nous avons | },,7 a; — v| <e et donc 


US al < fol +e. (11.259) 
jeJ 
Donc le supremum sur les J est majoré par |v| + e. 
Vu que cela est valable pour tout €, c’est aussi majoré par |v] lui-même, mais ce n’est pas 
utile pour notre propos. 


Pour (1), = Nous supposons maintenant Que SUP J fini dans D 
supremum. Il existe un Jj fini dans 1 tel que 


jeg Aj < 00. Soit u < © ce 


ND a-vl<e. (11.260) 
JE Jo 
Étant donné que tous les termes sont positifs, nous pouvons même dire que 


Daelv-e,v]. (11.261) 
JE Jo 


Pour tout K contenant Jç nous avons la même majoration et donc 


V—E< Pie Naud (11.262) 
jEJo keK 
Pour (2) Nous nommons v = Sup y fini dans 1 je @j- Soit € > 0; il existe Jo fini dans I tel 
que 
v—es D aj<v. (11.263) 
JEJo 


Pour tout X fini contenant Jç nous avons aussi ÿ jeJo 4 < Dex ax et donc 
D 'aæelv—e,vl. (11.264) 
keK 


Au final nous avons bien prouvé que 


| D ax ol <e RO PE 


keK 


Vu que pour tout €, il existe un X qui réalise (11.265), la définition 11.99 nous dit que 
Der Qi — V. 


LEMooGXPGooZTJPoN 


Lemme 11.104 (|1]). 
Soient un espace vectoriel normé V ainsi qu'une suite sommable (ax)gen dans V. Alors 


N 
5 _—— Jim > _. FqooXqWBoeLyman, 
k=0 


keN 


La somme à gauche est celle de la définition 11.99 et celle de droite est donnée par la définition 


FRE 


Démonstration. Par hypthèse, le membre de gauche existe, et nous le nommons vw. Soit e > O0. Il 
existe Jo fini dans N tel que pour tout K fini dans N tel que J5 € K, nous avons 


[D a-vl<e. (11.267) 
keK 
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Ici, la somme est celle de la définition 1.302. Nous nommons mo = max(Jo) ; pour tout m > mo 
nous avons 


Jo = {0,...,mo} € {0,...,m} (11.268) 
et donc 
UD, a-vl<e. (11.269) 
ke{0,...,m} 
La bijection à prendre dans la définition (1.302) pour faire la somme sur {0,...,m} peut être 


l'identité, de telle sorte que PRET ag = 2-0 ap. 

Nous notons s; la somme partielle s; = ÿ};_, ax. Ce que nous avons prouvé jusqu'ici est que 
pour tout €, il existe mo tel que si m > mo, alors |s; — uv] < €. Cela signifie exactement que 
My D po x = v, C’est à dire que le membre de droite de (11.266) vaut v, ce qu’il fallait. 


Exemple 11.105. 

La suite a; = (—1)' n’est pas sommable parce que quel que soit JQ fini dans N, nous pouvons trouver 
J fini contenant Jo tel que Ÿ: de J(—1) > 10. Pour cela il suffit d'ajouter à Jj suffisamment de termes 
(—1) <—10. À 


pairs. De la même façon en ajoutant des termes impairs, on peut obtenir ÿ PL 


Exemple 11.106. 


De temps en temps, la somme peut sortir d’un espace. Si nous considérons l’espace des polynômes 
[0,1] — R muni de la norme uniforme, la somme de l’ensemble 


x" 
{1 + nen (11.270) 
est zéro. 
Par contre la somme de l’ensemble {1, E }nen est l’exponentielle qui n’est pas un polynôme. A 
PROPooJLQAooAEbIvZ 


Proposition 11.107 ([1]). 
Soient un espace vectoriel normé V, deux ensembles disjoints À et B ainsi que v: AL B — V. Si 
Deave et dep Ur sont sommables 4% alors (vx)kcAUB est sommable et 


D ou dut Du. (11.271) 


keAUB keA keB 
Démonstration. Nous nommons 
Du 
(11.272) 
= Due 
keB 


et nous prouvons que s + { vérifie la propriété qu'il faut (définition 11.99) pour être D ea p Uk: 
Soit € > 0. Il existe Lo fini dans À tel que | De vx — s| < € dès que 10 € I € À. Il existe également 
Jo fini dans B tel que | ey vx — t| < e dès que HE JE B. 

Nous posons So = 10 L Jo. Si S'est fini dans À LU B et vérifie So € S € AU B, nous notons 
S, =SnAet S,=SnB. Étant donné que D € S, et Jo € Sy, nous avons 


[Du (s+01= 1 D ut Du (5 +0) cf. justiPUPEROOPZSMooRmpant, 


keS kES à keSy 
< D ve-s|+| D vx —t| (11.273b) 
keSa keSy 
< 2e. (11.273c) 
Justifications. 


— Pour 11.273a. Vu que les sommes sont finies et que $, et S, sont disjoints d'union S, nous 
pouvons couper la somme en utilisant le lemme 1.305. 


49. Définition 11.99. 
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11.8.2 Somme non dénombrables 


Nous allons voir que les sommes non dénombrables ne sont pas intéressantes : si le nombre 
de valeurs non nulles parmi les (x;);er est non dénombrable, alors la somme est infinie. La bonne 
généralisation de somme infinie dans le cas non dénombrable est l'intégrale qui viendra seulement 


avec la définition 14.163 et la mesure de Lebesgue 14.139. 
LEMooYJCVooHajEbg 


Lemme 11.108. 
Si À est non dénombrable dans R, alors il existe Ô > 0 tel que An {|x| > 0} est non dénombrable. 


Démonstration. Nous y allons par l’absurde, et nous supposons que À ne contient pas zéro (sinon 
il faut ajouter zéro aux À, ci-dessous, et ça alourdit les notations). Nous supposons donc que les 
parties 


An = An{x| > (11.274) 
n 
sont dénombrables. Mais 
(ve) 
AC | JA. (11.275) 
n=1l 


Une union dénombrable d'ensembles dénombrables est dénombrable °°. Vu qu’un ensemble non 
dénombrable ne peut être inclus dans un ensemble dénombrable °!, nous avons une contradiction. 


LEMooQIMGooOUpZjk 
Lemme 11.109. 
Soit un ensemble T et une « suite » (x;);er avec x; > 0 pour tout i. Si l’ensemble 


F={iel tel que x; > 0} (11.276) 
est non dénombrable, alors 
nd (1977) 
iel 


Démonstration. Nous considérons l’ensemble des valeurs non nulles atteintes par x : 
V = {x; tel queie F}. (11.278) 


Il y a deux possibilités : soit V est dénombrable (ou fini), soit il est non dénombrable. 


(1) V est fini ou dénombrable Dans ce cas, l’application x: F — [0,%0|[ est une applica- 
tion d’un ensemble indénombrable vers un ensemble dénombrable. Le lemme 1.140 nous 
indique qu'il existe y € IR tel que x! (y) est indénombrable et en particulier infini. La somme 
don (y) Li est une somme indénombrable de termes tous égaux et strictement positifs. Elle 
est infinie. 


(2) V est indénombrable La partie V de R est non dénombrable; elle est donc sujette au 
lemme 11.108 : il existe 0 > 0 tel que W = V n {x > 0} est indénombrable. Vu que x; > Ô 
pour tout à dans x7!1(W) nous avons 


Tj = O0. (11.279) 
iez-l(W) 


50. Proposition 1.134. 
51. Proposition 1.139. 
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11.83 Sommes dénombrables 


La proposition suivante nous enseigne que les sommes infinies se comportent normalement au 


moins en ce qui concerne les majorations termes à termes. 
PropMpBStL 


Proposition 11.110 (|[1}). 
Soit TI un ensemble dénombrable. ITEMooZSDSooFUqXDO 
(1) Soient (a)ier et (bi)ier, deux familles de réels positifs telles que a; < b; et telles que (b;) est 


52 | 
sommable”*. Alors (a;) est sommable. ITEMooREEYooUtk1Rb 


(2) Si (aijier est une famille de réels telle que (lail) est sommable, alors (a:}16st semeghñnar.s 


(3) Si(z)ier est une famille de complexes telle que (||) est sommable, alors (z;) est sommable. 


Démonstration. En plusieurs parties. 


(1) Pour (1) Nous pouvons utiliser la caractérisation 11.103; dans un premier temps nous 
avons 


Jü= sup b<o. (11.280) 
ET J fini dans 1 


Pour chaque J fini dans 1, le lemme 1.307 nous assure que 


Due) be (11.281) 


jeJ jeJ 
Donc le supremum existe et est plus petit pour (a;) que pour (b;). En utilisant à nouveau 
la caractérisation de la proposition 11.103(1) (mais dans l’autre sens), nous concluons que 
(a;);er est sommable. 
(2) Pour (2) Nous posons 1* = {ie I tel que a; > 0} et 17 = {ie I tel que a; < 0}. 
Vu que (la;l);er est sommable, la famille (a;);-7+ est sommable par le lemme 11.101. La 


famille (a;);-7- est également sommable par le même lemme appliqué à (—a;);-7- qui est 
sommable par le lemme 11.100. Nous posons 


= y (11.282a) 
iel+ 

Ter (11.282b) 
iel— 


et nous allons prouver que (a;);=r est sommable de somme ST + ST. Soit € > 0. Nous 
choisissons se) et J; tels que Je SIT, dj ET et 


| D a-Stl<e (11.283a) 
keK+ 

| D a-S |<e (11.283b) 
keK— 


pour tout K* et K7 vérifiant Jÿf € K* cItet Jj c K= CT. 
Nous posons Jo = ces U J (qui est une union disjointe). Pour tout K fini dans 7 contenant 
Jo, nous avons 


[D ar-(ST+s = D, a+ D a—5t-s"| (11.284a) 
keK keKnIT keKnI- 
< D ax-St|+| D a-5| (11.284b) 
keKnI+ keKnI- 
< 2€ (11.284c) 


parce que Jj cKnltetJCKANI.. 
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(3) Pour (3) Similaire à (2), mais en coupant en 4 morceaux au lieu de 2 : les parties réelles 
et imaginaires en plus des parties positives et négatives. 


EXooULLXooTDFYqf 
Exemple 11.111. 
Au sens de la définition 11.99 la famille C1 
ni 
n 


(11.285) 


n’est pas sommable. En effet la somme des termes pairs est © alors que la somme des termes 

impairs est —00. Quel que soit Jo € NN, nous pouvons concocter, en ajoutant des termes pairs, un 

J avec Jo € J tel que De J(—1)} /j soit arbitrairement grand. En ajoutant des termes négatifs, 

nous pouvons également rendre 3,;.7(—1)//j arbitrairement petit. A 
PropVQCooYiWTs 

Proposition 11.112. 

Si (a;) est une famille de nombres positifs indexés par N x IN alors 


D aÿ= » (> ai): (11.286) 
j=1 


(i,5)EN? i=1 


Démonstration. Nous allons utiliser la proposition 11.103 pour traiter la somme de gauche. Nous 


considérons Jmn = {0,...,m} x {0,...,n} et nous avons pour tout m et n: 
mm n 
D az =Y (2 ais): (11.287) 
(i,j)EN? (87) Jmn i=0  j=0 


Si nous fixons m et que nous prenons la limite n — 0 (qui commute avec la somme finie sur 4) 


nous trouvons 
mm O0 
D a>Ÿ o ai): (11.288) 
i=0 j 


(:,3)EN? 


Cette inégalité étant valable pour tout m, elle est encore valable à la limite m — © et donc 


D aÿ> =) ce ai): (11.289) 


(i,3)EN2 i=0 j=0 


Pour l'inégalité inverse, il faut remarquer que si J est fini dans IN?, il est forcément contenu 
dans Jn pour m et n assez grands. Alors 


mn 00 oo 
» dj >» ji — >» » Gij < à (2% s (11.290) 
(i,5)eJ (i,3)EJmn i=0 j=0 i=0  j—=0 


Cette inégalité étant valable pour tout ensemble fini J € IN?, elle reste valable pour le supremum. 


La définition générale de la somme 11.99 est compatible avec la définition usuelle dans les cas 
où cette dernière s'applique. 
PropoWHdjw 
Proposition 11.113 (commutative sommabilité). 
Soit TI un ensemble dénombrable et une bijection T: N — TI. Soit (a;);er une famille dans un espace 
vectoriel normé. Si Ÿe7 ai existe, alors il est donné par 


da dim » a7(k)- (11.291) 


iel 
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Démonstration. Nous posons a = Ÿ,,-, a. Soit e > 0 et Jo comme dans la définition. Nous choisis- 


iel 
sons 
N > max{r {(j)}. (11.292) 


Edo 


En tant que sommes sur des ensembles finis, nous avons l'égalité 


N 

ao) (11.293) 
k=0 jEJ 

où J est un sous-ensemble de 7 contenant J5. Soit J fini dans 1 tel que J5 € J. Nous avons alors 


| DE —al=1X a; -al <e (11.294) 


jeJ 


Nous avons prouvé que pour tout €, il existe N tel que n > N implique | Yo ar(x) — a < €. 


La réciproque n’est pas vraie. Même en supposant que limn_, ss. an existe, il n’est pas 
forcé que Ÿ,,-n an existe. Cela est une conséquence de l'exemple 11.111. 
PROPooWLEDooJogXpQ 


Proposition 11.114 (|1}). 
Soit un espace vectoriel normé E et une famille sommable® {v;};er d'éléments de E. Soit f: E — 
C une application sur laquelle nous supposons 


(1) f est linéaire et continue ; 
(2) la partie {f(vi)ier} est sommable. 
Alors nous pouvons permuter la somme et f : 
EQooOUNHXooKq 
fODiu) = À fus). PÉA2E) 
iel iel 


Démonstration. Soit € > 0 ; vu que les familles {v;};er et {f(v;:)}ier sont sommables, nous pouvons 
considérer les parties finies J1 et J2 de I telles que 


|Diu-Dul<e (11.296) 
jE di iel 


et 


LD Fo - > flu)l < € (11.297) 


jEJ2 iel 
Ensuite nous posons J = Ji L Jo. Avec cela nous calculons un peu avec les majorations usuelles : 


Ov) - D fol < FO 0) — FO 091 +1 09) - YF. (11.298) 


iel iel iel jeJ jeJ iel 


Le second terme est majoré par €, tandis que le premier, en utilisant la linéarité de f possède la 
majoration 


O0) — FO ol = Qu - Lol < IA Du - Du < ef. (11.299) 


iel jeJ iel jeJ ici jeJ 


Donc pour tout € > 0 nous avons 


AO vi) — D Fu) < e(1 + | FI). (11.300) 


iecl iel 


D'où l'égalité (11.295). 
53. Définition 11.99. 
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11.9 Série réelle 


secseries 

La notion de série formalise le concept de somme infinie °*. L'absence de certaines propriétés 

de ces objets (problèmes de commutativité et même d’associativité) incite à la prudence et montre 
à quel point une définition précise est importante. 


11.9.1 Critères de convergence absolue 


Étant donné le terme général d’une série, il est souvent -dans les cas qui nous intéressent 
difficile de déterminer la somme de la série. L'exemple de la série géométrique est particulier °”, 
puisqu'on connaît une formule pour chaque somme partielle, mais pour l’exemple des séries de 
Riemann il n’y a aucune formule simple pour un «a général. D’où l'intérêt d’avoir des critères de 
convergence ne nécessitant aucune connaissance de l’éventuelle limite de la série. 


LemgHWyfG 
Lemme 11.115 (Critère de comparaison). 
Soient D, a; et D b; deux séries à termes positifs vérifiant 
HEUES 
alors 
(1) si >; diverge, alors »;;b; diverge, 
(2) si >,;b; converge, alors Ÿ,; a; converge (absolument). 
PROPooEFACooUYmtxd 


Proposition 11.116 (Critère d’équivalence[323]). 
Soient D; a et 2; b; deux séries à termes positifs. Supposons l'existence de la limite (éventuelle- 
ment infinie) suivante 


lim © =a (11.301) 
i— 00 b; 
avec à € RU {+0}. Alors 
(1) sia Æ£0 et a Æ ©, alors 
D CONVETGE > db; converge, (11.302) 
i j 


(2) sia =0 et },;b; converge, alors Ÿ;; ai converge (absolument), 
(3) si a = +00 et 3,:b; diverge, alors 3; a; diverge. 
Démonstration. (1) Le fait que la suite a,/b, converge vers à signifie que tant sa limite supérieure 
que sa limite inférieure convergent vers @. En particulier la suite e est bornée vers le haut 


et vers le bas. À partir d’un certain rang M, il existe M tel que 


M 2 M (11.303) 
bn 

et il existe m tel que 
ne (11.304) 
bn 


Nous avons donc an < Mb et an > mbn. La série de (a,) converge donc si et seulement si 
la série de (b,) converge. 

(2) Si a = 0, cela signifie que pour tout €, il existe un rang tel que — < €, et donc tel que 
An < €bg. La série de (a;) converge donc dès que la série de (b;) converge. 

(3) Pour tout M, il existe un rang dans la suite à partir duquel on a % > M, et donc ax > Mbz. 


à 


Si la série de (b4) diverge, la série de (ax) doit également diverger. 


54. La caractérisation qui nous intéresse est celle de la proposition 11.103. 
55. Voir la proposition 11.122. 
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PropOUXKUooQmAaJX 
Proposition 11.117 (Critère du quotient[330]). 
Soit D; a; une série. Supposons l'existence de la limite (éventuellement infinie) suivante 


di+1 
di 


lim 7 (11.305) 
1—>00 


avec LE RL {+}. Alors 
(1) si L <1, la série converge absolument, 
(2) si L > 1, la série diverge, 


(3) si L = 1 le critère échoue : il existe des exemples de convergence et des exemples de divergence. 


Démonstration. (1) Soit b tel que L < b < 1. À partir d’un certain rang K, on a = < b. En 
particulier, 
lax+1| < blax|, (11.306) 
et pour ax+2 nous avons 
lax+2| < blak+l < b|ax|. (11.307) 
Au final, 
laxin| < 0°lax|. (11.308) 


Étant donné que la série D n>x 0" converge (parce que b < 1), la queue de suite Ÿ x @; 
converge, et par conséquent la suite au complet converge. 


(2) SiL>1,ona 
lax| < larkail < lerkyol <.: (11.309) 


Il est donc impossible que la suite (a;) converge vers zéro. La série ne peut donc pas converger. 


(3) Par exemple la suite harmonique a» = L vérifie L = 1, mais la série ne converge pas. Par 


contre, la suite ay = = vérifie aussi le critère avec L = 1 tandis que la série ÿ,, = converge. 


Proposition 11.118 (Critère de la racine[323]). 


Soit ÿ,; a; une série, et considérons 
lim sup W/la;| = L 
i—00 


avec LE RU {+}. Alors 
(1) si L <1, la série converge absolument, 
(2) si L > 1, la série diverge, 
(3) si L = 1 le critère échoue. 


Démonstration. (1) Si L < 1, il existe un r € ]0,1[ tel que [a,|!/" < r pour les grands n. Dans 

ce cas, [an| < r”, et la série converge absolument parce que la série Ÿ,, r” converge du fait 

que r < 1. 

(2) Si L > 1, il existe un r > 1 tel que [a,|!/" > r > 1. Cela fait que |a,| prend des valeurs plus 
grandes que n pour une infinité de termes. Le terme général a, ne peut donc pas être une 


suite convergente. Par conséquent la suite diverge au sens où elle ne converge pas. 


11.9.2 Critères de convergence simple 


Les critères de comparaison, d'équivalence, du quotient et de la racine sont des critères de 
convergence absolue. Pour conclure à une convergence simple qui n’est pas une convergence absolue, 
le critère d’Abel sera notre outil principal. 
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11.9.2.1 Critère d’Abel 
Proposition 11.119 (Critère d’Abel). 
Soit la série D, c;z; avec 
(1) (&) est une suite réelle décroissante qui tend vers zéro, 


(2) (i) est une suite dans © dont la suite des sommes partielles est bornée dans ©, c’est-à-dire 
qu'il existe un M > 0 tel que pour tout n, 


nm 
DE 
i=1 


< M. (11.310) 


Alors la série + GiZi est convergente. 


Remarquons que ce critère ne donne pas de convergence absolue. 


11.9.3 Quelques séries usuelles 
SUBBEHEooBÆYKooKjNKUf 


Proposition 11.120 (Série harmonique). 
La série harmonique converge vers l'infini : 


00 
1 
> = +. (11.311) 


2n 1 
Hin—Hn= Ÿ . (11.312) 
k=n+1 


Cette somme contient n + 1 termes, tous plus grands que +, donc 


1 1 
Hn-Hn>nx — =—-. (11.313) 
2n 2 


Nous prouvons donc par récurrence que Horn > 5. D'abord pour n = 1 nous avons 
1 
H2 = 1 + 2 (11.314) 


Ensuite la récurrence : ; — 
n — n 
H. nm _ H. n— D —= Ë 11. 1 
5 on-1 + 5 5 + 5 5 ( 3 5) 


11.121. 
À quel point la série harmonique diverge-t-elle lentement ? Allez regarder 
https://www.youtube.com/watch?v=_AtkIpi6KPO. 


PROPooWOWQooWbzukS 
Proposition-Définition 11.122 (Série géométrique). 
La série géométrique de raison q € © est 
+ à EqZQTGooTWEE 
re PAGES 
i=0 
ITEMooAFAMooGuXqBm 


(1) Elle converge si et seulement si |q| < 1. 


56. Vous pouvez aussi dire qu’elle diverge, mais si on met la bonne topologie sur KR, la convergence vers +00 est 
plus précise que la non-convergence. 
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ITEMooBJHBooBMEmiG 
(2) Si |ql < 1 alors 
00 
1 EqRG 
n=0 À 
(3) Quand la série géométrique converge, la convergence est absolue. ITEMooVZHKooNGpDkx 


(4) Si la somme commence en n = 1 au lieu de n = 0 alors 
O0 
EqPZOWooMd 
Sa 1 <POioep ES 
n=1 È 
Démonstration. La somme partielle est déjà donnée dans le lemme 1.470 : 


ne 
ee | 11.319 
N = de ( ) 
En vertu de (10.129), la limite limn_, Sn existe si et seulement si |g] < 1 et dans ce cas nous 
avons le résultat parce que g +1 - 0. 

Pour le dernier point, il s’agit seulement du calcul 


mr — 1 = : 11.320 
Dr--i- (11.320) 


Un cas particulier de la formule (1.657) est le calcul de 2. q_1 bien utile lorsque l’on joue 
avec des nombres binaires (voir l'exemple 34.12). Nous avons 


N 


ÿ  — ÿ  — sg, EnooFMBAoGEIKENT 
j=1 ÿ=0 ne 


La série de Riemann est très liée aux intégrales impropres de la proposition 14.277. 
PRERooEPVKooGn#Qrs 


Proposition 11.123 (Série de Riemann). 
Pour a € R, la série de Riemann 


> = FRET) 


converge (absolument, puisque réelle et positive) si et seulement si a > 1, et diverge sinon. 
ExIJMHooUEUKf j 

Lemme 11.124 (Série exponentielle). 

La série 

tk 

E 


18 


exp(t) = (11.323) 


k 


0 


converge pour tout t € R. 
Elle est nommée . Pour tout savoir de l’exponentielle et de ses variations, voir le thème 29. 


Démonstration. Si ax = t*/k! alors _. = À dont la limite k — 00 est zéro (quel que soit t). 
En vertu du critère du quotient 11.117 la série exponentielle converge (absolument) pour tout 
teR. 


LEMooCVIQooUtuzgE 
Lemme 11.125 (Série arithmético-géométrique[331]). 
Une suite arithmético-géométrique est une suite vérifiant pour tout n la relation 


Uns1 = un + D (11.324) 


avec à et b non nuls. Nous nommons up le premier terme. 
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(1) Si la suite possède une limite, alors elle est donnée par 


_ b EQooMZSSo Pas 


(2) Pour tout n nous avons la formule 
Un = a (uo — ) + L. (11.326) 


Démonstration. Si la suite possède une limite, cette dernière doit résoudre { = al + b, et donc être 
égale à (11.325). 

Il n’est pas très compliqué de trouver le terme général de la suite en fonction de a et de b. Il 
suffit de considérer la suite v, = un — l, et de remarquer que cette suite est géométrique : 


Uni1 = Un. (11.327) 
Par conséquent v, = a”vo, ce qui donne pour la suite (u,) la formule 
Un = (ug — À) + l. (11.328) 
LEMooKDHPooP1FTIT 
Lemme 11.126 ([332]). 
Nous avons : 
N 
>, (11.329) 
ZAk&k+1) N+1 | 
et 
e 1 
D — = 1. (11.330) 
1 k(k +1) 
Démonstration. Nous posons 
É 1 
= —————— 11.331 
fn) 5 (11.331a) 
n 
= 11.331b 
g(n) = (1.331b) 


et nous montrons par récurrence que f(n) = g(n). Pour n = 1 nous avons f(1) = g(1) = à. 


Nous supposons que f(n) = g(n) et nous prouvons que f(n + 1) = g(n +1). Facile : 


l 
SE In: Dnid 11.332 
f(n+1) +5 : 
nm l 

_ ui 11.332b 
n+1 (n+1)(n+2) ( ) 
n(n +2) +1 

_ 11.332 
(n + 1)(n + 2) ( c) 

nm? +n +1 

_ 11.332d 

(n + 1)(n +2) ( ) 
2 

= 0e (11.332e) 
(n + 1)(n +2) 
n+l1 

_ 11.332f 
n +2 ( ) 

p'un, (11.3328) 

En ce qui concerne la seconde formule, par définition °? 
00 1 n 1 : 
RŒ+D ES: = 1. ii: 


57. Définition d’une série, 11.78. 
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11.9.4 Séries alternées 
THOoo0OHANooHYfkII 


Théorème 11.127 (Critère des séries alternées[309]). 
Soit (an)nen est une suite positive décroissante à limite nulle. Nous notons Sn la somme partielle 
de la série alternée : Sn = D %_o(—1) ag. Alors 
(1) les sous-suites (San) et (S2n+1) sont adjacentes ®. 
(2) La série ÿ,(—1)"an converge. 


ITEMooWEPWooXhLMYL 
(3) Si nous considérons le reste 

00 

Rn= D, (—-1)*&, (11.334) 
k=n+1 
nous avons 

sen(R,) = (—1)"+1 (11.335a) 
IA Sani (11.335b) 


Démonstration. En termes de notations, nous allons écrire ($,) la suite des sommes partielles 
de > 9(—1)fax. Nous notons (S2,) la suite des termes pairs de cette suite. C’est donc la suite 
ne 621. Nous divisons en plusieurs morceaux. 


(1) Sr est croissante Nous avons simplement 


Son+2 — Son = An+2 — An+1 < 0. (11.336) 


(2) (S2n+1) est décroissante Même calcul. 


(3) Les suites (S2) et S2+1 sont adjacentes Nous avons simplement 


Son+1 — S92n = An+1 > 0. (11.337) 


Nous concluons par le théorème des suites adjacentes 10.40 que les sous-suites des termes 
pairs et impairs sont convergentes et convergent vers la même limite. 


C’est le moment d'utiliser la proposition 10.41 qui convainera la lectrice que ($,) converge vers la 
même limite, que nous notons S. Le théorème des suites adjacentes nous dit encore que 


Son+1 < S < Son (11.338) 


et donc que Ron = S — Son < 0. Cela donne la majoration 


[Ronl = |S — Son] = Son — S < Son — Son+1 = A2n+1- (11.339) 


Nous faisons le même genre de majorations pour Ron+1. 


11.9.5 Moyenne de Cesàro 


La moyenne de Cesàro est le premier pas dans la direction des supersommes|2] qui permettent 
de sommer des choses de moins en moins convergentes, jusqu’à sommer la fameuse série 1 + 2 + 
3+4+...—=—1/12. 
DEFooLVRLooTeowkn 
Définition 11.128. 
Si a: N — V est une suite dans l’espace vectoriel V, alors sa moyenne de Cesàro est la limite 
(si elle existe) de la suite 


1 nm 
On(a) = = > de (11.340) 
k=1 


En un mot, c’est la limite des moyennes partielles. 


58. Définition 10.39. 
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LemyGjMqM 
Lemme 11.129. 
Si la suite (ay) converge vers la limite L alors la suite admet une moyenne de Cesàro qui vaudra L. 


Démonstration. Soit € > 0 et N € N tel que |a, — £| < € pour tout n > N. En remarquant que 


1 © 1 © 
= DCE = D (ax — 4), (11.341) 


nous avons 


1 À 1 N 1 n 

= 2 sie F2: les — {|| + F > 41 (11.342a) 
ver 1 (11.342b) 
< 2e. (11.342c) 


Dans ce calcul nous avons redéfini N de telle sorte que le premier terme soit inférieur à €. 


11.9.6 Écriture décimale d’un réel 


Nous avons déjà vu la fonction (1.118) qui permet d’écrire des naturels dans une base b > 2 
donnée. Nous allons maintenant construire une fonction du même type, pour la partie décimale 
d’un réel. 


NORMALooTZWYooPMgOIm 
11.130. 
Soit b > 2 un entier qui sera la base dans laquelle nous allons écrire les nombres. Nous considérons 
l’ensemble D, des suites dans {0,1,...,b— 1} qui n’ont pas une queue de suite uniquement formée 


de b — 1. Autrement dit une suite (c,) est dans D, lorsque pour tout N, il existe k > N tel que 
cx Æ b — 1. Associé à cet ensemble nous considérons la fonction 


Pb: De md [0,1[ 
oO 


on. 


n=1l 


FAOPPEEAS 


Lemme 11.131. 
La fonction w\ est bien définie au sens où elle converge et prend ses valeurs dans [0,1[. 


Démonstration. Tout se base sur la somme de la série géométrique (11.317) sous la forme 


D Fazer 


bk 


La somme (11.343) est donc majorée par },, ee qui converge. 
Pour prouver que l’image de 4, est bien [0,1[, nous savons qu’au moins un des c, (en fait une 
infinité) est plus petit que b — 1, donc nous avons la majoration stricte °° 


? POI EE (11.345) 
n=1 


do _— 
pu(c) < >» pr 
n=1 


59. Notez que la somme (11.343) commence à un tandis que la série géométrique (11.344) commence à zéro. 
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Le fait d'introduire l’ensemble D au lieu de l’ensemble de toutes les suites est justifié par 
la proposition suivante. Elle explique pourquoi un nombre possède au maximum deux écritures 
décimales distinctes et que ces deux sont obligatoirement de la forme, par exemple en base 10 : 


0.34599999999 ... = 0.34600000 (11.346) 


mais qu’un nombre commençant par 0.347 ne peut pas être égal. C’est pour cela que dans la 
définition de ID; nous avons exclu les suites qui terminent par tout des b — 1. 
La proposition suivante complète ce qui est déjà dit dans le lemme 7.264. 


PropSAUoofRIQR 
Proposition 11.132. 
Soit la fonction 
g:{0,...,b—1}" — [0,1[ 
OO 
_. (11.347) 
n=1l 
Si (x) = p(y) et si no est le plus petit entier tel que tn, Æ Yn, alors soit 
Eng — Una — 1 (11.348) 


et Tn = 0, Yn = b — 1 pour tout n > no, soit le contraire : Yns — Tny = 1 AVEC Yn = 0 Et En = b—1 
pour tout n > no. 


Démonstration. Nous nous basons sur la formule (facilement dérivable depuis (11.344)) suivante : 


D 1 1  b 
Ds re, (11.349) 
k=no+1l 


Nous avons 


Tno — Yno : Tn — Yn Tno — Uno : b—1 Lno — Uno — 1 


n=no+1l bo n=n0o+1l L bo 
(11.350) 
Le dernier terme étant manifestement positif, il est nul et nous avons tn, — Yno = 1. 
Nous avons donc maintenant 
1 - - 
0=p)-vwy= + À . FERME ETS 
n=no+l 


Nous majorons la dernière somme de la façon suivante, en supposant que |æ» — y,| # b — 1 pour 
un certain n > No : 


= Tn — Un C [En — Ynl es b—i 1 
Y de > >. nr. (11.352) 
n=no+l n=no+l n=no+l 


Étant donné cette inégalité stricte, l'équation (11.351) ne peut pas être correcte (valoir zéro). Nous 
avons donc [ty — b,| = b — 1 pour tout n > no. Donc pour chaque n > n9 nous avons soit 4h = 0 
et Yn = b— 1, soit a, = b— 1 et b, = 0. Pour conclure il faut encore prouver que le choix doit être 
le même pour tout n. 

Nous nous mettons dans le cas Zn, — Yns — 1; dans ce cas nous avons bien l'égalité (11.351) 
sans petites nuances de signes. Nous écrivons 


5 = (b— 1) : 1 (11.353) 


n=no+l n=no+l 


60. C’est ici qu'intervient la subdivision entre le cas 7, — Yns — 1 ou le contraire. En effet si « ce dernier terme 
était manifestement négatif », il aurait fallu majorer avec de 1 — b au lieu de 1 — b. 
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où 5, est pair ou impair suivant que Æn = 0, Yyn = b — 1 ou le contraire. Si un des (—1)*" est pas 
—1 alors nous avons l’inégalité stricte 


 (—1)*"  —1 1 

@—1) D, nm Ve . ee (11.354) 
n=no+l n=no+l 

Dans ce cas il est impossible d’avoir @(x) — (y) = 0. Nous en concluons que (—1)%" est toujours 

—1, c’est-à-dire zn — Yn = 1 — b, ce qui laisse comme seule possibilité x, = 0 et yn = b— 1. 

ThoRXBootpUpd 


Théorème 11.133. 
L'application 5: Di — [0,1] est bijective. 


Démonstration. En ce qui concerne l’injection, nous savons de la proposition 11.132 que si w(x) = 
gv(y) pour æ,y € {0,...,b—1}N, alors soit x soit y a une queue de suite composée uniquement de 
b—1, ce qui est exclu dans D;4. Nous en déduisons que w, est bien injective en prenant D, comme 
ensemble départ. 

La partie lourde est la surjectivité. Nous prenons x € [0,1] et nous allons construire par 
récurrence une suite a € D, telle que (a) = x. Si il existe a1 € {0,...,b — 1} tel que x = a1/b 
alors nous prenons la suite (a1,0,...,) et nous avons évidemment w(a) = x. Sinon il existe aj € 
{0,...,b— 1} tel que 


a] > a +l 
— <X 

b b 
parce que les autres possibilités pour x sont dans l’ensemble [0, 1[\{Ë} k=0,..,b-1 que nous subdivi- 
sons en 


(11.355) 


1 1 2 b—1 
0, — —,— ei ——,1|. 11.356 
Pour la récurrence nous supposons avoir trouvé a1,...,an tels que 
n n—1 
ak a An +l 
ces) et + (11.357) 
k=1 k=1 
Encore une fois si il existe an+1 € {0,...,b—1} tel que Ju 7 = x alors nous prenons ce an+1 et 


nous complétons la suite avec des zéros pour avoir (a) = x. Sinon , pour simplifier les notations 
nous notons 2’ = x— 3}, }# et nous avons 


5 An +l 


Dep < 7e (11.358) 
Le nombre x’ est forcément dans un des intervalles 
Pr it (11.359) 
avec 8 € {0,...,b—1}. Nous prenons le s correspondant à +” comme 4,41. Dans ce cas nous avons 
sn no 1 
2 DE <E< 2 mr (11.360) 


Note : les deux inégalités sont strictes. La première parce que si il y avait égalité, nous nous serions 
déjà arrêté en complétant avec des zéros. La seconde parce que 


TO à = bel 1 
>, ms < D = (11.361) 
k=n+2 k=n+2 


où l'égalité n’est possible que si az = b — 1 pour tout k > n +2. Dans ce cas nous aurions eu 


nm 
Ah Anti +l 


ni (11.362) 
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et nous aurions choisi le nombre a,+1 autrement et complété la suite par des zéros à partir de là. 
Notons que cela prouve au passage que la suite que nous sommes en train de construire est bien 
dans D, parce qu’elle ne contiendra pas de queue de suite composée de b — 1. 


Ceci termine la construction par récurrence de la suite a € D4. Par construction nous avons 
pour tout N > 1, 


U (07% U Ak 1 
» s £xr< > DE + MESÉ (11.363) 
k=1 k=1 
autrement dit : wp(a1,...,an) € B(x, — ). Nous avons donc bien convergence 
lim w(a1,...,an) = x (11.364) 
N—0co 


et l'application w, est surjective. 


L'application de [0,1[— D, est la décomposition décimale en base b des nombres de 
[0,1[. 

Tout cela nous permet de montrer entre autres que R n’est pas dénombrable. Vu qu'il y a une 
bijection entre [0,1[ et D}, il suffit de prouver que D, est non dénombrable. De plus il suffit de 
démontrer que D, est non dénombrable pour un entier b > 2 donné. 


PropNNHooYTVFw 
Proposition 11.134 ([333]). 
Il n'existe pas de surjection N — D,. Autrement dit D, est non dénombrable. 


Démonstration. Nous prenons b Æ 2 pour des raisons qui seront claires plus tard. Soit f : N — D. 
Pour à € N nous notons 


fn) = (9), (11.365) 
et nous définissons la suite 
:  (k) 
0 sic; Æ0 
Ck — 11.366 
. É si c{o) = (. ( 


C’est une suite dans D, parce que b £ 2 et que la suite ne contient que des 0 et des 1. Maïs nous 
n'avons f(n) = c pour aucun n € N parce que nous avons Cy Æ f(n)n. 

Si b = 2 alors nous savons que D2 — [0,1[- D3. Donc D2 — D3 et D2 ne peut pas plus être 
mis en bijection avec N que D3. 


Remarque 11.135. 
Le cas de la base b = 2 doit être fait à part parce que rien n’empêche d’avoir une queue de 1. Il y 
a alors toutefois moyen de se débrouiller en construisant la suite c de façon plus subtile. Si b = 2 
et n € NN alors f(n) est une suite de 0 et 1 contenant une infinité de 0 (parce qu’il n’y à pas de 
queue de suite ne contenant que des 1). Nous construisons alors c de la façon suivante : d’abord 
nous recopions f(0) jusqu’à son deuxième zéro que nous changeons en 1; nommons n9 le rang de 
ce deuxième zéro. Ensuite nous recopions les éléments de f(1) à partir du rang no + 1 jusqu’au 
second zéro que nous changeons en 1, etc. 

Le fait de prendre le deuxième zéro nous garantit que la suite c n’aura pas de queue de suite 
ne contenant que des 1. 

Notons que cette construction s’adapte à tout b; il suffit de prendre le second terme qui n’est 
pas b — 1 et le remplacer par b — 1. 


Corolaire 11.136. 
L'ensemble [0,1[ n’est pas dénombrable. 


Démonstration. L'ensemble [0,1] est en bijection avec D, que nous venons de prouver n'être pas 
dénombrable. 
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11.9.7 Théorème de Banach-Steinhaus 
LEMooPIPLooMppGSO 


Lemme 11.137 ([334]). 
Soient des espaces vectoriels normés X et Y ainsi qu'une application linéaire bornée T: X — Y. 
Pour tout a € X et pour tout r > O0 nous avons 


sup |Tx] > rÎT| (11.367) 


xæeB(a,r) 


Démonstration. Nous commençons avec a = 0. En utilisant la définition 11.51 de la norme opéra- 


teur, 

T T 1 
IT] = a Lu : ITæ| <— sup |[Tx|. (11.368) 
zeX |tl  z2eB(or) IX  TxeB(0r) 


Donc 
sup |[Tx| > rÎT|. (11.369) 


xeB(0;r) 


Il y à maintenant une astuce. Nous considérons un maximum : 


max{|T(a + ), (T(a— x)|} > 2 (|T(a + )| + IT(a — 2)f) 70 POP ST Ua) 


1 
2 


> (Ta +2) Ta + 2)]) SEAT RES) 
= IT EH) (11.3700) 
= Txl. (11.370d) 


Justifications : 
— Pour (11.370a), la moyenne est plus petite que le maximum. 
— Pour (11.370b), négalité triangulaire : |a — 8] < |a| + |]. 


Si maintenant y € B(a,r), nous avons y = a + x pour un certain x € B(0,r), donc 


. Tu = es EE (11.371a) 

yeB(a,r TE T 
BE ACJS0ooT 

= dp more ALT Ar PPT 
xeB(0,r) 

> sup |[Tx| (11.371c) 
xeB(0,r) 

> rIT|. (11.371d) 


Pour (11.371b), l’ensemble sur lequel nous prenons le supremum n’est pas modifié fondamentale- 
ment si nous regroupons les éléments deux à deux en prenant le maximum : les éléments exclus 


sont majorés. 


UÜne version avec des seminormes sera le théorème 27.5. 
THOooJHVNooIDDxyT 


Théorème 11.138 (Théorème de Banach-Steinhaus|[334]). 
Soient un espace de Banach°! X et un espace vectoriel normé Y. Soit une famille F d'opérateurs 
linéaire bornés. Si pour tout x € X, 


sup |Tx| < ©, (11.372) 
TEF 

alors 
sup |T| < oo. (11.373) 
TeF 


61. Définition 7.255. 
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Démonstration. Nous supposons que suprer |T|] = 0, de telle sorte que nous pouvons choisir 
une suite (7,) dans F telle que |T, |] — 0. Cette suite peut diverger arbitrairement vite, et nous 
fixerons exactement cela plus tard. 

Soit par ailleurs une suite a, > 0 d'éléments petits et tels que a, — 0. Nous supposons que 
on: 

Si a € À, le lemme 11.137 dit que 


sup  [Tnx| > |Talan. (11.374) 


xeB(a,an 


En posant 70 = 0, nous construisons une suite (x,) par récurrence en imposant 
(1) ïn € B(tn-1, An) 
(2) ITntn| > Tran: 


En utilisant une série télescopique et l’inégalité triangulaire |xz — xr11| < a, à chaque étage 
piq + , 


q O0 
lo — Tal < 2% < D (11.375) 


Mais puisque la somme des a, converge, la suite des queues de somme converge vers zéro (? : 
lim 2 an = 0. Cela implique que (x,) est une suite de Cauchy %. Vu que X est de Banach, 
la suite (x,) a une limite dans X. Soit x cette limite. 

Nous avons 5, = |x, — x] — 0. Il y aurait moyen de calculer 5, en fonction de a, (surtout si 
nous avions donné une forme explicite à a,), mais c’est sans importance ici. L'important est que 
c’est une suite qui tend vers zéro. 

Nous avons 


x E B(tn, Pn), (11.376) 


et donc il existe an € B(0, B,) tel que x = x, + an. Avec cela, pour chaque n nous avons : 


nr] = ]Tn(tn + an)| (11.377a) 
> |Tntn| — |Tnan| (11.377b) 
> Turn | : IT Bn SUBEHOoPLIT EAU 
> [nan — |Tnl8n = |Tnl(an — Bn)- (11.377d) 


Pour 11.377c, nous avons utilisé |T,a;| < |Th|Bn. En résumé, 


Tnt > |Tnl(an — Bn). (11.378) 
Il suffit de choisir |7,|| suffisamment rapidement croissant pour que °{ 


ITn(an — Bn) — 0, (11.379) 


et nous avons |T,x| — 0, qui est contraire aux hypothèses. 
ThoPFBMHBN 

Théorème 11.139 (Théorème de Banach-Steinhaus[103, 335]). 

Soit E un espace de Banach®® et F un espace vectoriel normé. Nous considérons une partie 

H € £L&«(E,F) (espace des applications linéaires continues). Alors H est uniformément borné 

si et seulement si il est simplement borné. 


62. Lemme 11.80(2). 

63. Proposition 7.259. 

64. Le point important ici est que ax (et donc B,) est choisi sans référence à |T, ||. 
65. Définition 7.255. 
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Démonstration. Si H est uniformément borné, il est borné; pas besoin de rester longtemps sur ce 
sens de l’équivalence. Supposons donc que H soit borné. Pour chaque k € N* nous considérons 
l’ensemble 
Qz = {xe E tel que sup |f(x)| > k}. (11.380) 
feH 


(1) Les (; sont ouverts Soit to € (3 ; nous avons alors une fonction f € H telle que | f(xo)| > 
k, et par continuité de f il existe p > 0 tel que |f(x)| > k pour tout x € B(xo,p). Par 
conséquent B(x0, p) € (4 et (x est ouvert par le théorème 7.8. 


(2) Les (; ne sont pas tous denses dans Æ Nous supposons que les ensembles Qz; soient 
tous dense dans Æ. Le théorème de Baïre 7.351 nous indique que Æ est un espace de Baire 
(parce que de Banach) et donc que 


(= E. (11.381) 


En particulier l’intersection des (x n’est pas vide. Soit xo € ke Q4. Nous avons alors 


sup |f(æ)| = co, (11.382) 
feH 


ce qui est contraire à l'hypothèse. Donc les ouverts (} ne sont pas tous denses dans E. 


(3) La majoration Il existe 4 > 0 tel que (% ne soit pas dense dans Æ, et nous voulons prouver 
que {|f| tel que f € H} est un ensemble borné. Soit donc k > 0 tel que (Z ne soit pas dense 
dans E ; il existe un x9 € E et p > 0 tels que 


B(x0, p) [A] Qz = SZ. (11.383) 
Si x Ee B(x0, p) alors x n’est pas dans (} et donc 


sup |f(x)| < k. (11.384) 
feH 


Afin d'évaluer | f|| nous devons savoir ce qu’il se passe avec les vecteurs sur une boule autour 
de 0. Pour tout x € B(0,p) et pour tout f € H, la linéarité de f donne 


1 f(x) = f(x + %o) — f(xo)| < 1 f(x + %0) + F(xo)| < 24. (11.385) 


Par continuité nous avons alors | f(x)| < 2k pour tout x € B(0,p). Si maintenant x € F 
vérifie |x| = 1 nous avons 


|f(æ)| = (os) < ze, (11.386) 


et donc | f| < , ce qui montre que 2k/p est un majorant de l’ensemble {| f| tel que f € H}. 


Une application du théorème de Banach-Steinhaus est l’existence de fonctions continues et 
périodiques dont la série de Fourier ne converge pas. Ce sera l’objet de la proposition 28.21. 


11.9.8 Convergence forte 


Lorsque nous avons une suite d'opérateurs linéaires, nous pouvons considérer la convergence 
d’une suite pour la norme opérateur : A; — À lorsque | Ax — A] — 0. 
DEFooNREQooElLvec 
Définition 11.140 ([336|). 
Soient un espace vectoriel E et un espace vectoriel normé V. Nous disons que la suite d’opérateur 
T,: E — V converge fortement vers l’opérateur T' si pour tout x € E nous avons 


[Trx — Tax] — 0. (11.387) 
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Cette notion s’appelle forte par opposition à la convergence faible dont nous ne parlerons pas. 


Elle est cependant moins forte que la convergence en norme dont nous avons déjà parlé. 
PROPooRFBLooUjSirP 


Proposition 11.141. 
Soient des espaces vectoriels normés E et F et une suite d'opérateurs T},: E — F convergeant vers 
T6. Alors cette suite converge également fortement. 


Démonstration. Soit x € E que nous supposons non nul. Soit À e € tel que x = Ày avec |y| = 1. 
Nous avons 


ITkx — Tax] = AÏTey — Tyl < [A PE ITkz — Tel = [ATX — T] — 0. (11.388) 
| =1 


La dernière étape est la convergence en norme T% — T. 


PROPooESZVooJNCidk 
Proposition 11.142. 
Soient E et F, des espaces vectoriels normés de dimension finie. Soit une suite (A,) d'applications 
linéaires E — F. Si elle converge fortement vers À, alors elle converge en norme vers À. 


Démonstration. En plusieurs coups. 


(1) Si une sous-suite converge Commençons par montrer que si (B,) est une sous-suite de 
(An) qui converge vers B, alors B = A. Autrement dit, À est le seul candidat limite pour 
An. 


Soit |x| = 1. Nous avons 


1Bnx — Bx| < | Bn — B|Ix| = | Br — B|, (11.389) 


mais pour la sous-suite (B,) nous avons supposé |B, — B| — 0. Donc | B,x — Bx| — 0, 
ce qui signifie que B,x — Bx. Mais par hypothèse, B,x — Ax. Par unicité de la limite, 
Bx = Ax pour tout x de norme 1. Pour les autres x, c’est la linéarité qui conclut. 


(2) Utilisation de deux gros résultats Par l'hypothèse de convergence, pour chaque x nous 
avons sup, | Ant| < 00. Le théorème de Banach-Steinhaus 11.138 nous indique alors que 
l’ensemble F = {A;}hen est borné. Il existe donc M > 0 tel que |A, | < M pour tout n. 


Nous utilisons à présent l'hypothèse de dimension finie en disant que l’espace des applications 
linéaires £ — Fest de dimension finie, de telle sorte que ses boules fermées soient compactes. 


Donc la suite (4,) est contenue dans un compact. 


(3) Les sous-suite convergentes La suite (4,) est contenue dans un compact. Toutes ses 
sous-suites sont dans ce compact et possèdent donc une sous-suite convergente (théorème 
7.136). Toutes ces sous-sous-suites convergent nécessairement vers À par ce que nous avons 
dit dans la première étape de la preuve. Le lemme 7.61 nous dit alors que À, — À. 


11.10 Application ouverte 


Définition 11.143 (application ouverte). 
Soient deux espaces topologiques X et Y. Une application f: X — Y est ouverte si l’image de 
tout ouvert de X par f est un ouvert de Y. 


Nous disons que f est ouverte en a € X si l’image de tout ouvert contenant a est ouverte. 
PROPooXGEGooHoMsne 


Proposition 11.144. 
Une application bijective est ouverte si et seulement si son inverse est continue. 


66. Sans précisions, ce sera toujours la convergence en norme. 
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Démonstration. Ce n’est seulement que la définition, mais pour le sport nous démontrons le sens 
direct. 

Soit donc une application f: À — Y bijective et ouverte entre les espaces topologiques X et 
Y. Prouvons que fl: Y — X est continue. Pour cela nous considérons un ouvert © dans X, et 
nous prouvons que (f-!) (©) est ouvert dans Y. Par définition de l'inverse, (f-!)-1(O) = f(O) 
et vu que f est ouverte, f(O) est ouvert. 


LEMooHHIPooEpGfCg 
Lemme 11.145. 
Une application f: X — Y est ouverte si et seulement si pour tout x € X et pour tout voisinage 
U de x, la partie f(U) est un voisinage de f(x). 


Démonstration. La preuve suit celle de la proposition 7.195. Le sens direct est un à fortiori. 
Dans l’autre sens. Soit un ouvert © de X. Pour prouver que f(O) est ouvert, nous considérons 
y € f(O), ainsi que x € © tel que f(x) = y. Vu que © est un voisinage de x, la partie f(©) est un 
voisinage de y = f(x). 
Il existe donc un ouvert V de Y tel que y = f(x) € V € f(O). Donc la partie f(O) contient 
un ouvert autour de chacun de ses points, et elle est ouverte par le théorème 7.8. 


Lemme 11.146 ([337]). 
Une application linéaire entre espaces vectoriels topologiques est ouverte si et seulement si elle est 
ouverte en 0. 


Démonstration. Le sens direct est un à fortiori. 

Soit un ouvert © et a € ©. La partie © — a est ouverte et contient 0. Donc f(O — a) est un 
ouvert parce que f est ouverte en 0. Nous en déduisons, par linéarité, que f(©) — f(a) est ouvert 
et donc que f(O) est ouverte. 


Lemme 11.147 ([337]). 
Soient des espaces vectoriels normés E et F. Une application linéaire ouverte f: E — F est 
surjective. 


Démonstration. Soit un ouvert B(0,r) dans E. Puisque f est ouverte, la partie f(B(0;r)) est 
ouverte dans F, et contient donc une boule Br(0,r’) pour un certain r” > 0. 


Soit ve F. Nous considérons F 
! ! 


DT & 
2|v| 


(11.390) 


Nous avons |v'| = r’/2, et donc v’ € Br(0,r'). Il existe donc x € E (et même dans Bg(0,r)) tel 


que f(x) = v’. Nous avons alors 
2|v| 
sé 


ce qui prouve que v est dans l’image de f, et donc que f est surjective. 


di) (11.391) 


THO00ATZKooXHWCRD 
Théorème 11.148 (théorème de l’application ouverte[337, 338, 339]). 
Soient des espaces de Banach®T E et F. Si l’application f: E — F est linéaire, surjective et 
continue, alors elle est ouverte. 


Démonstration. En plusieurs étapes. 


(1) Une union de fermés Soit ye F. Comme f est surjective, il existe x € E tel que y = f(x). 
Soit n e N tel que x € B(0,n). Nous avons alors 


y e f(B(0,n)) € f(B(0,n)) (11.392) 


En notant 
Fr f(Br(0,n)), (11.393) 


67. Espace de Banach : vectoriel, normé, complet. Définition 7.255. 
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nous avons 


00 
F=|Jr. (11.394) 


(2) Théorème de Baïre Le théorème 7.351 nous indique que F est un espace de Baire. Le 
lemme 7.350 nous dit alors qu'il existe un n tel que F, soit d’intérieur non vide. Mettons Fw 
d'intérieur non vide. 


(3) Boule unité Puisque FN est d'intérieur non vide, il existe y € Fn et n > 0 tels que 
Br(y,n) € Fn. Nous avons aussi 


Br(0,n) = Br(y,n) — y, (11.395) 


et comme y € FN nous avons Br(0,n) € Fn — Fw, et vu qu’en plus —F\ = Fw, nous avons 


Br(0,7) € 2Fn = f(Br(0,2N)). (11.396) 
Nous avons ensuite 
Br(0;1) = = Br(0,1) _ UE) = f(B(0,2N/n)). (11.397) 
Ceci pour dire qu’il existe un M € R tel que 
Br(0,1) € f(Br(0, M)). (11.398) 
Nous avons de même que 
Br(0, 3) © F(BO,M/2). EnooCHSPeRNEz ANT 


Nous voudrions maintenant avoir la même inclusion sans la fermeture. 


(4) Une suite par récurrence Soit z € Br (0, 1). Nous allons définir par récurrence une suite 


LJEM F 
(tn) dans E telle que . D 
M 
Tn € Bg(0, Si) (11.400a) 
1 
Âz — f(x1 +... + zn)] < cn (11.400b) 
(4a) Le premier élément Puisque z € Br(0,1) € f(Br(0, M)), nous avons 
1 
B(z, S) n f(BE(0, M)) # G. (11.401) 
Nous pouvons donc considérer x1 € B#(0, M) tel que f(x1) € B(z,à). 
Ce x1 vérifie les conditions (11.400). 
(4b) La récurrence En utilisant l'hypothèse de récurrence et (11.399), 
1 
z— f(x1+...+2n) € Br(0, ) c f(Bs(0,M/2")), (11.402) 
de telle sorte que 
1 
Blé f(mssssta) Gras) n f(B8(0,M/2")) 4 g. (11.403) 
Nous pouvons donc considérer 2,+1 € Be(0, M/2”) tel que 
1 
Donc 1 
z— f(ti+...+2%n) — f(&nr1) € Br(0, 0 (11.405) 
Nous avons donc bien : 
z — fai +... +rnn)l < = (11.406) 


on+1° 
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M 


(5) Convergence Nous avons, pour tout n, |x,| < 1. Donc la série 


(8) 


(ee) 


O0 
M 
FAFSY a (11.407) 
I n=1 


= 
converge. Autrement dit, la série des x, converge absolument ®. Puisque E est un espace de 
Banach, la proposition 11.85 nous dit que 37, x, converge dans E. Nous posons 


00 
r—) (11.408) 


En utilisant la série géométrique de la proposition 11.122(2), nous trouvons 


Ir < D Irel < MY ei M ÿ ZE = 2M. (11.409) 
k=1 k=1 k=0 
Passage à la limite Nous avons x € Bg(0,2M), et 
Jim 2 f(a1+...+2n)| = 0. (11.410) 
69 


Puisque les applications |.|, t- z— {et f sont continues 
de partout et écrire 


, nous pouvons rentrer la limite 


1z— f(x) = 0, (11.411) 


ce qui signifie que z = f(x). Comme z est un élément arbitraire de Br(0,1) nous avons 
prouvé que 


Br(0,1) € f(Be(0,2M)). (11.412) 


Nous avons donc aussi que pour tout r > 0, il existe r” tel que 
Br(0,r) € f(Be(0,r')). (11.413) 


En l'occurrence, r’ = r/2M. 


Passage aux voisinages Nous montrons que l’image de tout voisinage de x € E contient 
un voisinage de f(x) dans F. Soit x € E ainsi qu’un voisinage V de x. Il existe r > 0 tel que 
B(x,r) € V. Vu que f est linéaire, 


F(B(x;r)) = f(x) + f(B(0;r)), (11.414) 
et il existe un r” tel que Br(0,r’) € f(Br(0, He Cela pour dire que 
f(x) + Br(0,r') € JBlmr)) eV (11.415) 


Vu que f(x) + Br(0,r’) est un ouvert autour de f(x), nous avons prouvé que f(V) contient 
un ouvert autour de f(x), c’est-à-dire que f(V) est un voisinage de f(x). 


Conclusion Le lemme 11.145 conclut que f est ouverte. 


68. Définition 11.81. 
69. Oui, la continuité de f est une hypothèse en plus de sa linéarité parce que nous n’avons pas d’hypothèses sur 
la dimension de E et F. 
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11.11 Produit tensoriel d’espaces vectoriels 


Si vous êtes pressés, vous pouvez aller lire la définition 11.157 de produit tensoriel d'espaces 
vectoriels. Mais si vous étiez vraiment pressés, vous ne seriez pas en train de lire des choses sur le 
produit tensoriel (il vous suffit de croire que x @ y n’est finalement que la concatenation de x et 
y). 

PROPooYONEooWvwPZT 
Proposition-Définition 11.149. 
Soient un espace vectoriel V et un sous-espace N. Le quotient de V par N, noté V/N est l’en- 
semble des classes d'équivalence Ÿ pour la relation x < y si et seulement si x —ye N. 
Les définitions 
(1) [ol + [ul = [v + w] 
(2) Alv] = [Av] 
ont un sens et définissent une structure d’espace vectoriel sur V/N. 
En ce qui concerne la topologie, ce sera la définition 7.44. 


Démonstration. Un élément général de la classe [v] est de la forme v + n avec n € N. Le calcul 
suivant montre que la somme fonctionne : 
Lu + m1] + [uw + no] = [u + w + n1 + no] = [v + wl (11.416) 
parce que n1 + n2 € N. De même, 
X[v + n] = [Av + À n] = [Av] (11.417) 


toujours parce que Àn € N. 
Notons que nous avons utilisé de façon on ne peut plus cruciale le fait que N soit un sous-espace 
vectoriel. 


Proposition 11.150. 
Si {e;} est une base de V et si N est un sous-espace de V, alors {[e;]} est une partie génératrice 
de V/N. 


Démonstration. Si x = Ÿ, rer, alors [x] = ÿ, xfez], donc oui. 


11.12 Produit tensoriel 


Nous allons faire les choses suivantes : 
— Définir ce qu'est un produit tensoriel de V et W, définition 11.152. 


— Prouver que tous les produits tensoriels sont isomorphes, définition 11.153 et proposition 
11.154. 


— Construire un produit tensoriel relativement abstrait à base d'espace librement engendré par 
V x W, définition 11.157 et proposition 11.159. 


— Construire un produit tensoriel assez concret en tant qu’espace de formes bilinéaires sur 
V x W, proposition 11.179. 


11.151. 
Dans le Frido, la notation V @ W pourra désigner (au moins) trois choses différentes. 


— Un produit tensoriel quelconque, c’est-à-dire un espace quelconque vérifiant les conditions de 
la définition 11.152. 


— L'espace FKx(V x W)/N défini en 11.157. 
— L'espace L2(V x W, K) des formes bilinéaires. 


Dans tous les cas l’espace T qui veut prétendre être le produit tensoriel V @ W doit venir avec 
une application h. Lorsque (T,h) est un produit tensoriel de V et W, nous notons v @ w l’élément 
h(v,z) eT. 

70. Définition 1.32. 
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11.12.1 Définition générale 
DEFooXKKQooAvWRNp 


Définition 11.152 ([340]). 
Soient deux espaces vectoriels V et W. Un produit tensoriel de V et W est un couple (T,h) où 
T' est un espace vectoriel et h: V x W — T est une application 


pe 2 +. 71 
(1) bilinéaire ITEMooJCNYooGvjjtL 


(2) telle que pour tout espace vectoriel Z et toute application bilinéaire f: V x W — 7, il existe 
une unique application linéaire f : T — Z telle que f = foh. 


La propriété (2) est appelée propriété universelle du produit tensoriel. 


L'élément h(v,w) est souvent noté v @ w. 
DEFooPLHTooRiHjlE 


Définition 11.153. 
Un morphisme entre (T,h) et (T',h!) est une application linéaire D: T — T' telle que h = Doh. 
Nous parlons d’isomorphisme si a un inverse qui est également un morphisme. 
PROPooROPHooQXqNzZz 


Proposition 11.154 ([340|). 
Si V et W sont des espaces vectoriels, tous les produits tensoriels entre V et W sont isomorphes 
entre eux au sens de la définition 11.153. 
Plus précisément, si (T,h) et (T',h') sont deux produits tensoriels de V et W, alors 
(1) il existe une unique application linéaire g: T — T' telle que h! = go h, 


(2) cette application g est inversible. 


En particulier, l’application g est un isomorphisme d'espaces vectoriels. 
Démonstration. Soient deux produits tensoriels (T,h) et (T”,h’). 


(1) Existence 


L'application h': V@W — T' est bilinéaire, et (T, h) est un produit tensoriel. Donc il existe 
g: T — T' tel que h! = go h. De même, il existe une application g': T' — T telle que 
h=g'oh. 


(2) Unicité 
En ce qui concerne l’unicité, vu que h: V@W — T est surjective, la relation À! = goh 
prescrit les valeurs de g sur tous les éléments de T°. 

(3) Inversible 
Ces deux applications g et g' vérifient h’ = gg'h et h = g'gh, et de plus h: VOW — T 
est surjective. Soient t € T'et x € V@W tel que t = h(x). Nous avons h(x) = g'gh(x). 
C'est-à-dire t = (g'og)(t). De même dans l’autre sens, il existe à’ € V@W tel que t = h’(x’). 
En appliquant l'égalité h’ = gg'h' à x’, nous trouvons t = (go g')(t). 
Tout cela pour dire que g/ = g-!. Cette application g est donc un isomorphisme de produits 
tensoriels entre (T,h) et (T”,h’). 


Au final, l'application g: T — T” étant linéaire et inversible, elle est un isomorphisme d’espaces 
vectoriels. 


Proposition 11.155 ([341]). 
Soient deux espaces vectoriels V et W sur le corps K ainsi que u,a € V etv,be W tous non nuls. 
Si 

u Q v = a@ b, (11.418) 


alors il existe À et 1 tels que a = Au et b = pv. 
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Démonstration. Pour toute applications linéaires f: V — K et g: W — K nous posons 
fxg VxW—K 
(v,w) > f(v)g(w). 
Cette application f + g étant bilinéaire, il existe une application s;,: V@W — K telle que 
Sfgo0h= f*xg. 
Nous considérons maintenant des bases {e;} de V'et {e} de W, et nous considérons l’application 
linéaire f;,: V — K donnant la i*composante dans la base {e;} ; autrement dit 


Ji(ex) = dik. (11.420) 


(11.419) 


De même nous considérons l’application g;: W — IK. Comme dit plus haut, l’application jf; * 
g;: VxW — K se relève en une application s;;: V@W — K vérifiant 


sij(u ® v) = (Ji x g;)(u,v) = fi(u)g;(v). (11.421) 
Par hypothèse, s;;(u © v) = si;(a @ b), donc 
EQooBEXAo S 
fi(u)g;(v) = f(a)g5 ). PP ADS) 
Étant donné que u # 0, il existe to tel que fistu) # 0. De même nous considérons 9 tel que 
9j (v) # 0. Dans l'égalité 
Je (ü)9 (v) _ 5 (a)g;,(b), (11.423) 
le membre de gauche est non nul. Donc les deux facteurs du membre de droite sont non nuls. Donc 
en posant 
… Jio(a) 


H— , 
Jio(u) 
nous définissons bien un élément non nul € K. 
En repartant de (11.422) avec à = à nous trouvons 


gi(v) = 1g;(b) (11.425) 


pour tout à. Donc v = yb, ce qu'il fallait démontrer. Un raisonnement similaire montre que u = Aa 
pour un certain À non nul dans K. 


(11.424) 


PROPooMMOPooEkqkpk 
Proposition 11.156. 
Tous les espaces vectoriels sont sur le corps K. Si h: V x W — T' est un produit tensoriel et si 
f: T — Z est un isomorphisme d’espaces vectoriels, alors 


foh VxW-—Z (11.426) 


est un produit tensoriel. 


Démonstration. En plusieurs parties. 


(1) foh est bilinéaire Soient v,u2 € V et we W ainsi que À € K. Nous avons 


(fo h)(Au + v,w) = f(Avi © w + v2 @ w) h est bilin. (11.427a) 
= f(u1 © w) + f(v2 @ w) f est lin. (11.427b) 
= À(fo h)(u1,w) + (f o h)(u2, w), (11.427c) 


ce qui montre que f © h est linéaire en sa première variable. La vérification de la linéarité en 
la seconde variable est le même type de vérification. 

(2) Propriété universelle Soient un espace vectoriel Y et une application bilinéaire b: V x 
W — Y. Nous devons trouver une application linéaire b’: Z — Y telle que b'o(foh)= b. 


Vu que (T, h) est un produit tensoriel, il existe une application bilinéaire b: T — Y telle que 
boh = b. Vu que f est linéaire et inversible, l'application b = bo f-! est linéaire et fait 
l'affaire : 

bofoh=bof lofoh=boh=b. (11.428) 
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11.12.2 Constructions du produit tensoriel 


Tout cela est fort bien : nous avons unicité à isomorphisme près du produit tensoriel d'espaces 
vectoriels. Mais nous n’avons pas encore de certitudes à propos de l’existence d’un couple (T,h) 
vérifiant les propriétés demandées pour être un produit tensoriel. 

Nous allons maintenant construire un produit tensoriel. 


11.12.33 Construction abstraite 


C'est le moment pour vous de relire la définition 4.26 d'espace vectoriel librement engendré, et 


surtout le lemme 4.27 qui en donne une base. 
DEFooKTVDooSPzAhH 


Définition 11.157 ([340]). 
Soient deux espaces vectoriels V et W sur le corps commutatif"? K. Dans Fx(V x W)® nous 
considérons les sous-espaces suivants : 


A = One) + Dtanu) — baba) él Qué mitoe Vue W} (11.429a) 
A2 = {tour) + Ov) — Jtui+u) tel que v € V,un,w2 € W} SRAROREE 26e) 
A3 = {vw — du) tel que ve V,weW,1EeK} (11.429c) 
A4 = {vw — O(y,xw) tel que ve V,weW,\EeK}. (11.429d) 


Nous considérons alors N = Span(A1, 4), A3, A4) et le quotient 
V Or W = Fk(V x Wy/N. (11.430) 


Ce dernier espace vectoriel est le produit tensoriel de V par W. 
REMooSLEGooWEiutz 


Remarque 11.158. 
Quelques remarques. 


(1) Les éléments de V @W ne s’écrivent pas tous sous la forme v @ w. Certains ont vraiment 
besoin d’être écrits avec des sommes. En cela, la situation de V@W est réellement différente 
de celle de V x W. Dans ce dernier, tous les éléments sont des couples. 


(2) La classe de l'élément ô(,w) € F(V x W) sera d'habitude noté v @ w. 
(3) Pour insister sur la notion de classe, nous allons aussi noter [x] la classe des Hot dr 


(4) L’arithmétique dans V @ W est relativement simple. En ajoutant et soustrayant le même 
élément de A3 nous avons par exemple 


(Av) @ w = (Av) @ w + A(v ® w) — (Av) ® w. (11.431) 


Nous obtenons de cette façon 


X(v ® w) = (Av) @ w = v@(Aw), (11.432) 
que nous noterons Àv @ w sans plus de précision. 
PROPooIWZDooRRZNC£ 
Proposition 11.159 ([340]). 
L'espace vectoriel V x W muni de 
h VOW-—-V@aW 
(11.433) 


(v,w)r v@w 


est un produit tensoriel entre V et W. 


72. À part mention du contraire, tous les corps du Frido sont commutatifs. 
73. Espace vectoriel librement engendré, voir la définition 4.27 et le lemme 4.27. 
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Démonstration. Nous devons prouver les conditions de la définition 11.152. 
(1) k est bilinéaire 


Ce sont des calculs tels que faits dans la remarque 11.158(4) qui font le travail. 


(2) Rk est surjective 
Un élément de V @W est la classe d’un élément de F(V x W), c’est-à-dire de la forme 


[D Stvisue)] — D vi ® Ut. (11.434) 


Cet élément est dans l’image de À comme le montre le calcul suivant "{ : 


R(S (vi, wa)) = D ih(vi; Wa) = Div ® Wa- (11.435) 


ia 


(3) Propriété universelle 


Soient un espace vectoriel ÜU et une application linéaire f: V@&W — U. Nous devons trouver 
une application linéaire g: V@W — U telle que f = go h. Pour cela nous commençons par 
considérer l’application 

g: FVxW)—U 


(11.436) 
Ô(v,w) Eee f(v, w) 

définie sur tout F(V x W) par linéarité sans encombres parce que les 0, forment une base 

par le lemme 4.27. 

Nous démontrons que g(N) = 0 pour avoir le droit de passer g aux classes et le considérer 

comme application partant de V @ W au lieu de F(V x W). Prenons par exemple 


9 (O(o1 0) si O(ua,w) N  ) S 9(O(v1,w)) + 9(0(v2;u)) = duo) (11.437a) 
= f(u1,w) + f(va, w) — f(v1 + va, w) (11.437b) 
E (11.437c) 


par la bilinéarité de f. Cela montre que g(A1) = 0. Nous montrons de même que g(A2) = 
g(43) = g(A4) = 0, et enfin toujours par linéarité que g(N) = 0. Pour rappel, les éléments 
de N sont les combinaisons linéaires finies d'éléments de A1, A2, A3 et A4. 

Par passage aux classes, nous avons une application (que nous notons également g) 


g: F(VXxW)/N —=U (11.438) 

vérifiant g(v @ w) = f(v,w). Mais comme A(v,w) = v ® w, nous avons goh: V@OW —U 
vérifiant goh= f. 

L'espace vectoriel V © W est donc un produit tensoriel. [1 


11.160. 
Vu que V@W est un produit tensoriel de V et W, et vu qu’il y a unicité par la proposition 11.154, 
nous avons bien le droit de dire que V@ W est le produit tensoriel. Cela justifie le titre. 


11.161. 
Les prochains lemmes et propositions vont nous dire que l’application 


p: V*@W — L(V,W) 


aQw- (v > œ(v)w) (11.439) 


est un isomorphisme d’espaces vectoriels lorsque V est de dimension finie. Vu que nous aimons les 
énoncés très explicites, ça va être découpé en plusieurs morceaux, l'énoncé va devenir un peu long ; 
mais c’est pour la bonne cause. 


74. Faites bien la distinction entre 6, w, (v,w) et v@w. Sachez dans quel ensemble se trouvent chacun de ces trois 
objets. 
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LEMoo0UJEBooQruWEp 
Lemme 11.162. 
Soient deux espaces vectoriels V et W dont W est de dimension finie. Alors l'application définie 
par 
po: F(V*xW) - L(V.W) 


11.440 
SIC) us (v > a(v)w) 


sur la base « canonique » de F(V* x W) passe aux classes. 


Démonstration. Avec les notations de la définition 11.157 nous devons prouver que &(N) = 0. 
Nous montrons que (A4) = 0, et nous vous laissons faire les autres. Pour 1€ K,ae V*etweWwW 
en utilisant la linéarité de & nous avons : 


Pau) — Da, xw)) 0 = AP(E(œy)) (0) — P(8 (a, xn))(U) (11.441a) 
= Aa(v)w — a(v)(aw) (11.441b) 
—0 (11.441c) 


parce que a(v)(Aw) = Aa(v)w du fait que K est commutatif. La commutativité de K est ce qui 
permet de permuter le produit Aa(v). 


Nous laissons à la lectrice le soin de prouver que (A1) = w(A2) = w(A3) = 0. 
LEMooUQZHooWj1Gsy 


Lemme 11.163. 
SiW est de dimension finie, alors L(V,W) muni de 


h: V*@W — L(V,W) 


ne (11.442) 


est un produit tensoriel"® de V* par W. 


Démonstration. Nous devons prouver que 
— h est bilinéaire, 
— h est surjective 
— pour tout espace vectoriel U, et pour toute application bilinéaire f : V*@W — U, il existe 
une application linéaire g: L(V,W) — U tel que f = goh. 
(1) Bilinéaire Le fait que h soit bilinéaire est une simple vérification. 


(2) Surjective L'espace W étant de dimension finie, nous pouvons en considérer une base 
{zier. Soit a € L(V,W).Sive V, l'élément a(v) peut être décomposé dans la base {z;}, ce 
qui définit des applications linéaires a;: V — IK par 


a(v) = > ai(v)zi. (11.443) 


iel 
Notons que à; € V*. En comparant avec la définition de h, nous voyons que 


a(v) = > h(œi, )(v), (11.444) 


c’est-à-dire à = »}, A(ai, wi) = R(Y;(a, )). Nous avons donc bien a € A(V*@W). 


(3) Propriété universelle 


Soient un espace vectoriel U et une application bilinéaire f: V*@W — U. Pour a € L(V,W) 
nous définissons g(a) comme suit. D’abord nous écrivons a sous la forme 


a(v) = D œ(u)#, (11.445) 
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et nous posons 


g(a) = > flo 2). (11.446) 

Avec cette définition, en posant w = Ÿÿ,; w;z;, nous avons 
(go h)(a,w) = g(v- a(v)w) (11.447a) 
= g(v ÿ a(v)w;z) (11.447b) 
=) (ua, z) (11.447c) 
= Ÿ f(a,wiz) (11.447d) 
= f(a, > wiz) (11.447e) 
= f(a, ” (11.447f) 

Cela prouve que goh = f. 

PROPooKJTCooVTXWAQ 


Proposition 11.164 ([342]). 
Soient deux espaces vectoriels V et W dont V est de dimension finie. Alors l'application 


p: V*@W — L(V,W) 


(11.448) 


est bien définie S et est un isomorphisme d'espaces vectoriels. 


Démonstration. Le lemme 11.163 donne une structure de produit tensoriel de V* par W sur 
£L(V,W). Rappelons les structures : 


h: V*OW-v*@wW 


es (11.449) 


et 
R': V*OW — L(V,W 
( (11.450) 
(a,w) = [ur a(v)w|. 
La proposition 11.154 a déjà fait tout le boulot. La seule chose à faire est de vérifier qu’il existe 


une application w: VF@W — L(V,W) vérifiant simultanément les deux conditions Skianéese oc 


(1) vy(a@ w) = [u > œ(v)w| 
(2) h'=poh. 
La seconde condition assure que @ sera un isomorphisme d’espaces vectoriels. 

L'existence de @ vérifiant la condition (1) est un effet du lemme 11.162 qui donne une fonction 
sur F(V* x W) dont le & qui nous concerne est un quotient. Il reste à voir que cette application 
vérifie h = poh. 

En nous rappelant que a @ w = [ü(aw)] et en écrivant 4 à la fois l’application et son passage 
au quotient, 

(poh)(a,w) = p(a®w) = P(Lé(au)]) — P(b(aw))- (11.451) 


En appliquant à v € V nous avons : 


(go h)(a, w)u = p(é(au)v = a(v)w = h'(a,w)v. (11.452) 


Et voilà. Nous avons wo h = h/. 


76. Au sens où il existe une fonction 4 définie sur tout V* @ W qui se réduit à cela pour les éléments de la forme 


a Q w. 
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Une conséquence de la proposition 11.164 est que 
dim(V @W) = dim(V) dim(W) (11.453) 


via le lemme 4.41(2). 


11.12.4 Bases 
LEMooXFIMooDkTSrq 


Lemme 11.165 ([1]). 
SiT: V1 — Vo est un isomorphisme d'espaces vectoriels, alors il existe un isomorphisme d'espaces 
vectoriels ÿ: W@W — VW @W tel que p(u@ w) = r(v) &w'T. 
Démonstration. L'application 

@0: F(V x W) — F(V X W) 
: (11.454) 
Su) © O (ju) 


est un isomorphisme. 
Cette application passe aux classes, mais pas au sens où x € [y] impliquerait wo(x) = o(y): 
au sens où si x € [y], alors wo(x) € [o(y)|. Par exemple 


0 QUES — ee = ME = ‘Crau e [0]. (11.455) 


Nous vous laissons le soin de vérifier les égalités correspondantes pour les autres parties de N. 
Le passage au classes de Go signifie que l’on considère l’application 


p'UQW-V@W 


(11.456) 
[rl [yo(x)] 
où vous aurez noté que la prise de classe à gauche n’est pas la même que celle à droite. 
Il faut prouver que ce @ est un isomorphisme. En ce qui concerne la linéarité, 
e(Ex] + [u]) = e([x + y) (11.457a) 
= [po(x + y)] (11.457b) 
= [po(x) + vo(y)] (11.457c) 
= [po(x)] + [o(y)] (11.457d) 
= p([x]) + e(y)). (11.457e) 


Je vous laisse le reste de la linéarité. Et en ce qui concerne le fait que ce soit une bijection, 
allez-y. 


PROPooTHDPoolgjUwk 
Proposition 11.166 ([342]). 
Soient des espaces vectoriels de dimension finie V et W. Soient une base {e;} de V et une base 
{fa} de W. 
Alors : ITEMooQCILooUncdGl 
(1) La partie {e; ® fa} est une base de V@W. 


(2) Au niveau des dimensions, dim(V @ W) = dim(V) dim(W). 


ITEMooGCRHooJjAYPr 


Démonstration. Vu que V est de dimension finie, nous avons un isomorphisme d’espaces vectoriels 
V* = V, et même un isomorphisme d'espaces vectoriels 


Ti V — (V*)* 


T(v)u = pv). (11.458) 


77. La proposition 11.166 dira que cette condition fixe complètement w, mais c’est une autre histoire qui vous sera 
contée une autre fois. 
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Recopions l’isomorphisme de la proposition 11.164 en utilisant V* au lieu de V : 


Vo: (V*)*@W — L(V*,W) 


r(v)®uw (y r(v)(u)w = (v)w). (11.459) 


En écrivant cela, nous avons tenu compte du fait que tout élément de (V*)* peut être écrit de 


façon univoque sous la forme r(v) pour un certain v € V. 


Vu que 7 est un isomorphisme, l'application suivante est encore un isomorphisme  : 


db: V@W — L(V*,W) EQOOAEFRooPfmAn j 
vw (ur u(v}w). C #0) 


Nous avançons. Vu que nous avons un isomorphisme, nous pouvons faire passer des bases. Le 
lemme 4.41 nous donne une base de £L(V*,W) en les éléments Ba: V* — W définies par 


Bij(n) = H(e5) fa. (11.461) 


Donc {#1(8;,)} est une base de V@W. 
Pour a = ÿ,; ae (base duale, définition 4.126) nous avons : 


dei ® fa)a = a(ei) fa = Bia(a). (11.462) 


Cela prouve que D (Bi) = €; © fa, et donc que ces e; @ f, est une base de V@W. 
La formule concernant les dimensions est simplement la définition 4.15 de la dimension : le 
nombre d’éléments dans une base. 


LEMooYJIQooRCkHMq 
Lemme 11.167. 
Dans le produit tensoriel R@R, nous avons 
(1) x@1=1@7x=71(1@ 1) pour tout x e R. 
(2) Si x > 0 nous avons aussi x @ 1 = Vr ® x. 
LEMooKPWNooNjkAru 


Lemme 11.168. 
Le produit tensoriel est associatif. 

Plus précisément, si U,V,W sont des espaces vectoriels, nous avons des isomorphismes d’es- 
paces vectoriels 


U@(V@W)=(U@SV)@W. (11.463) 


Dans la suite, nous écrirons U @ V @W sans plus de précisions et même @*V pour le produit de 
k copies de V. 


Définition 11.169. 
Un k-tenseur sur V est un élément de R°V*. 


PROPoolODGooYajpiy 
Proposition 11.170. 
Il y a un isomorphisme d'espaces vectoriels @FV* — Ly(V,R). 
Exemple 11.171. 
Pour k = 2, l’isomorphisme de la proposition 11.170 est 
: L(V, V*) — LV, R 
ÿ: L(V,V*) — Lo(V,R) _—. 


b(a)(u,v) = a(u)v. 


Il faut se rappeler que le proposition 11.164 donne déjà un isomorphisme entre V*@V* et L(V, V*). 
A 


78. Lemme 11.165. 
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11.12.5 Construction par les formes multilinéaires 
LEMooCXPRooGf JMMV 


Lemme 11.172. 
Soient des espaces vectoriels de dimension finie V, W et Z. Soient une application bilinéaire 
f:VxW — Z ainsi que des bases {e;} de V et {d;} de W. 

Il existe des éléments f;; dans Z tels que 


f(v,w) = D uw fi (11.465) 
ij 
pour tout ve V'etweW. 
11.173. 
Ce que nous allons noter A(T,, S) est souvent noté T@S, parce que la proposition 11.179 montrera 


qu’il s’agit bien d’un produit tensoriel. Cependant nous avons besoin de pas mal de propriétés de 
h avant de pouvoir l’affirmer. 


DEFooUUMYooOUCzWk 
Proposition-Définition 11.174. 
SiTE Ly(V,R) et SE Li(V,R), nous définissons 
RIT, S): VÉHR 
( (11.466) 


Oise den) Ti 0) Ste der 


(1) L'application R(T, S) est multilinéaire ® : h(T, S) € Ly(V, R). 
(2) L'application h est associative : R(R(T, 5), R) : R(T, R(S, R)). 
(3) L'application h: Lx(V,R) x LV, R) — Lxu(V, R) est bilinéaire. 


Démonstration. En plusieurs parties. 


(1) multilinéaire Nous fixons des v; € V, nous considérons A(T,S); et nous calculons (en 
supposant à < k, sinon on adapte) 


AT Shui = AT. (Gia2s23 0450) (11.467a) 
ni T(v1, ss Us... , Uk) S (0x1; sr , Uk) (11.467b) 
= To (:sk (11.467c) 


Vu que T; est linéaire, nous en déduisons que A(T, S); est linéaire et donc que A(T, S) est 
multilinéaire. 


Associativité Facile de vérifier que 
R(R(T, 5}; R) (u1, da Ua im) —= T(u1, ti a ,&)S(Ux+1, PU , +) R(Uk+1+1, érès Sup le 
(11.468) 


Bilinéaire En utilisant directement la définition, on vérifie que A(T, ÀS) = AR(T,S) et AT, Si + S2) = 
RIT, S1) + AT, S2). 


11.175 (Quelques notations). 
Si V; sont des espaces vectoriels, si v; € Vi, et si &; e V*, nous notons 


nm 
Hésme)tret)= lé) (11.469) 
i=1 
Si Test un multiindice (1 = (i1,...,in)), et si vu est quelque chose qui peut avoir des indices, 
alors nous écrivons ur = (v,,...,:,). 


Nous écrivons en particulier 61 = [[£_1 dije- 


79. Application multilinéaire, définition 9.1. 
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LEMooPUNAooUnQTpJ 
Lemme 11.176 (égalité sur une base[1]). 
Soient des espaces vectoriels (V;);=1...n de dimensions n;. Soient deux formes N-linéaires S,T: Vi x 
.X Vy — R. Si pour tout multiindice T nous avons S(er) = T(er), alors S =T. 
Si les & sont des formes linéaires, nous notons y la forme multilinéaire h(£1,...,£n). 


Démonstration. Nous considérons les bases {el }i=1,..n, de Vx. Un élément générique de Vi x... Vi 
est de la forme 


ni nN 
N) (N 
Des. y. on) (11.470) 
Ji iN=1l 


Nous appliquons $ à cela en tenant compte de la multilinéarité : 


n1 nN n1 nN N 
(D (1) CN) (N)\ (à er (0) (N) 
s( da oe dar [6e (11.471a) 
j1 iN=1 ji=l  jn=li=l 
N 
= DT [1 5(e). (11.471b) 
J i=1 


Le même calcul avec T donne la même chose, compte tenu de l’hypothèse Se) = T(er). 
THOooTAGKooDscwFG 


Théorème 11.177 ([263]). 
Soient des espaces vectoriels (V;);=1..n de dimensions n;. Nous notons, pour chaque à une base 


CUP de V;. Nous notons {a} les bases duales. 


Alors {ar}r est une base de La(Vi X ...Vw,R). 


Démonstration. Nous commençons par prouver que {ar} est libre. Supposons que ÿ;} arar = 0. 
En l’appliquant à e, nous avons 


0 Diarar(es) = Dianôrs = ar (11.472) 


Cela prouve que tous les az sont nuls, et donc que la partie est libre. 
Pour prouver que la partie est génératrice nous considérons T € £La(Vi x... x Vw, R) et nous 
posons T7 = T(er) pour tout multiindice 7. En posant $ = ÿ,, Trar, nous 


S(ez) = D Tror(es) — D Trôrs = Ty. (11.473) 
I I 


Donc S(ez) = T(ez). Le lemme 11.176 conclu. 


LEMooPBLRooJePqlk 
Lemme 11.178. 
Soient deux espaces vectoriels de dimension finie V et W. Nous notons {;} une base de V* et 
{B;} une base de W*. Pour chaque £ € V* et o e W* nous considérons l'application bilinéaire 


h(é,o)}: VxW—R 


(v, w) + E(v)a(w). (11.474) 


La partie {h(a;, B;)} forment une base de l’espace des applications bilinéaires sur V x W. 
PROPoolFVBooGiMskq 

Proposition 11.179 ([1, 343]). 

Nous considérons l'application h: V* x W* — £La(V x W,R) donnée par 


R(Ë, o)(v,w) = E(v)o(w). (11.475) 


Le couple (L2(V x W,R), h) est un produit tensoriel de V* et W*. 
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Démonstration. Nous devons prouver que l’application h satisfait à la propriété universelle 11.152(2). 
Nous considérons une base {a;} de V* et {B;} de W#*. Si f: V* x W* — Z est bilinéaire, le lemme 
11.172 nous dit que f est déterminée par les éléments f;; = f(a, B;). 


(1) Existence Nous posons 
f: LV x a 


D aiÿh (ou, B > fé. (11.476) 


Notez deux choses. 


(la) C’est une bonne définition parce que les h(a;, B;) forment une base de £Lo(V x W,R) 
(lemme 11.178). 


(1b) L'application f est linéaire. 


Nous devons prouver que f o h = f. Soient £ = éme r $ ojbB;. Par bilinéarité nous 


avons 
o) = D &ojh(ai, B;). (11.477) 
ij 
Nous avons donc 
(foh) (£,o  iéoshs = D &oj(a, B) — J(ÊT: (11.478) 
ij 


et donc bien foh= f. 


Unicité Nous savons que les éléments h(a;,/3;) forment une base de Lo(V x W,R). Si 
f: LV X* W,.R) — Z est une application linéaire vérifiant f o h = f, alors nous avons 


SR 
ND 
nr 


flates = Canlad)= fa): (11.479) 


Donc l'application f est entièrement déterminée sur une base par les éléments f;; € Z. 


11.180. 
Lorsque V et W sont des espaces vectoriels, si rien n’est précisé, le produit tensoriel 


V@W (11.480) 
sera celui de la proposition 11.179, et lorsque £&1 € V* et £2 € W* nous notons 


1 @ 62 (11.481) 


l'élément h(£1, 62). 
Ce serait mieux de garder la notation V @ W pour un produit tensoriel abstrait (définition 
11.152), mais bon ...Nous n’allons pas non plus nous tuer sur les notations. 


11.12.6 Décomposabilité 
DEFooTSSVooUGybzL 


Définition 11.181 ([263]). 
Une application T € Ly(V,R) est décomposable si il existe des formes &1,...,£8% € V* telles que 


Le 
CE 
— 
I 
) 
lan 
= 
S 
— 


Tu, (11.482) 


i=1 


autrement dit T = h(£1,...,&x), ou encore T =  @...@ &x. 
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LEMooLETBooROVcim 
Lemme 11.182 ([263, 1]). 
Une forme 2-multilinéaire T = di ai;h(ai,a;) est décomposable®® si et seulement si la matrice a 
est de rang 1. 


Démonstration. En deux parties. 


(1) = Soient f1, f2 € V* tels que T(v;,v2) = fi(v1)fa(v2) pour tout vi, v2 € V. Nous appliquons 


T à (e1),e2 : 
Tex, e) = D ai(oi ® a;)(er, er) = D ajoi(ei)aÿ(er) = a, (11.483) 
ij ij 
mais aussi 
T(ex, e) — fier) fr(e). (11.484) 
Donc ax = fi(ex)f2(e). Notons À la matrice (et l’application linéaire) formée par ces 
nombres. Nous avons : 
A(ei) = D arier = D Jifer)fa(ei)ex = fa(ei) > fi(ex)ex. (11.485) 
k k k 


En notons w le vecteur ÿ}, f1(ex)ex, nous avons 
A(R") = Span(v). (11.486) 


Cela montre que la dimension de l’image de À est 1, et donc que À est de rang 1. 


(2) = Nous supposons que a est de rang 1, et nous posons 


T:V?-R 
(o,w) + Ÿ axvru. (11.487) 
kl 


Vu que rk(a) = 1, il existe u € V tel que a(R”) = Span(u). En particulier pour chaque à, il 
existe À; tel que a(e;) = Àju. Donc 


a(v) = D ivia(es) = D iviiu = (v : Àju, (11.488) 


et 
AI — a(ex) = ÀgUL. (11.489) 
Avec tout ça, 
T(v,;w) = DT = (À : v(u : w). (11.490) 
kl 


Donc nous avons T' = fi @ f2 avec 


fi: R°R 


11.491 
Te À: x ( 


eb fol) =: x. 


11.183. 

Il est dit dans [263] que l'étude de la décomposabilité devient très compliquée à partir des 3- 
tenseurs, et que c’est lié à l’intrication quantique. Personnellement je ne suis pas sûr de ce que ça 
veut dire, mais si ça vous parle, c’est sans doute intéressant. 


80. Définition 11.181. 


856 CHAPITRE 11. ESPACES VECTORIELS NORMÉS 


11.12.7 Produit tensoriel d’applications linéaires 
PROPooKNNJooLSqz1D 


Proposition 11.184 ([344, 345]). 
Soit une application bilinéaire f: V x W — Z avec dim(Z) = dim(V) dim(W) < co. Nous suppo- 
sons que Z est engendré par l’image de f : 


Z = Span (Image(f)). (11.492) 
Alors f est un produit tensoriel de V et W. 


Démonstration. En plusieurs parties. 


(1) Un autre produit tensoriel Nous considérons un produit tensoriel h: V x W — T (exis- 


tence : proposition 11.159). Étant donné que f est bilinéaire, il existe une application linéaire 
J: T — Z telle que f = foh. 


vxwh,T (11.493) 


Ï 


Z 


(2) f est surjective Nous prouvons que f est surjective. Soit z e Z. Étant donné que Z est 
engendré par f(V x W), il existe a;; € R, v; e V et w; € W tels que z = 24 dj f Qu, 5): En 


utilisant la linéarité de f et le fait que f = f o h nous avons : 


2= ÿ a; f(vi,w;) (11.494a) 
= D'autre h)(vi, w;) (11.494b) 
—  . ® w;) (11.494c) 
= F D Gijui ® w;). (11.494d) 


ij 
Nous voyons donc que z est dans l’image de f, et done que f est surjective. 


(3) Questions de dimensions L'espace vectoriel T est de dimension dim(V) dim(W) (pro- 
position 11.166(2)). Vu que Z est également, par hypothèse, de dimension dim(V) dim(W), 
nous avons une application linéaire surjective entre espaces de même dimensions. Elle est 
donc une bijection par le corolaire 4.48. 


(4) Conclusion La proposition 11.156 dit que f o h = f est un produit tensoriel. 


PROPooLFHFooRmTA jY 
Proposition 11.185 ([344, 1]). 
Soient des espaces vectoriels de dimension finie Vi, V2, Wi et Wo. L'application 


s: L(Vi,Wi) x L(V2,Wo) — L(Vi @ Vo, Wi @ W2) (11.495) 
s(A, B)(e; @e;) = Ae; @ Be; | 
est un produit tensoriel. 
C'est toujours cette structure que nous considérons lorsque nous parlerons du produit tensoriel 
d'applications linéaires. 


Démonstration. Notre objectif est d'utiliser la proposition 11.184, c’est à dire de montrer que 
l'image de s engendre £L(V1 © V2, Wi1 @ W2). Nous considérons des bases pour tous les espaces 
vectoriels en présence : {e;} pour Vi, {e:} pour V2, {ex} pour Wi et {e} pour W2. 
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La proposition 11.166(1) dit que {e; @e’} est une base de V1 @ V2 et que {ex @ €} est une base 
de W; © W2, de sorte qu’une base de £L(V1 @ V2, W1 @ W2) est donnée par les applications el 


fin: MOV WW @W2 


D'astes ® é —+ aijex ® à. (11.496) 
st 


Notre objectif est de montrer que ces applications sont dans l’image de s. Pour cela nous considérons 
les applications A: Vi — Wi donnée par Ales) = deg et B: V2 — Wa donnée par B(e;) = 65e. 
Nous avons alors 


s(4,B)(5° Gstes ® €!) = Ÿ_ as A(es) @ B(e;) (11.497a) 
st st 

= V Gsiex ® Gjel (11.497b) 
st 

= aijex © 4. (11.497c) 


Cela prouve que s(4, B) = fijm. 
Donc l’image de s engendre £(Vi @ V2, W2 @ Wa) et la proposition 11.184 conclut que s est un 
produit tensoriel pour £(V:, W:) et £L(V2, Wa). 


11.12.8 Contraction 
DEFooMQDHooBsyVpr 


Définition 11.186. 


Un (1,k)-tenseur sur V est une application k + l-multilinéaire sur (V*)! x VF. 
DEFO010JMooFtSTtK 


Proposition-Définition 11.187 ([1]). 
Soit un (1,k)-tenseur®? T sur V. Soient une base {e;}, et sa base duale {a;}. Nous considérons 
une bijection linéaire A: V — V, la base {Ae;} et la duale {B;}. 

Nous considérons l'application d'insertion v: V" — V"+l donnée par 


AC ES ET (11.498) 


Alors : ITEMooSROI00G€TXCL 


(1) Pour tout r < 1, pour tout s < k, pour tout &; e V* et v; € V nous avons 


Di T(er(a)(E1, € 1); ts(e;)(01,..., Up) = Di T(r(8)(E, …, € 1); ts(Ae)(v1,..…., Uk_1)). 


ITEMooPULB dd 9} 
(2) En posant 


CES (PPS EVER 
(£1, ne , 1; V1, .. Uk) ad D T(er(ai)(E, 8 LÉ cs(e;)(v1, …. us 1)), (11-500) 


l’application CT(T) est un (1 — 1,k — 1)-tenseur. 
Ce CY(T) est la (r,s)-contraction de T. 


Démonstration. Le point (2) est facile parce que c’est juste la multilinéarité. Nous faisons le point 
(2). Nous partons du lemme 4.127 qui dit que B; = ÿ; j A; a. Remarquez que 


Dleloésses 80) (11.501) 


81. Proposition 4.76(2). 
82. Définition 11.186. 
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est linéaire en ©. Cela nous permet de sortir plein de sommes de T dans le calcul suivant : 
ZT(u(B)E, 1), t5(Ae@)(v1, 1)) (11.502a) 
= DT Agla)(E...,&-1) 6(3) Axer)(vr,.… ue 1)) (11.502b) 
i j l 
= D AT AGT (er (a)(...), 2s(er)(...)) (11.502c) 


ijl 


= Di T(er(ai)(.) ts(e)(.) (11.502d) 


Proposition 11.188 ([263]). 
Soient v,w € V ainsi que B,7,0o € V*. Nous avons 


ClvQwQwWOBRY® 0) = y(v)w®@ BE. (11.503) 


Démonstration. Nous choisissons une base {e;} de V et sa base duale {a;}. Ensuite allons appliquer 
Ci(vOw®QB®SyDQo) à (£, v1, v2) avec £ € V*, v1, v2 € V. Remarquons d’abord que si nous adoptons 
la décomposition v = reg et 7 = D}, na, nous avons a;(v) = v; et y(e;) = y. Voici le calcul : 


CiLSwSBSTG0)Eu,v) = D {vOwB BD TS o)(ai,E, V1, ei, v2) (11.504a) 
= D a(o)E(u) (ee) (11.504b) 
= D'urnélu)B)otun (11.504c) 
L x x B@ a)(£; vi, v2). (11.504d) 


Pour la dernière ligne, Ÿ'; v;7; = y(v) parce que 


Y(v) = D ravrer) a DUT sn DUR. (11.505) 
kl k k 


11.12.99 Tenseurs symétriques et alternés 


Si T est une application k-multilinéaire sur V, et si o: {1,...,k} — {1,...,k} est une permu- 
tation, nous notons T° l’application k-multilinéaire donnée par 


T°: VF R 


(11.506) 
(v1, sa FU) us ACT D se 


Définition 11.189 ([263]). 
Un k-tenseur*® T sur V est symétrique si pour toute permutation o: {1,...,k} — {1,...,k}, 
nous avons 

Tv: s.. , Uk) = Tv); sc. pbs À, (11.507) 


c’est-à-dire T° =T. 


Définition 11.190 ([263]). 
Un k-tenseur T est alterné si T° = (—1)T. L'espace vectoriel des k-tenseurs alternés est noté 
AFV*. Nous notons aussi AV* = R. 


83. C’est à dire une application k-multilinéaire T: V* — R. 
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LEMooJEZYooMmrtgu 
Lemme 11.191. 
Si T' est un k-tenseur, et si o et x sont des permutations, alors 
(1) L'application T + TT est linéaire en T.. 
(2) (AN Au _ Trec. 
ONE Se 
LEMooZMTPooKnqsSuz 


Lemme 11.192. 
Si V est un espace vectoriel réel de dimension n, et si B est une base de V, alors le déterminant °* 
detg: V' —R est un n-tenseur alterné. 


DEFooHAKAooïIfbsEy 
Définition 11.193. 
Si T est un k-tenseur, nous définissons 
1 
ACT) = = D (—1)TT (11.508) 
k! 
TES% 
où la somme porte sur le groupe symétrique *”. 
LEMooWYCAooKoFpRu 
Lemme 11.194 ([263]). 
L'application Alt: Ly(V) — AFV* est une projection linéaire, c’est-à-dire 
ITEMooLADTooNfbV10 
1) Alt (L&(V)) & AËV* 
( ) ( k( )) ITEMooQPJKooTvriBv 
(7 Allaeye = 1e ITEMooYOXTooTmzzi0 


(3) L'application Alt est linéaire 


Démonstration. Pour (1), nous prouvons que ( AIt(T))” = (—1)° Alt(T). Pour cela nous utilisons 
les formules du lemme 11.191. Nous avons 


AI(T)7 = (à >, cure) (11.509a) 


TES% 
1 
22 V'(iyrpres (11.509b) 
k! 
TES% 
= ( = D (—1)7(—1) TT (11.509c) 
"res 
(ox 1 TOC To 
si D (-1)T (11.509d) 
TES% 
1 _ 
= D 3 (C-DTTT AA NOR NEE ESRR 
‘res 
= (1) AIT). (11.509f) 


Pour (11.509e), nous avons utilisé le fait que 7 > x o o est une bijection de $% et la proposition 
1.303. 
Pour le point (2), nous considérons un tenseur alterné T. Il vérifie donc TT = (—1)TT. Nous 


84. Définition 9.8. 
85. Groupe symétrique, définition 1.267. 
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avons alors le calcul suivant : 


1 
AK(T) = + D (-DTTT (11.510a) 
: TES % 
; ; (DT C-NT (11.510b) 
: TES% 
1 
=> ST (11.510c) 
TES% 
= (11.510d) 


parce que $z contient exactement k! éléments par le lemme 1.270. 
Pour le point (3), il s’agit de la linéarité de T > TT donnée par le lemme 11.191. 


LEMooIMYIooZIxYRp 
Lemme 11.195 ([1]). 
SiT e Ly(V) et SE LifV), nous avons 
AIT @S) = (—-1) AK(S@T). (11.511) 
Démonstration. Nous introduisons la permutation o € Sy, qui permute {1,...,k} avec {k + 
1,...,k+1}; par exemple pour k = 3 et { = 1, ce serait 12345 — 45123. 
Nous avons 
CPS) (tissus 0) = Toi op) SU, +250) (11.512a) 
= (S QT) (oui, 08 dis )). (11.512b) 
Donc T@S=(S@T)00. 
Passons au calcul de AI(T @ S). Nous avons 
1 
AK(T@S) =} D (-D'(T@S)or (11.513a) 
 reSxu 
1 
=; > (1) (S@T)o0007 (11.513b) 
: TESk+ 
1 = BEQooL j 
. >, (—1)7 "S(S QT) 08 EN POP 
"seSr+i 
1 BE LNGooE i 
= DM ECD(S@T 05 PA PO MATE) 
= (1) AI(S@T). (11.513e) 


Justifications : 
— Pour (11.513c), nous avons changé de variables dans la somme : s= 0x. 


— Pour (11.513d), nous avons utilisé le fait que (—1)7 = (—1)*! parce que qu'il faut kl trans- 
positions pour réaliser ©. 


LEMooERYDooAifUdG 


Lemme 11.196 ([1]). 
Soient Te AFV* et Se AlV*. Nous avons 


D (DT @S) = (1) >, (-D'(TSSY. (11.514) 


rESr+ TES k+k 
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Démonstration. Dans un premier temps, nous fixons un 7, nous oublions le (—1)T, et nous ne 


faisons pas la somme. Nous appliquons à (v1,...,vg47) € V**! : 
DEN (e) ST (ui: sir Ut) — (Te () S) (Ur) Se 6 > Ur(k+1) (11.515a) 
= Torre) S (Ur (+1),.0r (40) (11.515b) 
= Tops) ain en): (11.515c) 


Arrêtez vous un moment pour vous assurer d’avoir bien compris pourquoi ce qui arrive dans T 
sont bien des v,(,(5) et non des v,{4(). Une fois que c’est fait, nous définissons o' € Sy par 


| ERoocHee Es 


Avec ça nous pouvons continuer le calcul : 


CSS) ns on Plateau Sosa St) (11.517a) 
= (T OS) (01, .…., veu). (11.517b) 
(11.517c) 


En résumé, jusqu'ici nous avons prouvé que 
(TS @SYT = (TS) (11.518) 


où o’ est donné en fonction de © par la formule (11.516). 
Nous faisons maintenant le calcul avec la somme et tout (en notant € la signature) : 


S(r)(T° @ SY° = D e(r)(T @ 8)" (11.519a) 
= e(o’) D 'e(o')e(r)(T @ 5)7°7 (11.519b) 
= e(o’) Ÿ_ ef 0 o/)(T @ 5)°7 (11.519c) 
= eo) D e(r)(T @ ST. (11.519d) 

La dernière ligne est la proposition 1.303 et le fait que x + x o o’ est une bijection de Sy. 
LEMooKINCooHUEtaT 
Lemme 11.197 ([1]). 
Soient T e AFV*, Se AlV* et Re A"V*. Nous avons 5 
AIt (AK(T@S)@ R) = AK(T@S@R) = AK(T@AK(S@R)). (11.520) 
Démonstration. Nous prouvons la première égalité *7. Nous avons : 
1 m 
= ———— —1)T T 11.521 
AK (AK(T@S)@R) TEE > (-D'(ARKTO@S)@ER) (11.521a) 
TES R+I+m 
L) T k (ox (ox 7 
= à 1 >» (1 Tes)" eR 
(k+1+1)! ns. (œ + 1)! ns ) 
(11.521b) 
1 1 T 
- —1) ÿ, (-D'(T@S) @&R)". 
en à 
(k+l+m)!(k +0)! Su mr 
(11.521c) 


86. Nous avons le droit d'écrire T @ S @ R parce que le produit tensoriel est associatif, lemme 11.168. 
87. Je vous conseille d'essayer de prouver la seconde; je ne l’ai pas vérifiée. 
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C’est le moment d'utiliser le lemme 11.196. Nous continuons : 
1 1 
(k+1+1)! id 


Alt (AT @S)@ R) = D (1-1 (TSS) SR)" (11.522a) 


CESk+1 
1 
((T S) R)" 11.522b 
7 (K+1+m)! RE D Di(( one 
CESr+ T 
Notez que ce qui est dans la somme sur o ne dépend pas de ©. Nous avons donc |S%,,| = (k +k)! 
termes identiques, et nous continuons 
1 
Alt (AK(TOS)QR) = — (T@S@R) (11.523a) 
( ) Em 2 
= AK(TOS®R). (11.523b) 
Et voilà. 
DEFooCTSPooZRlufr 
Définition 11.198 (Produit extérieur). 
Pour T e AËV* et S e AlV* nous définissons 
k +1 
TAS= _. autres). (11.524) 
Cette opération est le produit extérieur. 
LEMooKEOWooNDXqgr 


Lemme 11.199 ([263]). 


Propriétés du produit extérieur. ITEMOOELVSo0HLORJy 
RE : : . AVS LT7* k+HITr* 
(1) L'opération À est une application À: ASV* x AIVYX — ASTVE, LTEMooRUBEooKVHFSz 


(2) L'application À: AFV* x AIV* — AFTVY est linéaire en ses deux ATJUR ER ES OTCUPOOI JYARE 
_ kl 

(3) Nous avons T AS =(—-1)"S AT. ITEMooKFPZooFennCT 

(4) Le produit extérieur est associatif : (T A S)AR=TA(S A R). 


Démonstration. En plusieurs parties. 

(1) Pour (1) Nous savons que T@S € Lyx41(V). Le lemme 11.194 conclut. 

(2) Pour (2) C'est la bilinéarité du produit tensoriel © et celle de l’antisymétrisation Alt 
donnée dans le lemme 11.194(3). 
Notez que la bilinéarité du produit tensoriel @ remonte à la définition d’un produit tensoriel 
(T,h) 11.152 qui demande à À d’être bilinéaire. La proposition 11.174 prouve que le produit 
T@S entre applications multilinéaires donne bien un produit tensoriel. Bref. Tout cela pour 
nous rappeler que ce que nous notons T @ S pourrait tout aussi bien se noter A(T, S). 

(3) Pour (3) Conséquence du lemme 11.195. 


(4) Pour (4) Soient Te AFV*, Se AÙV* et Re A"V*. En déballant les définitions, 


G&+1+m)! 
(TASIAR= Da AI ((T À S)@ R) (11.525a) 
__(k+l+m)l (k +1)! 
Dr AI (ET AIT x S)@ R (11.525b) 
CR 
= Alt (AK(T @ S)@ R) (11.525c) 
Km! 
k+1 
… COR K(T@(S@R)) lem. 11.197  (11.525d) 


= T'AS À AR): (11.525e) 
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LEMooZJJLooFGuguy 
Lemme 11.200 ([1]). 


Si & € A V*, alors nous avons 88 


En)! 
TT  — D Al ®...é). (11.526) 


Démonstration. Nous y allons par récurrence. Pour k = 1, l'égalité à prouver se réduit à 
£1 = Alt(é:), (11.527) 


qui est vraie par le lemme 11.194(2). 
Pour la récurrence nous faisons ceci : 


[ral 
_ Ea ni)! es ni)! 


(Et A si A GA br = (1 D: ÉEl À Éb (11.528a) 


Alt(£1 @...® éxr1) (11.528b) 
Da (nil) Dia ni)! : 
Ga ni)! 
[i-1 (ri!) 
PROPooRRSZooJX0Apq 
Proposition 11.201 ([263]). 
Soient £1,...,Ëêr € V* et v1,...,ux € V. Nous avons 
(£ Ne &)(u1, P x) = det (£i(v;)). (11.529) 


Démonstration. Nous pouvons utiliser le lemme 11.200 dans lequel n; = 1 pour tout à : (£1 A...A 
£x) = k! Alt(£1 ©... @ £x). Cela donne le calcul suivant : 


(E1 À... À éx)(v1,.….,ux) = k! AU (E ©... Q Ek)(v1,..., Uk) (11.530a) 
= Ha D CN ®...Qéx)"(v1,..., ve) (11.530b) 
= (DT (re) (11.530c) 
= EC) def. 4.78. (11.530d) 

Et voila. 
PROPooUGLOo0TULnDK 


Proposition 11.202 ([263]). 
Si {oi}i=1,..n est une base de V*, alors 


fon Au A on, teque lu << sSn) (11.531) 


est une base de A\* V*. 
Nous avons 


äim(A V)= Ge). (11.532) 


Démonstration. En plusieurs parties. 


88. L’alterné est donné dans la définition 11.193. 
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(1) Partie libre Nous notons {e;};-1..n la base (pré-)duale de V. Pour I = (i1,...,ix) avec 
ü <... < 4, nous notons (7 = a, À... A a, Soit J = (1,...,3k) avec j1 < ... < 4. Nous 
avons 

Qrler) = (oi À. A llé..,85) (11.533a) 
= Alfa, ©..:0.)(e:..8,) lem. 11.200 (11.533b) 
L T 
= KT D (Do (ext(5)) - x (Ext) (11.533c) 
: TES% 
= : 1)" Orr() (11.533d) 


Vu que les indices Z et J sont ordonnées, si 7 £ Id, nous aurons forcément un des 7(ÿ) # ü. 
Donc la somme sur 7 se réduit au terme x = Id : 


Qr(er) = êr. FOR RRE) 


Cela prouve que les (7 sont linéairement indépendants. 


(2) Partie génératrice 


Nous devons encore prouver qu'ils sont générateurs de Je V*. 

Soit T'E ia V*; en particulier nous avons T € £}(V,R), et le théorème 11.177 nous permet 
d'écrire T = ÿ 7 Trh(er) où la somme porte sur les 1 = (i1,...,ix) avec 1 < i; < n pour tout 
j, et her) = e, @...@e,. 

En utilisant encore le lemme 11.200, nous avons 


Qy = k!AIt (h(er)); (11.535) 


et donc 
T = AK(T 200 (A(e )-Zriuer (11.536) 


Il est temps de noter que si 1 et I’ sont les mêmes indices, mais ordonnés différemment, 
Qr = +Qy. Si I est un multiindice, nous notons r(1) le multiindice contenant les mêmes 
indices que 7, mais ordonné. Ensuite nous notons 


1 LOn—=0 
s(T) = Re, (11.537) 
—1 siQ,(rn = -Qr. 
Avec ça nous avons toujours (7 = ot et donc 
….. a DT QD. (11.538) 
Donc Test bien une combinaison linéaire des Q,(7,. 
(3) Cardinal Nous posons 
— {I tel que 1 < 1 <... <ig <n} (11.539a) 
= {Q7 tel que TI € À} (11.539b) 
C = {parties de cardinal k dans {1,...,n}}. (11.539c) 


Nous devons prouver que Card(B) = (}). Le lemme 3.42 donne déjà Card(C) = Card(A) = 
(Ah Nous prouvons à présent que 
v: A—B 
Tr Q7 


est une bijection. Cette application est surjective par définition de B. En ce qui concerne 
l’injectivité, si Q7 = Qy, alors pour tout multiindice L nous avons Qy(er) = Qy(ezr). En 
vertu de (11.534), cela donne ô7z = Ôy pour tout multiindice L. En prenant en particulier 
L = I, nous trouvons 1 = ôry et donc 1 = J. 


(11.540) 
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11.203. 
Si l = (i1,...,ùx) est un multiündice et si a = (a1,...,a,), alors nous notons 
AxT = du À À 0 (11.541) 
dans tous les cas où la formule a un sens. 
PROPooSDVXooLvwPbg 
Proposition 11.204. 
Soit ke N. Nous notons 
Cr = {(i1,..., x) € INF tel que 1 < ù <... < ip <n}. (11.542) 


Si {ei}i=1,.….n est une base de V, alors tout élément de AN V peut être écrit sous la forme 


w= Ÿ wrer (11.543) 


ieC% 


avec wr € R. 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


PROPooDXTOUooKYDOilI 
Proposition 11.205. 
Soit un ouvert U dans R". Si l’application 
k 
w: U— /\(R")* (11.544) 
est de classe C*, alors il existe des applications wr € C*(U) telles que 
w(s) = 2 wr(s)e* r. (11.545) 


IEC% 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


11.12.10 Règle de Leiïbnitz pour le produit extérieur 


Dans la suite nous allons intensément étudier la partie 
Sn = {r € Sr tel que r(1) < ... < T(k), n(k +1) <... < r(k+1i)}. (11.546) 


Nous commençons avec k = 1. Dans ce cas, le lemme 11.206 donnera la forme générale d’un 
élément de S{11. En ce qui concerne l'intuition, si 7(1) = m, toutes les autres valeurs de 7 sont 
fixées à cause de la croissance de j > r(j). Nous avons forcément que, lorsque j va de 2 à [ +1, le 
nombre 7(j) prend dans l’ordre toutes les valeurs entre 1 et ! + 1, en sautant m. 

Autrement dit, un élément de S{1 7 doit prendre cette forme : 

112 3 4 5 

11.547 
TG) 411 2 4 5: 
La première colonne est séparée parce qu’elle joue un rôle spécial : les nombres sont ordonnés de 
chacun des deux côtés. À droite, nous avons simplement l’énumération 1,2,3,4,5 en sautant 8. 

En ce qui concerne la signature, pour tout remettre en ordre, il suffit de bouger le 3 vers sa 


place. Pour cela il faut 2 transpositions. 
LEMooDBIEooYc;j1DP 


Lemme 11.206 ([1, 346]). 
À propos de Si: 
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(1) L'application @: {1,...,1+1} — Sr donnée par 


m si j=l : 
p(m)j=4j-1 sij<m FPT) 
j si ji>m 


est une bijection. 


ITEMooRIHAoo!ltlkCh 
; : — f_\m-1 
(2) En ce qui concerne la signature, nous avons e(d(m)) = (—1)"71. Te 
(3) Pour l'inverse de nous avons T = p(r(1)) pour tout TE Si). LTEMOoHMNFOoENphCK 
(4) Pour tout TE S(11) nous avons 
e(r) = —(—1)70 (11.549) 


Démonstration. Le fait que @ prenne effectivement ses valeurs dans S(; 7) est une simple vérification 
de la croissance. 
(1) Injective Si p(m) = p(n), alors en particulier m = p(m)l = p(n)l = n et donc m = n. 
(2) Surjective Soit re S(11,. Nous posons m = 7(1) et nous prouvons que T = b(m). 
Par croissance, si & > 2, nous avons 7(k) < k. En effet nous avons 7(1+1) > T(k)+(1+1—k). 
Au cas où nous aurions T(k) > k, nous aurions T(l +1) > T(k) +1—1—k>14+1, ce qui est 
impossible. 


D'autre part, pour tout k > 2 nous avons 
TE) = min ({1,...,1+1)\7{1..,6-1)). SE ÉESS8) 


Cela étant dit, commençons doucement en supposant ml = 1. Dans ce cas l’équation (11.550) 
donne tout de suite 7(2) = 2. Une récurrence montre qu’alors T(k) = k pour tout k. Autre- 
ment dit, si r(1) = 1, nous avons 7 = Id. Simple vérification que ph(1) = Id aussi. 


Passons au cas général r(1) = m > 1. Nous avons 
7(2) = min (a, Lit 1}\{m}) si (11.551) 


parce que m £ 1. Nous faisons une récurrence en supposant 7(j) = j — 1 pour un certain 
j < m. Nous prouvons que T(j + 1) = j. Pour cela, 


r(j +1) = min (ei, le 1,m}). (11.552) 


Étant donné que j < m, nous avons j — 1 < m et donc le nombre j est encore dans la 
différence dont nous prenons le minimum. Donc 7(j + 1) = j. Cela prouve que T(j) = g(m)j 
pour tout j < m. 


En ce qui concerne T(m), nous avons 
r(m) = min (4, DUR A de 2,m}) =m—1. (11.553) 


De même nous voyons que T(m + 1) = m + 1. De là, la croissance en tenant compte de 
T(k) < k fait le reste. 


(3) Pour (2) Nous montrons que 


m—1l 


(m, i) o b(m) = Id. (11.554) 
=] 


U 
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(3a) Pour j =1 Nous avons 


m—1 m—1 
(m,5)9(m)1 = | | (m,im (11.555a) 

é _ 
= | [(m,i)o(m,1l)}m (11.555b) 

. 
= | [(m,i)l (11.555c) 

i=2 
= 1 (11.555d) 


(3b) Si j <<m—1 Dans ce cas nous avonns p(m)j = j — 1. Nous avons alors le calcul 


m1 m—1 m—1l 
(m,i)@(m)j = ['[(m,)( —1) = [I (m,i) 0 (m,3j—1)(5 —1) (11.556) 
i=1 i=1 i=5 
m1 m—1l ' m—1l 
= [[(m,im= [T (mm, jm = [TT (m,i)5 = 5. (11:556b) 
i=j i=j+1 i=j+1 


(m,i)g(m}m = (m,m —1)(m —1) = m. (11.557) 


(3d) Pour j > m Nous avons 


m—1 m—1l 
(m,i)g(m)j = | [ (m5) = 5 (11.558) 
=] i=1 


t 
parce que j > m, de telle sorte qu’il n’est atteint par aucune des transpositions. 


Nous avons donc prouvé que IL: (m, i) o p(m) = Id. Vu que € est un morphisme *” et que 
e(Id) = 1, nous déduisons que 


e(g(m)) = e( | (m, à) (hs, (11.559) 


(4) Pour (3) Soit re S11. Vu que 6 est une bijection, il existe un unique m € {1,...,/+1} tel 
que 7 = (m). En appliquant cette égalité à 1 nous avons 7(1) = p(m)1. Mais la définition 
(11.548) de 6 donne @(m)1 = m. Nous avons donc prouvé que 


T(1) = (m)l = m, (11.560) 


c’est-à-dire m = 7(1) et donc 7 = @(r(1)). 
(5) Pour (4) Soit re S(11). En utilisant les points (3) et (2), nous avons 


e(r) = e(é(r(1))) = (1) 2 (re), (11.561) 
LEMooFHCHooQgrwHD 
Lemme 11.207 (|[1]). 
L'application 
p: Ban — Sa (11.562) 
mi O(r(1) —- 1) | 
est une bijection et vérifie 
e(p(r)) = —e(r). (11.563) 


89. Proposition 1.293. 
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Démonstration. En plusieurs parties. 
(1) Surjectif Lorsque x parcours B(13,, la valeur de (1) parcours les valeurs de 2 à ! +1, et 
donc (1) — 1 va de 1 à {. Le lemme 11.206 dit que @({1,...,1}) = Si-1. 
(2) Injectif Si p(r) = p(o), alors par injectivité de 6 (le 6 de S(11_1)) nous avons (1) = a(1). 
Or nous avons By € Sin. L'injectivié du @ de Si 1) dir que si r(1) = o(1), alors 7 = 0. 
(3) Signature Il s’agit d’abord le lemme 11.206(2). Soit x € B(11,. En posant m = 7(1) — 1 
nous avons 


e(p(r)) = e(b(r(n) = 1)) = (1) 2 (1), (11.564) 


Ensuite le lemme 11.206(4) nous donne e(x) = —(—1)"U), 


11.208. 
Si I est une partie de {1,...,n}, nous notons O(I) l'élément de N} donné par l’ordonnement des 
éléments de 1. Si E est un ensemble, nous notons P4(E) l’ensemble des parties de cardinal k de E. 
LEMooKGETooKhomPn 
Lemme 11.209 ([1]). 
Nous notons E = {1,...,k+1}. 
(1) L'application @: P,(E) — S(xr donnée par 
p(1)(1,...,1+k) = (O(1),O(E\)) (11.565) 


est une bijection. 


(2) Pour TE S(yy) nous avons 
= Ces (r(n)-n) Mo: hey 
Démonstration. Le fait que (1) soit dans S{,,) est visible dans la définition : les k premiers 
éléments de (9(1)1,...,@(1)(k +1)) et les ! suivants sont ordonnés. 


(1) Injective Soient 1,J € P,(E) tels que (1) = 6(J). En particulier pour j = 1,...,k nous 
avons®(1)j = d(J)j, et donc O(1); = O(J);. Cela prouve que O(I) = O(J) et donc que 


L =, 
(2) Surjective Soit 7 € S{,1. Nous notons 1 = T{1,...,k}, et nous prouvons que Tr = @(1). 
Vu que 7 € Sy, le vecteur (r(1), — TR) ): Étant donné que r est une bijection de E, nous 


avons aussi 
TÉk+1,...,k+1i} = E\T, (11.567) 
et comme (r7(k + 1),...,7(k +1)) est ordonné, il est égal à O(E\]). 
Nous devons déterminer combien de transpositions sont nécessaires pour transformer (7(1),...,T(k+ 
D) en (1,...,k +1). Étant donné que 7 € Sn, le plus grand parmi (r(1), —_ , T(k)) est 7(k), il il 
faut r(k) — k) permutations pour l’amener en k. Ce sont les transpositions 
T(k) 
L] Fr): (11.568) 
j=k+1 
Il faut ensuite T(k — 1) — (k — 1) transpositions pour ramener r(k — 1) en position k — 1, etc. 
Il faut donc bien composer 7 avec pe (r(n) — n) transpositions pour obtenir l'identité. 


LEMooEHTLooUSBBKL 
Lemme 11.210 ([1]). 
Bijection entre Br et S(xi-1). 
(1) L'application 
p: BG — S(ki-1) (11.560) 


me D(r{l,...,k} —1) 


est une bijection. 
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(2) Pour tout x € B(x1, nous avons 
e(p(r)) = (—1)Fe(r). (11.570) 


Démonstration. D'abord notons que w est bien définie. En vu que T(k + 1) = 1, aucun élément de 
n{1,...,k} n'est égal à 1. Et comme r(j) < k + 1, les éléments de T{1,...,k} — 1 sont entre 1 et 
k+1—1. L'ensemble r{1,...,k}—1 est donc un argument valable pour l’application D: P£{1,...,k+ 
li Sin 


(1) vest injective Soient T,o € B(41, tels que w(r) = y(a). Nous notons 1, = r{1,...,k} et 
15 = 0{1,...,k}. Pour tout j = 1,...,k nous avons 


E(T)j = O(fr — 1); = Of); — 1, (11.571) 


et similairement pour o. Nous en déduisons que O(I,) = O(T,), et donc que 7, = I. 


Vu que 7 = (1,), nous en déduisons que 7 = 6. 


(2) Surjectif Soit 7 € S(,3-1,. Nous posons 1, = T{1,...,k}, et nous considérons l’élément 
7 € B(x,1 donné par 
r(j) +1 siji<k 
r(ÿ) = {1 sij=k+l (11.572) 


O(E\(I Ù {1})), sij>k+1. 


La dernière ligne signifie « pour les autres, vous prenez ce qui reste, dans l’ordre ». Nous 
montrons à présent que 7 = (x). Nous avons 


pin) = (ri...) 1) = 0(r{1,...#h). (11.573) 


Cela prouve que p(T) = @(1;) =. 


En ce qui concerne la signature, il s’agit de manipuler la formule (11.566). Vu que By 1) € Sn, 
elle peut être utilisée tant pour x que pour 7(r). Pour x nous avons ”° 


k 
rl =  (r(n)-n). (11.574) 


n=1 
En ce qui concerne w(T) nous avons 
k k k k 
(nl = Ÿ (çtrin-n) = S (r(n)-1-n) = Y (min) -n)— D 1=Hrl-# (11.575) 
n=1 n=1 n=1 n=1 
LEMooRKWHooBNxZBL 
Lemme 11.211 ([1|). 
Soient des vecteurs v1,..., pu. Sim € Sy, si T € Lx(V) et si o € Sy, alors nous avons 
œ EQooQJXHooT 
T (Ur (1) s.. > Ur(k)) — T(Vro(1): . M) PE) 
Démonstration. Poser w; = v;(;,. Nous avons 
TT (Ur (1) Vr(k)) = T° (wi, .. ,W) = T(w, (1); s.. ut) = Tone tis s.. tee (11.577) 


90. Nous notons |r| le nombre de transpositions avec lequel il faut composer æ pour obtenir l'identité. C’est à dire 
e(r) = (—1)/l. Sinon l'expression est trop lourde. 
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LEMooTGNUooZnxkrc 
Lemme 11.212 ([62, 1]). 
Soient des tenseurs alternés T € AFV* et SE AlV*. Alors nous avons 
Œ A S)(v1, sers Uk+1) = . (r)T (vx (1); ns Un(e) S (Ur +1): jee > Ur(k+0) (11.578a) 
TES (k,1) 
= ŸN (TOS)" (un... ,œu). Une 
TES (k,1) 
où 
Sn = {Tr € Sxn tel que r(1) <... < r(k), r(k +1) <... < r(k +1}, (11.579) 


et e(r) est la signature °! de x, c’est-à-dire ce que nous notons souvent (—1)T. 


Démonstration. En plusieurs parties. 


(1) Une relation d’équivalence Nous considérons la relation d'équivalence suivante sur Sy+1. 
Nous posons 71 + 72 si {m1(1),...,71(k)} = {n2(1),...,m2(k)}. Pour mo € Sy: nous notons 


Aro) = {r € Sr tel que {r(1),...,7n(k)} = {ro(1),...,ro(k)}} (11.580) 


la classe d'équivalence de 7. 


(2) Permutations partielles 


Lorsque Tr — ro nous notons o(rxT0) la permutation qui permet de « remettre dans l’ordre 7 
les éléments mélangés par 7 ». Plus précisément : 


gér0) : F1... RE T1... E+ 
s flreer 0 iten(e... 6) 0 CN 


î sinon. 


Notez que o(7:70) est une bijection de {1,...,k+1}, c’est-à-dire que or) € Sy,7. De même 
nous considérons (77%) donné par 


rm). 1,...,k+1} —{1,...,k+1} 


. la siter({k+1,...,k+1}) (11.582) 
i sinon. 
Ces deux permutations vérifient 
a EnoctUVo FAQ 
En effet, si à = 1,...,k, nous avons o(7")x(i) = mo(i) et donc 
T0) (T0) 7 (à) = roi) (11.584) 


parce que mo(i) # m({k+1,...,k+1}). Même raisonnement pour prouver (11.583) pour les 
i=k+1,...,k+1. 


(3) Afro) = Sx x S Soit ro € Sx4. Nous notons P = ro({1, ne k}) et Q = mo({k +1,...,k+ 
1}). Nous montrons que 


d: Afro) — Sp x So 


11.585 
Ts (otr70)}», r(70)|0) ( ) 


est une bijection. 


91. Signature, définition 1.290. 
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(3a) Injective Soient 71,72 € A(m). Nous supposons que o("1"0)|L = g(r270)),. Vu que 
otrm0)|Q et or2:"0)|, sont l'identité, nous avons en réalité a(r1:"0) = G(r2:70), Le même 
raisonnement est valable pour T{r70) = F(r2:70), 


En utilisant (11.583) pour 71 et pour 2, nous écrivons 

TE) © GO) © 71 = 0, (11.586) 
et 

T2) © (20) © 72 = To, (11.587) 
et donc T1 = 72. L’injectivité est prouvée. 


(3b) Surjective Soient 9’ e Sp et 7’ € So. Nous les prolongeons par l'identité pour créer 
O,TE Sy. Nous posons 
m=0 or lo. (11.588) 


Nous voulons prouver que d(r1) = (o,T), mais d’abord nous devons rapidement vérifier 
que 71 = To. Pour à = 1,...,k nous avons 


(o-lor lo mp)(i) = o7l(mo(i)) € mofl,...,k}. (11.589) 


Même raisonnement pour à = k +1,...,k +1, et nous déduisons que T1 = mo. 
En utilisant la définition 11.581, pour à € ño{1,...,k} nous avons 


gru%t)(à) = (ont) 
= (Tom To)(i) 
= (ro)(i) 
= a (ti). 
Pour la dernière ligne, nous savons que o € SP et donc que o(i) € P, ce qui permet de 
dire que r(o(i)) = oi). 
Nous avons donc une bijection A(to) — Sp x SQ. Vu que P contient k élément et que Q en 
contient !, nous avons aussi une bijection A(ro) — Sy x Sy. 


Cardinal de A(mo) Par ce que nous venons de dire, nous pouvons écrire 


Card(ro) = k!l!, (11.591) 


et je vous prie de remarquer que cela ne dépend pas de 7. Toutes les classes d'équivalence 
ont même cardinal. 


Développer le produit extérieur Développons le produit extérieur. Nous avons 
1 1 ÆAQ00EQNJo i 
(Tas= D nTes"- D E«m(Tes) CÉFB02) 


: TESI+k AESr1/— TEA 


Nous sélectionnons mo € S%1:4 et nous regardons plus en détail la somme sur A(xo). Nous 
allons montrer que tous les éléments de la somme 


D «(r(T@S)" (11.593) 


TE A(To) 


sont égaux, et qu'il y a k!l! tels éléments. 


Un élément de la somme Soient ño € Sx44 et m € A(mo). Nous utilisons encore (11.583) : 


mo = 770) o gr") © 7. Nous allons provisoirement arrêter d'écrire les exposant ; nous 
écrivons o pour gr"), Donc 
(T (9) à à (v1, Ste , VkH) = Fois ie ront Siren si$s 18745 rest) (EL 594a) 


= T' (Von (1): ts » Vor(k)) S (Ur (+1); ces Vrn(kH) de 14 sent 
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Pour le premier facteur à = 1,...,k, nous avons (rox)(i) = (ox)(i). Nous introduisons 
o'=m loco r|{1,.x. Avec tout ce que nous avons fait, o'e Sy, et il est donc légitime de 


regarder ce que fait T°”. Notez qu'il n’est pas légitime de regarder T° ; bref. Nous avons, par 
la formule (11.576) : 


TP ur) eee Une)) = T'ÜUro/ (1): 2 Urot(e)) = T(Uor(1): Vor(h)): (11.595) 


Cela nous permet de réexprimer le premier SE dE r de le Qi ob ONE le second nous faisons 
le même genre de choses en introduisant T7’ : | 


(T © 5)" (v1, Le nr) — 1 Gt a (ur); CI » Un(k+0) (11.596a) 

_ e(o')e(r')T (vx); ... en LS et : Ur(k+0) (11.596b) 

= e(o')e(r')(T © S)"(a1,..., vu). (11.596c) 

(7) Signature Vu que o est l’identité sur m{k +1,...,k +1}, et vu que o =r loco, nous 
avons 

e(o') = e(r lon) = e(o) (11.597) 


parce que € est un morphisme. 
Comme toujours, nous avons e(r’) = e(r) pour la même raison. 


Nous avons f = Tooor, et donc 
e(ro) = e(r)e(o)e(r), (11.598) 
et en repartant de (11.596), 
e(ro)(T © S)" = e(mo)e(o)e(r)(T @ S)T = e(x)(T @ S)*. (11.599a) 
(8) Résumé Jusqu'à présent nous avons prouvé que pour tout x € A(mo), 
E(r)(T @ S)7 = e(mo)(T @ 5). (11.600) 
(9) Utilisation des classes Nous repartons de (11.592). Pour chaque classe À € Sy] —, 


nous choisissons un représentant m4 € À. Pour tout rm € À nous avons e(m)(T @ S)T 
e(rA)(T @ S)TA. Nous avons alors 


1 
(TAS)=5r À DrTes) (11.601) 
A€ES% y/= TEA 
1 
=uy D D draNTES)"* (11.601b) 
° ” AeSk y/= TEA 
1 T 
— ER D, Ællle(r4)(T @ S)"A (11.601c) 
A€ES% = 
=  ), «raT@S)A. (11.6014) 
AESz4/ 


(10) Conclusion Chaque classe À € $%,7/ — contient un unique élément de $(,. Il suffit de 
prendre celui-là comme choix de T1. Et nous avons finalement 


TAS= ÿ  «r(T@Sy, (11.602) 


TES (k,1) 


comme annoncé. 
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11.12.11 Produit intérieur 


Définition 11.213. 
SiveV et siTe id V*, nous définissons le produit intérieur i, : A V* — A LV par 


(iv T)(X1, ET , Xx_1) —= Te, X1: s.. Xp). (11.603) 
PROPooETGJooMjxAFp 


DEFooFWIHooJiTnwM 


Proposition 11.214 (|1}). 
Soit w e A" V*. L'application 


k—1 
PER NT (11.604) 
U + iy(w) 


est linéaire. 


Démonstration. Soit À € R. Nous avons 


ixo(w)(v1,...,Ug-1) = WAV, U1,..., Ug_1) (11.605a) 
= AU, Uis2545 061) (11.605b) 
= Malo)loi situe ji) (11.605c) 


Le même genre de vérifications montre que 


ru) (0,22, der) = dl) Cor, 24081) + ol) (oi. Uri). (11.606) 


Le lemme suivant donne les coordonnées de i,(w) en fonction de celles de w. 


LEMooOUBUVooBHpDZX 
Lemme 11.215 ([1]). 
Soient ve R" et we A\*(R"}*. Nous supposons que 
w=  Ù  wregr (11.607) 
T=(i,..ix) 
el 
bfw)= D wie. (11.608) 
J=(ÿ1,..,581) 
Alors . 
why = Ÿ wijui. (11.609) 
i=1 
Démonstration. Soient des vecteurs v2,...,v4. En ce qui concerne la somme sur J, nous notons le 
multiindice J = (j2,...,94) au lieu de J = (1,...,9x_1) pour que ce soit plus simple plus bas : 
? Fe / EQoo0CFOÜo TF0) 
w'(va, ..., UE) = > WG (V2, ; Ur) = » Goal ss op) | 
J=(ÿ2,...,5x) J=(ÿ2,...,5x) 
Sp PERS SR RRONCERCRE 
iu(w)(va,...,ux) = w(v,v2,...,Ux) (11.611a) 
= D wrepr(v, Ur, ..., Uk) (11.611b) 
I 
=) fu). (ue (11.611c) 
I 
nm 


“(os FE just Re ei Per) 
J 
= > (>, WiJVi) fesses cf. en à PES) 
J 


Il 
ÉA 
] 
- LA 
E 
Q 
E 
= 
S 
Pré 
ND 


Justifications. 
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— Pour (11.611d). Nous décomposons la somme sur 1 = (i1,...,ix) en une somme sur le 
premier élément (que nous nommons À) et une somme sur les autres (que nous nommons 
J = (ÿ2,...,9k)). Dans la notation w;7, le iJ signifie le multiindice (4, 2,..., jx). 


— Pour (11.611e). Permuter les sommes. 


Vu que y(w) = w’, en comparant (11.610) avec (11.611), nous trouvons 


why = D wijui (11.612) 
i 


comme il le fallait. 


PROPooYCRXooSOUsqCb 
Proposition 11.216 (Règle de Leibnitz pour le produit extérieur{62, 1]). 
Soient T e AFV* et Se AlV*. Pour tout v € V nous avons 


tlT À 9) = (iT) À S4 (-LÈT À (iuS). ÉMooGMEPoRp EN LT 


Démonstration. Pour des soucis de lisibilité nous notons v, pour v et nous calculons en utilisant 
l'expression du lemme 11.212 pour le produit extérieur : 


) VYOY 
Loi (T A S) (vo, soc ; Vk+1) = >, E(r)T (ur (1); ue > Ur(e)) S (Ur +1): ee Ur(kH) nn CESR l 
TES (k,1) 


Vu que les éléments de x € $(4,, ordonnent séparément {r(1),...,7(k)} et {n(k+1),...,m(k+1)}, 
la valeur de x_!(1) est soit 1 soit k + 1. Nous définissons donc deux parties : 
An = {TE Sun tel que (1) = 1} (11.615a) 
Bo — {T (= S(k,D) tel que r(k + 1) = 1}. (11.615b) 


Ces parties ont déjà été introduites et étudiées dans la définition 1.296 et le lemme 1.297. Nous 
poursuivons (11.614) : 


A (T A S) (vo, de ; Vk+1) S 5 (r)T (vx); HA > Un(e) ) S (Ur (+1): se “UtRat) 
TEA LE it) 
+ Der (tr); ë ste) rt): CE » Un(k+0) 
reB 
(1) Première somme, sur A;, Nous nous concentrons maintenant sur la première somme, 
c’est-à-dire les termes avec T(1) = 1. 


Dr) Tone «3 rte)) (UC +1)» +» Ur( +0) 
1e (11.617) 


= > e(T) (do T')(Ur(2); #42 Ut) S (Ur (+1): ee > Ur(k+0) ; 
TEA 


C’est le moment de profiter des lemmes 1.296 et 1.304 pour changer la somme. Nous notons 
f(x) — er) Gus T)(Ur(2,.or go) 5 (Ur (+1) …. “tte (11.618) 


et nous considérons la bijection 4: A{41) — S(x_119. Nous avons aussi gp l(r)i = r(i—1)+1. 
Et donc, en posant w; = v;,1 pour y voir plus clair : 


fer) — e(p7"(r)) (éu T°) (ue )+1 oe  Vr(1)-+1) S(07(6)+1: ss  Ur(k+1—1)+1) (11.619a) 
E(T)(iv, T) (wc), _—.  Wr(k-1)) S (UK), _— » Wr(k+1-1)) (11.619b) 
(in T @ S) (w;t1, ---, Wexri-1)) (11.619c) 
= (TO S) (anses teyr 1) (11.619d) 
Care). (us,:20840) (11.619e) 
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SUBEQSo0oSDMCooHmPCZ 
En remettant dans la somme et en utilisant le lemme 1.304, | Rues DOUÉ 
Sie  JGr6) (11.620a) 
TEA TES (k-1,1) 
= > (in T @ S)”" (vo, , ur) (11.620b) 
TES (k1,1) 
= Gal A Su. m) (11.620c) 


Cela est déjà le premier terme de (11.613). 


Seconde somme, sur B(,,, Nous étudions maintenant la somme sur B(41) dans (11.616). 


Nous posons encore 


f(x) = (r)T (ur); +. > Ur(e)) S (Ur (+1): sé Ur(k+t))- (11.621) 
Nous utilisons la bijection 4: B(x1) — S(x1-1) du lemme 11.210 
D, fm = D, f(e7(r). (11.622) 
TEB(k) TES(k,1—1) 


(—1)Fe(r). Ensuite, pour j = 1,...,k nous avons 5 l(r)j = 


en 

TS 
= 

= 

= 
I 


Nous avons d’abord e(p” 


T(j) + 1. Donc HoRBoLE 
T(vy-1(r)1: s.. uit) — Tv (+1 s.. > Ur(k)+1)- sai ° PE 6D 


Ca, c'était la partie pas très subtile. Nous devons maintenant voir la partie avec S c’est-à-dire 
déterminer en termes de 7 les valeurs de (@=t(r)(k+1),...,ç@t(r)(k+1)). 

Pour la suite, soyez attentifs à la distinction entre des égalités d’ensembles du type {a, b} = 
{c, d} qui signifie que a est c ou d et que b est l’autre et les égalités de vecteurs du type 
(a,b) = (c, d) qui signifie a = cet b = d. 

Vu que w!(r) est une bijection, nous avons 4-1(r){1,...,k +1} = {1,...,k +1}. Et nous 
avons déjà vu que 


p_ 1 (r)(L,...,k) = (r(1) +1,...,7(&) +1). (11.624) 
Mais par ailleurs, vu que 7 prend ses valeurs dans {1,...,k+1—1}, nous avons 
{1,...,k+1} = {1,7(1)+1,...,7(k+1—1) +1}. (11.625) 
Nous avons donc 
Tn{k+1,...,k+0 = {1;7r(k+1)+1,...,7(k+1—1) +1}, (11.626) 


et comme les valeurs de 7 sont ordonnées, nous avons même l'égalité de vecteurs 
pr) +1,...,k+0) = (1,7(k+1)+1,...,7(k+1—1) +1). (11.627) 
En utilisant cela, 


S(vo-1(7)(R+1)5 2 + + Vo-t(n)(e+0) = S(U1, Ur(k+1)+15 + à Ur(kæt1)+1) (11.628a) 
= (in S)(W:(%41): : + > Wr+i-1)) (11.628b) 


Où nous avons posé Wj = Vj+1. 
En écrivant aussi (11.623) en termes de w, nous avons 


fe n) = (DENT (wo)... w4) Gui 9) (W-(+2), -, Wrçgi1)) (11.629a) 
= (—1)e(r)(T @ in S) (we, wyç+r-1) (11.629b) 
= (1 e(T)(T @ iv, S)T (wi, , Wpxr_1) (11.629c) 
= (—1)fe(r)(T Qi, S) (ve, , veu). (11.629d) 
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E IZooXZrqi 
Et au final, en utilisant l’expression (11.578b) du produit extérieur, | RE 
D fm =(-if D «n(TOiS) (02, vu) (11.630a) 
rEB(x 1) TES (k,1-1) 
= (LT À in S)(02,... , ur). (11.630b) 


(3) Conclusion Les deux termes de (11.616) sont (11.620) et (11.630). Nous avons donc fina- 
lement 


do (T A S\(v», vs , Uk) = Car A S\(v2, re Veau) + (LT A iv9)(v2, se kit); (11.631) 


comme demandé. 


11.12.12 Pull back 


Définition 11.217. 
Si f: W — V est linéaire, nous définissons le pull back f*: A V* — A° W* par 


(Tue...) = Tour). los). (11.632) 


Proposition 11.218 ([62]). 
Pour toute application linéaire f : W — V nous avons 


PT AS) = (FT) À (F*S). (11.633) 


Démonstration. Soient Te A V* et Se /\! V*. En déballant les définitions, nous avons 


PCA Bu ese) = PA SN) Plügae)) (11.634a) 
_ . >, (—-D'(T @ S)"(f(u1),..…, f(vr +1) (11.634b) 
d  rESr+r 
k+k)! 
= _ à (11.634c) 
y (1) TT (Fur), pu For) SF (Ur 1); ses > É(Ur(k+0)) 
TES x+k 
k+k)! 
— ” ) à . CT); .. mn) See …. > Ur(k+1)) 
n  rESr+R 
(11.634d) 
k+k)! 
_ _. = CPTIOUP Says trtérn) (11.634e) 
.  rESp+k 
= (FT) À (FF S) (or, , Uri). (11.634f) 
(11.634g) 


11.12.13 Norme 


Nous considérons des espaces vectoriels V et W de dimension finie. L'application (11.460) 
donne un isomorphisme d’espaces vectoriels 


pb: V@W — L(V*,W) 


vw (ar a(v)w). CES) 


Et ça, c’est très bien, parce que nous connaissons une norme sur £L(V*,W) : la norme opérateur 
l1:51. 
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DEFOoEXXNooMgIpSV 
Définition 11.219 ([1]). 
Soient deux espaces vectoriels normés de dimension finie V et W. Sur V @OW nous définissons, 
pour te V@OW 


lé = oem (11.636) 
LEMooQPXHooJWfpmk 
Lemme 11.220 ([1]). 
La norme sur V @W vérifie 
lv @ w| = |v|lwl (11.637) 


pour toutve V'etweW. 


Démonstration. C’est un simple(?) calcul : 


lu @wl = Ip(v®w)| = la a(v)wl — ce la(v)wl = AE la(u)fful|. (11.638) 
| = al = 
Étant donné que V est de dimension finie, SUPJa=1 1A(v)| = || %, Nous avons donc 
lu @ w| = lulu. (11.639) 


Le lemme suivant montre que R@R n'est pas du tout R x R = R?. Au contraire, R@R est 


isomorphe à IR. 
LEMooVONEooQpPgcn 


Lemme 11.221 ([1|). 
L'application 
p:R@R—R 


(11.640) 
1@1-1 


prolongée par linéarité est un isomorphisme isométrique. 


Démonstration. D'abord une base de R est {1}; donc une base de R@R est {1 @ 1} par la 
proposition 11.166. Donc l’application proposée se prolonge par linéarité à tout IR @ R. 

Le fait que 4 soit une bijection provient du fait que 4 transforme une base en une base ; si vous 
n'y croyez pas, la vérification de l’injectivité et de la surjectivité est facile. 

Pour que 4 soit isométrique, nous faisons le calcul 


leGx @ y)l = Ixy(t @ 1)| = lzyll1 11 = lxyl = 1x @ yl. (11.641) 


Nous avons utilisé la propriété 7.149(3) d’une norme ainsi que le lemme 11.220 pour la norme sur 
R@R. 


11.12.14 Applications bilinéaires, matrices et produit tensoriel 
SECooUKRYooZjagcX 


Soit Æ, un espace vectoriel de dimension finie. Si « et B sont deux formes linéaires sur un 
espace vectoriel E, nous définissons « @ 5 comme étant la 2-forme donnée par 


(a ® B)(u, v) = a(u)A(v). FROUNRT RE) 


Si a et b sont des vecteurs de FE, ils sont vus comme des formes sur Æ via le produit scalaire et 
nous avons 


(a@®b)(u,v) = (a : u)(b : v). (11.643) 


92. Cela est une des raisons pour lesquelles nous sommes en dimension finie : je ne sais pas si cette égalité est vraie en 
dimension inifinie. 
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Cette dernière équation nous incite à pousser un peu plus loin la définition de a@b et de simplement 
voir cela comme la matrice de composantes 


(a ® bij = &b;. (11.644) 


Cette façon d'écrire a l’avantage de ne pas demander de se souvenir qui est un vecteur ligne, qui 
est un vecteur colonne et où il faut mettre la transposée. Évidemment (a @ b) est soit abt soit atb 
suivant que a et b soient ligne ou colonne. 


11.12.15 Application d’opérateurs 


LemMyKPzY 
Lemme 11.222. 
Soient x,ye E et À,B deux opérateurs linéaires sur E vus comme matrices. Alors 
E 
(Az ® By) = A(x ®y)Bt. PE 
Démonstration. Calculons la composante 17 de la matrice (Ar @ By). Nous avons 
(Az @ By)ij = (Ax)i(By); (11.646a) 
— AitrBy (11.646b) 
kl 
= Ajx(x @y)HB;j (11.646c) 
= (A(x@y)B"),.. (11.646d) 


Le fait que les applications linéaires soient continues * est valable dans une assez large gamme 
d'espaces vectoriels[347]. Nous voyons ici dans le cas des espaces vectoriels normés de dimension 


finies. 
PROPooADPDooUtukQP 


Proposition 11.223. 
Soient des espaces vectoriels normés E et F'. Si f: E — F' est une application linéaire et si E est 
de dimension finie, alors f est continue. 


Démonstration. La proposition 11.51(1) nous dit que | f] < 00, c’est-à-dire que f est borné. Donc 
la proposition 11.62 conclut. 


LemWWXVSae 
Lemme 11.224. 
Soit F un espace de Banach et deux suites Aj — A et By; — B dans L(F,F). Alors Ajo By — AoB 
dans L(F, F), c’est-à-dire 
lim (AxBx) = (ii A1) (ii m) ; (11.647) 
k—00 k—00 k—00 
Démonstration. Il suffit d'écrire 


Ar Bx — AB| < Ar Br — A&B| + 4x B — AB||. (11.648) 


Le premier terme tend vers zéro pour k — © parce que 


| AxBx — AB] = | Ax(Bx — B)| (11.649a) 
< | Ax]]Bx — B]— |AÏ : 0 (11.649b) 
= (11.649c) 


où nous avons utilisé la propriété fondamentale de la norme opérateur : la proposition 11.62. Le 
second terme tend également vers zéro pour la même raison. 


93. Proposition 11.62. 
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11.12.16 Convergence en norme et par composante 


En dimension infinie, la convergence en norme et la convergence composante par composante 
ne s’impliquent ni dans un sens ni dans l’autre. 

L'exemple suivant devrait être formalisé dans l’espace {? des suites de carré sommable, mais 
vous voyez l’idée. 


Exemple 11.225. 
Nous considérons l’ensemble des suites réelle munie de la norme |x| = 4/30 |xxl2. Dedans nous 
considérons les vecteurs de base e; donnés par 


(&)s — One (11.650) 
Ensuite nous considérons la base 


Ji = e1 + —e. (11.651) 


La suite 7 = fn — f1, dans cette base a toujours —1 comme première composante °*, Et pourtant 
elle converge en norme vers 0. A 


11.13 Calcul différentiel dans un espace vectoriel normé 
SecLStKEmc 
Quelques motivations pour la notion de différentielle sont données dans 12.22.1. 


11.13.1 Définition de la différentielle 


Proposition-Définition 11.226 (|1]). 
Soient deux espaces vectoriels normés® E et F ainsi qu'une fonction f: U — F où U est un 
ouvert de E. Si il existe une application linéaire T € L(E, F) satisfaisant 


DefDifferentiellePta 


Jim f(a+h)— f(a) -T(h) _ 0. EqCritere FÉES, 
je DE 


alors il en existe une seule. 
Dans ce cas nous disons que f est différentiable au point a et l’application T ainsi définie 
est appelée différentielle de f au point a, et nous la notons dfs. 


Démonstration. Soient deux applications linéaires Ti, T2 satisfaisant la condition (11.652). Nous 
avons 


MG) B()lr LIT) = fa +h) + f(a)] | IF +R) — F0) = ()| 
lhle L 1h] IA] 


Nous avons donc 


>0. (11.653) 


IT — D)(h)|r 
h—0 IRlE 


= 0. (11.654) 


Soit e > 0. Ce que signifie la limite est qu’il existe un r > 0 tel que pour tout u € Bg(0,r), nous 
ayons 
ICT — T2)(u)|r 
lu 
Soit ve E. Nous considérons À € R tel que Ave B(0,r), par exemple À < r/|v|. Nous avons 
D —B)OQv)lr _ IT -2)(v)| 


| 
E > = 
lvl lu] 


. (11.655) 


(11.656) 


Cela donne 
ICT: — T2)(v)| < lol. (11.657) 


Nous avons donc |(T1 — T2)(v)| = 0, soit Ti(v) = Tv). 


94. N’essayez pas de faire un dessin : ça ne fonctionne qu’en dimension infinie. 
95. Définition 7.149. 
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L'application différentielle 


df:E—£(E,F) (11.658) 
a+ dfa | 


est également très importante. 


11.13.2 Quelques mots à propos des différentielles d’ordre supérieur 


Soient deux espaces vectoriels normés V et W ainsi qu’une application f: V — W. La diffé- 
rentielle est une application df: V — L(V,W). Pour être clair, la différentielle seconde consiste 
à différentier df, par rapport à x. C'est-à-dire que la différentielle seconde est une application 
d(df): V — £(V, EVE W)). 

Et c’est là que commencent les problèmes. Les différentielles successives font intervenir des 
emboîtements de plus en plus profonds d'espaces comme d f: V — £(v L(V, L(V, w))). 


Nous introduisons quelques notations pour traiter ces espaces. 
DefPNjMGqy 


Définition 11.227 ([348, 1]). 
Soient deux espaces vectoriels normés V et W ainsi qu’une application f: V — W. Nous disons 
que f est 

— de classe C® si elle est continue, 

— de classe CŸ si l'application différentielle df : V — L(V,W) est continue, 

— de classe CŸ si sa différentielle est de classe C*-1. 

— de classe CT si elle est de classe C* pour tout k. 

Lorsque nous demandons que la différentielle de f soit continue, nous entendons bien la conti- 

nuité de df: V — L(V,W\), c’est-à-dire la continuité de df; par rapport à x. Sur£L(V,E), nous 
considérons la topologie de la norme opérateur 11.51. 


Le lien entre classe C* et dérivées partielles d'ordre k sera le théorème 12.341. 
DEFooJYOPooBzditG 


Définition 11.228. 
Soient des espaces vectoriels normés V et W. Nous définissons les espaces emboîtés par récurrence : 


E=E (11.659) 
Ep = L(V, Ex). (11.659b) 


Définition 11.229. 
Si {e;} est une base d’un espace vectoriel V, nous allons noter 


w:V—R 

| (11.660) 
LR di. 

Ce w; est ce qu’on appelle souvent ef. Plus généralement, si I est le multiindice (i1,...,ù) nous 

notons wy € L'(V,R) par 

WI : vit R 

11.661 

a, 20) 20. 20 (06 

Re HÉTUE 


Ce seront nos formes multilinéaires de base. 


Afin de garder des notations très explicites, nous ne pouvons pas écrire des formules comme 


0) 
dia = D SE (our 


ï 
parce que si f prend ses valeurs dans £(V, R), lorsqu'on écrit df,(v), il n’y a aucune raison à priori 


de vouloir que v soit pris par w; au lieu de 0; f(a). 
Nous introduisons donc un produit fait exprès pour dire que « c’est celui de droite qui prend ». 
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DEFooLULCooŸjBEaz 
Définition 11.230 ([1]). 
Si W est un espace vectoriel, nous définissons le produit x, par 
x1: W x L(V,R) — LV, W 
. er (11.662) 
(w x1 a)(v) = a(v)w 
el par 6 
Xn: WXRh — W, 
u . h (11.663) 


(w Xn a)(v) = w Xn-1 a(v) 


Cette notation sera utilisée dans la proposition 12.304 pour écrire correctement df,. Pour 

l'instant nous n’en avons pas besoin. 
DefAQIQooYqzZdya 

Définition 11.231 (difféomorphisme). 
Soient U et V, deux ouverts d’un espace vectoriel normé. Une application f de U dans V est un 
difféomorphisme si elle est bijective, différentiable*" et dont l'inverse f-! : V — U est aussi 
différentiable. 

Un C®-difféomorphisme est un difféomorphisme qui est C* et dont l'inverse est CF. 


11.232. 
Truc marrant : un C!-difféomorphisme n’est pas seulement un difféomorphisme qui est C!. L’inverse 
doit également être C!. Comment nommer un difféomorphisme qui est par ailleurs un application 


de classe C1? Je ne sais pas. 
RemATQVooDnZBbs 


Remarque 11.233. 
L'application norme étant continue, le critère du théorème 7.138 est en réalité assez général. Par 
exemple à partir d’une application différentiable Ÿ f: X — Ÿ nous pouvons considérer la fonction 
réelle 

a |dfal (11.664) 


où la norme est la norme opérateur *”. Si f est de classe CT alors cette application est continue et 
donc bornée sur un compact K de X. 


11.13.3 Différentielle d’applications linéaires 
LEMooZSNMooCf;jz0B 


Lemme 11.234 (Différentielle d’une application linéaire). 
Soient deux espaces vectoriels normés E et F'. Soit une application linéaire f: E — F. 


(1) Si f: E — F est linéaire, alors sa différentielle est 


df: E—£L(E,F) 


at f. 


(11.665) 


(2) Si f: E — F est linéaire, toutes les différentielles d'ordre supérieures sont nulles. 
(3) Toute application linéaire est de classe CT. 


(4) Toute application affine est de classe C?. 


Démonstration. Pour rappel, toujours bon à avoir en tête : df: E — L(E,F). Soit a € E; nous 


avons 
Ga +) — f(a) = F)Ir 
0 lle 


= 0 (11.666) 


96. Définition 11.228 pour les espaces Eh et Rh. 
97. Différentiables, définition 11.226. 

98. Définition 11.226. 

99. Définition 11.51. 
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parce que le numérateur est nul pour tout h. Donc h + f(h) est la différentielle de f au point a 
parce que elle vérifie la condition (11.226). 
Nous avons prouvé que la différentielle de f est l’application constante 


df: E— L(E,F) 


. (11.667) 


En ce qui concerne la différentielle seconde, nous prouvons que d(df), = 0 pour tout a € E. En 
effet, 


. Idfa+h — dfalc(e,r) 
im 


= 0 11.668 
He JA ES 


parce que le numérateur vaut f — f = 0. 
Maintenant il n’est pas compliqué de faire une récurrence : si f est de classe CŸ et si dX(f) = 0, 
alors d”(f) est de classe C! et dX f = 0. 


LEMooAJDLoo!IPcmIV 
Lemme 11.235. 
Soient a < b dans R. L'application 
J':{a,b] — [0,1] 
E IINJ 
T—a ii) su 11-600) 


b—a 


Tr 


est un CT°-difféomorphisme 100. 


Démonstration. En plusieurs parties. 


EM RECoo0USEqJL 
(1) Valeurs dans [0,1] Nous à evons prouver que pour tout x € [a,b], nous avons f(x) € [0,1|. 
D'une part si x € [a, b|, alors x — a > 0 et donc (x — a)/(b— a) > 0. 
Dans l’autre sens, si (x — a)/(b — a) > 1, alors x — a > b — a et donc x > b. Donc f(x) > 1 


n'arrive jamais pour æ € [a, b]. 


TS 
ND 
a 


Injectif Si f(x) = f(t), alors en simplifiant par b — a 0, nous trouvons x —- a =t—a 
et donc x = t (ne citez le lemme 1.433 que si vous êtes capables de le prouver, sinon faites 
comme si c'était évident et il ne vous arrivera rien). 


(3) Surjectif Il est vite vérifié que 
ft) = #(b— a) + a, FRE TE TO) 


et en procédant de même qu’au point (1), nous voyons que pour tout t € [0,1], f-!(t) e [a, b]. 
(4) De classe C® C’est le lemme 11.234 qui fait le travail parce que (11.669) est affine. 
(5) Inverse de classe C? Encore le lemme 11.234 parce que (11.670) est affine. 


11.13.4 Accroissements finis 
LEMooYQZZooVybqjk 


Lemme 11.236. 
Soit une fonction f: E — V (espaces vectoriels normés) différentiable en a € E. Alors il existe 
une fonction a: E — V telle que 


00 | , 
En 1 = (11.671a) 
f(a+h) = f(a) + dfa(h) + a(h). (11.671b) 


Démonstration. Il s’agit seulement de poser 
a(h) = f(a+h)— f(a) — dfa(h). (11.672) 


Le fait que a(h)/|h| — 0 est alors la définition de la différentiabilité de f. 
100. Définition 11.227. 
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11.13.5 Notations pour les applications linéaires 
DEFooTLQUooJvknvi 


Définition 11.237 ([349]). 
Soient E et F deux espaces vectoriels normés. 
(1) SiE et F sont deux espaces vectoriels (pas spécialement normés) nous notons L(E, F) l’en- 
semble des applications linéaires de E vers F. 
(2) Un morphisme d’espaces vectoriels normés est une application linéaire E — F continue 
pour la topologie de la norme opérateur. 
L'ensemble des applications linéaires bornées 11! entre E et F est noté L(E, F). 
(3) Un isomorphisme est un morphisme continu inversible dont l’inverse est continu. Nous 
notons GL(E, F) l’ensemble des isomorphismes entre E et F. 


11.13.6 (non?) Différentiabilité des applications linéaires 
LemooXXUGooUqCjmp 


Lemme 11.238. 
Soit une application linéaire f. 


(1) Si f est continue, alors elle est différentiable et df,(u) = f(u) pour tout a et u. 


(2) Si f n’est pas continue, alors elle n’est pas différentiable. 


Démonstration. La linéarité de f donne : 


f(a+h) — f(a) — f(h) = 0, (11.673) 


et donc prendre T = f dans la définition 11.226 fait fonctionner la limite. De plus T est alors 
continue par hypothèse; elle est donc bien la différentielle de f. 
Supposons que f ne soit pas continue, prenons une application linéaire continue T, et calculons 


f(a+h) io TR). DU = (f = T)(ep) ERooFLYMo G Et Een 


où e} est le vecteur unitaire dans la direction de h. Vu que f n’est pas continue et que T° l’est, 

l'application f — T' n’est pas continue. Elle n’est pas pas bornée par la proposition 11.62. Il existe 

alors un vecteur h tel que |(f — T(ex)] > 1 (et même plus grand que ce qu’on veut). 
Donc la limite de (11.674) pour h — 0 ne peut pas être nulle. 


LemLLvgPQW 
Lemme 11.239. 


Une application linéaire continue est de classe CT. 


Démonstration. Soit a e E. Étant donné que f est linéaire et continue, elle est différentiable et 


df: E-— L(E,F) 


ae (11.675) 


est une fonction constante et en particulier continue ; nous avons donc f € C!. Pour la différentielle 
seconde nous avons d(df)a = 0 parce que df(a + h) — df(a) = f — f = 0. Toutes les différentielles 
suivantes sont nulles. 


11.13.7 Dérivation en chaine et formule de Leibnitz 
PropOYtglua 


Proposition 11.240. 
Soient f;: U — F;, des fonctions de classe C” où U est ouvert dans l’espace vectoriel normé E et 
les F; sont des espaces vectoriels normés. Alors l'application 


FANS Mouse, 
ze (f(x)... fa(c)) 


101. Nous avons vu dans la proposition 11.62 que la continuité était équivalente à être bornée pour la norme 
opérateur de la définition 11.51. 


(11.676) 
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est de classe CT et 
dis lee (11.677) 
Démonstration. Soit x e U et h € E. La différentiabilité des fonctions f; donne 
je +R) = f(x) + (dfie(h) + œi(h) (11.678) 
avec limp_,0 &(h)/|h| = 0. Par conséquent 


f(x +h) = (2, fi(e) + (dfi)a(h) + œih),...) (11.679a) 
Co en Ce on (11.679b) 


Mais la définition 7.216 de la norme dans un espace produit donne 


Jim =, (11.680) 
h—0 [Lol| 
ce qui nous permet de noter a(h) = (a1(h),...,a,(h)) et avoir limp_,0 a(h)/[h| = 0. Avec tout ça 
nous avons bien 
f(&+h) = f(x) + ((dfi)a(h),..., (dfn)a(h)) + a(h), (11.681) 
ce qui signifie que f est différentiable et 
de (dis 0e) (11.682) 
THOooIHPIoo!IUyPaf 


Théorème 11.241. 
Soient des espaces vectoriels normés E,V et W. Nous considérons deux fonctions f: E — V et 
g: V— W. Nous supposons que : 


(1) f est différentiable en a € E 
(2) g est différentiable en f(a) € V 
(3) dfa est de norme finie 102. 
Alors go f: E — W est différentiable en a et 


d(g ° fja(u) = dgfta) (dfa(u)), (11.683) 
où encore 
d(g f)a = dgf(a) © dfa- (11.684) 
Démonstration. En utilisant le lemme 11.236 pour les fonctions f et g, nous avons 
E XNWZooJSP; 
f(a+h) = f(a) + dfa(h) + a(h) Roots 
L EQoo1QZZooW 
g(f(a) +) = g(f(a)) + dar (A) + 80). FEES) 


L'application dg/(a) ° dfa est une application linéaire, et est notre candidat différentielle. En suivant 
la définition 11.226, nous allons calculer 


(go fa + h) — (ao FY(a) — (arte © dfa)() 


11.687 
Le A] He 


Si cette limite existe et vaut zéro, alors nous aurons prouvé que le candidat différentielle est correct. 
Pour cela, nous emboîtons les formules (11.685) et (11.686) l’une dans l’autre pour avoir : 


(go f)(a+h) = g(f(a) + dfa(h) + a(h)) (11.688a) 
= g(f(a)) + dgp(a) (dfa(h) + a(h)) + B(dfa(h) + a(h)). (11.688b) 


102. Je ne suis pas totalement certain que cette hypothèse soit nécessaire, mais en tout cas, elle est utilisée. 
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Vu que dgÿ(4) est linéaire, le deuxième terme peut être coupé en deux et après recombinaisons, 
(go f}(a+h) — (go f)(a) — (dgpta) © dfa)(h) = dg(a(a(h)) + B(dfa(h) + a(h)). (11.689) 


Étant donné que dÿf(a) St linéaire, 


dgs@(ath)) |, (5) _, 11.690 
mo (mm) ne 

Il nous reste à voir que 
lim ACHOE: œ(h)) EQooUQNUoR EN JR 


existe au vaut zéro. Vu que df, est linéaire, il existe M > 0 tel que !® |df,(h)| < M|h|. D'autre 
part, vu que a(h)/|h] — 0, nous avons la(h)| < |h] pour tout À suffisamment petit. 
Donc si h est assez petit, nous avons 


Idfa(h) + a(h)| < (M + DIAI. FRooEQ Bot GE) 


Soit € > 0. Soit Ô > 0 tel que |h| < 6 implique B(h)}/|h| < € et (11.692) en même temps. Soit r tel 
que (M + 1)r < 0; et notons que r < ô. Nous considérons alors h € B(0,r) et nous calculons : 


B(dfa(h) + a(h)) _ B(dfa(h) + a(h)) |dfa(h) + a(h)| 


= < (M +1)e. (11.693) 
IA] Idfa(h) + a(h)| IA] 
La limite (11.691) existe donc et vaut zéro. 
11.13.8 Composition 
ThoAGXGuEt 


Théorème 11.242 (Différentielle de fonctions composées|[350]). 
Soient E, F et G des espaces vectoriels normés, U ouvert dans E et V ouvert dans F. Soient des 
applications de classe C" (r >1) 


fiU—V (11.694a) 
g: V —G. (11.694b) 


Nous supposons que dfx et dgy(x) sont de norme finie. 
Alors l'application go f: U — G est de classe C” et 


d(g° f)x = dgf(x) © dfx- FF Pe08) 


Démonstration. Nous nous fixons x € U. La fonction f est différentiable en x € U et g en f(x), 
donc nous pouvons écrire 


f(x+h) = f(x) + dfx(h) + a(h) (11.696) 
et 
g(f(x) +u) = g(f(x)) + dg(x(u) + B(u) (11.697) 
où la fonction « a la propriété que 
h 
lim cu = (; (11.698) 


et la même chose pour 5. La fonction composée en x + h s'écrit donc 


(go f)(x+h) = g(f(x) + dfx(h) + a(h)) = g(f(x)) + dgf(x)(dfa(h) + a(h)) + B(dfz(h) + (h)). 
9 g( ) = 9(F(x)) + dgg(z) ( ) +8 caf 


103. Ce M est par exemple la norme opérateur de df,, comme nous l’assure le lemme 11.59. C’est pour ce passage-ci 
que nous avons supposé que dfa était de norme finie. 
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Nous montrons que tous les « petits » termes de cette formule peuvent être groupés. D’abord si h 


est proche de 0, nous avons 104 


Idfz(R) + ah) 2 Id NIAN , Te) 
IA] VA (le 


(11.700) 


Si h est petit, le second terme est arbitrairement petit, donc en prenant n’importe que M > |df,| 
nous avons 


Idfx(h) + a(h)| 


< M. 11.701 
A] En 


Par ailleurs, nous avons 


18(df2() + a(h))| _ 18(df2(h) + a(R))| [df:(R) + a(h)| BC. (h) + ath))| 
IA \dfa(R) + a(h)| [A] ME ra (11.702) 
BFC) 


Vu que la fraction est du type ln) Avec limp_,0 f(h) = 0, la fraction tend vers zéro lorsque 
h — 0. En posant 


HR) = B(df;(h) + a(h)) (11.703) 


nous avons limp_,0%1(h)/|h| = 0. 
L'autre candidat à être un petit terme dans (11.699) est traité en utilisant le lemme 11.61 : 


Idases (a())| < Idarcolla (I. (11.704) 
Donc 
ldasey (a(n))] la(h)| 
——— —— < hdgrl ——., 11.705 
M] Id Ty Con 
ce qui nous permet de poser 
= CU) (11.706) 


avec 2 qui a la même propriété que 71. Avec tout cela, en posant y = 1 + Y2 nous récrivons 


(g° f)(x + h) = g(f(x)) + dgg(n (dfx(h)) + Y(h) (11.707) 


avec limh_,0 LE = (0. Tout cela pour dire que 


__ (go f)(x +h) — (go f)(x) — (dgs(x) © dfx)(h) 


= 0, (11.708) 
h0 IA] 


ce qui signifie que 
d(g9 f)x = dgf(x) ° dx. (11.709) 


Nous avons donc montré que si f et g sont différentiables, alors g o f est différentiable avec 
différentielle donnée par (11.695). 
Nous passons à la régularité. Nous supposons maintenant que f et g sont de classe C7 et nous 
considérons l’application 
g: L(F,G) x L(E,F) — L(E,G) 


(A,B)- AoB ne) 


Montrons que l’application 4 est continue en montrant qu’elle est bornée l®. Pour cela nous écri- 
vons la norme opérateur 


lWl= sup |p(4,B)]= sup |AoB|< sup |AÏIB|<1. (11.711) 
1(4,B)1=1 I(A,B)1=1 I(4,B)1=1 


104. Ici nous utilisons l’hypothèse de norme finie pour la différentielle. 
105. Proposition 11.62. 


11.13. CALCUL DIFFÉRENTIEL DANS UN ESPACE VECTORIEL NORMÉ 887 


Justifications : d’une part la norme opérateur est une norme algébrique !%, et d’autre part la 

définition 7.216 de la norme sur un espace produit pour la dernière majoration. L'application 

est donc continue et donc C® par le lemme 11.239. Nous considérons également l’application 
dv:U— L(F,G) x L(E,F) 


Vu que f et g sont C1, l’application 4 est continue. Ces deux applications 4 et 4 sont choisies 
pour avoir 


(11.712) 


(go p)(x) = p(dgs(x) fx) = d9f(x) © dfxs (11.713) 


c’est-à-dire @ o = d(go f). Les applications 4 et d étant continues, l'application d(g o f) est 
continue, ce qui prouve que go f est C1. 

Si f et g sont C” alors dg e C"— let dgo f € C"! où il ne faut pas se tromper : dg: F — L(F,G) 
et f: U — F'; la composée est dgo f: x dgf(x) € L(F,G). 

Pour la récurrence nous supposons que f, ge C"—! implique go f e C"—! pour un certain r > 2 
(parce que nous venons de prouver cela avec r = 1 et r = 2). Soient f,g € C” et montrons que 
go f EC". Par la proposition 11.240 nous avons 


vd = dgo f x fe C"-1, (11.714) 


et donc d(go f) = wo 4e C1, ce qui signifie que go f e C". 


PROPooRCZOooSgvpSE 
Proposition 11.243 (|[1]). 
Soit une application f : E — V de classe CP. Soit une application linéaire 6: V — W. Alors 6o f 
est de classe C?. 


Démonstration. Toute la preuve est un grand jeu de cohérence des espaces en présence, alors soyez 
attentifs et capable de dire précisément à quel espace appartient chacun de objets entrant en jeu. 
Nous posons VW = V et V,1:1 = L(E, Vz). Idem pour les espaces W,. Ensuite nous posons 

pi: L(E,V) — L(E,W) 


ar poa. 


(11.715) 


et 
pre LE, Via) + LE, Wa) 


Ar Pr-1° . 


(11.716) 


Notez la cohérence : si a € E, a(a) € V&-1 = L(E, V4-2), et donc 
(k-1 0 &)(a) = px-1(a(a)). (11.717) 


À droite nous avons gr-1(a(a)) E L(E, Wy-2) = Vy-_1. 

De plus, w est linéaire; ça se prouve par récurrence en partant de 4 et en se basant sur le fait 
que w est linéaire. 

C’est parti pour une récurrence. 


(1) Énoncé Nous allons prouver par récurrence que 
(vof) =vrod"f. (11.718) 
pour tout k < p. 
(2) Initialisation 
D'abord, f est de classe C?, donc différentiable et 4 est linéaire donc différentiable. Donc 


la composée est différentiable et le théorème 11.241 nous donne la différentiabilité de wo f 
ainsi que la formule 


d(p 9 fJa(u) = dpj(a(dfa(u)) = (29 dfa)(u) = pi(dfa)(u). (11.719) 


106. Lemme 11.61. 
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Donc d(oo fa = pi(dfa), ce qui signifie 


d(po f) = 10 df. (11.720) 


C’est bon pour k = 1. 


(3) La pas de récurrence 


Vu que f est de classe C?, d* f est encore différentiable. Vu que w4 est encore linéaire, nous 
pouvons encore utiliser la règle de différentiation de fonctions composées sur l'application 
er © d f. Nous avons : 


dE (po fja(u) = d(d'(p 0 f)),(u) = d(pr o d'fa(u). (11.721) 
C’est le moment d'utiliser la formule de différentiation en chaine : 
dE (po fja(u) = (dora, © d+ fa) (u). (11.722) 
Mais 4 étant linéaire, (dx), = wx, donc 
d'r(po fjatu) = (pr 0 d°T" fa)(u). (11.723) 
Donc, en oubliant l’application au vecteur u, 
dE (0 fa = prod fa = phe1(d fa) = (per 0 dé F)(a). (11.724) 
Nous avons donc bien 
d(gof) = pero dfttf. (11.725) 
PROPooGJGVooWnbeAe 


Proposition 11.244 (|1|). 
Soient des espaces vectoriels E, V et W de dimension finie, et une fonction f: E — V de classe 
CP. Si: V — W est linéaire, alors 

pof:E-W (11.726) 


est de classe CP. 


Démonstration. En utilisant le théorème de différentiation de fonctions composées 11.241, 


d(po fJa(u) = dpp(a)dfa(u), (11797) 
et donc, parce que w est linéaire, 
d(p fa = #0 dfa- (11.728) 
Nous pouvons exprimer cela de façon un peu différente en posant w1: L(E,V) — L(E,W), 
gi(a)(a) = (po a)(a). (11.729) 
Cela nous permet d'écrire 4 o dfy = (w1 © df)(a) et donc 
d(go f) = vo df Fe CPU) 


où w1 est encore une application linéaire. Une récurrence semble possible. Nous posons W = V et 
Wo = W puis 
V&s1 = L(E, Ve) (11.731a) 
Wz1 = L(E,W%) (11.731b) 


et 
vk: L(E, Vg-1) — L(E,Wx-:) 


9 Pr-10°39. 


(11.732) 


Avec tout cela, nous prétendons que d*(w 0 f) = x o d*f avec wy linéaire. 
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(1) w4 est linéaire Soient a1,a2 € L(E, Vy_1), ainsi que À, € K. Nous avons, en utilisant la 


linéarité de @x-1 : 


pr(Aa + pos)(a) = pr-1((An1 + Las)(a)) (11.733a) 
= x-1(Xai(a)) + uypr-1(a(a)) (11.733b) 
= }pr(ai)a + uypr(a2)a. (11.733c) 


Donc w4 est linéaire pour tout k. 
(2) La relation La relation 
dé(eo f) = vr 0 d'f (11.734) 


se démontre par récurrence, chaque pas étant justifié de la même manière que (11.730). 


PROPooLRRMooRzrTNE 
Proposition 11.245 (Composition). 
Soient trois espaces vectoriels normés E,V,W de dimension finie. Si les applications f: E — V 
et g: V — W sont de classe CP, alors la composée go f: E — W est de classe CP. 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


11.13.9 Inverse 


Lemme 11.246. 
Si f:U — V est un difféomorphisme 0 alors pour tout a e U, l'application df, est inversible et 


LemooTJSZooWkuSzv 


(dfa) = (df )s{ay: (11.735) 

Démonstration. Il suffit d’apercevoir qu’en vertu de la règle de différentiation en chaine (11.695), 
(dfa)(df 7) fra) = dE 9 F7) ta) = 1 (11.736) 

PROPooNONAooCyAtce 


Proposition 11.247. 
Soient des ouverts À de RP et B de R". Si il existe un difféomorphisme f: À — B, alors p = m. 


Démonstration. Vu que f est un difféomorphisme, le lemme 11.246 fait son travail : l'application 
linéaire dfa : IR? — IR’? est inversible d’inverse df (a): IR? — IR?. 

Or une application linéaire ne peut pas être bijective entre espaces de dimensions différentes 
(finies). Donc p = m. 


11.13.10 Différentiation de produit 


Si nous avons deux application f: E — V et g: E — W, alors nous voudrions considérer la 

fonction 

f@gE—-V@W 
ar f(a) @ g(a). 

Le problème avec cette notation est que très souvent, les applications f et g sont des éléments 
d'espaces vectoriels. Si par exemple f € L(E,V) et g € L(E,W), nous avons f @ ge L(E,V)©@ 
£(E,W). Dans le Frido nous ne nous permettons pas de dire calmement que L(E,V)@£L(E,W) = 
L(E,V @ W\). Et je ne vous dit même pas à quel point il n’est pas évident, si f € CT(E,V) et 
ge C(E,W) que nous aurions f@ge CT(E,V)®@CT(E,W) = CT(E,V@W). 

Tout cela pour dire que nous n’allons pas nous lancer dans des abus de notations. Non. Au 
lieu de cela, nous introduisons une notation. Pour rappel, dans tout le Frido, Fun(A, B) désigne 
l’ensemble de toutes les application de À vers B sans suppositions de régularité. Pour les puristes, 
nous précisions que si f € Fun(A, B), nous supposons que f est définie sur tout A. hum ...sauf 
mention du contraire. 


(11.737) 


107. Définition 11.231 


890 CHAPITRE 11. ESPACES VECTORIELS NORMÉS 


DEFooMVNDooFWFtRn 
Définition 11.248. 
Si f € Fun(E,V) et ge Fun(E,W\), alors nous définissons 
Et (11.738) 
ar f(a) @ g(a). 
PROPooCRVXo0EGxdZ1 


Proposition 11.249. 
Soient des applications continues f: E — V et g: E — W entre espaces vectoriels de dimension 
finies. Alors la fonction f@g: E — V@W est continue. 


Démonstration. Soient a € ÆE ainsi qu’une suite xx — a dans Æ. Nous voulons prouver que 
a v@wW 
f@g(xx) de f(a) @ g(a). Nous avons : 


| (ax) Sex) — f(a)Sg(a)| < | f (ax) Sy (ar) — (ax) Sg(a)| + | (a) sta) - TÉL TE0) 
Ensuite en utilisant la classe d'équivalence (11.429b). 
(x) @ g(xx) — f(xx) © g(a) = f(xx) ® (g(xx) — g(a)), (11.740) 
et en ce qui concerne les normes, 
| f(x) © g(x) — ax) @ g(a)| = 11 (gtæx) — gta). (11.741) 


Mais par hypothèse, f(x) — f(a) et g(xx) — g(a). Donc le tout tend vers zéro lorsque k — 00. 
Le même raisonnement fonctionne avec le second terme de (11.739). 


Lorsque nous parlons de différentielle de produit de fonctions, nous voulons étudier la différen- 
tiabilité de f@g sous l'hypothèse de différentiabilité de f et g. Et aussi, si f et g sont de classe CP, 
est-ce que f@g est également de classe CP ? 

Nous voudrions avoir une formule du type 


d(f@g) = df@g + f@dg, (11.742) 


mais ça ne colle pas au niveau des espaces. En effet, en évaluant cela en a € E, nous avons à 
gauche d(f@g)a € L(E,V @ W), tandis qu’à droite nous avons df, @ g(a) € L(E,V)@W et 
f(a) ® dga € V@L(E,W). 

Nous pourrions bien entendu dire que V @£L(E,W) est isomorphe à £L(E, V @W) et hop voilà, 
on n’en parle plus. Ce serait passer sur deux points importants. D'abord est-ce que V @£L(E,W) 
est vraiment isomorphe à L(E, V @W)? Et ensuite, l’isomorphisme implique une utilisation du 
théorème 11.241 qui est tout sauf une trivialité. 

Bref, fidèle au principe fridesque de ne pas cacher des difficultés techniques sous des abus de 
notations, nous allons écrire les choses explicitement. 


Lemme 11.250. 
Si E, V et W sont de dimension finie, les applications 
dv: L(E,V)j@W — L(E, V@W) 


EQooVWXRo fs 4 
f@wr (ur f(u)®u) di 15) 


et 
p: V@L(E,W) — L(E,V@W) 


vOg— (ar v@® g(a)). 


sont des isomorphismes d’espaces vectoriels. 


(11.744) 


Dans le meilleur des mondes, ces applications devraient être affublés d'indices V et W. 
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Démonstration. Nous donnons des détails à propos de #. Pour 4 c’est la même chose. 

(1) Linéaire La formule (11.743) définit # en particulier sur une base de L(E,V) @W par 
la proposition 11.166(1). Ce que signifie réellement la formule (11.743) est que 4 est ainsi 
définie sur la base et est prolongée par continuité. 

(2) Injective Si pour un f et un w fixé nous avons Y(f @ w) = 0, alors il y a deux cas : soit 
w = 0 soit w Æ 0. Dans le premier cas, f @ w = 0, et dans le second cas, nous remarquons 


que 

0 = Y(f@ w)(a) = f(a)@w (11.745) 
pour tout a € E. Cela implique f(a) = 0 pour tout a et donc f = 0, ce qui signifie que 
f@w=tQ. 


(3) Bijective En utilisant la proposition 11.166 et le lemme 4.41(2), nous avons égalité des 
dimensions entre L(E,V)®@OW et L(E,V @W). 
Une application linéaire injective entre deux espaces vectoriels de même dimension (finie) est 
une bijection. 


PROPooZOAFooRMeBglT 
Proposition 11.251. 
Soient des espaces vectoriels normés de dimension finie. Soient f: E — V etg: E — W des 
fonctions de classe C*. Alors f@g: E — V@W est de classe C} nous avons les formules 


d(fg)a(u) = dfa(u) ® g(a) + f(a) ® dga(u) AOOPIPG REA) 


ainsi que 


d(f&g) = vo (df@g) + v 0 (F@dg). FRE a) 


Démonstration. Nous commençons par prouver que f@g est différentiable en injectant le candidat 
(11.746) dans la définition. Au numérateur nous avons : 


(F&g)(a + h) — (F8g)(a) — dfa(h) @ g(a) — f(a) ® dga(h). PP PILTAS) 


Le lemme 11.236 assure qu’il existe une fonction a: E — V telle que limy_,0a(h)/|h] = 0 et 
f(a+h) = f(a) + dfath) + a(h). Même chose pour g. Nous avons donc 


(f@g)(a + h) = f(a + h) ® g(a + h) = (f(a) + dfa(h) + a(h)) @ (g(a) + dga(h) + B(h)) (11.749) 


qui se développe en 9 termes. En effectuant les différences dans (11.748), nous nous retrouvons 
avec un numérateur qui vaut 


Fa) @B(h) + dfa(h) @ dga(h) + dfa(h) @B(h) +a(k)@g(a) +a(k)@dga(h) +a(h)@F(h). (11.750) 


Nous pouvons prouver terme à terme qu’en divisant par |h| nous avons une limite qui vaut zéro. 
Par exemple, 


jrs 00 70) (11.751) 
h—0 Al 
se calcule en prenant la norme du numérateur et en utilisant le lemme 11.220 : 
HOÉLOIR ICI LOIR _—. 
[Lol| IA] 
Tous les termes contenant a(h) ou B(h) se traitent de la même manière. Le dernier terme à traiter 
est 
lim De(n) ® dan th) (11.753) 
h0 IA] 


En prenant la norme du numérateur, en utilisant encore le lemme 11.220 et en utilisant le lemme 
11.59, nous avons 


Idfa(h) @ dga(h)| = Idfa(h)|dga(k)| < IdfalldgallA1?, (11.754) 
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donc 


= 0. (11.755) 


Notons que l’utilisation du lemme 11.59 requière que df, soit continue, ce qui n’est pas évident 
en dimension infinie : une application linéaire n’est pas spécialement continue. C’est donc ici que 
nous utilisons le fait que Æ, V et W sont de dimension finie À, 

Ceci prouve que f@g est différentiable et nous donne la formule (11.746) pour appliquer sa 
différentielle à un élément de Æ. La formule (11.747) est un corolaire : elle se vérifie en l’appliquant 
à a puis à u. 

Pour terminer nous devons prouver que d(f@g) est continue. Vu que f et g sont de classe C'!, 
les applications f, g, df et dg sont continues. Les applications # et 4 sont également continues 
parce que linéaires sur des espaces de dimension finie. La proposition 11.249 appliquée à df et g 
montre que df@g est continue. La composition avec 4 qui est linéaire conserve la continuité. 

Donc le membre de droite de (11.747) est continu et f@g a une différentielle continue. Elle est 
donc de classe C1. 


Il est temps de démontrer le truc difficile, à savoir que si f et g sont de classe C?, alors f@g 


est également de classe C?. 
PROPooAWZFooM1hoCN 


Proposition 11.252. 
Nous appelons P, la propriété suivante : 


Pour tout espaces vectoriels normés E, V, W de dimension finies et pour toutes appli- 


cations f: E — V et g: E — W de classe C, la fonction f@g est de classe C*. 
ITEMooDQRYo0AEdxrW 


(1) La propriété P, est vraie pour tout k. ITEMoOUUTFOoGDyTMM 


(2) Si f: E— V etg: E — W sont de classe CP, alors f@g: E — V @W est de classe CP. 


Démonstration. Il est compliqué de prouver le point (2) directement par récurrence pour des f, g, 
E, V et W fixés. La raison de cette difficulté est que les espaces en jeu dans les différentielles de 
f et g aux différents ordres sont tous différents. [l faut donc, pour chaque ordre de différentielle, 
repartir sur de tout nouveaux espaces vectoriels. C’est pour cela que nous incluons « pour tout 
espaces vectoriels » dans la propriété de récurrence. 

Bref, une fois que (1) sera démontrée, le point (2) sera immédiat. 


(1) Pour k=0 Pour k = 0. Nous supposons que f et g sont de classe C", c’est-à-dire continues. 
La proposition 11.249 montre alors que f@g est continue, c’est-à-dire de classe C?. 


(2) Pour k=1 Bien que ce ne soit pas tout à fait nécessaire, nous prouvons que P\ est égale- 
ment vraie avant de passer à la récurrence. Si f et g sont de classe C!, alors la proposition 
11.251 s'applique : f@g est de classe C1. 


(3) Pour k+1 Nous faisons la récurrence en supposant que P, est vraie, et en prouvant que 
Py1 est vraie. Nous considérons des applications f: E — V et g: E — W de classe C*TT. 
La proposition 11.251 dit que f@g est de classe CT et que 


d(f@g) = + o (df@g) + vo (f@dg). (11.756) 


À droite, df et g sont de classe C* parce que f et g sont de classe C**!. Donc df@g est de 
classe C* par l'hypothèse de récurrence appliquée aux espaces L(E, V) et W. La proposition 
11.243 nous assure alors que 4 o (df@g) est de classe CF également. 

Nous avons prouvé que d(f@g) est de classe C*, donc f@g est de classe C*+1, Cela nous fait 
la récurrence. 


108. Il y a surement moyen de paufiner, et d'affaiblir cette hypothèse, mais je ne me lance pas là-dedans. 


11.13. CALCUL DIFFÉRENTIEL DANS UN ESPACE VECTORIEL NORMÉ 893 


11.13.11 Formule des accroissements finis 


PropDQLhSoy 
Proposition 11.253. 
Soient a < b dans R et deux fonctions 
f:lab] -— E (11.757a) 
g:[a,bl—R (11.757b) 


continues sur [a,b] et dérivables sur ]a, b[. Si pour tout t € |a, b[ nous avons | f'(t)| < g'(t) alors 
1F(b) — f(a)l < g(b) — g(a). (11.758) 
Démonstration. Soit e > 0 et la fonction 


pe: [a,b] —R 


be | FE — F(a)| — (0 — dt. Co 


Cela est une fonction continue réelle à variable réelle. En particulier pour tout u € ]a, b] la fonction 
we est continue sur le compact [u, b] et donc y atteint son minimum en un certain point ce [u,b]: 
c’est le bon vieux théorème de Weierstrass 7.138. Nous commençons par montrer que pour tout u, 
ledit minimum ne peut être que b. Pour cela nous allons montrer que si t € [u, b[, alors w.(s) < w(t) 
pour un certain s > {. Par continuité si s est proche de t{ nous avons 


fe) 70 | POI < go += 10790 Le (11.760) 
Ces inégalités proviennent de la limite 
… f(s)=fO _ , 
Big = f'(6), (11.761) 
donc si s et { sont proches, 
OR = re) (11.762) 


est petit. Si s > { nous pouvons oublier des valeurs absolues et transformer l'inégalité en 
I f(s) — FE) < gs) — gt) + e(s — +). (11.763) 


Utilisant cela et l'inégalité triangulaire, 


pe(s) < | f(s) — f(t)1 + 1 f(E) — f(a)| — g(s) — es (11.764a) 
< g(s) — gt) +es — et + || f(t) — f(a)] — g(s) — es (11.764b) 
= A: (11.764c) 


Donc nous avons bien we(s) < et) avec l'inégalité stricte. Par conséquent pour tout uw € |a,bl| 
nous avons @e(b) < we(u) et en prenant la limite u — a nous avons 


pe(b) < ge(a). (11.765) 
Cette inégalité donne immédiatement 
1f(b) — f(a)| < 9g(b) — g(a) + e(b — a) (11.766) 


pour tout € > 0 et donc 
1f(b) — f(a)| < g(b) — g(a). (11.767) 
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ThoNAKKght 
Théorème 11.254 (Théorème des accroissements finis). 
Soient E et F des espaces vectoriels normés, U ouvert dans E et une application différentiable 
f:U — F. Pour tout segment [a,b] € U nous avons 


1 FC) — f(a)| < | 2) 1b— al. (11.768) 


Démonstration. Nous prenons les applications 


k: [O, 1] — E 
(11.769) 
tr f((1-—t)a + tb) 
et 
g: [0,1] —R 
tt sup [dfelllé- al. (11.770) 
xe[a.b] 


Pour tout t nous avons g/(t) = Mb — al où il n’est besoin de dire ce qu'est M. D'un autre côté 
nous avons aussi 


Ge 


d 


_ | f(G — t)a + tb + e(b — a))| 


_ df(1-tja+t0(b — à) 


(11.771) 
e=0 


où nous avons utilisé l'hypothèse de différentiabilité de f sur [a,b] et donc en (1 — t)a + tb. Nous 
avons donc 


1k CO) < 1b — alldf1-nareel < Mb — al = g() (11.772) 


La proposition 11.253 est donc utilisable et 


Ik(1) — k(0)| < g(1) — g(0), (11.773) 
c’est-à-dire 
FC) — fa) < Mb — al (11.774) 
comme il se doit. 
ProFSjmBAt 


Proposition 11.255. 

Soient E et F des espaces vectoriels normés, U ouvert dans E et une application f: U — F. 
Soient a,b E U tels que [a,b] € U. Nous posons u = (b — a)/|b — a] et nous supposons que pour 
tout x € [a,b], la dérivée directionnelle 


Of d 
(a) = à LC " m)| (11.775) 
existe. Nous supposons de plus que (x) est continue en x = a. Alors 
CA 
If) — f(a)l < { sup 1) | 16 — al. (11.776) 
zef[a,b] OU 


Démonstration. Nous posons évidemment 


À») (11.777) 
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et nous considérons les fonctions 
k(t) = f((1—t)a + tb) (11.778) 


et 
g(t) = tM|b— al. (11.779) 


Pour alléger les notations nous posons x = (1—t)a+tb et nous calculons avec un petit changement 
de variables dans la limite : 


WE) = SC +b—a))] _ = 15 al [FC : rer LL - a]. =1e- al (æ) (11.780) 
dore dbbauace 
LAOIESAUX (11.781) 
ce donne 
Ik(1) — k(0)] = g(1) — g(0), (11.782) 
et dre 
FC) — f(a)| < _ CE (ay — à]. (11.783) 


ThoOUYwdeVt 
Théorème 11.256. 
Soient E,V deux espaces vectoriels normés, une application f: E — V, un point a € E tel que 
pour tout u € FE, la dérivée 


[rte + t)] (11.784) 


existe pour tout x € B(a,r) et est continue (par rapport à x) en x = a. Nous supposons de plus 
que 


CL (a) _0 (11.785) 


pour tout u € E. Alors f est différentiable en a et 
dfa = 0 (11.786) 


Démonstration. Soit € > 0. Pourvu que |h| soit assez petit pour que a + h € B(a,r), la proposi- 
tion 11.255 nous donne 


Ô 
a+n-f@l< sup |A (11.787) 
xe[a,a+h] Ou 


où u = h/|h|. Par continuité de ©, f(x) en x = a et par le fait que cela vaut 0 en x = a, il existe 
un 0 > 0 tel que si |A] < 6 alors 


of 
— h)|l < e. 11. 
|SL(a + nl << (11.788) 
Pour de tels À nous avons 
If(a + h) — f(a)] < eh], (11.789) 


ce qui prouve que l'application linéaire T(u) = 0 convient parfaitement pour faire fonctionner la 
définition 11.226. 
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11.13.12 Applications multilinéaires 


Nous avons déjà parlé d'applications multilinéaires dans la définition 9.1. 
LemFRaNDCd 


Lemme 11.257 (Leibnitz pour les formes bilinéaires[350]). 
Si B: E x F — G est bilinéaire et continue, elle est C®© et 


dB(yy(u, v) = B(x,v) + B(u,y). EE 


Démonstration. D'abord le membre de droite de (11.790) est une application linéaire et continue, 
donc c’est un bon candidat à être différentielle. Nous allons prouver que ça l’est, ce qui prouvera la 
différentiabilité de B. Avec ce candidat, le numérateur de la définition (11.226) s'écrit dans notre 
cas 


B((x,ÿ) + (u,v)) — B(e,y) — B(x,0) — B(u,y) = B(u,v). (11.791) 
Il reste à voir que 
B 
in. 2006 (11.792) 
Gu)(0,0) |(u, v)| 
Par l’équation (11.210) nous avons 
B(u,v)| _ IBllullvl 
ECDIS = |Bllol (11.703) 
ICu,v)] lul 


parce que |(u,v)| > |ul. À partir de là il est maintenant clair que 
IB(u,v)| | 


= ( 11.794 
(uw)—(0,0) |(u,v)| | 


ce qu'il fallait. 


Proposition 11.258 (Règle de Leibnitz[350]). 
Soient FE, F1, F2 des espaces vectoriels normés, U ouvert dans E et des applications de classe C” 
ræ=l) 


fU—-F (11.795a) 
(11.795c) 


et BE L(F; x F2,G). Alors l’application 
QU—-G 


ze B(fi(x), fa(x)) ET 


est de classe C” et 


dpa(u) = p((df)a(u), fa(x)) + e (f(x), (dfa)a(u)). FRE 70 7) 


Démonstration. Par hypothèse B est continue (c’est la définition de l’espace L), et donc C© par 
le lemme 11.257. Par ailleurs la fonction f1 x f2 est de classe C” parce que fi et f2 le sont et parce 
que la proposition 11.240 le dit. L'application composée B o (f1 x f2) est donc également de classe 
C" par le théorème 11.242. 

Il ne nous reste donc qu’à prouver la formule 11.797. En utilisant la différentielle du produit 


cartésien [0° nous avons 
f(Bo (fi x f2)),(h) = dB(pixfoy(x) ((df1)a(h), (df2)(h)). (11.798) 
Nous développons cela en utilisant le lemme 11.257 : 
d(B o (fi x f2)),(h) = dE; (A0) ((df1)2(R), (df2)a(R)) (11.799a) 


= B(f1(x), (df2)x(h)) + B((dfi)x(h), fa(æ)), (11.799b) 


comme souhaité. 
109. Proposition 11.240. 
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11.13.13 Différentielle partielle 
VJM_CESKT 


Définition 11.259 (Différentielle partielle). 
Soient E, F' et G des espaces vectoriels normés et une fonction f: E x EF — G. Nous définissons 
sa différentielle partielle sur l’espace E par 


di f(x0,yo0) : EC 
(11.800) 


he . 


La différentielle d2 se définit de la même façon. 
PropLDN_nHWDF 


Proposition 11.260 ([350]). 
Soient F1, E2 et F des espaces vectoriels normés, soit un ouvert U € E1 x E2 et une fonction 


Le ItemRDD_oPmXVi 
(1) Si f est différentiable alors les différentielles partielles existent et 

di f(&0,v0}(U) = df(æo vo) (U> 0) (11.801a) 

d2 f(xovo) () = df(o yo) (0 V) (11.801b) 


où ue F1 etve FE. 
(2) Si f est différentiable alors 


df(æo yo) (4 0) = di f(xo,yo}(U) + d2f (oo) (L)- (11.802) 
Démonstration. Nous posons a = (x0, yo) € U et 


j®: E; > E; X Es 


(11.803) 
ze (x, yo). 
C’est une fonction de classe C© et 
d d 
DO ao(u) = LH (ro +#)] = © le) 11.804 
GP)tu) = 2] Go +tu)] = ](eo + tu v0)] = (u,0) (11.804) 
D'autre part 
d 
te a | “, 
(di fau) = HE F(ro + tuvo)] (11.805a) 
d 
_ (D) 
[Go 3€ )(&o + t)] (11.805b) 
= (d(f oj0)).(u). (11.805c) 
À ce moment nous utilisons la règle des différentielles composées 11.242 pour dire que 
(di fja(u) = df;ue, ° (if )ao(u) = dfa(u, 0). (11.806) 
Voilà qui prouve déjà le point (1). 
Pour la suite nous considérons les fonctions 
P ; — À, J = ,0 ; 
1, ÿ) = J(u) = (1,0)  . 
P2(x, y) — Y;, Je(v) . (O,v) 
et nous avons l'égalité évidente 
JoP+oP=1 (11.808) 


sur E1 x E2. En appliquant df, à cette dernière égalité, en appliquant à (u,v) et en utilisant la 
linéarité de df, nous trouvons 


dfa(u, v) = dfa((J1 o Pi)(u,v)) + dfa((J2 o Pr)(u,v)) (11.809a) 
= dfa(u, 0) + dfa(0, v) (11.809b) 
= (di fja(u) + (d2f)a(v) (11.809c) 


où nous avons utilisé le point (1) pour la dernière égalité. 
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11.13.14 L’inverse, sa différentielle 


Si E est un espace de Banach, nous sommes intéressés à l’espace GL(E) des endomorphismes 
inversibles de Æ sur Æ. Cet ensemble est métrique par la formule usuelle 
IT] = ce IT(x)|5. (11.810) 
|| = 
PropQA;jqUNp 
Proposition 11.261 (Thème 40). 
Soit E un espace de Banach (espace vectoriel normé complet). Si À est un endomorphisme de E 
satisfaisant | A| < 1 pour la norme opérateur, alors (1 — À) est inversible et son inverse est donné 
par 


(1— 4)! = > FA (11.811) 


Démonstration. Étant donné que la norme opérateur est une norme algébrique (lemme 11.61), 
nous avons |A*| < | A|F. Par conséquent la série | AF| est majorée par la série géométrique qui 
converge 10, Par conséquent D AF est une série absolument convergente et donc convergente par 
la proposition 11.85 et le fait que £(E) est complet (proposition 11.88). 

Montrons à présent que la somme est l’inverse de 1 — À en utilisant le produit terme à terme 
autorisé par la proposition 11.94 : 


D AF(I—A4)= D (A — AT) 2 nant, (11.812) 
k=0 k=0 
Par conséquent 
I D, A*(1— A4) = 14777] < JA/"T = 0. (11.813) 
k=0 
ThoCINVBTJ 


Théorème 11.262 (Inverse dans GL(E)[351, 350]). 
Soient E et F' des espaces vectoriels normés. 
(1) L'ensemble GL(E) est ouvert dans End(E). 
(2) L'application inverse 
j: GL(E, F) — GL(F.E) 


k (11.814) 


U Uu. 


est de classe C© et 
diyo(h) = -uÿ'ohoug! (11.815) 


pour tout h € End(E) 


Démonstration. Nous supposons que GL(E, F') n’est pas vide, sinon ce n’est pas du jeu. 


(1) Cas de dimension finie 
Si la dimension de Æ et Fest finie, elles doivent être égales, sinon il n’y a pas de fonctions 
inversibles E — F. L'ensemble GL(E, F) est donc naturellement GL(n,R). Un élément de 
Min, R) est dans GL(n, R) si et seulement si son déterminant est non nul. Le déterminant 
étant une fonction continue (polynomiale) en les entrées de la matrice, l’ensemble GL(n, R) 
est ouvert dans Mn, R). 
Même idée pour la régularité de la fonction 4: GL(n, R) — GL(n,R), X + X°-!. Les entrées 
de Xl sont les cofacteurs de X divisé par det(X), et donc des polynômes en les entrées de 
X divisés par un polynôme qui ne s’annule pas sur GL(n,R), et donc sur un ouvert autour 
de X et de X-!. Bref, tout est C?. 


Le reste de la preuve parle de la dimension infinie. 


110. Proposition 11.122. 
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(2) Ouvert autour de l’identité 


(3 


) 


— 


Nous commençons par prouver que B(1,1) € GL(ÆE). Pour cela il suffit de remarquer que si 
Iu| < 1 alors le lemme 11.261 nous donne un inverse de (1+u) en la personne de XF ,(—u)". 


Ouvert en général 


Soit maintenant uo € GL(E). Si |u| < ET alors |uy ul < 1, ce qui signifie que 


1+uç'u (11.816) 
est inversible. Mais üo + u = uo(1 + uÿ lu), donc up + u € GL(E) ce qui signifie que 
1 
B C in) c GL(E). (11.817) 
uo 
Différentielle en l’identité 
Nous commençons par prouver que dix(u) = —u. Pour cela nous posons 
Le) 
ah) = D (—-1fR* (11.818) 
k=2 
et nous calculons 
dixQu) = Li + t)] = fi tu + (tu) (11.819) 
Qu) = 1 0] = u+a(tu)| à 
Il suffit de prouver que %la(tu)| — 0 pour conclure que dij(u) = —u. Pour cela, nous 
+= 


remarquons que @(0) = 0 et donc que 


d … a(tu) — «(0 
lat] = 1m ( - Q) (11.820a) 
Col 0 
— ji SK! o) (11.820b) 
F0 t 
O0 
= -—limu CT EN (11.820c) 


La norme de ce qui est dans la limite est majorée par 


1 
al À el = bol (1) (11.821) 


et cela tend vers zéro lorsque { — 0. Nous avons utilisé la somme 11.317 de la série géomé- 
trique. Nous avons bien prouvé que dix(u) = —u. 


Différentielle en général Soit maintenant wo € GL(E) et h € End(Æ) tel que uo + h € 
GL(E) ; par le premier point, il suffit de prendre |h| suffisamment petit. Vu que uo + h = 
uo(1 + uÿ th) nous avons 


(uo+h) = (1+uth) lus! (11.822) 
Nous pouvons donc calculer 
(uo + h) 1 = (1 — us h+a(us 1h))uÿ Lust usthus! + a(us thhu!, (11.823) 
et ensuite 
d'f. df 1, —1 _1p\, —1 
diuo(h) = æ |ituo + th), = LS —tug hug +altus h)u lé (11.824) 
mais nous avons déjà vu que 
d 
—la(th = 11.82 
galet], 0 FEee) 
donc 
diuo(h) = —ug *hug* (11.826) 


Cela donne la différentielle de l’application inverse. 
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(6) Continuité de l’inverse 
L'application à est continue parce que différentiable. 
(7) L’inverse est CT 


Nous allons écrire la fonction inverse comme une composée. Soient les applications 


B: L(F,E) x L(F,E) - L(L(E,F),L(F,E)) 


11.827 
Ba, V2)(4) = —4i o À 0 oi 
et 
AFF E)- L(FE)xL(F E 
pr (9,9) 
Nous avons alors 
di=BoAoi. (11.829) 


L'application À est de classe C'?. Nous devons voir que B l’est aussi. Pour le voir nous 
commençons par prouver qu’elle est bornée : 


IBl= sup  |B(41,#)|. 
PANNES L(LEPLL(RE) 
= sup sup [Y10 Aolr(re) 
II 1=1 14121 (11.830) 
< sup sup |ÿ1||A||v| 
lé I21=1 1411 
<1. 


Donc B est bien bornée et par conséquent continue. Une application bilinéaire continue est 
C® par le lemme 11.257. La décomposition di = B o À oi nous donne donc que ? e C'©° dès 
que À est continue, ce que nous avions déjà montré. 


11.14 Exponentielle de matrice 


PropPEBS8o8Bn5xfM 
Proposition 11.263. 
Soit V un espace vectoriel de dimension finie et A € End(V). La série 
A4? AS er A 
exp(4) = 1+ A++ oz nu (11.831) 


converge normalement "1! dans (End(V),|.lop). L'exponentielle de la matrice A est cette ma- 
trice. 


Démonstration. Vu que la norme opérateur est une norme d’algèbre par le lemme 11.61, nous 
avons pour tout k la majoration | 4F| < | A]F. Nous avons donc 


. 14" D La a 


La dernière somme converge en vertu de la convergence de la série exponentielle donnée en le 
lemme 11.124. 


Étant donné que c’est une limite, il y a une question de convergence et donc de topologie. C’est 
pour cela que nous ne pouvions pas introduire l’exponentielle de matrice avant d’avoir introduit la 
norme des matrices. La convergence de la série pour toute matrice sera prouvée au passage dans 
la proposition 11.264. 

La fonction exponentielle x + e* n'est pas un polynôme en x, mais nous avons le résultat 
marrant suivant. 


111. Convergence normale, définition 11.82. 


11.15. ESPACE DUAL 901 


PropFMqsIE 
Proposition 11.264. 
Si u est un endomorphisme, alors exp(u) est un polynôme en u !?. 
Démonstration. Nous considérons l'application 
: K[X] — End(E 


PH P(u) 


Étant donné que l’image de w, est un fermé dans End(E), il suffit de montrer que la série 
00 k 
X 
» ar (11.834) 
k=0 . 


converge dans End(Æ) pour qu’elle converge dans Image(w,). Pour ce faire nous nous rappelons 


de la norme opérateur !1 et de la propriété fondamentale | A| < |A|F. En notant À = w,(X), 
[EMI] IAÏ* 
<ÿ 2. <ÿ nt (11.835) 
k=n k=n =n 


ce qui est une morceau du développement de elAl. La limite n — 00 est donc zéro par la convergence 
de l’exponentielle réelle. La suite des sommes partielles de e4 est donc de Cauchy. La série converge 
donc parce que nous sommes dans un espace vectoriel réel de dimension finie (End(Æ)). 


11.265. 
Pourquoi exp(u) est-il un polynôme d’endomorphisme alors que exp n’est pas un polynôme ? 
Lorsque nous disons que la fonction x > exp(x) n’est pas un polynôme, nous sommes en train de 
localiser la fonction exp à l’intérieur de l’espace de toutes les fonctions IR — KR, c’est-à-dire à l’inté- 
rieur d’un espace de dimension infinie. Au contraire lorsqu'on parle de exp(u) et qu’on le compare 
aux endomorphismes P(u), nous sommes en train de repérer exp(u) à l’intérieur de l’espace des 
matrices qui est de dimension finie. Il n’est donc pas étonnant que l’on parvienne moins à faire la 
distinction. 

Si par contre nous considérons exp en tant qu’application exp: End(ÆE) — End(E), ce n’est 
pas un polynôme. 

Si u et v sont des endomorphismes, nous aurons des polynômes P et Q tels que e" = P(u) 
et e° = Q{v); mais nous n’aurons en général évidemment pas P = Q. En cela, exp n’est pas un 
polynôme. 


11.15 Espace dual 

SECooKOJNooQVawFY 
Définition 11.266. 
Soit un espace vectoriel normé (V,|.|) sur le corps C ou R (que nous nommons K). Son dual 
topologique, noté V' est l’ensemble des applications linéaires continues V — K 


11.15.1 Topologies 


Il est possible de mettre sur V’ (au moins) deux topologies distinctes. La première est la 
topologie de la norme opérateur; rien de nouveau pour elle. La seconde est la topologie +-faible 
dont nous avons déjà un peu parlé dans la définition 7.343. 

En termes de notations, nous allons noter les seminormes de la topologie faible par 


Pa() = |p(x)| (11.836) 


pour æ € V et w € V'. À droite, les barres dénotent soit la valeur absolue (si K = R), soit le 
module (si K = C). 


112. Nan, mais j'te jure : exp n’est pas un polynôme, mais exp(u) est un polynôme de u. 
113. Définition 11.51. 
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LEMooFMAUooQBIleTh 
Lemme 11.267. 
Soit we V'etxe V. Alors 
Pa(e) < [x||pl: (11.837) 
Si vo eV’, sir >0 et sixe V nous avons aussi : 
B(0;,r) eu B;(%0; Ixfr). (11.838) 


Démonstration. En posant x’ = x/|x|, le vecteur x’ est de norme 1 et nous avons 


Page) = le(x)l = elle(æ) < rllelt. (11.839) 


En ce qui concerne la seconde affirmation, si 6 € B(w0,r) alors en notant à = x/|x| nous 
avons : 


Pr(po — 4) = [po(x) — v(x)| = [vo — v)(x)l < Ixflso — pl < rlæl. (11.840) 
Donc ve Bx(go,r|x|). 
PROPooMINIooGCWsPR 
Proposition 11.268. 
Si une suite(vx) dans V’ vérifie 
pr LL o (11.841) 
alors elle vérifie aussi 
en (11.842) 


Démonstration. Soit une suite (x) dans V”, convergente vers 4 pour la topologie de la norme. 
Soit x e V, et x’ = x/|x|. Nous avons 


Peer — p) = |rllgk(x") — o(x)| < xx — el — 0. (11.843) 


LEMooEAVEooAFveHn 
Lemme 11.269. 
La translation dans V' est une opération continue pour la topologie de la norme opérateur et pour 
celle de la topologie *. 


Démonstration. Soit une suite wx tendant vers 0 ; nous devons prouver que 7(9x) — T(0) = ©. 
Et ce, pour chacune des deux topologies. 


(1) Norme opérateur 


L'hypothèse ox H, ç signifie que |y£| — 0, c’est-à-dire que 


sup [gx(v)| — 0. (11.844) 
Iv|=1 
Nous avons alors 
ITo(px) — o| = Iro(px)v — a(v)| = Res lpx(v)| — 0. (11.845) 
v|=1 vi=1 


Donc d'accord pour (4) — ©. 
(2) Topologie + 
Nous supposons maintenant que 4 +; 0. Pour tout v € V nous avons 
Pu(ro(vr) — 9) = Ira(pr)u — o(v)| = lpr(v)l = pur). (11.846) 


Mais par hypothèse, p,(wx) — 0. 


11.15. ESPACE DUAL 903 


Pour la suite, nous allons préfixer par N les concepts liés à la topologie de V” associée à la 


norme opérateur et par +, les concepts de la topologie *. 
PROPooFGXAooFRWweD 


Proposition 11.270. 
Soit un espace vectoriel normé V. Un +-ouvert est toujours un N-ouvert. 


Démonstration. Soit un +-ouvert © de V”. Il existe donc x € V et r > 0 tels que B,(y,r) € ©. 
Nous avons alors, en utilisant le lemme 11.267, 


B(p,rx|) € B:(w,r) € O. (11.847) 


Donc © est un N-ouvert. 


Corolaire 11.271. 
Soit un espace topologique X. Si f: (V',*x) — X est continue, alors f: (V’,|.]) — X est continue. 


Démonstration. Soit un ouvert © de X. Vu que f est +-continue, la partie f (©) est un +-ouvert 
de V”. Il est onc un N-ouvert de V’ par la proposition 11.270. 


11.15.2 Module de continuité 
DEFooYARJooYyzMMP 


Définition 11.272. 
Soient deux espaces topologiques normés X et Y, ainsi qu’une application f: X — Y. Le module 
de continuité de f est la fonction 


wp: R° — R'U {w} 


ht sup dy (f(x), f(y)). (11.848) 
T,yEX 


Écrite de façon plus compacte, 


wy(h)= sup |f(x)- f(u)|. ES dr) 


lr—yl<h 


Nous définissons aussi wÿ(h) = 0 pour h < 0 parce que le lemme 11.27} fera grand cas de la 
continuité en zéro du module de continuité. 


Notons que le module de continuité est une fonction croissante. 
LemLUbgYeo 


Lemme 11.273. 
Soit f € C9([0,1], ©) et w son module de continuité. Si À et h sont strictement positifs avec 
Xh € [0,1] alors 

W(AR) < (À + 1)w(h). (11.850) 


Démonstration. La fonction w est croissante, et pour h,k > 0 nous avons w(h + k) < w(h) +w(k). 
Par récurrence pour tout k e IN nous avons 


w(kh) < kw(h). (11.851) 
En écrivant cela pour k = [À], nous avons 


w(Xh) < w(kR) < kw(h) < (À + Lw(h). (11.852) 
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LemeERapq 
Lemme 11.274. 


Une fonction f: X — Y est uniformément continue ! si et seulement si son module de continuité 
vérifie 
lim w(k) ={); (11.853) 


Autrement dit, si et seulement si sont module de continuité est continu en zéro. 5. 
Démonstration. Nous commençons par supposer que f est uniformément continue. Soit € > 0. Par 
uniforme continuité, il existe ô > 0 tel que d(f(x), f(y)) < € dès que d(x,y) < 6. Si he B(0,6), 
alors 


wf(h) < wy(ô) = Ru d(f(x), f(y)) < €. (11.854) 


d(x,y)<ô 

Cela prouve que limp_,owy(h) = 0. 
Dans l’autre sens, si € > 0 est fixé, il suffit de prendre Ô tel que w(h) < € pour tout h < à pour 
faire fonctionner la définition de l’uniforme continuité. 


LEMooKPPSooPIncvn 
Lemme 11.275 ([352]). 
Soient des espaces métriques E et E" et une suite de fonctions (fi);>0 qui converge uniformément 
vers f. Alors pour chaque 8 > 0 nous avons 


lim supwy,(0) < wy(Ô). (11.855) 


i—00 


Démonstration. Soient 6 > 0 ainsi que x,y € E tels que d(x, y) < ô. Pour chaque à nous avons 


LC) — fu) < fie) — FC) + fe) — F1 + (y) — (y) (11.856a) 
< | f(x) — f(y)| + 21f — flo (11.856b) 
< wÿ(8) + 2] fi — fÎloo: (11.856c) 


Nous prenons le supremum de cela sur {x,y€ E tel que |x — y] < 6} pour obtenir : 
wf,() < wÿ(8) + 2]| fi — FIloo. (11.857) 


La tentation est grande à ce point de prendre la limite des deux côtés pour à — 0. Cependant, rien 
ne nous permet de dire que la suite à > wy,(0) ait une limite. Nous pouvons cependant prendre la 
limite supérieure !16 et obtenir 

lim supwr,(0) < wy(Ô). (11.858) 


i—00 


11.16 Mini introduction aux nombres p-adiques 


11.16.1 La flèche d’Achille 


s:un 
C’est un grand classique que je donne ici juste comme introduction pour montrer que des séries 
infinies peuvent donner des nombres finis de manière tout à fait intuitive. 
Achille tire une flèche vers un arbre situé à 10m de lui. Disons que la flèche avance à une 
vitesse constante de 1 m/s. Il est clair que la flèche mettra 10s pour toucher l'arbre. En 55, elle 
aura parcouru la moitié de son chemin. On le note : 


temps = 5s +... 


114. Définition 7.308. 
115. Dans ce lemme, nous avons deux espaces métriques, mais nous allons noter d la distance des deux côtés. 
116. Définition 10.42. 
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Reste 5 m à faire. En 2.55, elle aura fait la moitié de ce chemin, soit 2.5m = Dm. On le note : 
| 10 n 10 n 
EMPS = —5$ + —5s 
RS 7 
10 10 


Reste 2.5m à faire. La moitié de ce trajet, soit &m, est parcouru en +s; on le note encore, mais 
c’est la dernière fois ! 


10 
D r L SF —S+ 


En continuant ainsi à regarder la flèche qui parcourt des demi-trajets puis des moitiés de demi- 
trajets et encore des moitiés de moitiés de demi-trajets, et en sachant que le temps total est 105, 
on trouve : 


10 A = 10 
RUE AD) CS RE 


On doit donc croire que la somme jusqu’à l'infini des inverses des puissances de deux vaut 1 : 


Cela peut être démontré à la loyale. 


11.16.2 La tortue et Achille 


Maintenant qu’on est convaincu que des sommes infinies peuvent représenter des nombres tout 
à fait normaux, passons à un truc plus marrant. 

Achille, qui marche peinard à 10 m/h, part avec 1m d’avance sur une tortue qui avance à 1 m/h. 
Le temps que la tortue arrive au point de départ d'Achille, Achille aura parcouru 10m, et le temps 
que la tortue mettra pour arriver à ce point, eh bien, Achille ne sera déjà plus là : il sera à 100m. 
Si la tortue tient bon pendant un temps infini, et si l’on est confiant en le genre de raisonnements 
faits à la section 11.16.1, elle rattrapera Achille dans 


1m + 10m + 100m + 1000m +... 


Autant dire que ça ne risque pas d'arriver. Et pourtant, mettons en équations : 


æAchie(t) = 1 + 104 (11.859a) 
Ttortuelt) = t. (11.859b) 
La tortue rejoint Achille au temps t tel que TAchite(t) = Ttortue(t). Un mini calcul donne t = —1/9. 


Physiquement, c’est une situation logique. Peut-on en déduire une égalité mathématique du style 
de 


1 
A 


Là où les choses deviennent jolies, c’est quand on cherche à voir ce que peut bien être la valeur 
d’un hypothétique x = 1 + 10 + 100 + 1000 +... En effet, logiquement on devrait avoir 


D LL 1410+100+ 
10 10 . 
ne 


Reste à résoudre l’équation du premier degré : # = x + +. Ai-je besoin de donner la solution ? 


ZÆ 
10 
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11.16.3 Dans les nombres p-adiques, c’est vrai 


Nous nous proposons d'apprendre sur les nombres p-adiques juste ce qu’il faut pour montrer 
que l'égalité 


C 1 
Yi (11.860) 
k=0 

est vraie dans les nombres 5-adiques. Tout ce qu’il faut est sur wikipedia. 


Soit a € NN et p, un nombre premier. La valuation p-adique de a est l’exposant de p dans la 
décomposition de a en nombres premiers. On la note v,(a). Pour un rationnel on définit 


a 


UD (5) = v,(a) — v,(b) (11.861) 


La valeur absolue p-adique de r € À est 
pet, (11.862) 
Nous posons |0|, = 0. De là nous considérons la distance 


dy, 9) = |e — vip. (11.863) 
LEMooQNHZooX1HdUc 

Lemme 11.276. 
L'espace (Q, d,) est un espace métrique !T. 


Nous considérons maintenant p = 5. Étant donné que a = 5 : 2 nous avons v5(10) = 1 et 


“ (à) no) = 0, (11.864) 


Nous avons 


N N+1 
1 10 
D 10 + — (11.865) 
k=0 
mais 
10 N+1 
Up G = 05107) — v5(9) = N +1. (11.866) 
Par conséquent 
N 1 10N+1 
ds( 310,2) =] bep ee (11.867) 
9 9 
k=0 
En passant à la limite, 
N 
1 
li 10$, —-) — 1 
ne 2 0,2) =0, (11.868) 
ce qui signifie que |? 
= 1 
Side = (11.869) 
k=0 


117. Définition 7.107 
118. Voir la définition 11.78 de la convergence d’une série dans un espace métrique. 


Chapitre 12 


Analyse réelle : limites et dérivation 


12.1 Limite de fonctions 


12.1.1 Définition 


La définition générale de la limite est 7.102. Dans le cas de fonctions R — KR, elle peut s’écrire 
de façon plus efficace. La proposition suivante montre comment fonctionne la limite pour une 


fonction définie sur tout R. 
PropAJQQooQQClfp 


Proposition 12.1 (Caractérisation de la limite). 
Soit une fonction f : IR — R définie sur R et a € R. La fonction f admet la limite £ pour x — a 
si et seulement si il existe un réel £ tel que pour tout € > 0, il existe un Ô > 0 tel que 
EqDefLimiteF ti 
O<r—a| <= |f(x) —4 <e. MT 0 Mai) 
Démonstration. 1 s’agit de montrer l’équivalence avec la définition 7.102. Nous allons faire un 
usage intensif de la proposition 7.110. 


(1) Sens direct Soient € > 0 et V = B(L,e). Alors il existe un voisinage W de a dans R tel 


que 
F(W\{a}) eV. (12.2) 

Soit Ô tel que B(a,ô) € W. Nous avons encore 
f(B(a,5)\{a}) € V. (12.3) 


Soit maintenant x € R tel que 0 < [x — a| < 6. Cela signifie x € B(a,6)\{a}. Pour un tel x 
nous avons donc f(x) € B(L,e), c'est-à-dire | f(x) — #| < €. 


(2) Dans l’autre sens Soient un voisinage V de Let e > 0 tel que B(L,e) € V. Nous considé- 
rons Ô tel que | f(x) — {| < e pour tout x satisfaisant 0 < |x — a| < 6. 
Avec tout cela nous posons W = B(x,6), et nous avons 


F(W\{a}) € B(Le) € V. (12.4) 


Si aucun nombre £ ne vérifie la condition de la définition, alors on dit que la fonction n’admet 
pas de limite en a. Lorsque f possède la limite £ en a, nous notons 


ln Fr) = 6 (12.5) 


La proposition suivante a déjà été démontrée dans la proposition 7.105. Nous en donnons ici 
une démonstration adaptée au cas R — R. 


Proposition 12.2. 
Soit une fonction f: D — KR. Si a est un point d’accumulation de D et si il existe une limite de f 
en a, alors il en existe une seule. 
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Démonstration. Nous prouvons qu’il ne peut pas exister deux nombres { Æ L' vérifiant tous les 
deux la condition (12.1). 
Soient £ et {’ deux limites de f au point a. Par définition, pour tout e nous avons des nombres 
6 et 6’ tels que 
[x al <ô=|f(x) -4 <e EgsCont#2307Right 
Lx — al < 8 = f(x) -L}<e 


Pour fixer les idées, supposons que Ô < 4’ (le cas d > 0’ se traite de la même manière). 

Étant donné que a est un point d’accumulation du domaine D de f, il existe un x € D tel que 
lx — al < 6. Évidemment, nous avons aussi [x — a| < 6’. Les conditions (12.6) signifient alors que 
ce æ vérifie en même temps 


[f(æ) — #| < €, (12.7) 


et 
FC (12.8) 


Afin de prouver que £ = {', nous allons maintenant calculer |£ — {/| et montrer que cette distance 
est plus petite que tout nombre. Nous avons (voir remarque 12.3) 


le 61 = 1e f(x) + fe) — €] < 16 F(œ)] + 1f(e) — 2] < ESPN EEE 


En résumé, pour tout € > O0 nous avons 


|£ — #'| < 2e, (12.10) 
et donc |{ — L’| = 0, ce qui signifie que £ = W/. [1 
RemTechniquelneqs 


Remarque 12.3. 
Les inégalités (12.9) utilisent deux techniques très classiques en analyse qu’il convient d’avoir bien 
compris. La première est de faire 


A=8)21A4-60406- 8] (12.11) 


Il s’agit d'ajouter —C' + C dans la norme. Évidemment, cela ne change rien. 
La seconde technique est l’inégalité 


[À + B] < |A] +]B|. (12.12) 


Exemple 12.4. 

Considérons la fonction f(x) = 2x, et calculons la limite limz-,3 f(æ). Vu que f(3) = 6, nous nous 
attendons à avoir £ = 6. C’est ce que nous allons prouver maintenant. Pour chaque € > 0 nous 
devons trouver un 8 > 0 tel que [x — 3] < 8 implique | f(x) — 6| < €. En remplaçant f(x) par sa 
valeur en fonction de x et avec quelques manipulations nous trouvons : 


If(x) — 61 < € 
2x —6l<e 
[x — 3] < à 

2 


Donc dès que |r — 3] < 5, nous avons | f(x) — 6| < €. Nous posons donc Ô = 5. 
Plus généralement, nous avons lim,_,, f(x) = 2a, et cela se prouve en étudiant |f(x) — 2a| 


exactement de la même manière. AN 


12.1. LIMITE DE FONCTIONS 909 


12.1.2 Quelques règles de calcul 


Les opérations simples passent à la limite, sauf la division pour laquelle il faut faire attention 


au dénominateur. 
PropÜpsSimplesLimites 


Proposition 12.5. 
Soient deux fonctions f,g: R — R. Nous supposons que limz-sa f(x) = à et limz-»a g(x) = B. 
Alors ITEMooUJUWooQpqqnQ 
(1) La fonction f + g a une limite x — a qui vaut lims_,a(f + g)(æx) = à + B, 
(2) La fonction fg a une limite en a, qui vaut lim;_,,(fg)(x) = aB, 
(3) si il existe un voisinage de a sur lequel g ne s’annule pas, et si B Æ 0, alors la fonction f/g 
| : f(&) _ a 
a une limite en a qui vaut limy_, A — 5 
Démonstration. En plusieurs points. 


(1) La somme Soit € > 0. Soient 01 > 0 et 02 > 0 tels que 


0 <x— al < 6, = f(x) —-al<e (12.14a) 
0 < [x — a] < ÿ2 = |g(x) — 5] < €. (12.14b) 


En prenant 0 < min{01, 02}, si 0 < [x — a] < Ô alors 
LF(œ) + gx) — a — BI < [f(x) — al + |g(x) — 8] < 2e. (12.15) 


(2) Le produit Nous prenons €, 01 et 62 dans les mêmes conditions que pour la somme. Nous 
majorons comme ceci : 


[f(æ)g(x) — ab] < |f(x)g(x) — ag(x)| + lag(x) — al (12.16a) 
= |g(x)|lf(x) — al + lallg(x) — 8] (12.16b) 
< e(|g(x)| + |al) (12.16c) 
< e(|B|+e+lal) (12.16d) 


La dernière ligne majore |g(x)| < |B| + €. 


(3) Le quotient Soit € > 0. Nous considérons Ô > 0 tel que nous ayons simultanément | f(x) — 
al <e, |g(x) — 8] <e et g(x) Æ 0 pour tout x € B(a, 6). Nous avons alors le calcul 


f@) _a _ Jf@) a a _a 


lt) 8) à lo(æ) a) F pes gl (12.17a) 
— _ _1 1) SUBEQooOHFHooZr 
y lf@) al+lal î or 
Nous avons la majoration 
TE (12.18) 
Ig(x)l  18l—e 


et comme f£ # 0, nous pouvons supposer que € est assez petit pour que le dénominateur ne 
s’annule pas. En ce qui concerne le second terme de (12.17b), 


1 1 _B—g(x) 
g(x) BB g(x)B 


Ici aussi nous pouvons majorer 1/g(x). Le numérateur se majore par €. En remettant tout ça 
dans (12.17b), nous avons une majoration qui tend vers zéro lorsque € — 0. 


(12.19) 


Le résultat suivant est pratique pour le calcul des limites. 
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PropChmVarLim 
Proposition 12.6. 
Quand la limite existe, nous avons 


dim (a) = lim (a + 0), 
ce qui correspond à un « changement de variables » dans la limite. 
Démonstration. Si À = lim,;_,4 f(x), par définition, 
EqCondFapl j 
Ve’ > 0, 26 tel que [x — a| < Ô = [f(x) — A] < €. Le °sÉP50) 


La seule subtilité de la démonstration est de remarquer que si [x — a| < 6, alors x peut être écrit 
sous la forme x = a +e pour un certain [e| < 0. En remplaçant x par a + e dans la condition 12.20, 
nous trouvons 

Ve’ > 0, 2 tel que [el <ô = |f(a+e) — A|< 6, (12.21) 


ce qui signifie exactement que lime_,0 f(a + €) = À. 


Il y a une petite différence de point de vue entre limz-,a f(x) et lime_,0 f(a+e). Dans le premier 
cas, on considère f(x), et on regarde ce qu’il se passe quand x se rapproche de a, tandis que dans 
le second, on considère f(a), et on regarde ce qu’il se passe quand on s'éloigne un tout petit peu 
de a. Dans un cas, on s'approche très près de a, et dans l’autre on s’en éloigne un tout petit peu. 
Le contenu de la proposition 12.6 est de dire que ces deux points de vue sont équivalents. 


En plus d’être linéaire, la limite possède les deux propriétés suivantes. 
PROPooDQFIooMMwxxJ 


Proposition 12.7. 
Si f et g sont deux fonctions qui admettent une limite en a, alors 


lim (/g)(æ) = lim (x) + lim g(a). (12.22) 


Si de plus limz-_,a g(æ) # 0, alors 


| Î _ lim, f(x) 
lim (£ (x) Re (12.23) 
ThoLimLinMul 
Théorème 12.8. 
Si . 
lim f(x) = b, Éahypru in 
alors Eqbutmultli 
lim (Xf)(x) = XD Ur E TES 


pour n'importe quel À € R. 


Démonstration. Soit € > 0. Afin de prouver la propriété (12.25), il faut trouver un 6 tel que pour 
tout x dans [a — Ô,a + 6], on ait [(Af)(x) — Ab] < €. Cette dernière inégalité est équivalente à 
Alf (x) — b] < €. Nous devons donc trouver un Ô tel que 
€ 
hE< = 
soit vraie pour tout x dans [a — à, a + 6]. Mais l'hypothèse (12.24) dit précisément qu’il existe un 
ô tel que pour tout x dans [a — 6, a + 6] on ait cette inégalité. 


(12.26) 


ThoLimLin 
Théorème 12.9. 
Si 
lim ft) =h (12.27a) 
lim g(x) = ba, (12.27b) 
alors 


Jim (f + 9) (x) = bi + bo. (12.28) 
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Démonstration. Soit e > 0. Par hypothèse, il existe 01 tel que 


ROLE 


Fafbunepe sea 


dès que |x — a] < 01. Il existe aussi 02 tel que 


\g(æ) — bal < £. Fagbaeuxepasenr 


2 


dès que [x — a] < 02. Notons l’astuce de prendre e/2 dans la définition de limite pour f et g. 
Maintenant, ce qu’on voudrait c’est un 6 tel que l’on ait [(f+g)(x)—(b1+b2)| < € dès que |r—a| < Ô 
Constatons que d = min{01,02} fonctionne. En effet, en utilisant l'inégalité |a + b| < |a| + |b|, nous 
trouvons : 


LG + 9)(æ) — (1 + 62)| = |((æ) — d1) + (ge) — b2)| < [f(&) — da] + lot) — dl PP TEE) 


Comme on suppose que |x — a| < Ô, on a évidemment |x — a| < 61, et donc l'équation (12.29) tient. 
Mais si |x — a] < 0, on à aussi [x — a| < 02, et donc l’équation (12.30) tient également. Chacun des 
deux termes de (12.31) est donc plus petits que e/2, et donc, le tout, est plus petit que €, ce qu’il 
fallait montrer. 


PROPooVLBWooVttvFK 
Proposition 12.10. 
La limite est linéaire : pour toutes fonctions f et g admettant une limite en a et pour tout réels À 
et fL. 
Jim (à f + ug)(x) = À lim f(x) + y lim g(x). (12.32) 


Démonstration. Il s’agit seulement des deux propriétés des théorèmes 12.8 et 12.9. 
LEMooYJGLooVBag1B 


Lemme 12.11. 
Soient un espace vectoriel normé E ainsi qu’une fonction f: R — E telle que limy_,0 f(t) = vw. 


Alors pour tout À€ R nous avons 
lim Qt) = v. (12.33) 


Démonstration. Nous utilisons la caractérisation (12.1) de la limite. Soit € > 0. Soit Ô > 0 tel que 
|f(t) — v| < € pour tout [t| < 6. Nous considérons alors 0” = 6/|À|. 
Si |t| < 0’, alors | At] < 6 et nous avons bien | f(At) — v| < €. 


PROPooOUPNooTrC1Hw 
Proposition 12.12 ([323]). 
Soient des fonctions f,g: R — R telles que limz-,a f(x) = L et limz-,a g(x) = V0. Alors 


JG) _£ 
Démonstration. Nous avons : 
LORD 2102707 
— : 12.35 
| MOI se. 


Soit s, un minorant de |g(x)| sur un voisinage de a; puisque la limite en a est {’ Æ 0, nous 
pouvons prendre par exemple s = |{//|/2 : |g(x)| > [//|/2 sur B(a, 6) dès que 6 est assez petit. Nous 
considérons x € B(a,ô). Avec cela nous avons : 


f@) _£|_ léf() - ao | 

| FO a 
2 (IP (x) — g(a)e 

<a | me) ni 

“rer (x) — £81 + | — g(x)£|) (12.36c) 

(IEC) — 4 + AE — go). (12.364) 


_ me 
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Nous avons utilisé la règle du produit de valeurs absolues du lemme 1.371(7). 
Soient € > 0 et Ô tel que | f(x) — {| <e et |[g(x) — L'| < € pour tout x € B(a,ô). Avec cela nous 


avons 
| JG) © 
g( 


) 2 
Æ} # 


< €. 
[e2(IET + 14) 


(12.37) 


D'où la limite attendue. 


LemLimMajorableVois 
Lemme 12.13. 
Si limz-,a f(x) = b avec a, bER, alors il existe un Ô > 0 et un M > 0 tels que 


(x —al<ô) = [f(x)l < M. 


Ce que signifie ce lemme, c’est que quand la fonction f admet une limite finie en un point, 
alors il est possible de majorer la fonction sur un intervalle autour du point. 


Démonstration. Cela va être démontré par l’absurde. Supposons qu’il n’existe pas de 0 ni de M 
qui vérifient la condition. Dans ce cas, pour tout ô et pour tout M, il existe un x tel que [x — a| < Ô 
et |[f(x)| > M. Ceci est valable pour tout M, donc, prenons par exemple, b + 1000. Aïnsi 


VO > 0,2x tel que [x — a] < 8 et |f(x)| > b + 1000. (12.38) 


Cela signifie qu'aucun 6 ne peut convenir dans la définition de lims-,4 f(x) = b, ce qui contredit 
les hypothèses. 


Dans le même ordre d’idée, on peut prouver que si la limite de la fonction en un point est 
positive, alors elle est positive autour de ce point. Plus précisément, nous avons la proposition 


suivante. 
PropoLimPosFPos 


Proposition 12.14. 
Si f est une fonction telle que lims_,a f(x) > 0, alors il existe un voisinage de a sur lequel f est 
positive. 


Démonstration. Supposons que limz-4 f(æ) = yo. Par la définition de la limite, nous avons pour 
tout x dans un voisinage autour de a, |[f(x) — a| < €. Ceci est valable pour tout €, pourvu que le 


voisinage soit assez petit. Si nous choisissons un voisinage pour lequel | f(x) — a| < ®, alors, sur 
ce voisinage, f est positive. 
Tholimfgabab 
Théorème 12.15. 
Si 
lim f(x) = b el lim g(x) = be, (12.30) 
alors 
Bin (9)(a) = bb (12.40) 


Démonstration. Soit € > 0, et tentons de trouver un Ô tel que |f(x)g(x) — b1b2] < € dès que 
x — a] < 6. Nous avons 


|f(x)g(x) — bibol = | f(x)g(x) — b1b2 + f(x)b2 — f(x)bal 
= |f(x)(g(x) — b2) + bo( f(x) — b)| EqfgbunbdenxMi 
< |) (o(e) — b)| + fbe(/() 3) De 
= |f(æ)|\g(x) — bal + lb2l| f(x) — dif: 


Maintenant, nous savons par le lemme 12.13 que pour un certain 01, la quantité |f(x)| peut être 
majorée par un certain M dès que [x—a| < 81. Prenons donc un tel 01, et supposons que [x—a| < 61. 
Nous savons aussi que pour n'importe quel choix de €2 et 3, il existe des nombres 02 et 03 tels que 
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f(x) — b1l < e2 et |g(x) — b1] < €e3 dès que [x — a] < 02 et [x — a] < 03. Dans ces conditions, la 
dernière expression (12.41) se réduit à 


[f(x)g(x) — b1b2] < Me2 + |bales. (12.42) 


Pour terminer la preuve, il suffit de choisir e2 et e3 tels que Me2 + |b2le3 < €, et puis prendre 
ù = min{ô1, 02, 03}. 

Remettons les choses dans l’ordre. On se donne un €e au départ. La première chose est de trouver 
un 0 qui permette de majorer |f(x)| par M selon le lemme 12.13, et puis, choisissons 62 et e3 tels 
que Mes + |boles < €. Ensuite, nous prenons, en vertu des hypothèses de limites pour f et g, les 
nombres 02 et 03 tels que | f(x) — b1| < e2 et |[g(x) — bol < e3 dès que [x — a] < & et |x — a| < 63. 

Si avec tout ça on prend Ô = min{01,02,03}, alors la majoration et les deux inégalités sont 
valables en même temps, et au final 


[f(x)g(x) — bib2] < Mes + |brles < €, 


ce qu'il fallait prouver. 


À l’aide de ces petits résultats, nous pouvons déjà calculer pas mal de limites. Nous pouvons 
déjà par exemple, calculer les limites de tous les polynômes en tous les nombres réels. En effet, 
nous connaissons la limite de la fonction f(x) = x. La fonction x + x? n’est rien d’autre que le 
produit de f par elle-même. Donc 


lim x? = ( lim x) ‘ (lim x) = a?, 


T— a T—a T— a 
De la même façon, nous trouvons facilement que 
img". (12.43) 
Ta 
LEMooLSJZooDauTkc 
Lemme 12.16. 
Soitte IR. Nous avons : 
Jim = int(xt) =t (12.44) 


où int est la fonction partie entière définie en 1.459. 


Démonstration. En vertu du lemme 1.459, nous avons y = int(y) + frac(y) avec frac(y) € [0,1|. 
Nous avons donc 


1 1 
— int(xt) = (xt — frac(xt)) (12.45a) 
g d 
t t 
_ st | frac(xt) (12.45b) 
ü à 
f t 
nn) (12.45c) 
2 
Puisque frac(xt) € [0,1[, nous avons 
im ÉLt (12.46) 
T—00 T 
D'où la limite demandée. 
12.2 Limites pointées et épointées 
SECooNJSGooGSAtdV 


La limite d’une fonction en un point a déjà été définie en 7.102. Nous introduisons maintenant 
une notion très ressemblante. 
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DEFooBAPHooUtIaRsS 
Définition 12.17 (limite pointée[353]). 
Soient X et Y deux espaces topologiques, À une partie de X, f une application de À dans Y, a un 
point de X adhérent à À et L un point de Y. On dit que L est une limite pointée de f au point a 
si pour tout voisinage V de L, il existe un voisinage W de a tel que pour tout point x d WA A, 
l’image f(x) appartient à V. 


Quelques notations et vocabulaire. 


(1) Nous allons limiter notre discussion au cas des fonctions R — R. 


(2) La limite de la définition 7.102 sera provisoirement nommée limite épointée, pour ne pas 
causer de confusion. 


(3) Pour bien distinguer la limite pointée de la limite épointée, nous allons noter LP;_,,f(x) 
pour la limite pointée et LE,_,,f(x) pour la limite épointée. 
(4) Nous allons utiliser la caractérisation 10.80 de la continuité de f en un point. 
(5) Nous allons utiliser la caractérisation 12.1 de la limite épointée. 
LEMooWAZLooDPvemu 
Lemme 12.18. 
Si une fonction f: R — R vérifie LP; f(x) = L, alors elle vérifie LE;_,a4f (x) = £. 


Démonstration. Soit € > 0. L'existence de la limite pointée dit qu’il existe Ô > 0 tel que [x — a| < Ô 
implique | f(x) — {| < €. À fortiori, si 0 < [x — a| < Ô nous avons aussi | f(x) — {| < €. Donc la limite 
épointée, par la caractérisation 12.1. 


La réciproque n’est pas vraie, comme le montre le lemme suivant. 


LEMooUSNGooJpiXbK 
Lemme 12.19 ([354)). 
Soit la fonction 
J:R—-R 
0 sxzÆ£0 (12.47) 
Te 
1 six —0. 
Nous avons ITEMooNRNCooFhbZwB 
(1) LEx-of(x) = 0. ITEMooUSWMooMNPMCT 


(2) La limite pointée de f en 0 n'existe pas. 


Démonstration. En deux parties. 
(1) Pour (1) Pour tout x € B(0,6)\{0} nous avons f(x) = 0. Donc la limite épointée suit. 


(2) Pour (2) Soit ÿ > 0. Le lemme 1.424 nous assure qu'il existe x € ]—06,0[. Ce x est dans 
B(0,6) et vérifie f(x) = 0. Nous avons aussi + = 0 dans la même boule. Donc f(B(0,6)) 
contient au moins les nombres 1 et 0. 


Il n’existe donc pas de £ tel que tout f(B(0, ô)) soit dans B(L, €). 


LEMooTPNEooRurTJJ 
Lemme 12.20. 
Soit une fonction f: R\{a} — R. Alors la limite pointée de f en a existe si et seulement si la 
limite épointée existe. Dans ce cas, elles sont égales. 


Démonstration. En trois parties. Nous notons ( = R\{a} le domaine de f. 


(1) Si la limite pointée existe, alors l’épointée existe Soit € > 0. L'existence de la limite 
pointée dit qu’il existe 0 > O0 tel que J(B(a, ô)n Q) c B(L,e). Comme B(a,ô) n Q = 
B(a,ô)\{a}, nous avons la condition épointée. 


(2) Si la limite épointée existe, alors la pointée existe Du même tonneau. 
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(3) Égalité Le jeu des boules du premier point prouve l'égalité au passage. 


Que faut-il donc ajouter à la limite épointé pour obtenir une limite pointée ? Réponse dans le 
lemme suivant. 


Lemme 12.21. 
Soit une fonction f : IR — IR. Nous avons 


LPy-af(a) = L (12.48) 


si et seulement si les deux conditions suivantes sont réunies : 
Ü) EP Ta 


(2) Soit f n'existe pas en a, soit f est continue en a. 


Démonstration. En deux parties. 

(1) = L'existence d’une limite pointée implique celle de la limite épointée, et l'égalité entre 
les deux. Donc LEz-,af(x) = L. Supposons que f existe en a. Soit € > 0. L'existence d’une 
limite pointée signifie qu’il existe 8 > 0 tel que [x — a] < Ô implique | f(x) — {| <e. 

En particulier avec x = a nous avons |f(a) — | < € pour tout €. Donc f(a) = L. 

(2) = Nous supposons que LE,_,,f(x) = L. Si f n’existe pas en à, alors les limites pointée et 
épointée coïncident !. Si par contre f existe en a et f(a) = L, alors nous travaillons. 

Soit € > 0. Il existe Ô > 0 tel que x € B(a,ô)\{a} implique |f(x) — #| < e. Mais si x = a nous 


avons |f(x) — {| = 0 < €. Au final nous avons [f(x) — {| < € pour tout x € B(a,ô). Donc 
Ps) EE 


LEMooNEGUooC111IMN 
Lemme 12.22 (limite et continuité). 
Supposons que LEx_,Af(x) = L et que f est continue en a. Alors f(a) = L. 


Démonstration. Soit € > 0. L'hypothèse sur la limite dit qu’il existe 01 > 0 tel que 0 < [x — a] < 01 
implique | f(x) — £| <e. 

L'hypothèse de continuité, avec la caractérisation 10.80, dit qu’il existe 62 > 0 tel que |x—a| < 02 
implique | f(x) — f(a)| <e. 

Nous considérons un 0 > 0 plus petit que 01 et que 02. Soit aussi un x satisfaisant 0 < [x—a| < 6. 
Nous avons 


Lf(a) — € < [f(a) — f(x) + 1f(x) — 4 < 2e. (12.49) 


Puisque cela est valide pour tout x, nous déduisons que f(a) = £. 


12.2.1 Théorèmes de composition de limites 


La proposition suivante formalise le fait que la limite pointée soit stable par composition. 
THOooUYXDooKDPkuïf 


Théorème 12.28. 
Soient des fonctions g: R—R et f: (Q — R avec Q CR telles que 


(1) BP gi =4 
(2) LPy-f(y) = b. 
(3) gR) ca 
Alors 
LPea(f eg) =: (12.50) 


1. Lemme 12.20. 
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Démonstration. Soit € > 0. L'hypothèse de limite pour f donne 7 > 0 tel que 
EQooLWGIoo 
y 4 <n = |f(y) dl <e (SET 


Soit d > 0 tel que [x — a] < 6 implique |g(x) — £] < 7. 
Avec tout ça, si [x — a] < 0 nous avons |g(x) — {| < n et en appliquant l'implication (12.51) à 
y = g(x) nous trouvons |f(g(x)) — b| < €. 


Le théorème suivant, qui traite de la composition de limites pointées, montre que la limite 


épointée ne passe pas gratuitement à la composition. 
THOooNPBQooEMOYpd 


Théorème 12.24. 
Soient des fonctions g: R—R et f: 9 — MR avec Q CR telles que 


(1) LEz-ag(x) = À 

(2) LEy-ef(y) = b. 

(3) gR) ca 

(4) Soit L£ Q, soit f est continue en L. 
Alors 


ITEMooUNJAooCDOKcO 


LEy-sa(f © g)(x) = b. Foot ooeNE EE 


Démonstration. Nous notons ( le domaine de f. Ce sera R ou R\{/} selon le cas traité dans (4). 
Soit € > 0. L'hypothèse de limite épointée pour f nous dit qu'il existe 7 > 0 tel que 


yeNn B(4n)\{} (12.53) 


implique | f(y) — b| < €. 
L'hypothèse de limite épointée pour g, appliquée à ce 7 dit qu’il existe Ô > 0 tel que 0 < 
[x — a] < Ô implique [g(x) — #| < n. 


(1) Si f n’existe pas en {/ Supposons avoir 0 < |x — a] < n. Alors nous avons |g(x) — £| < ô. 
Notons qu’il est impossible d’avoir g(x) = { parce que nous avons supposé g(R) € { et que 
{ n’est pas dans (2. 


Nous avons quand même 0 < [g(x) — {| < 6. La condition de limite pour f appliquée à 
y = g(x) donne alors | f(g(x)) — b| < e, ce qui signifie la limite épointée (12.52). 


(2) Si f est continue en { Le lemme 12.22 dit qu’alors f(£) = b. L'hypothèse de limite époin- 
tée sur f dit que 


O<|y—4| <n —=]|f(y) —-bl<e. (12.54) 


Mais puisque f(£) = b, nous avons en réalité 
EQooHAHHooRi 
y-4<n+lf)-ù<e (285) 


Supposons donc que 0 < |x — a| < 6. Alors |g(x) — {| < n. En appliquant (12.55) à y = g(x) 
nous trouvons 


[F(y) — b] < €. (12.56) 


NORMooSLAJooLfDreV 
12.25. 
Les deux théorèmes sont incomplets. En effet, le théorème « pointé » 12.23 ne traite pas le cas où 
seules des limite épointées existent. Il est donc moins général que le théorème « épointé » 12.24. En 
contrepartie, le théorème « épointé » ne parvient pas à conclure à l’existence d’une limite pointée 
dans le cas où elle existe. Sa conclusion est donc moins forte. 
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Nous devons donc nous atteler à écrire un théorème qui traite tous les cas en obtenant la 
conclusion la plus forte possible dans chaque cas. Nous allons supposer que 

LBy-sa9(E) = (12.57a) 

LE,_f(y) = b. (12.57b) 


Ensuite, les différents cas seront divisés selon quatre critères : 
(1) g existe en a ou pas. 
(2) f existe en £ ou pas. 
(3) g est continue ou pas en a. 
(4) f est continue ou pas en 4. 


Cela fait 2 = 16 combinaisons. Heureusement certaines sont impossibles : si une fonction n’existe 
pas en un point, elle ne peut pas y être continue. 
Nous avons donc 9 cas résumés dans le théorème suivant. 


ga) [1l1/1[1/1/1/01/010 
f@ [11111l1l0l011|110 
12. 
geC 111010111000 10 (208) 
fe ]1101101010111010 
THOooHXGIooBclAHA 
Théorème 12.26 (|[1]). 
Soient des fonctions f et g telles que 
LPO) = (12.59a) 
LE,_f(y) = b. (12.59b) 
ITEMooDXBLooVfhSlig 


(1) Si f est continue en L et si g est continue en a, alors f o g est continue ÉESoIXBQooMDknwN 


(2) Nous supposons : 


(2a) g définie en a (2c) g continue en a 
(2b) f définie en L (2d) f non continue en L. 
Alors nous ne disons rien. ITEMooHTIEooMKDrqx 


(3) Nous supposons : 


(3a) g définie en a (3c) g non continue en a 

(3b) f définie en L (3d) f continue en L. 

Alors LEz-a(f o g)(x) = b. ITEMooVQMDooEtHfwC 
(4) Nous supposons : 

(a) g définie en a (4c) g non continue en a 

(4b) f définie en L (4d) f non continue en L. 

Alors nous ne disons rien. ITEMooANFQooWVrfTd 
(5) Nous supposons : 

(5a) g définie en a (5c) g continue en a 

(5b) f non définie en L (5d) f non continue en L. 

Alors LEs-a(f 9 g)(x) — b. ITEMooDJBHooS1qp00 


(6) Nous supposons : 
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(6a) g définie en a 
(6b) f non définie en L 


Alors LEx_,a(f o g)(x) = b. 


(7) Nous supposons : 


(Ta) g non définie en a 
(db) f définie en L 


Alors LEx-_,a(f © g)(x) = b. 


(8) Nous supposons : 


(8a) g non définie en a 
(8b) f définie en L 


Alors nous ne disons rien. 


(9) Nous supposons : 


(9a) g non définie en a 
(9b) f non définie en L 


Alors LEx_,a(f © g)(x) = b. 


Démonstration. Cas par cas. 


(1 
(2 
(3 
(4 
(5 
(6 
(7 
( 


8 


) 


) 
) 
) 
) 
) 
) 
) 


— 
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(6c) g non continue en a 


(6d) f non continue en L. 


ITEMooUFJHooRzLg1Z 


(Tc) g non continue en a 
(1d) f continue en L. 


ITEMooUAAVooS joYOv 


(8c) g non continue en a 


(8d) f non continue en L. 


ITEMooPVZKooBXJARI 


(9c) g non continue en a 


(9d) f non continue en L. 


Cas (1) C’est le théorème 10.85 de composition de la continuité. 


Cas (2) l’exemple du lemme 12.19. 
Cas (3) Théorème 12.24. 


Cas (4) Le contre-exemple dans ce cas est g = 1o et f = Lo. 


Cas (5) Théorème 12.24. 
Cas (6) Théorème 12.24. 
Cas (7) Théorème 12.24. 


Lo(x) 


Cas (8) Contre-exemple, un peu artificiel, avec g(x) = 7. C’est une fonction qui vaut 
0 partout sauf en 0 où elle n’existe pas. Ensuite pour f, nous prenons l’indicatrice de {0} : 


Ï = lo. Pour tout x Æ 0 nous avons 


(fo g)(x) = 


Donc LE;_,0(f o g)(x) = 1. 


Mais nous avons pourtant 


Cas (9) Théorème 12.24. 


lo (=) = 19(0) = 1. (12.60) 


(12.61a) 
(12.61b) 
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12.2.2 Discussion pointée Vs épointée 
Résumé : 
(1) Dans l’éducation nationale et dans les programmes en France, c’est la limite pointée qui est 
donnée. 


(2) Dans le Frido ce sera la limite épointée. Autrement dit, nous réserverons la notation lim et 
le mot « limite » pour la limite épointée. 


(3) De toutes façons, ça ne change pratiquement rien nulle part. Vous pourriez terminer l’agré- 
gation sans vous en rendre compte. Vous pouvez sauter toute la discussion et reprendre une 
vie normale. 


Le débat pour savoir quelle est la « meilleure » notion a déjà fait couler de nombreux octets[355, 
356, 354, 357, 358]. 
12.2.2.1 La limite pointée est plus simple au départ 


Il est vrai que la limite pointée est plus simple de premier abord. 


12.2.2.2 Le théorème de composition 

Le théorème de composition des limites pointées 12.23 est plus propre que le théorème de 
composition épointé 12.24. Intuitivement, on voudrait que la limite d’une fonction composée soit 
la composée des limites. Et ça c’est vrai pour la limite pointée, pas pour l’épointée. 


12.2.2.8 Limite d’une fonction discontinue mais qui existe 


Que pensez-vous que la limite en l’infini de la fonction suivante « devrait » être ? 


J: [0,0] —R 
‘Sp (12.62) 
Tr 
O0 six = 


Là, tant que x s'approche de sans l’atteindre, il n’y à vraiment que de la croissance à perte de 
vue ; jusqu’à l’horizon et au-delà. 

On pourrait faire la même remarque avec la fonction indicatrice de {0}. Qu'est-ce que la limite 
en zéro « devrait » être ? 


12.2.2.4 Point d’étape 
Aucune des deux limites ne donne le résultat « attendu » dans les deux cas. Toutes deux font 
une chose bien, et une chose pas bien. 
12.2.2.5 Limite d’une fonction discontinue mais qui existe 
Prenons la fonction indicatrice de {0} : 
J:R—-R 
1 siz=0 (12.63) 
TT 
O sinon. 


En utilisant la limite pointée, on peut exprimer deux choses : 
— la limite pointée en zéro n'existe pas 
— la fonction n’est pas continue en zéro. 

En utilisant la limite épointée, on peut exprimer deux choses : 


— la limite épointée en zéro existe et vaut zéro. 
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— la fonction n’est pas continue en zéro. 


La première paire d'informations est compatible avec la fonction 1/x. Autrement dit, la valeur 
« inattendue » que prend f en zéro casse tout ce qu’on aurait pu dire sur un voisinage de zéro. 

La seconde paire d'informations donne au moins une idée de ce qu’il se passe autour de zéro. 
On peut en déduire, par exemple, que f est intégrable sur un voisinage de zéro parce qu’elle y est 
bornée et que la valeur en un point ne fait rien à l’intégrabilité ?. 


12.2.2.6 L’enseignement du cas précédent 


La limite épointée donne une information sur ce qu’il se passe « autour » du point sans rien dire 
de ce qu’il se passe « sur » le point. Si nécessaire, la continuité complète l’information en précisant 
ce qu'il se passe « sur » le point. 

Certaines questions n’ont pas besoin de savoir ce qu’il se passe en un seul point. 

La limite épointée « refuse » de dire ce qu’il se passe autour du point parce qu’il y a un problème 
juste sur ledit point. Un seul point se comporte mal et tout le voisinage passe sous le radar. 


12.2.2.7 La limite épointée est plus riche 


La classe des fonction admettant une limite pointée est plus grande que celle admettant une 
limite épointée (lemme 12.18). L'utilisation de la limite épointée permet de décrire quelques cas 
supplémentaires par rapport à ce que l’on peut faire seulement avec la limite pointée. 

Pour être plus précis, comme je le disait précédemment, en 12.25, aucune des deux notions 
n’est satisfaisante seule : 


— mettez de la limite pointée dans les hypothèses, vous aurez un théorème moins général ; 
— mettez de la limite pointée dans la thèse, vous aurez un résultat plus fort. 


Le vrai intérêt de la limite épointée est que en combinaison avec la notion de continuité permet 
d’être plus général et plus précis que ce qu’on peut obtenir avec la limite pointée. Dit autrement, 
le couple (limite épointée, continuité) est plus fort que le couple (limite pointée, continuité). 

D'un certain point de vue, oui, la limite pointée est plus simple, mais elle est plus simple parce 
qu’elle donne moins d’informations. 


12.2.2.8 Retour sur le théorème de composition 


Le vrai théorème de composition est le théorème 12.26. Lui, il passe en revue tous les cas 
possibles et donne le plus de conclusions possibles dans chaque cas. 

Ce théorème s'exprime de façon à peu près convenable à l’aide de limite épointée et de conti- 
nuité. J'attends de voir le même avec une limite pointée et la continuité. 

Je suis très ouvert à la discussion si c’est pour avoir quelque chose de plus simple produisant 
les mêmes résultats. Je ne suis par contre pas très ouvert pour avoir quelque chose de plus simple, 
mais donnant moins de résultats. C’est toujours facile d’avoir des résultats plus courts, plus simples 
et plus intuitifs quand on se contente de moins. 


12.2.2.9 En français 

La limite épointée rend l’idée de « s'approcher sans atteindre ». En français l'expression « être 
à la limite de tel résultat » signifie le plus souvent être très proche du résultat, mais ne pas y être. 
12.2.2.10 La question est pédagogique 


Tant qu’on ne m’a pas montré comment on exprime le théorème de composition 12.26 avec des 
limites pointées, je resterai sur cette idée : la limite pointée est plus simple, mais elle dit moins. 


2. Peut-être qu'il faut ajouter que f est mesurable ? Mais peut-être que l'existence de la limite implique la mesurabilité ? 
Dites-moi ce que vous en pensez. 
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Cela n’est cependant pas spécialement bloquant. Après tout, ça dépend de ce qu’on veut. D’un 
point de vue pédagogique, la limite pointée introduit autant de € et de à qu’on le veut, et permet 
d'introduire tous les concepts utiles en analyse. 

La question est de savoir à quel point on est prêt à se compliquer la vie pour avoir des théorèmes 
un micro-cheveu plus complets. Le choix du Frido est de recevoir la difficulté avec résignation et 
de l’endurer avec courage, pour le plaisir d’avoir des théorèmes qui donnent un peu plus d’infor- 


mation ?. 


12.2.2.11 En fait ça ne change presque rien 


Certains craignent qu'utiliser la limite pointée demande d’ajuster beaucoup de résultats un 
peu partout[359]. Le Frido contient à ma connaissance seulement deux théorèmes dont l’énoncé 
contient une subtilité due au choix épointé. Le fameux théorème de composition 12.24, et le lemme 
12218; 

Le fait est que l’on ne calcule presque jamais de limites en une valeur où la fonction existe. Si 
on calcule une limite, c’est précisément parce qu’on regarde un point où la fonction n'existe pas. 

Exemples : 


— Quand on calcule une dérivée, on calcule 


im +9 = Sa) 


e—0 € 


(12.64) 


Cette fonction de € n’existe pas lorsque € = 0. Donc les limites pointées et épointées sont 
identiques. 


— De même, l'étude du sinus cardinal f(x) = sin(x)/x (lemme 20.207) est une fonction dont 
ça ne viendrait à l’idée de personne de calculer la limite pour x — 4. Et ça tombe bien : la 
seule limite que ça donne envie de calculer est 


ne) 


lim — (12.65) 


Et encore une fois, la fonction dans le limite n'existe pas au point limite. 


— Beaucoup de conditions d’intégrabilité demandent des limites à l'infini. Là encore, ce sont 
des limites vers des points où la fonction n'existe pas. Franchement, qui va vouloir définir 


h 2e (12.66) 
T 


sans rigoler ? OK. Pour cette fonction, il y a une différence entre la limite pointée et épointée. 
Mais franchement, c’est bien la limite épointée qui donne le résultat « intuitif ». 


12.2.2.12 Si vous avez quand même envie de discuter 


Essayez de garder votre salive pour des sujets importants. 


— L'intégrale de Kurzweil-Henstock{360] contre Lebesgue. Là au moins, il y a des choses non 
triviales à dire, et des vrais résultats mathématiques à la clef. 


— L'utilisation de 7 au lieu de 7. 


3. C’est une de mes citation préférées. Comme nous sommes entre adultes, je vous donne la référence : [359]. Si 
vous n’avez pas 18 ans, on peut vraiment se demander si le Frido est vraiment une lecture de votre âge. 
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12.2.2.13 En très résumé 


Si vous ne voulez pas lire toute ma prose, voici ce dont vous devez être conscient : 
(1) La limite épointée est celle utilisée partout sauf en France. 


(2) La limite épointée est un peu plus compliquée que la limite pointée, mais elle permet de 
prouver plus de choses. En témoigne le théorème « complet » de composition 12.26 que je 
doute être facile à exprimer à l’aide des limites pointées et de la continuité {. 


(3) La limite pointée « cache » l’information sur tout le voisinage de a si la fonction se comporte 
mal juste en a. 


Une fois que vous êtes conscients de ces quelque points, vous faites comme vous voulez; ça n’a 
pratiquement aucune importance. La seule position indéfendable est celle de prendre la limite 
pointée et de ne pas prévenir la lectrice que les sources autres que françaises donnent une définition 
différente. 


12.3 Limites en l’infini 


Non, sur R nous n’allons pas ajouter © avec la topologie d’Alexandrov de la définition 7.98. 
Nous n’allons pas considérer À = R U {0}. 
DEFooRUyiBSUooALDDOa 
Définition 12.27 (Droite réelle achevée[362]). 
Nous considérons l’ensemble 


R=RU {+00, -c} (12.67) 


où +00 et —0 ne sont pas des éléments de R. 
Nous mettons sur R la relation d'ordre en prenant celle de R à laquelle nous ajoutons les règles 


(1) —00 < x pour tout x E R LU {+0} 


(2) +00 > x pour tout x € R LU {—c}. 
Nous mettons une topologie sur R en donnant la base” suivante : 
— Ja,bl, 
— Ja, +oo], 
— [ol 


pour tous réels a et b. 


12.28. 
La notation «  » peut désigner l’unique élément ajouté dans du compactifié d’Alexandrov Ÿ aussi 
bien que l'élément infini positif dans la droite réelle achevée. Si vous faites attention au contexte”, 
ça ne devrait pas poser de problèmes. 

Certaines autrices réservent « © » pour Alexandrov et écrivent toujours « +00 » et « —00 » 
pour la droite réelle achevée. 


Lemme 12.29 (|1]). : 
La topologie sur R induite de celle sur R est la topologie usuelle. 


Démonstration. Nous notons rR la topologie de R, 7g celle de R et 7; celle induite de R sur R. 
Nous devons prouver que T; = TR. 


(1) mc TR Un élément de 7; est de la forme O = R n À où À est un élément de 7g. Vu que À 
est un ouvert de R, il est une réunion d'éléments de la base de topologie® ; donc 4 = | J,; À; 
où les À; sont des trois types listés dans la définition 12.27. 


. Il y a bien entendu moyen. Voir par exemple [361]. Sans ironie, je trouve ce théorème fascinant. 
. Base de topologie, définition 7.2. 

. Le compactifié d’Alexandrov R, définition 7.98. 

. Vous devez toujours avoir parfaitement clairement en tête la topologie que vous manipulez. 

. C’est la proposition 7.2 qui dit ça. 


D JO À 
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(la) Si A4 =| 
(1b) Si A =] 
(1c) Si À; = [—0,b[, même chose. 

Donc RnA=U);.,(Rn Ai) est une union d’ouverts de R. 


(2) mR<T% Comme les ]a,b] forment une base de topologie de R, l’ensemble 7; contient une 
base de topologie de R et donc contient tout TR. 


b[ alors R n A = ]a, b[ est un ouvert de R. 


@, 
a, +], alors R A À; = |a, +c| est un ouvert de R. 


Proposition 12.30 ([1]). 


Soit une suite (x,) dans R = IR LU {+}. Nous avons x4 Æ, +oo si et seulement si pour tout 
M > 0 il existe un N > 0 tel que n > N implique xx > M. 


Démonstration. En deux parties. 

(1) = Pour tout voisinage À de +00, il existe un N tel que n > N implique x, € A. Soit donc le 
voisinage |M, +], et le N correspondant. Nous avons alors, pour tout n > N,x, € ]M,+0| 
et donc 4» > M. 

(2) = Soit un ouvert A contenant +00. Nous avons À = (JA; où les À; sont des trois 
types listés dans la définition 12.27. Comme +00 € À, pour au moins un des ?, nous avons 
A; = Ja, +. 
Prenons N tel que n > N implique x, > a. Alors pour n > N nous avons x, € À. 


LEMooUBFAooEmquQQ 
Lemme 12.31 (|1]). 
Soient x > 1 dans R et n > 1 dans N. Alors x" > x. 


Démonstration. Pour n = 1, nous avons x" = x donc d’accord. Supposons que x° > x pour un 
certain n € N, et prouvons que LPFr ER 
Calcul avec justifications en-dessous : 


at 2 gr (12.68a) 
. SUBEQooBBJYo 12 68) 
> . RENE 


Justifications : 
— Pour (12.68b) hypothèse de récurrence. 
— Pour (12.68c), lemme 1.418. 


LEMooFCIXooJuHFqk 
Lemme 12.32. L 
Nous considérons l’espace topologique de la droite réelle achevée” R. Si n > 1 nous avons 
E RRFE Ÿ 
lim "= +00 AOORAFEOOEEnRS 
%— +00 
el 1 
lim —=0. (12.70) 


Démonstration. Si V est un voisinage de +0, alors nous devons montrer qu’il existe un voisinage 
W de + tel que x" € V pour tout x € W. 

Un ouvert est une union d’éléments de la base de topologie 1. Nous voyons que V contient au 
moins une partie de la forme |R, +]. Nous supposons que R > 1. 


9. Définition 12.27. 
10. C’est la définition 7.2. 


924 CHAPITRE 12. ANALYSE RÉELLE : LIMITES ET DÉRIVATION 


Six > R> 1, alors nous avons x" > x (lemme 12.31) et donc 
pd: (12.71) 


ce qui signifie x € V. 
En prenant W = ]R, +00], nous avons bien W” € V. Cela prouve (12.69). 
En ce qui concerne la seconde limite, la démonstration est du même type. Remarquez seulement 
que vous n’avez pas formellement le droit d’utiliser la proposition 12.12 en invoquant = (. 


12.3.1 Limite en des nombres 


Nous posons la définition suivante. 
DeflnfNombre 


Définition 12.33. 
Lorsque a € R, on dit que la fonction f tend vers l’infini quand x tend vers à si 


VM ER, 6 tel que (|x — al < 6) = f(x) > M quand x € dom f. 


Cela signifie que l’on demande que dès que x est assez proche de a (c’est-à-dire dès que |r—a| < 
6), alors f(x) est plus grand que M, et que l’on peut trouver un Ô qui fait ça pour n'importe quel 
M. Une autre façon de le dire est que pour toute hauteur M, on peut trouver un intervalle de 
largeur 6 autour de a!! tel que sur cet intervalle, la fonction f est toujours plus grande que M. 

Montrons sur un dessin pourquoi je disais que la fonction x — 1/x n’est pas de ce type. 

Le problème est qu’il n'existe par exemple aucun intervalle autour de 0 sur lequel f serait 
toujours plus grande que 10. En effet n'importe quel intervalle autour de 0 contient au moins un 
nombre négatif. Or quand x est négatif, f n’est certainement pas plus grande que 10. Nous y 
reviendrons. 

Pour l'instant, montrons que la fonction f(x) = 1/x? est une fonction qui vérifie la défini- 
tion 12.33. Avant de prendre n'importe quel M, prenons par exemple 100. Nous avons besoin 
d’un intervalle autour de zéro sur lequel f est toujours plus grande que 100. C’est vite vu que 
f(0.1) = f(—0.1) = 100, donc l'intervalle [-; D] convient. Partout dans cet intervalle, f est plus 
grande que 100. Partout ? Ben non : en x = 0, la fonction n’est même pas définie, donc c’est un 
peu dur de dire qu’elle est plus grande que 100. C’est pour cela que nous avons ajouté la condition 
« quand x € dom f » dans la définition de la limite. 

Prenons maintenant un M € R arbitraire, et trouvons un intervalle autour de 0 sur lequel f est 
toujours plus grande que M. La réponse est évidemment l'intervalle de largeur 1/VM, c'est-à-dire 


1 1 
Er 7) 
12.3.2 Limites quand tout va bien 


D'abord définissons ce qu’on entend par la limite d’une fonction en un point quand il n’y a 


aucun infini en jeu. 
DefLimPointSansInfini 


Définition 12.34. 
On dit que la fonction f tend vers b quand x tend vers a si 


Ve > 0,10 tel que (|x — al < 6) = | f(x) — b] < € quand x € dom f. 


Dans ce cas, nous notons 
lim f(x) = b. (12.72) 
T—a 
Commençons par un exemple très simple : prouvons que lim,_,0 x = 0. C’est donc a = b = 0 
dans la définition. Prenons € > 0, et trouvons un intervalle autour de zéro tel que partout dans 
l'intervalle, x < e. Bon ben c’est clair que Ô = € fonctionne. 
Plus compliqué maintenant, mais toujours sans surprises. 


11. C'est-à-dire un intervalle de la forme [a — 6, a + 6]. 
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Proposition 12.35. 
lim x? = 0. 
æ—0 


Démonstration. Soit € > 0. On veut un intervalle de largeur 6 autour de zéro tel que x? soit plus 
petit que € sur cet intervalle. Cette fois-ci, le Ô qui fonctionne est ô = 4/e. En effet un élément de 
l'intervalle [—6, 6] est un r de valeur absolue plus petite ou égale à 6 : 


lr| < ô = Ve. 


En prenant le carré de cette inégalité on a : 


ce qu’il fallait prouver. 


Calculer et prouver des valeurs de limites, mêmes très simples, devient vite de l’arrachage de 
cheveux à essayer de trouver le bon Ô en fonction de € si on n’a pas quelques théorèmes généraux. 


Heureusement nous en avons déjà quelques uns : 12.10, 12.7, 12.8, 12.9, 12.12. 
PROPooWXBAooAEwesF 


Proposition 12.36 ([1]). 
Soit f: R? — R une application continue dont la variable y varie dans un compact I de R. Alors 
la fonction 

d'R—R 


ze sup f(x, y) 
yel 


(12.73) 


est continue. 


Démonstration. Soit xo fixé. Prouvons que d est continue en x. Nous notons % la valeur de y qui 
réalise le maximum (par le théorème 10.54 et le fait que les fonctions projection soient continues, 
lemme 7.206). Soit aussi € > 0 tellement fixé que même avec un tournevis hydraulique, il ne 
bougerait pas. Nous considérons 6 tel que si |(x,y) — (xo, yo)| < Ô alors | f(x, y) — f(xo, yo)| < €. 

Si [x — x0] < Ô alors pour y assez proche de y nous avons |(x,y) — (xo,yo)| < 0, et donc 
f(x, y) — f(xo, yo)| < €. Cela montre qu’il existe 6 tel que x — 0] < Ô implique d(x) > d(xo) — €. 

Nous devons encore trouver un Ô tel que si [x — xo| < 6 alors d(x) < d(xo) + €. Supposons que 
non. Alors pour tout 6 il existe un x tel que [x — xo| < Ô et d(x) > d(xo) +. Cela nous donne une 
suite Ti — Lo. 

Pour chaque x; nous notons y; la valeur de y qui réalise le supremum correspondant. La suite 
(y:) étant contenue dans un compact nous supposons prendre une sous-suite de (x;) telle que la 
suite (y;) converge. Nous nommons a la limite (et non yo parce que nous ne savons pas si y; — Yo). 
Pour chaque À nous avons 


f(x, yi) > sup f(xo, y) + €. (12.74) 
yel 


En prenant la limite et en utilisant la continuité de f, 


f(xo,a) > nu J(xo,y) + e, (12.75) 
YE 


ce qui est impossible. 


12.3.3 Limites de fonctions 


Tentons de comprendre ce que signifie qu’un nombre £ ne soit pas la limite de f lorsque x — a. 
Il s’agit d’inverser la condition de la proposition 9.251(2). Le nombre { n’est pas une limite de f 
pour x — a lorsque 


E 
Je > 0 tel que Vô > 0, 3x tel que 0 < |x — a] < 6 et f(x) — {| > €, qceractiquen 


c’est-à-dire qu’il existe un certain seuil € tel qu’on a beau s'approcher aussi proche qu’on veut de 
a (distance 6), on trouvera toujours un x tel que f(x) n’est pas e-proche de £. 
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Lemme 12.37 (Unicité de la limite). 
Si Let L' sont deux limites de f(x) lorsque x tend vers a, alors £ = #!. 


Démonstration. Soit € > 0. Nous considérons 6 tel que | f(x)—£{| < € pour tout x tel que |x—a| < 6. 
De la même manière, nous prenons 6” tel que |x — a| < 6’ implique | f(x) — /'| < €. Pour les x tels 
que |x — al est plus petit que 8 et 0” en même temps, nous avons 


lé 2 = 12 f(x) + FC) — 1 <1L- F1 + fe) — LU < 2e, (12.77) 


et donc |£ — £'| = 0 parce que c’est plus petit que 2€ pour tout €. 


PROPooKPOXo0EHIXJs 
Proposition 12.38 ([1]). 
Soient un espace vectoriel normé (V,|.]) et a € V. Soient encore un voisinage À de a et deux 
fonctions f,g: A\{a} — R qui admettent une limite en a. 
Si f(x) < g(x) pour tout x € A\{a} alors 


lim f(x) < lim g(x). (12.78) 


LT— a T— «a 
PROPooGQHKookgyk ji 
Proposition 12.39. 
Si f:R— RU {+} est continue et croissante, alors il existe { E R L {+co} tel que 
lim f(x) = 4. (12.79) 


T—00 


12.3.4 Limite à gauche et à droite 


Si a est à l’intérieur du domaine de f, nous savons ce que signifie lim,_,, f(x). Nous donnons 
également une définition des limites à gauche et à droite. 


Définition 12.40. 
Soient D CR et une fonction f: D — R. $i a € Adh(D) nous définissons la limite à droite de 


J en a par L : _. 
lim f(x) = lim f(x) , PAS) 
Sat za 
où f est la fonction f restreinte à D n {x tel que x > a}. La limite (12.80) est souvent écrite sous 
la forme condensée 

lim f(x). (12.81) 


Ta 
T>a 


Pour la limite à gauche c’est un peu la même chose : 
lim f(x) = lim f(x). (12.82) 


Ta 
T<a 


LEMooXJMFooCkzoVi 
Lemme 12.41. 
Soient D € R et une fonction f: D — R. Si a € Adh(D) nous avons lim,_,4+ f(x) = L si et 
seulement si pour tout € > 0, il existe Ô > 0 tel que x E Ja,a + ô[ n D implique f(x) € B(L,6). 


Démonstration. Nous avons les équivalences entre les propriétés suivantes, en utilisant la définition 
7.102 de la limite : 

ÉD on Vin =6 

(2) mess) =t 

(3) Pour tout € > 0, il existe 0 > 0 tel que si x € B(a,ô) n Dh{x > a} alors f(x) € B(L,e) 

(4) Pour tout € > 0, il existe 0 > 0 tel que si x € Ja,a + ô[ n D alors f(x) € B(L,e) 
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PROPooGDDJooDCmydE 
Proposition 12.42 ([363]). 
Soit une fonction f: D — R où D est une partie de R. Si a € Adh(D) alors la limite limz-,a f(x) 
existe si et seulement si les limites à gauche et à droite existent et sont égales. Dans ce cas nous 
avons égalité : 
lim f(x) = lim f(x) = lim f(x). (12.83) 
Ta x—at za 


Démonstration. En deux parties. 


(1) = Nous disons que lim,_,, f(x) = £. Si V est un voisinage de L, il existe un voisinage U de 
a tel que f(U N D\{a}) € V. En particulier il existe un 6 > 0 tel que six e [a,a +ô[ n D, 
alors | f(x) — £| < €. Cela est la limite à droite (lemme 12.41). 


(2) = Soit e > 0. Par la limite à droite, il existe 8 > 0 tel que f(Ja, a + dif n D) € B(L,6). 
Par la limite à gauche, il existe 62 tel que f (Ja — 62, a[ n D) € B(L,e) 
En prenant 6 — min{ô1, 62} nous avons bien f(B(a,6) n D\{a}) & B(4,e) comme le demande 
la définition de la limite. 


12.43. 
Quelques remarques à propos de la proposition 12.42. 


(1) Cette proposition ne se généralise pas aux dimensions supérieures. Dans IR? par exemple, il 
ne faudrait pas croire que si les limites suivant toutes les directions existent alors la limite 
existe. 


(2) Cette proposition est souvent utilisée pour calculer des limites dans lesquelles interviennent 
des valeurs absolues. Par exemple, durant la démonstration de la proposition 12.360. 


12.4 Limite en compactifié d’Alexandrov 


Nous considérons l’espace topologique localement compact R, et son compactifié d’Alexandrov 
défini en 7.98. Nous avons donc un point supplémentaire noté 0. Ce point n’est ni du côté des 
grands nombres positifs, ni du côté des grands nombres négatifs. Il n’est ni +00 ni —co. 


Proposition 12.44. 
Dans cet espace topologique R = R LU {æ}, 


l 
lim — = co. (12.84) 


Démonstration. Soit un voisinage V de 00 dans R. Il s'écrit V = K°U {o} pour un certain compact 
de R. Le théorème 10.24 nous assure que K est borné. Donc il existe R > 0 tel que X € B(0,R). 
Pour x € B(0,1/R) nous avons 


" (12.85) 


PA 


et donc 1/x € K°. Donc aussi À e V. 


De la même façon, dans € LU {w} nous avons 


1 
lim — = co. (12.86) 
2—0 Z 
12.45. : 
Je vous laisse deviner la topologie à considérer sur R = RÜ{+00,—œ}. Dans cet espace topologique 
la limite lim, _,0 _ n'existe pas. 
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12.4.1 Prolongement par continuité 
12.4.1.1 Discussion avec mon ordinateur 


Voici un extrait de ce que peut donner Sage. Nous lui donnons la fonction 


SG) = PRE 


” 322+ 107 8 


Cette fonction est inventée exprès pour que le dénominateur s’annule en —4. En fait 3x? +10x—8 = 
(x + 4)(3x — 2), et la fraction peut se simplifier en 


: 1 
=. 


f(x) (12.88) 


Et avec cela nous écririons f(—4) = —. Voyons comment cela passe dans Sage. 


| Sage Version 5.2, Release Date: 2012-07-25 

| Type "notebook()" for the browser-based notebook interface. | 

| Type "help()" for help. 
sage: f(x)=(x+4)/(3xxxx2+10%x-8) 

sage: f(-4) 

ValueError Traceback (most recent call last) 
ValueËrror: power::eval(): division by zero 


Il produit donc une erreur de division par zéro. Cela n’est pas étonnant. Pourtant si on lui demande, 
il est capable de simplifier. En effet : 


sage: f.simplify_ful1() 

x |--> 1/(3*x - 2) 

sage: f.simplify_ful1()(-4) 
-1/14 


Nous considérons la question suivante : étant donné une fonction f définie sur 1\{xo}, est-il 
possible de définir f en x9 de telle façon à ce qu’elle soit continue ? 


Exemple 12.46. 


La fonction 
J:R\{0} —R 
1 (12.89) 


Tr — 
T 


n’est pas définie pour x = 0 et il n’y a pas moyen de définir f(0) de telle sorte que f soit continue 
parce que limz_,9 _ n'existe pas. PA 


12.4.1.2 Limite et prolongement 


Reprenons l’exemple de la fonction (12.87) que mon ordinateur refusait de calculer en zéro : 


x +4 x +4 
: — ’ 12.90 
fa) 3x2 +10x—-8 (x+4)(3x —2) 
Cette fonction a une condition d’existence en x = —4. Et pourtant, tant que x Æ —4, cela à un 


sens de simplifier les (x + 4) et d’écrire 
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Étant donné que pour toute valeur de x différente de —4, la fonction f s'exprime de cette façon, 


nous avons 1 
ed (=) | 


Oui, mais la fonction !? g(x) = 1/(3x—2) est continue en —4 et donc sa limite vaut sa valeur. Nous 
en déduisons que 


Que dire maintenant de la fonction ainsi définie ? 


z ne si x Z —4 


ee à si 


Cette fonction est continue en —4 parce qu’elle y est égale à sa limite. Les étapes suivies pour 
obtenir ce résultat sont : 


— Repérer un point où la fonction n'existe pas, 


— calculer la limite de la fonction en ce point, et en particulier vérifier que cette limite existe, 
ce qui n’est pas toujours le cas, 

— définir une nouvelle fonction qui vaut partout la même chose que la fonction originale, sauf 
au point considéré où l’on met la valeur de la limite. 


C’est ce qu’on appelle prolonger la fonction par continuité parce que la fonction résultante 
est continue. La prolongation de f par continuité est donc en général définie par 


F0) — f(x) SiT £Y 
(x) . 6) Ga (12.92) 


Dans le cas que nous regardions, 
f(x) - 
z 
3x2 + 10x — 8° 


le prolongement par continuité est donné par 


1 
3x — 2 


f = (12.93) 


Remarquons que cette fonction n’est toujours pas définie en x = 2/3. 


12.4.2 Prolongement par continuité 
Proposition-Définition 12.47 (Prolongement par continuité). 
Soit f: 1\{xo} — R telle que lims_,», f(x) = LE R. La fonction 
f:1—R 
JC) set (12.94) 
L si X = To 
est une fonction continue sur 1 et est appelée le prolongement par continuité de f en xo. 


Vous noterez que dans cet énoncé nous demandons £ € R. Les cas {/ = +00 sont donc exclus. 


12.48. 

Le lemme 12.64 donnera un autre gros morceau de prolongement par continuité. Là, ce ne sera pas 
juste une valeur qui manquera, mais carrément la majorité des valeurs ; mais par contre, ce ne sera 
pas vraiment de la prolongation par continuité, mais de la prolongation par Cauchy-continuité. 


12. Cette fonction g n’est pas f parce que g a en plus l’avantage d’être définie en —4. 
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Exemple 12.49. 


La fonction 
f:R\{-3,2} —-R 


r+92x—3 (12.95) 
(x + 3)(x — 2) 
admet pour limite lims_,_3 f(æ) = $. Son prolongement par continuité en x = —3 est donné par 
; si 
(a) = (12.96) 
x —2 
Notons que les fonctions f et f ne sont pas identiques : l’une est définie pour x = —3 et l’autre 


pas. Lorsqu'on fait le calcul 


x? + 2x —3 (æ—1)(r+3) z-1 


_ _ 12.97 

(x+3)(x—-2) (x+3)(r—-2) x—2° 
la simplification n’est pas du tout un acte anodin. Le dernier signe « = » est discutable parce que 
les deux dernières expressions ne sont pas égales pour tout x; elles ne sont égales « que » pour les 
æ pour lesquels les deux expressions existent. PA 


Les fonctions trigonométriques donneront quelques exemples intéressants de prolongements par 
continuité. Voir l’exemple 18.240. Et une avec la fonction logarithme dans l’exemple 15.112. 


12.4.3 Théorème de la bijection 


À propos de la continuité de l’application réciproque dans divers cas, voir le thème 34. 
LEMooYU00ooByoQdr 


Lemme 12.50 ([1]). 
Si I est un intervalle de R, et si x € Adh(1), alors x est dans une des trois situations suivantes !* : 


(1) æeInt(]) 

É0)-@ = nil) 

(3) x = sup(1) 
Démonstration. Soit a € Adh(7). Nous supposons que a n’est pas dans l’intérieur de 7, et nous 
prouvons que nous sommes dans un des deux autres cas. Soit € > 0. 


(1) a+e n’est pas un minorant Vu que a est dans l’adhérence de 7, pour tout n, il existe 
tn dans B(a,1/n) n I. En choisissant n assez grand, nous avons 


1 
Tn <a+—-<a+E, (12.98) 
n 


de telle sorte que a + € ne soit pas un minorant de 1. 


(2) a—e n’est pas un majorant De même nous avons æ, > a—}>a—e. 


(3) a > x ou a < x pour tout xe I Nous devons encore prouver que soit a > x pour tout 
x € 1, soit que a < x pour tout x € 1. Supposons que ce ne soit pas le cas. Il existe x_,x, € I 
tels que 


É_ 0e du (12.99) 


Vu que J est un intervalle nous avons [x_,x7,]€ I. Alors en prenant r < (x; — x_)/2 nous 
avons 
Piarehkemles (12.100) 


ce qui signifierait que a est dans l’intérieur de 1. 


13. Définitions de suprémum et d’infimum 1.444. 
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LEMooBDGGooSOdOUXb 
Lemme 12.51 ([364]). 
Soient un intervalle T1 et une application continue f: 1 — TR. Elle est injective si et seulement si 
elle est strictement monotone. 


Démonstration. En deux parties. 


(1) Si f est injective Nous prouvons que f est strictement monotone par l’absurde en sup- 
posant qu’elle ne l’est pas. Si f n’est pas strictement monotone sur 1, il existe 1, z2, æ3 et 
za dans 1 tels que 


T1 < T1 T3 < LA 
fai) < f(x) f(x3) > f(x). 


Vu que J est un intervalle, tous les points entrex1, x2, æ3 et x4 sont dans /. Nous pouvons 
donc définir 


(12.101) 


g: [O, 1] — R 
te féai + (1 t)x2) — f(x + (1 — ba). (12.102) 
Nous avons 
g(0) = f(x3) — f(x4) > 0 
g(1) = f(x1) — f(x2) < 0. (12.103) 


Le théorème des valeurs intermédiaires 10.89 nous indique qu’il existe to € [0,1] tel que 
g(to) = 0. Nous posons alors u = tox1 + (1—to)x3 et v = tox2 + (1 — to)x4, de telle sorte que 


0 = g(to) = f(u) — f(v). (12.104) 


Mais u £ v parce que æ1 < %2 et æ3 < æ4. Nous avons contredit l’injectivité de f. 


(2) Si f est strictement monotone Supposons que f soit strictement croissante. Nous de- 
vons prouver que f est injective. Pour cela supposons que f(u) = f(v) avec u,v € I. Nous 
avons alors 


J(v) (12.105a) 
J(v). (12.105b) 


Par stricte monotonie nous en déduisons que u < v et que u > v, autrement dit, que u = vw. 


PropÜARooUuCaYT 
Proposition 12.52 ([365, 1]). 
Une surjection monotone d’une partie X de R vers un intervalle est continue *. Nous sommes 
dans une des trois situations du lemme 12.50. 


Démonstration. Soit une application monotone g: X — 1 où I est un intervalle. Nous supposons 
dans un premier temps que g est croissante. Soit un ouvert V dans 1. Nous allons montrer que 
g7!(V) est ouvert dans X. 

Pour cela nous considérons x € g_!(V) et nous posons y = g(x). Nous allons prouver qu'il 
existe un voisinage U de x vérifiant g(U) € V. 

Le nombre y est dans un des trois cas du lemme 12.50. 


(1) y est à l’intérieur de 7 Il existe r > 0 tel que B(y,r) € V. Nous posons alors 0 < & <r, 
et choisissons æ_ € g_l(y— a) et x, € g_l(y+ a). Vu que g est surjective sur 1, ces nombres 
existent dans X. Par croissance de g, nous avons 


Here, (12.106) 


Enfin nous considérons la partie U = ]x_,x,[n X. Ce U est un ouvert contenant x. 
Avec tout ça nous avons g(U) € V. 


14. Pour les topologies induites de X et de 7. Dans le cas de 1, si il est ouvert, c’est la topologie usuelle. 
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(2) Si y = sup(l) Il existe r tel que ]y — r,y] € V. Nous considérons x_ € gl (y — r), et nous 
posons U = |x_,00[ n X. Avec cela nous avons 


g(U)cJy-eyle V. (12.107) 


(3) Siy=inf(7) Dans ce cas nous avons un r tel que [y,y + r[ € V. Nous considérons x} € 
g (y + r) et l'ouvert |-c,x,[ n X. Nous avons encore g(U) € V. 
Nous devons encore prouver le cas où g est décroissante. Dans ce cas la fonction h(x) = —g(x) 
est croissante et surjective sur l'intervalle —7. Elle est donc continue. Si h est continue, alors g est 
continue. 


Proposition 12.58. 
Soient f: 1 — J une bijection et fl: J — I sa réciproque. Alors pour tout x0 € 1 nous avons 


F (f(&o)) = 0 EaHaRop TEE, 


et pour tout yo € J nous avons 


FFT (wo)) = 4. Fal Top yen 


Démonstration. Nous prouvons la relation (12.108) et nous laissons (12.109) comme exercice au 
lecteur. 

Soit x9 € 1. Posons yo = f(x0). La définition de l’application réciproque est que pour y € J, 
{7 (y) est l’unique élément x de 1 tel que f(x) = y. Donc f-!(y0) est l'unique élément de Z dont 
l'image est yo. C’est donc xo et nous avons f—{(yo) = 0, c’est-à-dire 


F (U(G0)) =%0: (12.110) 


ThoKBRooQKXThd 
Théorème 12.54 (Théorème de la bijection). 
Soit I un intervalle et f une fonction continue et strictement monotone de 1 dans R. Nous avons 
alors : 


(1) f(1) est un intervalle de R ; 
(2) La fonction f: I — f(I) est bijective 


(3) La fonction f-!: f(1) — I est strictement monotone de même sens que ÉtemEJZooKuFoeFiv 


ITEMooMAWXooZXmVwA 


(4) La fonction f: 1 — f(1) est un homéomorphisme, c'est-à-dire que f-!: f(1) — I est conti- 
nue. 


Démonstration. Prouvons les choses point par point. 


(1) Supposons pour fixer les idées que f est monotone croissante l°. 
Soient a < b dans f(1). Par définition il existe x1,12 € I tels que a = f(x1) et b = f(x2). 
La fonction f est continue sur l’intervalle [1,2] et vérifie f(x1) < f(x2). Donc le théorème 
des valeurs intermédiaires 10.89 nous dit que pour tout t dans [f(x2), f(x2)], il existe un 
zo € [x1, to] tel que f(xo) = t. Cela montre que toutes les valeurs intermédiaires entre a et 
b sont atteintes par f et donc que f(1) est un intervalle. 

(2) Nous prouvons maintenant que f est bijective en prouvant séparément qu’elle est surjective 


et injective. 


(2a) f est surjective Une fonction est toujours surjective depuis un intervalle vers l’en- 
semble Image f. 


(2b) f est injective Soit x £ y dans TZ; pour fixer les idées nous supposons que x < y. La 
stricte monotonie de f implique que f(x) < f(y) ou que f(x) > f(y). Dans tous les cas 


(x) # f(y). 


15. Traitez en tant qu’exercice le cas où f est décroissante. 
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La fonction f est donc bijective. 


(3) Comme d’accoutumée nous supposons que f est croissante. Soient y1 < y2 dans f(1):; nous 
devons prouver que f{(y1) < f-!(y2). Pour cela nous considérons les nombres 21,49 € Î 
tels que f(x1) = y1 et f(x2) = y2. Nous allons en prouver la contraposée en supposant que 
fu) > f- (y). En appliquant f (qui est croissante) à cette dernière inégalité il vient 


FFT u)) > F(FT (u)), (12.111) 
ce qui signifie 
y > y2 (12.112) 
par l'équation (12.109). 


(4) La fonction fl: f(1) — I est une fonction monotone et surjective, done continue par la 
proposition 12.52. 


Exemple 12.55. 


La fonction 
f: 12,3] — [4,9] 


; (12.113) 
Tr x 
est une bijection. Sa réciproque est la fonction 
1 
: [4,9] — [2,3 
f RS BI (12.114) 
A 
12.5 Limite et continuité 

SecLimiteFontion 


Voir les remarques dans l’index thématique 29 pour comprendre la place et la portée de ce qui 


va venir à propos de limite et de continuité. 
ThoLimCont 


Théorème 12.56 (Limite et continuité). 
La fonction f est continue au point a si et seulement si lims_,4 f(æ) = f(a). 


Démonstration. Nous commençons par supposer que f est continue en a, et nous prouvons que 
lims_,a f(x) = f(a). Soit e > 0; ce qu’il nous faut c’est un Ô tel que |x — a] < 6 implique 
[f(x) — f(a)| < €. La caractérisation 10.80 de la continuité donne l’existence d’un Ô comme il nous 
faut. 

Dans l’autre sens, c’est-à-dire prouver que f est continue au point a sous l'hypothèse que 
limy-a f(æ) = f(a), la preuve se fait de la même façon. 


Nous en déduisons que si nous voulons gagner quelque chose à parler de limites, il faut prendre 
des fonctions non continues. En effet, si une fonction est continue en un point, la limite ne donne 
aucune nouvelle information que la valeur de la fonction elle-même en ce point. 

Prenons une fonction qui fait un saut. Pour se fixer les idées, prenons celle-ci : 


jt) = - si æ €] — 00,2| EangiqEL, 


x/2 sixe[2,+0l 


Essayons de trouver la limite de cette fonction lorsque x tend vers 2. Étant donné que f n’est pas 
continue en 2, nous savons déjà que lim,_,2 f(x) Æ f(2). Donc ce n’est pas 1. Cette limite ne peut 
pas valoir 4 non plus parce qu’en prenant n'importe quel €, la valeur de f(2 + €) est très proche 
de 2, et donc, ne peut pas s’approcher de 4. En fait, on peut facilement vérifier que aucun nombre 
ne vérifie la condition de limite pour f en 2. Nous disons que la limite n'existe pas. 
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Il ne faudrait pas en déduire trop vite que si une fonction n’est pas continue en a, alors la limite 
x — a n'existe pas. Ce que dit le théorème 12.56 est que si une fonction n’est pas continue en a, 


alors sa limite (si elle existe) ne vaut pas f(a). 
EXooKREUooLeullv 


Exemple 12.57 (Un exemple de continuité; Thème 29). 


Soit la fonction 
f(x) = ë FR enne 
si x = (0. 


Cette fonction n’est pas continue en x = 0, et pourtant la limite existe : lim;_,0 f(x) = 0. Etudions 
cela en détail, pour nous assurer de ce qu’il se passe. 

Considérons l’ouvert |3,5[. L'image réciproque de cet ouvert par f est la partie ]3,5[ L {0} qui 
n’est pas ouvert. Donc la fonction f n’est pas continue comme fonction IR — KR. 

Considérons pour comprendre la restriction f: [—1,1] — R. L'image inverse de |3,5[ par cette 
fonction est {0} qui n’est pas un ouvert. 

Plus généralement tant qu’on considère des restrictions de f sur des parties contenant un 
voisinage de 0, la fonction ne peut pas être continue 6. 

Voyons ce qu’il en est de la continuité ponctuelle de f en x = 0. La définition 7.32 est celle de 
la continuité en un point ; elle dit que f sera continue en 0 si f(0) = 4 est une limite de f. Nous 
voilà parti vers la définition 7.102. 

Soit le voisinage V = ]3,5[ de f(0). Quel que soit le voisinage W de 0 dans R, il existe un 
e > 0 tel que W € B(0,e). Nous avons alors 


f(W\{0}) € F(B(0,e)\{0}). (12.117) 
Mais le nombre €/2 fait partie de f(B(0,e)\{0}) et n’est pas dans V. Donc f(0) n’est pas une 
limite de f en zéro. Cette fonction n’est donc pas continue en zéro. A 


Exemple 12.58 (Même exemple, limite). 
Nous avons vu que, pour la fonction (12.116), le nombre 4 n’est pas une limite de f en zéro. Nous 
montrons à présent que 0 est une limite (et même la seule par la proposition 7.105 que nous ne 
rappellerons plus à chaque fois) de f. 

Montrons que 0 est une limite de f en zéro, c’est-à-dire que limz-,0 f(x) = 0. 

Nous suivons la définition 7.102. Soit un voisinage V de 0 dans R. Il existe Ô tel que B(0,6) € V. 
En posant € = Ô et en définissant W = B(0,e) nous avons 


f(B(0,€)\{0}) = B(0,e)\{0} « B(0,6) € V. (12.118) 
Donc 0 est une limite de f en zéro. A 


Nous avons déjà vu par le corolaire 10.56 qu’une suite croissante et bornée était convergente. 


Il en va de même pour les fonctions. 
PropMTmBYeU 


Proposition 12.59 ([1]). 
Si la fonction réelle f: I = [a,b[— R est croissante et bornée, alors la limite 


lim f(x) (12.119) 


a—b 
existe et est finie. 


Démonstration. Commençons par prouver que si (x,) est une suite dans 7 convergeant vers b, alors 
f(æn) est une suite convergente. Dans un second temps, nous allons prouver que si (x,) et (x!) 
sont deux suites qui convergent vers b, alors les suites convergentes f(x,) et f(æ’,) convergent vers 
la même limite. Alors le critère séquentiel de la limite d’une fonction conclura (proposition 7.239). 


16. Les plus acharnés se demanderont ce qu’il se passe pour la restriction de f à la partie {0} munie de la topologie 
induite de R. 
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Nous pouvons extraire de x, une sous-suite croissante (x4(,,). Alors la suite f (oatx)) est une 
suite croissante et majorée, donc convergente par le corolaire 10.56 !7. Nommons 4 la limite et 
montrons qu'elle est aussi limite de f sur la suite originale. 

Pour tout € > 0, il existe K tel que si n > K alors |f (Tan) _ €] < €. Soit K” tel que pour tout 
n > K' nous ayons x, > x,(x). Cela est possible parce que la suite est bornée par b et converge 
vers b : il suffit de prendre K” de telle sorte que [2» — b| < [ta(n) — b|. Sin > K” alors tn > Ta(x) 
et 

f{n) > fran) > € (12.120) 


en résumé si n > K alors | f(x») — {| < €. Cela prouve que f(x) — L. 
Soit maintenant une autre suite (x},) qui converge également vers b. Comme nous venons de 
le voir la suite f(x/,) est convergente et nous nommons // la limite. Si nous considérons (x7) la 
suite « alternée » (71,4 ,%2, 5, ---) alors nous avons encore une suite qui converge vers b et donc 
(2 / 
fan) — £. 
Mais étant donné que f(x,) et f(x/,,) sont des sous-suites, elles doivent converger vers la même 
valeur. Donc £ = #' = £". 


PROPooLOQVooULDhZz 
Proposition 12.60 ([1]). 


L'ensemble IR L {oo} muni de la topologie de la compactification en un point !? 


est connexe par 
arcs. 


Démonstration. Nous allons montrer que le chemin 
7: [0,1] — [0,0] 


: sir #0 (12.121) 
Tr 
do sitæ=0 


est continu au sens de la définition 7.32(2) (qui est le seul sens possible au mot « continu »). 

Soit un ouvert © dans RU {æ}. Si cet ouvert ne contient pas , alors y -!(O) est ouvert dans 
R parce que la fonction x ++ 1/x est continue !°. 

Si o € O, alors © = {oo} LU ©’ où ©’ est un ouvert de R ayant la propriété que R\O’ est 
compact. 

Nous avons y 1(O) = {0} U y !(0'). Et aussi que + (©) est un ouvert de R contenu dans 
[0,1]: 

Puisque le complémentaire de ©’ est compact, il existe a € R tel que [a,o[ € ©’. Donc 
O' = ]a, wo] L ©” où ©” est un ouvert. 

Nous avons : 


77 (0) = {77 (c)} La (a, of) ü 77" (0") (12.122a) 
= {0} U ]0, = U7(0") (12.122b) 
= [0, = LT (OP). (12.122) 


Vous noterez le point essentiel où la topologie de la compactification agit : comme {0} n’est pas 
un ouvert de [0,1], nous devons nous assurer que la partie +-1(©') vienne se coller à {0} pour 
compléter en un ouvert. 

L'ensemble 7-1(©”) est un ouvert de R contenu dans [0,1]. Nous avons donc 


y {(©) = (1-1, 2[U v(0")) n [0,1]. (12.123) 


Cela est un ouvert de [0,1] par définition de la topologie induite 2°. 


17. En gros nous sommes en train de dire que toute la théorie des fonctions convexes est un vulgaire corolaire de 
Bolzano-Weierstrass. 

18. Définition 7.98. 

19. Voir par exemple la proposition 12.5. 

20. Définition 7.24. 
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12.5.1 Prolongement des rationnels vers les réels 


Si f: À — R est une fonction continue pour la topologie induite, est-ce qu’on peut la prolonger 
en une fonction continue sur IR? La réponse est hélas non. 


EXooWZNCooQkKdtJ 
Exemple 12.61 ([366]). 
Puisque 2 est irrationnel ?!, ceci définit bien une fonction sur Q : 
JR—R 
0 siq< V2 (12.124) 
L 1 sig> 412. 


C’est une fonction continue sur Q. En effet, soient q e Q et e > 0. Nous prenons 6 > 0 tel que V2 
ne soit pas dans B(q,0). Alors si pe Ba(q,ô) nous avons f(q) = f(p) et donc 


[f(p) — f(g)| < €. (12.125) 


Il n’est cependant pas possible de la prolonger en une fonction continue sur KR. A 


Pour qu’une fonction sur À puisse être prolongée en une fonction continue sur R, il faut 
un peu plus que la continuité. Il faut la Cauchy-continuité, que nous définissons pas plus tard 


qu'immédiatement. 
DEFooXX0GooXblyKP 


Définition 12.62 ([366]). 

Soient X et Y deux espaces métriques. Une application f : X — Y est dite Cauchy-continue si 

pour toute suite de Cauchy (xn) dans X, la suite (f(xn)) est de Cauchy dans Y. 
PROPooPUNFooFMytOY 

Proposition 12.63 ([367]). 

Soient X et Ÿ des espaces métriques ”?. Nous supposons que Ÿ est complet”. Nous considérons 

AC X et une application Cauchy-continue f: À — Y. 

Alors : 


(1) Il existe un unique prolongement continu g: A — Y de f. ITEMooDEZGooUAvuvE 


(2) Ce prolongement est lui-même Cauchy-continu. 


Démonstration. En plusieurs parties. 
(1) Une suite 
Soit x e À. Nous considérons une suite (a,) dans À telle que a» À, x. Alors (an) est de 


Cauchy 2 et donc ( Î (an)) est de Cauchy dans Y. Vu que Y est complet, ( F (an)) est une 
suite convergente. 


(2) Indépendance 


Montrons que si (b,) est une autre suite dans À convergeant vers x, alors lim, f(an) = 
lim f(bn). Pour cela nous considérons la suite(ao, bo, a1,b1,...,). Cela est une suite qui 
converge vers x. Elle est donc de Cauchy et son image par f est encore de Cauchy. Toutes 
les sous-suites de la suite image sont dont convergentes vers la même limite. En prenant les 
sous-suites paires et impaires, nous avons lim, f(as) = limh f(b»). 


(3) Définition de g Nous pouvons donc définir 


DAY 


host (12.126) 


où (a) est une quelconque suite dans À convergeant vers x. 


21. Proposition 1.393. Le fait que 42 existe dans R est la proposition 1.457. 
22. Il a une distance, définition 7.107. 

23. Définition 7.253. 

24. Proposition 7.259. 
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(4) g est séquentiellement continue Soit une suite (x,) dans À. Nous devons prouver que 


g(ën) — g(x). 

Nous pouvons choisir a, € À tel que d(as,zn) < 1/n. Si nous considérons une suite de Cauchy 
dans À convergeant vers 2,, et que nous prenons a, assez loin dans cette suite, alors nous 
pouvons même choisir a, tel que d(f(an),g(tn)) < 1/n. Nous choisissons (a,) de telle sorte 
à vérifier les deux en même temps. 


Nous avons 
d(an, T) < d(an, En) + d(£n, €) — 0. (12.127) 


Donc (a,) est de Cauchy et par définition de g, nous avons 


g(x) = lim f(ah). Ro NRENORINR ES 


n—00 


À partir de là nous avons la majoration 


d(g(&n), g(x)) < d(g(tn), f(an)) + d(F(an), g(x)). (12.129) 
Le premier terme tend vers zéro par choix de la suite (a,) et le second tend vers zéro par 
(12.128). 


(5) g est continue La proposition 7.245 donne l’équivalence entre la continuité et la continuité 
séquentielle. 


(6) Unicité Soient g1 et g», deux prolongations continues de f sur À. Si a, — x dans À, alors 
nous avons, par continuité de g1 et g2 : g1(an) — g1(x) et g2(an) — g2(x). 
Mais g1(an) = g2(an) = f(an) ; donc les limites sont égales. 


(7) g est Cauchy continue 


En terme de prolongement continu, nous avons ce lemme qui demande à une fonction d’être 
Cauchy-continue. Vous pouvez comparer avec le principe de prolongement analytique 17.141 qui 


donne un énoncé similaire pour un prolongement analytique. 
LEMooUAFBooAwiXx)j 


Lemme 12.64 ([1, 368, 367]). 
Soit une fonction Cauchy-continue® f: Q — R. 


(1) La limite limy-x f(q) existe pour tout x e R. 
(2) Il existe un unique prolongement continu f: R — R. 


(3) Ce prolongement est donné par 


f(x) = Lea oo (12.130) 


limyx f(g) sinon 


Démonstration. C’est tout dans la proposition 12.63 en sachant que 
— À est dense dans R, proposition 10.16. 
— KR est complet, théorème 7.272. 


PROPooXWHYooFiVYfi 
Proposition 12.65. 
Soient des fonctions continues f,g:1IR — IR. Si f et g sont égales sur À, alors elles sont égales 
sur R. 


25. Définition 12.62 ; nous en avons discuté dans l’exemple 12.61. 
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Démonstration. Nous pouvons utiliser les propriétés fondamentales des réels et de la continuité. 
Soit x € R:; nous voulons montrer que f(x) = g(x). En prenant par exemple le lemme 1.436, il 
existe une suite q; de rationnels telle que q; Le 

Par ailleurs, f et g sont continues sur R et donc en chaque point de R (théorème 7.196). Par 
la caractérisation séquentielle 7.129 de la continuité, nous avons 


fx) = Jim (a) = lim g(qi) = g(x). (12.131) 


PROPooTNIAooNAJDZL 
Proposition 12.66 ([1]). 
Soit une fonction strictement croissante f: Q — R. Alors la prolongation continue f: R — R est 
également strictement croissante. 


Démonstration. Soient x,y € R avec x < y. Notons d = y — x. Nous considérons des suites de 
rationnels x, — x et y — y telles que pour tout k, xx € B(x,d/3) et yx € B(y, d/3). En particulier, 
xx < y pour tout k et L. 

Soient des rationnels q et q' tels que pour tout k, 


Tk << <Yk. (12.132) 


Pour trouver de tels rationnels, il suffit de les chercher dans |x + 2, y — af. Cet intervalle étant de 
longueur d/3, il contient des rationnels. 
Vue la croissance de f sur À, nous avons, pour tout k : 


f(x) < F(a) < (4) < F(ux), (12.133) 


et à la limite : 


f(x) < f(a) < (a) < (y). (12.134) 


Notez que les inégalités strictes se changent en inégalités larges au passage à la limite. D'où l’utilité 
de prendre deux rationnels entre x4 et y, pour maintenir une inégalité stricte entre f(x) et f(y). 


12.6 Espace des fonctions continues 


Définition 12.67. 
Soit I, un intervalle de R. L'’oscillation sur I est le nombre 


wf(1) = sup f(x) — inf f(x). (12.135) 
el xel 
Pour chaque x fixé, la fonction 
zr wf(B(x,6)) (12.136) 


est une fonction positive, croissante et a donc une limite (pour d — 0). Nous notons wy(x) cette 
limite qui est l’oscillation de f en ce point. Une propriété immédiate est que f est continue en 
zo si et seulement si wy(x0) = 0. 

LemuaPbtQ 
Lemme 12.68. 
L'ensemble des points de discontinuité d’une fonction f : R — R est une réunion dénombrable de 
fermés. 


Démonstration. Soit D l’ensemble des points de discontinuité de f. Nous avons 


00 
1 
1 U {x tel que wy(x) > mL (12.137) 


n=1 
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Il nous suffit donc de montrer que pour tout €, l’ensemble 
{x tel que wy(x) < €} (12.138) 
est ouvert. Soit en effet x0 dans cet ensemble. Il existe Ô tel que w/ (B(xo, 6)) <e.Sixe B(xo,6), 


alors si on choisit 4’ tel que B(x,0’) € B(x0,6), nous avons w/ Ciao) < €, ce qui justifie que 
wf(æ) <e et donc que x est également dans l’ensemble considéré. 


Théorème 12.69. 
L'ensemble des points de discontinuité d’une limite simple de fonctions continues est de première 
catégorie. 


Démonstration. Soit (f,) une suite de fonctions qui converge simplement vers f. Nous devons 
écrire l’ensemble des points de discontinuité de f comme une union dénombrable d’ensembles tels 
que sur tout intervalle 1, aucun de ces ensembles n’est dense. Nous savons déjà par le lemme 12.68 
que l’ensemble des points de discontinuité de f est donné par 


O0 
1 
D = U {x tel que w(x) > mL (12.139) 


n=l 


Nous essayons donc de prouver que pour tout €, l’ensemble 


F = {x tel que w;(x) > €} (12.140) 
est nulle part dense. Soit 
En = [) {x tel que | f(x) — f;(x)| < à. (12.141) 
i,3>n 


Nous montrons que cet ensemble est fermé en étudiant le complémentaire. Soit x & E, ; alors il 
existe un couple (4, j) tel que 


fix) — f(x) > €. (12.142) 


Par continuité, cette inégalité reste valide dans un voisinage de x. Donc il existe un voisinage de x 
contenu dans CE, et FE, est donc fermé. 

De plus nous avons E, € Eh41 et UJ, En = R. Ce dernier point est dû au fait que pour tout x, 
il existe N tel que i,j > N implique |f;(x) — f;(x)| < €. Cela est l'expression du fait que la suite 
(la) est de Cauchy. 

Soit 1, un intervalle fermé de IR. Nous voulons trouver un intervalle J € 1 sur lequel f est 
continue. Nous écrivons 7 sous la forme 


I- Ü (En. (12.143) 


n=1l 


Tous les ensembles J, = E, n I ne peuvent être nulle part dense en même temps (à cause du 
théorème de Baire 7.310). Il existe donc un n tel que J, contienne un ouvert J. Le but est de 
montrer que f est continue sur J. Pour ce faire, nous n’allons pas simplement majorer |f(x)— f(xo)| 
par € lorsque [x — x0| est petit. Nous allons majorer l’oscillation de f sur B(x0,06) lorsque 6 est 
petit. Pour cela nous prenons x9 et x dans J et nous écrivons 


LFCœ) — f(ro)l < f(x) — f(x) + fax) — fn(o)|. (12.144) 


À ce niveau nous rappelons que n est fixé par le choix de J, dans lequel € est déjà inclus. Nous 
choisissons évidemment |x — x0| < 8 de telle sorte que le second terme soit plus petit que € en 
vertu de la continuité de f,. Pour le premier terme, pour tout à, j > n nous avons 


fix) — f(x) < €. (12.145) 
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Si nous posons j = n et à — 0, en tenant compte du fait que f; — f simplement, 


Lf(x) — fn(x)| < €. (12.146) 


Nous avons donc obtenu |f(x)— f,(xo)| < 2e. Cela signifie que dans un voisinage de rayon 0 autour 
de xo, les valeurs extrêmes prises par f(x) sont f,(x0o) + 4e. Nous avons donc prouvé que pour tout 
€, il existe Ô tel que 

wF([ro — 6, to + 6]) & 4e. (12.147) 


De là nous concluons que 
lim «y ([xo — 6,0 + 6]) = 0, (12.148) 


ce qui signifie que f est continue en xp. 


Exemple 12.70. 
Une fonction discontinue sur Q et continue ailleurs. La fonction 


J(æ) = - ee (12.149) 
4 Sit=p/q 


où par «x = p/q » nous entendons que p/q est la fraction irréductible *. 

Cette fonction est discontinue sur À parce que si q € Q alors f(q) < 0 alors que dans tous 
voisinage de q il existe un irrationnel sur qui la fonction vaudra zéro. 

Montrons que f est continue sur les irrationnels. Si x0 # Q alors f(xo) = 0. Mais si on prend un 
voisinage suffisamment petit de x, nous pouvons nous arranger pour que tous les rationnels aient 
un dénominateur arbitrairement grand. En effet si nous nous fixons un premier rayon ro > 0 alors 
il existe un nombre fini de fractions de la forme 1, ë, L.. .…, € dans B (to, ro). Il suffit maintenant 
de choisir 0 < r < ro tel que ces fractions soient toutes hors de B(x0,r). Dans cette boule nous 
avons f < +. Du coup f est continue en x. A 


Définition 12.71 (Point périodique|369]). 
Soit f: 1 — 1 une application d’un ensemble T dans lui-même. Si x € I vérifie f(x) = x et 
f(x) Æ x pour k = 1,...,n — 1 alors on dit que x est un point n-périodique. 

LemAONBooGZBuYt 
Lemme 12.72. 
Soit I un segment" de R et une fonction continue f: I — I. Si K est un segment fermé avec 
K € f(1) alors il existe un segment fermé L € I tel que K = f(L). 


Démonstration. Mentionnons immédiatement que f est continue sur Z qui est compact . Par 
conséquent tous les nombres dont nous allons parler sont finis parce que f est bornée par le 
théorème 10.54. 

Soit K = [a, 5]. Si a = B alors le segment L = {a} convient. Nous supposons donc que a # B 
et nous considérons à, b € I tels que a = f(a) et 5 = f(b). Puisque a Æ b nous supposons a < b (le 
cas a > b se traite de façon similaire). 

Nous posons 

A={xe{a,b] tel que f(x) = a}. (12.150) 


C’est un ensemble borné par a et b. De plus il est fermé; ce dernier point n’est pas tout à fait 
évident parce que f n’est pas définie sur KR, mais sur 1, qui est fermé. Le corolaire 10.86 n’est donc 
pas immédiatement utilisable. Prouvons donc que Z = {x e R tel que f(x) = a} est fermé. Si xo 
est hors de Z alors, soit x0 est dans 1, soit il est hors de 7. Dans ce second cas, le complémentaire de 
T étant ouvert, on à un voisinage de xo hors de 1, et par conséquent hors de Z. Si au contraire xo € 1 
alors il y a (encore) deux cas : soit x0 € Int(1), soit x0 est sur le bord de 7. Dans le premier cas, le 


26. Proposition 3.33. 
27. définition 10.51. Un segment est un intervalle fermé borné. 
28. Par le lemme 10.20. 
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théorème des valeurs intermédiaires ?* fonctionne. Pour le second cas, nous supposons x = max(1) 
(le cas 0 = min(1) est similaire). Le théorème des valeurs intermédiaires dit que sur [x0 — €, to], 
Îf Æ a et en même temps, sur [to, to +], nous sommes en dehors du domaine. Au final { f(x) = a} 
est fermé et À est alors fermé en tant que intersection de deux fermés. 

L'ensemble À étant non vide (a € À), il possède donc un maximum que nous nommons w : 


u = max(A). (12.151) 


Nous posons aussi 
B = {x € [u, b] tel que f(x) = B} (12.152) 


qui est encore fermé, borné et non vide. Nous pouvons donc définir 

v = min(B). (12.153) 
Nous prouvons maintenant que f ([u,v]) = [a,B]. D'abord f([u. v]) est un intervalle compact °° 
contenant f(u) = a et f(v) = B. Par conséquent [a,B] € f ([u, v]). Pour l'inclusion inverse 
supposons { € [u,v] tel que f(t) > B. Vu que f(a) = a et à < B, par le théorème des valeurs 
intermédiaires, il existe to € [a,t] tel que f(to) = 5. Cela donne to < v et donc contredit la 
minimalité de v dans B. Nous en déduisons que f([u, v]) ne contient aucun élément plus grand 
que 6. Même jeu pour montrer que l'intervalle ne contient aucun élément plus petit que @. 

En définitive, le segment L = [u, v] satisfait toutes les exigences. 


Lorsque 12 € f(11) nous notons /, — 12 ou, si une ambiguïté est à craindre, 7; ; L. Cette 


flèche se lit « recouvre ». 
LemSSPXooMkwzjb 


Lemme 12.73 ([370, 369]). 
Soient les segments I0,...,1n_1 tels que nous ayons le cycle 


IL — En —...— 1, 1 — I. (12.154) 


Alors f" admet un point fixe x € Lo tel que f*(xo) € 14 pour tout k = 0,...,n —1. 


Démonstration. Nous prouvons les cas n = 1 et n = 2 séparément. 
(1) n=1 Nous avons Z0 — Lo, c’est-à-dire que 10 € (Lo). Si Lo = [a,b] alors nous posons 
a = f(a) et b = f(B) pour certains à, 8 € 15. Nous posons ensuite g(x) = f(x) — x. 
Dans un premier temps, g(a) = a — a < 0 parce que a = min(/5) et & € 19. Pour la même 
raison, g(8) = b— B > 0. Le théorème des valeurs intermédiaires donne alors to € [a, 5] € Lo 
tel que g(to) = 0. Nous avons donc f(to) = to. 


(2) n=2 Nous avons 19 — 1 — 19. Puisque Z, € f(Io), le lemme 12.72 donne un segment 
Ji € D tel que f(J1) = 11. Mézalors 


Jclbce f()= f(J). (12.155) 


2 
Nous avons donc Ji “e Ji et par le cas n = 1 traité plus haut, la fonction f? a un point 
fixe xo dans Ji. De plus 
f(xo) € FC) = L, (12.156) 
le point xo est donc bien celui que nous cherchions. 


(3) Cas général Nous avons 


TL —-h—...— 1, 1 — I. (12.157) 
Puisque 11 € f(1o), il existe Ji € 16 tel que f(J1) = l1. Mais 


Be f(h) = f(), (12.158) 


29. Théorème 10.89. 
30. Corolaire 10.91 et théorème 7.211. 
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donc il existe Jo € Ji tel que 12 = f?(J2). En procédant ainsi aussi longtemps qu'il le faut, 


nous construisons les ensembles J1,...,.,_1 tels que 
JÎn-1 € Jn-2C...C dE do (12.159) 
tels que 14 = f*(Jx) pour tout k = 1,...,n — 1. La dernière de ces inclusions est 1,_1 = 
FT (Jh_1), mais 11_1 — Lo, c’est-à-dire que 
DE fUn-1) = FT), (12.160) 


et il existe Jn € Jn-1 tel que 10 € f"(J,). Mais comme J, € Jo nous avons en particulier 
dE Th) 

Cela donne un point fixe xo € J, pour f". Par construction, nous avons J, € Jy_1 € ...c€ 
Ji € Jo et donc x9 € Jy pour tout k. En particulier 


f*(&o) € F(Jx) = le (12.161) 


pour tout k. 


Théorème 12.74 (Théorème de Sarkowski[370, 369]). 
Soit I, un segment de R et une application continue f : [1 — I. Si f admet un point 3-périodique, 
alors f admet des points n-périodiques pour tout n > 1. 


Démonstration. Soit a € I un point 3-périodique pour f et notons b = f(a), c = f(b). Les points 
b et c sont également des points 3-périodiques. Quitte à renommer, nous pouvons supposer que a 
est le plus petit des trois. Il reste deux possibilités : a < b < cet a < c < b. Nous traitons d’abord 
le premier cas. 


Supposons a < b < c. Nous posons 16 = [ab] et 11 = [b,c]. Nous avons immédiatement 


1€ f(lo) et comme f(b) = cet f(c) = a, f(L1) recouvre [a, c] et donc recouvre en même temps 
LI; et 12. Nous avons donc 16 — 15, li — I et Li — Hi. 


(1) Un point 1-périodique Nous avons 1; — I; qui prouve que f à un point fixe dans 1. 


(2) 


TR 
Æ 
nr 


C’est le cas n = 1 du lemme 12.73. Voilà un point 1-périodique. 


Un point 2-périodique Nous avons 169 — 11 — 10. Par conséquent, le lemme 12.73 dit que 
f* a un point fixe 0 € Jo tel que f(xo) € 11. Montrons que f(x0) £ xo. Pour avoir x0 = f(xo), 
il faudrait x0 € on Li = {b}. Mais b est un point 3-périodique, donc ne vérifiant certainement 
pas f2(b) = b. Nous en déduisons que f(x) £ xo et donc que x9 est 2-périodique. 


Un point 3-périodique On en a par hypothèse. 


Un point n-périodique pour n >4 Nous avons le cyle 


D (12.162) 
————— 
n-1 fois 
Le lemme donne alors un point fixe x € 19 pour f" tel que f*(x) € 11 pour k=1,...,n—1. 


Est-ce possible que æ = b? Non parce que f?(b) = a € Î9 alors que f?(x) € 11. Mais 
Lo [A] T — {b}. 

Par conséquent la relation f(x) € 11 exclut d’avoir f*(x) = x, et le point x est bien n- 
périodique. 


Passons au cas a < € < b. Alors nous posons 6 = [a,c] et 11 = [cb]. Encore une fois f(1o) 


contient a et b, donc 15 — 16 et 10 — 11. Mais en même temps f(11) contient a et c, donc Z1 — 16. 


Nous pouvons donc refaire comme dans le premier cas, en inversant les rôles de 0 et 5. En 


particulier nous pouvons considérer le cycle 


LB — I — I —...— I — JT. (12.163) 
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12.7 Uniforme continuité 
SESooUAZM60RYSARE 


L’uniforme continuité est la définition 7.308. 


Définition 12.75. 
Une partie À € R"" est dite bornée si il existe un M > 0 tel que A € B(0, M). Le diamètre de 


la partie À est le nombre 
Diam(A) = sup |x — y| € [0,0]. (12.164) 


T,YE 


Lorsque À est bornée, il existe un M tel que |x| < M pour tout x € À. 
LEMooFABOooZYF jhv 
Lemme 12.76. 
Si À est une partie non vide de R”, alors Diam(A) = Diam(A). 


Exemple 12.77. 
Prenons la fonction f(x) = À, et demandons nous pour quel Ô nous sommes sûr d’avoir 


1 


Ô = < €. 12.165 
fa+9-sa- | -2l<e (12.165) 
Pour simplifier, nous supposons que a > 0. Nous calculons 
1 1 > 
— — € 
a a+ô 
UN. 
a(a + ô) 
Ô < ea? + ad (12.166) 


d(L=Ea) E0 
ea? 


Ô < 


1—Ea 


Notons que, à € fixé, plus a est petit, plus il faut choisir 0 petit. La fonction x + _ n’est donc pas 


uniformément continue. Cela correspond au fait que, proche de zéro, la fonction monte très vite. 


Une fonction uniformément continue sera une fonction qui ne montera jamais très vite. A 
PROPooVOUToo0tiGLG 


Proposition 12.78. 
Quelques propriétés des fonctions uniformément continues. 


(1) Toute application uniformément continue est continue ; 
(2) la composée de deux fonctions uniformément continues est uniformément continue ; 
Nous verrons qu’une application lipschitzienne est uniformément continue (proposition 12.332). 


Une fonction peut être uniformément continue sur un domaine et pas sur un autre. Le théorème 


suivant donne une importante indication à ce sujet. 
ThoHeineContinueCompact 


Théorème 12.79 (Heine). 
Soit K un compact de R". Une fonction continue f : R°? — IR" est uniformément continue sur K. 


Démonstration. Nous allons prouver ce théorème par l’absurde. Nous commençons par écrire la 
condition qui exprime que f n’est pas uniformément continue sur le compact K : 


3e > 0 tel que VO > 0, 3r,y € K tels que fx — y| < Ô et |f(x) — f(y)| > €. (12.167) 


En particulier (en prenant Ô = 1 pour tout n), pour chaque n nous pouvons trouver +, et y dans 
K qui vérifient simultanément les deux conditions suivantes : 


1 
tn — Yn] < = (12.168a) 


\f(œn) — HSE Co (12.168b) 
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Nous insistons que c’est le même € pour chaque n. L'ensemble K étant compact, l’ensemble K x K 
est compact (théorème 7.299) et nous pouvons trouver une sous-suite convergente du couple (ï», Un) 
dans X x K. Quitte à passer à ces sous-suites, nous supposons que (x,,y,) converge dans K x K 
et en particulier, que les suites (x,) et (y) sont convergentes. Étant donné que pour chaque n 
elles vérifient |t» — yn| < 1, les limites sont égales : 


lim æ» = limyn = x. (12.169) 


L'ensemble K étant fermé, la limite x est dans K. Par continuité de f, nous avons finalement 


lim f(œn) = lim (un) = f(æ), (12.170) 
mais alors 
Lim |f(œn) — f(G)| = 0, (12.171) 


ce qui est en contradiction avec le choix (12.168b). 

Tout ceci prouve que f(K) est bornée supérieurement et que f atteint son supremum (qui 
est donc un maximum). Le fait que f(K) soit bornée inférieurement se prouve en considérant la 
fonction — f au lieu de f. 


Remarque 12.80. 
Nous pouvons ne pas utiliser le fait que le produit de compacts est compact. 

Pour choisir les sous-suites (x,) et (y), il suffit de prendre une sous-suite convergente de (x,) 
et d’invoquer le fait que |æn — yn| < +. Les suites (æ») et (yn) étant adjacentes !, la convergence 
de (x) implique la convergence de (y,) vers la même limite. 


Il est donc un peu superflu de parler de la convergence du couple (Zn, Yn). 
PROPooBWUFooYhM1Dp 
Proposition 12.81 (Heine[371]). 
Toute application continue d’un espace métrique compact dans un espace métrique quelconque est 


uniformément continue *?. 


Démonstration. Soient un espace métrique compact X et un espace métrique quelconque Æ. Nous 
considérons une application continue f: X — E. 


(1) Un ensemble Soit e > 0. Nous considérons l’ensemble 
K = {(x,y)e X x X tel que d(f(x), f(y)) > €}. (12.172) 


(2) Il est compact L'espace X étant compact, X x X est également compact par le théorème 
7.299. Les fonctions f et d étant continues, l'application 


p'XxXX—RT 
(x, y) > d(f(x), f(y)) 


est continue, de telle sorte que la partie & > € est fermée. Un fermé dans un compact est 
compact par le lemme 7.91. 


(12.173) 


(3) Une borne atteinte Nous considérons l'application distance d: K — R*. C’est une appli- 
cation continue sur le compact Æ ; donc elle atteint ses bornes (théorème des bornes atteintes, 
10.54). Elle a un minimum que nous notons 6. 


Comme (x,x) & K, nous avons d(x,y) > 0 pour tout (x,y) € K. Et donc 6 > 0. 


(4) Conclusion Si x,ye X sont tels que d(x,y) < 6, alors (x,y) € K. De ce fait nous avons 


d(f(x), f(y)) < €. (12.174) 


D'où l’uniforme continuité de f sur X. 


31. Définition 10.39. 
32. Uniforme continuité, définition 7.308. 
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LEMooIVAKooUïiEENr 
Lemme 12.82 (|1]). 
Soit une fonction continue f: [a,b] x [c, d] — R. Pour chaque x € [a, b] nous définissons 


x: (dd R 
Ja: le, d] (12.175) 
y f(,y). 
Alors l’application 
: [a,b] — R 
9: La, b] (12.176) 


T4 |fællo 
est continue. 
Démonstration. Soit à € [a,b], et prouvons la continuité de g en a. 
(1) Le décor Nous considérons l’espace vectoriel normé (C°([a, b]), ||.|X) des fonctions conti- 


: 5 5 [ab] unif 
nues sur [a,b] muni de la norme uniforme. Prouvons que si 2, — à, alors fr, — fa. 


(2) Module de continuité Pour cela nous avons le calcul suivant, avec justifications juste 


en-dessous : 
I fr — Falco = ne I (tr, y) — f(a, y)| (12.177a) 
VE C; 
SUBEQooC0J W 
< sup ler(l(rr) — (as) 21770) 
VE C; 
= sup [wy(|xx — al)| AAAAERS IE PAU) 
yelc,d] 
= Wwy(|rx — à|). (12.177d) 
Justifications. 


— Pour (12.177b). Utilisation du module de continuité, définition 11.272. 
— Pour (12.177c). La norme dans IR? de (xy,y) — (a, y). 


(3) Uniforme continuité La fonction f est continue sur le compact [a, b] x [c, d]. Elle est donc 
uniformément continue par le théorème de Heine 12.81, et donc son module de continuité 


vérifie limp_,ow(h) = 0 par 11.274. 
Nous avons donc . 
M fre — falo <wy(Itx — al) — 0. (12.178) 


N d : : R 1 Ils 
ous avons donc prouvé que si x; — à, alors fr, — fa. 


(4) Conclusion La norme étant une application continue, nous en déduisons que si 7; — à, 
alors | frs ll — |falco- 


Ceci est la continuité séquentielle de la fonction g, et donc la continuité tout court. 


12.8 Fonctions sur un compact 


Par le théorème des valeurs intermédiaires 10.89, l’image d’un intervalle par une fonction conti- 
nue est un intervalle, et nous avons l’importante propriété suivante des fonctions continues sur un 
compact. 

Le théorème suivant est un cas particulier du théorème 10.54. 


Théorème 12.83. 
Si f est une fonction continue sur l'intervalle compact [a,b]. Alors f est bornée sur [a, b] et elle 
atteint ses bornes. 
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Démonstration. Étant donné que [a, b] est un intervalle compact, son image est également un inter- 
valle compact, et donc est de la forme [m, M]. Ceci découle du théorème 7.211 et le corolaire 10.91. 
Le maximum de f sur [a, b] est la borne M qui est bien dans l’image (parce que [m, M] est fermé). 
Idem pour le minimum m. 


12.9 Polynômes, théorème de d’Alembert 


L’algèbre des polynômes sur un anneau est définie en 1.352. Si P € A[XT] et si «à € À nous 
avons également défini l'évaluation de P en a; c’est la définition 1.355. Dans le cadre de l’analyse, 
lorsque nous considérons des polynômes, nous allons complètement confondre le polynôme avec la 
fonction qu’il définit. 


12.9.1 Polynômes sur les réels 


PROPooJKYJooFqbQMr 
Proposition 12.84. 
Tout polynôme à coefficients réels de degré impair possède une racine réelle. 
Démonstration. Nous mettons le plus haut degré en facteur : 
k 
Pix) = » = 21 . + (12.179) 
k=0 k=0 


Le terme en k = n vaut a,x” tandis que les autres sont de la forme (à un coefficient près) _ pour 
un { > 1. Lorsque x — ©, chacun de ces termes s’annule (lemme 12.32). Nous avons donc 


Jim PÉE) = 6%, (12.180) 
et de même, n étant impair, limz_,_ P(æx) = —00. Le théorème des valeurs intermédiaires 10.89 


nous donne alors l’existence d’un réel sur lequel P s’annule. 


12.9.2 Polynômes sur les complexes 


Nous allons parler de comportement asymptotique de polynômes définis sur €. La topologie 
que nous considérons est celle de la compactification en un point, décrite en 7.98. 

Le lemme suivant donne une caractérisation de la limite en l’infini dans le compactifié €. Dans 
beaucoup de cas, cette caractérisation est prise comme la définition de la limite. Hélas, dans le 
Frido nous sommes des extrémistes et nous ne parvenons pas à dire le mot « limite » si il n’y a pas 


une topologie. 
LEMooERABooQjLBzW 


Lemme 12.85 ([1]). 
Nous considérons la compactification en un point d’Alexandrov*. Soit une fonction f: © — C. 
Nous avons limz-, f(z) = © si et seulement si pour tout M > 0, il existe R > 0 tel que |z] > R 
implique |f(2)| > M. 


Démonstration. Souvenons-nous que, en général **, nous avons 


lim f(x) = b (12.181) 


si pour tout voisinage V de b, il existe un voisinage W de a tel que z € W\{a} implique f(z) € V. 
Précisons encore un point de notation. Si K est une partie de C, nous notons K° son complé- 
mentaire dans C, pas dans €. 
Ceci étant dit, nous passons à la preuve. 


33. Définition 7.98. 
34. Définition 7.102. 
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(1) Sens direct Nous supposons que lim:_,% f(z) = 00. Soit M > 0; nous considérons le 
voisinage V = B(0, M)" U {co}. Par définition de la limite, il existe un voisinage W de « tel 
que ze W = f(2)e V\{ow} = B(0, M). Ce voisinage est de la forme K° U {oo}. Puisque K 
est compact, il est borné, et il existe À > 0 tel que K € B(0,R). 


Avec tout cela nous avons la chaine suivante d’implications : 


l:1>R=2:eK°>2:eW = f(2)e V\{o} = B(0,M) = |f(2)| > M. (12.182) 


C’est bien la propriété que nous voulions. 

(2) Sens réciproque Soit un voisinage V de «0. Nous avons V = K° 0 {wo} où K est compact 
dans €. Il existe M > 0 tel que K € B(0, M). 
Par hypothèse, il existe R tel que || > R = |f(2)| > M. Soit W = B(0,R)" L {co}. Nous 
avons la chaine 


z2eEW=/]>R=|f(2) > M = f(2) € K° = f(2)Ee V. (12.183) 


PROPooPWVWooGuftxZ 
Proposition 12.86 ([1]). 
Soit le polynôme 


(12.184) 


où nous sous-entendons que an Æ 0. La fonction z + |P(2)| est équivalente en l'infini à la 
fonction 
w:C—R* 
ze |anz”|. 


(12.185) 


: . : : ë o0GXWZooDJZNZzE 
Démonstration. Nous voudrions prouver qu’il existe une fonction æ: € — KR telle que ES 
P q q 


[D az} = (1+a(2))lanz"|. (12.186a) 
i=0 
Jim a(z) = 0. (12.186b) 


Nous trouvons un candidat pour être une telle fonction en isolant simplement a(z) de cette égalité. 
Nous trouvons 


1. (12.187) 


Elle vérifie immédiatement (12.186). Le point qui fait intervenir la topologie de © est de vérifier 
que lim,;_,% @(z) = 0. Le terme à = n de la somme vaut 1. Il suffit donc de montrer que pouri£n 
nous avons 


1 
lim —— = 0. (12.188) 


z—00 gn—1 
Soit € > 0. Nous devons prouver qu’il existe un voisinage V de © dans € tel que 


1 


zn— 


0 =. (12.189) 
pour tout z € V. 
En utilisant la proposition 10.101 nous avons déjà 


1 


zn—i 


1 1 


_ [ani] = Lapei 


(12.190) 


35. Définition 7.62. 
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Soit R > 0 tel que 5 < €. Nous considérons le voisinage {|2| > R} U {oo} de co. Dans ce voisinage, 


nous avons 
1 1 1 


je a R 


<e (12.191) 


Et voilà. 


Le lemme suivant parle de polynôme sur C. Vous pouvez l’adapter à R et R. 
LEMooYZVGooXZvBAc 


Lemme 12.87. 
Si P: C — C est un polynôme, alors |P| atteint une borne inférieure globale. 


Démonstration. Nous savons, par l’équivalence de fonctions prouvée dans la proposition 12.86 
que lim;-,0 P(z) = 0. Soit a > 0 dans R. Par le lemme 12.85 il existe un R > a tel que 
LI>R=1f() > 1f(a)l. 

La fonction |P| est continue sur le compact B(0, R). Soit z9 le point de minimum * de |P| sur 


B(0, À). 


Nous devons prouver que z0 donne même un minimum global. Comme a € B(0, À) nous avons 


|P(20)| < |P(a)|. (12.192) 
Size B(0,R) , nous avons 
[P(2)1 > IP(a)l > 1P(20)|. (12.193) 
Donc ce z9 est un minimum sur B(0,R) et sur B(0, R). Bref, un minimum global. 
LEMooTTOYooXaukuH 
Lemme 12.88. 
Soit le polynôme 
P:C—C 


(12.194) 


nm 
2m > az". 
i=0 


À part si ao = a1 = 0, la fonction P est équivalente à ag + a1z en z = 0. 


Note : si ao = a = 0, alors évidemment P devrait être équivalente à 0, ce qui est évidemment 
faux : la fonction identiquement nulle tend vers zéro plus vite que n’importe quoi. 


Démonstration. En posant g(z) = ao + a1z, nous devons trouver une fonction a telle que 
EQooZFJBooŸ 
P(2) = (1+ a(z))g(2). dent) 


Si ao É 0, il existe un voisinage épointé de z = 0 sur lequel la fonction 


Fe NH (Je EooVCOVoRAKY JE 


ao + @a12 


existe. Il n’y a aucun problème à ce que a(z) — 0 pour z — 07, et un simple calcul ® donne 
(12.196). 


Si par contre ao = 0, nous faisons le calcul intermédiaire suivant : 


nm 
a(z)g(2) = P(2) — (2) = D ax? (12.197) 
i=2 
et donc, en isolant a(z) et en simplifiant par z, nous voyons que la fonction à définie par 


nm 
7 i-2 
a(z) = — &;2 12.198 
@=rÈa (12.198) 


convient. 


36. Théorème de Weierstrass 7.138. 
37. En remarquant toutefois que c’est une limite à deux dimensions. Sachez la définir. 
38. En fait, la formule (12.196) est obtenue en isolant a(z) dans (12.195). 
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PROPooLBBLooQwEiHr 
Proposition 12.89 ([372, 1]). 
Soient a,beR. ITEMooSPSWooKLtqzz 
> . 2 . . 
(1) L'’équation z° = a + bi a une solution dans C. ITEMooQOJDoojfCXv 


(2) Pour tout l, l'équation 27 = a + bi a une solution dans C. 


Nous ne disons pas que ces solutions sont uniques *”. 


Démonstration. Pour prouver (1), l'équation 2? = a + bi a pour solution +£ où *° 


l l 1 1 
Ê= Vie + 5V® + D? + D ONE 2 a? + b2. (12.199) 
Nous n'avons en fait pas besoin de montrer que +£ sont toutes deux des solutions, ni que ce sont 
les seules. Un calcul direct montre que £? = a + bi et nous sommes contents. 
Pour (2), nous faisons une récurrence sur {. Nous savons que 


TT 2 (222. (12.200) 


Soit é E € tel que e2° = a + bi; un tel € existe par hypothèse de récurrence. Alors si z est tel que 


2? = £, nous avons 
k+1 
2 


= a + bi. (12.201) 


Le théorème de d’Alembert possède de nombreuses démonstrations. En voici une qui à ma 
connaissance est celle demandant le moins d'analyse; une démonstration à base de théorie de 
Galois peut être trouvée dans [99, 373]. Si vous lisez ces lignes pour savoir qu’un polynôme de 


degré n possède au maximum n racines, ce n’est pas ici qu’il faut regarder, mais le corolaire 3.128. 
THOooIRJYooBiHRyW 


Théorème 12.90 (d’Alembert[372]). 

Le corps © est algébriquement clos : tout polynôme non constant à coefficients complexes admet 
au moins une racine complexe“. 

Démonstration. Nous effectuons une preuve tout à la fois par l’absurde et par récurrence en sup- 
posant que le polynôme 


f:C—-C 


| (12.202) 
ze 27 + az +... +an 


n’a pas de racine dans ©, et que n soit le plus petit entier pour lequel un tel polynôme existe. 
Nous notons 
n = 2m (12.203) 


où m est impair. 
Le lemme 12.87 donne un point z0 qui réalise le minimum global de |f| sur C. Nous posons 
g(z) = f(zo + 2) et nous définissons ses coefficients À; par 


g(2) = D Aix. (12.204) 
i=0 
Nous avons A4, = 1 et |Ao] = |f(20)|. Soit À, le premier à être non nul parmi les A1, A9, ...… 


39. Comme vous en conviendrez en pensant à 2? = 1 qui a déjà les solutions 1 et —1. 
40. Si vous vous demandez où sont définies les racines carrés, c’est 10.92. 
41. C’est la définition 6.74 d’être algébriquement clos. 
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(1) Sir <n Par hypothèse de récurrence, il existe £ € € tel que £&" = —A4;/4,. Nous avons 
— A,t"A L ns 
g(t8) = Ao + EE DD ARTE (12.205) 
F i=r+1l 


En notant P(t) le dernier polynôme, nous pouvons écrire cela sous forme compacte : 
g(t£) = Ao — #" Ao + # + Pt). (12.206) 


Puisque 
lim = liméP(t) = 0, (12.207) 
0 
il existe to > 0 tel que 
[51 P(to)| < |Aoté]. (12.208) 
Nous choisissons de plus to < 1, de telle sorte que 1 — {” > 0. Avec cela nous avons 
g(68)1 < 1Aol( — #°) + * PE] = lAol #1 A0 + lé PE] < | Aol. (12.209) 
————  —] 
<0 


Or |Ao| était un minimum global de [g|. Contradiction. 
(2) Sir=n 
Dans ce cas, 
g(z) = f(2o + z) = Ao + 7”, (12.210) 


et nous rappelons que n = 2m où m est impair. Nous allons trouver une contradiction dans 
les quatre cas Re(Ao) > 0, Re(Ao) < 0, Im(4o) > 0 et Im(Ao) < 0. Bien entendu ces cas se 
recouvrent largement, mais en toute généralité, nous avons besoin des quatre. 


(2a) Si Re(4o) > 0 La proposition 12.89 nous permet de considérer v e € tel que v?° = —1. 
Nous avons alors 


gltv) = Ao + (to) = Ao + (02) = An + (1) = A —#" (12.211) 


parce que m est impair. Nous avons Im (g(tv)) = Im(A4o). Si t est assez petit pour que 
t < |Re(Ao)| nous avons aussi | Re (g(tv))| < | Re(4o)|. Donc 


leo)? = Re (g(év))/? + [im (g(#o))? < | Re(40)/? + |Im(4o)/? = |4of. (12.212) 


Donc |g(tv)| < | Aol. Contradiction. 
(2b) Si Re(Ao) <0 Nous prenons v = 1, et même histoire. 


(2c) Si Im(Ao) <0 Nous prenons w € € tel que 
2h L(m—1) 
w? = i(—1)2001), (12.213) 
Là, il y à un peu d’arrachage de cheveux pour bien voir les cas. La difficulté est que les 


puissances de à alternent entre 1, —1, à et —i. Puisque m est impair, nous avons un | tel 
que m = 2l +1. Nous subdivisons les cas { pair et { impair. 


(2c.ïi) Si / est pair Alors d’une part £(m — 1) = { est pair et donc 
(—1)20m-D 2 7, (12.214) 
Et d’autre part, 42441 = (—1)li = j. En tout, 


(1) AUD) 2 à, (12.215) 
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(2c.iii) Si l'est impair Alors £(m — 1) = l et ( 1)30m—0) — —1. Mais en même temps, 
+1 
[A = 


—i, ce qui donne encore une fois 
(—1)207 D = 5, (12.216) 


Bref, que | soit pair ou impair, nous avons im (—1)3 (m1) = À. 
Nous avons donc Re (g(tw)) = Re(Ao) et Im (g(tw)) < Im(Ao). Encore contradiction. 


(3) Si Im(A4o) > 0 Même chose que ce que nous venons de faire, mais avec 


2 = —i(—1)207-D), (12.217) 


CORooKKNWooWEQukb 
Corolaire 12.91 ([1]). 
Tout polynôme de degré 3 à coefficients réels possède au moins une racine réelle. 


Démonstration. Soient les racines A1, A2 et A3 du polynôme en question. Toutes trois sont dans 
C. Supposons que À1 ne soit pas réelle. Alors A2 ou À3 doit être égale à A1. Disons A2. Nous avons 
donc les racines À, À1 et À3. Le polynôme se factorise alors en 


a = ANRT = FAooELIMoRNRÈSE 


Le coefficient a doit être réel parce qu’il est le coefficient du terme en X* (réel par hypothèse). Si 
3 n’est pas réel, alors ce polynôme ne peut pas avoir des coefficients réels. Entre autres parce que 
le terme indépendant est a|A1[?}3, qui est réel si et seulement si À3 est réel #2. 


Tant que vous y êtes, vous pouvez voir que le polynôme (12.218) est à coefficients réels si et 


seulement siaeRet AE R. 
EXoo1PLOooSNfiWg 


Exemple 12.92. 
Toute application linéaire R° — R a un vecteur propre. En effet si R: R° — R° est linéaire, son 
polynôme caractéristique YR est de degré 3. Le corolaire 12.91 indique qu’un tel polynôme possède 


au moins une racine réelle. Une telle racine est une valeur propre de À par le théorème 9.114. A 
DEFooVFTYooJyDePn 


Définition 12.93. 
Sie K est une racine de X4, l’ordre de l’annulation est la multiplicité algébrique de la valeur 
propre À de u. À ne pas confondre avec la multiplicité géométrique qui sera la dimension de 
l’espace propre. 

LEMooPJKEooQwuWMb 
Lemme 12.94. 
Siae C n’est pas réel, alors les polynômes X — à et X — à sont premiers entre eux dans C[X|. 


Démonstration. Un polynôme diviseur commun de X — a et X — & doit être de la forme aX + b 
parce qu’un diviseur ne peut pas être de degré plus haut. Si nous voulons que le diviseur commun 
soit non inversible, il faut a # 0. 

Dire que aX + b divise X — a signifie qu’il existe s € © tel que (aX +b)s = X — a. Cela donne 


= 1/a et b = —a/s. En substituant la première dans la seconde, nous trouvons b = —aa. 
En recommençant avec X — &, nous trouvons également la relation b = —à&a. En égalisant, 
—aa = —@a. (12.219) 


En simplifiant, &« = à. Cela contredit l’hypothèse que a n’est pas réel. 


PROPooUMDQooVmfDYU 
Proposition 12.95. 
Un polynôme irréductible à coefficients réels est, soit de degré un, soit de degré 2 avec un discri- 
minant négatif. 


42. Notez l’utilisation du lemme 10.102. 
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Démonstration. Soit un polynôme P à coefficients réels de degré plus grand que 1. Alors le théorème 
de d’Alembert-Gauss (théorème 12.90) implique l'existence d’une racine a € €. Si a est un réel, 
P est réductible. Si « n’est pas réel, alors son conjugué complexe & est également une racine. Par 
conséquent les polynômes (X — a) et (X — à) divisent P dans C[X|].. 

Ces deux polynômes sont premiers entre eux par le lemme 12.94. Par conséquent le produit 


X?— (a+ aà)X + a (12.220) 


divise également P. Ce dernier est un polynôme à coefficients réels de degré 2. Donc tout polynôme 
de degré 3 ou plus est réductible. 


PROPooLXGSooXmVcVG 
Proposition 12.96. 
Si E est un espace vectoriel sur C, tout endomorphisme possède au moins une valeur propre. 


Démonstration. Soit un endomorphisme u sur E. Le théorème 9.114 dit que À € © est une valeur 
propre si et seulement si À est une racine du polynôme caractéristique x. Or ce polynôme possède 
au moins une racine dans € par le théorème de d’Alembert 12.90. 


12.10 Trigonalisation 


12.10.1 Trigonalisation : généralités 
SUBSECooMCOUGooEoQCsz 


Définition 12.97 ([374]). 
Une matrice dans M(n, K) est trigonalisable lorsqu'elle est semblable ** à une matrice triangu- 


laire supérieure. 
PropKNVFooQf1QsJ 


Proposition 12.98 (Trigonalisation et polynôme caractéristique scindé). 
Soit u un endomorphisme d’un espace vectoriel E sur le corps K. Les points suivants sont équiva- 
lents. ItemZKDMooOr THkwi 


(1) L'’endomorphisme u est trigonalisable (auquel cas les valeurs propres sont SU RARE) 


(2) Le polynôme caractéristique de u est scindé**. 


Démonstration. En deux parties. 


(1) (2)=(1) Nous avons par hypothèse 


Tr 


Xa(X) = [ [(X - 19% (12.221) 
1=1 


où les À; sont les valeurs propres de u. Le théorème de Cayley-Hamilton 9.118 dit que x4(u) = 
0, ce qui permet d'utiliser le théorème de décomposition des noyaux 9.89 : 


E = ker(X — A)%@...@ker(X — À,)%. (12.222) 


Les espaces F\,(u) = ker(u — À;)% sont les espaces caractéristiques de uw, ce qui fait que 
u— X;1 est nilpotent sur F,(u). L'endomorphisme u — À;1 est donc strictement trigonalisable 
supérieur sur son bloc +. Cela signifie que u est triangulaire supérieure avec les valeurs propres 
sur la diagonale. 


(2) (1)=(2) 
C’est immédiat parce que le déterminant d’une matrice triangulaire est le produit des élé- 
ments de sa diagonale. 


43. Définition 9.196. 
44. Définition 6.39. 
45. Proposition 9.206. 
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Remarque 12.99. 
La méthode des pivots de Gauss “© certes permet de trigonaliser n’importe quelle matrice, mais 
elle ne correspond pas à un changement de base. Autrement dit, les pivots de Gauss ne sont pas 
des similitudes. 

C’est là qu’il faut bien avoir en tête la différence entre équivalence et similarité*". Lorsqu'on 
parle de changement de base, de matrice trigonalisable ou diagonalisable, nous parlons de similarité 
et non d'équivalence. 


4 


12.10.2 Trigonalisation : cas complexe 


La proposition 12.98 dit déjà que tous les endomorphismes sont trigonalisables sur C. Nous 
allons aller plus loin et montrer que la trigonalisation peut être effectuée à l’aide d’une matrice 
unitaire. 

Une démonstration alternative passant par le polynôme caractéristique sera présentée dans la 


remarque 12.108 utilisant la proposition 12.98. 
LemSchurComplHAftTq 


Lemme 12.100 (Lemme de Schur complexe, trigonalisation[375]). 
Si À e M(n, C), il existe une matrice unitaire U telle que U AU! soit triangulaire supérieure *”. 
La diagonale de la matrice triangulaire contient alors les valeurs propres de A. 


Démonstration. Étant donné que C est algébriquement clos ®, nous pouvons toujours considérer 
un vecteur propre v de À, de valeur propre À. Nous pouvons utiliser un procédé de Gram-Schmidt 


pour construire une base orthonormée {v;,u2,...,u,} de C”, et la matrice (unitaire) 
Du | Î 
Q= |v1 u2 ::- Un |. (12.223) 
| À | 


Nous avons Q-lAQe; = Q7 Au = ÀAQ lv = Mei, par conséquent la matrice Q-1AQ est de la 
forme 


Q"1AQ = ( 2 (12.224) 


où + représente une ligne quelconque et A; est une matrice de M(n — 1,C). Nous pouvons donc 
répéter le processus sur A1 et obtenir une matrice triangulaire supérieure (nous utilisons le fait 
qu’un produit de matrices orthogonales est une matrice orthogonale °!). 


DefWQNooKEeJzv 
Définition 12.101. 
Un endomorphisme est normal si il commute avec son conjugué hermitien ”?. 


Les opérateurs normaux comprennent évidemment les opérateurs hermitiens, mais également 
les anti-hermitiens, et ça c’est bien parce que c’est le cas de l’algèbre associée à SU(2). 
ThogammwA 
Théorème 12.102 (Théorème spectral pour les matrices normales[300, 376, 377]). 
Soit AE M(n,C) une matrice de valeurs propres ]1,...,An (non spécialement distinctes). Alors 
les conditions suivantes sont équivalentes : 


46. Le lemme 4.111. 

47. Définition 4.110. 

48. Définition 9.175. 

49. « triangulaire supérieure » ne signifie pas « strictement triangulaire supérieure ». Ici, il est possible que la 
diagonale soit non nulle ; non seulement possible, mais même très probable en pratique. 

50. Algébriquement clos, définition 6.74. Le fait que C le soit est le théorème de d’Alembert 12.90. 

51. Proposition 9.43(1). 

52. Définition 9.173. 
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(1) À est normale”*, 

(2) À se diagonalise par une matrice unitaire, 

(8) Dr Al? — Di JA, 

(4) i existe une base orthonormale de vecteurs propres de A. 


Démonstration. En plusieurs parties. 
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ItemJZhFPSi 
ItemJZhFPSii 


ITEMo0oIIQTooQURrXP 


ITEMooJRKSooNfsQJb 


(1) (1) = (2) Soit Q la matrice unitaire donnée par la décomposition de Schur (lemme 12.100) : 


A = QTQ-!. Étant donné que À est normale nous avons 


QTT* QT" = QT*TQ"”, 


(12.225) 


ce qui montre que T' est également normale. Or une matrice triangulaire supérieure normale 


est diagonale. En effet nous avons T;; = 0 lorsque à > j et 


nm nm 
cree ele Er (12.226) 
k=1 k=1 
Écrivons cela pour à = 1 en tenant compte de |T1[? = 0 pour k = 2,...,n, 
al? = 1Tal? + [Ti2l ++ + (Tin? (12.227) 


ce qui implique que 7; est le seul non nul parmi les 754. En continuant de la sorte avec 


i=2,...,n nous trouvons que T' est diagonale. 


(2) (2) = (1) Si À se diagonalise par une matrice unitaire, U AU* = D, nous avons 


DD* = UAA*U* 


et 
D*D = U A*AU*, 


qui ce prouve que À est normale. 


(12.228) 


(12.229) 


(3) (2) = (3) Il existe une matrice unitaire U et une diagonale D telles que D = UT AU. La 
proposition 9.210 nous dit que la diagonale de D contient les valeurs propres de À, c’est-à-dire 


Du = dr. 
Nous avons Di = UTAÏU, et donc 


D'D = Uf A'UU‘ AU = UT AÏ AU, 


(12.230) 


c’est-à-dire que D'D est semblable à AÏA. La proposition 9.201 implique que leurs traces 
sont donc égales. Petit calcul en utilisant le lemme 9.174 (AÏ, = Aÿ;) : 


Tr(AA) = DA Aer = VS Aïe An = SAR. CET 
kl 


k 


Deuxième calcul : 


T(DiD) = S'DkDr = Y'énAtômar = DAf. TEE 
kl kl k 


Nous avons le résultat en égalisant (12.232) avec (12.231). 


53. Définition 12.101. 
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(4) (3) = (2) Le lemme de Schur complexe 12.100 nous indique qu’il existe une matrice uni- 


taire U et une matrice triangulaire supérieure T telles que T = U AUT et telle que Tÿ = À. 
Le lemme 9.203 nous indique que EP >; |4;;P?. Donc 


DA = DIT = DIAP + D ITP. (12.233) 
ÿ ÿ ; Fi 


Mais l'hypothèse nous dit que },; A Ë, lA;/?. Nous en déduisons que Y 
et donc que T'est diagonale. 
(5) (2)= (4) Soit une base {e;} de C”. Soit À = U DUT. Il suffit de poser f; = Üe; pour avoir 


Ef = 0, 


j>i 


Af; = UDUÎUe; = UDe; = XUe; = Xfi. (12.234) 


Donc f; est un vecteur propre de À. Le fait que {f;} soit une base de C” est dû au fait que 
U est inversible. 


(6) (4) = (2) Soit la base canonique {e;} de C”. Si {f;} est une base de vecteurs propres 
normalisés de À, alors il existe une matrice unitaire UÜ telle que f; = ÜUe;. Alors la matrice 
U AUT est diagonale. 


Tant que nous en sommes à parler de spectre de matrices hermitiennes...Soit une matrice 
inversible À € GL(n, C). La matrice A*A est hermitienne ** et le théorème 11.18 nous assure que 


ses valeurs propres sont réelles. Par la remarque 11.19, ses valeurs propres sont même positives. 
LEMooHUGEooVYhZdZz 


Lemme 12.103 ([378]). 
Si À est une matrice carrée et inversible, 


Spec(A*A) = Spec(AA*) (12.235) 


Démonstration. Nous allons montrer l'égalité des polynômes caractéristiques. D'abord une simple 
multiplication montre que 


(A*A — X1)A 1 = A T(AA* - 1). (12.236) 
Nous prenons le déterminant de cette égalité en utilisant les propriétés 9.13(1) et (3) : 
det(A* A — X1) det(A!) = det(A”!) det(AA* — X1). (12.237) 


En simplifiant par det(A-!) (qui est non nul parce que À est inversible) nous obtenons l'égalité 
des polynômes caractéristiques et donc l'égalité des spectres. 


En particulier les matrices hermitiennes, anti-hermitiennes et unitaires sont trigonalisables par 


une matrice unitaire, qui peut être choisie de déterminant 1. 
LEMooRCFGooPPXiKi 


Lemme 12.104. 
Soient À € M(n,C) et une matrice unitaire U telle que À = UTU-? où T est triangulaire. 


(1) En ce qui concerne les polynômes caractéristiques, XA = XT. 
(2) Pour les spectres, Spec(A) = Spec(T). 


(3) Les valeurs propres de A sont les éléments diagonaux de T. 
Démonstration. Puisque U commute évidemment avec 1, nous avons 
XA(À) = det(A — A1) = det(UTU T1 — X1) = det (U(T — AL)U-!). (12.238) 
À ce niveau nous utilisons le fait que le déterminant soit multiplicatif 9.13 pour conclure : 


XA(X) = det (U(T — A1)U7!) = det{U) det(T — A1) det{(U7}) = det(T — A1) = xr(X). (12.239) 


54. Définition 9.175. 
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Pour les spectres, l'égalité des polynômes caractéristiques implique l'égalité des spectres parce 
que les valeurs propres sont les racines du polynôme caractéristique par le théorème 9.114. 


Les valeurs propres d’une matrice triangulaire sont les valeurs sur la diagonale. 
LemSLGPooIghEPI 


Lemme 12.105 (Trigonalisation simultanée). 
Une famille de matrices de GL(n, C) commutant deux à deux est simultanément trigonalisable. 


Démonstration. Commençons par enfoncer une porte ouverte par la proposition 12.98 : toutes les 
matrices de GL(n, C) sont trigonalisables parce que tous les polynômes sont scindés. 
Nous effectuons la démonstration par récurrence sur la dimension. Si n = 1 alors toutes les 
matrices sont triangulaires et nous ne nous posons pas de questions. Nous supposons donc n > 1. 
Soit la famille (A;);er dans GL(n,C) et Ao un de ses éléments. Nous nommons À1,...,), les 
valeurs propres distinctes de 45. Le théorème de décomposition primaire 9.257 nous donne la 
somme directe d’espaces caractéristiques °° 


E = PF, (40) ® © Fi, (4o). (12.240) 


Nous pouvons supposer que cette somme n’est pas réduite à un seul terme. En effet si tel était 
le cas, Ao serait un multiple de l'identité parce que A5 n’aurait qu’une seule valeur propre et les 
sommes dans la décomposition de Dunford 9.259(3) se réduisent à un seul terme (et p; = Id). En 
particulier les dimensions des espaces F\(490) sont strictement plus petites que n. 

Puisque tous les A; commutent avec Ao, les espaces F,(A0) sont stables par les 4; et nous 
pouvons trigonaliser les À; simultanément sur chacun des F,(45) en utilisant l'hypothèse de ré- 
currence. 


ThoUWQBooCvutTO 
Théorème 12.106 (Lie-Kolchin[370, 379]). 
Tout sous-groupe connexe et résoluble®® de GL(n, C) est conjugué à un groupe de matrices trian- 
gulaires. 


Démonstration. Soit G un sous-groupe connexe et résoluble de GL(n, C). Nous faisons une récur- 
rence sur n. 


(1) Si sous-espace non trivial stable par G Nous commençons par voir ce qu’il se passe si 


il existe un sous-espace vectoriel non trivial V de €” stabilisé par G. Pour cela nous consi- 
dérons une base de €” dont les premiers éléments forment une base de V (base incomplète, 
théorème 4.13). Les éléments de G s’écrivent, dans cette base, 


o ) Faso pee 


0 g2 
Les matrices g1 et g2 sont carrées. Nous considérons alors l’application 4 définie par 


dv: G— GL(V) 
gr 91. 


(12.249) 


Cela est un morphisme de groupes parce que 


91 * hi  * - gih1 *# 
È à É ï,) _ ( 0 . ’ (12.243) 
de telle sorte que #(gh) = #(g)#{h). 


Le groupe 4#(G') est connexe et résoluble. En effet #(G) est connexe en tant qu’image d’un 
connexe par une application continue (lemme 7.209). Et il est résoluble en tant qu’image 
d’un groupe résoluble par un morphisme par la proposition 2.25. 


55. Définition 9.253. 
56. Définition 2.22. 
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Nous avons prouvé que #(G') est un sous-groupe résoluble et connexe de GL(V). Vu que V 
est de dimension strictement plus petite que €”, nous utilisons l’hypothèse de récurrence 
et nous déduisons que d(G) est conjugué à un groupe de matrices triangulaire, c’est-à-dire 
qu’il existe une base de V dans laquelle toutes les matrices g (avec g € G) sont triangulaires 
supérieures. 

On fait de même avec l’application g > g, ce qui donne une base du supplémentaire de V 
dans laquelle les matrices g> sont triangulaires supérieures. 

En couplant ces deux bases, nous obtenons une base de C”’ dans laquelle toutes les matrices 
(12.241) (c'est-à-dire toutes les matrices de G) sont triangulaires supérieures. 


Sinon Nous supposons à présent que C” n’a pas de sous-espaces non triviaux stables sous 
G. Nous posons m = min{k tel que D*(G) = {e}}, qui existe parce que G' et résoluble et que 
sa suite dérivée termine sur e (proposition 2.24). 


Sim=1 Sim = 1 alors G est abélien et il existe une base de G dans laquelle toutes les 
matrices de G sont triangulaires (lemme 12.105). Le premier vecteur d’une telle base serait 
stable par G, mais comme nous avons supposé qu’il n’y avait pas de sous-espaces non triviaux 
stabilisés par G&, ce vecteur tout seul forme un sous-espace trivial, c’est-à-dire que n = 1. 
Dans ce cas, le théorème est démontré. 


Sim>1 Nous devons maintenant traiter le cas où m > 1. Nous posons À = D"-1(G); 
cela est un sous-groupe normal et abélien de G. Encore une fois le résultat de trigonalisation 
simultanée 12.105 donne une base dans laquelle tous les éléments de A sont triangulaires. 
En particulier le premier élément de cette base est un vecteur propre commun à toutes les 
matrices de A. 
Soit V le sous-espace engendré par tous les vecteurs propres communs de H. Nous venons de 
voir que V n’est pas vide. Nous allons montrer que V est stable par G. Soient he H,veV 
et ge G: 

h(g(o)) = gg ‘hg(v) = g(x0) = Xg(o) CE 

cH 


parce que v est vecteur propre de g_lhg. Ce que le calcul (12.244) montre est que g(v) est 
vecteur propre de h pour la valeur propre À. Donc g(v) € V et V est stabilisé par G. Mais 
comme il n'existe pas d'espaces non triviaux stabilisés par G, nous en déduisons que V = €”. 
Donc tous les vecteurs de C” sont vecteurs propres communs de H. Autrement dit on a une 
base de diagonalisation simultanée de H. 


H est dans le centre de G 


Montrons à présent que H est dans le centre de @, c’est-à-dire que pour tout geGetheH 
il faut ghg_! = h. D'abord ghg ! est une matrice diagonale (parce qu’elle est dans H) ayant 
les mêmes valeurs propres que h. En effet si À est valeur propre de ghg=! pour le vecteur 
propre v, alors 


(ghg”")(v) = Av (12.245a) 
h(g” lv) = X(g” lv), (12.245b) 


c’est-à-dire que À est également valeur propre de h, pour le vecteur propre g— lv. Mais comme 


k a un nombre fini de valeurs propres, il n’y à qu’un nombre fini de matrices diagonales ayant 
les mêmes valeurs propres que h. L'ensemble Ad(G)h est donc un ensemble fini. D'autre part, 
l'application g + g—!hg est continue, et G est connexe, donc l’ensemble Ad(G')h est connexe. 
Un ensemble fini et connexe dans GL(n, C) est nécessairement réduit à un seul point. Cela 
prouve que ghg=! = h pour tout geGetheH. 


Espaces propres stables pour tout G 


Soit h € H et W un espace propre de À (ça existe non vide, parce que A est triangularisé, 
voir plus haut). Alors nous allons prouver que W est stable pour tous les éléments de G. En 
effet si w € W avec h(w) = Àw alors en permutant g et À, 


hg(w) = g(hw) = XAg(w), (12.246) 
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donc g(w) est aussi vecteur propre de h pour la valeurs propre À, c’est-à-dire que g(w) € 
W. Comme nous supposons que C” n’a pas d’espaces invariants non triviaux, nous devons 
conclure que W = €”, c’est-à-dire que H est composé d’homothéties. C'est-à-dire que pour 
tout h € H nous avons À = Àp1. 


(7) Contradiction sur la minimalité de m 


Les éléments d’un groupe dérivé sont de déterminant 1 parce que det(g1929; : 2 1) = 1. Par 
conséquent pour tout h, le nombre À est une racine n°de l’unité. Vu qu’il n’y a qu’une 
quantité finie de racines n° de l’unité, le groupe H est fini et connexe et donc une fois de 
plus, réduit à un élément, c'est-à-dire H = {e}. Cela contredit la minimalité de m et donc 
produit une contradiction. Nous devons donc avoir m = 1. 

(8) Conclusion Nous avons vu que si C? avait un sous-espace non trivial fixé par G alors le 
théorème était démontré. Par ailleurs si C” n’a pas un tel sous-espace, soit m = 1 (et alors 
le théorème est également prouvé), soit m > 1 et alors on a une contradiction. 

Bref, le théorème est prouvé sous peine de contradiction. 


Remarque 12.107. 

Le lemme mentionne le fait que les valeurs propres de À sont les éléments diagonaux de T. Mais 
attention : ceci ne dit rien au niveau des multiplicités géométriques. Un nombre peut être cinq fois 
sur la diagonale de T' alors que l’espace propre correspondant pour À n’est que de dimension 1. 


Exemple : la matrice 
1 1 
A = ( n (12.247) 


a deux 1 sur la diagonale. Le nombre 1 est bien une valeur propre de À, mais le système 


A () = () (12.248) 


donne y = 0 et donc un espace propre de dimension seulement 1. 
RemXFZTooXkGzQg 


Remarque 12.108. 
Si K est algébriquement clos (comme € par exemple), alors tous les polynômes sont scindés et 
toutes les matrices sont trigonalisables 7. Un exemple un peu simple de cela est la matrice 


_ È + (12.249) 


Le polynôme caractéristique est x,(X) = X? + 1 et les valeurs propres sont +i. Il est vite vu que 


dans la base 
(() GC) (12.250) 


RemREOSo0oGEDJWX 


de C?, la matrice u se note É .) 


Remarque 12.109. 
Cela nous donne une autre façon de prouver qu’une matrice nilpotente de M(n, C) ou Mn, R) est 
trigonalisable[380]. D'abord dans M(n, C), toutes les matrices sont trigonalisables %, et les valeurs 
propres arrivent sur la diagonale. Mais comme les valeurs propres d’une matrice nilpotente valent 
zéro, elle est triangulaire stricte. Par ailleurs, son polynôme caractéristique est alors X7. 

Ensuite si u € Mn, R) nous pouvons voir u comme une matrice dans Mn, €) et y calculer son 
polynôme caractéristique qui sera tout de même X”. Ce polynôme étant scindé, la proposition 12.98 


57. La proposition 12.98 montre cela, et le lemme de Schur complexe 12.100 va un peu plus loin, et précise que la 
trigonalisation peut être obtenue par une matrice unitaire. 
58. Parce que le polynôme caractéristique est scindé, voir la proposition 12.98. 
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nous assure que u est trigonalisable. Une fois de plus, les valeurs propres étant sur la diagonale, 


elle est triangulaire supérieure stricte. 
CorUNZooAZULXT 


Corolaire 12.110. 
Le polynôme caractéristique” sur © d’une matrice s'écrit sous la forme 


T 


xA(X) = [IX - x)" (12.251) 
i=1 


où les À; sont les valeurs propres distinctes de À et m; sont les multiplicités correspondantes. 


Démonstration. Le lemme 12.100 nous donne l’existence d’une base de trigonalisation ; dans cette 
base les valeurs propres de À sont sur la diagonale et nous avons 


X— À, * * 
XA(X) = det(A — X1) = det 0 E z | (12.252) 


qui vaut bien le produit annoncé. 


CORooTPDHooXazTuZ 
Corolaire 12.111. 
Si Ae M(n,C) etke N alors 


Spec(Af) = {XF tel que À e Spec(A)}. (12.253) 


Démonstration. Par le lemme 12.100 nous avons une matrice unitaire Ü et une triangulaire T telles 
que À = UTU-!. En passant à la puissance £ nous avons aussi 


AF=UTU RE (12.254) 
Donc le spectre de A est celui de T* (lemme 12.104 et le fait qu’une puissance d’une matrice 


triangulaire est encore triangulaire). Or les éléments diagonaux de T* sont les puissances k° des 
éléments diagonaux de 7’, qui sont les valeurs propres de À. 


Pour le cas complexe, c’est le lemme 11.18 et le théorème 12.102. 


12.11 Matrices, spectre et norme 


Le lien entre la norme opérateur d’une matrice et son spectre sera entre autres utilisé pour 
étudier le conditionnement de problèmes numériques. Voir la définition 34.107 et par exemple son 
lien avec la résolution numérique de systèmes linéaires dans la proposition 34.112. 


PROPooKLFKooSVnDzr 
Proposition 12.112 ([326]). 
Soit une matrice À € M(n,C) de rayon spectral p(A). Soit une norme |.| sur C” et la norme 
opérateur correspondante. Alors 
p(A) < JAI (12.255) 
pour tout k € N. 
Démonstration. Soit vu € C” et À € € un couple vecteur-valeur propre. Nous avons | Av| = |A||v| 
et aussi 
Ale = TAfol = 14fol < 1 Av. (12.256) 


La dernière inégalité est due au fait que nous avons choisi sur M(n, C) la norme subordonnée à 
celle choisie sur C”, via le lemme 11.59. Nous simplifions par |v| et obtenons [A] < | A*|1/F. Étant 
donné que p(A) est la maximum de tous les À possibles, la majoration passe au maximum : 


p(A) < AFF. (12.257) 


59. Définition 9.110. 
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PROPooJGNFooEwtNmJ 
Proposition 12.113. 
Soient deux espaces vectoriels normés E et V. Soient des applications continues f,g: E — End(V). 


Alors l’application 
v: E — End(V) 


ms fl) éule) (12.258) 


est continue. 


End(V 
Démonstration. Soit une suite rx > x. Nous devons montrer que Y(xx) _” (x). Pour cela 


nous utilisons le lemme 11.61 qui indique que la norme opérateur est une norme d’algèbre. Nous 
avons : 


lbCcx) — D(x)| = | f(xx) © g(xx) — f(x) © g(x)| (12.259a) 
< | f(æx) © gr) — (xx) © g(x)| + 1 f (xx) 0 gx) — (x) 0 g(x)| (12.259b) 

= | f(æx) © (gx) — g(x))| + 1(F(æx) — f(x) ° gx) (12.259c) 

(xx) ( ) 


< 1f()lgGe) — 9) + 1x) — fm) g(æ)|. 


Pour k — nous avons |f(xx)| — |f(x)|, |f(xx) — f(x)] — 0 (parce que f est continue) et 
similaire avec g. Donc le tout tend vers zéro. 


12.11.1 Rayon spectral 


La chose impressionnante dans la proposition suivante est que p( A) est défini indépendamment 
du choix de la norme sur M(n, K) ou sur K. Lorsque nous écrivons | A|, nous disons implicitement 


qu’une norme a été choisie sur K, et que nous avons pris la norme subordonnée sur Mn, K). 
PROPooWZJBooTPLSZp 


Proposition 12.114 ([381|). 
Soit À une matrice de M(n,R) ou M(n,C). Alors 


p(À) < |A]: (12.260) 


Démonstration. Nous devons séparer les cas, suivant que le corps de base soit R ou C. 


(1) Pour A€ Mi(n,C) Soit À une valeur propre de À telle que |A] soit la plus grande. Nous 
avons donc p(A) = [À]. Soit un vecteur propre u € C” pour la valeur propre À. En prenant 
la norme sur l'égalité Au = Au, et en utilisant le lemme 11.59, 


jAflul = lAul < Alul: (12.261) 


Donc JA] < |A et p(4) < |A]. 

(2) Pour AE M(n,R) 
L'endroit qui coince dans le raisonnement effectué pour M(n, €) est que, certes À € Min, R) 
possède une plus grande valeur propre en module et qu’un vecteur propre lui est associé. 
Mais ce vecteur propre est, à priori, dans €”, et non dans IR’. Nous pouvons donc écrire 
Au = Au, mais pas | Au] = |A||u] parce que nous ne savons pas quelle norme prendre sur 
(Eu 
Il n’est pas certain que nous ayons une norme sur €” qui se réduit sur IR” à celle choisie 
implicitement dans l’énoncé. Nous allons donc ruser un peu. 


Soit une norme N sur C” 50, Nous nommons également N la norme subordonnée sur M(n, C) 
et la norme restreinte sur M(n,R). Vu que N est une norme sur Mn, R) et que ce dernier 
est de dimension finie, le théorème 11.46 nous indique que N est équivalente à |.|. Il existe 


donc C > 0 tel que 
N(B) < C|B| (ER O) 


60. Il y en à plein, par exemple celle du produit scalaire x, y) = Ÿ, trÿr. 
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pour tout B € M(n,R). Nous avons maintenant 
p(A)" < N(47) < CJAT] < CJAFT. (12.263) 


Justifications 
— Par la proposition 12.112. 
— Parce que 4” € Mn, R) et la relation (12.262). 
— Par itération du lemme 11.61. 


Nous avons donc p(A) < C/"| A| pour tout m € IN. En prenant m — 00 et en tenant compte 
de C/" -; 1 nous trouvons p(À) < |A]. 


LEMooGBLJooCPvxN1 
Lemme 12.115 ([381]). 
Soit À € M(n,K) avec K = R ou C. Soit € > 0. Il existe une norme algébrique sur Mn, K) telle 
que 
N(A) < p(A) + €. (12.264) 


Démonstration. Soit par le lemme 12.100 une matrice inversible U telle que T = UAU-! soit 
triangulaire supérieure, avec les valeurs propres sur la diagonale. Notons que même si A € M{n,R), 
les matrices U et T sont, à priori, complexes. 

Soit s € R ainsi que les matrices 


D, = diag(1,5 1,5 2,...,s1 1) (12.265) 


et T, = D,TD,!. Nous fixerons un choix de s plus tard. 
La norme que nous considérons est : 


N(B) = |(P;U)B(DsU) 00 (12.266) 
où |.|x est la norme sur M(n, K) subordonnée à la norme |.|, sur K” dont nous avons déjà parlé 


dans l’exemple 11.54. Cela est bien une norme parce que 
— Nous avons |Bl, = 0 si et seulement si B = 0, et comme (D,U) est inversible, nous avons 
(D,U)B(D,U) ! = 0 si et seulement si B = 0. 
— N(AB) = |ANN(B). 


— Pour l'inégalité triangulaire : 


N(B +C)=|(D;U)B(D.U) ! + (D,.U)C(D,U) {lo (12.267a) 
< |(D,U)B(DU) {lo + |(DsU)C(DsU) {oo (12.267b) 
= N(B) + N(C). (12.267c) 


En ce qui concerne la matrice À elle-même, nous avons 
N(A) = H(DsU)A(DsU) "oo = |Tsllco: (12.268) 


C’est le moment de se demander comment se présente la matrice T,. En tenant compte du fait que 
(Dix = dis? nous avons 


=) DD = tee (12.269) 
kl 
La matrice T est encore triangulaire supérieure avec les valeurs propres de À sur la diagonale. Les 
éléments au-dessus de la diagonale sont tous multipliés par au moins s. Il est donc possible de 
choisir s suffisamment petit pour avoir 61 
nm 


DACPPES EQOOSTEL OT AE 


j=i+i 


61. Il me semble qu'il manque un module dans [381]. 
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Avec ce choix, la formule 11.163 donne 


N(T.) < max , (Ts hixl < € + p(A). (12.271) 
k 


En effet le € vient de la somme sur toute la ligne sauf la diagonale (c’est-à-dire la partie k £ à) et du 
choix (12.270) pour s. Le p(A) provient du dernier terme de la somme (le terme sur la diagonale) 
qui est une valeur propre de À, donc majorable par p(A). 

Nous devons encore prouver que N est une norme algébrique. Pour cela nous allons montrer 
qu’elle est subordonnée à la norme 


n: KR 


(12.272) 
vi [(UDi)vlc. 


Cela sera suffisant pour avoir une norme algébrique par le lemme 11.61. La norme n sur K” produit 
la norme suivante sur M(n, K) : 


n(B) I(UD;)Bvls 
= sup 
v£0 NV)  v£0 UDsvlx 


(12.273) 


Puisque UD, est inversible, nous pouvons effectuer le changement de variables v + (UD,) lv 
pour écrire 


I&D.)B(UD.) le |(D:)B(UD:) ‘lee F 
n(B) = sup = sup = [(UD,)B(UD, = N(B). 
(B) = (UD)UD:) le — 8 Ile RERO PRESSE A 
(12.274) 
PROPooYPLGooWKLbPA 


Proposition 12.116. 
Si AE M{n,R) alors p(A)" = p(A”) pour tout m € N. 


Démonstration. La matrice À peut être vue dans Mn, C) et nous pouvons lui appliquer le coro- 
laire 12.111 : EooJJIYo ; 
Spec(A*) = {XF tel que À e Spec(A)}. PRESS 


À noter qu’il n’y a pas de magie : le spectre de la matrice réelle A est déjà défini en voyant A 
comme matrice complexe. Le spectre dont il est question dans (12.275) est bien celui dont on parle 
dans la définition du rayon spectral. 

Nous avons ensuite : 


p(AF) = max{|A| tel que À e Spec(A*)} 
= max{|XË| tel que À € Spec(A)} 
= max{|A[f tel que À e Spec(A)} 
= p(A}*. 


PROPooXEQLooHvzVVm 
Proposition 12.117. 
Soient des espaces vectoriels normés V de dimension n et W de dimension m sur K (corps normél. 
Nous considérons une base {es}s=1...n de V et {fa}a=1,.m de W. 
Alors l’application 
vd: Min x m,K) — L(V,W) 


Y(A)v = D Asavs fa (12.277) 


est un isomorphisme d'espaces topologiques. 
Pour rappel, la topologie sur M(n, K) est donnée par la définition 10.33. 
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Démonstration. Nous savons déjà que Ÿ est une bijection. De plus, elle est linéaire et donc continue 
par la proposition 11.223. En ce qui concerne son inverse, c’est également une application linéaire 
(lemme 4.34) ; elle est alors également continue. 


PROPooDRHMooYzXbkl 
Proposition 12.118. 


Soit un espace vectoriel normé V de dimension finie. Soit une suite d'opérateurs T} € End(V). Si 


. End(V 
{e;} est une base de V et si Th(ei) nr e; pour tout 1, alors Ty nt) Id. 


Démonstration. Nous utilisons l’application d: M(n,K) — End(V) définie en 4.67. Elle nous 
permet d’écrire 


Ta(z) = D 4 (Tiutier, (12.278) 
pr 


que nous allons particulariser à x = e;. Nous avons 


ej= lim 1(8;) (12.279a) 
= Jim DU (Ti)môjier (12.279b) 
kl 
= D (lin 07 (Ti)k;)er (12.279c) 
k 


En identifiant les coefficients de e;, on trouve 


lim Y (Tn)kj = Ohy: (12.280) 


n—00 


Pour chaque k et 1, à gauche nous avons une limite dans K. Vue la topologie sur M(n, K) ?, nous 
pouvons écrire cela comme une limite dans M(n, K) : 


lim Ÿ !(T,) = 1. (12.281) 


n—00 


Nous savons que 47! est continue (proposition 12.117) de telle sorte que nous pouvons la commuter 
avec la limite : 
L= nd" (,)= lim Th). (12.282) 
n— 


n—00 


Appliquant maintenant 4 des deux côtés, (1) = Id et 


Id = lim 74. (12.283) 
n—>00 


Le point important de la définition 11.237 est la continuité. En dimension infinie, la continuité 
n’est par exemple pas équivalente à l’inversibilité (penser à ex — key). 

Si V est un espace vectoriel normé, nous avons déjà défini son dual topologique V’ comme 
étant l’ensemble des applications linéaires continues V — € ou V — R selon le corps de base de 
V. C'est la définition 4.125. 


Proposition 12.119. 
Soient un espace vectoriel normé V et un élément v € V vérifiant |v| = 1. Il existe une forme 
y € V' telle que |w| = 1 et g(v) = 1. 


Démonstration. Nous allons utiliser le théorème de la base incomplète 4.24. Pour cela nous consi- 
dérons 1 = V et la partie clairement génératrice G = {e; = i};er (si vous avez bien suivi, G = V en 
fait ; rien de bien profond). Nous considérons ensuite 19 = {v}. Le théorème de la base incomplète 
nous donne l’existence de J tel que Z0 € 15 € IT et tel que B = {e;}ier, est une base. 


62. Toutes les normes sur un espace vectoriel de dimension finie sont équivalentes (théorème 11.46). Sur M(n,K), 
nous avons convenu dans la définition 10.33 de considérer la norme maximum. 
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Tout cela pour dire que B = {e;}ier, est une base contenant v. Nous allons aussi éventuellement 
redéfinir la norme de e; pour avoir |e;| = 1. Cette renormalisation n’affecte pas le fait que v € B. 
Nous passons maintenant à la définition de 6: V — IK. Pour x € V nous commençons par 


écrire 
D (12.284) 
jeJ 
et nous posons 
p(x) = ni ne (12.285) 
O sinon. 


Cette définition a un sens par la partie unicité de la proposition 4.7 de décomposition d’un élément 
dans une base. 
Nous devons calculer la norme de @. Par la proposition 11.51(3) nous avons 


lel = sup [p(x)l. ÉRooËFLLopQRÉeT 


læ=1 


Avec x = v nous avons w(x) = 1 et donc |y| > 1. 
Nous devons encore montrer que |w| < 1. Un élément x € V s'écrit toujours sous la forme 


me) (12.287) 
ieJ 
pour un certain J fini dans J; et pour certains x; € K. Pour un tel x nous avons (x) = x. Si 
ly(x)| > 1, alors |x,| > 1, mais alors 


el < D Irsllesl = D 1x5l > Itol > 1, (12.288) 
jEJ jEJ 
ce qui fait que ce x ne participe pas au supremum (12.286). 
Notons que w est continue (et donc bien dans V”) parce qu’elle est bornée (proposition 11.62). 


12.11.2 Normes de matrices et d’applications linéaires 
THO0O0ONDQSooOUWQrK 


Théorème 12.120 (Norme matricielle et rayon spectral[382]). 
La norme 2 d’une matrice est liée au rayon spectral de la façon suivante : 


lAl2 = v?4 (12.289) 
ou plus généralement par | A|2 = 4/p(A*A). 
Lemme 12.121. 


Soit une matrice À € Mn, R) qui est symétrique, strictement définie positive. Soient \min €t Amax 
les plus petites et plus grandes valeurs propres. Alors 


LEMooNESTooVvUEOv 


. 1 
Ale = mar et ER : (12.290a) 
min 
Démonstration. Soient les vecteurs v1,...,v, formant une base orthonormée de vecteurs propres °° 
de À. Nous notons Unax Celui de max: Nous avons : 
Ale > [Avmar] = lAmazllUmar| = lAmarl = Âmaz- (12.291) 


Voilà l'inégalité dans un sens. Montrons l'inégalité dans l’autre sens. Soit x = Ÿ'; uv; avec |x|2 = 1. 


Alors 
ia Does Doi (12.292) 


En ce qui concerne l'affirmation pour la norme de A7, il suffit de remarquer que ses valeurs 


lAx| = 


propres sont les inverses des valeurs propres de À. 


63. Possible par le théorème spectral 9.221. 
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LEMooCSBVooZzqxqg 
Lemme 12.122 (|1, 383]). 
Soit une matrice diagonale D € M(n,C) dont nous notons À, € © les éléments diagonaux. Alors 
la norme opérateur? de D est donnée par 


|DI2 = max{}xi}. (12.293) 


Démonstration. En plusieurs points. 


(1) Le compact Puisque la partie {x € C” tel que |x|2 = 1} est compacte, nous pouvons uti- 
liser un maximum au lieu d’un supremum dans la définition de la norme opérateur (théorème 
de Weierstrass 7.138.). 


(2) Notations pour C” Pour se mettre d’accord sur les notations, si x e C”, alors x = ÿ vie; 
où e1 € Cest le vecteur (1,0,...,0). C’est un vecteur de base de C” comme espace vectoriel 
sur C. Et d’ailleurs {e;};-1,..n est une base orthonormée de C7”. 


(3) Norme dans C” Lorsque À est un opérateur sur C”, nous avons 


1/2 2\ 1/2 
|Aæ|2 = 5 (aan) = [SD Aus; (12.294) 
i i | 
Nous avons utilisé les conventions (4.89). 
(4) Le calcul Si c’est bon pour vous, je me lance dans le calcul : 
|D|2 = max |Dxl2 (12.295a) 
xlo=1 
nm 
= XiTi 12.295b 
ges (D) M 
” 1/2 
< max max |); r? = max |;|. (12.295c) 
BL À i=1 | 


=|æl2 


L'inégalité |D]2 < max; |À;] est prouvée. Nous démontrons à présent l’inégalité dans l’autre sens. 
Appliquons D au vecteur de base e; : De; = À;e;. Donc 


IDi2 > | Del = [Aie] = Al. (12.296) 


Cela étant valable pour tout , nous avons |D|2 > max; |X;|. 


PropMAQoKAg 
Proposition 12.123. 
La fonction 
f:M{n,R) x M(n,R)-R 


(X,Y) = Tr(X'Y) (12.297) 


est un produit scalaire sur M(n, R). 


Démonstration. Il faut vérifier la définition 9.164. 
— La bilinéarité est la linéarité de la trace. 
— La symétrie de f est le fait que Tr(At) = Tr(A). 


64. Norme opérateur, définition 11.51. La notation | D|2 signifie la norme opérateur de D: €? — €" où l’on a 
mis la norme euclidienne sur €”, c’est-à-dire la norme de la définition 10.107. 
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— L'application f est définie positive parce que si X € M{n,R), alors X!X est symétrique 
définie positive, donc diagonalisable avec des nombres positifs sur la diagonale. La trace étant 
un invariant de similitude, nous avons f(X, X) = Tr(X!X) > 0. De plus si Tr(X?X) = O, 
alors XX = 0 (pour la même raison de diagonalisation). Mais alors | Xu| = 0 pour tout 
ue E, ce qui signifie que X = 0. 


EXooHDCWooHragNA 
Exemple 12.124. 
Soient m = n, un point À dans R et T\ l'application linéaire définie par T\(x) = Àx. La norme de 
T\ est alors 
ITilc = sup JAxrr = [Al 


Icmm <1 
Notez que T\ n’est rien d’autre que l’homothétie de rapport À dans R?. PA 
EXooVXENooZbtBNi 
Exemple 12.125. 
Toutes les isométries de R’ ont norme 1. En effet si T est une isométrie, |Tx| = |x|. En ce qui 
concerne la norme de T nous avons alors 
T 
IT] = sup FRCIES sup lel _ L (12.298) 
zeR" |t|  zerr || 
A 
LEMooNWQWooBrpXgn 
Lemme 12.126. 
Soit be R"”. Nous considérons l’application 
T,:R7—-R 
? (12.299) 
CE EE 
(1) L'application T, est linéaire. 
(2) Sa norme est |Ti|L = |b]rm. 
Démonstration. La norme de 7, satisfait les inégalités suivantes 
ITc= sup lb:zxl< sup Jbirr|zirr < lb], 
Icllrem <1 tm <1 
b b|? 
le = su 16: lue > fe = De lélme, 
z|Rm<1 Ib] lb] 
donc |Ti|£ = |b|Rr. 
Proposition 12.127. 
Une application linéaire de R”" dans R" est continue. 
Démonstration. Soit x un point dans R’?. Nous devons vérifier l'égalité 
lim T(z+h) = T(x). (12.300) 


Cela revient à prouver que limp_,0,, T(h) = 0, parce que T(x + h) = T(x) + T(h). Nous pouvons 
toujours majorer |T(h)}\ par |T}c(mmmr)|hÎRm (lemme 11.59). Quand h s'approche de 0,, sa 
norme |hlm tend vers 0, ce que nous permet de conclure parce que nous savons que de toutes 
façons, |T|£ est fini. 


Note : dans un espace de dimension infinie, la linéarité ne suffit pas pour avoir la continuité : 
il faut de plus être borné (ce que sont toutes les applications linéaires R’? — R’). Voir la propo- 
sition 11.62. 
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PROPooHXJAooGaDtme 
Proposition 12.128 (|1|). 
Soit À € GL(n,C). La suite (AF);e7 est bornéeS si et seulement si À est diagonalisable®T et 
Spec(A) & S!. 


Démonstration. Nous commençons par supposer que À est diagonalisable et que Spec(A) € sf. 
Nous nommons À; ses valeurs propres. Par hypothèse À; e S!. Nous avons donc [À;| = 1 et, par la 
proposition 10.97(4), nous avons |À;[F = 1. 

La proposition 9.210 permet de considérer une matrice inversible Q telle que À = Q7!DQ où 
D est la matrice diagonale D;; = À;. Nous avons donc aussi 


AF = Q71DFQ. (12.301) 
La matrice DF est diagonale et DE = À. 


(1) Pour &>0 La norme matricielle étant une norme d’algèbre ‘, 
1AŸ]2 = 1Q7DFQI2 < 1Q 2] D 2 lQ Is. (12.302) 


En ce qui concerne la norme | D|2, nous avons le lemme 12.122 qui nous annonce que | D|2 = 
max;{|X;|} = 1. Dans notre cas, nous avons donc |D|2 = 1 et 


|A] < 1Q7°|2lQle: (12.303) 


Autrement dit, la suite (4*);en est majorée en norme par le nombre |Q-1|2|Q|2. 


(2) Pour k<0 Alors il suffit de poser B = Al. La matrice B est autant diagonalisable que 
A et le même raisonnement s’applique : il existe une matrice inversible P telle que 


1B°|2 < IP al Pa. (12.304) 


(3) Pour tous les 4 La suite (AF)zez est donc majorée par le maximum entre | P-1|2| P| et 


1Q7"|2l@l. 


Dans l’autre sens, maintenant. 


Puisque nous travaillons sur C, le polynôme caractéristique de À est scindé et la réduction de 
Jordan (° s'applique. Nous considérons une matrice inversible Q telle que À = Q7!MQ avec 
XMi+N 
M = Eu : (12.305) 
\l+N, 


où les N; sont nilpotents. Notez qu'ici les « 1 » sont de différentes tailles. 


(1) Juste un bloc Nous considérons un bloc de Jordan À1 + N. Nous supposons que la suite 
(A1 + NF est bornée, et nous allons montrer que [| = 1 et N = 0. 


Nous nommons s la borne, et r le plus petit entier tel que N’ = 0. En utilisant la formule 
du binôme ", pour # > r nous avons 


r—1 
GL+N) = ÿ () AFPENT & S (12.306) 


65. Oui, c'est avec ke Z. Vu que À est dans GL, elle est inversible, donc pas de soucis à considérer A7. 

66. Nous considérons sur GL(n, ©) la norme opérateur dérivant de la norme hermitienne sur C” donnée par la 
formule (10.155). 

67. Définition 9.209. 

68. Lemme 11.61. 

69. Théorème 9.289. 

70. Proposition 3.43. 
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Le lemme 9.207 indique que la partie {NF} est libre. En utilisant le lemme 7.159, nous en 


déduisons que 
(1) MINI) < 5 FAooZMConfa QT) 


En particulier, pour tout k nous pouvons considérer le terme ! = 0. Cela donne 


pour tout & > r et pour tout | < k. 


[A < 5 (12.308) 


qui implique |À| < 1. 
Nous avons donc deux possibilités : [A] < 1 et [A] = 1. Supposons |A] = 1, et considérons 
l'inéquation (12.307) avec { = 1 : |kXŸT IN] < 5. Cela implique que 


kIN| <s (12.309) 
pour tout k. Cela n’est possible que si |N| = 0 parce que R est archimédien (théorème 
1.423). Nous restons donc avec les deux possibilités 


— JA <T 

— [À =1et N =0. 
Nous nous tournons maintenant sur la contrainte que (A1 + N) doive rester borné pour 
k < 0. Nous avons 


X1+N =X(1+X IN), (12.310) 
et nous pouvons appliquer la proposition 9.208 à l'opérateur nilpotent —XA-1N pour avoir 
Le] 
G@-(-x IN) = SUN (12.311a) 
1=0 
00 
=1+3 (A) TN (12.311b) 
I=1 
r—1 
=1+3) (à) Ni (12.311c) 


Ceci pour dire que (A1 + N) 1 = À-!(1 + À IN’) pour une autre matrice nilpotente "! 
N' = æ (—)) IN 1. Le travail déjà fait, appliqué à À! et N/, nous donne deux possibilités : 
— [à <1 
— [A 1] =1et N'=0. 
La possibilité [A1] < 1 est exclue parce qu’elle impliquerait [A] > 1 qui avait déjà été exclu. 
Il ne reste donc que la possibilité |A] = 1 et N = N'=0. 


Pour la matrice M Nous supposons que {M} est borné : |MF| < s pour tout s. En 
utilisant le lemme 11.52 et la proposition 11.53, pour tout n et pour tout à nous avons : 


IC + AN] < s. (12.312) 
Nous appliquons ce que nous venons de montrer pour les blocs et nous obtenons |À;| = 1 et 
N; = 0. 
La matrice A Nous pouvons enfin parler de la matrice À = Q-1MQ. Nous avons AF — 


Q7!MQ, et donc aussi 
M = QAFQT"1. (12.313) 


En ce qui concerne la norme, si la suite (AF) est bornée par le réel s, alors 


IM*] = 1Q4*Q "| < 1Q1IQ TA < s1QNQ|. (12.314) 


71. Notez que la somme part de ! = 1, sinon ce serait raté pour la nilpotence de N’. 
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Donc la suite (M) est bornée et nous pouvons appliquer à MF ce que nous avons fait sur 


M. Nous avons donc 
A 


A=Q !MQ=Q "! “a Q (12.315) 
Às 


avec |À;| = 1. Nous avons prouvé que À est diagonalisable et que Spec(A) € S1. 


12.12 Géométrie dans l’espace 


12.129. 

Les notions de droites, plans et parallélisme sont des notions vectorielles qui auraient pu être 
traitées beaucoup plus haut. La chose qui rend la géométrie un peu piquante est la notion de 
perpendicularité. Cette notion demande un produit scalaire et fait intervenir ici et là des polynômes 
du second degré. Travailler avec le second degré demande la connaissance des racines carrés "? et 
donc d’un peu de topologie réelle et de continuité. La résolution dans IR du polynôme du second 
degré est la proposition 10.110. 


12.12.1 Droites dans l’espace 


La notion d'application affine entre espaces vectoriels est la définition 9.157. 
Une application affine n’est pas linéaire, mais presque au sens où des increments égaux dans le 
paramètre donne des increments égaux dans la valeur. 


LEMooËQEAooQaFCMW 
Lemme 12.130. 
Si f est affine alors pour tout a,b,v € V nous avons 
f(a+v) — f(a) = f(b+v) — f(b). (12.316) 
Démonstration. Simple calcul : 
f(a + vu) — f(a) = u(a + v) + a — u(a) — a = u(a) + u(v) — u(a) = u(v). (12.317) 
Le même calcul partant de f(b + v) donnera évidement aussi u(v). 
DEFooTQIFooKcloeY 


Définition 12.131. 
Soit un espace vectoriel E. 


(1) Une droite vectorielle dans E est un sous-espace vectoriel de dimension 1. 


(2) Une droite affine est une partie de E de la forme a+ V oùae E et V est un sous-espace 
vectoriel de dimension 1 de E. 


(3) Un plan vectoriel est un sous-espace vectoriel de dimension 2. 

(4) Une partie P est un plan affine si il existe un v € E tel que P — v soit un plan vectoriel. 
Le plus souvent, nous parlerons de « droite » et « plan » sans préciser « vectoriel » ou « affine ». 
Dans ces cas, le plus souvent, ce sera « affine ». 

Définition 12.132 (Perpendiculaires et parallèles). 
Deux notions importantes. 
(1) Nous disons que les droites a + V etb+W sont parallèles lorsque V = W. 


(2) Nous disons que les droites a + V etb + W sont perpendiculaires si pour tout v € V et 
wEW nous avons vu : w = 0. 


72. Définition 10.92. 
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Vous noterez que le parallélisme est une notion vectorielle alors que la perpendicularité dépend du 


produit scalaire ; c’est une notion comme qui dirait « métrique ». 
PROPooADJNooMyXUxG 


Proposition 12.133. 
Les propriétés usuelles. 


(1) Deux droites parallèles ayant une intersection sont confondues. 
(2) Le parallélisme est une relation d'équivalence sur l’ensemble des droites de E. 


(3) Si la droite di est parallèle à la droite d2, alors une droite est perpendiculaire à di si et 
seulement si elle est perpendiculaire à d2. 


LEMooRLFQooJADark 
Lemme 12.134. 
Deux droites perpendiculaires ont un unique point d’intersection. 
PROPooPWNWooYuyrOc 
Proposition 12.135. 
Soient une droite d et un point p. 
(1) Il existe une unique droite parallèle à d contenant p. 
(2) Il existe une unique droite perpendiculaire à d contenant p. 
LEMooQQFFooEZYeck 


Lemme 12.136. 
Si D est une droite et si a,bEe D, alors D — a = D — b et D — a est une droite vectorielle. 


Démonstration. Vu que D est une droite, il existe v € V tel que D — v soït une droite vectorielle 
que nous notons Z. Nous allons montrer que D — a = D — v. Comme a est arbitraire, cela suffit. 


(1) D—-ac D-—-v Un élément de D — a est de la forme x — a avec x € D. Nous écrivons x — a 
sous la forme y — v et nous espérons que y € D. Allons-y : d’abord nous isolons y dans 
T—a—=y—V: 


y=x-a+v=(r—-v)—(a—v) +v. (12.318a) 


Puisque x — v et a — v sont des éléments de L, la somme est dans L et donc y = [+ v pour un 
certain élément de { € L. Nous avons donc prouvé que y € D et donc que x—a = y—ve D—v. 


(2) D—vce D—a Nous notons x — v un élément générique de D — v (x € D). En posant 
y — a = x — v, nous trouvons 


y=r-v+a=z—-v+(a—v)+v (12.319) 
=, —2 


Donc ye Detr-v=y-aeD—a. 


PROPooNTHVooWWyaf J 
Proposition 12.137. 
L'image d’une droite par une application affine est une droite. 

LEMooRWASooOfwjdw 
Lemme 12.138. 
Soit un espace vectoriel V sur le corps K. ITEMooYQCIooUrhRuj 


(1) Si L est une droite vectorielle, alors pour tout a £ 0 dans L, nous avons L = Image(f) où f 
est l’application linéaire donnée par 


J:K—V 


12.320 
À Àa. 


73. Définition 9.157. 
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ITEMooZ1IGMooGruFMP 


(2) Si D est une droite, alors pour tout a Æ b sur D nous avons D = Image(f) où f est 


l’application affine donnée par 
f:K—V 


12.321 
Nerad ba) ) 


ITEMoo0UKJZooIHYDIKk 
(3) Une partie D € V est une droite (affine) si et seulement si il existe a,v € V tels que 


D = {a + Av}xex. (12.322) 


Démonstration. En deux parties. 
(1) Pour (1) Comme L est un sous-espace de dimension 1, il possède une base contenant un 
unique élément, disons {b}. En particulier a = ub pour un certain u € K. Si x € L nous avons 
x = À,b pour un certain À,, et donc 


T = —a. (12.323) 
mn 


Donc x = f(À,/1u). Cela prouve que L € Image(f). 
L’inclusion inverse est simplement le fait que Àa € L dès que a € L parce que L est vectoriel. 
(2) Pour (2) Le lemme 12.136 nous indique qu'il existe une droite vectorielle Z telle que 
D — x = L pour tout x € D. 
(2a) D € Image(g) Nous nommons f: K — V l'application linéaire qui donne L. Puisque 
b—ae L nous avons 
FO) = À(b— à), (12.324) 
et tout élément de L est de la forme f(À). Nous avons aussi D = L+a ; donc un élément 
de D est de la forme f(À) + a et donc de la forme À(b — a) + a = g(À). 


(2b) Image(g) € D Un élément de Image(g) est de la forme a + À(b — a) avec À € K. Mais 
b—ae€ L, donc À(b—-a)e Let 


g( =a+)(b-a)ea+L= D. (12.325) 


PROPooRSKLooVrxrFz 
Proposition 12.139. 


Si a et b sont deux points distincts de R”, alors il existe une unique droite contenant a et b. 
PROPooTFTJooJejuBU 


Proposition 12.140. 
Soient deux droites di et d> dans R". Alors nous sommes dans une des trois situations suivantes : 


(1) di [A do — S. 
(2) Card(di n d2) = 1 
(3) di = do. 


Exemple 12.141. 

Les exemples les plus courants d'applications affines sont les droites et les plans ne passant pas 

par l’origine. 

Les droites Une droite dans IR? (ou RŸ) qui ne passe pas par l’origine est l’image d’une fonction 
de la forme s(t) = ut + v, avec te R, et u et v dans IR? ou IR? selon le cas. 

En choisissant des coordonnées adéquates, les droites peuvent être aussi vues comme graphes 
de fonctions affines. Dans le cas de R?, on retrouve la fonction de l'exemple 4.32, pour 
n=m=l. 

Les plans De la même façon nous savons que tout plan qui ne passe pas par l’origine dans R° est 
le graphe d’une application affine, P(x, y) = (a, b)T + (x,y)! +(c, d)T, lorsque les coordonnées 
sont bien choisies. 

A 
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12.12.2 Projection orthogonale 


Le théorème suivant n’est pas indispensablissime parce qu’il est le même que le théorème de la 
projection sur les espaces de Hilbert *. Cependant la partie existence est plus simple en se limitant 


au cas de dimension finie. 
ThoWKwosrH 


Théorème-Définition 12.142 (Théorème de la projection). 
Soit E un espace vectoriel réel ou complexe de dimension finie, x € E, et C un sous-ensemble 
fermé convexe de E. 


(1) Les deux conditions suivantes sur y € E sont équivalentes : zZETSfYCSItemi 


(1a) (x — y] = inf{|x — z| tel que z e C}, 27ETSEYCSItemii 


(1b) pour tout ze C, Re<x — y,z — y) < 0. 


(2) I existe un unique y € E, noté y = proj(x) vérifiant ces conditions. 


Démonstration. Nous commençons par prouver l’existence et l’unicité d’un élément dans C' véri- 
fiant la première condition. Ensuite nous verrons l’équivalence. 


(1) Existence 
Soit # e C'et r = |x — |. La boule fermée B(x,r) est compacte ” et intersecte C. Vu que 
C'est fermé, l’ensemble ©” = CA B(x,r) est compact. Tous les points qui minimisent la 
distance entre x et C sont dans C’; la fonction 


C'—R 
(12.326) 
z2+ d(x,2) 
est continue sur un compact et donc a un minimum qu’elle atteint 6. Un point P réalisant 
ce minimum prouve l’existence d’un point vérifiant la première condition. 


(2) Unicité Soient y1 et y2, deux éléments de C minimisant la distance avec x, et soit d ce 
minimum. Nous avons par l'identité du parallélogramme (11.3) que 


Yi + Y2 — X 


2 
à + 2|y1 — x? + 2] yo — xf? < —Ad + 2d + 2d = 0. (12.327) 


ip 1 


Par conséquent y1 = y. 


RS 
Co 
a 


(1a)= (1b) SoitzeCette ]0,1[; nous notons P = proj, x. Vu que y et P sont dans C 
et que C'est convexe !?, le point z = ty + (1 —t)P est également dans ©, et par conséquent, 


x — Pl? <æz—tz-(1—#4P{ = |(x— P) -t(2-— P)f. (12.328) 


Nous sommes dans un cas |a|? < |a — b|?, qui implique 2 ReÇa, b) < |b|?. Dans notre cas, 
2Re(x — P,t(z— P})< |z— P|?. (12.329) 
En divisant par t et en faisant { — 0 nous trouvons l'inégalité demandée À : 


2Re(x — P,z2- P)< 0. (12.330) 


TR 
Æ 
nr 


(1b)= (1a) 
Soit un point P e C vérifiant 
Rex — P,z2-— PS<0 (12.331) 


74. Théorème 25.7 

75. C’est ceci qui ne marche plus en dimension infinie. 

76. Théorème 10.54. 

77. Définition 7.146. 

78. Ici nous utilisons la proposition 12.38, et c’est une des choses qui font que cette partie sur la « géométrie 
élémentaire » demande en réalité d’être placée après déjà une partie de l’analyse réelle. 
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pour tout z € C. Alors en notant a=x—-Petb= P —2, 
lz— 2 =lx-P+P- 2 = 1|a+0f 
= |a|? + 1b|? + 2Re<a, b) 
= al? + bp} —2Rex — P,2-— P) 


> ||”, 


(12.332) 


ce qu'il fallait. 


PROPooHGGIooïlssaTA 
Proposition 12.143. 
Soient une droite d dans R? ainsi qu’un point p. La projection” proj,(p) est le point d’intersec- 
tion entre d et la perpendiculaire à d passant par p. 


Démonstration. Nous considérons la droite d = {a + Av}xer et un point p € IR°. Nous notons 
xæ(À) = a + Àv le point courant dans d. Conformément à la définition 12.142 de la projection 
orthogonale, nous allons minimiser la distance |p — x(À)| par rapport à À. 

Puisque |p — x(À)| est toujours positif, nous pouvons chercher à minimiser le carré : 


lp x = pl? —2p + a — 2Ap : v + al? + [Auf + 22 : v. (12.333) 


Quitte à minimiser ça par rapport à À, nous pouvons oublier les termes ne contenant pas À. Nous 
posons donc 

FO) = [ol 2x? + 2(a — p) + vÀ (12.334) 

Comme le coefficient de À? est positif, la proposition 10.110 nous dit que cette fonction aura 


un minimum (et non un maximum). La valeur Ào pour laquelle f est minimal se découvre grâce à 
10.110(2) : 


= __— s (12.335) 
Cela est la valeur de À pour laquelle 
proja(p) = æ(à0); (12.336) 
nous avons donc 
æ(Ao) = a é D y, (12.337) 
Nous devons voir maintenant que (p — æ(0)) - vu = 0. Il suffit d’un peu déballer : 


(p—æ(o)) :v=p'v-a:v+ ep ll =p.v-a-v+(a-pl:v—0. (12.338) 


LEMooGUVMooPXtXnV 
Lemme 12.144. 


Soit vi € R°. Il existe des vecteurs va et v3 tels que les v; sont deux à deux perpendiculaires. 


Démonstration. Nous considérons w # v dans R° et nous profitons de la proposition 11.34 pour 
poser vo = vi x w. Enfin nous définissons v3 = vi X v2. 


LEMooGXGCooDfgbqG 
Lemme 12.145. 
Soient trois éléments v1, vo, vs € IR? deux à deux perpendiculaires. Six L v1, alors x € Span{v, v3}. 


Démonstration. Il faut se rappeler de la proposition 11.14 qui fait de {v1,v2,v3} une partie libre. 
Elle est donc une base par la proposition 4.18(2). 

Soit x L vi. Nous le décomposons dans la base {v1, 02, u3} : & = Ajui + Aou + Asus. En prenant 
le produit scalaire par v1, et en tenant compte du fait que v1 : va = v2 * v3 = 0 nous trouvons 
0 = 1 : x = Xlfu|?. Donc M = 0 et x e Span{w, vs}. 

79. Définition 12.142. 
80. Lemme 12.134. 
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12.12.3 Plan médiateur 
PROPooSNUDooTxovMz 


Proposition 12.146 (plan médiateur|[1]). 
Soient un espace euclidien V ainsi que deux points distincts a, b E V. Sim = (a+b)/2, nous avons 


{x eV tel quex -mlb—-a}={xe V tel que |x — al = |x — b|}. (12.339) 


Dans le cas de V = RŸ, alors cet ensemble est un plan®! 
Ce plan est le plan médiateur du segment [a, b]. 


Démonstration. Nous notons 


= {x € V tel que x — m L b— a}, (12.340a) 

= {x € V tel que [x — a] = |x — b|}. (12.340b) 

(1) MEN Soit x e M. Nous avons (ska VorefdcoitiyBeg nous pouvons utiliser Pythagore 
11.22 dans les triangles xbm et xma : 

x — al? = |x — ml]? + |a — m|? (12.341a) 

le — 0? = [x — mf? + |m — bf?. (12.341b) 

Vu que m est le milieu, nous avons a—m = m—b et donc |a—m| = |m—b|. Nous voyons donc 

que les membres de droites des deux équations (12.341) sont égaux. Donc |x — a? = |x—b|?. 

Comme une norme est toujours positive, les carrés peuvent être simplifiés : |x — a] = }x—b||. 


Donc x € N. 


(2) NE M Soitxe N. Nous posons h = proj{y)(x), la projection de x sur la droite (ab). La 
proposition 12.143 nous dit que h est l’unique point de (ab) tel que x — h L b— a. 
Le théorème de Pythagore 11.22 dans le triangle ahx donne 


Ix — af? = fa — A? + |x — À? (12.342) 
et dans le triangle bhæx il donne : 

lb — x]? = |b— h]? + 1h — |? (12.343) 
Lx — b|? et donc 


la — À] = |b— Al. (12.344) 


Par hypothèse nous avons ||r — a|? = 


Nous cherchons à présent quel(s) point(s) h de la droite (ab) vérifie(nt) cette condition, et 
nous espérons que ce sera (a + b)/2. 

Nous cherchons À sous la forme À = a+A(b—a). D'une part nous avons |a—h|? = | A(b—a)|? = 
X21b — a|?, et d'autre part 


lb— A? =1b—-a—2A(b— af? = 11-16 — af” (12.345) 

Nous en déduisons que |A] = |1 — À]. Cela laisse deux possibilités : la première est À = 1 — À 
qui donne À = 1/2 et la seconde est À = —(1 — À) qui est impossible. Donc À = 1/2 et 

ha teste (12.346) 


Donc en posant m = (a + b)/2 nous avons bien b— a L x —-m 

C’est un plan Nous nous mettons maintenant dans le cas où V est l’espace R° muni de 
sa norme usuelle. Posons f1 = b — a et considérons deux vecteurs f2, f3 tels que les f; soient 
deux à deux perpendiculaires (lemme 12.144). 


RS 
Co 
nr 


Nous allons prouver que M = Span{ fo, f3} + m. 


(3a) Une inclusion Si x € Span(f2, f3) + m, alors x = a f2 + Bf3 + m et nous avons bien 
z—-mlLib—a. 


(3b) L’autre inclusion Soit x € M. Donc x — m L b — a. Le lemme 12.145 nous indique 
alors que x — m € Span{f2, f3}, ce qu’il fallait. 


81. Définition 12.131. 
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12.12.4 Tétraèdre 
DEFooMUUMooFVxKyb 


Définition 12.147 (|1]). 

Un tétraèdre régulier est un ensemble de 4 points À, B, C et D de R? deux à deux équidistants. 
Nous allons nommer {a;} les segments entre les points, {d;} les droites sur ces segments, et 

{s;} les sommets. 


Lemme 12.148. 
Un tétraèdre régulier existe. 


Démonstration. Prenez un triangle équilatéral ABC dans le plan (.,.,0), et prenez ensuite un point 
D à la verticale du centre, placé à la bonne hauteur pour que les longueurs |AD|, |BD| et |CD| 


soient égales à | AB||. 


LEMooNWELooZeSEMN 
Lemme 12.149. 


Si T est un tétraèdre régulier, nous avons d; NT = a;. 
LEMooUSKVooQJiBuz 


Lemme 12.150. 
Les droites {d;};=1,..6 ne sont pas confondues ni parallèles. 


Démonstration. Si trois points À, B, C' sont alignés, il n’est pas possible d’avoir | AB| = | AC | = 
|BC!|. Donc il n’y a pas deux droites parmi les {d;} qui sont confondues. 

Supposons que deux des droites AB et CD sont parallèles. En particulier, les points À, B, C 
et D sont dans un même plan : le plan À + Span{B — A,C — A}. Il n’est pas possible d’avoir 4 
points dans un plan, tous équidistants deux à deux. 


Dans la suite, quand nous parlerons du « tétraèdre », nous parlerons de ses six points et six 


segments les joignant. L'ensemble T & R? ne contient pas les surfaces et les volumes. 
LEMooJCMKoo0jMqtw 


Lemme 12.151. 
Soit un tétraèdre régulier T. Un point de R? est un sommet si et seulement si il est l'intersection 
de deux des droites {d;} différentes. 


Démonstration. En deux parties. 


(1) Sens direct 
Par définition les sommets sont les points À, B, C, D; et les droites d; sont les droites (AB), 
(AC), (AD), (BC), (DB) et (CD). Donc oui, les sommets sont à des intersections de ces 
droites. 


(2) Sens inverse Soit un point X € R° à l'intersection entre deux des d;. Nous avons déjà vu 

dans le lemme 12.150 que ces droites ne sont ni parallèles ni confondues. Donc elles ont au 
plus un point d’intersection. Voyons les couples possibles de droites. 
On à une série de possibilités comme (AB) n(AC'). Dans ce cas, l'intersection entre ces deux 
droits est À qui est un des sommets. Ensuite nous avons une série de possibilités comme 
(AB) n (CD). Ces deux droites n’ont pas d’intersection parce que si elles en avaient, les 
points À, B, C'et D seraient dans le même plan, ce qui est impossible. Donc deux droites d; 
ont soit, pas d’intersection, soit, une intersection qui est un sommet. 


12.13 Géométrie dans le plan 

LEMooYIHXooEwmlPo 
Lemme 12.152 (Équation de droite). 
Si D est une droite®? dans R?, alors D est d’une des deux formes suivantes : 


82. Définition 12.131, mais c’est surtout la caractérisation du lemme 12.138(3) que nous devons avoir en tête. 
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— Soit il existe a € R tel que 
D = {(x,y) € R? tel que x = a}, (12.347) 
— soit il existe a, BE R tels que 
D = {(x,y) € R? tel que y = ax + B}. (12.348) 


Le premier cas correspond aux droites verticales. 


Démonstration. Nous prenons une droite D et une application affine f donnée par (12.138)(3). Il 
y a deux possibilités : soit b — a est un multiple de €», sois pas. 


(1) Sib—a=ue2 Alors f(À) = a + Aue2. Nous avons alors 


D = {a + X@}ier a. 
= {)e2 + ae} cf. justif. ns ASEATE SI 
= {(a1, A)}1eR (12.349c) 
= {(x,y) € R?° tel que x = a}. (12.349d) 

Justifications. 


— Pour 12.349b. Parce que a2e2 + Àe2 prend toutes les valeurs de la forme Àe>. 


(2) Sinon Nous avons 


__fai+A(b—a) 
JO) = e  . (12.350) 
En posant a = (b— a)2/(b — a)1 et 5 = —aai + a2, nous avons bien 
F()2 = af(X)1 + 8. (12.351) 
PROPooUFKXooARiQZK 


Proposition 12.153. 
Si D est une droite dans R?, il existe une application affine f: R? — R telle que 


D={xeR? tel que f(x) = 0}. (12.352) 


Nous disons qu’une telle application affine est une application associée à D. 


Si f est une application affine quelle que f(x) = 0 donne la droite D, alors pour tout réel non 
nul À, l'application affine Àf donnent également D. Il n’y a donc pas d’unicité. 


Définition 12.154. 
Soit une application affine f : R? — R. Nous appelons demi-plans associés à f les parties 


HŸ = {xe R? tel que f(x) > 0} (12.353) 
el 
H; ={re R? tel que f(x) < 0}. (12.354) 
LEMooEZEDooSDbrkq 
Lemme 12.155 (|1]). 
84 


Les demi-plans sont convexes®*. 


83. Définition 9.157. 
84. Définition 7.146. 
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Démonstration. Soit une applications affine f : IR? — IR ainsi que a,b € IR? tels que f(a) > 0 et 
f() > 0. Vu que f est affine, il existe une application linéaire /: R? — R ainsi que a e R tels que 
f(x) = {(x) + a pour tout x. 

Nous considérons 


:R—R 
L (12.355) 
tr a+t(b— a). 
Nous devons prouver que (f o y)(t) > 0 pour tout te [0,1]. 
Nous avons (f o y)(0) > 0 et . o y)(1) > 0. Nous avons d’abord 
(fo = l(a+t(b—a)) +a (12.356a) 
= [(a) + F1 )— tl(a) + (12.356b) 


= (1—+){(a) + H(b) + ta + (1—t)a (12.356c) 
te t)f(a ) + tf(b ). SUBEGOoLZTP A AUERS 


Les nombres f(a) et f(b) sont strictement positifs. Les nombres (1 —t) et t sont positifs, mais ne 
s’annulent pas en même temps. Donc dans (12.356d), au moins un des deux termes est strictement 
positifs tandis que l’autre est positif ou nul. Bref, (f o y)(t) > 0. 

Cela prouve que le demi-plan f(x) > 0 est convexe. Le même raisonnement tient pour le 
demi-plan f(x) < 0 


LEMooXLNZooFyqPxG 
Lemme 12.156 ([1]). 
Si f,g: R? — R sont affines et si ker(f) = ker(g), alors 


(H},H7}={Ht, Ho}. (12.357) 


Démonstration. Il existe un a € R? tel que f(a) > 0. En effet f(x) = {(x) + à où L: R? — R est 
linéaire et à € R. Il suffit de prendre x tel que [(x) < —a. Soit a € IR? tel que f(a) > 0. Il y a 
deux possibilités : g(a) > 0 ou g(a) < 0 parce que g(a) = 0 n’est pas possible du fait que f et g 
s’annulent aux mêmes points. 
(1) Si g(a) >0 Nous allons prouver qu’alors HŸ = H} et H; = H,.Soitbe HŸ. Nous 
savons que HŸ est convexe (lemme 12.155), de telle sorte que f([a,b]) > 0. En particulier f 


ne s’annule pas sur le segment [a,b], et g non plus. Autrement dit, la fonction 
s: [0,1] — R 
El (12.358) 
tr g((1—t)a + tb) 


ne s’annule pas. Vu que s(0) = g(a) > 0, le théorème des valeurs intermédiaires ** nous 


indique que g(b) = s(1) > 0. Donc be H. 
Nous avons prouvé que HŸ (en HF . En inversant les rôles de f et g nous prouvons que 
H ”i (en HŸ. 


(2) Si g(a) <0 Il se prouve de même que HŸ = H, et H; =H,. 


PROPooSIANOOTOK1BI 
Proposition 12.157. 
Si f: R? —R est une application affine non constante, alors ker(f) est une droite °° 


Démonstration. Posons f(x) = [(x) + a où L: R? — R est linéaire et a € R. 

Commençons avec a = 0. Considérons a € ker(f) et prouvons que ker(f) = {Aa}1er. D'abord 
fa) = Ia) = Aa) = 0. Donc {Aa}jier € ker(f). D'autre part si f(x) = 0 alors que x n’est pas 
de la forme Aa. Dans ce cas, {x, a} forment une base de IR? et nous concluons que ker(f) = IR?, ce 
qui est contraire à l'hypothèse comme quoi f # 0. 

Nous ne supposons plus que « = 0. Soit a € IR? tel que {(a) = —a. Nous allons prouver que 
ker(f) = a + ker(l). 


85. Théorème 10.89. 
86. La caractérisation 12.138(3) est plus pratique que la définition. 
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(1) a+ ker(!) € ker(f) Soit ze ker({). Nous avons f(a +2) = {(a) +{(2)+a=-a+0+a=0. 
Donc a + z € ker(f). 


(2) ker(f) € a + ker({) . Soit b € ker(f). Nous prouvons que b — a € ker({). Nous avons 0 = 
f(b) = {(b) + à et donc {(b) = —a. Donc 


L(b— a) = 1(b) — I(a) = —-a + a = 0. (12.359) 

parce que {(a) = —a. 
La conclusion est que ker(f) = a + ker({). La première partie ayant déjà montré que ker({) est une 
droite, nous avons fini. [] 
LEMooTOUUooJbpLVB 


Lemme 12.158 ([1, 160]). 
Soit une fonction affine f: IR? — R. Soient a,b € IR? tels que f(a), f(b) # 0. 


ITEMooXLCFooQiDCrR 
(1) L'intersection [a, b] n ker(f) contient 0 ou 1 point. ITEMoOMORGooTzNefp 
(2) Si [a,b] n ker(f) = @ alors f(a) et f(b) ont même signe. ITEMooDWIQooXnoMIT 


(3) Si [a,b] n ker(f) Æ © alors f(a) et f(b) sont de signe opposés. 


Démonstration. Point par point. 


(1) Pour (1) Nous savons que ker(f) est une droite (proposition 12.157). Vu que f(a) # 0, 
l’unique droite passant par a et b (proposition 12.139) n’est pas la droite ker(f). Donc 
parmi les trois possibilités de la proposition 12.139, nous sommes forcément dans le cas 
où l'intersection est vide ou réduite à un unique point. 


(2) Pour (2) Nous supposons que ker(f) n [a,b] = @. Considérons la fonction 


5: [0,1] —R 


tr f((1—t)a + tb). VE 


La fonction s est continue et ne s’annule pas parce que les points (1 — t)a + tb sont ceux de 
[a,b]. Si s(0) et s(1) étaient de signe différents, le théorème des valeurs intermédiaires 10.89 
donnerait un to € ]0,1[ tel que s(to) = 0. Donc s(0) et s(1) ont le même signe. 


(3) Pour (3) Nous prouvons la contraposée. Supposons que f(a) et f(b) aient le même signe 
(strict), et disons que f(a), f(b) > 0 pour fixer les idées. Cela signifie que a et b sont dans le 
demi-plan HE Par convexité de ce dernier (lemme 12.155), nous avons f(x) > 0 pour tout 
x E [ab]. 


LEMooBWFSooBkIcOg 
Lemme 12.159 ([1]). 
Soient une application affine f. Soient a € ker(f) et v e IR? tels que? ker(f) = {a + Av}\em. Soit 


un vecteur non nul w € R? non parallèle à v. ITEMooYDYPooRzupcO 
(1) {v,w} est une base de R?. ITEMooHKVWooLAEMTm 
(2) Nous considérons l'application 
:R°—R 
F (12.361) 
À0 + uw + li. 
Alors l’application 
:R°—R 
4 (12.362) 
ti p(x— a) 
est affine. ITEMooGRZGooMFQP jM 


(3) Les demi-plans de f et de g sont les mêmes. 


87. Si on en croit la proposition 12.157, ça existe parce que le noyau d’une application affine est une droite. 
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Démonstration. Point par point. 


(1) Pour (1) Les vecteurs v et w ne sont pas colinéaire et forment donc une base par le lemme 
4.9(1). 


(2) Pour (2) L'application p est linéaire. Nous avons 


g(x) = p(x — a) = p(x) — p(a). (12.363) 


L'application g est donc bien affine. 


(3) Pour (3) Les applications f et g sont affines. Si x € ker(g), alors p(x — a) = O0, c’est-à-dire 
que x — a = Àv et donc x = Àv + a € ker(f). Donc ker(g) € ker(f). De même nous trouvons 
que ker(f) € ker(g). 


Deux applications affines ayant le même noyau ont les mêmes demi-plans par le lemme 12.156. 


LEMooURPNooYRsual 
Lemme 12.160 (|[1]). 
Soit une application affine f ainsi qu’une application continue g: R? — R telles que ker(f) = 
ker(g). Supposons l'existence de a, be R? tels que g(a) > 0 et g(b) < 0. 


Alors les demi-plans de f sont les parties {x tel que g(x) > 0} et {x tel que g(x) < 0}. 
PROPooTPHKooXnpJaV 


Proposition 12.161 (|1]). 
Soit une droite d dans R? et une chemin dérivable y: R — R?. Nous supposons que (to) € d et 
que (to) est non nul et non parallèle à d. 

Alors il existe 8 tel que pour tout € < Ô, (to + €) est dans un demi-plan de d et (to — €) est 
dans l’autre demi-plan de d. 


Démonstration. Posons a = (to). Nous considérons un vecteur b1 € R? tel que d = {a + Abi}\cem, 
ainsi que b2 tel que {b1,b2} soit une base de IR?. 
Tout élément de R? peut être écrit de façon unique sous la forme 


x = à + X101 + xobo. (12.364) 
Cela nous donne des fonctions continues 0;: R — R telles que 
y(t) = @ + o1(t)b1 + o2(t)bo, (12.365) 


et que 
VE) = 0 (t)b1 + o5(t)b2. (12.366) 


Vu que Y/(to) n’est pas parallèle à la droite d, nous avons 0/(to) £ 0. De plus (to) = a, de telle 
sorte que o1(to) = o2(to) = 0. 

Que dites-vous ? La fonction dérivable 02: R — IR vaut zéro en to et sa dérivée y est non nulle ? 
Supposons pour fixer les idées que o,(to) > 0. Il existe donc un € > 0 tel que o2 est strictement 
positive sur [to — €, to[ et strictement négative sur to, to + €]. 

En vertu du lemme 12.159, les points de 7 tels que o2 > 0 sont dans un demi-plan de d et les 
points de y avec o2 < 0 sont dans l’autre demi-plan. 


THOooFMMLooLmAnAd 
Théorème 12.162 (Théorème de Thalès[384]). 
Soient trois points À, B, C non alignés dans R?. Soient D € (AB) et E e (AC). Nous supposons 
que (DE) est parallèle à BC. 
Alors 
(1) 
ID A] |E-— AI |E-D] 
IB— A) CA] ]C-B] 


(12.367) 


(2) I existe une homothétie D: IR? — IR? centrée en A telle que O(B) = D et p(C) = E. 
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THOo00GFTWooACQLFJ 
Théorème 12.163 (Théorème de Thalès dans le cercle[385]). 
Soient des points O, À, B, C dans R? tels que 


(1) |A—-O|-1B-0|-1C-0o1. 
(2) À, O et B sont alignés. 
Alors le triangle ABC est rectangle en C. 


12.14 Dérivée : exemples introductifs 


12.14.1 La vitesse 


Lorsqu'un mobile se déplace à une vitesse variable, nous obtenons la vitesse instantanée en 
calculant une vitesse moyenne sur des intervalles de plus en plus petits. Si le mobile a un mouvement 
donné par æ(t), la vitesse moyenne entre { = 2 et { = 5 sera 


2(5)— (2) 


Uroy(2 > 5) = 59 


Plus généralement, la vitesse moyenne entre 2 et 2 + At est donnée par 


x(2 + At) — (2) 


Umoy(2 — 2 + At) = À 


Cela est une fonction de At. Oui, mais rappellons qu’on a dans l’idée de calculer une vitesse 
instantanée, c’est-à-dire de voir ce que vaut la vitesse moyenne sur un intervalle très très très très 
petit. La notion de limite semble toute indiquée pour décrire mathématiquement l’idée physique de 
vitesse instantanée. 

Nous allons dire que la vitesse instantanée d’un mobile est la limite quand At tend vers zéro 
de sa vitesse moyenne sur l'intervalle de temps At, ou en formule : 


r(to) — z(to + At) Eqvinskiimi te 


At—0 At ‘ 


12.14.2 La tangente à une courbe 


Passons maintenant à tout autre chose, mais toujours dans l’utilisation de la notion de limite 
pour résoudre des problèmes intéressants. Comment trouver l'équation de la tangente à la courbe 
y = f(x) au point (x0, f(xo)) ? 

Essayons de trouver la tangente au point P donné de la courbe donnée à la figure 12.1. 


À 


FIGURE 12.1: Comment trouver la tangente à la courbe agrpoitangentequestion 


La tangente est la droite qui touche la courbe en un seul point sans la traverser. Afin de la 
construire, nous allons dessiner des droites qui touchent la courbe en P et un autre point Q, et 
nous allons voir ce qu’il se passe quand Q est très proche de P. Cela donnera une droite qui, 
certes, touchera la courbe en deux points, mais en deux points tellement proches que c’est comme 
si c'étaient les mêmes. On sent que la notion de limite va encore intervenir. 
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D$------------- 


FIGURE 12.2: Traçons d’abord une corde entre le point P et un point @aurneamustiigtai 


Nous avons placé le point, sur la figure 12.2, le point P en a et le point Q un peu plus loin, en 
æ. En d’autres termes leurs coordonnées sont 


P=— (ua) Q = (&, f(x)). (12.369) 


En regardant par exemple la figure 12.2, le coefficient directeur de la droite qui passe par ces deux 
points est donné par 


f(x) — f(a) 


T—a 


(12.370) 


et bang! Encore le même rapport que celui qu’on avait trouvé à l’équation (12.368) en parlant 
de vitesses. En regardant la figure 12.3, on constate réellement qu’en faisant tendre x vers a, on 
obtient la tangente. 


(a) Pas très bon (b) ...de mieux en mieux ... 


À À 


Q2 6 


(c) ...de mieux en mieux (d) ...presque parfait 


FIGURE 12.3: Recherche de la tangente par approximations syg6estiy8$esSubFigures 


7 LabelFigLesSubFiguresssLabelSubFigLesSubFiguneslFigLes 


7 LabelFigLesSubFiguressbLabelSubFigLesSubFigüretæ1Figles 
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12.14.3 L’aire en dessous d’une courbe 
SubSecAirePrimIinto 


Encore un exemple. Nous voudrions bien pouvoir calculer l’aire en dessous d’une courbe. Nous 
notons S}(x) l’aire en dessous de la fonction f entre l’abscisse 0 et x, c’est-à-dire l’aire bleue de la 
figure 12.4. 


à f(x) 
NN | 
K | 
T'x+Ax 


FIGURE 12.4: L’aire en dessous d’une courbe. Le rectangle rouge d’aire f(x) Ax approxime l’aug- 
mentation de l’aire lorsqu'on passe de x à x + Ax. LabelFigNOCGooYRHLCn 


Si la fonction f est continue et que Àx est assez petit, la fonction ne varie pas beaucoup entre x 
et æ + Ax. L'augmentation de surface entre x et x + Ax peut donc être approximée par le rectangle 
de surface f(x) Az. Ce que nous avons donc, c’est que quand Ax est très petit, 


Sy(x + Az) — S;(x) = f(x) Az, (12.371) 


c’est-à-dire 
(12.372) 


Donc, la fonction f est la dérivée de la fonction qui représente l’aire en dessous de f. Calculer des 
surfaces revient donc au travail inverse de calculer des dérivées. 

Nous avons déjà vu que calculer la dérivée d’une fonction n’est pas très compliqué. Aussi 
étonnant que cela puisse paraitre, il se fait que le processus inverse est très compliqué : il est en 
général extrêmement difficile (et même souvent impossible) de trouver une fonction dont la dérivée 
est une fonction donnée. 

Une fonction dont la dérivée est la fonction f s'appelle une primitive de f, et la fonction qui 
donne l’aire en dessous de la fonction f entre l’abscisse 0 et x est notée 


se [ | f(bat. (12.373) 


Nous pouvons nous demander si, pour une fonction f donnée, il existe une ou plusieurs primitives, 
c’est-à-dire si il existe une ou plusieurs fonctions F telles que F” = f. La réponse viendra par le 
corolaire 12.202. 


12.15 Dérivation de fonctions réelles 
seccontetderiv 


On considère dans la suite une fonction f : À — R, où a € A € R; cependant, les notions 
de continuité et de dérivabilité se généralisent immédiatement au cas de fonctions à valeurs vec- 
torielles ; la notion de continuité se généralise au cas des fonctions à plusieurs variables (la notion 


de dérivabilité est remplacée par celle de différentiabilité dans ce cadre). 
DEFoo0UYFZooFWmcAB 


Définition 12.164. 
La fonction f est dérivable en a si a € Int À et si 


km S) — Fa) 


Ta  T—aQ 
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existe. On note alors cette quantité f'(a), c’est le nombre dérivé de f en a. La fonction dérivée 
de f est 
f: AR 
ar f’(a) 


définie sur l’ensemble noté A' des points a où f est dérivable. 


(12.374) 


Exemple 12.165. 
Montrons que la fonction f :R —R:x1 x est continue et dérivable. Exceptionnellement (bien 
qu’on sache que la dérivabilité implique la continuité), montrons ces deux assertions séparément. 


Continuité Pour prouver la continuité au point a € IR nous devons montrer que 


Lx =" (12.375) 
LT—a 
c’est-à-dire 
Ve> 0,8 >0:VreR|r-a <ô—=[rx-al<e (12.376) 


ce qui est clair en prenant 0 = €. 


Dérivabilité Soit a € R. Calculons la limite du quotient différentiel 


Jim = = limi=1 (12.377) 
T—a T— a T—a 
2Æ£a tÆa 


ce qui prouve que f est dérivable et que sa dérivée vaut 1 en tout point a de R. 


On a donc montré que la fonction x + x est continue, dérivable, et que sa dérivée vaut 1 en 


tout point a de son domaine. 


Fa 
PropSFyxOWF 


Proposition 12.166. 
Une fonction dérivable sur un intervalle est continue sur cet intervalle. 


Démonstration. Soit I un intervalle sur lequel la fonction f est dérivable, et soit xo € 1. Nous 
allons prouver la continuité de f en x. Le fait que la limite 


hi = 
f(œ0) = tim 20 + À) — Fo) (12.378) 
h—0 h 
existe implique a fortiori que 
lim f(xo + h) = f(x) = 0. (12.379) 
Cela signifie la continuité de f en vertu du critère 12.56. 
TH0Oo0FFOZooCYGets 


Théorème 12.167. 
Toute fonction dérivable en un point est continue en ce point. 


Démonstration. Soient f : R — R et a € R. Nous supposons que f n’est pas continue en a et nous 
allons en déduire qu’elle n’est pas non plus dérivable en a. Pour cela nous considérons le lien entre 
limite et continuité donné dans le théorème 12.56. Nier que f est continue en a revient à dire qu’il 
existe un voisinage V de f(a) tel que 


Vr > 0, Je < r tel que f(a + €) é V. (12.380) 
Si B(f(a), R) c VS, et sir = 1/n, nous construisons une suite €, — 0 telle que 


[f(a+en) — f(a) > ER. (12.381) 


Avec cela nous avons : 
A D à PO ES (12.382) 
En En 


Donc la fonction f ne peut pas être dérivable en a. 


88. Existence par la définition de la topologie métrique 7.109. 
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Remarque 12.168. 

La réciproque du théorème précédent n’est pas vraie : il existe bien des fonctions qui sont continues 
en un point æo, mais qui ne sont pas dérivables en +0. La fonction valeur absolue, x + |x|, par 
exemple est continue sur tout IR mais elle n’est pas dérivable en 0. 


Si f est une fonction dérivable, il peut arriver que la fonction dérivée f’ soit elle-même dérivable. 
Dans ce cas nous notons f” ou f(2) la dérivée de la fonction f’. Cette fonction f” est la dérivée 
seconde de f. Elle peut encore être dérivable: dans ce cas nous notons f) sa dérivée, et ainsi de 
suite. Nous définissons f() = (f(-1)) la dérivée n° de f. Nous posons évidemment f(0 = f. 


12.15.1 Exemples 


Exemple 12.169. 
Commençons par la fonction f(x) = x. Dans ce cas nous avons 


f(æ) — f{a) __x—a 


T—Q T—a 


= 1. (12.383) 


La dérivée est donc 1. VAN 


Proposition 12.170. 
La dérivé de la fonction x + x vaut 1, en notations compactes : (x)! = 1. 


Démonstration. D’après la définition de la dérivée, si f(x) = x, nous avons 


f(&) = lim PLOES lim ei: (12.384) 
E— € € 0 € 


et c’est déjà fini. 


12.15.1.1 La fonction carré 


Prenons ensuite f(x) = x?. En utilisant le produit remarquable (x? — a?) = (x — a)(x + a) nous 


trouvons 
J(x) — f(a) 


=t+a. (12.385) 
z—a 


Lorsque x — a, cela devient 2a. Nous avons par conséquent 


F2, (12.386) 
LemDeccCarr 
Lemme 12.171. 
Si f(x) = x?, alors f'(x) = 2x. 


Démonstration. Utilisons la définition, et remplaçons f par sa valeur : 


Î(x+e) — f(x) 


Fo lim - (12.387a) 
2.2 
= lim (EE (12.387b) 
e— € 
Fe, 2,2 
 — (12.387c) 
e—0 € 
2 
= lim ACER) (12.387d) 
e— € 
= lim(2x +e) (12.387e) 
— 2, (12.387f) 


ce qu'il fallait prouver. 
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12.15.1.2 La fonction racine carré 


Considérons maintenant la fonction f(x) = 4/x. Nous avons 


f(x) — f(a) _ vr- va 


de 
G—a)(Va+ va) 
1 


Vx + Va 
Lorsque x — a, nous obtenons 


(12.389) 


Notons que la dérivée de f(x) = 4/x n'existe pas en x = 0. En effet elle serait donnée par le 
quotient 


l 
= lim Ve lim (12.390) 
Mais si x devient très petit, la dernière fraction tend vers l'infini. 


12.15.2 Interprétation géométrique de la dérivée : tangente 


Considérons le graphe de la fonction f sur 1, c’est-à-dire l’ensemble 


{Cr f()) tel que x € IF (12.391) 
Le nombre 
f@) Jo (12.392) 


est la pente de la droite qui joint les points Le; f(x)) et (a, f(a)), voir la figure 12.5. 


ne 

I 

1 

I 

1 

1 
e 
a 


FIGURE 12.5: Le coefficient directeur de la corde entre a étabe1FigGWOYooRxHKSm 


Étant donné que f'(a) est le coefficient directeur de la tangente au point (a, f(a)), l'équation 


de la tangente est = 
y — f{a) = Fa)(x — a). AFS) 
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12.15.3 Interprétation géométrique de la dérivée : approximation affine 


Le fait que la fonction f soit dérivable au point a € I signifie que 


in Sa) — #(a) 


Ta  T—Q 


= £ (12.394) 


pour un certain nombre £. Cela peut être réécrit sous la forme 


(x) — f(a) 


lim = 0, (12.395) 
Ta  T—a 
ou encore j 
fn =) 1e) (12.396) 
za æ—a 
Introduisons la fonction ’ ” 
at = ACT fo 2 (12.397) 


Cette fonction est faite exprès pour que 


sde f(x) — f(a) — L(x — de Fqinternsgxaags 


T—Q 


par conséquent lim,_,, @(x — a) = 0. Nous récrivons l'équation (12.398) sous la forme 
EqCodeD i 
f(x) — fa) — L(x — a) = (x — a)a(x — à). ESS See) 


Le second membre tend vers zéro lorsque x tend vers a avec une « vitesse au carré » : c’est le 
produit de deux facteurs tous deux tendant vers zéro. Si x n’est pas très loin de à, il n’est donc 
pas une mauvaise approximation de dire 


f(x) — f(a) — (x — a) = 0, (12.400) 


c’est-à-dire 


f(a) = f{a) + f'(a)(x — a). F3 400) 


Nous avons retrouvé l'équation (12.393). La manipulation que nous venons de faire revient donc à 
dire que la fonction f, au voisinage de a, est bien approximée par sa tangente. 
L'équation (12.401) peut être aussi écrite sous la forme 


f(x + Az) = f(x) + f'(x)Ax FarxaxSined at 


qui est une approximation d'autant meilleure que Ax est petit. 


12.15.4 Développement limité au premier ordre 


Si une fonction est dérivable en a alors elle peut être approximée « au premier ordre » par une 
formule simple qui sera généralisée pour des dérivées d'ordre supérieurs avec les séries de Taylor, 


théorème 12.455. Pour trouver des versions avec des dérivations partielles, voir le thème 54. 
PropUTenzfQ 


Proposition 12.172 (Développement limité au premier ordre). 
Si f: R —R est une fonction dérivable, alors il existe une fonction a: IR — R telle que 


f{a+ h) = fa) + hf/(a) + ah) FGOoHBDHog Er UD 
et 7 
lim = 0. (12.404) 
H'esisté dussi ane fonction Be R +12 telle ie 
fa + h) = f(a) + hf(a) + hB(R) FAO EMA AT 


telle que limp_,0 B(h) = 0. 
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Démonstration. La fonction f étant dérivable en a nous avons l’existence de la limite suivante : 


f'(a) = lim AU + = } (12.406) 
ce qui revient à dire qu’en définissant la fonction £ par 
f'(a) = RSR B(h) (12.407) 


h 


alors B(h) — 0 lorsque À — 0. En réduisant au même dénominateur, et en multipliant par h, nous 
avons la formule (12.405). 
En nommant a(h) = h5(h) nous trouvons la fonction a de la formule (12.403) : 


f(a+h) = f(a) + hf'(a) + a(h) (12.408) 
avec a(h) 
lim Ed Jim B(h) = 0. (12.409) 


12.16 Règles de calcul 


D'abord une dérivée facile, qui sera utile pour démontrer la formule de dérivation d’un quotient. 


Lemme 12.173. 
Nous avons : 


CG) = 5. (12.410) 


El x_(r+e _ 
. L A - _. 1e _ _. L z(x : €) CERN 


Nous trouvons le résultat en passant à la limite et en tenant compte de la proposition 12.12 sur la 
limite d’un quotient. 


PROPooOUZUooEcYKxn 
Proposition 12.174 ([386, 387, 388]). 
Nous avons les règles suivantes. ITEMOoTFNPooYngHnD 
(1) Si f,g: R — KR sont dérivables en a € R, alors f + g est dérivable en a et 
(f + g) (a) = f'(a) + g'(a). (12.412) 
ITEMooTPLRooOUZXqMg 
(2) Sif:R—R est dérivable en ae R et si ER, alors (X\f) est dérivable en a et 
(Xf)'(a) = Af'(a). (12.413) 
ITEMooMQERooBCqnvsS 
(3) Si f,g: R —R sont dérivables en a € R, alors fg est dérivable en a et 
(fg)'(a) = f’(a)g(a) + f(a)g'(a). (12.414) 
Cette formule est appelée règle de Leibnitz**. ITEMooLYZCooVUPTyh 


(4) Soient deux intervalles T, J dans R. Soient des fonctions f: 1 — J et g: J — R. Soit encore 
ae I. Si f est dérivable en a et si g est dérivable en f(a), alors go f est dérivable en a et 


(go fY(a) = g'(f(a)) f'(a). (12.415) 


89. Pour des formes plus générales, voir la proposition 30.11 et le lemme 30.13. 
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ITEMooMUNQooLiKffz 


(5) Soient f,g: 1 — R des fonctions sur un intervalle ouvert I. Soit a € I; supposons que 
g(a) # 0. Alors la fonction À est dérivable en a et 


g 
f\',, _ F'(a)g(a) — f(a)g/(a) 
(£) (a) | (12.416) 


En particulier, la dérivation est une opération linéaire sur l’espace des fonctions infiniment déri- 
vables. 


Démonstration. Point par point. 
(1) Pour (1) Soit e > 0. Nous avons 
(f+gla+e)—(f+g)(a) _ f(a+e)— fa), gate) — g(a) 


+ : (12.417) 
€ € € 


Par hypothèse, les deux termes de droïte ont une limite lorsque € — 0. Donc le membre de 
gauche a une limite qui vaut la somme des deux limites %, c'est-à-dire f’(a) + g/(a). 


(2) Pour (2) Écrivons la définition de la dérivée avec (Af) au lieu de f, et calculons un petit 
peu : 


(AP) (x) = lim , (12.418a) 
= Hi AU — fa) (12.418b) 
= lim ia 9 — fa) (12.418c) 
= À lim Jœ+ 9 — f&) (12.418d) 
= hf(x). (12.418e) 

(3) Pour (3), règle de Leïbnitz La définition de la dérivée dit que 
(fa)'(e) = 1m 6 +996 +9) = Fa)ae) Fafgrinegpatez 


e—0 È 


La subtilité est d'ajouter au numérateur la quantité — f(x)g(x + €) + f(x)g(x + €), ce qui est 
permis parce que cette quantité est nulle °!. Le numérateur de (12.419) devient donc 


f(x +e)g(x +e) — f(x)a(x + e) + f(x)g(x + e) — f(x)g(x 


= g(x +e)(f(x +0) — f(x)) + f(x) (ax + à — g(x)), (12.420) 


où nous avons effectué deux mises en évidence. Etant donné que nous avons deux termes, 
nous pouvons couper la limite en deux : 


(fg)"(æ) = Tim g(x + 1e + 9 fa) | lim ff +940) .. 
— lim g(x + €) lim fw+ 9 — QG) + f(x) Tim se ©: 


où nous avons utilisé le théorème 12.15 pour scinder la première limite en deux, ainsi que la 
propriété (12.25) pour sortir le f(x) de la limite dans le second terme. Maintenant, dans le 


90. Limite de sommes, proposition 12.5(1). 
91. Nous avons déjà fait le coup d’ajouter et enlever la même chose durant la démonstration du théorème 12.15. 
C’est une technique assez courante en analyse. 
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premier terme, nous avons évidemment *? lime _,0 g(x +e) = g(x). Les limites qui restent sont 
les définitions classiques des dérivées de f et g au point x : 


(F9) (x) = gx) f(x) + f(x)g'(x), (12.422) 


ce qu'il fallait démontrer. 


Pour (4) Nous posons b = f(a) et nous considérons la fonction suivante : 


u: J—R 
g(y) — g(b) . 
JU) 7 F0) 25 (12.423) 
y + u(y) = y — b oe 
g'(b) si y = 


Vu que g est dérivable en b, la seconde ligne existe et u est continue en y = b = f(a). C’est 
la définition de la dérivée. 
Mais f est continue en a, donc u o f est également continue en a, et nous avons 


lim (u o f(x) = u(f(a)) = u(b) = g/(b). (12.424) 


En réécrivant la définition de u en f(x), l'expression suivante est une fonction continue de 


L g(f()) - 90 
u(f(x)) = on Loire (12.495) 
g'(b) si y = 
Si f(x) £ b nous avons : 
g(f(a)) — (6) = u(f(x)) (f(x) 0). FRERE 26) 


Si par contre f(x) = b, en réalité, l'égalité (12.426) est encore valable parce qu’elle se résume 
à 0 = 0. Nous divisons par x — a et nous avons l'égalité 


g(f(x)) — g(f(a)) | 


T—Q T—Q 


(12.427) 


qui est valable sur 7\{a}. 


Il ne s’agit pas maintenant de prendre la limite x — a des deux côtés, parce que la limite 
du membre de gauche est précisément ce que ce théorème s’efforce de prouver exister. Nous 
montrons que la limite du membre de gauche existe en montrant que celle de droite existe. 


D'une part, u o f est continue et 


lim u(f(x)) = u(f(a)) = u(b) = g'(b). (12.428) 


Ta 


D'autre part, f est dérivable en a, donc 


in = AE) f'(a). (12.429) 


a  T—a 


Tout cela pour dire qu’à droite, la limite existe et vaut g/(b) f'(a). Donc nous avons l’existence 
de la limite que nous définissons (go f)'(a), et la valeur 


…, gU(æ)) — 4 (a) 


za T—& 


= g'(f(a)) f'(a). (12.430) 


Le résultat est prouvé. 


92. Pas tout à fait évidemment : selon le théorème 12.56, limite et continuité, il faut que g soit continue. 
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(5) Pour (5) Nous considérons la fonction 


À: R\{0} — KR 
1 (12.431) 
Te —. 
% 
La fonction g est dérivable en a, la fonction à est dérivable en g(a). Donc par le théorème de 
dérivation des fonctions composées *, la fonction 4 o g est dérivable en a et 


(io g)'(a) = à’ (g(a))g'(a) = — = (12.432) 


Pour le quotient, nous utilisons la formule de la dérivée du produit sur Î(x) = j\&) a pour 
dire que f/g est dérivable en a et 


A à 1\', fl) f(og(e)_ f'(og(e) - f(og(a) 
(£) 0 +10 ( ) (a) ( 


ce qu'il fallait démontrer. 


Remarque 12.175. 

Nous ne pouvons pas dire que la dérivée est une opération linéaire sur l’espace des fonctions déri- 
vables. Certes la proposition 12.174 implique entre autres que l’ensemble des fonctions dérivables 
est un espace vectoriel. Mais la dérivée d’une fonction dérivable n’est pas spécialement dérivable. 


Remarque 12.176. 

La formule (1/u)! = —u//u? ne peut pas être vue comme un cas particulier de (u®*) = au! 
(proposition 12.445) parce que cette formule est utilisée dans la démonstration de la formule 
générale. 


Pour les fonctions à valeurs dans R”, nous posons la définition suivante. 
DEFooNEPUooWOMpyu 
Définition 12.177. 
Soit une fonction f : R — IR" dont les composantes f;: R — IR sont dérivables. Nous définissons 
la fonction f! par 


f(x) =», fi(æ)es, (12.434) 
i 
c’est-à-dire une dérivation composante par composante. 


Cette définition est celle pour une fonction IR — R”, et elle est facile. Très différente est la 
situation d’une fonction R'° — R dans laquelle il faudra introduire la notion de différentielle °{. 


LEMooXHVBooHYjXdq 
Lemme 12.178. 
Soit une fonction dérivable f : IR — IR. Nous posons 
:R—R 
EL (12.435) 
tr f(a + Àt) 
où a € R. Alors g est dérivable et g'(0) = Af'(a). 
Démonstration. Nous devons prouver que la limite 
— g(0 
lim g(e) — 9(0) (12.436) 
e— € 


93. Proposition 12.174(4). 
94. Ce sera pour la définition 11.226. 
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existe et vaut Àf'(a). Nous y allons avec les accroissements finis 12.172 : 
g(e) — g(0) = f(a + Àe) — f(a) = f(a) + Aef(a) — f(a) = Aef(a). (12.437) 
Le quotient différentiel devient donc 


g(e) — g(0) _ Aef(a) | 


= - Aa). (12.438) 


Il n’y a donc pas de problème à passer à la limite et nous avons g/(0) = f'(a). 


Par rapport à la dérivation, les produits scalaire et vectoriel vérifient une règle de Leibnitz. 


PROPooFKKHooQZGXhE 
Proposition 12.179. 
Soit I un intervalle de R. Si u et v sont dans C\(1,R*), alors 
TU | v() _ (Ce) | v(+) * (u(e) | v'(#) EqFormLeibProdscalV 
: 62.189) 


at x v(t)) = (u/(t) x u(t)) + (ut) x v'(#)). 


Démonstration. Nous considérons des fonctions dérivables f,g: IR — IR, et nous posons g(f) = 
f(t) : g(t). En ce qui concerne la dérivée de la fonction f : g: R — R, nous devons étudier la 
limite 

ft+e) - g(t+e) — f(6) : 9) FNoo RERO aan 


€—0 € e—0 € 


La fonction f étant dérivable, la proposition 12.172 nous donne une fonction a: IR — R* telle que 


f(t+e) = f(t) + ef'(t) + ea(e) (12.441) 
et lime_,0 a(e) = 0. En substituant cela dans le numérateur de (12.440) nous calculons un peu : DA 
SE +9 » gt +e) — JU » ge) = (FU + eJ'(0 + cale) : (tt) + eg (E) + cB(E)) (12442) 
— f(t) - g(t) (12.442b) 
= Ef(t) : g'(t) +ef(8) : B(9) (12.442c) 
+ef"(0 : 9) + FE - d'O + F0 : 8) (12.442) 
+ ea(e) - g(t) + a(eje? + g/(t) + 2 a(e) - B(e). (12.442e) 
En divisant cela par € et en prenant la limite € — 0, il nous reste 
FC) : 9 + FC) : 90). (12.443) 
12.16.1 Dérivée de la réciproque 
PropMRBooXnnDLq 


Proposition 12.180 ([389]). 
Soit f: I — J une fonction bijective, continue et dérivable*®. Soient xo € I et yo — f(xo). Si 
f'(xo) # 0 alors la fonction réciproque f—} est dérivable en yo et sa dérivée est donnée par 


Yu) = RooxG IA 


95. Définition 12.164. 
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Démonstration. Pour rappel, une fonction dérivable est toujours continue (proposition 12.166). 
Prouvons que f_! est dérivable au point b = f(a) € J. Étant donné que f est dérivable en a, 


nous avons  … f(x) - f(a) FaJEMOpSSQUES 


Ta T—a 


Par ailleurs, étant donnée la continuité de f—! donnée par la proposition 12.54(4), nous avons 
lim fl b+e) = f 1 (b) = a. (12.446) 
Nous pouvons donc remplacer dans (12.445) tous les x par f-!(b + e) et prendre la limite € — 0 


au lieu de x — a : 
FU Mb ES) = fe) 


f'(a) lim f1(b + €) 2 
Lun Pt f(a) 
0 f(b+e) — f7"() 
: € 
_ ue f-1(0 +6 — f-1(b) (12.447) 
1 
7 Jim so +9 
: 1 
AURIU) 


Nous avons utilisé le fait que f(a) = b et a = f-!(b). 
EXooGKPNooZtmJen 


Exemple 12.181 (difféomorphisme entre R et un ouvert borné). 
Nous cherchons à construire une application dérivable et d’inverse dérivable entre R (en entier) et 
un ouvert borné de R. Il serait tentant de prendre l’application arc tangente 


TT 
arctan: R— |-2,2| 
2 2L, (12.448) 


xt arctan(x) 


mais elle ne sera définie que dans le théorème 18.38. 


Nous posons 
f{a) = k +1 sixz<l EQoo0SPIopANzReS 


1 _ 
_. si x > 1. 


Cette fonction est continue en x = 1 : il suffit de calculer les deux valeurs. En ce qui concerne la 
dérivabilité en x = 1, nous devons étudier 


(12.450) 


La limite à gauche est égale à la dérivée de x + 2 + — 


la dérivée de x + 1/x en x = 1. Dans les deux cas nous trouvons —1. 


en x = let la limite à droite est égale à 


Nous voyons vite que cette fonction est strictement décroissante ; et un calcul de limite nous 
dit qu’il s’agit d’une bijection dérivable 


f:R— 10,21. (12.451) 
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La proposition 12.180 s’applique et la bijection réciproque est également dérivable (donc continue 
aussi). A 


ii Avertissement /question à la lectrice !! 12.182 

Si vous connaissez un autre exemple, plus simple, de difféomorphisme f : R — ]|a,b[, faites-le moi 
savoir. Ne pas utiliser d’exponentielle (vous pensiez à bricoler quelque chose à partir de la primitive 
deze ?) ni de fonctions trigonométriques. 


Exemple 12.183. 

Nous aimerions donner le logarithme comme exemple, mais l’exponentielle ne sera définie que 
dans longtemps, à partir des séries entières. Allez voir l'exemple 15.91 pour le logarithme comme 
réciproque de l’exponentielle. A 


12.16.2 Dérivée de fonction composée 
PROPooDONLooWthqgRR 


Proposition 12.184 ([390]). 
Soient des intervalles I et J dans R ainsi que des fonctions f: 1 — R et g: J — KR tels que 
g(J) € I. Soit ae J. Nous supposons que f est dérivable en g(a) et g est dérivable en a. 

Alors f o g est dérivable en a et 


(fo g)'(a) = F'(g(a))g'(a). (12.452) 


Démonstration. Nous considérons la formule des accroissements finis sous la forme (12.405). Pour 
la fonction g, nous écrivons 


g(a + €) = g(a) + eg'(a) + ea(e) (12.453) 


avec @(e) — 0. Et de même pour f(g(a)) : 


f(g(a + e)) = f(g(a) + eg'(a) + ea(e)) (12.454a) 
— f{g(a)) + (eg'(a) + ea(e)) f'(g(a)) + eB(eg'(a) + ea(e)) (12.454b) 


avec B(e) — 0. Nous avons donc, pour € assez petit pour que tout reste dans 7 et J Fe que 


(fog)(a+e) — (fo g)(a) 


€ 


= (g'(a) + a(e)) f'(g(a)) + B(eg'(a) + ea(e)). (12.455) 
En ce qui concerne la limite € — 0, nous avons entre autres, 


lim 8(eg'(a) + ea(e)) = 0, (12.456) 


et donc bien (f o g)'(a) = g'(a)f'(g(a)). 


12.16.3 Dérivée de fonction périodique 
DEFooHUZAooYyBmwe 


Définition 12.185. 
Une fonction f : R — R est périodique si il existe T>0€R tel que 


FT) = JE) (12.457) 


pour tout x E R. Un tel T est une période de f. Nous disons que T est la période de f si il est le 
minimum vérifiant la propriété. 

LEMoo0GFGooCnTD 0 
Lemme 12.186 ([1]). 
Si f est une fonction périodique de période T', alors toutes les périodes sont de la forme KkT' avec 
k e N*. 


96. Et c’est là qu’on utilise la continuité de f et g garantie par la proposition 12.166. 
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Démonstration. Considérons une période t. Nous avons t{ > T' par hypothèse. Si t n’est pas un 
multiple de 7’, la division euclidienne 1.215 permet d'écrire t = kT° + l avec ! < T. Nous avons 
alors, pour tout x € R : 


f(x) = fe +1) = fc +RkT +1) = f(x +. (12.458) 


Donc !/ est une période de f. Cela n’est pas possible parce que T' est la plus petite. 
LEMooHWQYooXcNLts 


Lemme 12.187. 
Si f:R — R est périodique et si T est une période de f, alors f' est périodique et T en est une 
période. 


Démonstration. Soit a € R. Par hypothèse f est dérivable en a et les limites qui suivent existent : 


f(a+T+e)— f(a+T) _Limzate fa) 


€ e—0 € 


f(a+T) = lim = f'(a). (12.459) 


Nous avons utilisé la condition de périodicité en a eten a+e. 


12.17 Dérivation et croissance 


Supposons une fonction dont la dérivée est positive. Étant donné que la courbe est « collée » 
à ses tangentes, tant que les tangentes montent, la fonction monte. Or, une tangente qui monte 
correspond à une dérivée positive, parce que la dérivée est le coefficient directeur de la tangente. 

Ce résultat très intuitif peut être prouvé rigoureusement. C’est la tache à laquelle nous allons 


nous atteler maintenant. 
PropGFkZMwD 


Proposition 12.188. 
Si f et f! sont des fonctions continues sur l'intervalle [a, b] et si f” est strictement positive sur 
[a,b], alors f est strictement croissante sur [a b]. 

De la même manière, si f' est strictement négative sur [a,b], alors f est strictement décrois- 
sante sur [a, b]. 


Démonstration. Nous n’allons prouver que la première partie. La seconde partie se prouve en 
considérant — f et en invoquant alors la première *’. Prenons x1 et x2 dans [a, b] tels que x1 < x2. 
Par hypothèse, pour tout x dans [11,2], nous avons 


file) = tm 6 + 9) = Se) 


€—0 € 


> 0. (12.460) 


Maintenant, la proposition 12.14 dit que quand une limite est positive, alors la fonction dans la 
limite est positive sur un voisinage. En appliquant cette proposition à la fonction 
f@+e) — f(x) 


r(e) = - : (12.461) 


dont la limite en zéro est positive, nous trouvons que r(€) > 0 pour tout € pas trop éloigné de zéro. 
En particulier, il existe un 8 > 0 tel que € < Ô implique r(e) > 0; pour un tel €, nous avons donc 


f(x+e) — f(x) 


€ 


r(e) = 


> 0. (12.462) 


Étant donné que € > 0, nous avons que f(x + €) — f(x) > 0, c’est-à-dire que f est strictement 
croissante entre x et t +e. 

Jusqu'ici, nous avons prouvé que la fonction f était strictement croissante dans un voisinage 
autour de chaque point de [a, b]. Cela n’est cependant pas encore tout à fait suffisant pour conclure. 
Ce que nous voudrions faire, c’est de prendre un voisinage |a,m1| autour de a sur lequel f est 


97. Méditer cela. 
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croissante. Donc, f(m1) > f(a). Ensuite, on prend un voisinage |m1,m2[ de m1 sur lequel f est 
croissante. De ce fait, f(m2) > f(m1) > f(a). Et ainsi de suite, nous voulons construire des ma, 
ma... jusqu'à arriver en b. Hélas, rien ne dit que ce processus va fonctionner. Il faut trouver une 
subtilité. Le problème est que les voisinages sur lesquels la fonction est croissante sont peut-être 
de plus en plus petits, de telle sorte à ce qu'il faille une infinité d’étapes avant d’arriver à bon port 
(en b). 

Heureusement, nous pouvons drastiquement réduire le nombre d’étapes en nous souvenant du 
théorème de Borel-Lebesgue 10.19. Nous notons par ©,, un ouvert autour de x tel que f soit 
strictement croissante sur ©,. Un tel voisinage existe. Cela fait une infinité d’ouverts tels que 


la,ë= (] ©. (12.463) 
x€[a,b] 


Ce que le théorème dit, c’est qu’on peut en choisir un nombre fini qui recouvre encore [a, b]. Soient 


Ox,..., Or, }, les heureux élus, que nous supposons pris dans l’ordre : æ1 < 2 < ... < x,. Nous 
1 n 
avons 
nm 
[ao] (Ji: (12.464) 
i=1 


Quitte à les rajouter à la collection, nous supposons que z1 = a et que æn = b. Maintenant nous 
allons choisir encore un sous-ensemble de cette collection d'ouverts. On pose A1 = ©,,. Nous 
savons que À: intersecte au moins un des autres O,,. Cette affirmation vient du fait que [a, b] est 
connexe (proposition 10.52), et que si O,, n’intersectait personne, alors 


On et [JO (12.465) 
i=2 


forment une partition de [a, b] en deux ouverts disjoints, ce qui n’est pas possible parce que [a, b] 
est connexe. Nous nommons 42, un des ouverts O,, qui intersecte A1. Disons que c’est ©. Notons 
que À1 L À: est un intervalle sur lequel f est strictement croissante. En effet, si y12 est dans 
l'intersection, f(a) < f(y12) parce que f est strictement croissante sur A1, et pour tout + > y12 
dans 4), f(x) > f(y12) parce que f est strictement croissante dans 42. 

Maintenant, nous éliminons de la liste des O,, tous ceux qui sont inclus dans A1 L 42. Dans ce 
qu’il reste, il y en a automatiquement un qui intersecte 4; L 42, pour la même raison de connexité 
que celle invoquée plus haut. Nous appelons cet ouvert 43, et pour la même raison qu'avant, f est 
strictement croissante sur A1 L A2 LU 43. 

En recommençant suffisamment de fois, nous finissons par devoir prendre un des ©,, qui 
contient b, parce qu’au moins un des O©,, contient b. À ce moment, nous avons fini la démons- 
tration. 


PROPooKZPZooWjIsWg 
Proposition 12.189 (Dérivée et croissance). 
Soit un intervalle I € R. Une fonction dérivable f : 1 — R est 
(1) Si f > 0 sur I, alors f est strictement croissante sur I. 
(2) Si f > 0 sur I, alors f est croissante sur I. 
(3) Si f' <0 sur I, alors f est strictement décroissante sur I. 


(4) Si f' <0 sur T, alors f est décroissante sur I. 
PROPooSGTBooFxUuXxK 
Proposition 12.190 ([391]). 
Soient des intervalles I et J dans R. Soit f : 1 — J une fonction dérivable et strictement monotone. 


Si f’ ne s’annule pas sur T alors ITEMooFXHYooRNHYPI 
(1) la fonction f est injective de I vers J, ITEMooWPPIooDUAYSH 


(2) la fonction f-! est dérivable sur J, ITEMooTVMLooQgiLEB 


Cp) 1 Rose 


(3) et nous avons la formule 
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Démonstration. Nous supposons que f est strictement croissante sur J. Les adaptations à faire en 
cas de fonction strictement décroissante sont laissées au lecteur. En plusieurs points. 


(1) Pour (1) Une fonction strictement croissante est injective. 
(2) Pour (2) Vu que f’ ne s’annule pas, la la proposition 12.180 dit que f_! est dérivable. 
(3) Pour (3) Formule 12.444. 


12.191. 
Très souvent on préfère retenir la formule 


(Go) = 7x F — EqiAopBRENSx 


Elle est très simple à retrouver : il suffit d’écrire 


f Co)=x (12.468) 


puis de dériver les deux côtés par rapport à x en utilisant la règle de dérivation des fonctions 
composées de la proposition 12.184 : 


(YF G@))f'(æ) = 1. (12.469) 


12.17.1 Théorèmes de Rolle et des accroissements finis 
ThoRolle 


Théorème 12.192 (Théorème de Rolle[392, 393]). 
Soit f, une fonction continue sur [a,b] et dérivable sur |a,b[. Si f(a) = f(b), alors il existe un 
point c €]a, b[ tel que f'(c) = 0. 


Démonstration. Étant donné que [a,b] est un intervalle compact, l’image de [a,b] par f est un 
intervalle compact, soit [m, M] (théorème 7.211). Si m = M, alors le théorème est évident : c’est 
que la fonction est constante, et la dérivée est par conséquent nulle. Supposons que M > f(a) (il 
se peut que M = f(a), mais alors si f n’est pas constante, il faut avoir m < f(a) et le reste de la 
preuve peut être adaptée). 

Comme M est dans l’image de [a,b] par f, il existe c €la, b] tel que f(c) = M. Considérons 
maintenant la fonction 

f(c+æ)— f(c) 


Tr) = (12.470) 
œ 
Par définition, lim,_,0 T(x) = f'(c). Par hypothèse, si u < €, 
T(u— c) fu Jo > 0 (12.471) 


parce que u—c<0et f(u) — f(c) < 0. Par conséquent, lim,_,0 r(x) > 0. Nous avons aussi, pour 
ve, 


< 0 (12.472) 


V—C 


parce que v—c > Oet f(v)—f(c) < 0. Par conséquent, limz_,0 T(x) < 0. Mettant les deux ensemble, 
nous avons f’(c) = lim,s_,0 r(x) = 0, et c est le point que nous cherchions. 


Voici une généralisation du théorème de Rolle, dans le cas où nous n’aurions pas deux points 
sur lesquels la fonction est identique, mais deux points en lesquels la limite de la fonction est 
identique. Typiquement, lorsque les points en question sont +00. 
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THOooXDTBooFeSZok 
Théorème 12.193 (Généralisation du théorème de Rolle[392]). 
Soient —0 < a < b < +00. Soit une fonction dérivable f : ]a,b[ — R telle que 
lim f(x) = lim f(x) = 4 (12.473) 


Ta æ—b 
avec LE R. Alors il existe x € Ja, b[ tel que f'(x) = 0. 


Démonstration. Soit un difféomorphisme Ÿ strictement croissant 4: IR — ]a, [. Pour cela vous 
pouvez bricoler à partir de l’exemple 12.181. Mais n’utilisez pas la fonction arc tangente, parce 
qu’elle n’est définie qu’au théorème 18.38. 

Nous posons à = ga), b = y(b) et 


= pofow !: là, b[ — Ja, S. (12.474) 


Cela est une fonction dérivable et continue sur [à, b] en posant g(à) = g(b) = (4). 
Donc il existe & € ]à,b[ tel que g/(&) = 0. En posant c = 7 !(&) nous avons c € Ja, b[ et, en 
utilisant de nombreuses fois la règle de dérivation des fonctions composées 12.174(4), 


fo) = F'(p71®) (12.475a) 
= (7) ((gov)(e 1@))(g0e) (#76) (12.475b) 
= (p7)' (©) 3 © v'(e7"() (12.475c) 
=0 
= 0. (12.475d) 


Une autre généralisation du théorème de Rolle, avec des dérivées d’ordre supérieur : 
PROPooCPCAooJÿOZNy 


Proposition 12.194 ([394)). 
Soit un intervalle ouvert I € R contenant a,b (a Æ b). Soit une fonction f € C"T(I,R). Si 
f(a) = f(b) et si fÜ) (a) = 0 pour j = 1,...,n, alors il existe ce Ja, b[ tel que f"+1)(c) = 0. 


Démonstration. Le théorème de Rolle 12.192 nous dit qu'il existe «1 € Ja, b[ tel que f'(c1) = 0. 
Mais alors f’(a) = f'(c1) = 0, et le théorème de Rolle appliqué à f’ donne €2 € |a,c1[ tel que 
f"(c2) = 0. Continuant ainsi n fois, il existe ce Ja, b[ tel que fl"*(c) = 0. 


Le théorème suivant est le théorème des accroissements finis. Une version avec des dérivées 
partielles sera la proposition 12.249. 


ThoAccFinis 
Théorème 12.195 (Accroissements finis). 
Soit f, une fonction continue sur [a,b] et dérivable sur |a, bl. ITEMooFZONooX JaLyX 
(1) Il existe au moins un réel c eJa, b] tel que 
b) — 
fo 00) ) fQ) (12.476) 
— à 
Autrement dit, la tangente en c est parallèle à la corde entre a et b. ITEMooXRQKooDBFpdQ 
(2) Nous avons la majoration 
b 
ES { < sup |f'(æ)|[b — al. (12.477) 
— a zeJa,bl 


98. Définition 11.231. 
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Démonstration. Considérons la fonction 


r(x) = f(x) ee = f(a). + f(a)— a10 JF), (12.478) 


b—a — & 


c’est-à-dire la fonction qui donne la distance entre f et le segment de droite qui lie (a, f(a)) à 
(b, f(b)). Par construction, r(a) — r(b) = 0, donc le théorème de Rolle s’applique à 7 pour laquelle 
il existe donc un c€]a, b] tel que 7’(c) = 0. 

En utilisant les règles de dérivation, nous trouvons que la dérivée de 7 vaut 


(12.479) 


donc dire que 7’(c) = 0 revient à dire que f(b) — f(a) = (b — a)f'(c), ce qu’il fallait démontrer. 
La majoration est une conséquence immédiate, parce que le supremum de |f’(x)| est forcément 
plus grand que |f’(c)|. 


Une généralisation pour une fonction sur un intervalle Ja, b[ où a et b peuvent être infinis. 
THOooRIIBoo0ÿkzMa 


Théorème 12.196 (Généralisation des accroissements finis). 
Soient —0 < a <b< +00 et f,g des fonctions continues sur [a, b] et dérivables sur ]a, b|. 
Si a = — : 


— Nous demandons la continuité sur |—00,b] et la dérivabilité sur |—c0, b|. 
— Nous notons f(a) la limite lim;_,_ f(x), et nous supposons qu’elle est finie. 


Mêmes conventions si b — +00. 
Alors il existe c € ]a, b[ tel que 


(F() — f(a))g'(e) = (9) — g(a)) F'(o). (12.480) 


h(£) = (g(b) — g(a))f(#) — (F(b) — f(a))g(®). (12.481) 


Nous avons limy_,4 h(t) = lim, ,, A(t), de telle sorte que le théorème de Rolle généralisé 12.193 
s’applique et il existe c € ]a, b[ tel que h’(c) = 0. Pour ce c nous avons 


0 = hR'(c) = (F(b) — f(a))g'(c) — (g(b) — g(a)) F'(0), (12.482) 


et donc 


(F(b) — F(a))g'{c) = (gb) — g(a)) F'(0). (12.483) 


12.17.2 Règle de l’Hospital 
PROPooBZHTooHmyGsy 


Proposition 12.197 (Règle de l’Hospital pour 5[395]). 
Soient des fonctions f,g dérivables sur ]a,b[ et dont la limite en a est nulle. Si g' ne s’annule pas 
sur |a, b[ et si 

(x) 


æat g! (x) 


=} (12.484) 


alors 


. f(x) _. EooJHHYo pLfdRPA 


a—at q x) 


IcileR, et les hypothèses garantissent l'existence de la limite (12.485). 


12.17. DÉRIVATION ET CROISSANCE 999 


Démonstration. Soit x € ]a, b[. Les fonctions f et g sont dérivables sur Ja, x[ et continues sur [a, x], 
de telle sorte que le théorème 12.196 s’applique et nous avons €, € ]a, x[ tel que 


(f(x) — f{a))g (cr) = (g(x) — g(a)) f'(cx). ne 


Nous nous souvenons de ce que signifient les notations dans le théorème : les notations f(a), f(x), 
g(a) et g(x) désignent en réalité les limites. Donc dans (12.486), nous avons f(a) = g(a) = 0. 

D'autre part nous avons g(x) # g(a), sinon le théorème de Rolle 12.193 annulerait g' quelque 
part dans |a,x[. Nous pouvons donc réécrire (12.486) sous la forme 


f(x) L f'(cx) | EQooUGLVoREgAtEC 


Mais lim,_,,+ € = à parce que €; € Ja, x[. Donc la limite du membre de droite de (12.487) lorsque 


x — a existe et vaut {. La même limite à gauche doit alors exister et valoir la même valeur. 
PROPooTJVCooMeUhIy 
Proposition 12.198 (L'Hospital pur ©). 
Soient f et g deux fonctions 
(1) dérivables sur ]|a, b, 
(2) dont les limites en a sont toutes deux ©, 
(3) g! Æ 0 sur Ja, b]. 
(4) 
6 = EQooVFYCooMj0 
ner RooVY COR ORET, 
zat g(x) 
Alors 
ner (12.489) 
at g(x) 


Cette dernière égalité signifie « la limite existe et vaut L ». 


Démonstration. Soit un intervalle |x, y| strictement inclus dans ]a, b[ avec x, y € R. Par le théorème 
des accroissements finis généralisés 12.196 il existe c € ]x, y[ tel que 


f(@æ) = fG) _ FC) (12.490) 


Notons que le dénominateur à gauche n’est pas nul à cause du théorème de Rolle et de l’hypothèse 
que g/ ne s’annule pas sur [x,y|. Nous isolons f(x) : 


fe) = Late) - at) + st. te 


Avant de diviser par g(x) nous devons prendre quelques précautions. Soit V, un voisinage de £ °°. 
Vu la limite (12.488), il existe y € ]a, b] tel que 


J'() 
70 < V (12.492) 


pour tout t € Ja, y[. Nous utilisons ici avec subtilité le fait que ces intervalles sont une base de 
la topologie autour de 0. Maintenant f(y) et g(y) sont fixés et sont des nombres réels. Vu que 
lims_,4 g(t) = © nous pouvons choisir r < y tel que nous ayons simultanément 


(1) g(x) Æ 0 sur Ja,r|, 


99. Vous savez ce que signifie un « voisinage de © » ? Allez voir la définition 12.27. 
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Eu < € (12.493) 
g(x) 
. f@) 

y 


pour tout ze Ja,r|. 


Nous sommes maintenant armés de y et r satisfaisant tout cela et nous pouvons traiter avec la 
formule (12.491) en ne la considérant que pour x € Ja, r[. Soit x € Ja, rl! ; il existe c, € ]a, x[ tel que 


ne : D (: run) 10) EooNEZQop SRE 
Nous avons : 
(1) Em, + — 0; 


(2) 


n LC). je 16). (12.496) 


ù (y) 
g(y)\ 
lim (1 — re) = (12.497) 


(4) limoat 28 — 0. 


Donc chaque partie du membre de droite de (12.495) à une limite bien déterminée pour x — a*. 


Les règles de calcul s'appliquent et nous avons 


h, Us EDS (12.498) 
xat g(x) 


12.17.3 Dérivée et primitive 
CORooEUERooYprtex 


Corolaire 12.199. 
Soit f une fonction dérivable sur [a, b] telle que f'(x) = 0 pour tout x € [a,b]. Alors f est constante 
sur [a, b]. 


Démonstration. Si f n’était pas constante sur [a, b], il existerait un +1 €]a, b[ tel que f(a) Æ f(x1), 
et dans ce cas, il existerait, par le théorème des accroissements finis 12.195, un cela, x1[ tel que 


f(x) — f(a) 


T1] — à 


f'(e) = 20, (12.499) 


ce qui contredirait les hypothèses. 


CorNErEgcQ 
Corolaire 12.200. 
Soient f et g, deux fonctions dérivables sur [a, b] telles que 


fe) = gr) (12.500) 
pour tout x € [a,b]. Alors il existe un réel C' tel que f(x) = g(x) + C pour tout x € [a,b]. 


Démonstration. Considérons la fonction h(x) = f(x) — g(x), dont la dérivée est, par hypothèse, 
nulle. L’annulation de la dérivée entraine par le corolaire 12.200 que À est constante. Si h(x) = C, 
alors f(x) = g(x) + C, ce qu'il fallait prouver. 
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DefXVMVooWhsful 
Définition 12.201. 
Soient T un intervalle ouvert de IR et une fonction f: 1 — IR. La fonction F: 1 — R est une 
primitive de f si F est dérivable sur TI et si F'(x) = f(x) pour tout x dans I. 


Exprimé en termes des primitives, le corolaire 12.200 signifie que 
CorZeroCst 


Corolaire 12.202. 
Si F'et G sont deux primitives de la même fonction f sur un intervalle, alors il existe une constante 
C pour laquelle F(x) = G(x) + C. 


Cela signifie qu’il n’y a, en réalité, pas des milliards de primitives différentes à une fonction. Il 
y en a essentiellement une seule, et puis les autres, ce sont juste les mêmes, mais décalées d’une 
constante. 


Remarque 12.203. 

L'hypothèse de se limiter à un intervalle est importante parce que si on considère la fonction sur 
deux intervalles disjoints, nous pouvons choisir la constante indépendamment dans l’un et dans 
l’autre. Par exemple la fonction 


F(x) = (12.501) 


m(xz)+1 siz>0 
m(x)—7 six <0 
est une primitive de À sur l’ensemble R\{0}. 
Certains ne s’en privent pas. Le logiciel Sage par exemple fait ceci : 


sage: f(x)=1/x 

sage: F-f.integrate(x) 
sage: A=F(x)-F(-x) 
sage: A.full simplify() 
Ixpi 


En réalité lorsque x > 0, Sage définit In(—x) = In(x) + ir. Cela a une certaine logique parce que 
In(—1) = ir (du fait que eT = —1), mais si on ne le sait pas, ça peut étonner. 


12.204. 
Il existe plusieurs primitives à une fonction donnée. En physique, la constante arbitraire est souvent 
fixée par une condition initiale, comme nous le verrons dans la section 42.1. 


12.18 Fonctions de plusieurs variables 


La physique, et les sciences en général, regorgent de fonctions à plusieurs variables. 


Accélération centripète !% Si une masse m tourne sur un cercle, elle subira une accélération 


dirigée vers l’intérieur égale à 


mu? 


Fu,r)= (12.502) 


ñ 
où r est le rayon du cercle et v est la vitesse. 


Pression dans un gaz Si on a n moles de gaz dans un volume V a une température T, alors la 
pression sera donnée par la fonction de trois variables 


nRT 


12.503 
( ) 


D — 


où À est la constante des gaz parfaits. 


100. Appelez la « centrifuge » si vous voulez; ça ne me fait ni chaud ni froid. 
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En mathématique, on peut inventer de nombreuses fonctions de plusieurs variables. La fonction 
(æ,y) = x? + æycos(x° + y°) (12.504) 


est définie sur IR?. La fonction 


x + y — 22 
f(x, y, 2) = 


1-7 -ÿ-2 (12.505) 
est définie sur IR? moins la sphère unité {x? + y? +2? = 1}. 

Consacrons nous à l’étude des fonctions de plusieurs variables, en donnant tout d’abord quelques 
indications sur comment «dessiner» une telle fonction. Vous connaissez déjà la définition de graphe 
pour une fonction f d’une seule variable à valeurs dans R : c’est l’ensemble des points du plan de 
la forme (x, f(x)). Vous voyez que cet ensemble n’est pas vraiment un gros morceau de R? parce 
que son intérieur est vide : il y a une seule valeur de f qui correspond au point x, donc une boule 
de R? centrée en (x, f(x)) de n'importe quel rayon contient toujours des points qui ne font pas 
partie du graphe de f. 

Nous voulons donner une définition assez générale pour le graphe d’une fonction. 


Définition 12.205. 
Soit f une fonction de R”*' dans R”. Le graphe de f est la partie de R”* x IR" de la forme 


Graph f = {(x,y) e RT x R'|y = f(x)}. (12.506) 


Cette définition se spécialise de la façon suivante dans les cas communs. Soit f une fonction de 
R’? dans R. Le graphe de f est la partie de R’? x R donné par 


Graph f = {(x,y)ER"xR|y= f(x)}. (12.507) 
Et pour les fonctions R? — R : 
Graph f = {(x,y,2) € R° tel que z = f(x, y)}. (12.508) 


C’est cette définition qu’il faut garder à l'esprit lorsqu'on travaille sur des dessins en trois dimen- 
sions. 

Si f est une fonction de deux variables indépendantes x et y à valeurs dans R, alors un point 
dans le graphe de f est un point (x,y,2) € IR° tel que 


= (ru) (12.509) 


ou encore, un point de la forme 
(au; f(œ; 0): (12.510) 


Nous avons parfois besoin de donner des représentations graphiques d’une fonction. Nous pou- 
vons, par exemple, penser à la fonction qui associe à un point de la Terre, son altitude. Lorsqu'on 
part pour une promenade en montagne on a envie de connaitre le graphe de cette fonction qui 
correspond en fait à la surface de la montagne. Bien sûr, nous ne voulons pas amener avec nous 
un modèle en 3D de la montagne, donc il nous faut une méthode efficace pour projeter le graphe 
de f sur le plan x-y tout en gardant les informations fondamentales. Pour cela nous avons besoin 
de deux définitions (à ne pas confondre !) 


Définition 12.206. 
Soit f une fonction de R? dans R et soit c dans R. La z-section de Graph f à la hauteur c est 
donnée par 
Se = {(x,y,c) e R°| f(x, y) = c}. 
def_niveau 
Définition 12.207. 
Soit f une fonction de R” dans R et soit c dans R. La courbe de niveau de f à la hauteur c est 
l’ensemble 
Nip R "ris )ecE (12.511) 
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On peut représenter la fonction f d’une façon très précise en traçant quelques-unes de ses 
courbes de niveau. Dans la suite, on pourra considérer aussi les x-sections et les y-sections du 


graphe d’une fonction de deux variables. La x-section de Graph f à la hauteur a est 


Se L {(a, y, 2) eR° | f(a, y) s z}. 


Comme vous avez peut être déjà compris, SŸ est le graphe de la fonction de y qu’on obtient de f 


en fixant x = a. Cette fonction est appelée x-section de f pour x = a. 
Certaines surfaces dans R? sont le graphe d’une fonction. 


Exemple 12.208. 
Quelques graphes importants. 


Un plan non vertical Tout plan dans R° peut être décrit par une équation de la forme 


a(x — %o) + by — Yo) + C(z — 20) = r, 


où, (To, Yo, Zo) est vecteur dans IR, et a, b, c et r sont des nombres réels. Si c # 0 alors le 
plan n’est pas vertical et on peut dire qu’il est le graphe de la fonction 


PE r + Co — a(x 0) b(y vo). 


quitte à choisir des nouvelles constantes 5, t, q, 


P(x,y) = sx + ty + 4. 


Un paraboloïde elliptique Pour tous a et 6 dans R les graphes des fonctions 


2 2 
PE\(x,y) = 2 + A 
ou de la fonction 
a y 
PEa(x, y) = Tas B2 


sont des paraboloïdes elliptiques. Le premier est contenu dans le demi-espace z > 0, l’autre 
dans z & 0. Le nom de cette surface vient de la forme de ses sections. En fait toutes sections 
S? sont des ellipses, alors que les sections SŸ et SŸ sont des paraboles. 


Un paraboloïde hyperbolique (selle) Pour tous a et 8 dans R les graphes des fonctions 


Une 


2 2 
PH = 52 
ou de la fonction 
2 
PHa(x,y) = — 2 M 


sont des paraboloïdes hyperboliques. Remarquez que les sections S7 de ce graphe sont des 
hyperboles, alors que les sections S% et SŸ sont des paraboles. 

demi-sphère La fonction S*(x,y) = 4/R?2 — x? — y? a pour graphe la demi-sphère supé- 
rieure centrée en l’origine et de rayon À. Le dernier de ces exemples nous signale une chose 
très importante : une sphère entière n’est pas le graphe d’une fonction de x et y. Par contre, 
une demi-sphère est bien le graphe de la fonction f(x,y) = 4/1 — x? — y?. 

L’équation que nous utilisons pour décrire une sphère de rayon À centrée en l’origine est 


a +y +2 =R 


Donc, à chaque point (x,y) dans le disque x? + y? < R? (notez que ce disque est contenu 
dans la section Sé), on peut associer deux valeurs de z : 21 = 4/R? — x? — y? et 22 = 

R2 — 2 — y2. Par définition, une fonction n’associe qu’une seule valeur à chaque point 
de son domaine, d’où l'impossibilité de décrire cette sphère comme le graphe d’une fonction 
de x et y. 
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a 


Considérons la fonction Sp : R° — IR qui associe à (x,y,z) la valeur x? + y? + 22. La sphère 
de rayon À centrée en l’origine est l’ensemble de niveau N%2 de Sp. L'ensemble de niveau N de 
Sp est l’origine, et tous les ensembles de niveau de hauteur négative sont vides. La même chose 
est vraie pour les ellipsoïdes centrées en l’origine avec les axes x, y et z comme axes principaux et 
comme longueurs de demi-axes a, b et c. Voici la fonction dont il sont les ensembles de niveau 


2 r à 
a bb cc 


El(x,y, 2) = 


Exemple 12.209. 
Des ensembles de niveau importants. 


Tout graphe Le graphe de toute fonction f de R? dans R peut être considéré comme l’ensemble 
de niveau zéro de la fonction F(x,y,2) = 2 — f(x, y). 


Hyperboloïdes Les hyperboloïdes, comme les ellipsoïdes, sont une famille d'ensemble de niveau. 
En particulier, nous considérons des hyperboloïdes dont l’axe de symétrie est l’axe des z et 
qui sont symétriques par rapport un plan æ-y. Une fois que les paramètres à, b et c sont fixés 
la fonction que nous intéresse est 


Hyp(s,y,2) = 5 +25 


Les ensembles de niveau N; pour d > 0 sont connexes, on les appelle hyperboloïdes à une 
feuille. L'ensemble de niveau No est un cône (elliptique), les deux moitiés du cône se touchent 
en l’origine. Enfin, les ensembles de niveau Ny pour d < 0 ne sont pas connexes et pour cette 
raison on les appelle hyperboloïdes à deux feuilles. 


A 
12.18.1 Graphes de fonctions à plusieurs variables 
Le graphe d’une fonction de deux variables f: D € R? — R est l’ensemble 
{au (x.y) tel que (x, y) € D} (ci (12.512) 
Ce graphe est une surface dans R3. 
ExempleTroisDxxyy 
Exemple 12.210. 
Tracer le graphe de la fonction 
(æ,y) + 2? + y. (12.513) 


Le plus simple est de demander à Sage de nous fournir une représentation 3D 


| Sage Version 4.6.1, Release Date: 2011-01-11 | 
| Type notebook() for the GUI, and license() for information. | 
sage: f(x,y)=x**2+y*##2 

sages piotodif,(6,-8,91,07,-3,90) 


101 


Voici ce que cela donne : (à regarder avec des lunettes bleues et rouges) : 


101. En vrai, ce que Sage donne est un objet qu’on peut même faire bouger. 
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À part que l'ordinateur l’a dit, est-ce qu’on peut comprendre pourquoi le graphe de la fonction 
x? + y? ressemble à un bol ? En coordonnées cylindriques, le graphe s'écrit 


z = r?. (12.514) 


Donc il apparaît que plus on s'éloigne du point (0,0) dans le plan XY, plus le graphe va monter. 
Et il monte à quelle vitesse ? Il monte à la vitesse r?. Il s’agit donc de dessiner la fonction z = r? 
dans le plan et de la « faire tourner ». A 


12.18.2 Courbes de niveau 


Une technique utile pour se faire une idée de la forme d’une fonction en trois dimensions est 
de tracer les courbes de niveau. La courbe de niveau de hauteur À est la courbe dans le plan 
donnée par l’équation 

Jeu) = (12.515) 


Exemple 12.211. 
Dessinons par exemple les courbes de niveau de la fonction 


f(x, y) = x +y+2. (12.516) 
La courbe de niveau h est donnée par l'équation x + y +2 = h, c’est-à-dire 

y(x) = -T+h—2. (12.517) 
Par conséquent la courbe de niveau de hauteur 0 est y = —x—2, celle de hauteur 5 est y = —x +3, 


etc. 
Nous pouvons également nous aider de Sage pour ce faire : 


| Sage Version 4.6.1, Release Date: 2011-01-11 
| Type notebook() for the GUI, and license() for information. | 
sage: f(x,y)=x+y+2 

sage: var(’h’) 


sage: niveau(h,x)=solve(f(x,y)==h,y) [0] .rhs() 
sage: gi(x)=niveau(1,x) 

sage: gi 

ne nt 


D 


1006 CHAPITRE 12. ANALYSE RÉELLE : LIMITES ET DÉRIVATION 
Ici la fonction g1 est la courbe de niveau 1. 
Si on veut faire tracer une courbe de niveau, Sage peut le faire : 
sage: implicit_plot(f(x,y)==1,(x,-3,3),(y,-4,4)) 
Cela tracera la courbe de niveau h = 1 dans la partie du plan x € [—3,3] et y e [—4,4,|. 


A 


Il est bien entendu possible de créer automatiquement 50 courbes de niveau et de demander 
de les tracer toutes sur le même graphe. 


#! /usr/bin/sage -python 
# -4x- coding: utf8 -*- 


from sage.all import * 


var (’x,y’) 
f=xkx2+ÿXxX*x2 
G=Graphics() 
a=3 
for i in range (0,5): 
G=G+implicit _plot(f-==i,(x,-a,a) ,(y,-a,a)) 


>| show (G) 


tex/frido/courbeNiveau.py 


Le résultat est : 


Notez que les courbes sont censées être des cercles : les axes X et Y n’ont pas la même échelle. 


Exemple 12.212. 
Un exemple plus riche en enseignements est celui de la fonction 


f(x, y) = x? — y. (12.518) 


La courbe de niveau À est donnée par l'équation x? — y? = h. 

Commençons par h = 0. Dans ce cas nous avons (x + y)(x — y) = 0 et par conséquent les 
courbes de niveau de hauteur zéro sont les deux droites x + y = 0 et x — y = 0. 

Voyons ensuite la courbe de niveau À = 1. Cela est l'équation x? — y? = 1, c’est-à-dire 


y(x) = +Vzx? —1. (12.519) 


C’est une fonction qui n’est définie que pour |x| > 1. Avec x = 1 nous avons y = 1. Ensuite, lorsque 
æ grandit, y grandit également, mais la courbe ne peut pas croiser la courbe de niveau h = 0. Donc, 
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FIGURE 12.7: La courbe de niveau x? — y? — 1: LabelFigKGQXooZFNVnW 


suivant les notations de la figure 12.6, la courbe de niveau « part » de P et doit monter sans croiser 
les diagonales. 


En ce qui concerne la courbe de niveau h = —1, elle correspond à la courbe y = +41 + x? 
qui est définie pour tous les x € IR. Le même raisonnement que précédemment nous amène à la 
figure 12.7. AS 


Une autre façon de voir les courbes de niveau est de dire que la courbe de niveau de hauteur 
h est la projection dans le plan XY de la section du graphe de f par le plan z = h. 

On peut également définir le graphe de fonctions de trois (ou plus) variables. Le graphe de la 
fonction f: D € R° — R est l’ensemble 


{Crus JE z)) tel que (x,y, 2) € D} CR“. (12.520) 


De tels graphes ne peuvent pas être représentés sur une feuille de papier. Il est toutefois possible 
de définir les ensembles de niveaux : 


En = (rue) € D tel que f(x,y,z) = h+. (12.521) 


Ce sont des surfaces dans R que l’on peut dessiner. 
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Exemple 12.213. 
Les surfaces de niveau de la fonction f(x,y,z) = x? + y? + 2? sont des sphères. Il n’y a pas de 
surfaces de niveau pour les « hauteurs » négatives. PA 


Exemple 12.214. 
Considérons la fonction f(x, y, z) = x? +y?—2?. En coordonnées cylindriques, cette fonction s'écrit 


feba=r-#, (12.522) 


La surface de niveau 0 est donnée par l'équation r = |z|. Cela fait un cercle à chaque hauteur, dont 

le rayon grandit linéairement avec la hauteur ; le tout est donc un cône. C’est d’ailleurs le cône 

obtenu par rotation de la courbe de niveau À = 0 que nous avions obtenu pour la fonction æ° — y?. 
En ce qui concerne les ensembles de niveau positifs, ils sont donnés par 


z= +Vr +y —h. (12:52) 


Notez qu'ils ne sont pas définis pour r > h. Cela pose un petit problème quand on veut le tracer 
à l'ordinateur : 


| Sage Version 4.6.1, Release Date: 2011-01-11 
| Type notebook() for the GUI, and license() for information. 
sage: var(’x,y’) 

(x, y) 

sage: f(x,y)=sqrt(xx*2+yxx2-3) 

sage: F=plot3d(f(x,y),(x,-5,5),(y,-5,5)) 

sage: G=plot3d(-f(x,y),(x,-5,5),(y,-5,5)) 

sage: F+G 


Le résultat est 102 : 


On voit qu’il y a un grand trou au centre correspondant aux z proches de zéro. Or d’après l’équation, 
il n’en est rien : en z = 0 il y a bel et bien tout un cercle. Afin d'obtenir une meilleur image, il 
faut demander de tracer avec un maillage plus fin : 


| Sage Version 4.6.1, Release Date: 2011-01-11 | 
| Type notebook() for the GUI, and license() for information. 


102. Encore une fois : ça donne mieux à l’écran, et vous pouvez le faire bouger ; je vous encourage à le faire! 
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sage: f(x,y)=sqrt(xx*2+yxx2-3) 

sage: F=plot3d(f(x,y),(x,-5,5),(y,-5,5) ,plot_points=300) 
sage: G=plot3d(-f(x,y),(x,-5,5),(y,-5,5) ,plot_points=300) 
sage: F+G 


Le temps de calcul est un peu plus long, mais le résultat est meilleur : 


6.9 
O.0 
-5.0 -6.9 5.0 
A 
12.19 Limites à plusieurs variables 
secLimVarsPlus 
Prenons une fonction f: IR? — R. Nous disons que 
lim f(x) =ieR (12.524) 
TT 


lorsque Ve > 0, 26 tel que |x — xol < implique |f(x) — {| < €. 

Remarquez qu'ici, æ € R”, et sachez distinguer |.}, la norme dans R” de |.| qui est la valeur 
absolue dans R. Une autre façon d'exprimer cette définition est que l’ensemble des valeurs atteintes 
par f dans une boule de rayon 6 autour de x0 n’est pas très loin de {. Nous définissons donc 


Es = {f(x) tel que x € B(xo,0)}. (12.525) 


Notez que si f n’est pas définie en xo, il n’y a pas de valeurs correspondantes au centre de la boule 
dans £5. Ceci est évidemment la situation générique lorsqu'il y a une indétermination à lever dans 
le calcul de la limite. Nous avons alors 


lim f(x) =! (12.526) 
T—TO 
lorsque Ve > 0, 46 tel que . ; | 
sup{|v — {| tel que v € Es} < €. qynoÏNSTAPPAINIS 


Une façon classique de montrer qu’une limite n’existe pas, est de prouver que, pour tout 6, l’en- 
semble Æ5 contient deux valeurs constantes. Si par exemple 0 € E% et 1 € F5 pour tout 6, alors 
aucune valeur de ! (même pas / = +) ne peut satisfaire à la condition (12.527) pour toute valeur 
de €. 

Nous laissons à la sagacité de l'étudiant le soin d'adapter tout ceci pour le cas limz_,», f(x) = 
+00. 

La proposition suivante semble évidente, mais nous sera tellement utile qu’il est préférable de 
l’expliciter : 
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PROPooPOAQooPmxEtb 


Proposition 12.215. 
Soient f : D — R une fonction de domaine D, a € Adh(D) et un voisinage V de a. Nous supposons 
que V n D s’écrive comme une intersection finie : 


k 
VnD=f\a: 
i=1 


telle que a € Adh À; pour tout à < k. Alors, la limite 


Hi Fr) D à 15858) 


Ta 


existe et vaut bE R si et seulement si chacune des limites 


lim f(x) (12.529) 
ze À; 


existe et vaut b. 


Démonstration. On sait déjà que si la limite de f : D — R existe, alors toute restriction à À; 
admet la même limite !%, Il suffit donc de prouver la réciproque. 
Fixons provisoirement un entier + entre 1 et k ainsi que € > 0. Vu que limxa f(x) = b, il existe 
TEA; 


& > 0 tel que si x € À; et si 0 < |x — a] < 6;, alors 
HOBIOIES re 2 


Quitte à prendre 6; un peu plus petit, nous supposons que V € B(a, 6j). 
Nous posons Ô = min{0;};=1...8, et nous considérons x € D tel que 0 < [x — a] < 6. Nous avons 
alors 
(1) xeVnD, 
(2) il existe 4 tel que x € À. 
Ce x est donc un élément de À; vérifiant 0 < |x—a| < 0 < 6,. Il vérifie donc (12.530) : |f(x)— f(a)| < 
€. 


Cela prouve la limite (12.528). 


Exemple 12.216. (1) Pour qu'une fonction f : R — R admette une limite en a € R, il faut et 
il suffit qu’elle y admette une limite à droite et une limite à gauche qui soient égales. 


Cela est une application de la proposition 12.215 avec R = |—00, af L Ja, |. 


(2) Une suite (x4) admet une limite si et seulement si les sous-suites (424) et (—2k+1) convergent 
vers la même limite. Ceci n’est pas une application directe de la proposition, mais la teneur 
est la même. 


pa 


Lemme 12.217 (|1]). 
Soient deux espaces vectoriels E et F. Soit une fonction f: R — F telle que lims_,0 f(t) = yer. 
Nous posons 

op E-F 


(12.531) 
he f(IRl). 
Alors ÿ admet une limite pour h — 0 et elle est donnée par 
lim (Ah) = lim f(t). (12.532) 


h—0 t—0 


103. C’est une conséquence de la caractérisation séquentielle de la continuité 7.201. 
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Démonstration. Soit e > 0. Il existe Ô tel que si t < Ô alors | f(t) — y|r < €. Si |h|] < 6 nous avons 


loCR) — yl = FR) — yl < €. (12.533) 


Donc c’est bon. 


Voici, dans le même ordre d’idée, un autre résultat qui permet de réduire le nombre de variables 
dans une limite lorsque la fonction ne dépend pas de certaines variables. 


LEMooYLIHooFBQyzC 
Lemme 12.218 ([1|). 
Soit une fonction g: IR — R vérifiant 
lim CES à (12.534) 
Alors pour tout bE R, la fonction 
:R°—R 
Ï (12.535) 
(x,y) > g(x) 
vérifie 
lim æ,y) = L. 12.536 
en (12.536) 


Démonstration. Soit € > 0. Par hypothèse sur la limite de g en a, il existe 0 > 0 tel que 0 < 
fé — a] < Ô implique [g(t) — £| <e. 
Attention : passage subtil 104, Si O0 < |(x,y) — (a,b)| < 6, alors nous avons évidemment aussi 
[x — a] < Ô, mais pas spécialement 0 < |x — a] < Ô comme le requis pour utiliser la limite de g. 
Dans le calcul de la limite restreinte à x Æ a, les points qui interviennent sont les valeurs de 
(x, y) dans B((a,b),6)\{x = a}. Or pour celles-là nous avons bien 0 < |x—a| < 6. Le calcul suivant 
fonctionne donc : 


LAC, 9) — 4 = |g() — 4 < 6. (12.537) 


EXooHSYNooBZhDbE 
Exemple 12.219. 
Pourquoi prendre la limite (x,y) — (a,b) avec x £ a dans l’énoncé du lemme 12.218 ? Imaginons 
la fonction 


0 sixÆ0 
a (12.538) 
1 six =0(. 


Dans ce cas, le graphe de la fonction f(x,y) = g(x) est tout plat sauf la ligne x = 0 qui est en 
hauteur. Nous avons donc f(0,t) = 1 pour tout t et donc nous n’avons pas LM (x,y)—(0,0) fui = 0: 
tout voisinage de (0,0) contient des points (x, y) tels que f(x, y) = 1 et des points (x,y) tels que 
JG, y) = 0. A 


12.220. 

Il existe de nombreuses façons de calculer des limites à plusieurs variables. Plus nous connaîtrons 
de mathématiques, plus nous aurons de techniques à notre disposition. Nous allons tout de suite 
voir quelques méthodes. Voir le thème 66 pour plus de techniques et d'exemples. 


12.19.1 Caractérisation de la limite par les suites 
ExFNExempleMethodeTrigigi 


Exemple 12.221. 
Considérons la fonction 


Ty 
= + — 12.539 


104. Je rejette déjà en bloc et d’un revers de main toute tentative de dire « la limite épointée, c’est mieux ». Voir 
aussi l'exemple 12.219. 
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et remarquons que, quelle que soit la valeur de y, cette fonction est nulle lorsque x = 0. De la 
même manière, nous voyons que si æ = y, alors la fonction vaut 10° 1. 

Il est impossible que la fonction ait une limite en (0,0) parce qu’on ne peut pas trouver un { 
dont on s'approche à la fois en suivant la ligne x = 0 et la ligne x = y. 

Deux autres chemins avec encore deux autres valeurs sont dessinés sur la figure 12.8. 


Cet exemple pourra être formalisé en utilisant le théorème 12.222. Voir l'exemple 12.223. A 
ThoLimsSuite 


Théorème 12.222 (Caractérisation de la limite par les suites). 

Une fonction f: D € R°" — IR" admet une limite { en un point d’accumulation a de D si 
et seulement si pour toute suite (xn) dans D\{a} convergente vers a, la suite (f(x»)) dans R" 
converge vers L. 


Démonstration. Supposons d’abord que la fonction ait une limite £ lorsque x — a, et considérons 
une suite (x,) dans D\{a} convergente vers a. Nous devons montrer que la suite yy = f(x») 
converge vers {, c’est-à-dire que si nous choisissons € > 0 nous devons montrer qu’il existe un N 
tel que n > N implique [y — £| = |f(tn) — £| < €. 

Nous avons deux hypothèses. La première est la convergence de la fonction et la seconde est la 
convergence de la suite (x,). L'hypothèse de convergence de la fonction nous dit que (le € a déjà 
été choisi dans le paragraphe précédent) 


16 tel que 0 < x — al < 8 = | f(x) — | <e. (12.540) 


Une fois choisi ce Ô qui « va avec » le € qui a été choisi précédemment, la définition de la convergence 
de la suite nous enseigne que 


IN tel que n > N = |x, — a] < 6. (12.541) 


Récapitulons ce que nous avons fait. Nous avons choisi un €, et puis nous avons construit un 
N. Lorsque n > N, nous avons |x, — a] < 6. Mais alors, par construction de ce ô, nous avons 
|f(tn) — | < €. Au final, n > N implique bien |y, — {| < €, ce qu’il nous fallait. 

Nous supposons maintenant que la fonction f ne converge pas vers £, et nous allons construire 
une suite d'éléments x, qui converge vers a sans que (yn) = (f(xn)) ne converge vers £. La fonction 
f vérifie la condition (12.76). Nous prenons donc un € tel que V6, il existe un x qui vérifie en même 
temps les deux conditions 


O<|x— al <ô (12.542a) 
lf(x) — 4] > €. (12.542b) 


Un tel x existe pour tout choix de 0. Choisissons un n arbitraire et Ô = L. Nous nommons x, le x 
correspondant à ce choix de n. La suite (x,) ainsi construite converge vers a parce que 


1 
[tn — al < ôn = —, (12.543) 
n 
donc dès que n est grand, |x, — a] est petit. Mais la suite y, = f(x,) ne converge pas vers £ parce 
que 
lfCœn) — 4 > € (12.541) 


pour tout n. La suite y, ne s’approche donc jamais à moins d’une distance € de L. 
EXo0oNBTYooFyKRTB 


Exemple 12.223. 
Reprenons l’exemple 12.221. Considérons les deux suites æ, = (0, 2) et y, = (4, 1). Ce sont deux 
suites dans R° qui tendent vers (0,0). Si la fonction f convergeait vers 4, alors nous aurions au 


moins pas ne 
lim f (zx) =# (12.545a) 
lim f(yn) = 4, (12.545b) 


mais nous savons que pour tout n, f(xn) = f(0, 1) = 0 et f(Yn) = fŒ 1) = à. Il n’y a donc aucun 
1 


nombre £ qui vérifie les deux équations (12.545) parce que lim f(x,) = 0 et lim f(yn) = 5. A 


105. En fait ce que nous sommes en train de faire est de poser 0 = 7/2 et 0 = x/4 dans (18.821). 
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12.19.2 Règle de l’étau 


Une première façon de calculer la limite d’une fonction est de la « coincer » entre deux fonctions 


dont nous connaissons la limite. 
ThoRegleEtau 


Théorème 12.224 (Règle de l’étau[396]). 
Soit O, un ouvert de R” contenant le point a. Soient f, g et h, trois fonctions définies sur O\{a}. 
Supposons que 


(1) 


g(x) < f(x) < h(x). (12.546) 
pour tout x € O\{a} 
(2) 
lim g(x) = lim h(æ) = £. (12.547) 


Alors la limite lim,_,4 f(x) existe et vaut L. 


Démonstration. Soit € > 0. Nous devons trouver un voisinage V de a tel que | f(x) — {| < € pour 
tout x € V\{a}. Étant donné que lims_,4 g(x) = lims-a h(x) = 4, il existe un voisinage ouvert V 
de a tel que !06 


[g(æ) — À < € (12.548a) 
lA(x) — 4 < €. (12.548b) 


pour tout x € V\{a}. Pour tout x £ a dans V, nous avons 


L—e< gx) < f(x) <h(x) <£+e. (12.549) 


Donc |f(x) — {| <e, comme nous l’avions annoncé. 


Cette méthode est très pratique lorsqu'on a des fonctions trigonométriques qui se factorisent 
parce qu’elles sont toujours majorables par 1; voir l'exemple 18.73. 


Exemple 12.225. 
Prouver la continuité en (0,0) de la fonction 


æ|yl si (x 
flag) = 4 VPHP ON (12.550) 


0 sinon. 
Considérons une suite (z»,yn) € IR? qui tend vers (0,0). Étant donné que u - < 1 pour tout x 
Va?+y 
et y, nous avons 
z 
0 <|f(tn;Un)| = al < [tn] — 0. (12.551) 
VTn + Un 

Donc nous avons 

f(&, y) = 0 = f(0,0), (12.552) 


lim 
(æ,y)—(0,0) 


ce qui prouve que la fonction est continue en (0,0) par la proposition 7.129. Nous avons utilisé la 


règle de l’étau (théorème 12.224). À 
12.226. 
Nous notons f — g pour x — a lorsque limz_,4 Dr = 1. 


Cela signifie que f et g tendent vers la même limite, à la même vitesse. 
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y = —X 4 
L” y = x/2 
I > 
FIGURE 12.8: Sur toute la droite y = —x, la fonction vaut —1/2, tandis que sur toute la droite 
y = x/2, elle vaut 2. Il est donc impossible que la fonction ait une limite en (0,0), parce que dans 


toute boule autour de zéro, il y aura toujours un point de chacune de ces dens1digMféthodeChemin 


12.19.33 Méthode des chemins 


Lorsque la limite n'existe pas, il y a une façon en général assez simple de le savoir, c’est la 
méthode des chemins. 


C’est la proposition suivante qui va faire une grosse partie du travail. 
PROPooSAFIooWvmsSiT 


Proposition 12.227 (|[1]). 
Soit f: DER”? — R' et a un point d’adhérence de D. Alors nous avons 


lim.f(r)=£# (12.553) 
si et seulement si pour toute fonction y: R — R°"" telle que limy_,0 y(t) = a, nous avons 
lim(f o y)(t) = L. (12.554) 


Démonstration. En deux parties. 


(1) Sens direct Soit une fonction y: R — R”’ telles que lims_,0 y(t) = a. Par le théorème 
12.222, il suffit de montrer que (f o y)(t,) — £ pour toute suite {, — 0 dans R. 


Nous savons que la suite n + (tx) est une suite qui converge vers a. Mais l’hypothèse 
limy_,4 f(x) = L implique que pour toute suite x, — a nous avons f(x,) — £. Cela est en 
particulier vrai pour la suite n + y(t,). Donc : 


loire (12.555) 


n—00 


ce qu’il fallait prouver. 


(2) Réciproque Pour les mêmes raisons de caractérisation séquentielle que précédemment, il 
faut prouver que lim,_, f(4n) = £ pour tout suite &, — a. 


(2a) Un chemin Soit la fonction y: IR — R”°' affine par morceaux et telle que 


. () =. (12.556) 


Nous prolongeons 7 par y(t) = a pour t < 0. 
(2b) y(t) — a Nous montrons que limy_,0 y(t) = a. Soient € > 0 et N tel que x, € B(a,e) 
pour tout n > N.Sit< L alorste [ri +] pour un certain k > N. Donc 


10 € GG) (12.557) 


106. Si vous ne voyez pas comment avoir les deux conditions en même temps, prenez Vi pour g et V2 pour h, et 
considérez V = Vi n V2 qui sera encore un ouvert. 
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et donc y(t) € [xx11,xx] parce que + est formé de ces segments de droites. Mais comme 
B(a,e) est convexe 117, nous avons 


y(t) € [rxu1, re] € B(a, 6e). (12.558) 


Nous avons donc bien lims_,0 y(t) = a. 


(2c) Conclusion L'hypothèse nous donne alors lims_,o(f o y)(t) = £. En particulier le 
critère de la caractérisation séquentielle de la limite dit que 


lim fQ() = #, (12.559) 


n—00 n 


ce qui signifie limy_,œ f(Æn) = £. 


CorMethodeChemin 
Corolaire 12.228. 
Soient f: D € R® — R” et a un point d'accumulation de D. Si nous avons deux fonctions 
1,%2: R — R’' telles que 
lmn(t) = lim o(t) = a (12.560) 


tandis que 
lim( o 11) # Tim(f o4)(#). (12.561) 


ou bien que l’une des deux limites n'existe pas, alors la limite de f(x) lorsque x — a n'existe pas. 
CorMethodeChemoinNegatif 

Corolaire 12.229. 

Soient f: DCR” — R' et a un point d’accumulation de D. Si il existe une fonction y: R — R”7 

avec y(0) = a telle que la limite lims_,o(f o y)(t) n'existe pas, alors la limite lim;_,a f(x) n'existe 

pas. 


En ce qui concerne le calcul de limites, la méthode des chemins peut être utilisé de trois façons : 


(1) Dès que l’on trouve une fonction +: R — R’” telle que lims_,o(foy)(t) = £, alors nous savons 
que si la limite lim,_,, f(x) existe, alors cette limite vaut 4. 


(2) Dès que l’on a trouvé deux fonctions 7; qui tendent vers a, mais dont les limites de limy_,o(fo 
yi)(t) sont différentes, alors la limite lim,_,, f(x) n'existe pas. 


(3) Dès qu’on trouve une chemin le long duquel il n’y a pas de limite, alors la limite n'existe pas 
(corolaire 12.229). 


La méthode des chemins ne permet donc pas de calculer une limite quand elle existe. Elle permet 


uniquement de la « deviner », ou bien de prouver que la limite n'existe pas. 


Exemple 12.230. 
Soit à calculer 


T —Y FASO TEEN EE 


lim : 
(&,y)—(0,0) T + y 
Si nous prenons le chemin 1(t) = (t,t), nous avons bien lims_,0 y1(t) = (0,0), et nous avons 


: . t—t 
Donc si la limite (12.562) existait, elle vaudrait obligatoirement 0. Mais si nous considérons y2(t) = 


(0,t), nous avons 
—t 


(om) = = 1, (12.564) 
donc si la limite existe, elle doit obligatoirement valoir —1. Ne pouvant être égale à 0 et à —1 en 
même temps, la limite (12.562) n’existe pas. A 


107. C’est la proposition 8.28. 
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12.20 Dérivée directionnelle 


Nous sommes capables de dériver une fonction de deux variables f(x, y) par rapport à x et par 
rapport à y. C'est-à-dire que nous sommes capables de donner la variation de la fonction lorsqu’on 
bouge le long des axes horizontal et vertical. Il est évidemment souhaitable de parler de la variation 
de la fonction lorsqu'on se déplace le long d’autre droites. 


Soit donc u = di un vecteur unitaire (c’est-à-dire u? + u3 = 1), et considérons la fonction 
2 
de une variable 
p:R—R 


12.565 
tr f(a+tui,b+ tu). ) 


La fonction & n’est rien d’autre que la fonction f vue le long de la droite de direction donnée par 
le vecteur u. Nous pouvons aussi l'écrire o(t) = f(p + tu). 

Soit f: R? — R une fonction de deux variables et soit (a,b) € IR?. La façon la plus naturelle 
de définir une dérivée à deux variables est de considérer les dérivées partielles définies par 


CH (a,0) = lim Ce b) 
DEN et TD) (12.566) 
y” ER =D : 


Ces nombres représentent la façon dont le nombre f(x, y) varie lorsque soit seul x varie soit seul y 
varie. Les dérivées partielles se calculent de la même façon que les dérivées normales. Pour calculer 
OxJ, on fait « comme si » y était une constante, et pour calculer ©, f, on fait comme si x était une 
constante. 


12.20.1 Dérivée partielle et directionnelles 


Soit une fonction f : À € R° — R. Si n £ 1, la notion de dérivée de la fonction f n’a plus 
de sens puisqu'on ne peut plus parler de pente de la tangente au graphe de f en un point. On 
introduit alors quelques notions qui feront, en dimension quelconque, le même travail que la dérivée 
en dimension un : les dérivées directionnelles et la différentielle. Nous allons voir qu’en dimension 


un, la différentielle coïncide avec la dérivée. 
DEFooCATTooTPLtpR 


Définition 12.231. 
Soit une fonction f : V — W où V et W sont des espaces vectoriels normés. Soient a € V etve V. 
Nous posons v: IR — W donnée par 


g(t) = f(a + tv). (12.567) 


Nous disons que f admet une dérivée suivant le vecteur v au point a si la fonction & est 
dérivable en 0. Nous notons alors 


(a) = (0), (12.568) 
ou alors 
Cf(a) = lim Cas mn =) (12.569) 


Si une base {e;} de V est donnée, nous notons 0;f la dérivée de f dans la direction de e;. La 
fonction ©;f est la dérivée partielle de f. Dans le cas de V = R”, cela est souvent noté 


of d 


Ôt; ue alt je tes)| (12.570) 


Sim = 2,3 on peut utiliser la notation f>, © ou 01 pour la dérivée partielle suivant e1, fy, Oy 
ou © pour la dérivée partielle suivant e2 et f,, ©, ou @3 pour la dérivée partielle suivant e3. En 
général, nous écrivons ©; pour noter la dérivée partielle suivant e;. 
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Des exemples faisant intervenir les fonctions trigonométriques, exponentielles et logarithme 
sont les exemples 18.250, 15.92. 
La fonction d’une seule variable qu’on obtient à partir de f en fixant les p — 1 variables 


Tl,-.., Lil, Ti+1,...,Zp et qui associe à x; la valeur f(x1,...,%i-1,Ti,Ti+1,...,%p), est appelée 
x-ème section de f en æ1,...,%5_1,%541,...,%9. L’i-ème dérivée partielle de f au point a = 
(t1,...,Tm) est la dérivée de l’i-ème section de f au point x;. En pratique, pour calculer les dérivées 


partielles d’une fonction on fait une dérivation par rapport à la variable choisie en considérant les 
autres variables comme des constantes. 

Géométriquement, il s’agit du taux de variation instantané de f en a dans la direction du 
vecteur u, c’est-à-dire de la pente de la tangente dans la direction du vecteur w au graphe de f au 


point (a, f(a)). 


Remarque 12.232. 
De nombreuses sources parlent de dérivée dans la direction du vecteur v en définissant (avec 
une certaine raison) une direction dans R”? comme étant un vecteur de norme 1. 

Ces personnes ne définissent alors @,f que pour |u] = 1. Pourquoi? Le but de la dérivée 
directionnelle dans la direction uw est de savoir à quelle vitesse la fonction monte lorsque l’on se 
déplace en suivant la direction u. Cette information n’aura un caractère « objectif » que si l’on 
avance à une vitesse donnée. En effet, si on se déplace deux fois plus vite, la fonction montera deux 
fois plus vite. Par convention, on demande alors d'avancer à vitesse 1. 

Ici, pour être plus souple en termes de notations et de manipulations, nous définissons © f 
pour tout u (non nul). Nous devons cependant garder en tête que le nombre (@,f)(a) ne peut pas 
être interprété comme étant une « vitesse de croissance de f en a » de façon trop sérieuse. 


Cas particulier où n = 2 : 


a = (a, a2), u = (ui, u2) et 


fai + tu, a2 + tu2) — f(a1, a2) 
t 


(a, 22) _— Jim (12.571) 


Un cas particulier des dérivées directionnelles est la dérivée partielle. Si nous considérons la 
base canonique e; de R”, nous notons 


Of Of 
—— = ——. 12.572 
OT; 0e; ( 
Dans le cas d’une fonction à deux variables, nous avons donc les deux dérivées partielles 
Of of 
— — 12. 
SL (a) et (0 (12.573) 


qui correspondent aux dérivées directionnelles dans les directions des axes. Ces deux nombres 
représentent de combien la fonction f monte lorsqu'on part de a en se déplaçant dans le sens des 
axes X et Y. 


12.20.1.1 Quelques propriétés et notations 


(1) Si on prend u = e; le j-ème vecteur de la base canonique de R”, alors 


Of Of 
——(a) = ——(a 12.574 
an (®) = EE (® (12.574) 
c'est-à-dire que la dérivée de f au point a dans la direction e; est la dérivée partielle de f 
par rapport à sa j-ème variable. 


(2) Une fonction peut être dérivable dans certaines directions mais pas dans d’autres (rappelez 
vous que si la limite à droite est différente de la limite à gauche, la limite n'existe pas). 
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(3) Même si une fonction est dérivable en un point dans toutes les directions, on n’est pas sûr 
qu’elle soit continue en ce point. La dérivabilité directionnelle n’est donc pas une notion suf- 


fisante pour assurer la continuité. C’est pourquoi on introduit le concept de différentiabilité. 
LEMooVOTHooPJcrWH 
Lemme 12.233. 
Nous notons K le corps R ou C. Soient deux espaces vectoriels E et F sur K. Soient une appli- 
cation f: E — F ainsi que a,u € E tels que 2É (a) existe. 


Alors pour tout € K, (0x, f)(a) existe et 


Of 
O(AU) = Ou (a) 


(12.575) 


Démonstration. Nous allons utiliser le lemme 12.11. D'abord nous avons, pour tout t, À et a : 


f(a+thu) — f(a) |; f(a+tau) — f(a) Poe 
t À ‘ | 


En posant g(t) = f(attu)—f(a) 


t 
vaut BE (a). Le lemme 12.11 indique que lims_,0 g(At) existe aussi et vaut la même chose. Donc 


(t est une variable dans R), l'hypothèse est que lims_,0 g(t) existe et 


f(a+ Xtu) — f(a)  ôf 
+0 Xt Ou 


(a). (12.577) 


En prenant la limite dans (12.576), nous avons le résultat. 


Exemple 12.234. 

Considérons la fonction f(x,y) = 2xy°. Lorsque nous calculons 0, f(x, y), nous faisons comme si 
y était constant. Nous avons donc 0, f(x,y) = 2y°. Par contre lors du calcul de 4, f(x, y), nous 
prenons æ comme une constante. La dérivée de y? par rapport à y est évidemment 2y, et par 
conséquent, Oy f(x, y) = Axy. A 


Définition 12.235. 
Soient f une application de U € R"? dans R et u un vecteur de R"”. La fonction f est dérivable 
sur U suivant le vecteur u, si f est dérivable suivant le vecteur u en tout point de U. 


Pour les fonctions d’une seule variable, la dérivabilité en un point a implique la continuité en 
a. Cela n’est pas vrai pour les fonctions de plusieurs variables : il existe des fonctions f qui sont 
dérivables suivant tout vecteur au point a sans pour autant être continue en a. 


Exemple 12.236. 
Considérons la fonction f : R? — R 


x? 


fay=t m3g (æ,y) # (0,0), (12.578) 
0 sinon. 


Pour voir que f n’est pas continue en (0, 0) il suffit de calculer la limite de f restreinte à la parabole 
2 
Y—X 


1 
: 2, __+ 
lim f(a,x) = #0. 


Pourtant la fonction f est dérivable en (0,0) dans toutes les directions. En effet, soit u = (vi, v2). 


Si vo £ 0, alors 
: tv2v2 v? EQooX0CWo 
dy f(a) = lim a 1 33 — . APS 
4 LUT + LUS Vo 


tandis que si v2 = 0, alors la valeur de f(tv1,0) est 0 pour tout t et v1, donc la dérivée partielle de 
f par rapport à x en l’origine existe et est nulle. A 
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Exemple 12.237. 
Pour une fonction réelle à variable réelle, la dérivabilité entraine la continuité. I n’en va pas de 
même pour les fonctions à plusieurs variables, comme le montre l’exemple suivant : 


0 six = 0 
f(x, y) = (12.580) 
re +y? sinon. 
x 
Nous avons tout de suite of 
——(0,0) = 0. 12.581 
37 (0,0) (12.581) 
De plus si u; # 0 nous avons 
2E (0,0) = “Jul (12.582) 
D Le UP ‘ 


Donc toutes les dérivées directionnelles de f en (0,0) existent alors que la fonction n’y est mani- 
festement pas continue. En effet sous forme polaire, 


rsin(6) 

f(r,6) = cos(0) 

et quelle que soit la valeur de r, en prenant 0 suffisamment proche de 7/2, la fraction peut être 
arbitrairement grande. 

Nous verrons par la proposition 12.265 que la différentiabilité d’une fonction implique sa conti- 

nuité. A 

val medio _1 


(12.583) 


Théorème 12.238 (Accroissements finis pour les dérivées suivant un vecteur). 
Soit U un ouvert dans R”? et soit f : U — IR”? une fonction. Soient a et b deux points distincts 
dans U, tels que le segment! ® [a,b] soit contenu dans U. Soit u le vecteur 


b—a 


U= ———. 
1b— aim 


Si Cu f(x) existe pour tout x dans [a,b] on a 


1 FC) — f(a)ln < sup |uf(x){n|b — all. 


x€[a,b] 


Démonstration. Nous considérons la fonction g(t) = f((1— t)a + tb). Elle décrit la droite entre a 
et b parce que g(0) = a et g(1) = b. En ce qui concerne la dérivée, 


Lim (Gt hat (+h)o) — f(( — Ha + tb) 
. | 12.584 
_ym ++ R(— a) — f(a+t(o—a)) ( ) 
h—0 h 
Of 


= (a +45 a))1b- al 


Le dernier facteur |b — a] apparaît pour la normalisation du vecteur u. En effet dans la limite, il 
apparaît h(b — a), ce qui donnerait la dérivée le long de b — a, tandis que w vaut (b — a)/|b — al. 
Par le théorème des accroissements finis pour g, il existe to € ]0,1[ tel que 


g() = 9(0) + d (0) — 0). (12.585) 
Donc o 
LG 10) <suplo(ni= su a+ 6) led. (12586 
to toe]0,1[ | OU 


Mais lorsque t, parcourt |0,1{[, le point a +to(b— a) parcourt le segment ]a, b[, d’où le résultat. 
108. Définition 10.51. 
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Corolaire 12.239. 
Dans les mêmes hypothèses, sin = 1, alors il existe x dans |a, b[ tel que 


J(b) — f(a) = a f(&)1b — alim: 


Définition 12.240. 


Le nombre 
tu, b + tu) — ,b 
den fee) (12.587) 
t—0 6 
est la dérivée directionnelle de f dans la direction de u au point (a, b). Il sera noté 
Of 
{ab 12.588 
CL (a,6), (12.583) 


ou plus simplement 0, f(a, b). 


Lorsque f est différentiable, la dérivée directionnelle est donnée par 


Of EqDerDi 
au) = Vi) : u. Go) 
LEMooASGNooCWqAmN 
Lemme 12.241. 
Les projections canonniques sont des applications différentiables. 
LEMooGYJUooOudNLH 
Lemme 12.242. 
Toute fonction polynômiale à n variables est différentiable comme application de R’" vers R. 
LEMooUMRXo0oDUQHPK 


Lemme 12.248. 
Toute fonction rationnelle, du type f(x) = Do où P et Q sont des polynômes, est différentiable 


en tout point a tel que Q(a) Æ 0. 
LEMooTPDSooGbxfhP 


Lemme 12.244. 
Pour une fonction d’une variable f : D € IR — KR, le caractère différentiable et le caractère 
dérivable coïncident. De plus, on a 

dfatu) = f'(a)u. (12.590) 

deriveepartielles 

12.245. 
En pratique, ayant une formule pour la fonction f, nous la dérivons par rapport à la variable x; 
en utilisant les règles usuelle de dérivation en considérant que les autres (x; avec j Æ i) sont des 
constantes. 


Exemple 12.246. 
Pour f(x,y) = xy + x?, les dérivées partielles s’écrivent 


Of Of 
ie, 9 a 
de y+2x et cs T 
A 
12.20.22 Gradient : direction de plus grande pente 
Étant donné que u est de norme 1, l'inégalité de Cauchy-Schwarz donne 
IV (a, b) : da | < |Vf(a,b)|: (12.591) 


Donc 
—|Vf(p)| < Vf() : u < IVf(p)||. (12.592) 
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La norme de la dérivée directionnelle (qui est la valeur absolue du nombre au centre) est donc 
« coincée » entre —|V f(p)| et |Vf(p)|. Prenons par exemple 


V f(p) 
peer. (12.593) 
IV f(»)| 
Dans ce cas, nous avons exactement 
Vf(p) : u={|[Vf(p)|, (12.594) 


qui est la valeur maximale que la dérivée directionnelle peut prendre. 

La direction du gradient est donc la direction suivant laquelle la dérivée directionnelle est la 
plus grande. Pour la même raison, la dérivée directionnelle est la plus petite dans le sens opposé 
au gradient. 

En termes bien clairs : lorsqu'on veut aller le plus vite possible au ski, on prend la direction 
du gradient de la piste de ski. C’est dans cette direction que ça descend le plus vite. Dans quelle 
direction vont les débutants ? Ils vont perpendiculairement à la pente (ce qui ennuie tout le monde, 
mais c’est un autre problème). Les débutants vont donc dans la direction perpendiculaire au 
gradient. Prenons donc u L Vf(p) et calculons la dérivée directionnelle de f dans la direction u 
en utilisant la formule 12.589 : of 

… 


(p) = Vf(p) : u=0 (12.595) 


parce que nous avons choisi u L V f(p). Nous voyons donc que les débutants en ski ont eu la bonne 
intuition que la direction dans laquelle la piste ne descend pas, c’est la direction perpendiculaire 
au gradient. 

C’est aussi pour cela que l’on a tendance à faire du zig-zag à vélo lorsqu'on monte une pente très 
forte et qu’on est fatigué. C’est toujours pour cela que les routes de montagne font de longs lacets. 
La montée est moins rude en suivant une direction proche d’être perpendiculaire au gradient ! 


Théorème 12.247. 
Le gradient des fonctions suit à peu près les mêmes règles que les dérivées. Soient f et g deux 
fonctions différentiables. Nous avons entre autres 


(A) VF +9) = Vi + Va; 
(2) V(fg)(a, b) Lu g(a, b)V f(a, b) La f(a, b)Vg(a, b) ; 
(3) Dès que g(a,b) Æ 0, nous avons 


f g(a, b)V f(a, b) = f(a, b)Vg(a, b) 
g g(a,b)° 


V | (12.596) 


12.20.3 Gradient : orthogonal au plan tangent 


Vu que le gradient d’une fonction est la direction de plus grande pente et que le plan tangent 
est le plan de plus petite pente, quoi de plus naturel que de penser que le gradient est orthogonal 
au plan tangent ? 


Lemme 12.248. 
Soit D: R° — R une fonction de classe C! et la partie 


l'={reR" tel que (x) = C} (12.597) 


pour une certaine constante C. 
Soit xo € L'. Le gradient de o en xo est orthogonal au plan tangent à T'en x. 


Démonstration. Un vecteur tangent à Len +0 est de la forme +/(0) où +: R — vérifie y(0) = xo. 
Puisque & est constante sur [nous avons 


d 


[éGts)| =), (12.598) 


s=0 
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ce qui donne 
= (r(0))1(0) = 0, (12.599) 


ce qui signifie exactement {(Vo)(xo), 7 (0)> = 0. Le vecteur (Vé)(xo) est donc perpendiculaire à 
tout vecteur tangent de l'en x. 


12.20.4 Mise en bouche en dimension 2 


Nous savons déjà comment dériver les fonctions composées de R dans R. C’est la proposition 
12.184. Si nous avons deux fonctions f: IR — KR et u: IR — KR, nous formons la composée & = 
fou: R— HR dont la dérivée vaut 


g'(a) = f'(u(a))u/(a). (12.600) 


Considérons maintenant le cas un peu plus compliqué des fonctions f: R—Ret u:R?—R, 
et de la composée 
p:R?—R 
px, y) = f(u(x,y)). 
Afin de calculer la dérivée partielle de & par rapport à æ, nous admettons que pour tout a, b et t, 
il existe ce [a, a +t] tel que 


(12.601) 


u(a+t,b) = u(a,b) + re b). (12.602) 


Cela est une généralisation immédiate du théorème 12.195. Nous devons calculer 


ep. D pla +t,b) — w(a,b) _. f(u(a +t,b)) — f(u(a,b)) EqPrenPaspif an 


0x t—0 t +0 t 


Étant donné l'hypothèse que nous avons faite sur u, nous avons 


fu(a+t,b)) = f(u(a,b) + re b)). (12.604) 


En utilisant le théorème des accroissements finis pour f, nous avons un point d entre u(a,b) et 
u(a, b) + t3(c, b) tel que 


a) Ô 
F(u(a,b) +45 (0,0) = F(u(a,b)) +1 (cb) (à). (12.605) 
Le numérateur de (12.603) devient donc 
ou ; 
ta (c b) f'(d). (12.606) 


Certes les points c et d sont inconnus, mais nous savons que c est entre a et a + t ainsi que d se 
situe entre u(a,b) et u(a,b) + t(c, b). Lorsque nous prenons la limite t — 0, nous avons donc 
limy_,oc = a et lims_,0 d = u(a,b). Nous avons alors 


ou ! 
tE(c, b)f (d) : ce (a, b)f' (u(a, b)). (12.607) 


La formule que nous avons obtenue (de façon pas très rigoureuse) est 


Ou 


À L(u(r,y)) = my) (u(x,y)). (12.608) 


Prenons maintenant un cas un peu plus compliqué où nous voudrions connaître les dérivées 
partielles de la fonction & donnée par 


pie, ÿ.2) = J(u(x, y), v(x, y, 2) (12.609) 
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où f:R?—R,u:R?—Ret v: R° —R. 

Commençons par la dérivée partielle par rapport à z. Étant donné que w ne dépend de z que 
via la seconde entrée de f, il est normal que seule la dérivée partielle de f par rapport à sa seconde 
entrée arrive dans la formule : 


Ov 


. (u(x, y), v(x, y, 2)) Ze). (12.610) 


net 
Ôz on | v 


La dérivée partielle par rapport à y demande de tenir compte en même temps de la façon dont f 
varie avec sa première entrée et la façon dont elle varie avec sa seconde entrée ; cela nous fait deux 
termes : 


Q Ô Ô Ô 0] 
eu) = (uen 2) + ya). (2611) 


Cette formule à une interprétation simple. Lançons un caillou du sommet d’une falaise. Son 
mouvement est une chute libre avec une vitesse initiale horizontale : 

GE) = dpt (12.612a) 

JU) = hp (12.612b) 


où vo est la vitesse initiale horizontale et ho est la hauteur de la falaise. Si nous sommes intéressés 
à la distance entre le caillou et le bas de la falaise (point (0,0)), le théorème de Pythagore nous 


dit que 
d(t) = 4/x2(t) + y2(t). (12.613) 


Pour trouver la variation de la distance par rapport au temps il faut savoir de combien la distance 
varie lorsque x varie et multiplier par la variation de x par rapport à t, et puis faire la même chose 
avec y. 


12.20.5 Accroissements finis et dérivées partielles 
PROPooCAWBooINcNx;j 


Proposition 12.249 (Accroissements finis). 

Soient des espaces vectoriels normés V et W. Soit une application f: V — W. Soient des points 
a,b € V tels que f est continue sur le segment [a,b] et partiellement dérivable dans la direction 
b— a sur ]a,b]. Alors il existe c € ]a, b] tel que 


F(b) = f(a) + (0sf)(c) (12.614) 
oùcela,b| etB=b—a. 


Démonstration. Nous considérons la fonction 


: [0,1| — W 
7e (12.615) 
tr f(a+t(b—a)). 
Par le théorème des accroissements finis 12.195, il existe s € [0,1] tel que !°° 
p(1) = (0) + g'(s)(1 — 0). (12.616) 
Autrement dit, 
f() = f(a) + (0gf)(a + s(b — a)). (12.617) 


Nous avons le résultat en posant c = a + s(b — à). 


109. Les a et b dans l’énoncé de 12.195 sont les valeurs s = 0 et s = 1 ici. Rien à voir avec les a et b d’ici qui sont 
des éléments de V. 
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LEMooNMTAooLgMkgH 

Lemme 12.250 (Accroissements finis[1]). 
Soient des espaces vectoriels normés V et W. Soit une fonction f: V — W qui est différentiable 
sur un voisinage O de a € V. Soient ve V ete > 0 tels que a + ev reste dans ©. 

Nous considérons une base de V pour donner un sens aux dérivées partielles 0,f. Alors il existe 
une fonction a: V — W telle que 

nm nm 

f(a + ev) = f(a) + y, evr(r.f) (a + >. evie;) + ea(e) (12.618) 
k=1 


i=k+1 


où la somme sur à est nulle dans le cas k = n. 


Démonstration. Nous commençons par nous attaquer à la dérivation par rapport à la première 
variable. La définition 12.231 de la dérivation partielle nous invite à poser 


o(t) = f(a+ ” evrer + tie). (12.619) 
k=2 
Nous avons : : 
p'(0) = v1(@1f)(a + > ever). (12.620) 
k=2 


Nous appliquons les accroissements finis 12.172 à la fonction @ en t = 0. Nous avons une fonction 
a: R — W telle que lims_,9 a(t) = 0 et 


p(t) = p(0) + tp/(0) + tai(t). (12.621) 
Nous écrivons cette égalité pour { = €, tout en rappelant que w(e) = f(a + ev) : 
nm nm 
f(a+ev) = p(e) = f(a+ » evrex) + evi(@1 f)(a + … evrex) + ea (€). (12.622) 
k=2 k=2 


Pour la suite, il suffit de recommencer en écrivant is EURER —= EV2€2 + E evrez dans le 
second terme. 


Voici une version un peu moins technologique. 
PROPooYYSMooUDxt1B 


Proposition 12.251. 
Soit une fonction f: V — R où V est un espace vectoriel métrique. Soit a € V tel que (d;f)(a) 
existe. Alors il existe une fonction a: R — R tel que 


f(a + ee;) = f(a) + e(d;f)(a) + eae) (12.623) 
et lime_,oa(e) = 0. 


Démonstration. Nous posons 
:R—R 
F (12.624) 
tr f(a +te;). 


Par hypothèse (et définition 12.231 de la dérivée partielle), la fonction est dérivable et 


p'(0) = (@.f)(a). (12.625) 
Nous appliquons le théorème des accroissements finis 12.172 sur la fonction 4 : 
(t) = (0) + #p/(0) + ta(s) Foto EE) 


pour une certaine fonction a: R — R qui vérifie lims_,0 a(t) = 0. En remplaçant 4 par sa valeur 
en termes de f dans (12.626), 


f(a+te;) = f(a) + (df)(a) + ta(t). (12.627) 
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12.21 Formes différentielles 


SecFormDiffRappel 
Nous parlerons de formes différentielles exactes et fermées dans la section 20.81. 


12.21.1 Décomposition dans la base duale 
DEFooMGXSooWioKie 


Définition 12.252. 
Soit U, un ouvert dans R”". Une 1-forme différentielle w sur U est une application 


: U — (R°)* 
É a (12.628) 
Te Wy- 
Une k-forme différentielle est une application 
w: U — LE;(R’",R) (12.629) 


telle que w, est alternée pour tout x. 
Étant donné que Li(R",R) est un espace vectoriel normé (définition 11.7), nous savons ce 


qu'est une forme différentielle continue ou de classe C*. 
REMooSKKSooDZFMAr 


Remarque 12.253. 
L'ensemble des 1-formes différentielles devient un espace vectoriel avec les définitions 


(w)x(v) = Aux (v) 


(12.630) 
(w + u)a(v) = wa(v) + Ur(v). 
Nous connaissons la base de (R”)* définie en 4.126. Nous allons noter ces formes par dx; : 


el = dt:vru 
EE 


en = dant VE 


Toute forme différentielle s’écrit 


nm 
ur = Ÿ a(r)dr (12.632) 

i=0 
où &1,...,4n Sont les composantes de w dans la base usuelle, et sont des fonctions à valeurs réelles. 
LEMooNSFKooLOKGGy 


Lemme 12.254. 
Une 1-forme différentielle est continue si les fonctions a; sont continues. La forme sera C* quand 
les a; seront C*. 


Pour un vecteur v = (v1,...,v,) on a donc par définition de dx; 
nm 
We(v) = > ai(x)vi. (12.633) 
i=0 


Ces fonctions a; peuvent être trouvées en appliquant w aux éléments de la base canonique de R” : 
aj(x) = wr(e;) (12.634) 


parce que w,(e;) = »,, a(z)dri(e;) = Ÿ, a«(r)ü; = a;(x). 
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12.21.2 L’isomorphisme musical 
Si G est un champ de vecteurs sur IR”, et si x € IR”, nous pouvons définir 


GRR EqDefBen 
v + (G(2),0) CHF) 


Pour chaque x, l'application G est une forme sur IR”, c’est-à-dire une application linéaire de 
IR” vers R. Nous écrivons que 
Ge (R°)°. (12.636) 


Nous pouvons ainsi déterminer le développement de G? dans la base des dx; en faisant le calcul 
Ge) = (G(x), ei) = Gi(x), (12.637) 


donc les composantes de G? dans la base dx; sont exactement les composantes de G dans la base 
Ei : 
GP, = Gi(x)dri + +: + Gn(t)dtn. (12.638) 


La construction inverse existe également. Si w est une 1-forme différentielle, nous pouvons 
définir le champ de vecteurs w* par la formule (implicite) 


wy(v) = wi(x), 0 (12.639) 
pour tout v € R”. Par définition, (wi)? = w. 


Lemme 12.255. 
En composantes nous avons : 


(x) = (a1(x),.…., an(x)). (12.640) 


Si G est un champ de vecteurs, alors (G?)} = G. 


12.22 Différentielle 


Nous avons déjà donné une définition abstraite de la différentielle dans la définition 11.226. 
Nous en voyons maintenant quelques motivations dans le cas de fonctions sur R? ou R”. 


12.22.1 Exemples introductifs 
SEBSECooLPRQooJRQCFL 


La notion de dérivée est associée à la recherche de la droite tangente à une courbe. Reprenons 
rapidement le cheminement. La dérivée de f: R — R au point a est un nombre f'(a), qui définit 
donc une application linéaire dont le coefficient angulaire est f’(a), et que nous notons df, : 


dfa:R—R 
Ï ; (12.641) 
ur f'(a)u. 
La droite donnée par l’équation 
y(a+u) = f'(a)u (12.642) 


est parallèle à la tangente en a. Pour trouver la tangente, il suffit de la décaler de la hauteur qu’il 
faut. L’équation de la droite tangente au graphe de f au point (a, Î (a)) devient 


y(x) = fa) + f'{a)(x — a) = (a) + dfa(x — à). EqDiffRapTeDer, 


Nous nous proposons de généraliser cette formule au cas de la recherche du plan tangent à une 
surface. 
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Exemple 12.256. 
Considérons f(x, y) = x?y + y’e*. Les dérivées partielles sont 


= = 2ry + y'e° 
(12.644) 
= 3? + 2ye*. 


Cet exemple était l'exemple facile où tout se passe bien. 


Exemple 12.257. 
Les choses sont moins simples lorsqu'on considère la fonction suivante : 


f(x, y) = Le F : . (12.645) 


On voit que pour tout x et tout y, nous avons f(x,0) = f(0,y) = 0. Donc cette fonction est nulle 
sur les axes horizontaux et verticaux. Nous avons en particulier 


(0,0) = 0 
of (12.646) 
ag (0-0) = 0. 


Donc ces dérivées partielles existent. 


Il n’est par contre pas question de dire que cette fonction « va bien » autour du point (0,0). 
En effet si nous regardons sa valeur sur la droite diagonale y = x, nous avons 


2 


f(x, x) = © — 


Se (12.647) 
DA 


1 
5 
Par conséquent si nous suivons la fonction le long de la droite y = x, la hauteur vaut j en 
permanence, sauf juste en (0,0) où la fonction fait un grand plongeon ! 


sage: var(’x,y’) 

(x, y) 

sage: f(x,y)=(xxy)/(xxk2+y*xx2) 
sage: plot3d(f,(x,-2,2),y(-2,2)) 


D'ailleurs elle fait un plongeon le long de toutes les droites (sauf verticale et horizontale). En 
effet si nous regardons la fonction le long de la droite y = mx, nous avons 


ma? m 


E — . 12.648 
TRE) a? +m?a? l+m? ( ) 


La fonction est donc constante sur chacune de ces droites. Il n’est donc pas question de dire que 
cette fonction est « dérivable » en (0,0), vu qu’elle fait des grands sauts dans presque toutes les 
directions. VA 


Nous devons donc trouver mieux que les dérivées partielles pour étudier le comportement des 
fonctions un peu problématiques. 
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12.22.2 Différentielle 


Nous nous souvenons de l'équation (12.399) qui nous dit que pour une fonction d’une variable 
la dérivabilité signifiait qu’il existait un nombre £ et une fonction a tels que 


f(x) = f{a) + {(x — a) +(x— a)a(x — a) (12.649) 


et lims_,o a(t) = 0. 
En nous inspirant de cela, nous comprenons peut-être un peu le pourquoi de la définition 11.226. 


12.258. 

L'objet df, est en soi une application df,: R” — R”. Nous notons df,(u) la valeur de df, sur le 
vecteur u € R”?. En particulier, l’application df est une forme différentielle au sens de la défini- 
tion 12.252. 


12.259. 

Les propositions 12.269 et 12.272 vont montrer qu’en étudiant bien les dérivées partielles, nous 
pouvons conclure à la différentiabilité d’une fonction. Attention cependant, nous verrons dans 
l’exemple 12.278 que l’existence des dérivées directionnelles partielles ne permettait pas de conclure 
à la différentiabilité. 


12.22.33 Matrice de la différentielle 


La différentielle est une application linéaire. Elle possède donc une matrice lorsque des bases 


sont fixées. 
PROPooBMROo0oThgLuU 


Proposition 12.260. 
Soient une application différentiable f: R? — R' et ae R”. Dans les bases canoniques de R” et 
IR”, la matrice de df, est 


CA I | (a). (12.650) 


Démonstration. Le lien entre matrice et application linéaire est vu dans la proposition 4.70. Dans 
le cas des bases canoniques de R”* et IR” nous savons qu’'extraire une composante revient à prendre 
le produit scalaire. Nous avons donc 


(dfa)ij = (dfa(e;)); = dfa(e;) * ei. (12.651) 


La linéarité de la dérivation donne alors 


d d Of 
sde) -ae [7 (a + |. = | (a F te)] Ad. (265) 
LEMooDDUZooLwXKkRp 


Lemme 12.261 ([1]). 
Soit une fonction g: R — R de classe C°. Nous posons 


f:R-R 


(x, y) + g(x). (12.653) 


Alors f est de classe C®© sur R?. 


Démonstration. Le problème lorsqu'il faut démontrer qu’une fonction est de classe C"?, c’est que 
d* f sera une application de IR? vers un espace qui est un terrible emboîtement de £(R?,...). 
Pour traiter cette difficulté, nous considérons les espaces suivants : W — IR et par récurrence 
Ven = L(R?, Vs). 
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Et nous considérons également les éléments 


G:R —R 
; (12.654) 
(uv) u 
et plus généralement ax € V4, donné par 
ag: R°? — V,- 
; _ (12.655) 


(u,v) — uaz-_1. 


Notons que dans l’expression uay_1, il s’agit d’un produit entre un scalaire u € KR et un vecteur 


Qk+1 € Vx-1. 
Nous prouvons maintenant par récurrence que d” (ab) = gK) (a)ax, en utilisant directement la 
définition. 


(1) 


Initialisation 
Pour k = 1, nous calculons 


|f(a+ h1,0+ ho) mie b)— g'(a)æ(h)| _ Ig(a+ hi) = — g'(a)hu] (12.656) 


2 
Notre but est de calculer la limite de cela lorsque h KE, 9 avec À # 0. L'hypothèse sur la 
dérivabilité de g nous indique que si 0 < |t| < 6, alors 


lg(a + €) — g(a) — tg(a)l RON 


él 


Nous considérons donc la boule épointée de IR? de rayon 6 : B = B((0,0),6)\{(0,0)}, et nous 
considérons h € B. Deux cas sont à distinguer : h; = 0 et h1 # 0. 
Si A1 = 0, alors 
|g(a + h1) — g(a) — g'(a)hil 
[Lel| 


Sinon nous avons 0 < h1 < |h| < Ô et donc 


lg(a + 1) — ga) — g'(a)hl L lg(a + M) — g(a) — g'(a)ml _. (12.659) 
A ’ | 


[on 
par la relation (12.657). Nous avons donc bien 


je [f(a + h1,d + h2) — f(a,b) — g'(a)ai(h)| 
h—0 IR] 


= 0. (12.658) 


= 0. (12.660) 


Récurrence 
Nous supposons que d* fab = g%)(a)ar, et nous devons prouver que d*f est différentiable 
et que d*+1 fab) = gE+1) (a)ar+1. Pour cela nous introduisons tout dans la définition de la 
différentielle pour voir ce qui arrive. 
Nous avons : 
À foa+hab4ho) = Ef(ab) — 98 (a)ax+1 (1, Ra) 
IR] 
90) (a+ hijay — 9) (a)az — gKTD(a)hiaz 
[Lol | 
Cela est, pour chaque À Æ 0, un élément V4, mais le coefficient ay se factorise de telle sorte 
que nous devons seulement calculer la limite (si elle existe) 


bn 9% + h1) = 90 (a) — ag 0 (a) 
id nl 


(12.661) 


(12.662) 


Le même jeu de séparation entre h1 = 0 et h1 Æ 0 que dans le cas k = 1 nous permet de 
déduire que cette limite existe et vaut zéro, grace à la définition de g+1), 


Nous avons donc prouvé que f est différentiable autant que fois que souhaité. Elle est donc de 


classe CT comme annoncé. 
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12.22.4 Différentielle, dual et forme différentielle 
12.22.4.1 Dans la base duale 
Nous avons déjà parlé en (12.631) de la base {dx;};-1...n des formes différentielles sur R”. 


Proposition 12.262. 
La forme de base dx; est la différentielle de la fonction de projection 


proj,: R° —R 


(12.663) 
vrR UV. 
Autrement dit nous avons 
d(proj;)a = di (12.664) 
pour tout à et pour tout a. 
Démonstration. Le quotient 
proj(a + h) — proj,(a) — dæ(h) : 


IA] 


est toujours nul. La limite est a fortiori nulle. 


Nous avons donc (dproj;); = dx; pour tout a. Notons que les fonctions dx; et proj, sont les 
mêmes. Cela justifie la notation « dx; » pour les formes différentielles de base, parce que ce sont 
les différentielles des fonctions « coordonnées » que nous pouvons noter x;. 

Étant donnée une fonction f, il est légitime de nous demander comment (si elle existe) la 
différentielle se décompose en chaque point dans la base duale. C’est-à-dire fixer les fonctions a; 
en termes des dérivées de f pour avoir 


da > . (a)dx;. (12.666) 


C’est ce que nous allons faire dans le corolaire 12.267. 


Exemple 12.263. 
Si F: R? — R est une fonction C?, sa différentielle est la forme 


dE = — dx + —dy. (12.667) 
T y 


Si nous nommons f et g les fonctions ©,F et ©,F, nous avons donc 


Df = fdx + gdy, (12.668) 

qui vérifie 
Oyf = 0x9) (12.669) 
parce que . gr ge 28 . Ce que nous avons donc prouvé, c’est que PA 


Lemme 12.264. 
Si fdx + gdy est la différentielle d’une fonction de classe C? sur R?, alors Oyf = 0x9. 
12.22.5 Ce n’est pas la différentielle extérieure 


Il existe une notion de différentielle extérieure, mais ce n’est pas celle-là que nous utilisons la 
majorité du temps. En particulier si E et F sont des espaces vectoriels normés, lorsque f: E — F 
est une fonction, df est une application 


df:E—L(E,F) (12.670) 
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et la différentielle seconde est la différentielle de cette application-là. Chose faisable parce que 
L(E,F) est un espace vectoriel on ne peut plus respectable. 

Soit D € R’. Par définition de la différentielle extérieure d’une 1-forme, nous avons une formule 
de Leibnitz 


d(fw) = df À w + fdw. (12.671) 
En particulier, 
d(fdx) = df À d Had) ee a +03 A d (12.672) 
x) = x Des - æ dy y À dx. | 
=0 = 


Attention : la différentielle extérieure n’est pas la différentielle usuelle. Certes dans le cas d’une 
O-forme (c’est-à-dire d’une fonction), les deux notions coïncident, mais ça ne va pas plus loin. La 
différentielle extérieure vérifie d’w = 0 pour tout w, y compris pour les fonctions : si w = df alors 
duw = 0. 

Nous mentionnerons la différentielle extérieure dans le cas de 

(1) Théorème de Stockes 20.68. 


12.22.6 Continuité, dérivabilité et différentiabilité 


Le théorème suivant reprend les principales propriétés d’une fonction différentiable. Il est à ne 
pas confondre avec le théorème 12.306 qui dira que si les dérivées partielles sont continues sur un 
voisinage de a, alors f est différentiable en a. 

ThoRapPropDäaff8i 
Proposition 12.265. 
Soit un espace vectoriel normé V et une fonction f: IR? — V. Si f est différentiable au point 
a € R" alors 
(1) elle est continue en a, 
(2) elle admet une dérivée dans toutes les directions de R”, 


(3) toutes les dérivées directionnelles ©, f(a) existent et nous avons l'égalité 


dfa: R'—R7 


EgDiff 
ur dfa(u) = 3 (a) = > TL (a)us, CEA) 


si les u; sont les composantes de u dans la base canonique R”. 


La dernière égalité sera de temps en temps utilisée sous la forme 


dfi(u) = L[y(a + tu)] EIRE TE 


dt 


Démonstration. La limite 


in LG +) — S{a) = TH) 


Er Vin 


— 0, 
implique que 
dm If(a+h)— f(a) —T(h)lh = 0. 
Comme T est dans £L(R”,R”), on a limp_,0 T'(h) = 0, d’où la continuité de f au point a. 
Si u est un vecteur non nul, la différentiabilité de f au point a implique 


ira LÉ + tu) — (a) = Tttu)ln 
10 féulm 


= 0, 


par la linéarité de T et par l'égalité |tulh = [t[|ulh on obtient 


(a + tu) — (a) 


t—0 fé 


=T(u): 


Donc f est dérivable suivant le vecteur u et ©, f(a) = T(u) = df,(u). 
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CORo0oTBUMooHPncPH 
Corolaire 12.266 (Différentielle et dérivée). 
Soit une application différentiable f: R — V où V est un espace vectoriel normé. Alors f'(u) = 


dfu(1). 
Démonstration. En vertu de la proposition 12.265, nous avons 
d() = L[u+4)] = fu) (12.675) 
dt t=0 


Nous avons utilisé le fait que pour une fonction sur R, l’unique dérivée partielle est la dérivée 
normale. 


CORooXURPooQMKvB1 
Corolaire 12.267. 
Si f est différentiable, alors la forme différentielle df, se décompose en 


dfa = D (Gif)(a)dx:. (12.676) 


t 


Démonstration. Vue la définition des formes dx; nous pouvons remplacer u; par dx;(u) dans l’éga- 
lité (12.673) et écrire 


dfa(u) = D (Gi f)(a)dxi(u) (12.677) 


U 


et donc écrire l’égalité demandée. 


Le lemme suivant regroupe quelques égalités avec lesquelles nous allons souvent travailler. Il 


explique comment sont liées les dérivées directionnelles, les dérivées partielles et la différentielle. 
LemdfaSurLesPartielles 


Lemme 12.268. 
Si f:R°" — R" est une fonction différentiable, alors 


° d LR 
dfa(u) = CL (a) = Ælf(a+u)] = ue 
i=1 


(a) = Vf(a) : u (12.678) 


t 
pour tout vecteur u € R?? 


Démonstration. La première égalité est la proposition 12.265, et la seconde est seulement la défi- 
nition de la dérivée directionnelle avec des notations un peu plus snob. En particulier nous avons 


of 


dfa(ei) — Le 


(a). (12.679) 


Pour le reste c’est la linéarité de la différentielle qui joue : le vecteur u peut être écrit de façon 
unique comme combinaison linéaire des vecteurs de base 


mm 
u= D wes, WER,Vie{1,...,m}. 
i=1 


Alors, la linéarité de df, nous donne 


m 


dfa(u) = dfa Ê “es =) wide)» vx SE (a) (12.680) 
i=1 i=1 É 


i=1 


Le lien avec le gradient est la définition du produit scalaire (9.169). 


La formule df,(u) = a f(a + tu)| est bien utile pour calculer des différentielles, mais 
=0 
elle ne permet pas de prouver que f est différentiable. Autrement dit, même si le calcul de la 
dérivée . | f(a+ tu)] donne un résultat pour tout u, nous ne pouvons pas en déduire que f est 
t=0 


différentiable au point a. 
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PropExistDiffUn 
Proposition 12.269. 
Soient f une fonction de x et y et un point (a, b) € R?. Si les nombres ©, f(a,b) et 0, f(a,b) existent 
et si il existe une fonction a: R — R telle que 


Of of 
fu) = S(a,b) + 2 (a,8)(x — a) + EL b)(y — b) eqcritDi fé tapant 


+ Ce,2) — (a b)la(I(æ,2) — (a,0)1) 


et 


lim a(t) = 0. (12.682) 


alors f est différentiable en (a, b). 


12.270. 
Dans cet énoncé nous avons écrit d((x,y),(a,b)) la distance entre (x,y) et (a,b), c’est-à-dire le 


nombre 4/(x — a)? + (y —b)?2. Afin d'écrire l’équation (12.681) sous forme plus compacte, nous 
introduisons le vecteur 


Lab) 
Vf(a,b) = | 5% (12.683) 
EAU b). 
y 
L'équation (12.681) devient alors 
FC) = f(P) + Vf(a,b) : (X = P) + |X — Pla(|X - PJ). Fa SEE 


Le vecteur (Vf)(a,b) est appelé le gradient de f au point (a,b). 


Remarque 12.271. 

Nous avons introduit la notation Vf pour le gradient d’une fonction f. Nous allons par la suite 

introduire V + F' pour la divergence du champ de vecteurs F' et V x F° pour son rotationnel. 
Toutes les formules pour Vf, V : F'et V x F peuvent facilement être mémorisées en pensant 

à V comme étant le vecteur 


vla EQooQKGop Per ag 


Nous allons ici cependant seulement penser à (12.685) comme un moyen mnémotechnique ; nous 


ne donnons pas de définition à « V » tout seul. 
PropExistDiffDeux 


Proposition 12.272. 
Soit f une fonction de deux variables admettant des dérivées partielles 0, f(x, y) et f(x, y) qui 
sont elles-mêmes des fonctions continues de x et y. Alors la fonction f est différentiable partout. 


Proposition 12.273. 
Si f est différentiable en (a,b) alors pour tout vecteur u, la fonction 


v:R—R 
(12.686) 
tr f(a+tui,b+ tu) 
est dérivable en 0 et on a 
p'(0) = Vf(p) ‘ u (12.687) 


où nous avons noté p = (a,b). 


Démonstration. Réécrivons la formule (12.684) sous la forme 


ÏG) = f@) + Vf() : (x —p) + x —pla(lx — pl). (12.688) 
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Cela étant vrai pour tout x, nous l’écrivons en particulier pour x = p + tu où t est un réel et u est 
le vecteur unitaire choisi. Nous avons donc 


F(p +tu) = f(p) +{Vf(p) : u + ltula(ltul). (12.689) 

En utilisant le fait que u est unitaire, |tu] = [t||u] = |t}. La dérivée de @ en 0 est alors donnée par 
t _ 

lim J@+ ” JG) _ lim V/(p) : u + a((fl). (12.690) 


Lorsque nous prenons la limite, le membre de gauche devient /(0) tandis que dans le membre de 
droite, le second terme disparaît. Nous avons finalement 


p'(0) = Vf(p) : u (12.691) 


12.22.7 Calcul de valeurs approchées 


Si nous remplaçons les accroissements z — a et y — b par h et k, le critère de différentiabilité 


oo ds à 
f(a+h,b+k) = f(a,b) + 3 (@ b)h + a (a, b)k (12.692) 


+ VR2 + k2a(V/h2 + k2). 
Le dernier terme du membre de droite tend vers zéro à une vitesse double lorsque À et k& tendent 


vers Zéro : d’une part parce que Vh? + k?2 tend vers zéro et d’autre part parce que a(v R2 + k2) 
tend vers zéro. Nous avons donc la « bonne » approximation 


s'écrit 


fe, y) = f(a, b) + CL (a, b)(x — a) + SL (a bj(y—b). … FaFormAPPrON ET Al 


lorsque (x,y) n’est pas trop loin de (a,b). Cette expression est évidemment une généralisation 
immédiate de l’équation (12.402). Elle exprime que l’on peut obtenir des informations sur la valeur 
d’une fonction en (x,y) si on peut calculer la fonction et ses dérivées en un point (a,b) non loin 


de (x, y). 
Cette formule peut aussi être vue sous la forme suivante, plus pratique dans certains calculs : 
0 Ô EqgFormA D 
f(a + Ar,b+ Ay) = f(a,b) + Ar (a, b)+ Av (a p)FAFOTRAPPr OX ET ARTE, 


Exemple 12.274. 
Prenons la fonction f(x, y) = cos(x)sin(y) et calculons une approximation de 


Ce + 0.01, . + 0.03). (12.695) 
D'abord les dérivées partielles sont 
Ô 
(a, y) = — sin(a)sin(y) 
. (12.696) 
Pt ) = cos(x) cos(y) 
Nous allons utiliser l’approximation 
T T TT Of,T 7 Of,T 7 
— OI, — ; = f(—, — 0.01——(—, — 0.03—(—, —). 12.697 
FA + 00h PO PE OR OS (oo) C2 
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Nous avons 


Of,T 7 TT. V3 
( : ) = — sin — sin — — 

Of, 7 T 

(3° 2) DS CSS = 0 
Par conséquent 

T T 1 a 1 3 
FC +001 +008)eS 00: (12.699) 
sage: var(’x,y’) 
(x, y) 
sage: f(x,y)=cos(x)*sin(y) 
sage: a=f(pi/3+0.01,pi/2+0.03) 
sage: numerical_approx(a) 
0.491093815387986 
sage: b=1/2-sqrt(3)/200 
sage: numerical_approx(b) 
0.491339745962156 
sage: numerical _approx(a-b) 
-0.000245930574169814 
Cela fait une erreur de l’ordre du dix millième. 
A 


Remarque 12.275. 
Les esprits les plus critiques diront que cette vérification par Sage n’en est pas une parce que Sage 
a certainement utilisé un algorithme d’approximation qui se base sur la même idée que ce que nous 
venons de faire, et que par conséquent le fait qu’il obtienne le même résultat que nous est un peu 
tautologique. 

Ils n'auront pas tort. Cependant, le code source de Sage est disponible publiquemen 
pouvez aller le lire et vérifier qu’il y a effectivement une preuve que le résultat fourni par Sage 
possède une bonne dizaine de décimales correctes. 


+ 118 ; VOUS 


Cette disponibilité publique du code source est une des nombreuses différences fondamentales 
entre Sage et votre calculatrice !!!. Dois-je vous rappeler qu’un des principes fondamentaux de 
l'éthique scientifique est que les résultats et les méthodes utilisés doivent être absolument ouverts 
à la vérification et à la critique de tous ? 


12.22.8 Différentielle et tangente 


La notion de dérivée partielle (ou de dérivée suivant un vecteur) pour une fonction de plusieurs 
variables n’est pas une généralisation de la notion de dérivée en une variable d'espace. En fait, du 
point de vue géométrique, la dérivée de la fonction g : IR — R au point a est la pente de la ligne 
droite tangente au graphe de g au point (a, g(a)). Cette ligne, d’équation r(x) = g'(a)x + g(a), est 
la meilleure approximation affine du graphe de g au point a, comme à la figure 12.9. 

Le graphe d’une fonction f de R? dans R est une surface de deux paramètres dans IR. Si l’ap- 
proximation affine d’une telle surface au point (x,y, f(x, y)) existe, alors elle est un plan tangent. 
En dimension plus haute, le graphe de la fonction f : IR” — IR est une surface de m paramètres 
dans R”+l et son approximation affine (si elle existe) est un hyperplan de R"?. 

Nous allons voir que si f prend ses valeurs dans R’ l’approximation affine de f au point a est 
l'élément de f(a) + £L(R”,R”) qui ressemble le plus à f au voisinage de a. Plus précisément, on 
utilise les définitions suivantes. 


110. Voir http://www.sagemath.org 
111. et les autres logiciels de type fenêtre, pomme ou feuille d’érable. 
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FIGURE 12.9: Tangentes au graphe d’une fonction d’une gasällsTangentSegment 


Définition 12.276. 
Soient f et g deux applications d’un ouvert U de R” dans R”. On dit que g est tangente à f au 
point a EU si f(a) = g(a) et 

… LfG@) = gta) 


PET 


= (0. 


La relation de tangence est une relation d'équivalence. Nous sommes particulièrement intéressés 
par le cas où f admet une application affine tangente au point a. 


FIGURE 12.10: Interprétation géométrique de la différenbiélirigpifferentielle 


En ce qui concerne l'interprétation géométrique, si nous regardons la figure 12.10, et d’ailleurs 
aussi en voyant la définition 11.652, la fonction est différentiable et la différentielle est T'si il existe 
une fonction « telle que 


f(a+u) — f(a) — T(u) = a(u) (12.700) 


où la fonction a satisfait 


im JC Lo EqPrenquets 


u>0 |ul 


C’est cela qui fait écrire f(a + u) — f(a) — dfa(u) = o(|u]) à ceux qui n’ont pas peur de la notation 
o. 

La différentielle df, est donc la partie linéaire de l’application affine qui approxime au mieux 
la fonction f autour du point a. La notion de différentielle est la vraie généralisation du concept 
de dérivée pour fonctions de plusieurs variables, en outre elle nous permet d’expliciter la relation 
qui associe au vecteur u la dérivée ©, f(a), pour f et a fixés. 


Remarque 12.277. 
Si on remplace les normes | : | et | : |, par d’autres normes, l’existence et la valeur de la 
différentielle de f au point a ne sont pas remises en cause. En effet, soient | : |17 une norme sur 
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R?? et | - |x une norme sur R”. Par le théorème 11.46, ces normes sont équivalentes à |.|, et 
|.]n respectivement ; il existe donc des constantes k, K, l, L > 0 telles que pour tout vecteur w de 
R’"* et tout vecteur v de R" 


klula < lulm < Klulw, 
lola < lvln < Lun. 


Les éléments de £L(R’”,R") sont les mêmes et on a 


lIfQa+h)—f(a)—-T(h)ln L fa +h)— f(a) = T(h)ln 


K All ù Ml < 
_LIf(a+h)—f(a) -T(k)|n (12.702) 
D (Alar 


Il est donc possible, pour démontrer la différentiabilité ou pour calculer la différentielle, d'utiliser 
le critère (11.652) avec une norme au choix. Parfois c’est utile. 


12.22.9 Prouver qu’une fonction n’est pas différentiable 


Chacun des points du théorème 12.265 est en soi un critère pour montrer qu’une fonction n’est 
pas différentiable en un point. 


12.22.9.1 Continuité 


Le premier critère à vérifier est donc la continuité. Si une fonction n’est pas continue en un 
point, alors elle n’y sera pas différentiable. Pour rappel, la continuité en a se teste en vérifiant si 


bhnsss fr flo: 


12.22.9.2 Linéarité 


Un second test est la linéarité de la dérivée directionnelle par rapport à la direction : l’appli- 
cation u CT (a) doit être linéaire, sinon df, n'existe pas. 
Exemple0046Diff 
Exemple 12.278. 
Examinons la fonction 
f:R-R 
Ty? 
(y) 4 x? + y 
0 sinon. 


si (x,g) Æ (0,0) (12.703) 


Prenons u = (u1,u2) et calculons la dérivée de f dans la direction de w au point (0,0) : 


ou t—0 t 


. tuit?u3 
= lim D 2 
0 t \t2uf + téus 


2 
_. ue : (12.704) 
0 Vuf + t2us 
uÿ 
— siu] ZÛ 
= du 
0 Si Uj = 


Cette application n’est pas linéaire par rapport à u. En effet, notons 


A:R'—-R 
f (12.705) 
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et vérifions que pour tout u et v dans R” et À € R, nous ayons A(Au) = ÀA(u) et A(u + v) = 
Au) + A(v). La première égalité est vraie, parce que 


Aus uè 
A(Au) = A(Au:, Au) À XA(u). (12.706) 
AU] u1 
Mais nous avons par exemple 
1 
A((0,1) + (2,3)) = A(2,4) = : —8, (12.707) 
tandis que : 
A(0,1) + A(2,3) = 0 + 9 # 8. (12.708) 


La fonction f n’est donc pas différentiable en (0,0), parce que la candidate différentielle, df{o,o)(u) = 


25 (0, 0), n’est même pas linéaire. 
A 


Voici une autre façon de traiter la fonction de l’exemple 12.278. 
ExeFHmCLIlI 


Exemple 12.279. 
La figure 12.11 représente le domaine d’une fonction f: IR? — R, et sur chacune des parties, elle 
est définie différemment. 


RE ee A ee ee eee l 
Ty T—Y ; 
D 3 
Pre Tree k é 
c+y | y 
SORTE ER ; 
FIGURE 12.11: La fonction de l’exemple 12.279. LabelFigFWJuNhU 
L'expression de f est ici 
Ty six <0ety>0 
T — sitz>0ety>0 
fau) = 47, ? : (12.709) 


z2y siz>0ety<0 


x+y sinon. 


On note que les deux axes forment une zone à problèmes. La zone hors des axes est un ouvert 
sur lequel f est différentiable car composée de polynômes. Analysons chacun des points de la forme 
(a, b) dans la zone à problèmes (c’est-à-dire si ab = 0). 

(1) Sia=0etb>0 Un tel point (0,b) est sur l’axe vertical, dans la moitié supérieure. Pour 
calculer la limite de f en ce point, on peut restreindre notre étude au demi-plan ouvert y > 0, 
ce qui revient à comparer la limite 


lim æ,y)= lim x =0—-b= —-b 
(æ,y)—(0,b) fe) (æ,y)—(0,b) * 
y>0 y>0 


zZz0 æ>0 
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avec la limite 


lim æ,y)= lim xy=0b=0 
(æ,y)—(0,b) f(e,9) (æ,y)—(0,b) 

y>0 y>0 

æ<0 æ<0 


qui sont différentes puisque b est supposé non nul. 

Conclusion : f n’est pas continue en un point du type (0,b) avec b > 0. 

Sia=0etb<0 Un tel point (0,b) est sur l’axe vertical, dans la moitié inférieure. Pour 
calculer la limite de f en ce point, on peut restreindre notre étude au demi-plan ouvert y < 0, 
ce qui revient à comparer la limite 


lim z,y)= lim x?y=0b=0 
en PTE Ron TV 
y<0 y<0 
æZ0 LEÛ 
avec la limite 
lim  f(x,y)= lim x+y=0+b=b 
(æ,y)—(0,b) (æ,4) (æ,y)—(0,b) 
y<0 y<0 
x<0 x<0 


qui sont différentes puisque b est supposé non nul. 

Conclusion : f n’est pas continue en un point du type (0,b) avec b < 0. 

Sia>0etb=0 Un tel point (a,0) est sur l’axe horizontal, dans la moitié droite. Pour 
calculer la limite de f en ce point, on peut restreindre notre étude au demi-plan ouvert x > 0, 
ce qui revient à comparer la limite 


lim  f(x,y) = lim zx—-y=a-0=a 
(x,y)—(a.0) ( ) (x:y)—(a.0) 

æ>0 x>0 

yZ0 y>0 


avec la limite 


lim z,y)= lim x?y=a0=0 
(æ,y)—(a.0) fe) (æ,y)— (a,0) 

æ>0 æ>0 

y<0 y<0 


qui sont différentes puisque a est supposé non nul. 
Conclusion : f n’est pas continue en un point du type (a, 0) avec a > 0. 


Sia<0etb=0 Un tel point (a, 0) est sur l’axe horizontal, dans la moitié gauche. Pour 
calculer la limite de f en ce point, on peut restreindre notre étude au demi-plan ouvert x < 0, 
ce qui revient à comparer la limite 


lim  f(x,y)= lim xy=ab=0 
(æ,y)—(a.0) (2) (æ,y)—(a,0) 

æ<0 æ<0 

y>0 y>0 


avec la limite 


lim Æ,y) = im æ+y=a+0=a 
et LT dE 

æ<0 x<0 

y<0 y<O 


qui sont différentes puisque a est supposé non nul. 

Conclusion : f n’est pas continue en un point du type (a, 0) avec a < 0. 

Sia=0etb—=0 Le cas du point (0,0) est particulier, puisque il est adhérent aux quatre 
composantes du domaine où la fonction est définie différemment. Pour étudier la continuité, 
il faut donc étudier quatre limites. Ces limites ont déjà été étudiées ci-dessus et valent toutes 
0, ce qui prouve la continuité de f en (0,0). 


En ce qui concerne la différentiabilité, on sait qu’il est nécessaire que toutes les dérivées 
directionnelles existent. Calculons la dérivée dans la direction (0,1) (au point (0,0)) : 


= (0.0) +H(0,D)— O0 FO 
t—0 t t—0 t 
10 10 
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qu’on sépare en deux cas, car f(0,t) possède une formule différente si t < 0 ou sit >0: 


02) fm 400 = imp Et = 1 
lim L _ t<0 (0,t) t< 

0 à lims-0 2 2 limeo dt = 1 
t20 120 


ce qui prouve que la limite n'existe pas, donc que la dérivée directionnelle n’existe pas, et 
finalement que la fonction n’est pas différentiable. 

Conclusion : La fonction donnée est continue hors des axes et au point (0,0), mais discontinue 
partout ailleurs sur les axes. Elle est différentiable hors des axes, mais ne l’est pas sur les 
axes. 


A 


12.22.93 Cohérence des dérivées partielles et directionnelle 


Dans la pratique, nous pouvons calculer ©, f(a) pour une direction u générale, et puis en déduire 
Cxf et 0,f comme cas particuliers en posant uw = (1,0) et u = (0,1). Une chose incroyable, mais 
pourtant possible est qu’il peut arriver que 


ol Ô 
À (a) #Y f (a)u. (12.710) 
Ceci se produit lorsque f n’est pas différentiable en a. 


12.22.9.4 Un candidat dans la définition (marche toujours) 


Lorsqu'une fonction est donnée, un candidat différentielle au point (a1,a2) est souvent assez 
simple à trouver en un point : 


© Ô 
T(u1,u2) = (ar, as + 2 (ax aa)u. (12.711) 


L'application Test la candidate différentielle en ce sens que si la différentielle existe, alors elle est 
égale à T. Ensuite, il faut vérifier si 


_ f(x, y) — f(ar, a2) — T((x, y) — (ai, a2)) 
(x,y)—{a1 a) (x, y) — (ar, a2)| 


= 0 Fe 5) 


ou non. Si oui, alors la différentielle existe et df{,4)(u) = T(u), sinon !, la différentielle n’existe 
pas. 

Attention : dans la ZAP, les dérivées partielles 0,f et @,f ne peuvent en général pas être 
calculées en utilisant les règles de calcul (c’est bien pour ça que la ZAP est une zone à problèmes). 
Il faut d'office utiliser la définition 


fai +t,a2) — f(a1, a2) 


7. (1,0) = lim ; : (12.713) 
et la définition correspondante pour à, f. 
Conclusion 
Soient f: AC R? — R”, et a € Int(A). Si f est différentiable en a, 
(dfa(es))i = d(fi)a(es) = Ch (a) = [Jac(f)ialis (12.714) 


et la matrice de l’application linéaire df, est la matrice jacobienne m x n de f en a notée Jac(f)l. 


112. y compris si la limite (12.712) n’existe même pas. 
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12.22.10 Gradient 


Définition 12.280. 
Soit f une fonction différentiable de R” dans R. On appelle gradient de f la fonction V'f : 
IR — R* de composantes 


Gif... 0mf. 


Soit f une fonction de R” dans R”, f(a) = (f1(a),..., fa(a))!. On appelle matrice jacobienne 
de f la fonction J(f) : R° — Rx R’? définie par 


fifa) ... Omfi(a) 


ar 


.. (12.715) 
O1 fn(a) ere Om fn (a) 


12.22.11 Linéarité 


La proposition suivante signifie que la différentiation est une opération linéaire sur l’ensemble 


des fonctions différentiables. 
PropDiffLineaire 


Proposition 12.281. 
Soient f et g deux fonctions de U € R”* dans R” différentiables au point a EU, et soit À dans R. 
Alors les fonctions f + g et Àf sont différentiables au point a et on a 


d(f + g)(a) = df(a) + dg(a), 


d(Xf)(a) = Xdf(a), (12.716) 
Démonstration. 
im GG +R) + ga + h)) — (F(a) + g(a)) — df(a).h — dg(a).hl, | 
Éi (Am < 
1 If(a+h) — f(a) — df(a).h|: fn |g(a + À) — g(a) — dg(a).hn | | (12.717) 
ot Am h— 0m IA ; 


De même on démontre la propriété d(\f)(a) = Adf(a). 


12.23 Produit 


Soient f et g deux fonctions de IR’ dans IR’. Nous notons f - g la fonction de IR’ dans R 
donnée par le produit scalaire point par point, c’est-à-dire 


CF: g)(x) = f(x) : g(x) (12.718) 


pour tout x € R”'. Le point dans le membre de droite est le produit scalaire dans R”. Le cas 
particulier n = 1 revient au produit usuel de fonctions : 


(fg)(x) = f(x)g(x). (12.719) 
LemDiffProsuid 
Lemme 12.282. 
Si f et g sont des fonctions différentiables sur R°? à valeurs dans R, alors la fonction produit f g 
est également différentiable et 


(dfg)a = g(a)dfa + F(&)dga ED ARE) 


au sens où pour chaque u dans R”?, 


(dfg)a(u) = g(a)dfa(u) + f(a)dga(u). (12.721) 
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Démonstration. Ce que nous devons faire pour vérifier la formule 12.720, c’est de vérifier le critère 
(11.652) en remplaçant f par fg et T(h) par g(a)df(a).h + f(a)dg(a).h. 
Ce que nous avons au numérateur est 
R—(fg)(a+h)—(fg)(a) — g(a)df(a).h — f(a)dg(a).h 
= f(a+h)g(a+h)— f{a)g(a) — g(a)df(a).h — f(a)dg(a).h. 


Maintenant, nous allons faire apparaitre (f(a+h)— f(a)—df(a))g(a+h) en ajoutant et soustrayant 
ce qu'il faut pour conserver à : 


# = (f(a+h)— f(a) — df(a).h)g(a + h) 
+ f(a)g(a + h) + g(a + h)df(a).h (12.723) 
— f(a)g(a) — g(a)df(a).h — f(a)dg(a).h. 
Nous mettons maintenant f(a) et df(a).h en évidence là où c’est possible : 
#=(f(a+h)— f(a) — df(a).h)g(a + h) 
+ f(a) (g(a + h) — g(a) — dg(a).h) (12.724) 
+ (g(a + h) — g(a))df(a).h. 


Nous devons maintenant considérer la limite 


(12.722) 


__l&l 
lim —. 12.725 
F2 Al Ve 


Étant donné que f et g sont différentiables, les deux premiers termes sont nuls : 
Ca + Hi) — F(a)  df(a).h) 
im 
h—0 [Lol| 


im f(a (g(a + h) — g(a) — dg(a).h) 
US IR] 


g(a+h) = 0 
(12.726) 
= 0. 


En ce qui concerne le troisième terme, en utilisant la norme d’une application linéaire, nous avons 


.… |df(a).h| Idf(a).h| 
D SE JA lé), (12.727) 


et par conséquent 
idf(a).h||R| 

[Lol| (12.728) 
< Jim |g(a + h) — g(a)|ldf(a)| = 0 


0 < lim |g(a + 7) — g(a) 


parce que g est continue (la limite du premier facteur est nulle tandis que la norme de df(a) est 
un nombre constant). Nous avons donc bien prouvé que la formule (12.720) est la différentielle de 
Jg au point a. 


Ce résultat se généralise pour des fonctions f et g de R”° dans R” dans la proposition suivante 
qui généralise tout en même temps la proposition 12.179. 


Proposition 12.283. 
Soient f et g deux fonctions de U € IR" dans R" différentiables au point a € U. Alors la fonction 
f : gest différentiable au point a et on a 


d(f : g)(a) = g(a) : df(a) + (a) : dg(a) (12.729) 


d(f * gJa(u) = g(a) : (dfa(u)) + f(a) : (dgalu)) Fat cpEgep 


pour tout u € R”. 
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Démonstration. La preuve du cas n = 1 est déjà faite ; c’est la formule (12.720). Pour le cas général 
n > 2, nous passons aux composantes en nous rappelant que 


n 


(f - g)(a) = D fi(a)gi(a) = D (figi)(a). (12.731) 
i=1l 


i=1 
En utilisant la linéarité de la différentiation, nous nous réduisons donc au cas des produits f;g; qui 
sont des fonctions de R’? dans R : 


di (12.732) 


Ceci termine la preuve. 


12.23.1 Difficulté d’ordre supérieur 


12.284. 
Il serait tentant de faire une récurrence sur le lemme 12.282 pour dire que si f et g sont de classe 
CP, alors le produit fg est également de classe CP, parce que la formule de d(fg) contient des 
produits de fonctions de classe CP et CP. 

Le problème est que le lemme 12.282 est énoncé et prouvé pour des fonctions à valeurs dans 
R, alors que déjà la formule 

d(fg) = gdf + fdg (12.733) 

contient le produit de g: E — R par df: E — L(E,R). Lorsque nous montons dans les diffé- 
rentielles, la situation empire, et les produits dont sont composés les formules sont réellement à 
définir... 


Oublions un instant les questions de régularité, et calculons sans ménagement, pour voir ce qu’il 
se passe. Nous considérons un espace vectoriel Æ ainsi que des fonctions f: £ — R et g: E — V 
où V est un autre espace vectoriel. 
Nous avons 
d(fg)a(u) = dfa(u)g(a) + f(a)dga(u). (12.734) 
Les deux termes sont des produits IR x V — IR. Montons un coup : 
d d 
d(gdf)a(u) = [@df(attu)] = fetathdfaun] = dulu)dfa+g(a)(d fra(u). (12.735) 
Un autre pour voir comment ça se passe plus haut : 


d(dfdg)a(u) = E[(drdg)(a + tu)] = ÉTdfernudgurn] = (dal) dga + dfa(d/ g)a(u). 


(12.736) 


0 — 


Là déjà vous noterez que nous sommes passés par le produit 


dfa+tudfa+tu (12.737) 


qui pour chaque t est un produit £(E,R) x £(E, V) que nous n’avons pas réellement défini. 
En continuant le calcul ainsi nous trouvons par exemple 


(d Fg)a(u) = d fa(u)g(a) + d fadga(u) 
+ À fa(u)dga + dfad” ga(u) 
+ À fa(u)dga + dfa(d?g)a(u) 
+ dfa(u)d”ga + F(a)(d*ga(u). 


Vous noterez que cette formule contient trois termes que nous aurions eu envie de noter d? fdg. Or 
ces trois termes ne sont pas identiques : deux sont d°f,(u)dg, et un est (d?f)adga(u). 


(12.738) 
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12.23.2 Solution : produit tensoriel 


Afin de donner un sens à tous les produits, nous allons passer par les produits tensoriels. Nous 


avons déjà le théorème 11.252 qui fait pratiquement tout. 
PROPooWNCGooHbmcVb 


Proposition 12.285 (|[1|). 
Soient des fonctions f : R° — R et g: R' — MR de classe CP. Alors fg est de classe CP. 


Démonstration. Nous considérons l'application 


p:R@R—R 


(12.739) 
1Q1-1 


dont nous avons déjà parlé dans le lemme 11.221. En utilisant la notation ® de la définition 11.248, 
nous avons 
fg = vo (f@g). (12.740) 
La proposition 11.252 nous dit que f@g: R° — R@R est de classe C?. Vu que @ est un iso- 
morphisme d’espaces vectoriels, la proposition 11.243 nous dit que w o (f@g) est encore de classe 
CP. 
Et voilà. 


12.23.3 Formes bilinéaires 


Nous avons aussi une formule importante pour la différentielle des formes bilinéaires. 


bilin diff 
Lemme 12.286. 
Toute application bilinéaire 
B:R”"xR" — R? 
(12.741) 
B(a1, a2) = 1 * Q2 
est différentiable en tout point (a1,a2) de Rx R”, et on a 
dB(a, a2).(R1, ho) = h1 x a9 + a1 x ho. 
Démonstration. 
|B(a1 + h1,a2 + ho) — B(a1,a2) — (h x 2 + 4j * h2)|» : 
h h me nm 
(ax + h1) * (a2 + ha) — 1 * 42 — (h1 * QG +G%x h2)|» 
- à 
Cha, Ro) rm x mr 
on rajoute et on enlève la quantité (ai + h1) x a2 dans le numérateur, et on obtient 
à Car + A1) x ho + ha x ao — (ha x a2 + a1 x ho)|» L 
Ces, 2) me x mr 
h\+xh h h 
Vite Lo Valmbtaln —— 
ICR1, Ro) mm x mr CR1, Ro) rm x mn 


| (R1, h2) ne 
$ = C\(h1, ho)|rmxmr. 
CR1, R2)ÎRr xRr | : 
Si on prend la limite de cette expression pour (h1,h2) — (0,:,0,) on obtient 0, donc la preuve 
est complète. À noter, que dans l’avant-dernier passage on à utilisé la continuité des applications 
linéaires proj,, : R? x R° — R” et proj, : R°”* x R? — R” qui à chaque point (a1,a2) de 
R°? x R” associent a; et a2 respectivement. 


PropEKLTooSvZ;jdW 
Proposition 12.287. 
Soit V et W deux espaces vectoriels et y: V — W un isomorphisme. Soit f : © — V une application 
telle que wo f: © — W soit différentiable. 
Alors f est différentiable et df = ÿ-! 0 d(po f). 
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Démonstration. Si Test la différentielle de & o f au point z nous avons 


D = 1m PA +R) — (po f)(e) + T() 7. 
h—0 h 


(po f}(z+h)— (po f)(2) + o((woT)(h)) 
h—0 h 


= lim y (# ie fe ne 20) (12.744c) 


__… fG@+Rh)- f(2) +6 iT(h) 
Ris h 


(12.744b) 


| (12.744d) 


Pour la dernière ligne, nous avons permuté 4 avec la limite (parce que 4 est continue). Nous avons 
prouvé que f est différentiable et que df = w-loT = 4 lod(po f). 


12.24 Différentielle de fonction composée 


Une importante règle de différentiation est la règle de différentiation d’une fonction composée 
(chain rule dans les livres anglais et américains). Cette règle généralise la règle de dérivation pour 
fonctions de R dans R. 

Cette règle a déjà été donnée dans le théorème 11.241, mais si vous avez seulement envie 
d'entendre parler de R”, vous pouvez lire le lemme 12.288 suivi de la proposition 12.290. 

Le lemme suivant est essentiellement une reformulation du lemme 11.236. 


Def_diff2 
Lemme 12.288. 


Soit U un ouvert de R"?. La fonction f : U — IR" est différentiable au point a dans U, si et 
5 à ; ; " SubEqsDiff2 
seulement si il existe une fonction of : U x U — R” telle que | 


op(a,a) = lim of(a,x) = 0 (12.745a) 
à : 
f(x) = f{a) + T(x — a) + ay(a,x)|x — al, ot) 
pour une certaine application linéaire T € L(R”,R?). 


Démonstration. Si les conditions (12.745) sont satisfaites alors Test la différentielle de f en a. En 
effet, dans ce cas nous avons 


f(a+h) = fa) +T(h) + or(a, a + h)|h|, (12.746) 


et la condition (11.652) devient 


h)||A 
qe lerCasa + HDI 


1 h)|| = 12.74 
im ET lim o(a,a + h)| = 0 (12-747) 
Si f est différentiable au point a il suffit de prendre T = df(a) et 


f(æ) — f(a) — df(a).(x — a) 


1æ — am 


of(a,x) = 


Remarque 12.289. 
La fonction o/(a,x)|x — al, est ce qui avait été appelé e(h) sur la figure 12.10. 

PropDiffCompose 
Proposition 12.290. 
Soient U un ouvert de R"? et V un ouvert de R”. Soient f : U — V et g:V — R? deux fonctions 
différentiables respectivement au point a dans U et b = f(a) dans V. Alors la fonction composée 
go f : U — RP est différentiable au point a et 


d(g° fja = dgf(ay © dfa- FI FI ERRass) 
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Démonstration. En tenant compte du lemme 12.288 on peut écrire 


f(a + À) — f(a) = dfa(h) + (a, a + R)|Alm, Vh e U\{0}, (12.749a) 
9 + &) — g(b) = dgu(k) + 09(b,b + &)| El, Vk e V\{0}. (12.749b) 


On sait que f(a) = b et que f(a + h) est un élément de V et f(a + h) = f(a) + k pour k = 
df(a).h+ œf(a;a+h)}h|,. Par substitution dans la deuxième équation on obtient 
g(f(a+h)) — g(f(a)) 
= dgpta (ah) + ay(a,a + h)lhlm) 


+ 9 (F(a), ae Idfa(h) + os(a;a + R)|hlml, 
=gof(a+h)—ge f(a) 


(12.750) 
= dgf(ay © dfa(h ” 
He, 
+09 (f(a) (a+ h)ldr Fa + oj(asa+ h)|, | 
donc 
(go f)(a +R) — (go f)(a) = dgg(a) © dfa(h) + S(a, a + R)|Alm (12.751) 


où S représente le contenu du dernier grand crochet. Il ne reste plus qu’à prouver que S(a,a + h) 
est o(|h|n). En tenant compte du fait que oy(a,a + h) et o,(f(a), f(a + h)) sont o(|h|;»), 


. S(a,a+h) . dgf(a)7f(a; a + h) 
h0m  |Allm h0m Alim 


S(F(a), (a + h)) dark + oy(a,a + h)] 


h0m Alim 


(12.752) 


r = 0. 


Remarque 12.291. 
Note : la formule (12.748) est à comprendre de la façon suivante. Si u € R”?, alors 


d(g° fja(u) =  dgf(a) (dfatu) ) e RP. (12.753) 


eL(R?,R?)  €R? 


Le lemme suivant sert à prouver les théorèmes 15.9 et 20.69. Il est fondamentalement la raison 


de la formule définissant l’intégrale d’une forme sur un chemin (définition 20.44). 
LEMooKNBVooQSowos 


Lemme 12.292 (|1]). 
Soient un espace vectoriel normé F' de dimension finie, ainsi que E, un espace vectoriel normé. 
Nous considérons un chemin de classe C! 


y:[a,b] -— E (12.754) 
et une application de classe C* 
PES, (12.755) 
Sig = fo7y, alors 
g'(t) = (df);6 (TE) (12.756) 


pour tout te [a, b]. 
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Démonstration. Nous écrivons la dérivée de g de la façon suivante : es co 

g'(t) = & EC + s)] (12.757a) 

ds s=0 

d 
Dr LS 0 7)(É + s)| 0 (12.757b) 
ue BEQooHUZ 
= d(f oy}(1) SUBEROOHUA Ne 
SUBEQooUAYLoolT 

= (df);19 (de(1)) RATE 
(12.757e) 


Justifications : 


— Pour (12.757c) : les formules (12.268). Notez que le 1 à qui s’applique la différentielle de fo 
est le vecteur de R qui est multiplié par s dans l’expression (f o y)(t +5). 


— Pour (12.757d) : la différentiation de fonctions composées de la proposition 12.290. 
Mais : 
dy(1) = EC "s s)] .=T®. (12.758) 


S= 


En remettant au bout de (12.757), nous obtenons le résultat. 


12.24.1 Fonctions composées 


Cette façon de voir la différentielle nous permet de jeter un nouveau regard sur la formule de 
différentiation des fonctions composées. Soient 


. . si (12.759) 
g: R°"—R, 
et h: IR? — R définie par 
h(u) = g(f(u)) = (go f}(u). (12.760) 


Nous allons noter x les coordonnées de IR?, a un point de IR? et u, un vecteur de RP accroché au 
point a. Pour R”, les notations seront y pour les coordonnées, b pour un point de R’” et v, un 
vecteur « accroché » au point b. 

Nous avons 


dgo(v > AC )dyi(v (12.761) 


Ici dyi(v) signifie la ième composante de v. C’est simplement v;. Cette formule étant valable pour 
tout point be IR" et pour tout vecteur v, nous pouvons l'écrire en particulier pour 


b = f(a) (12.762a) 
v = dfa(u). (12.762b) 
Cela donne : 
dgs(a)(dfa(u)) = >. 2 (ad (dfa(u)). PAS) 
il 7? 
Mais : 
dfa(u) = Sade, (u), (12.764) 
j=1 
donc la ième composante de ce vecteur est 
D 5 
Ge Y D (a)dx;(u). (12.765) 
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En remplaçant dy; (dfa(u)) par cela dans l’expression (12.763), nous trouvons 


d9f(a )(dfa(u )) = DEC De 


(a)dx;(u). (12.766) 


(a)dx;(u), (12.767) 


tandis que, par la dérivation de fonctions composées, 


(g -)+ Jan ts, FqDer Gappois 


D 


Au final, ce que nous avons prouvé est que 


d(g 0 fha(u) = dgptay(dfa(u)). D à D 


12.25 Autres trucs sur la différentielle 


12.25.1 Différentielle et dérivées partielles 


Étant donné que pour tout vecteur u dans R°”° on a 4, f(a) = Vf(a) : u, le gradient de f nous 
donne la direction dans laquelle la croissance de f est maximale. 

La matrice jacobienne calculée au point a est la matrice associée canoniquement à l’application 
linéaire dfa : R? — R?. 


12.25.2 Plan tangent 


On a dit au début de cette section que si f est une fonction de R? dans KR alors le graphe de 
f est une surface à deux paramètres et que l'application affine tangente au graphe de f au point 
(a, f(a)) est un plan. Maintenant on sait que ce plan est celui d’équation 


Tax, y) = f(a1, a2) + Ca a)(r — a) + (ans e2)(u — a2). (12.770) 


Le plan tangent au graphe de f au point a est le graphe de cette fonction 7%. 
PROPooJPRUooNOcXPJ 


Proposition 12.293. 
Îl existe des fonctions différentiables dont les dérivées partielles ne sont pas continues. 


Retenez que si vous obtenez que les dérivées partielles d’une fonction ne sont pas continues, 
vous ne pouvez pas immédiatement en conclure que la fonction ne sera pas différentiable. 


12.25.3 Notes idéologiques quant au concept de plan tangent 


ssecConceptPlanTag 
Notons G, le graphe d’une fonction f, c’est-à-dire 


G = {(x,y, 2) € R° tel que z = f(x, y)}. (12.771) 


Première affirmation : si y: IR — Gest une courbe telle que 7(0) = (a, f(a)), alors +/(0) € R” est 
dans le plan tangent à G au point (a, f(a)). 

Plus fort : tous les éléments du plan tangent sont de cette forme. 

Le plan tangent à G en un point x € G est donc constitué des vecteurs vitesse de tous les 
chemins qui passent par x. 


12.25. AUTRES TRUCS SUR LA DIFFÉRENTIELLE 1049 


Prenons maintenant $S, une courbe de niveau de G, c’est-à-dire 
S = {(x,y) € R?° tel que f(x, y) = C}. (12.772) 


Si nous prenons un chemin dans G qui est, de plus, contraint à S, c’est-à-dire tel que y(t) € S, 
alors y/(0) sera tangent à G (ça, on le savait déjà), mais en plus, y/(0) sera tangent à S, ce qui est 
logique. 

La morale est que si vous prenez un chemin qui se ballade dans n’importe quoi, alors la dérivée 
du chemin sera un vecteur tangent à ce n’importe quoi. 

En outre, si y(t) € S et (0) = a, alors 


(Vf(a),Y(0)) = 0, (12.773) 


c’est-à-dire que le vecteur tangent à la courbe de niveau est perpendiculaire au gradient. Cela est 
intuitivement logique parce que la tangente à la courbe de niveau correspond à la direction de 
moins grande pente. 


12.25.4 Gradient et recherche du plan tangent 


Nous avons maintenant en main les concepts utiles pour trouver l’équation du plan tangent à 
une surface. 

De la même manière que la tangente à une courbe était la droite de coefficient directeur donné 
par la dérivée, maintenant, le plan tangent à une surface est le plan dont les vecteurs directeurs 
sont les dérivées partielles : 

La généralisation de l’équation (12.643) est 


T(a) = (a) + DL (a)(x — ax FapefPAgntag 
k 


Nous introduisons aussi souvent l'opérateur différentiel abstrait nabla, noté V et qui est donné 
par le vecteur 


© © 
V = . ; 12.775 
e ? 1 =) ( ) 
Les égalités suivantes sont juste des notations, sommes toutes logiques, liées à V : 
Of Of 
Vf = _— : 12.776 


et 
CA 


0x1 


VF) = ( 


Ce dernier est un élément de R” : chaque entrée est un nombre réel. 


Do St) Éqpercragient 


’ 0x9 


Définition 12.294. 
Le vecteur gradient de f au point a est le vecteur donné par la formule (12.777). 


La notation V permet d'écrire la différentielle sous forme un peu plus compacte. En effet, la 
formule (12.673) peut être notée 


dfa(u) = (Vf(a),u). (12.778) 
En utilisant ce produit scalaire, l'équation (12.774) peut se réécrire 
Ta) = #(0) + 3 SE (a)(z — a) = f{a) + (VS(a)r — 0) (12.779) 


Afin d'éviter les confusions, il est souhaitable de bien mettre les parenthèses et noter (V f)(a) 
au lieu de Vf(a). 
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12.25.4.1 Plan tangent en dimension deux 


Le plan T, avec a = (a, a2) a pour équation dans R* : 
Ô 0 EqgPlanTgEnDi 
z = f(a,a2) + CL (ax, a) (x — a1) + (aa) (y — a2). Dr PNEU) 


Définition 12.295. 
Soit f : R° — R une fonction différentiable en un point a. Le plan tangent au graphe de f en 
(a, f(a)) est l’ensemble des points 


Tif = {(x,2)E R'XR tel que z = f(a) + df,(x — a)} 


= {(x,2)e R° x R tel que z = f(a) + <Vf(a),x — a)} 
EX000MWGToekApgzH 


Exemple 12.296. 
Étudiez la continuité, la dérivabilité et la continuité de la dérivée de chacune des fonctions sui- 
vantes : 


() 2 | 1 sinon 


xsin(li) six+0 
(3) ze # 
ô sr Item0035d 
æ?sin(l) six +0 
> HA 
(4) & { 0 sinon 


Dans ces exercices, les fonctions données sont dérivables et à dérivée continue sur Ro car pour 
a € Ro, il existe toujours une boule autour de a dans laquelle la fonction est composée de fonctions 
dérivables (sin, À, ...). L'intérêt de l'exercice est donc d'établir (ou réfuter) la continuité et la 
dérivabilité en 0. 


(1) Notons f cette fonction. f n’est pas continue en 0 car 


En particulier f n’est pas dérivable en 0 (et donc la continuité de sa dérivée n’a pas de sens 
en 0). 


(2) Dans ce cas-ci, la limite « restreinte » 


n'existe pas puisque, par exemple, pour la suite de terme général 


1 
Dhs 
' 5 +2k7n 


on a bien limz_,, æx = 0 mais 
dim f(x) = 1 # (0) 
puisque pour tout k€ N, f(xx) = 1. Donc la fonction n’est pas continue. 
(3) Montrons que la fonction, notée f, est continue en 0. Pour tout x réel, nous avons 


. 1 
sin ()) < |x| 
É 


0 < |f(x)| = [xl 
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ce qui montre que lim,_,0 f(æ) = 0 par la règle de l’étau. 
Par ailleurs, f n’est pas dérivable en 0 car la limite 


n'existe pas, comme on l’a vu précédemment. 
(4) Montrons que cette fonction, notée f, est dérivable en 0 (ce qui prouvera qu'elle y est conti- 


nue). Calculons 
lim f(æ) = lim æsin (2) = 0 
Ë 


T0 ZT æ—0 
xÆ0 xZ0 


où la dernière égalité a été montrée à l’exercice précédent. Nous avons donc f’(0) = 0. 
Par ailleurs, en utilisant les règles de calcul usuelles sur les dérivées, nous obtenons pour 


z F0 
Fa) = sin (2) Loos (2) 
z z x 


qui est une fonction ne possédant pas de limite en 0 puisque, par exemple, si x} est tel que 


1 T 

— = — +2kT 

Tk 4 

alors la suite (xx)£en tend vers 0, mais f’(xx) tend vers +00 lorsque k — +00. La dérivée 
n’est donc pas continue en zéro. 


A 
EXooELTHooDdJyJE 
Exemple 12.297. 
Dessiner les courbes de niveaux des fonctions suivantes. Représenter ensuite leur graphe dans 
l’espace. Donner l’équation du plan tangent en l’origine. 


(1) f(x, y) = 1/2? + y. 
(2) f(x, y) = 1-7? — y. Item0041 


(3) f(x, y) = (a° + y)? — 8xy. 
Les courbes de niveau de l’exercice (3) sont les ovales de Cassini; en particulier, la courbe de 
niveau 0 est la lemniscate de Bernouilli. 


(1) f(x) = 4/2? + y?. Les courbes de niveau f(x) = C'sont des cercles (sauf f(x) = 0 qui se réduit 
à un point). Les sections horizontales étant des cercles, et le rayon de ces cercles augmentant 
linéairement, le graphe est une cône. Nous pouvons nous en convaincre en vérifiant par 
exemple que la droite t+ (t,0,t) est bien entièrement contenue dans z = f(x, y). 


Afin de déterminer la différentielle, nous calculons les dérivées partielles 


Cu _ 1 2 2\—1/2 . _ + EgDerrPaert( 
êx = ;& +y ) 2 = Va + 19981 
et 
0j … y EqDerrPariggais, 


DU Vip 
Pour le plan tangent, nous essayons d’utiliser la formule (12.780). Pour cela, nous devons 
trouver les dérivées partielles en zéro. 
Il est vite vu que la formule (12.781) n’a pas de limite pour (x,y) — (0,0). Ceci ne prouve 
pas que la différentielle de f n’existe pas en (0,0). L'existence de la différentielle implique 
la continuité de la fonction, et non de la différentielle elle-même. En effet, une différentielle 
peut exister en un point sans qu’elle soit la limite de la différentielle aux autres points. Nous 


1052 


(2) 


(3) 
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avons vu par exemple, dans l'exercice 12.296(4), un exemple de fonction dérivable {1% en O, 
mais dont la dérivée n’est pas continue en zéro. 
Il ne suffit donc pas de calculer les limites de 12.781 et de 12.782 pour trouver la différentielle 
de f en (0,0). Il n’est par contre pas très compliqué de remarquer que les dérivées partielles 
n'existent pas en (0,0), par exemple parce que 


ri JE; 0) = (0, 0) 


lim - (12.783) 


n'existe pas pour cause de limite différente pour t > 0 et t < 0. Il n’y a donc pas de plan 
tangent. Ceci est conforme à l'intuition : il n’y a pas de plan tangent à un cône en son 
sommet. 
Nous pouvons faire une petite vérification du fait que le graphe est bien un cône : la droite 
reliant (0,0,0) à (x,y, 1x? + y?) est entièrement contenue dans le graphe de f. En effet si 
nous posons 

y) = (tx, ty, t4/x2 + y?), (12.784) 


pour tout t, nous avons 7.(t) = f(yx(t)? + yy(t)?). 


f(x, y) = 1/1 — x? — y?. Les courbes de niveau f(x,y) = C n'existent que pour C < 1, et ce 
sont des cercles 
r'+yÿ =1-C. (12.785) 


Cette fois, le graphe est une coupole ce sphère. Nous allons en effet vérifier que l’arc de cercle 
centré en (0,0,0) joignant se sommet (0,0,1) à (1,0,0) dans le plan y = 0 est entièrement 
contenu dans le graphe de f. La symétrie de f sous les rotations dans le plan x — y fait le 
reste. L’arc de cercle en question est le chemin 


V6) = (14,0, 1-— (1—#)?). (12.786) 
Chaque point de ce chemin vérifie bien la relation 
GE), %E) = 20. (12.787) 


Le plan tangent à la coupole de sphère en (0,0,1) est évidement horizontal. Nous nous 
attendons donc à trouver que la différentielle de f en (0,0) est nulle. Simple calcul : 


1 
Er Lee mer mA (12.788) 
| of 1 2 
: —2y 
2 (x, y) ee (12.789) 


Évaluées en (0,0), ce deux dérivées partielles sont nulles. Donc si la différentielle existe en 
(0,0), elle sera nulle (voir l’expression (12.673)). Afin de voir qu’elle existe, il faut juste 
montrer que df(0,0,(7, y) = 0 fonctionne dans la définition 11.226. 


f(x, y) = (x? +y?)? — 8xy. La courbe de niveau zéro, en coordonnées polaires est donnée par 
r = 24/sin(26). (12.790) 


Les dérivées partielles sont données par 


© 
SL (a y) = A(x° + y°)x — 8y 
of ,, (12.791) 
2 9) = A(x° + y°)y — 8x 
A 


113. Pour rappel, en dimension un, la dérivée est exactement la notion de différentielle. 
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12.25.4.2 Plan tangent en dimension trois 


Nous avons vu que, de la même façon qu’en deux dimensions nous avions l’approximation 
(12.401) d’une fonction par sa tangente, en trois dimensions nous avons l’approximation suivante 
d’une fonction de deux variables : 


f(x, y) = f(a,b) + CH (a, b)(x — a) + À (a bu — b) (12.792) 


lorsque (x, y) n’est pas trop loin de (a, b). Cela signifie que le graphe de f ressemble au graphe de 
la fonction 7,4) donnée par 


Ô 
Tab)(2: y) = f(a,b) + CL (a, b)(x — a) + (a b)(x — a). (12.793) 
En notations compactes : 
To (x) = f(p) + Vf(p) : (x — D). (12.794) 


Le graphe de la fonction 7, sera le plan tangent au graphe de f au point p. L’équation du plan 
tangent sera donc 


2— f(p) = Vf(p) : (x — p). (12.795) 


Remarque 12.298. 
Lorsque nous utilisons la notation vectorielle, la lettre « x » désigne le vecteur (x, y). Il faut être 
attentif. Dans un cas x est un vecteur dans l’autre c’est une composante d’un vecteur. 


12.26 Jacobienne 


12.26.1 Rappels et définitions 


Dans cette section nous considérons des fonctions f : D — R" où D € IR”, et un point 
a € Int D où f est différentiable. 


Remarque 12.299. 

La définition de continuité (resp. différentiabilité) pour une fonction à valeurs vectorielles est celle 
introduite précédemment, et on remarque que pour avoir la continuité (resp. différentiabilité) de f 
en un point, il faut et il suffit que chacunes des composantes de f = (f1,..., fm), vues séparément 
comme fonctions à n variables et à valeurs réelles, soient continues (resp. différentiables) en ce 
point. 


Définition 12.300. 
La jacobienne de f en a est la matrice de l'application linéaire donnée par la différentielle. Elle 
a de nombreuses notations 


of ofi 
ON SENS 
Sn (a) . 2x (a) 


Autrement dit, c’est la matrice composée de l’ensemble des dérivées partielles de f. Le jacobien 
de f au point a est le déterminant de cette matrice. 

Sim = 1, cette matrice ne contient qu'une ligne ; c’est donc un vecteur appelé le gradient de 
f au point a et noté V f(a). 


Remarque 12.301. (1) Si la fonction est supposée différentiable, calculer la jacobienne revient 
à connaitre la différentielle. En effet, par linéarité de la différentielle et par définition des 
dérivées partielles, nous avons 


22 (a) SH (a)\ fan 
dfa(u) D : 
Cm (a) Cm (a)/ \un 
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où u = (u1,...,un) et où le membre de droite est un produit matriciel 


(2) Remarquons que la jacobienne peut exister en un point donné sans que la fonction soit 


différentiable en ce point! 
NORMooKBJVooDDDmOa 


12.302. 

Le théorème de différentiation de fonctions composées 12.290 peut également se lire au niveau des 
matrices jacobiennes. La matrice jacobienne de go f au point a est le produit matriciel des matrices 
jacobiennes de g et de f. Plus précisément, nous avons 


Jyos(a) = Jy(f(a))Jy(a). (12.797) 


Remarquez que nous considérons la matrice jacobienne de g au point f(a). 

Dans le cas particulier où m = 1 et f est une fonction d’un intervalle 7? dans R”, dérivable au 
point a, on trouve que la fonction composée go f est dérivable au point a si g est différentiable, et 
alors 


(g° f)'(a) = dg(f(a)) .F(a). 


En fait, pour les fonctions d’une seule variable la dérivabilité coïncide avec la différentiabilité. 


12.27 Fonctions de classe C! 


La définition des fonctions de classe C* est la définition 11.227. 
Soit f une fonction différentiable de U, ouvert de R””?, dans R”. L'application différentielle de 
f est une application de R”* dans £L(R’””,R”) 


df:R"— L(RT,R") 


(12.798) 
a+ dfa 


Nous savons que £(R”’,R?) est un espace vectoriel normé avec la définition 4.30. Si T est un 
élément dans £(R””,R”) alors la norme de Test définie par 


IT(x)| 
ITÎccRm,Rr) = Sup “= sup [T(x)|n. 
2xeR" tm æeR" 
frfm <1 


Lorsqu'il existe un M > 0 tel que |df(a)|£(mmmr) < M pour tout a dans U, nous disons que 


la différentielle de f est bornée sur U. 
NORMooDAZZo0oDiGFoW 


12.303. 

Quelques précisions sur l'énoncé de la proposition 12.304. Lorsque nous parlons de @;f, nous 
supposons donnée une base de V. Il n’y à aucune raison que la norme sur V soit adaptée à 
cette base. Nous allons donc utiliser une norme « euclidienne » adaptée à la base, et invoquer 
l’équivalence de toutes les normes pour dire que si une fonction est différentiable pour une norme 
elle l’est pour toutes les normes. 


12.27.0.1 Différentielle et dérivées partielles 
PROPooUDJLooHwzjQF 


Proposition 12.304 ([323]). 

Soient des espaces vectoriels normés de dimensions finies V et E ainsi qu'une application f : V — 
E. Nous supposons que les dérivées partielles ee existent sur un voisinage de a € V et qu’elles 
sont continues en &. 


Alors 
(1) l'application f est différentiable en a, 
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(2) la différentielle est donnée par !* 


dfa = > _ X1 WW. (12.799) 


Démonstration. L'espace V à une norme que nous notons |.|y ; nous n’allons presque pas l'utiliser. 
Nous nommons {e;} la base de V sous-entendue lorsque nous parlons des dérivées partielles, et 
nous considérons la norme || sur V donnée par [v| = 4/37 _,x? pour x = Y';æ;e;. Toutes les 
normes et boules dont nous allons parler dans la suite seront par rapport à cette norme. 

Nous posons € > 0. La continuité des dérivées partielles en a nous permet de considérer à > 0 


A9 — RE (OI < 6 FooPE Po) 


pour tout se B(a,ô), et pour tous les j en même temps ! 1°. 
Soit x € B(a,ô). Nous considérons les points 


tel que 


Sj — issues Se (12.801) 
Précision : 5, = x. 


(1) Un peu de convexité Nous montrons que le segment [s;,s;_1] est dans B(a,ô). Nous 
avons 8; — à = (x —@1,...,x%; — @j,0,...,0), et donc 


Îs; — al < |x — al < 6, (12.802) 


et donc s; € B(a,ô) pour tout j. Vu que la sphère B(a,ô) est convexe !15, tout le segment 
entre 5; et 5;-1 est dedans. 
(2) Accroïissements finis En nous souvenant que x et a ont été fixés, nous considérons les 


fonctions intermédiaires suivantes : 


g1(t) = f(t,a2,...,an) (12.803a) 
g5(t) = fie >Tj—1;É, Aj+ls... , An) (12.803b) 
Gn(t) = F(t1,...,Tn-1,t). (12.803c) 


Elles vérifient en particulier g;(x;) = f(s;) et g;(a;) = f(sj-1). Donc le théorème des ac- 
croissements finis 12.195 nous donne l'existence de r; entre x; et a; tel que 


(85) — f(s5-1) = gjx5) — g5(a;) = gi(r;)(x; — a). FGooVALVOR EUR 


(3) Dérivées partielles Les fonctions g; ont été construites de telle sorte à donner les dérivées 
partielles de f via une simple dérivation : 


Q 
9; bo ST (ar, ce. Tj—1, 00, Aj+lse.. sé À (12.805) 
Tj 
Or lorsque 7 #5 e [x;,a;], le point (x1,...,%;_1,to,aj+1,...,an) est dans [s;,s;_1]. Cela est 
le cas pour to = 7;. Nous notons 
5; — lisse dm dis: 20 (12.806) 
et nous avons 
g:(T) = of (5;) (12.807) 
TS) = 5 LS : 
J 0x; 
avec 8; € [s;_1,s;]. Tout cela pour récrire (12.804) sous la forme 
cie 
fs) — fs) = (5) — a). (12.808) 
1 


114. Voir la définition 11.230 pour x». 

115. Ce qui peut n'être pas possible en dimension infine. Je dis ça comme ça, juste pour faire remarquer que cette 
proposition n’est peut-être pas vraie en dimension infine. Voir aussi l'exemple de la fonction (25.152). 

116. Proposition 8.28. 

117. Retournez éventuellement les intervalles sur a; < x;. 
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(4) Une belle somme télescopique En nous souvenant que s9 = a et que 8, = x, nous avons 
cette somme télescopique 


fx) — f(a) = >, (F(s5) — f(s51)) (12.809a) 
j=1 
> (ss); a) (12.809b) 
jai 43 
= D [(@f)(8;) — (6,f)(a)](x; — a5) +20 ja)  (12.809c) 


S. 
Il 
un 


Nous isolons les termes qui nous intéressent dans la . de la différentielle : 


— Ÿ (G;f)(a)(x; — a) => (@;f)(5;) — (é;f)(a)](x; — a;). (12.810) 


(5) Et enfin : le quotient différentiel En utilisant la majoration (12.800), et en remarquant 
que |x — a] majore |x; — a;| pour chaque j, nous avons l’inégalité 


Lf(æ) — f(a) - > 


a)(æ; — a;)| < nez — a. (12.811) 


TR 


Autrement dit, en posant T =}; 2 (a)w; nous avons 


lf(a+h)— f(a) —T(h)] < nelhl, (12.812) 
et donc 
lim | f(a+h) io —T(h)] o. EQooVEYTO RE trs 


(6) Et donc? La limite (12.813) nous indique que f serait différentiable de différentielle T si 
|. était la norme sur V. C’est l’équivalence de toutes les normes {© qui fait en sorte que la 
norme sur V n’est pas importante. 


PROPooUUUSooPuXJjQ 
Proposition 12.305. 
Soient des espaces vectoriels normés de dimensions finies V et E ainsi qu’une application f : V — 
E. Nous supposons que les dérivées partielles ee. existent et sont continues sur un ouvert U de V. 


Alors f est de classe C! sur U. 


Démonstration. Nous notons {{ le voisinage sur lequel les dérivées partielles de f existent et sont 
continues. Il s’agit d'appliquer la proposition 12.304 en chaque point de {{. Nous avons alors 


de) a (#) X 1 W; (12.814) 


pour tout x EU. Pour a € V et hE V supposé petit, nous avons 


Idfa — dfarhlcv,r) = A dfa(v) — dfa+n(v)|e (12.815a) 
_ of y. 2 | 
= sup À GG, (0) _— ër, +h))v;| (12.815b) 
< sup [S (LL (a) LE (a+ n)}fpet re Te SZ 


0%; 


D EL (a+ SEePEL PEN 


IN 
bg 


Justifications : 


118. Sur un espace de dimension finie, 11.46. 
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— Pour (12.815d), nous avons majoré [v;| < |v] = 1. 
— Pour (12.815c), nous avons utilisé le lemme 11.59. 


La continuité de d;f conclut que limp_,0 |dfa — dfarn| = 0, ce qui signifie que df est continue et 
donc que f est de classe C1. 


TH0OooBEA0OooBdvOdr 
Théorème 12.306. 
Soient des espaces vectoriels normés de dimensions finies V et E. Soit un ouvert U de V. Une 
application f: V — E est de classe C? sur U si et seulement si ses dérivées partielles existent et 
sont continues sur U. 
Dans ce cas, nous avons la formule 


=> : , (a) xx wi. FooPREM IT RTE) 


0x 


Démonstration. Le premier sens, y compris la formule (12.816), a été fait dans la proposition 
12.305. Nous supposons maintenant que f est de classe C! sur 4 et nous allons prouver que ses 
dérivées partielles existent et sont continues. Pour tout t Æ 0 nous avons l'égalité 


flatte)— f(a) _ f(at+te;) — f(a) — dfa(tei) 
t t 


+ dfa(ei). (12.817) 


Par définition de la différentielle, prendre la limite t — 0 à droite donne df,(e;) parce que la fraction 
tend vers zéro. La limite définissant la dérivée partielle existe donc et vaut 


Of 
= dfa(e;). 12.81 
(a) = dfales) (12.818) 
Il nous reste à prouver que les dérivées partielles sont continues : 
Ô Of 
IT (a +h)— (a) = Idfa(ei) — dfa+n(ei)| 12.819a 
0x; OT; 


12.819b 
12.819c 
12.819d 


= |(dfatn — dfa)(ei)| 
< |dfarn — dfal|eil 
= |dfa+h — dfal: 


Vu que f est de classe C1, la limite À — 0 de cela donne zéro. 


nr TO — 


Voici une version du même théorème, démontré dans le cas seulement de dimension deux. Il 


rend peut-être aussi plus clairement pourquoi ça ne marche pas en dimension infinie. 
Diff _ totale 


Proposition 12.307. 

Soit U un ouvert dans R" et a un point dans U. Soit f une application de U dans IR". Si toutes 
les dérivées partielles de f existent sur U et sont continues au point a alors f est différentiable au 
point a. 


Démonstration. On se limite au cas m = 2. Pour rendre les calculs plus simples on utilise ici la 
norme | : |x dans l’espace IR?, mais comme on a vu plus en haut, cela ne peut pas avoir des 
conséquences sur la différentiabilité de f. Si la différentielle de f au point a existe alors elle est 
définie par la formule 

_ 0f 


dfa(v) = 2x (a)v1 + EL 


pour tout v dans R. 

On commence par prouver le résultat en supposant que les dérivées partielles de f au point a 
sont nulles. La différentiabilité de f signifie que pour toute constante € > 0 il y a une constante 
6 > 0 telle que si [vs < Ô alors 


IL f(a1 + v1,a2 + va) — f(a1, a) 
CIE 


Im Le 
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On écrit alors 


Lf(ai + v1, a2 + va) — f(ar, a2)|n = 
= | f(ar1 + vi, a2 + va) — (ai + v1, 42) + f(a1 + v1, a2) — f(a1, a2)]n < (12.820) 
< || f(a1 + v1, 02 + vo) — fai + v1, a2)|n + | f(a1 + v1, a2) — f(a1, a2)|n. 


Comme la dérivée partielle ©, f est nulle au point a on sait que pour toute constante € > Oil y a 
une constante 01 > 0 telle que si [vi] < 01 alors 


| f(a1 + v1,a2) — f(ar, a2)ln < eluil. 
Pour l’autre terme on a, par la proposition 12.238, 
| FCar + v1, a2 + va) — far + v1,a2)ln < sup{|df(x)ln | x € SHlvol. (12.821) 


où S est le segment d’extrémités (a1 + v1,a2) et (a + v1, a2 + vi). Comme la dérivée partielle à, f 
est continue et nulle au point a on sait que pour toute constante € > 0 il existe une constante 
62 > 0 telle que si }(u1,u2)|sx < 02 alors |, f(a1 + u1, a2 + u2)|n < €. Si on choisit Ô = min{ô1, 02} 
le segment S' est contenu dans la boule de rayon Ô centrée au point a et on obtient 


| fCa1 + V1, a2 + v2) — (ar, a2)fn < elvil + Elv2l < 2evlo. 
Cela prouve que f est différentiable en (a1,a2) et que la différentielle est nulle : 
df(d5a8) = (. (12.822) 


Dans le cas général, où les dérivées partielles de f au point a ne sont pas spécialement nulles, 
on peut considérer la fonction !!° 


g(x, y) = f(x, y) — dr f(a)x — é2f(a)y, FoRnE RSS 


qui a dérivées partielles nulles au point a. La fonction g est donc différentiables. La fonction f est 
maintenant la somme de g et de la fonction linéaire et continue (x,y) + CG f(a)x — d2f(a)y. On 
verra dans la prochaine section que la somme de deux fonctions différentiables est une fonction 
différentiable. Par conséquent, la fonction f est différentiable. 


Remarque 12.308. 
En dimension infinie, il n’est pas vrai que l’existence et la continuité de toutes les dérivées partielles 
en un point implique la différentiabilité en ce point. Pour donner un exemple, nous allons continuer 
l'exemple 11.63 avec la fonction 25.152 sur un espace de Hilbert. 

En dimension infinie nous aurons le théorème 11.256 qui donnera quelque chose de moins fort. 


12.27.0.2 Dérivée partielle de fonctions composées 


12.309. 
Une petite note sur les notations du théorème de dérivation partielle de fonctions composées. La 
formule (12.835) est plus souvent écrite sous la forme 


Afog),. + of ANT 
an © à cr (gta) (a). (12.824) 


Du point de vue du névrosé des notations précises que je suis, cette façon d'écrire est délicate à 
exprimer parce qu'il faudrait décider ce que signifie « noter x les variables de IR”? et y celles de 
R7? ». 

Et je ne vous parle même pas des problèmes que ça pose si x est justement le nom d’une 
fonction quand on considère un changement de variable. 


119. Vous verrez dans la discussion à propos de la fonction (25.152) pourquoi cette fonction ne fonctionne pas dans 
le cas de la dimension infinie. 
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12.310. 

À propos de changement de variables ...J'ai une bonne nouvelle : il n’y a pas de notions de 
« différentielle partielle » et de « différentielle totale ». Ces notions sont introduites par les personnes 
qui utilisent de mauvaises notations pour distinguer deux notions différentes qu’ils sont incapables 
de distinguer par des notations claires 120. 


Les choses mal faites en une dimension Voici comment on présente (mal) les choses. Soit 
une fonction y(x). Si on effectue un changement de variables x = x(t), on peut voir y comme une 
fonction de t au lieu de x, et parler de la dérivée de y à travers x. 

Si y(x) = x? et si x(t) = sin(t), on se retrouve à écrire 


y'(t) = 2sin(t) cos(t) FHOONGE Yo Gynig 


et 


y) = 22 Eneonespy eg 


Comment l’objet y peut dépendre du nom de la variable ?!? Notez qu’en substituant x = sin(t) 
dans (12.826), le compte n’est pas bon : on n’a pas (12.825). 

Pour résoudre ce problème, on peut dire que la bonne quantité à regarder n’est pas y mais 
bien dy. Alors on doit en fait regarder non y/(x) mais y(x)dx où dx = cos(t)dt. Avec ça, on à en 
effet 


dy = LRU? = 2sin(t) cos(t)dt, (12.827) 
dx dt 
et 
dy 
dy = ad = 2sin(t) cos(t)dt. (12.828) 


Il faut alors bien comprendre que le « y » dans da n’est pas le même que le y dans ci 


Les choses bien faites en une dimension Soit une fonction y: IR — KR. Nous considérons une 
application (appelée « changement de variable » si on veut, mais surtout appelée « difféomorphisme 
de R vers R»)x:R—R. 

Maintenant que la notation « x » est prise pour désigner une fonction, il n’est plus possible 
d'écrire y(x), parce que y est une application qui prend en argument un élément de R et non de 
CPR). 

On introduit donc une nouvelle fonction z = yo x. Donc z(t) = y(x(t)) = sin(t)?. Le nom 
de la variable importe peu tant que ce n’est pas un nom déjà utilisé. Nous avons alors aucune 
ambigüité : 

y'(u) = 2u (12.829) 


et 
z'(u) = 2sin(u) cos(u). (12.830) 

Notez que les égalités suivante sont parfaitement correctes et ne souffrent d'aucun problème d’in- 
terprétation : 

— y = 

— 2(€) = sin(e)? 

— x(s) = sin(s) 

— x(y(u)) = sin (y(u)) = sin(u?). 


Si les fonctions y et x représentent des quantités physiques, certaines de ces formules sont peut-être 
idiotes à écrire, mais elles sont correctes. 


120. Là je vise la quasi totalité des sources parlant de changement de variable dans les équations différentielles et 
les physiciens, en particulier les mécaniciens. 
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Les choses mal faites en dimension 2 Soit une fonction f de la position et du temps qu’on 
note f(x,t). Cette fonction vérifie une équation aux dérivées partielles, mettant en jeu af et 2. 
Coup de théâtre : on veut savoir la valeur de f le long d’une trajectoire x(t). Nous voici avec 


Fate). (12.831) 


Et là quand on veut parler de la dérivée de f par rapport à t, on doit distinguer la dérivée 
partielle 2f qui consiste à ne dériver l’expression f (x(t), t) que par rapport aux t qui apparaissent 
« vraiment », de la « dérivée totale » qui consiste à dériver par rapport à toutes les occurrences de 
t, y compris à travers x. 


Les choses bien faites en dimension 2 Soit une fonction f: IR? — R. Prenons par exemple 
f(x,t) = æsin(t). Soit une trajectoire s: R — R que nous nous gardons bien de noter « x ». Ce 
qu'on entend par « voir f sur la trajectoire s » signifie en réalité considérer la fonction 


op: R—R 
tr f(s(é),t). 


Ce qu’on aurait appelé la dérivée totale de f par rapport à t est simplement la dérivée usuelle 
g! de w en tant que bête fonction R — R. Si par exemple s(t) = t?, nous avons 


(12.832) 


q(t) = t?sin(t). (12.833) 


Nous avons donc toutes les dérivées sans ambigüité : 


(2,0 — sin(t) (12.834a) 
(a, = æcos(t) (12.834b) 
p'(t) = 2tsin(t) + t? cos(t). (12.834c) 


Le mieux serait même d'écrire @f et Cf au lieu de 2f et of, parce que ce sont des fonctions 
complètement déterminées par f et non par la notation x et { qu’on a choisie pour nommer les 
variables au moment d'écrire f(x,t) = xsin(t). 


12.311. 
Et d’ailleurs en mathématique, il n’y a rien qui s’appelle « changement de variable ». Il y a seulement 
des choses qui s'appellent « composition de fonction ». 

Cela n’est pas limité à l’analyse. Il n’y a par exemple pas de concept de « choisir une base 
dans laquelle une matrice est diagonale ». Si S est une matrice symétrique, il existe une matrice 
diagonale D et une matrice orthogonale À telles que D = ASA!. Quand on veut démontrer une 
théorème sur S, on commence par démontrer le théorème dans le cas particulier où S'est diagonale, 
puis on espère que le résultat se généralise facilement aux matrices de la forme ADA-T où D est 
diagonale et À est orthogonale. 


12.312. 
Tout cela pour dire que nous allons maintenant prouver le théorème de dérivation partielle de 
fonctions composées. C’est ce théorème qui est utilisé chaque fois qu’on fait un « changement de 


variables » dans une équation aux dérivées partielles. 
THO00OKBTYooWFtoSF 


Théorème 12.313 ([1, 397]). 
Soient : 


(1) trois espaces vectoriels normés U, V et W de dimension finie 
(2) a€ V, un voisinage de a 
(3) des applications g: Q — U et f: g@Q)—W 
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(4) des bases de U, V et W de telle sorte que parler des dérivées partielles ait un sens. Toutes 
les bases vont être notées {e;} sans précisions. Sinon, on ne va pas s’en sortir. 


Nous supposons que 
(1) f est de classe C! sur un voisinage de g(a) !?1, 
(2) g admet une dérivée partielle dans la direction de e; en a. 
Alors 
(1) La fonction f © g a une dérivée partielle dans la direction de e; en a, 


(fo g){a) = (x f)(g(a)) (Gig)(a). RSA MES | 


(2) nous avons la formule 


k 
Démonstration. à u que f est différentiable en g(a), nous pouvons y utiliser le lemme 12.268 et 
écrire | 
Ôg d Ôg 
—— = — t 12. 
do (HO) - E[rGo + 0)] (12.836a) 
0g 
a) +€e;5(a)) — a 
. f(g(a) + ex (a)) — f(g(a)) (12.836b) 
E—> € 


Maintenant, le jeu est de travailler f (g(a) + cô;g(a)) de deux façons différentes. D’une part en 
effectuant un développement de f autour de g(a) et d’autre part dé-développant g(a) + eû;g(a) 
pour le changer en g(a + ée;). 


(1) Développer f En utilisant le lemme 12.250 pour f autour de g(a), nous avons 


f(g{a) + edig(a)) = f(g(a) + eXiGise)(a)ex) (12.837a) 


+06 :gk)(a)(ôr.f) (g(a) + eux) (12.837b) 


où ug = D y_p:1(aig)(a)e. La forme exacte de uy n’est pas importante pour notre histoire. 
En mettant cela dans la dernière fraction de (12.836), 


(ga) + e(dig)(a)) — f(g(a)) 


- (12.838a) 
_ f(g(a)) + AR OBACE + eux) + ea(e) — f(g(a)) (12.838b) 
= D (digk)(a)(dk.f) (g(a) + eux) + ae). (12.838c) 


k 


Nous prenons la limite € — 0 en tenant compte du fait que lim._,0 a(e) = 0 et du fait que les 
dérivées partielles de f sont continues en g(a) (théorème 12.306). Nous avons 


dfgta) ((@ig)(a)) = D (Gigx)(a)(@x.f)(g(a)). (12.839) 
FR 


(2) Développer g Nous développons maintenant g à l’intérieur de f. Pour cela nous utilisons 
les accroissements finis 12.251 pour g : 


g(a) + _ (a) = g(a + ee;) — exe). (12.840) 
Ti 
Pour avancer dans (12.836), nous considérons le terme 
Ô 
f(g(a ) + (a) = f(g(a + €e;) — ea(e)) (12.841) 


121. Classe C!, définition 11.227. 
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dans lequel nous allons développer f autour de g(a + ée;). Vu que la fonction €+ g(a + ée;) 
est continue (elle est dérivable par hypothèse), pourvu que € soit assez petit, le point g(a + 
€e;) est encore dans le voisinage de g(a) sur lequel f est de classe C!, de telle sorte qu’un 
développement de f ne pose pas de problèmes. Nous pouvons appliquer le lemme (12.250) : 


f(g(a + éei) — ea(e)) = f(g(a + éei)) rail ea(e)k(0rf)(g(a + ee) + eux) + eB(e). (12.842) 


Ce que nous avons dans la limite dans (12.836) est 


(ga + ee;)) — Y, ea(e)(ôx f)(g(a + ee;) + eux) — f(g(a)) 
_ (fog)(a+ee;) — (fo g)(a) 


€ 


(12.843a) 


> a(e)k(ôrf)(f(a + ee) + eux). (12.843b) 


k 


Nous allons passer à la limite. Vu que f est de classe C1, ses dérivées partielles sont continue. 
Le vecteur uy ne dépendant pas de €, toute la partie (04 f) (g(a+ €e;) + Eux) peut être majorée 
uniformément en €. Et comme a(e) — 0, tout le second terme disparait. 


Ce qui reste à la limite est 


dfata) ET )) = ôl 2) (a). (12.844) 


Donnons un exemple d'utilisation de cette formule. Si 


g: R°—R° 


12.845 
f:R*—R, ) 


nous avons @: R? — R. Les dérivées partielles de 4 sont données par les formules 


CE (x,1) = te 1)) (a + SE (ate,)) co (x, y) + + TE (aten) (4) (12.846) 
et 
SE (&u) = (ut En | )+ Eat) tan) + LE (at) av) (12.847) 


Notez que les dérivées de w et des composantes de g sont calculées en (x,y), tandis que celles de 
f sont calculées en g(x, y). 


12.28 Différentielle et dérivée complexe 

SECooJWNOoo0OgMiWR 
12.314. 
Nous commençons par donner quelques éléments à propos de dérivée et de différentielle pour des 
fonctions € — € parce que les séries entières vont souvent être des fonctions complexes. Le gros 
du chapitre sur les fonctions holomorphes est le chapitre 26. 


Nous identifions R? à C par l'application 


p:R?— € 


12.848 
(x, y) > x + iy. ) 


Dans cette partie, nous désignons par ( un ouvert de C. 
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DEFooVJVXooKinFkh 
Définition 12.315. 
Une fonction f: Q — © est C-dérivable si la limite 
h) — 
ji OPA) F0) (12.849) 
h—0 h 
heC 
existe. Dans ce cas, cette limite est la dérivée de f et est notée f". 
DefMMp jJZ 


Définition 12.316. 
Soit Q un ouvert dans C. Une fonction f : Q — € est holomorphe si elle est C-dérivable sur (1. 


Une avalanche de conditions équivalentes à l’holomorphie est donnée dans le théorème 26.82. 
DEFooQSMCooUoWVZk 


Définition 12.317. 
Si K est un compact de €, nous disons qu’une fonction est holomorphe sur K si il existe un 
ouvert contenant K sur lequel f est holomorphe. 

Et si f n’est réellement définie que sur K, elle est holomorphe sur K° si il existe une extension 
holomorphe de f vers un ouvert contenant K. 


Définition 12.318. 
Une matrice de la forme 


é k ) (12.850) 


LEMooJNFEooZCbJMo 


avec a, BE R est une similitude. 


Lemme 12.319. 
En tant qu'application linéaire € — C, l’opération de multiplication par à + Bi est la matrice 


(5 2. (12.851) 


Démonstration. Cela est vite remarqué en calculant explicitement (a + Bi)(u1 + iu2). 
LEMooKI0ZooEUxfsB 


Lemme 12.320. 
Une application A: € — © est C-linéaire si et seulement si elle est une similitude en tant qu'’ap- 
plication R? — R?. 

Dans ce cas, il existe 20 € © tel que A(z) = 202 pour tout z € C. 


Démonstration. Commençons par considérer l'application A sur R?. Elle est en particulier une 


5 
5 telle que 


9-6 20) vo 


Nous voulons maintenant imposer la C-linéarité, c’est-à-dire que nous voulons 


application R-linéaire et par conséquent il existe une matrice 


A((a + bi)(x + iy)) = (a + bi) A(x + iy) (12.853) 
pour tout a, b,x,y€e R. À gauche nous avons 
A(ax — by + i(bx + ay)) (12.854) 


et à droite nous avons 
(a + bi) (ax + By + i(yx + ôy)). (12.855) 


1064 CHAPITRE 12. ANALYSE RÉELLE : LIMITES ET DÉRIVATION 


En égalant les deux expressions nous obtenons les équations 


Bb = —-b} (12.856a) 

—ab + Ba = ab — bô (12.856b) 

0b = ba (12.856c) 

—"yb + da = bB + aô, (12.856d) 

dont nous tirons immédiatement que 7 = —B et ÿ = a. La matrice de À est donc de la forme 
demandée. 

Inversement nous devons prouver que la fonction 
, : EqOEWY 
fa + iy) = ax + By + i(—Bx + ay) CETTE EST) 


est C-linéaire, c’est-à-dire qu’elle vérifie f(202) = z0f(z) pour tout 20,2 € C. Cela est un simple 
calcul que nous confions à Sage : le code suivant affiche « 0 ». 


#! /usr/bin/sage -python 
# -4x- coding: utf8 -*- 


from sage.all import * 


def f(z): 


var (’alpha ,beta”) 

x=Zz.real part () 

y=Zz.imag _part() 

return alpha*x+tbeta*xy+Ilx( -beta*x+alpha*xy ) 


slvar(’a,b,x,y”) 


5 A=at+bxI 
|Z=x+y*xI 


zi=f( AxZ ) 


o[Z2=Axf( Z ) 


rep=zi-2z2 
print (rep.full_ simplify()) 


tex/frido/code_sage3.py 


Pour conclure, notons que la fonction (12.857) est la fonction de multiplication par a — 8. 
NORMooMKNDooBeoGRN 


12.321. 
Soient une fonction f: € — C et l’isomorphisme canonique w: € — R?. La fonction f définit la 
fonction 

F=#pofog !:IR?— MR. (12.858) 


Cela est la fonction R? — R? associée à f. Il serait tentant de croire que tout ce qui est vrai pour 
Fest également vrai pour f. Eh bien non. 

Par exemple, F peut être différentiable sans que f le soit. La proposition suivante donne une 
condition sur dF pour que f soit différentiable. 


La proposition suivante donne le lien entre df et la dérivée complexe f”. Pour avoir le lien avec 
©, f, il faudra voir la proposition 26.4. 
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PropKJUDooJfqgYs 
Proposition 12.322. 
Une fonction f : Q — © est C-dérivable en a € ( si et seulement si elle est différentiable en a et 
si df, est une similitude. 
Plus précisément avec les notations de 12.321, la fonction f est C-dérivable (donc holomorphe) 
au point zo = to + iyo si et seulement si la fonction F est différentiable en (xo, Yo) et si la matrice 


de dF' est de la forme 
dF = _ à EQooWZGKopLPEHGE 


c'est-à-dire Si dF(x5y0) Journit une application C-linéaire. 
Dans ce cas, le lien entre C-dérivée et différentielle est donné par 


(df)(2) = f'(e0)z. EQPAEFopNNRURe 


Démonstration. Nous décomposons f en parties réelles et imaginaires : 


FC + ig) = P(a,y) + iQ(x, 1) (12.861) 

où P et Q sont des fonctions réelles. La jacobienne de Fest la matrice 
oP oP 
B |, (12.862) 
x  Ôy 

_ . ___ EqFDUrXBP 

et la condition dont nous parlons s’écrit comme le système | 
OP  0Q 
Po e 12.863 
0x ©y Le 
0P 0Q 
sue, 12.863b 
©y 0x 


Si Fest différentiable en (x0, yo) alors nous avons 


F((x0, vo) + (h,&)) = F(&o, ÿo) + dFixo y) () + s([h] + ||) Fu RE 


s(t) 


: ; _ : £ ; 
où s est une fonction vérifiant limy_,9 + = 0. Soit 


dE{ao 40) = é . ) (12.865) 


a 
Si nous posons o = a — iB et w = h +ik, l'équation (12.864) s'écrit dans © sous la forme 
EgY j 
f(eo + w) = f(z0) + où + s(wl). AS806) 


ce qui implique que f est C-dérivable en 20. 
Supposons maintenant que f soit C-dérivable en 29. Alors nous avons 


(co + w) — f(20) 


: = =GE : 
f’(20) dim _ oeC, (12.867) 
ce qui se récrit sous la forme 
AC (12.868) 
w—0 wÙ 


Si nous posons 20 = Z0 + yo, w = h +ik et o = à — iB nous avons 


Fou + (8) = Fo = (5 2) (| 


im 
(h,k)—(0,0) fu 


| (12.869) 
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ce qui signifie que F' est différentiable et que sa différentielle est la matrice 


( : .) | FA870) 


_B à 


La matrice (12.870) est, vue dans IR?, la matrice de multiplication dans € par a — i8 = f'(20). 
En d’autre termes, dans € nous avons 


due) = f'e0)s, (12.871) 


et en particulier la différentielle est donnée par 


du = f'(z)dz. EaPropaN tn 


Exemple 12.323 (Une application (© mais pas C-dérivable). 
Nous considérons la fonction 


fi:C—-C 


| (12.873) 
T+iyrR x. 


Vu que c’est une application linéaire, elle est différentiable une infinité de fois et sa différentielle 
est elle-même. C’est donc une application CT. 
Elle n’est cependant pas C-dérivable. En effet le quotient différentiel est, pour € € € : 
fete ti) =f(t+i) . € 


=, 12.874 
| , ( ) 


Cela n’a pas de limite lorsque € — 0. Pour voir cela nous invoquons la méthode des chemins du 
corolaire 12.228 avec les chemins e(t) = t et eo(t) = it. Dans le premier cas, le quotient différentiel 
vaut 1 pour tout t, tandis que dans le second il vaut zéro pour tout t. A 


12.28.1 Quelques règles de calcul 
LEMooVDXOooUÿFHXZ 


Lemme 12.324. 
Si f et g sont deux fonctions holomorphes sur un ouvert Q € C et si g ne s’annule pas sur Q, 
alors f/g est holomorphe sur (1. 


12.29 Théorèmes des accroissements finis 
SecThoAccrsFinis 


Nous avons déjà démontré (lemme 12.268) que si f est différentiable au point x alors df,(u) = 
Ou f (x). Une importante conséquence est le théorème des accroissements finis 
val medio _2 
Théorème 12.325 (Accroissements finis, inégalité de la moyenne). 
Soit U un ouvert dans R”" et soit f : U — IR” une fonction différentiable. Soient a et b deux points 
dans U, a Æ b, tels que le segment [a, b] soit contenu dans U. Alors 


1 FC) — f(a)ln < . Idfx Lam mr) |1b — am: (12.875) 


xela, 


Démonstration. On utilise le théorème 12.238 et le fait que 


In f(x)n < IdfelcaRm,Rr) ul; 


pour tout u dans R??. 


La proposition suivante est une application fondamentale du théorème des accroissements fi- 
nis 12.325. 
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PropAnnulationEtConstance 
Proposition 12.326. 
Soit U un ouvert connexe par arcs de R"? et une fonction f: U — R”. Les conditions suivantes 


sont équivalentes : ItemPropCstDiffZeroi 


(1) f est constante ; ItemPropCstDiffZeroii 


(2) f est différentiable et df(a) = 0 pour tout a EU ; TtenbropostDiffZeroiii 


(3) les dérivées partielles 1 f,...,0mf existent et sont nulles sur U. 


Démonstration. Nous allons démonter les équivalences en plusieurs étapes. D'abord (1) = (2), 
puis (2) = (3), ensuite (3) — (2) et enfin (2) = (1). 

Commençons par montrer que la condition (1) implique la condition (2). Si f(x) est constante, 
alors la condition (11.652) est vite vérifiée en posant T(h) = 0. 

Afin de voir que la condition (2) implique la condition (3), remarquons d’abord que la différen- 
tiabilité de f implique que les dérivées partielles existent (proposition 12.265) et que nous avons 
l'égalité df(a).u = ÿ;u;0;f(a) pour tout u € R’”* (lemme 12.268). L’annulation de Ÿ, u;0; f(a) 
pour tout u implique l’annulation des d;f(a) pour tout 1. 

Prouvons maintenant que la propriété (3) implique la propriété (2). D'abord, par le théorème 
12.306, l'existence et la continuité des dérivées partielles 0; f(a) implique la différentiabilité de f. 
Ensuite, la formule df(a).u = Ÿ,; u;0;f(a) implique que df(a) = 0. 

Il reste à montrer que (2) implique la condition (1), c’est-à-dire que l’annulation de la diffé- 
rentielle implique la constance de la fonction. C’est ici que nous allons utiliser le théorème des 
accroissements finis. En effet, si a et b sont des points de Ü, le théorème 12.325 nous dit que 


1 FC) — f(a)ln < sup Idf(x)|cRr,Rr) lb — am. (12.876) 


x€{[a,b] 


Mais |df(x)| = 0 pour tout x € U, donc ce supremum est nul et f(b) = f(a), ce qui signifie la 
constance de la fonction. 


12.30 Fonctions Lipschitziennes 
DEFooQHVEooDbYKmz 
Définition 12.327. 
Soient (E,dg) et (F,dr) deux espaces métriques ??, f: E — F une application et un réel k 
strictement positif. Nous disons que f est Lipschitzienne de constante k sur E si pour tout 
æ,yEE, 
dr(f(x), f(y)) < kdg(x, y). (12.877) 


Soit f une fonction k-Lipschitzienne. Si y € B(+, 6) alors |x—7| < 6 et donc | f(x) — f(y)| < kô. 
Cela signifie que la condition Lipschitz peut s’énoncer en termes de boules fermées par 


f(B(x,5)) c B(f(x), kô) EPETRRE 


tant que B(x,0) est contenue dans le domaine sur lequel f est Lipschitz. 


Proposition 12.328. 
Soit U un ouvert convexe de R””, et soit f : U — IR” une fonction différentiable. La fonction f 
est Lipschitzienne sur U si et seulement si df est bornée sur U. 


Démonstration. Le fait que l'application différentielle df soit bornée signifie qu’il existe un M > 0 
dans R tel que |dfa|cçmm mr) < M, pour tout a dans U. Si cela est le cas, alors le théorème 12.325 


122. Pour rappel, les espaces métriques sont définis par la définition 7.107 et le théorème 7.109 ; je précise que nous 
ne supposons pas que E soit vectoriel; en particulier il peut être un ouvert de R". 
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et la convexité l° de U impliquent évidemment que f est de Lipschitz de constante plus petite ou 
égale à M. 
Inversement, si f est Lipschitz de constante k, alors pour tout a dans U et uw dans R”” on a 


[eo 


< Klulm; 
nm 


t 


En passant à la limite pour t — O on a 


1duf(a)In = Idfa(u)In < Aluwlm 


donc la norme de df, est majorée par k pour tout a dans U. 


Notez cependant qu’une fonction peut être Lipschitzienne sans être différentiable. 
PropFZgFTEW 


Proposition 12.329. 
Une fonction Lipschitzienne f : R — R est continue. 


Démonstration. Nous utilisons la caractérisation de la continuité donnée par le théorème 7.196. 
Prouvons donc la continuité en a € R. Pour tout x nous avons 


Lf(æ) — f(a)| < k|x — al. (12.879) 


Si e > 0 est donné, il suffit de prendre 0 < ? pour avoir 


|f(æ) — f(a)| <k= = € (12.880) 


Donc f est continue en a. 
DefJSFFooEOCogV 


Définition 12.330. 


Une fonction 
J:R'"xR" — R? 


(ë,y) — f(E, y) 


est localement Lipschitz en y au point (to, yo) si il existe des voisinages V de to et W de y et 
un nombre k > 0 tels que pour tout (t,y) € V x W on ait 


| f (to; vo) — fé, y)| < kly — vol. (12.882) 


(12.881) 


La fonction est localement Lipschitz sur un ouvert U de R” x R’* si elle est localement Lipschitz 


en chaque point de U. 
NORMooYNRAooBgobcK 


12.331. 
Autrement dit, une fonction est localement Lipschitzienne en sa deuxième variable lorsque tout 


point admet un voisinage sur lequel elle est Lipschitzienne. 
PROPooVZSAooUneUQK 


Proposition 12.332. 


Toute application Lipschitz 24 


est uniformément continue !?. 


Démonstration. Soit une application k-lipschitzienne f: E — F' entre deux espaces métriques. 
Soient € > 0 ainsi que a € E. Nous considérons Ô = e/k. Si x € B(a,ô) nous avons 


dp(f(a), f(x)) < kdg(a,x) < kô < €. (12.883) 


123. La convexité de U sert à assurer que la droite reliant a à b est contenue dans U ; c’est ce que nous utilisons 
dans la démonstration du théorème 12.325. 

124. Définition 12.327. 

125. Définition 7.308. 
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PropGIBZooVsIqfY 
Proposition 12.333. 
Si f et g sont deux fonctions localement Lipschitz alors f + g l’est. 
Démonstration. Il s’agit d’un simple calcul avec une majoration standard : 

IC + 9) Co, vo) — (CF + 9), v)| < | F (to, vo) — FE, y) + 1g(Éo, go) — (4, y)| (12.884a) 
< ksy — yol + kgly — vol (12.884b) 
= (kg + k)|y — vol. (12.884c) 

LemCFZUooVqZmpc 
Lemme 12.334. 
La fonction donnée par 
JE, (x, y)) = y (12.885) 


est localement Lipschitz en tout point. 
Démonstration. Nous avons la majoration classique 


LF(E, (to, vo)) — F(t, (x, y))| = Itogo — xyl < |toyo — toyl + [roy — zyl < [ro||vo — y| + [yllro — x|. 
(12.886) 


Vu que nous parlons de fonction localement Lipschitzienne, nous pouvons majorer |y| et |xo| par 
un même nombre k dans un voisinage de (x, yo). Cela donne 


LF(E, (co, vo)) — FE, (x, y))| < k(lyo — gl + |xo — xl) < V2k| é : 1) |. (12.887) 


Nous avons utilisé l’équivalence de norme de la proposition 11.44(1). 


12.31  Différentielles d’ordre supérieur 


SecDiffOrdSup 

12.31.1 Différentielle et dérivées partielles 

C’est le moment de relire les définitions 11.228 et 11.227. 
Définition 12.335. 
Une sorte de projection. Pour u € V nous définissons 
prog: L'(V,E) — L'TUV,E) _—. 
aro, (O)(uisisss tn) = dd, ces ete 
LEMooSMZQooJBVySP 

Lemme 12.336 ([1, 398]). 

À Propos de dimensions . ITEMooUWEBooSzFseN 
(1) dim(En) = dim(V)" dim(£). ITEMooFMKQooFSMpgF 
(2) dim (£"(V,E)) = dim(E) dim(V}". 

LEMooTDLNooTcPkLg 

Lemme 12.337 ([1]). 

Nous définissons les x par récurrence. D'abord 

gi: L'(VE) > L(V, LU(VE) (12.889) 
pi(w)u = proj,(w), 

et ensuite . 

D (12.890) 


pr(w)u = d-1(proju(w)). 
Les applications O4 sont bijectives. 
126. En, définition 11.228. 
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Démonstration. Nous prouvons par récurrence. 

(1) Injective, k = 1 Soit we L'(V, E) tel que pi(w) = 0. Pour tout uw € V nous avons pi(w)u = 
0, ce qui signifie que proj,(w) = 0 ou encore que pour tout w1,...,Un_1 € V nous avons 
w(u,v1,...,Un-1) = 0. Nous avons donc bien w = (. 

(2) Surjective, &k=1 Soit ae £L(V, £L"-1(V,E)). Nous allons construire w € L"(V, E) tel que 
i(w) = a. Nous posons 


to (Obs 2) = dou 223 0 A (12.891) 


Avec lui nous avons bien proj,, (w) = a(vo). 


(3) Injective, k = k Nous supposons que Og(w) = 0, c’est-à-dire que pour tout u € V nous 
avons 


Pk-1(proj,(w)) = 0. (12.892) 
Cela implique proj,(w) = 0 parce que #-1 est injective par hypothèse de récurrence. Nous 
déduisons que w = 0, et que 4 est injective. 
(4) Surjective, k = k Nous allons montrer que @: L'(V,E) — L'K(V, E)y est une applica- 
tion linéaire injective entre deux espaces de même dimension. 
Il s’agit d'utiliser le lemme 12.336. D’abord 


dim (L'-F(V, Ex) = dim(V)" dim (£L"-F(V,E)) = dim(V)" dim(E). (12.893) 


Ensuite dim (£"(V,E)) = dim(V)" dim(Æ). Le compte est bon. 
Le théorème du rang (formule (4.50)) avec dim (ker(dx)) = 0 nous dit que le rang de dx est 
maximal et donc que @4 est surjective. 


LEMooLTYCooAoMJKD 
Lemme 12.338. 
Soit we W. Nous avons 


Lu xx pr(wr)] X1 ur = w Xp+1 Dexia, r). (12.894) 


Démonstration. Il s’agit d'appliquer les deux membres à un élément v € V. D'abord 


Lu xx bk(wr)] x1 wi(v) = wi(u)w xx Ék(wr) (12.895a) 


= w xx (be(wr)ur) suretoomin fs 


Pour (12.895b) nous avons utilisé le fait que w (v) = w € R et que le produit x} est linéaire. De 
l’autre côté, en utilisant les définitions de x} et de @y, nous avons 


Lu x px Dexia, r)]v = w x (dr+1(ur,r)v) (12.896a) 
= w xx bk(proj,(urr)) (12.896b) 
= w X4 bE(Uwr) (12.896c) 

parce que proj, (wir) = vwr. 
PROPooVGRRooHSwcP1 
Proposition 12.339 ([1]). 
Soit une application f: V — E de classe C". Alors 
(1) pour tout n-multiindice I, la dérivée partielle O7 f existe, 
(2) nous avons la formule 
CHIPS — ———— (a) Xn ris. in) (12.897) 
es One. 


Üèn 


où la somme porte sur tous les multiindices de taille n, le produit x, est la définition 11.230 
et l'application ®, est donnée dans l’énoncé du lemme 12.331. 
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Démonstration. Nous faisons tout cela par récurrence. Le cas n = 1 est déjà fait par le théorème 
12.306 parce que D1(w) = w. Nous supposons que le résultat est démontré pour une valeur k, et 
nous considérons f de classe C” avec n > k + 1. L'hypothèse de récurrence dit que 


(fa = D(Orf)(a) xx e(wr) FQooBOZUoegiRE ER 


I 


est continuement différentiable par rapport à a. Nous pouvons donc utiliser la formule (12.816) 
pour calculer la différentielle de (12.898) : 


Ce NS A2 (a) x1 ur (12.899a) 
1 
> >. [(Gôr f)(a) Xk Pk(wr)] x1 (12.899b) 
TI 
= D (àrf )(a) Xk+1 Pk+1(uu,r) + RERO OPANE ER RICn 
LI 


où nous avons utilisé le lemme 12.338 pour obtenir (12.899c). 
PROPooKOBVooQhrAeJ 


Proposition 12.340. 
Soit une application f : V — E telle que les dérivées partielles a existent et sont continues 
dr Lin 


sur un ouvert U. Alors f est de classe C" sur U. 


Démonstration. Pour n = 1, cette proposition est déjà contenue dans le théorème 12.306. Nous 
pouvons donc directement passer au pas de récurrence. Nous définissons les objets 


Te(a) = D (Grf)(a) xx bk(wr) (12.900) 


J 


où la somme porte sur tous les k-multiindices. Ces applications 7} existent et sont continues par 
hypothèse. 

Le théorème 12.306 nous indique que Ti(a) = df,. Nous supposons maintenant que (d*f), = 
Ty (a) et nous allons prouver que 7441 est la différentielle de d* f. Pour cela nous devons prouver 


que 
= ROPRPENMEE 


En utilisant le lemme 12.338 nous pouvons dégrossir le terme 74:1(a)h : 


im Ath) = Tk(a) = Trh(a)h 
im 
h—0 IR] 


Teui(a)h = D [(@,rf)(a) Xi Peri(er rh (12.902a) 
LI 

rl (@,rf)(a) xx de(wr)] x1 wr(R) (12.902b) 
LI 

—_ Ra(@,r f)( (a) Xx Pk(Qr) (12.902c) 


or AO] xe dater). 7 CESR 


Vu que ©rf est une fonction dont les dérivées partielles existent et sont continues, le théorème 
12.306 (toujours lui) nous dit qu’elle est différentiable et que 


d(Or f )a( = dima (Or f)(a). (12.903) 


En mettant la somme sur 7 tout devant dans (12.902d), nous trouvons 


Tesi(a)h = D d(rf)a(h) xx br(wr). (12.904) 
T 
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C’est pas beau la vie? Nous pouvons écrire le numérateur du quotient différentiel (12.901) : 
Ti(a + h) — Tia) — Tr+1(a)h = D [(Orf)(a + h) — (ôrf)(a)] Xk Pr(wr) (12.905a) 
I 
— Y'd(0rfha(h) Xk Pk(wr) (12.905b) 
I 


= D [(@rf)(a + h) — (@rf)(a) — d(ôrf)(a)h] x1 Ék(wr). (12.905c) 
d, 


Nous utilisons le fait que l'application w + w xx dx(wr) est linéaire et commute avec la limite, 
c’est-à-dire que 
lim (w(R) xx k(wr)) = (lim w(h)) Xk Pk(wr). (12.906) 


Et bien sûr, la somme sur les multiindices ? commute également avec la limite. Donc 


(Or f)(a + h) — (01 f)(a) — d(orfjah 


… T(a+h)—Tr(a) —Tryi(a)h 
hr, In] D (a TR] ) 4 Per) 
(12.907a) 
— 0. (12.907b) 


Cela prouve que 7}, est bien la différentielle de 7. Par récurrence, la fonction f est bien n fois 
continuement différentiable. 


Maintenant que nous avons plein de lemmes et de résultats, il est facile de démontrer un très 
gros résultat en peu de lignes. 
THOooPZTAooTASBhZ 
Théorème 12.341. 
Soit une application f: V — E entre deux espaces vectoriels normés de dimension finies. Nous 
avons équivalence entre 


ITEMooBOWTooXgxhps 
Lo 
(1) f est de classe C ITEMooPVZHooHihSRD 
PR : ; n—1 
(2) les dérivées partielles 0;,f sont de classe C ITEMooVBQMooBleazN 


(3) les dérivées partielles 07 f existent et sont continues pour tout multiiindice de longueur n. 
Démonstration. En plusieurs implications. 

(1) (3) implique (1) C’est la proposition 12.340. 

(2) (1) implique (3) C’est la proposition 12.339. 


(3) (3) implique (2) En posant g = @;f, l'hypothèse est que les O0 existent et sont 
continues pour tout multiindices 7 de longueur n — 1. En appliquant « (3) implique (1) » à 
la fonction g;, la fonction g; est de classe Cf. 


(4) (2) implique (3) Les fonctions g; déjà définies sont de classe C"-!. Nous leur appliquons 


« (1) implique (3) », nous savons que les fonctions 0} lg; sont continues, c'est-à-dire que les 
©r0,f. Vu que tout multiiindice de longueur n peut être écrit sous la forme i7 où 1 est de 
longueur n—1, nous avons prouvé que les 0” f existent et sont continues pour tout multiindice 
J de longueur n. 


PROPooCKROooYutfEXx 
Proposition 12.342 (|[1]). 
Soit un espace vectoriel V de dimension finie n sur K (= C ou R). Soit une base {e;}jer de V. 
Pour chaque i, la projection 


Se (12.908) 


est de classe CT. 
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Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 
PROPooMOMMooDYIayv 


Proposition 12.343 (|[1]). 

Soient deux espaces vectoriels normés de dimension finie V et W. Soient des bases {e;} et {e;} de 
V et W. Une application f: V — W est de classe CP si et seulement si chacune de ses composantes 
le sont, c’est à dire si en écrivant 


fs) = D fi(s)eh, (12.909) 
j 
les applications f;: V — R sont de classe CP. 
Démonstration. En deux parties. 
(1) Sens direct Considérant la proposition 12.342, la projection 


proj;;: W—R 
S'arc, =. (12.910) 
k 


est de classe C©. Vu que f est de classe C?, la composée proj,of est de classe C? par la 
proposition 11.245. 


(2) Sens réciproque Si I est un multiindice de longueur p, nous avons 


(F)(s) = Dr fk)(s)e4, (12.911) 


k 


qui est continue parce que les f, sont de classe CP. Donc f est de classe C?P par le théorème 
12.341(3). 


12.31.2 Application à valeurs dans les opérateurs 
PROPooUCRNooagseb;j 


Proposition 12.344 (|[1]). 

Soient des espaces vectoriels normés V et W. Soient un ouvert U € R" et une application A: U — 
End(V,W). L'application A est de classe CF si et seulement si toutes les applications s + A(s)ij 
sont de classe CF. 


Démonstration. Nous utilisons les applications f;; de la proposition 4.76, en nous souvenant que 
les éléments de matrice de As) sont les coordonnées de A(s) € End(V,W) dans ces coordonnées 


(proposition 4.77). Le résultat est alors seulement un cas particulier de la proposition 12.343. 
PROPooYORGooDmwrJg 


Proposition 12.345 (|[1]). 
Soient des espaces vectoriels normés V et W. Soient un ouvert U € R”" et une application A: U — 
End(V,W}). Nous supposons que pour chaque ve V , l'application s > A(s)v est CF. 

Alors À est C*. 


Démonstration. Soient une base {e;} de V'et {ei} de W. Nous considérons les applications 


J (12.912) 
sr A(s)e;. 
Par hypothèse, f; est une application C*. Nous avons 
fi(s) = A(s)ei = D A(s)je, (12.913) 
J 


Nous profitons de la proposition 12.342 qui dit que la projection est de classe C®, et de la propo- 
sition 11.245 à propos des composées, l'application (proj “© fi) est de classe CP. Or nous avons 


(proj;ofi)(s) = A(s);. (12.914) 
La proposition 12.344 conclut que f est de classe C?. 
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12.31.3 Espaces d’applications multilinéaires et identifications 


Si V et Æ sont des espaces vectoriels de dimensions finies, la différentielle de f: V — E 
est une application df: V — £(V,E). La différentielle seconde est une application d(df): V — 
L(V, L(V,E)) et ainsi de suite. 

Une grande difficulté de la manipulation des différentielles d'ordre supérieurs provient de cet 
emboîtement d'espaces d’applications linéaires. Nous nous attaquons à présent à la description de 
ces espaces emboîtés !27. 

Pour la suite, nous considérerons des espaces vectoriels normés V et E de dimension finie. Nous 
notons L’(V, E) l’espace des applications multilinéaires V? — E. 

Nous introduisons le produit suivant|1] : 


APR £(V,£(V,W)) 


CHIOTETONT 
Dans la suite, pour économiser des parenthèses et des maux de tête, nous allons noter #(u,v) le 
nombre (u)v. Il n’est cependant pas question de dire que # est une application bilinéaire. En 
effet, identifier £(V, £L(V, W)) à l’espace des applications bilinéaires V x V — W ne sert pas à 
grand chose pour l'instant parce qu’une telle identification a le prix de devoir prouver que toutes les 
propriétés des différentielles passent à travers l'identification, tâche qui est à priori (conservation 
de la difficulté) de la même nature que celle à laquelle nous nous attachons à présent. 

LEMooHCUSooXYHuBR 


Lemme 12.346 ([1]). 
Soient deux espaces vectoriels normés V et E ainsi que Ÿ € £(V, £(V, R)). Pour tout a € E nous 
avons 


le lee)  Wle(revm)lele (12.916) 


Démonstration. Il s’agit seulement d’un calcul : 


la : d| = Fu (a: d)(v)lzv.r) (12.917a) 
D (a: p)(v)wlz (12.917b) 
= sup sup |(#(o)w)ale Fe CENT 
= . so d(v)w| |alz 0 tn 
n d(v)| lal (12.917e) 
= |y|lal. (12.917f) 


Notez que dans (12.917c), [#(v)w| est un simple réel; c’est pourquoi nous le retrouvons hors de la 
norme |.|# dans (12.917d), muni d’une simple valeur absolue. 


Lemme 12.347 (|1]). 
Soient d € L(V. L(V.R)) et une fonction continue f: V — E. Alors la fonction 


g: V — L(V,L(V, E)) 


Ed (12.918) 


est continue. 


127. Toutes les constructions, tous les énoncés et les preuves qui suivent sont de l’invention personnelle de l’auteur 
de ces lignes. Je n’ai trouvé nulle part une source qui s’attaque réellement à la récurrence. 
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Démonstration. Pour des raisons de notations, nous allons écrire g, pour g(x). Cela étant dit nous 


considérons a € E, une suite x, — a et nous calculons : 


Sa — ax] = DD Ga(U) — Gxx (U)|£(v,E) (12.919a) 
— |ga(u)0 — ga, (u)v|r (12.919b) 
D | f(a)p(u)v — f(xx)b(u)vl| (12.919c) 
one |f(a) — f(xx)|f#(uol (12.9194) 
= |) — FCm)|suphé(e (12.919) 
= 1f(a) — (wo) lol (12.919) 


En prenant la limite 4 — ©, et en considérant que f est continue en a, nous obtenons 


Jim |ga — gax = 0. (12.920) 
—>00 


Lemme 12.348 (|1]). 
Soient une application différentiable f : V — E ainsi que d € £L(V, LU R)). Soit 


g: V — LIVE, E)) 


(12.921) 

tte f(x) : d. 

Alors g est différentiable et pour tout a € V nous avons 
dga(h) = dfa(h) * Ÿ. (12.922) 


Notons que nous n’avons pas dga = dfa * 4. En effet, df, € L(V,W), de telle sorte que df, : € 
L(V, LV ÈV W))). Les espaces ne s’emboîtent pas dans le bon ordre. 


Démonstration. Il s’agit de vérifier que h + df,(h) : d vérifie la condition de la définition 11.226. 
En utilisant le fait que (a + b) + d = a : d + b : 4 ainsi que le lemme 12.346 nous écrivons 


lf(a+h) : d— f(a) : d — dfa(h) : Y| _ | f(a+h) — f(a) — dfalh) , 


| |  (12.92%3a) 
[Lal| h 
f(a+h) — f(a) — df(h 
= LDC IQ HO, (202) 
Vu que f est différentiable en a et que df, est la différentielle, nous avons bien 
. a+h)— fa) — df,fh 
dim A+ FE | L 0, (12.924) 


Démonstration. Nous faisons (1) par récurrence. D'abord dim(Æ5) = dim(Æ) et ensuite 
dim(Ey41) = dim £(V, Ex) = dim(V) dim(£Ey) = dim(V)"*l dim(E). (12.925) 
Pour (2), si {e;} est une base de V, un élément w € £L"(V,E) est déterminé par les va- 


leurs de w(e;,,...,e;,) qui peuvent être n'importe quel vecteur de Æ. Donc la dimension est 
dim(V}" dim(E). 
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Lemme 12.349 ([1|). 
Soit n EN nous définissons par récurrence 


n,0: En — En 
Fa (12.926) 
ar à. 
et : 
nk: En — LV, En 
Fa k) (12.927) 
Ÿn,k(@) (ur, Uk) = (Dn,k-1(@)(v1, ce ,Ur-1) )ü 
L'application 


est un isomorphisme isométrique. 


Démonstration. Nous allons démontrer par récurrence sur k que tous les 4, , sont des isomor- 
phismes isométriques. Pour k = 0 c’est évident parce que 4,0 est l’identité. 


(1) Injective Soient à € E, tels que dK+1(a) = 0. Cela signifie que pour tout v1,...,Uk+1 
nous avons 

Vnk(@)(u1, cs Uk) Ug+1 = (0. (12.929) 

c'est-à-dire Yh,k(a)(v1,...,vx) = 0. Vu que 4, 4 est injective (hypothèse de récurrence), nous 


avons «a = (. 


(2) Surjective Soit we L*I(V,E,_}); nous cherchons a € E, tel que 4, K+1(@) = w, c’est-à- 
dire tel que 


Vn.k+1(@)(v1, s.. , Uk+1) — Vnk(@)(v1, sr Uk) Ug+1 — w(v], és me OU) 


Notez que 
Yn,k(@) € L*(V, En-x) = L'(V, L(V, En-k-1)). (12.931) 


En considérant o e L* (V, £L(V, E,, 54)) donné par 
TU DElURET = Qi: dpt). (12.932) 


il existe (hypothèse de récurrence sur k) un a& € E, tel que dhxK(a) = 0. 
Pour ce à, la condition (12.930) est satisfaite. 


(3) Isométrique Encore une fois par récurrence. Soit « € E,. Nous avons 


Ink (a) Les, x) = da In (a)(v1, ..., ve) rs x (12.933a) 
Vi|| = 
= sup Ma (een teur, à (12.933b) 
Vi =1 
— | sup ln,k-1(01,..., 0x1) LE x 1) (12.933c) 
<= 
Aure 
= |Yn,k-1(@)| (12.933d) 
= |al|. (12.933e) 


La dernière égalité est l'hypothèse de récurrence. Notez la subtile utilisation du lemme 7.139 
qui permet de donner un sens aux supremums, grace au fait que {v € V tel que |v| = 1} est 
compact. 


LEMooFBEGooCqrzxH 
Lemme 12.350. 
Nous avons Ynn = Pn". 
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» ÿ , EQooPBQIooUValDA 
Démonstration. Pour nous échauffer nous posons w € L"(V,R), et nous calculons | 


12.934a 


12.934b 
12.934c 
12.934d 


Yn,2(Pn(w))(v1, va) = CRCONE 
= (Pn(w)v1)v2 
= Pn-1(proj,, (w)) 


) 
) 
) 
= On-2(proj,, proj,.(w)). ) 


( 
( 
( 
( 
Cela étant dit, nous allons prouver ceci par récurrence : 


k 
Un k (Dn(eo))(u1,..., Uk) = Pn-k ( [[proi. ()) (12.935) 
i=1 


Notez l’ordre du produit des projections. En ce qui concerne cet ordre, pour fixer les idées voici 
un exemple : 


projs, proj,, (w) — (proj,,(w))(v2) = w(v1, V2). (12.936) 
Faisons maintenant la récurrence. 
(1) Pour &k=2 C'est le calcul (12.934). 


(2) Pour &+1 C’est encore un calcul, en faisant attention à l’ordre dans lequel viennent les 


projections : 
Bnka (dn(eo)) (or, 0er) = (bn (dn(eo)) (01, ve) ) ex (12.937a) 
k 
_ (om-r(T Jproi, (w)) }ok (12.937b) 
i=1 
k 
ES Pn-k-1(Proju. [Iproi., (w)) (12.937c) 
i=1 
k+1 
= n-+1n(] [prois, (w)). (12.937d) 
i=1 


Il ne reste qu'à écrire la formule démontrée avec k = n : 


Ynn(Pn(w)) pisse) Del [Iproi. (w)) Hu ru (12.938) 


i=1 


Donc nous avons bien que Y» » (On (w)) = W. 


LEMooDGUGooTX0tih 
Lemme 12.351. 
Soient deux espaces vectoriels normés V et E. Nous considérons une application linéaire A: V — 
E, une forme w € L'(V,R) ainsi que la forme 


a:V—+E, 
j (12.939) 
ur A(u)h 1 (u). 
Alors 

Vn+1n+1(@) (v1, sacs it) — A(vi)w(vo, sus EL) (12.940) 

Démonstration. Nous prouvons la formule suivante par récurrence : 

k 

Vneik(w)(v1,.….,; 0e) = A(vi)fn-k1(] [projs,(w)). (12.941) 


i=2 
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Nous commençons la récurrence avec k = 2, en tenant compte que #1 = @, (lemme 12.350) : 


Yn+1,2(@)(v1, 2) = (Yn+11(a)v1)v2 (12.942a) 
= a(vi)va (12.942b) 
= A(ui)(#7t(w}uo) (12.942c) 

= A(v1)(n(w)ve) (12.9424) 
= A(vi)dn-1(proj,, (w)). (12.942e) 
C’est bon pour k = 2. Nous passons à la récurrence : 
Vn+1,k+1(w)(01, — , Uk+1) = (n+1,#(w)(v1, —. , Uk) )Ur41 (12.943a) 
k 

_ A(01) (dn-k(] [rroi., a) jo (12.943b) 

i=2 

k 
= A(v1)n-k(Projas El pro, w) (12.943c) 
i=2 

k+1 
: A(v1)Pn- (+1 ( [I proj,, w). (12.943d) 

i=2 


La récurrence est terminée. Nous écrivons la formule pour k = n + 1 en tenant compte de do = Id 
pour terminer la preuve de ce lemme : 


n+1 


Undins le )Uiss pi) = Avi) ( (ll pros. w) = A(ui)w(ve,...,Un+1). (12.944) 
i=2 


12.31.4 Fonctions différentiables plusieurs fois 


Définition 12.352. 
Un C*-difféomorphisme est une application inversible de classe C* dont l'inverse est également 


de classe CF. 
bilin_2diff 


Exemple 12.353. 

Soit B : R°” x R°” — R" une application bilinéaire. On définit f : R° — R" par f(x) = B(x,x). 
Le lemme 12.286 nous dit que B est différentiable. Cela implique la différentiabilité de f. Pour 
trouver la différentielle de la fonction f, nous écrivons f = Bo s où 5: R7 — R7 x Rest 
l'application s(x) = (x,x). En utilisant la règle de différentiation de fonctions composées, 


df(a) = dB(s(a)) o ds(a). (12.945) 
Mais ds(a).u = (u,u) parce que s(a + h) — s(a) — (h,h) = 0. Par conséquent, 
df(a).u = dB(s(a))(u,u) = B(u, a) + B(a,u) FRS 91 


où nous avons utilisé la formule du lemme 12.286. La formule (12.946) peut être écrite sous la 
forme compacte 


df(a) = B( : ,a) + B(a, : ) (12.947) 


La fonction df(a) ainsi écrite est linéaire par rapport à a, donc différentiable. En outre elle coïncide 
avec sa différentielle, comme on a vu dans le lemme 11.234, au sens que la différentielle de df au 
point a sera l’application que à chaque x dans R/” associe l’application linéaire B(x, : }+B( : ,x). 
On voit bien que d°f au point a est une application de R°° vers l’espace des applications linéaires 
£L(R”",R?). On peut utiliser d’autre part l’isomorphisme des espaces L(R’”", L(R”,R”)) et L(R"" x 
R",R°) et dire que, une fois que a est fixé, l’application d? f(a) est une application bilinéaire sur 
R" x R. On écrit alors d°f(a)(x,y) = B(x,y) + B(y,r). A 
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12.31.5 Différentielle seconde, fonction de classe C? 


La différentielle seconde dans l'exemple 12.353 est symétrique, c’est-à-dire que d? f(a)(æ1,x2) = 


d f(a)(x2,r1). En fait toute différentielle seconde est symétrique. 
Schwarz 


Théorème 12.354 (Schwarz). 
Soit U un ouvert de R" et f:U cR" — R’° une fonction de classe C?. Alors, pour tout couple 
i,j d'indices dans {1,...,m} et pour tout point a dans U, on a 


CA à Ci 


Oxi0%; AT CE: “ 


Démonstration. Pour simplifier nous nous limitons ici au cas m = 2. Soit (h,g) un vecteur fixé 
dans R?. Pour tout v = (x,y) dans R? on note 


Anf(v) = flu+he)—f{v) = f(x +h,y) — f(x,y), 
Agf(v) = f{u + ges) — f{u) = f(x, y + 9) — f(x, y), (12.948) 


Nous avons 


AgAnf(o) = (f(x +hy+g)— f(x,y+g)) — (f(x + hu) — f(x, y)), (12.949) 
AnA fo) = (f(x +h,y+9)— f(x +h,y)) — (f(x y +9) — f(x,y)), | 


donc, 
1 1 1 1 
PE. An f(v) L FA? 9 () . (12.950) 
On utilise alors le théorème des accroissements finis 12.195 
1 1 1 
pan f(v) = AUC + h,y) — f(x, y)) = raz + th, y)h = f(x + t1h,y), (12.951) 


pour un certain {1 dans |0,1[. De même on obtient 


1 
go ef(v) = O2f(x, y + t29), 
pour un certain {2 dans |0,1[. Alors 
1 1 
+ (Gf(x+tih,y)) = Pas (d2f(x, y + t2g)). (12.952) 
En appliquant encore une fois le théorème des accroissements finis on a 


201 f(x + th, y + 519) — 0102 f(x + s2h, y + t29). (12.953) 


Il suffit maintenant de passer à la limite pour (h, g) — (0,0) et de se souvenir du fait que f est C2? 
seulement si ses dérivées partielles secondes sont continues LÀ pour avoir 01 f(v) — 0102 f(v). 


Si f est deux fois différentiable d?f(a) est l'application bilinéaire associée avec la matrice 
symétrique 
ŒF(a) .…. Ciômf(a) 
H}(a) = : . (12.954) 
ômf(a) -.. fa), 


Cette matrice est dite la matrice hessienne de f. 


128. Théorème 12.341. 
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Exemple 12.355. 
Montrons qu'il n'existe pas de fonctions f de classe C? telles que 


def, y) = 5snx (12.955a) 
Out, y) = 6% + y. (12.955b) 


Ceci est vite fait en appliquant le théorème de Schwarz, 12.354 ; ce que nous trouvons est 


Oy(Oxf) = 0 
alors que 
Ox(Oyf) = 6. (12.956) 
Vu que d:(0yf) # 0y(0»f), le théorème 12.354 dit que f ne peut pas être de classe C?. A 
NORMooKSAVooCelILmI 
12.356. 


Soit une fonction de classe C? f: V — R où V est un espace vectoriel de dimension n < co. Nous 
avons 


JV—-R (12.957a) 
df : V — L(V,R) (12.957b) 
f: V — LV, £(V: R)), (12.957) 
avec, en suivant les différentes formules du lemme 12.268, 
d 
dfa(u) = [7 + n)| (12.958) 
et à 
2 = — 
(d'Fatu) = + Ldfaruu] (12.959) 


pour tout a,u € V. Notons que dans le deuxième cas, il s’agit d’une limite dans £(V,R). Si 
dim(V) = n, alors dim £L(V,R) = n et avec un choix de base, nous pouvons trouver une matrice 
n x n pour (d fa. 


Soit une base {e;} de V et la base duale {e*} de £L(V,R). Nous allons chercher la matrice de 
(d? fa pour ces bases. L'élément de matrice 


CAP (12.960) 


19 


est la composante e* de (d? f)a appliqué à e;. Trouver cette composante e* revient à appliquer 


l'élément (d?° f)ae; de L(V,R) à e;. Le calcul est donc : 


[(d Pal, = (( fJae:) (e;) (12.961a) 
TOR pores 
= LE Lf(a + tei + se)] LES (12.961c) 

af 
| Omiôz; (12.9614) 


Attention : le passage à (12.961b) n’est pas une trivialité. Le fait est que si t + At) est une 
application continue R — £(V,R) alors 


lim (A(t)v) = (lim A(t))v. (12.962) 


Donc la matrice de d? f est la matrice des dérivées secondes. Il s’agit d’une matrice symétrique 
par le théorème de Schwarz 12.354. 
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NORMooZAUEo0GqjpLH 
12.357. 
Si a € V, nous pouvons aussi voir (d?f), comme une forme bilinéaire sur V grâce à la proposi- 
tion 11.77. Si u,v € V nous notons 


( Fja(u,v) = (d F)a(u)v. (12.963) 


À droite, il s’agit de la définition réelle de d?f sans abus de notations, et à gauche, il s’agit d’une 
notation. Cette application bilinéaire (d2 f), € L2)(V,R) a pour matrice symétrique la matrice des 


dérivées secondes calculées en a. 
ExZHZYcNH 


Exemple 12.358. 
Voyons comment la différentielle seconde fonctionne entre deux espaces vectoriels. Soient deux 
espaces vectoriels de dimension finie V et W. Pour que les choses soient claires, nous avons : 


Vas (12.964a) 
df:V — L(V,W) (12.964b) 
Bf:V — L(V, L(V, W)). (12.964c) 


Siae V, alors (d? f), est une application V — £(V,W). Il faut donc l'appliquer à u € V et ensuite 
à v € V pour obtenir un élément de W : 


(d fja(u)o = Eden] 0 (12.965a) 
d 
= dant]. (12.965b) 
drd 
= + [= | F(a + tu + su)] |. (12.965c) 
_ (a) (12.965d) 
Ou0v ‘ 


Par conséquent nous voyons 
. Ecpnre 
a 


Dans le cas d’une fonction f : R — R, nous avons une seule direction et par linéarité de (12.966) 


par rapport à u et v, nous avons ; 
E 
d fa(u,v) = f"(a)uv Roos0CGoRTAnT 


où les produits sont des produits usuels dans R et f” est la dérivée seconde usuelle. A 


Tout ceci est un peu résumé dans la proposition suivante. 
PROPooFWZYooUQwz j 


Proposition 12.359. 
Soit une fonction f: R° — R de classe C?. Alors en désignant par H,f sa matrice hessienne au 
point a nous avons 


_ #1 
(d Palu,0) = 


(a) = ((Hf)u,v) (12.968) 
pour tout u,ve R”. 


Démonstration. La première égalité est l’équation (12.967) déjà faite. Pour la seconde, il faut se 
rappeler du lien entre dérivée partielle et dérivée directionnelle, donné en le lemme 12.268. En 
particulier ici nous avons 

®f ®f 


Cuov — “a OrKÔT) (a)uxv = ((Haf}u,v). (12.969) 
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En particulier, la matrice hessienne H, f est symétrique et donc diagonalisable (théorème spec- 
tral 9.221). Si e; est un vecteur propre unitaire pour la valeur propre À; nous avons 


(P Fate, ec) = ((Haf)ei, ei) = Xei, ei) = À. (12.970) 


Enfin pour celles qui aiment les notations matricielles de tout poil, il y a cette façon-ci d’écrire : 


2 _. Œf(a) ©,f(a)\ fa 
(É fa(a, 8) = (a B) En 2) (;) . (12.971) 


12.31.6 Ordre supérieur 


Intuitivement, une fonction est de classe C? si elle est p fois continûment différentiable. Cela 
est la définition 11.227. 

Ce qui est terrible avec les différentielles d'ordre supérieurs, c’est l’'emboîtement des espaces. 
Pour une fonction f: E — F', nous allons souvent poser 


W=Fr (12.972) 
Ves1 = L(E, VW), (12.972b) 
de telle sorte à avoir 
d:E—[L(E,F)=V (12.973) 
et 
df:E — L(E,Vi) = V, (12.974) 
ce qui donne en général 
d*f:E — L(E,vp_1) = Ve. (12.975) 


La proposition suivante lie une bonne fois pour toute dérivée et différentielle dans le cadre de 


fonctions R — R. 
PROPooCNDHooKRwils 


Proposition 12.360 ([1]). 
Une fonction f : R — R est de classe CP si et seulement si elle est p fois continüment dérivable. 


Démonstration. Nous commençons par poser un certain nombre de notations. Comme souvent 
nous posons W = R et 
Ve = LR, VW). (12.976) 


De plus nous considérons Mi € L(R,R) donnée par Mi(t) = t. Et par récurrence 
Myi(t) = tMy. (12.977) 


Nous avons M € Vi et My: IR — V4_:, c’est-à-dire My € V4. 
Les formules que nous allons prouver sont que d’une part, 


dfa = f'(a) M1. (12.978) 
et que d’autre part, plus généralement, 
(d* fha = f(a) My. (12.979) 


En plusieurs parties et par récurrence. 


(1) Si f est continâment dérivable, alors f est C! Nous montrons que l'application T 
donnée par T(h) = hf'(a) vérifie la condition pour être la différentielle de f en a : 


f(@+h)— fa) F(a)h _ f@+h) (a) _,, pe), EtooCPHopHgEE 
IA] Ihl | 
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où nous avons noté 1 le vecteur unité dans la direction de h, c’est-à-dire 17 = h/|h|. Vu 
que RE R, c’est simplement 


1 sih>0 
= Pi (12.981) 


et nous ne définissons pas 17 si h = 0. 


C’est le moment de prendre la limite de (12.980) pour h — 0* et h — 07 séparément. 
Lorsque h — 0*, nous avons |A] = h et 1}, = 1. Vu que f est supposée dérivable, la limite 
du quotient existe et vaut f'(a). Donc le tout a une limite nulle : 


fa+n=f@- fan _ Le fa+h)-f(o 


! 
= a) = 0. 12.982 
Jin, A] Jin, 7 J'(a) ( ) 
En ce qui concerne la limite h — 07, nous avons |h| = —h et 1, = —1, et à nouveau 


une limite nulle. La proposition 12.42 nous permet alors de conclure que la limite existe et 
est nulle. Les limites à gauche et à droite étant nulles, la limite existe et est nulle par la 
proposition 12.42. 


Si f(P) est continue alors d f aussi Nous passons à la récurrence de notre preuve. Sous 


l'hypothèse que f@) existe et est continue, nous allons montrer que d’f existe, est continue 
et vaut 


(Pf)a = FP)(a) M. (12.983) 


Soit k < p tel que ce soit bon (pour k = 1 c’est déjà fait). Nous avons (d*f), = f() (a) My, 
et pour prouver que (d*+1f), = fA+1){a)My:1 nous l'y mettons dans la définition de la 
différentielle. Nous avons : 


(Path = (Pa = FE (a) Mn) | FO (a+ h)Mr — FO (a)My — RFI (a) Mr 
1h] IA] | 


(12.984) 
La limite h — 0 est une limite dans V4, et elle se traite comme précédemment. Elle vaut zéro 
parce que f(*+1) est la dérivée de f(%). Cela justifie les faits que d*f est différentiable en a 
et que la différentielle est donné par la formule voulue. 
Par hypothèse, k + 1 < p, donc f(*+1 est continue. Par conséquent l'application a + 
FAT (a) My41 est continue. 


Si f est de classe C! alors f’ existe et est continue Dire que f est de classe CT re- 
vient à dire que la différentielle df : R — £L(R,R) existe et est continue. Soyons conscient 
que dfa(e) = edf,(1) et calculons 


f(a+e) — f(a) — dfa(e) _ f(a+e) — f(a) d(). (12.985) 


€ 


La définition de la différentielle est que la limite de cela pour € — 0 soit nulle. Cela implique 
que la limite suivante existe et vaut 


f(a+e) — f(a) 


= df(L). (12.986) 


Nous avons prouvé que f'(a) = dfa(1). 


La fonction a + df, est continue. Pouvons-nous en déduire que f” est continue ? Nous avons 
f'= eu 0 df (12.987) 


où ev est l’application d'évaluation dont le lemme 11.60 a déjà donné la continuité. Donc f’ 
est continue comme composée d'applications continues. 
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(4) f est C?. Récurrence Nous supposons que f est de classe CP, et nous allons montrer par 
récurrence que f(%) existe et est continue pour tout 4 < p. Posons exactement l'énoncé de 


notre récurrence. 

Pour k = 1 c’est fait. Nous supposons que la formule soit correcte pour un certain k& < pet 
PP À EQSooUPLAooQhueCl P P 

nous y allons pour k + 1. Nous avons 


(*F)(a + h) — (d*F)(a) — FEV (a)Mrn(h) | [HO (a+h) — Ff(a) — RFO (a)] Mr 


17] IR] 
(12.988a) 

(k) — fl) 
a ee 0 
(12.988b) 


où nous avons aussi tenu compte que My+1(h) = hMx. 
C’est le moment de calculer séparément les limites h — 0Ÿ et h — 07. Cela fonctionne 
comme toutes les autres fois. 


Soit une fonction f: IR? — R différentiable ! fois. L'application 


d'f: R" — £(R",L(R",L . )) (12.989) 

au point + appliquée à u(1) appliquée au point v®), ..., appliquée à vÜ) est notée 
CHOCO UE F4o0T TOO EE) 
PROPooQKZIooXTvklr 


Proposition 12.361. 
Soit une fonction f: R" —R différentiable L fois. Avec la notation (12.990) nous avons 


l 
pa (o,..00) = J' of)... 00) of 
(d'F)a(u 7.0") Un Up non. (El (12.991) 


Démonstration. La preuve se fait par récurrence sur !, en sachant que la formule est déjà vraie 
pour { = 1 et { = 2. Si la formule est valable pour {, nous avons 


d 
(a fhe(u0), sie ut) DE dt [CHATS (uQ), ste 00) (12.992a) 
_ a ,odr of mi 
> EL der Eee a +0 )]. (12.992b) 
1...k 
l 
AY. Ds. co 
= Us". U x). 12.992c 
Cela donne le résultat attendu. 
12.362. 
La formule de la proposition 12.361 nous permet d'écrire de jolies formules comme 
(EF), h,h) = D hihyha(OBeP)(@). Po (IS80S) 
ijk 
PROPooMGFBooHWGXyC 


Proposition 12.363. 
Tout polynôme P: R° — R' est de classe C®. 
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12.32 Suites et séries : généralités 
SECooTDZNooJvjPks 
12.32.1 Norme suprémum 


Définition 12.364 (norme suprémum{323|). 
Soient un ensemble (, une partie À de ( et un espace normé V. Lorsque g est une fonction 
g: Q — V, nous notons 


Igla = sup |g(x)| (12.994) 
zEA 


C’est la norme suprémum limitée à la partie À. 
Nous disons qu'une suite de fonctions (fn) définies sur un ensemble À converge uniformé- 
ment sur À vers la fonction f si 
dim [fn — fla = 0 (12.995) 
LEMooLPRZooUPsWTR 
Lemme 12.365. 
Soient un espace compact K et une fonction continue f : K — © qui se décompose en partie réelle 
et complexe comme f(x) = u(x) + iv(x). Alors 


(1) Les fonctions u et v sont continues sur K. 
(2) Tulo < || Flloo, 
(3) vo < Flo 


12.32.2 Convergence uniforme 
12.32.2.1 Critère de Cauchy uniforme 

PropNTEynwq 
Proposition 12.366 (Critère de Cauchy uniforme[399]). 
Soit X un espace topologique et (Y, d) un espace topologique complet. La suite de fonctions fn: X — 
Y converge uniformément sur À si et seulement si pour tout € > 0 il existe N EN tel que sik,l> N 
alors 


d(fr(æ), fi(x)) < € (12.996) 


pour tout x € À. 


Grosso modo, cela dit que si qu’une suite de Cauchy pour la norme uniforme est une suite 
uniformément convergente. Le fait que la suite converge fait partie du résultat et n’est pas une 
hypothèse. Ce critère sera utilisé pour montrer que (C(K),||.|+) est complet, proposition 12.369. 


Démonstration. Si fn ae jf alors le critère est satisfait ; c’est dans l’autre sens que la preuve est 
intéressante. 

Soit donc une suite de fonctions satisfaisant au critère et montrons qu’elle converge uniformé- 
ment. Pour tout x € X la suite n — f,(x) est de Cauchy dans l’espace complet Y ; nous avons 
donc convergence ponctuelle f, — f. Nous devons prouver que cette convergence est uniforme. 
Soit e> Det NE N tel que si k,!1 > N alors 


d(fk(x), fi(x)) < € (12.997) 


pour tout x € X. Si nous nous fixons un tel k et un x € À nous considérons l’inégalité 


d(fr(x), fi(x)) < € (12.998) 


qui est vraie pour tout {. En passant à la limite / — © (limite qui commute avec la fonction 
distance par définition de la topologie) nous avons 


d(fr(x), f(æ)) < €. (12.999) 


Cette inégalité étant valable pour tout x € X, cela signifie que f» MER 
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ThoUnigCvCont 
Théorème 12.367 (Limite uniforme de fonctions continues). 
Soit À, un ensemble mesuré et f,: À — R”, une suite de fonctions continues convergeant uni- 
formément vers f. Si les fonctions fAh sont toutes continues en x0 € À, alors f est continue en 
TX. 


Démonstration. Soit e > 0. Si x € À nous avons, pour tout n, la majoration 


1 f(x) — f(mo)| < 1) — fn(x)1 + nr) — fn(xo)| + [fn (ro) — f(xo)| (12.1000a) 

< | fn(æ) — fn(zo)| + 2] fn — Flloo- (12.1000b) 
Grâce à l'uniforme convergence, nous considérons N € N tel que | f, — f| < € pour tout n > N. 
Pour de tels n, nous avons 


1 f(x) — f(ro)| < 2€ + | fn(x) — fn(ro)|. (12.1001) 


La continuité de f, nous fournit un 0 > 0 tel que | f,(xo) — fn(x)| < € dès que |x — xo| < 6. Pour 
ce 6, nous avons alors | fa(æ) — fn(xo)| < €. 
Donc lorsque n > N (N est choisi en fonction de €), et [x — xo] < à (ô est choisi en fonction 
de N), nous avons 
1 f(x) — f(ro)| < 3e, (12.1002) 


ce qui prouve la continuité de f en xo. 


12.32.2.2 Complétude avec la norme uniforme 
PropCZs1HBx 


Proposition 12.368 (Limite uniforme de fonctions continues). 
Soit X un espace topologique et (Y,d) un espace métrique. Si une suite de fonctions fn: X — Y 
continues converge uniformément, alors la limite est séquentiellement continue |?°. 


Démonstration. Soit a € X et prouvons que f est séquentiellement continue en a. Pour cela nous 
considérons une suite x, — a dans X. Nous savons que f(xh) en f(x). Pour tout k € N, tout 
ne Net tout x E X nous avons la majoration 


1 f(tn) — F)] < | fn) — fe(en)| + ffk(an) — fk(x)| +] f(x) — f(x)] (12.1003a) 
21 f — frlloo + | fk(tn) — fk(x)|. (12.1003b) 


Soit € > 0. Si nous choisissons k suffisamment grand la premier terme est plus petit que €. Et par 


continuité de fx, en prenant n assez grand, le dernier terme est également plus petit que €. 
PropSYMEZGU 


< 
< 


Proposition 12.369. 
Soit X un espace topologique métrique (ŸY,d) un espace métrique complet. Alors les espaces 


(1) (CP(X,Y), |.) des fonctions continues et bornées X — Y, 
(2) (CS(X,Y), |.) des fonctions continues et s’annulant à l'infini 
(3) (CÉ(X,Y), |.) des fonctions de classe C* et s’annulant à l’infini 


sont complets. 


Démonstration. Soit (f,) une suite de Cauchy dans C(X, Y), c’est-à-dire que pour tout € > O il 
existe N € N tel que si k,l > N nous avons | fx — fils < €. Cette suite vérifie le critère de Cauchy 
uniforme 12.366 et donc converge uniformément vers une fonction f: X — Y. La continuité (ou 
l'aspect C*) de la fonction f découle de la convergence uniforme et de la proposition 12.368 (c’est 
pour avoir l’équivalence entre la continuité séquentielle et la continuité normale que nous avons 
pris l’hypothèse d’espace métrique). 

Si les fonctions f, sont bornées ou s’annulent à l'infini, la convergence uniforme implique que 
la limite le sera également. 


129. Si X est métrique, alors c’est la continuité usuelle par la proposition 7.129. 
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Notons que si X est compact, les fonctions continues sont bornées par le théorème 7.211 et nous 
pouvons simplement dire que C°(X,Y) est complet, sans préciser que nous parlons des fonctions 


bornées. 
LemdLKKnd 


Lemme 12.370. 
Soient un espace topologique compact À et un espace complet B. L'ensemble des fonctions continues 
de À vers B muni de la norme uniforme est complet. 

Dit de façon courte : (C(A, B),|.|+) est complet. 


Démonstration. Soit (f,) une suite de Cauchy de fonctions dans C(A, B). Pour chaque x € À nous 
avons 


Ce) — fi(x)l8 < fx — fill, (12.1004) 


de telle sorte que la suite (fL(x)) est de Cauchy dans B et converge donc vers un élément de 
B. La suite de Cauchy (f;) converge donc ponctuellement vers une fonction f: À — B. Nous 
devons encore voir que cette fonction est continue; ce sera l’uniformité de la norme qui donnera 
la continuité. En effet soit x, — x une suite dans À qui converge vers x € À. Pour chaque k € N 
nous avons 


1 Fan) — Fr) < 1f(n) — fk(tn)| + kan) — fe) + A () — fm). (12.1005) 


En prenant k et n assez grands, cette expression peut être rendue aussi petite que l’on veut; le 
premier et le troisième terme par convergence ponctuelle f, — f, le second terme par continuité 
de fx. La suite f(x,) est donc convergente vers f(x) et la fonction f est continue. 


ii Avertissement /question à la lectrice !! 12.371 
Îl serait sans doute bon de revoir cette preuve à la lumière du critère de Cauchy uniforme 12.366. 


12.372 ([400]). 

Le théorème de Stone-Weierstrass indique que les polynômes sont denses pour la topologie uniforme 
dans les fonctions continues. Donc il existe des limites uniformes de fonctions C'©° qui ne sont même 
pas dérivables. Les espaces de type C? munis de |.}, ne sont donc pas complets sans quelques 


hypothèses. Voir la proposition 12.369 et le thème 36. 
ThoUFPLEZh 


Théorème 12.373 (Théorème de Dini[401]). 
Soient un espace métrique complet D et une suite de fonctions fn € C(D, R) telle que 


(1) fn — g ponctuellement, 
(2) ge C(D,R), 


(3) la suite (fn) est croissante, c’est-à-dire que pour tout x € D et pour tout n > 0 nous avons 
În41(T) > fn(x)- 


Alors la convergence est uniforme. 


Démonstration. Soit x € D et € > 0. Il existe N(x) € N tel que 


g(x) —€< fn(x) < g(t). (12.1006) 
De plus g et fç(s) Sont des fonctions continues, donc il existe 7(x) tel que si ye B(x,n(x)) alors 


g(u) € B(g(x).6) RC) 
FN G(9) € B(fNta)(T), €). SUR EE) 


Sin > N(x)et si ye B(x,n(x)) alors nous avons les majorations 


g(y) > fn(y) > NY) > FN) — € > g(x) — 2e > g(y) — 3e. (12.1008) 


Justifications : 
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(1) Les deux premières inégalités sont la crois- (3) Ensuite il y a le choix de N(x). 
sance de la suite. 
(2) La suivante est (12.1007b). (4) Et enfin il y a (12.1007a). 


Nous retenons que si x € D et sin > N(x) alors 


g(u) > fa(y) > g(y) — 3e A2: 1000) 


pour tout yE B(x,n(x)). 

Nous utilisons maintenant la compacité de D. Pour chaque x € D nous pouvons considérer la 
boule ouverte BL n(x)) : ces boules recouvrent D. Nous en extrayons un sous-recouvrement fini, 
c’est-à-dire un ensemble fini d'éléments x1,..., xx tels que 


K 
D =] B(æx,n(æx)). (12.1010) 
Si à ce moment vous ne comprenez pas pourquoi c’est une égalité au lieu d’une inclusion, il faut 
lire l'exemple 7.29. Considérons 
n>N=max{N(xi),..., N(xx)}. (12.1011) 


Pour tout y € D il existe k € {1,...,K} tel que y € Bi) et vu que n > N(xx) nous 
reprenons la majoration (12.1009) : 


g(y) > fn(y) Z g(y) — 3e. (12.1012) 


Pour le n choisi nous avons ces inégalités pour tout y € D, c’est-à-dire que nous avons | f, — g| < 3e 
et donc la convergence uniforme. 


PROPooFWVIooCzXoj0 
Proposition 12.374 (|[1]). 
Soient une suite de fonctions continues u;: IR — KR et une fonction continue u telle que u; — u 
simplement. Alors la convergence est uniforme sur tout compact. 


Démonstration. Soit un compact X ; nous notons |.| la norme uniforme sur K. Supposons que la 
limite ne soit pas uniforme, c’est-à-dire qu’il existe un € > 0 tel que 


fu; — u] > 2e (12.1013) 


pour tout i. Cela permet de considérer pour tout à un élément x; € K tel que !0 


fu;(x;) — u(x;)| > €. (12.1014) 


Pour cela, il faut noter que K est compact et que la fonction x + |u;(x) — u(x)| est continue sur 
K. Elle est donc bornée et atteint son maximum (c’est le théorème de Weierstrass 7.138). 

La suite 4 + x; est une suite dans un compact, et quitte à prendre une sous-suite, nous 
supposons qu’elle converge vers a € K (ça, c’est Bolzano-Weierstrass 7.135). 

La convergence ponctuelle u; — u, prise en a, dit qu’il existe un N tel que [u;(a) — u(a)| < € 
pour tout à > N. Pour un tel à, nous avons aussi 


[u;(x) — u(x)| < € (12.1015) 


sur un voisinage de a, parce que u; — u est continue. Mais tout voisinage de a contient un élément 
x; pour lequel 
fes) = ur] 2e (12.1016) 


Contradiction. 


130. Notez l'inégalité stricte, obetenue en considérant 2e plus haut. 
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12.32.3 Série de fonctions 


Les séries de fonctions sont des cas particuliers de suites. 
DEFooYEIUooCAgrxI 


Définition 12.375. 
Si (fn) est une suite de fonctions, nous définissons la somme des f, de la façon suivante : 


00 N 
> fn = lim D FA (12.1017) 


Le membre de droite est une définition de la notation introduite dans le membre de gauche. 


Avant de vous lancer, relisez une bonne fois les définitions de convergence absolue (définition 
11.81) et de convergence uniforme (équation 11.219). 


Lemme 12.376. 
Soient des fonctions un: ® — C. Si il existe une suite réelle positive (an)nen telle que 


(1) pour tout ze Q et pour tout n E N nous avons lun (z)| < an (c’est-à-dire ay > lun ), 
(2) la somme Ÿ,, an converge, 


ge . L'e) < 
alors la série de fonctions Ÿ,,_p un converge normalement LA 


Démonstration. Découle du lemme de comparaison 11.115. 


ThoSerCritAbel 
Théorème 12.377. 
Soit 3521 gk(x), une série de fonctions compleres où gk(x) = px(x)Yx(x). Supposons que 


(1) gr: A—Cet be pr(x)| < M où M est indépendant de x et K, 


(2) dr: A —R avec Yx(x) > 0 et pour tout x dans À, Yy:1(x) < Yx(x), et enfin supposons que 
dk) converge uniformément vers 0. 


Alors Y52_1 gx est uniformément convergente. 

ThoAbelSeriePuiss 
Théorème 12.378. 
Si la série de puissances (réelle) converge en x = x0 + R, alors elle converge uniformément sur 
[ro — R—e,x0 + R] (e > 0) vers une fonction continue. 

PropOMBbwst 

Proposition 12.379. 
Soient E et F', deux espaces vectoriels normés, ( une partie ouverte de E et une suite de fonctions 
continues un: ® — F convergeant normalement sur Q, c’est-à-dire que Ÿ,, lunls converge, la 
norme |.|s devant être comprise comme la norme supremum sur Q. Alors la fonction u = Ÿÿ,, Un 
est continue sur (2. 


Démonstration. Soit x,x/ € Q en supposant que |x — x’| est petit. Soit encore € > 0. Nous allons 
montrer la continuité en x. Pour cela nous savons que pour tout N l'inégalité suivante est correcte : 


N N 00 00 
lu(æ) —u(x)| <) D un(x) — D'un) + D fun(æ)l+ D, lur(æ)l. (12.1018) 
n=0 n=0 n=N+1 n=N+1 


Les deux derniers termes sont majorés par > 21 lunlo qui, par hypothèse, peut être rendu 
aussi petit que souhaité en choisissant N assez grand. Nous choisissons donc un N tel que ces deux 
termes soient plus petits que €. Ce N étant fixé, la fonction un est continue et nous pouvons 
choisir x” assez proche de x pour que le premier terme soit majoré par €. 


131. Définition 11.82. 
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ThoSerUnifCont 
Théorème 12.380 (Série uniforme de fonctions continues{1]). 
Soit un espace topologique X ainsi qu'un espace vectoriel normé V. Soient des fonctions conti- 
nues fn: À — V. Si la série fn converge uniformément !*, alors la fonction somme est 
séquentiellement continue. 
Si X est métrisable, alors la somme est continue. 


Démonstration. Nous notons f la somme (qui existe par hypothèse) et par (sw) la suite des sommes 
partielles. En tant que somme finie de fonctions continues, chacune des fonctions sn est continue. 
Ce que dit la définition 11.83, c'est que la convergence des sommes partielles est uniforme : 
unif 
sn À f. (12.1019) 
La proposition 12.368 dit alors que f est séquentiellement continue. 


Nous en déduisons la continuité de f dans le cas d’un espace métrisable avec la proposition 
7.245. 


Le corolaire suivant permet de considérer des séries de fonctions indexées par exemple par Z 
plutôt que par N. 


Corolaire 12.381. 
Une famille dénombrable de fonctions continues convergeant normalement converge vers une fonc- 
tion continue. 


Démonstration. Soit 1 dénombrable. Considérons une famille de fonctions continues (fh)ner telles 
que la famille (| fl )ier soit sommable. Le proposition 11.113 nous permet d’utiliser une bijection 
entre J et N. La proposition 12.379 s'applique alors. 


ThoCritWeierstrass 
Théorème 12.382 (Critère de Weierstrass). 
Soit une suite de fonctions fr: À — © telles que |fk(x)| < M ER, Vre À. Si D, My converge, 
alors 2. JL converge absolument et uniformément. 


Démonstration. La convergence normale est facile : l'hypothèse dit que | frs < My, et donc que 


00 


D fkllo < D Mr < ©. (12.1020) 
k=1 k 


La convergence uniforme est à peine plus subtile. Nous nommons F la fonction somme. Pour 
tout + et pour tout N, nous avons 


N 
D, ne) — F(œ) 
n=1 


| D fn(æ)] (12.1021a) 
n=N 


we) 


Y [f(x (12.1021b) 
n=N 


Ne: (12.1021c) 


n=N 


/\ 


/\ 


La convergence normale étant assurée, la série 2. [fnlx est finie, ce qui implique que la queue 
de somme }7_xy [fn tend vers zéro lorsque N — oo. Pour tout €, il existe donc un N (non 
dépendant de x) tel que 


N 
UD, fntx) — F(œ)l < €. (12.1022) 
n=1 


En prenant le supremum sur x € À nous trouvons la convergence uniforme. 


132. Définition 11.83. 
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Remarque 12.383. 
Il n’y a pas de critère correspondant pour les suites. Il n’est pas vrai que si lim,_, | f,| existe, 
alors limy_, fn existe, comme le montre l'exemple 


1 sixe/{0,1] et nest pair 
fn(x) = 41 sixel[1,2] et n est impair (12.1023) 


O0 sinon. 


12.33 Permuter limite et dérivée 


Une version avec intégrales de la démonstration qui suit est dans 14.270. Le même pour les 


dérivées partielles sera le théorème 12.387. 
THOooXZQCooSRtesr 


Théorème 12.384 ([323, 352, 1], thème 61). 
Soient une suite de fonctions f;: R — KR, une fonction f : R — R et une fonction g: R — KR telles 
que 


(1) f; est de classe CT pour tout i, 
(2) fi — f simplement, 
(3) f! — g uniformément sur tout compact. 


Alors ITEMooYSWDooFFeQCd 


(1) fi — f uniformément sur tout compact. 
(2) f = 39, 
(3) f est de classe C!, 


ITEMooFAWUooVQJPZh 


Démonstration. Un point à la fois. 


(1) Pour (1) Soit un compact À € R. Dans cette partie, toutes les fonctions en jeu sont 
restreintes à X. En particulier, lorsque nous parlerons du module de continuité 1° Wy pour 
g où w; pour f}, nous parlerons en réalité des fonctions g|x et f/|x. 
Ceci dit, nous allons montrer que (f;) est une suite de Cauchy pour la norme uniforme 1, 
Soit € > 0. On note w; le module de continuité de f/. Soient y € K,n € N et posons ay = De 


Pour tout à > 0, nous avons la somme télescopique 
nm 
fi(y) +2 LA (& + (k+ Jan) — fi(æ + kan)|. (12.1024) 


Par le théorème des accroissements finis 12.195, il existe pour tout 0 < k < n un réel u,, ; 7 € 
[kan, (k + 1)a,] tel que 


fi(e + (k+ Dan) — fi(e + kan) = lanlfi(t + unix), (12.1025) 


de sorte que 


fi(y) = fi(æ) + lanl > FE + unix). (12.1026) 


133. Définition 11.272. 
134. Et si vous avez bien suivi l'avertissement, c’est bien de la norme uniforme sur X que nous parlons. 
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SUBEQSooUYFTooWPVfWt 
Et pour tout à, j > 0, on obtient | ni dis 


AG) — fo) < 1e) — f5(e)| + lon] D |A + uni) — FE + Un,5x)|  (12.1027a) 
k=0 
< |fi(x) — f5(x)| (12.1027b) 


nm 
+ lon] D AE +unie) — FE + Un 5,x)| 
k=0 


nm 
+ [anl D [Ce + un,5x) — f(x + Un,5)| 


k=0 


< [fi(x) — f(x) 


nm 
+ Janl À 1fe + une) — fe + un,5)| 
k=0 


+ lan| D fi — F5 


k=0 


E YMH DFYPT 
or) 


< 1%) - 6 2 + leu Da lan) + leul À LE FE "ART a) 


< |fi(æ) — Pr a Cllau) + IA = fin) FNooZCEt Re Tee 
< AG) = Ho + Ma) +1 Pl) SRE) 


Justifications : 
— Pour (12.1027c) La norme supremum est forcément plus grande que la valeur en un 
point. 
— Pour (12.1027d) Remarquer que |x + un,i,8 — (2 + un,5,k)| = |un,ik — Un,j,kl < lanl. Cela 
est donc une bonne occasion de prendre la définition (11.849) du module de continuité : 


HG + unie) — fi(E +unx)| < wi(an). (12.1028) 


— Pour (12.1027e), il y a n + 1 termes dans les sommes et a, = (y — x)/(n +1). 


— Pour (12.1027f), nous travaillons uniquement sur le compact X. En particulier x,y € K 
et il existe un nombre M ne dépendant que de K tel que |y — x| < M. De plus w; est 
décroissante. Donc en remplaçant |y — x| par M nous majorons. 


Recopions notre dernière inéquation : 


HOEPOMOMOETCRET ENT (12.1029) 


Vu que f; est de classe C1, la fonction f/ est continue. Et vu que nous travaillons sur le 
compact Æ, elle est même uniformément continue (proposition 12.81). Le lemme 11.274 
dit qu’une fonction uniformément continue a un module de continuité continu en zéro : 
lim5_,0w:(0) = 0. Nous pouvons donc prendre la limite n — 0 pour nous supprimer le 
module de continuité : 


LAC) — fl < Le) — fo) + MIE — fx. (12.1030) 
Nous prenons maintenant le supremum par rapport à y : 
Lf— fx <IC) — fi) + MAÉ + fl. (12.1031) 


Par hypothèse nous avons la convergence simple f; — f, c’est-à-dire la convergence f;(x) Æ 
fi(x) pour tout x. Pour le x que nous nous sommes fixés, la suite à > f(x) est donc une 
suite de Cauchy dans MR. 
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Soit e > 0. Il existe N € N tels que si 4,3 > N nous avons |fi(x) — fj(x)| < €. De même 


la convergence uniforme f? x g implique que f; est également de Cauchy pour la norme 


uniforme. Donc pour un 4, > N (éventuellement un autre N, mais on prend le maximum 
entre les deux), nous avons |f; — f;| < €. 
Donc si à, > N nous avons 


Li fix < + Me= (M + 1e 2208 


Nous avons donc prouvé que (f;) est une suite de Cauchy pour la norme |.|x. Cela implique 
que (f;) à une limite uniforme sur K. Vu que nous avons déjà f; — f, nous en déduisons que 
sur K, cette limite est uniforme : 

fe ÿ (12.1033) 


Voilà qui prouve la convergence uniforme sur tout compact. 

Pour (2) Nous ne savons encore rien de la fonction limite f. Nous montrons qu’elle est 
dérivable et que f’ = g. 

Soient y € R et un voisinage compact K = B(y,6) de y avec 0 > 0. Pour tout à > 0 nous 
avons : 


f(y + 6) — f(y) 


5 g(y) (12.1034a) 
F JW FU) à JUL AU +) + ÉG+ 9 AG ay] (12.1034b) 
< : fi fie + [UT ù ÂG) _ op) (12.1034c) 
< hf — lie + AAC) — ou) SUBEQo UMP hAEE 
< FA lie + LA) — AD + LA — ou) (12.1034e) 
< A Flx + Au) — HG + AE — gx FRE PET UsIE) 
< SIA = flx + oillu— y) + If — gx (12.10348) 
< : fi flx + |! — glx + wi(26) So TEA) 
< fi = flk + LA — gl + (20) FPE EST 

Justifications : 


— Pour 12.1034d. Nous avons utilisé le théorème des accroissements finis 12.195, qui assure 
l'existence de u € B(y, 6) tel que 


fiu + 6) — fi(y) 
ô 


— Pour 12.1034f. Nous faisons un supremum sur le y € K dans le dernier terme. 


= f{(u). (12.1035) 


— Pour 12.1034h. Nous majorons [u — y| par le diamètre 26 du compact K = B(y, 6). 
— Pour 12.1034i. Le lemme 11.275 et le fait que f} DE g. 
Recopions la dernière inégalité : 


LG +4 =) 
6 


Nous prenons la limite à — ©. Par le point (1) nous savons que | f; — fx — 0. Par hypothèse 
nous savons aussi que | f! — g|x — 0. Nous restons donc avec 


GC +0) — f{y) 
ô 


g(y)| < 4 — fx + |f — gx + wo(26). (12.1036) 


g(y)| < wy(26). (12.1037) 
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Or, par uniforme continuité de g, nous avons lims_,9w4(6) = 0, donc la limite dans le membre 
de gauche se passe bien et 


im SG + 0) — (y) 


Lg EE = qu), (12.1038) 


ce qui signifie que f est dérivable en y et que la dérivée est g(y). 


ii Avertissement /question au lecteur !! 12.385 

Aussi incroyable que cela puisse paraitre, je n'ai pas trouvé d’énoncés du théorème 12.387. Donc 
soyez prudent. C’est donc une adaptation personnelle du cas sur R. Écrivez-moi si vous avez un 
problème ou un doute. 


ii Avertissement /question à la lectrice !! 12.386 

ii qd 

De plus, l’énoncé de 12.387 demande la convergence uniforme des dérivées directionnelles dans 
toutes les directions. Je ne serais pas étonné que la convergence uniforme seulement des dérivées 


partielles dans les directions « de base » suffise. 
ThoSerUnifDerr 


Théorème 12.387 (1323, 352, 1], thème 61). 

Soient des espaces vectoriels normés V et W. Soient un ouvert U de V et des fonctions fr: U—W, 
une autre fonction f : U — W ainsi que, pour toute direction! à e V, des fonctions ga: U — W. 
Nous supposons que 


(1) Les fx sont de classe C". 
(2) fr — f simplement. 
(3) Cafr — ga uniformément sur tout compact. 


Alors ITEMooQOSUo0oQGSUXC 


(1) Nous avons la convergence f; — f uniformément sur tout compact. ITEMooGFPLooGYEvkh 


(2) Pour toute direction a, nous avons 0af = ga. 
(3) La fonction f est de classe C! sur U. 


Démonstration. En plusieurs parties. 


(1) Uniforme convergence sur les boules fermées Soit a € U. Nous considérons r > 0 tel 


que B(a,r) € U (ça existe parce que U est ouvert ; il suffit de prenre r plus petit qu’un qui fait 
que B(a,r) € U), et nous posons X = B(a,r). Nous allons prouver l’uniforme convergence 


lg : Don: 
fi ——" f, et nous verrons plus tard comment faire pour l’uniforme convergence sur un 


compact général dans U. 
Nous restreignons toutes les fonctions à X. Nous notons w, ; le module de continuité 136 de 
Oafi. Pour chaque n € N nous définissons encore 


an: V—V 
a— x (12.1039) 
n+l 


Soit x e B(a,r). Nous écrivons la somme télescopique 


ere s. Lfi(a + (k+ Dan(z)) — fi(a+ kan(x))] SAGE 
k=0 


135. Ici le mot « direction » n’a pas de sens particulier ; c’est juste un élément quelconque. Si nous faisions de la 
géométrie différentielle hard-core, ce serait un vecteur tangent. 
136. Définition 11.272. 
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Notez que les points auxquels sont évalués f; sont dans B(a,r) parce que, si { € [0,n +1], 
nous avons 

la — x| 
n +1 
Ce point est important parce que rien ne nous dit que Ü est convexe; pour la suite nous 
avons besoin que tous les points sur les segments entre a et les différents points que nous 
allons considérer restent dans B(a,r). C’est d’ailleurs pour cette convexité de la boule que 
nous commençons notre preuve par le cas où K est une boule. Bref. 


la+lan(x) — al = [an(x)| =1 


<|a—zx|<r. (12.1041) 


Le théorème des accroissements finis 12.249 nous assure l’existences d'éléments 
yri € [a + (k + lJan(x), a + kan(x)| (12.1042) 
tels que 
fifa + (k+ Dan(x)) — fifa + kan(x)) = (d8f)(uri(x)) an (x). (12.1043) 


Notez que les y;;(x) sont dans B(a,r). 
Soit € > 0. Nous allons calculer | f;(x) — f;(x)| en substituant les valeurs de f;(x) et f;(x) 
données par (12.1040). Nous avons : 


Rx) — f(x] < 1 fa) a) + : lan(æ)||(O8 fi) (vri(x)) — (O5) (vr,5(æ))] 
(12.1044a) 


I(Oefi) (uri(æ)) — (ef) (ur s(æ))| (12.1044b) 


fs) (ee) — (sf) (ue, TRS TU ES) 


/\ 
m 
+ 
3 
+|s= 
= 
Cal 
NèsE 


/\ 
am 
+ 
3 
+|= 
= 
bb 


k=0 
+ D GA) (na) — Cof)(ues(o))| 


F 
Il 
=) 


PARC 01) es 0) 
NT) D lof — dsl 
k=0 


02 
D luss(lueste) — vol + PSE ÉRENEES 
k=0 


/\ 

m 

+ 
3 
+|- 
= 


nie 


Justifications : 


— Pour (12.1044c). Majoration |a,(x)| < ;7. De plus nous considérons des à et j assez 
grands pour que |f;(a) — f;(a)|x < €. Cela est possible parce que (fi) est une suite de 
Cauchy pour la norme uniforme sur K. 


— Pour (12.1044d). Utilisation du module de continuité, définition 11.272. 
B(a;r) 


— Pour (12.1044e). Nous avons la convergence uniforme 05f; ——> gg, de sorte que i + 
dgfi est une suite de Cauchy. Si à et j sont assez grands, nous pouvons majorer |08 f; — 
OBfl < € 

Étudions deux minutes ce qui est dans le module de continuité de (12.1044e). Nous avons 
yi(x) € [a+ (k+1)an(x), a + kan(x)], donc la différence |yx:(x) — yx,,(æ)| se majore par 
la taille de cet intervalle : 


lari(e) — yr,5(æ)] < la — kan(x) — (a + (k + Dan(x))] = lan(x)|: (12.1045) 
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Vu que le module de continuité est une fonction croissante, 


wss(lus(e) — ue) < wes(lan(o)|) < w8s (£ _ 4) : (=) (121046) 


n +1 n +1 


En substituant tout ça dans (12.1044e), nous continuons : 


nm 
r r r 
<E+ WBi(—) +re<E+Tw8; | —— | +re 12.1047 
ki ri si) (5) 
Résumons. Pour tout x € B(a,r), pour tout n € N, si i et j sont assez grands, nous avons la 
majoration 


lfi(æ) — f(x) < + rwsi( + re. (12.1048) 


r 
na 
Nous pouvons prendre la limite n — co de deux côtés. Vu que @3f; est uniformément conti- 
nue 7, le module de continuité tend vers zéro (lemme 11.274). 


Siiet j sont assez grands, nous avons donc 
le) — f5(x)1 < (1 +r), (12.1049) 


et donc aussi 
Li Hlges < LAG) - HG) < +). (12.1050) 


Cela prouve que (f;) est une suite de Cauchy pour |.|x. Donc f; converge uniformément vers 
une certaine fonction. Vu qu’elle converge simplement vers f, elle converge uniformément 
vers f. 

Nous avons donc prouvé que 


Us 
fi SF, (12.1051) 


c’est-à-dire la convergence uniforme sur toute boule compacte. 


(2) Convergence uniforme sur tout compact Soient un compact À de U, et e > 0. L’en- 
semble {B(x,r)}xek,r>0 est un recouvrement de X par des ouverts. On en extrait un sous- 
recouvrent fini, et on ferme les boules sans changer le fait que ce soit un recouvrement : 


nm 
KCe{JB(ar). (12.1052) 
i=1 


Vue la convergence uniforme sur toute boule fermée, pour chaque 1, il existe N,; tel que n > N; 
implique 
Mn —flgas < € (12.1053) 


En prenant N > max{N;}, nous avons 
| fn — fx < € (12.1054) 


pour tout n > N. 


(3) Pour (2) Soit a € U et un voisinage compact K = B(a,ô) de a. Nous considérons une 
direction u avec [u| = 1. Nous calculons un peu : 


te, pif en AC, (12.1055a) 
Le + = 50 _ y 
MHCENO] 
< ff + ÉD AO gta (12.1055b) 


137. Elle est continue sur un compact, proposition 12.81. 
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Ici, la norme | f;— f|| est une norme supremum sur X (vous devriez l’avoir deviné du contexte). 
C’est le moment d'utiliser le théorème des accroissements finis 12.249 : il existe y € [a+ du, a] 


tel que 
Ji(a + "0 = Ji(a) | (@; f;)(y) (12.1056) 
Nous continuons : 
0 < fi — F1 + In) — gu(a)| (12.1057a) 


2 SUBEQooCLCQoo 
< {fi — f1 + 1@uf)(0) — Gufi)(o)| + I@u)(@) — gu(a)l (31057) 
Nous introduisons le module de continuité l® Wiu de (fi) pour traiter le premier terme : 


I(@ufi)(a) — (Au fi)(a)| < wiu (lg — al) <wiu(d): (12.1058) 


Nous utilisons aussi la convergence uniforme sur tout compact (point (1)) df; x Ju pour 


majorer le second terme de (12.1057b) par € lorsque à est grand. 


Nous continuons. Pour tout À assez grand, nous avons 


2 + ôu) — F(a) 
Q] 


gula)| < Êf — 1 + € + wi (8). (12.1059) 


Nous prenons la limite à — c en tenant compte du lemme 11.275 : limi_, wiu(0) = wy(Ô) : 


f(a + ôu) — f(a) 


FES 


Ju(a)| < € + wy(Ô). (12.1060) 


Et enfin en prenant la limite Ô — 0 nous trouvons que pour tout €, 


li Se 12.1061 
dim ITS gu(a)| < € (12.1061) 
et donc nous avons prouvé que 
ô 
ti | AGE ” CRT TE (12.1062) 


Cela prouve que (2,f)(a) existe et vaut g(a). 


Vu que les g, sont continues, la fonction f est également de classe C1 par le théorème 12.306. 


12.34 La fonction puissance 


Si x et y sont des réels, définir xŸ n’est pas une mince affaire. Pour l'instant nous savons déjà 
définir x” lorsque x € R et n € N. Voir la définition 1.200 et le thème 51. 
Pour la suite nous notons 


Ja(x) = x° (12.1063a) 
ÿa(x) = a° (12.1063b) 


pour autant que ces fonctions sont définies !*°. 


138. Définition 11.272. 
139. L'objet des pages suivantes est de déterminer pour quelles valeurs de a, à et x nous pouvons trouver des 
définitions raisonnables pour ces fonctions. 
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12.34.1 Sur les naturels 


DEFooKEBIooZtPkac 
Définition 12.388. 
La fonction puissance définie sur N s'étend à Z de la façon suivante : 
1 
gi = (12.1064) 
CAL 


pour n > 0. Cela donne donne donc x" pour xEe R etneZ a l’exception de x = 0 lorsque n < 0. 
Nous étudions quelques propriétés de cette fonction pour n > 0 fixé. 


12.389. 
La limite 
lim x” = (12.1065) 


æ—>00 


demande la topologie sur la droite réelle achevée. C’est le lemme 12.32. 


PROPooXQYFooPxoEHE 
Proposition 12.390. 
Soit n E N\{0} ; nous posons fn(x) = x”. 
Sin est pair, 
fn: [0, co[ — [0, co[ (12.1066) 
est bijective. 
Sin est impair, 
fn: R—R (12.1067) 


est bijective. 
Toutes les fonctions fn sont continues sur R. 


Démonstration. En plusieurs morceaux, pas spécialement dans l’ordre auquel on s’attend. 
(1) Continuité 
Soit x € R. En vertu de 12.56 nous allons prouver que lime_,0 fn(x + €) = fh(x). Pour cela 
nous utilisons la formule du binôme 3.43 avec x,h > 0: 


fnæ+h)=(x+h}" = Y () pepe, (12.1068) 
k=0 
Nous fixons %0 € R. Calcul : 
7 nm 
tee +1 Po = 1 (Re )e (12.1069a) 
k=1 
<>, (Jteolr-#tu (12.1069b) 
k=1 
=h> o col" |A [F1 (12.1069c) 
k=1 
SA () col" À. (12.1069d) 
k=1 


Justifications : 
— Le terme k = 0 est égal à x" = fh(x) parce que (6) = 1. 
— Dans la somme nous avons majoré |h| par 1, opération justifiée par le fait que nous 
ayons dans l’idée de faire h — 0. 


Nous avons donc 
: L n n—k 
lim [fn(co + À) — fn(x < lim h 2 () En RS à © (12.1070) 


D'où la continuité de f, en tout point xo € R. 
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(2) Pour n pair ou impair, bijection sur les positifs Ceci sera déjà le résultat complet 
pour les n pairs, et a moitié du résultat pour les n impairs. 


(2a) Stricte croissance Soit n Æ O0 dans N. Nous commençons par prouver que f, est 
strictement croissante sur [0,œ0[. Nous repartons de la formule du binôme, mais cette 
fois, nous séparons les termes k = 0 et k = n des autres (si n = 1, il y a un peu de 
réécriture) en tenant compte de (9) = (*) =1: 


n—1l 
fn(t+h)=2"+ht + 2 () a RE > a = f(x). (12.1071) 


Vous noterez que l'inégalité est stricte même si n = 1. 
Vu que nous avons stricte monotonie, le théorème 12.54(2) nous dit que 


fn: [0, c0[ — fa ([0, of) (12.1072) 


est une bijection. 

(2b) Bijection 
Nous prouvons que fn([0,20[) = [0,00[. Si x > 0 alors fh(x) > 0, cela prouve une 
inclusion. 
Pour l’autre inclusion nous savons que lim, fn(æ) = © par le lemme 12.32. Si y € 
[0, cl, alors il existe ro tel que f,(xo) > y. Étant donné que f,(0) = 0 et que nous 
avons déjà prouvé que f, était continue (proposition 12.390), le théorème des valeurs 
intermédiaires 10.89 nous indique l’existence de 1 € [0, xo[ tel que fh(x1) = y. 

Nous avons prouvé que pour tout n, la fonction 


fn: [O, of — [0, co FAO EN Ir) 


est une bijection. 


(3) Pour n impair 


Nous montrons à présent que si n est impair, alors 
E TSLJ 
fn: ]-00,0] — ]-00,0] OCR AREA) 


est une bijection. 

Tout se base sur le fait que si x > 0 alors f,(—x) = —fh(x). Le fait que (12.1073) soit 
injective et surjective montre alors tout de suite le fait que (12.1074) soit également injective 
et surjective. 


Vous noterez que la continuité de f} démontrée dans la proposition 12.390 est indépendant de 
la proposition 12.64 qui sera invoquée plus tard pour définir a° lorsque a > 0 dans R. 


12.34.2 Sur les rationnels, racines 


L'existence, pour tout réel a > 0, d’un réel r tel que r? = a est déjà faite en la proposition 
LAST. 
DEFooJWQLooWkOBxQ 
Définition 12.391 (Exposant rationnels). 
La proposition 12.390 nous dit entre autres que pour tout n € N, la fonction 
: [O,00[ — [0,0 
fn: 10,œl D, (12.1075) 
Tr x 
est bijective. Nous définissions alors, pour a € [0, 0, 
an = frl(a). (12.1076) 


Autrement dit, le nombre a/" est l’unique solution positive de 


"0. (12.1077) 
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NORMooDUNZooUNdUKg 
12.392. 
Nous ne définissons pas al/” pour a < 0, du moins pas encore. Vu que f3 est bijective sur KR, il 
serait tentant de définir (—1)/3 = f, 1(—1) = 1. 
Cela causera un certain nombre de problèmes plus tard vu que nous aurons envie de deux 


choses en même temps : 
— d’une part In(—1) = àr, 
— d'autre part, a° = e”ln(a), 
De cette façon, nous devrions avoir 
(En, (12.1078) 


qui est un nombre complexe non réel. Voici un exemple de ce que ça donne avec Sage : 


sage: a=(-1)*x*(1/3) 
sage: a.real_part() 


:| 1/2 


sage: a.imag_part() 


5\1/2*xsqrt (3) 


tex/sage/sageSnip019.sage 


DEFooPOELooPouwtD 
Définition 12.393 (Racine). 
Pour n e N nous définissons &/x = f} (x). Lorsque n est pair, la fonction x + ?/x n’est définie 


que sur R*, et lorsque n est impair, elle est définie sur tout R. 
NORMooYPRNooCjEgR 


12.394. 
Notons que les fonctions x > #/x et x + x /° ne sont pas les mêmes : la première est définie sur 
tout R et donne des valeurs réelles tandis que la seconde n’est (pour l'instant) définie que sur les 
positifs, et donnera (quand on l’aura définie par l’exponentielle) des nombres complexes sur les 
négatifs. 

En suivant cette convention, c’est-à-dire en réservant la notation V/ Pour l'inverse de f2, nous 


1/3 


ne devrions pas écrire des choses comme « 4/—1I = à », mais plutôt « (—1)!/2 = à ». En effet, ÿ—I 
n’est pas défini et ne sera jamais défini alors que (07 2 n’est pas encore défini, mais sera défini 
par 

(—1)2/2 = e3in(1) 2 éir/2 25, (12.1079) 


En résumé, nous avons les fonctions suivantes : 
(1) y:R—R sin est impair, 
(2) x: [0, cf — [0, of si n est pair, 
(3) æl/": [0,co[ — [0,[ pour tout ne N. 
Cependant nous n’hésiterons pas à utiliser la notation /x pour x /* même lorsque x est négatif, 
parce c’est une notation très pratique. Il faut garder en tête que cette façon de faire est incohérente 
parce qu’elle inciterait à penser que Ÿ=I = e/T/3 au lieu de Ÿ I = —1. 
Pour toute la suite de cette section, nous allons considérer a° uniquement pour a > 0. 
DEFooHXUFooUJTVXA 


1/2 


Définition 12.395. 
Pour m,neN nous définissons (a!/" est la définition 12.391) 


no | 


ce qui définit la fonction puissance sur QT. Enfin nous posons 


a "1 L DÉRRGTIONAQN RE 


ad 
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lorsque q € Q*. 
Et avec tout ça, lorsque a > 0 nous avons défini a! pour tout q € Q. 


Nous allons souvent noter la définition (12.1080) sous la forme 


Fn/n(e)" = 2. FAooZTKKaQ TS 
LEMoo0OFPMooIEmSNA 
Lemme 12.396 ([1]). 


Si a,b > 0, nous avons ITEMooEFUA0OYBeJza 
(1) Pour ne N nous avons (ab)//" = a/pl/r, 


ITEMooHGPPooDBzWKx 
ln — j1/npl 
(2) Pour n,me IN nous avons (ab)1/" = at/npl/n, ITEMooUYTLooHzXwtf 
(3) Pour q € N nous avons (ab)? = a%b1. 
Démonstration. Point par point. 
(1) Pour (1) Utilisant la formule pour les exposants entiers, nous avons 
nm 
[GRR] = (a RS ab, (12.1083) 


Donc le nombre x = a!/"bl/" vérifie x" = ab. Autrement dit x = f}!(ab) = (ab)/" 
(2) Pour (2) 
(3) Pour (3) 


LEMooIDLJooZALNaD 
Lemme 12.397 ([1]). 
Pour a > 0 et p,q € Z nous avons : 


aP/9 = (aP)1/9 = (al/a)p. (12.1084) 


Démonstration. Nous divisons la preuve en fonction de la positivité du numérateur et du dénomi- 
nateur. 


(1) Numérateur et dénominateurs positifs 


Nous commençons avec p,q € N. La première égalité est la définition 12.391. Pour la seconde, 
la définition de (a?)1/1 est d’être le x > 0 tel que 


Me (12.1085) 
La définition de a!/4 est d’être le y > 0 tel que 
y = a. (12.1086) 


Ce y vérifie donc aussi y?1 = a? et donc (y)? = a?. Autrement dit, y = x, c’est-à-dire 
exactement 

(a/95P = (aP)1/9, (12.1087) 
Le lemme est prouvé dans le cas où p,q € N. 


(2) Numérateur et dénominateur négatifs 


Si p et q sont tous les deux négatifs, nous remarquons que p/q = (—p)/(—q) et nous sommes 
dans le même cas qu'avant. 


(3) Numérateur négatif, dénominateur positif 


Pour simplifier les notations nous supposons toujours p, q € IN mais nous considérons a(-P)/4. 
Nous avons d’une part : 


1 1 
aP/q (at/a)p 


ae =, (p/a) = (al/9)P, (12.1088) 
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Dans ce calcul, nous avons utilisé au dénominateur le résultat dans le cas positif. 
Le lemme 7.240(3) nous dit que (1/a?) = (1/a)?. Nous faisons le calcul suivant : 


AOOIMONECE Ca. 


où nous avons utilisé le résultat avec 1/a en guise de a. 


(4) Numérateur positif, dénominateur négatif 


Nous traitons maintenant a?/(-%), Nous avons d’une part 


1 


p/(—a) = ,—(p/9) — — 
. o ap/q (aP)1/a 


= (ap) 0/9 2 (opt), (12.1090) 


Et d’autre part : 


Se ne a) (CR) (12.1091) 


aPa (at/a)p mor 


Le lemme suivant montre que la définition sur Q7 est cohérente avec celle sur Q*, au sens où 
finalement nous retrouvons que a" vérifie x" = a” quel que soient les signes de m et n. 


Lemme 12.398 ([1]). 


Le nombre y = a-""" vérifie l'équation y" 


= am 


Démonstration. Nous posons x = a" 
CRULE 1. Alors 


, c’est-à-dire x” = a”. Nous avons, par définition y = 


y n= ==. (12.1092) 


donc c’est bon. 


LEMooJYGUooHhLASp 
Lemme 12.399 ([1]). 
Pour a > 0 et g,q € À nous avons 
aa = atT. (12.1093) 
Démonstration. Nous mettons q et g au même dénominateur. Soient qg = s/c et g = r/c avec 
s,reZet ce N. En utilisant les égalités du lemme 12.397 nous trouvons 


! 


a°/Ca"/© _ (ane )Ata er _ (anse =. aw+rVe = gt, (12.1094) 


LEMooXJXUooLoiTMo 
Lemme 12.400 ([1]). 


La fonction puissance prend les valeurs suivantes. 
(1) Si a = 1 alors al = 1 pour tout q € Q. 
(2) Si a > 1 alors 
— a>1siq>0 


ITEMooKZCGooKskUQx 


— al<1siq<0 
— a0 = 1. 

(3) Si a < 1 alors 
— a<1siq>0 
— al>1siq<0 


— a —1. 
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Démonstration. Si a = 1 alors a* = 1 pour tout k € N. Ensuite, pour m,n € N, a"/" est solution 
de x°* = a” = 1, donc x = 1. En ce qui concerne les puissances négatives, 1/1 = 1. 
Si a > 1 alors a > 1 pour tout k e N. De plus pour q > 0 nous avons q = m/n avec m,n € N. 


Alors a" est solution de x" = a" > 1. Or pour x < 1 nous avons x" < 1, donc la solution à 
x = a” vérifie forcément x > 1. 
Toujours avec a > 1, si q < 0 nous posons g = —q/ avec q > 0. Alors 
/ 1 
Qu a =. 
a = q (12.1095) 


s ! . . po \ 
Mais a? > 1, donc l'inverse est inférieur à 1. 
En ce qui concerne les cas a < 1, ils sont obtenus en posant b = 1/a et en calculant 


aî = G) | (12.1096) 
b bq 
PROPooVXKBooQPP jMn 
Proposition 12.401 (|1|). 
Soit a > 1. Alors 
lim a" = 00. (12.1097) 


Démonstration. Soient a > 1 et M > 0. Nous devons prouver qu'il existe n € N tel que a” > M. 
Nous posons a = 1 + h. Alors en utilisant la formule du binôme, 


af = (1+h)" = 5 () Ro, (12.1098) 


k=0 


Tous les termes de la somme sont strictement positifs. Prenons le terme k = n — 1. Il vaut 


n—1 


( : }n= ni. (12.1099) 


Donc a” > nh, donc oui, cela peut être rendu arbitrairement grand avec n sans toucher à a parce 
que N est archimédien par la proposition 1.83. 


PROPooGCBZooTcyGtO 
Proposition 12.402 (|1}). 
Pour a > 0 nous considérons la fonction 
:Q—R 
ga: Q (12.100) 
gr ai. 
(1) Siae ]0,1[ alors g est décroissante et 
lim ga(q) = 0, lim ga(q) = 0. (12.1101a) 
q—00 q——00 
ITEMooGOEVooKVoVpz 
(2) Si a > 1 alors ga est croissante et 
Jim 9a(g) = , im, Sa(g) = 0. (12.1102a) 


Démonstration. Nous prouvons le cas a > 1. L'autre cas s’en déduit en posant b = 1/a. Pour la 
croissance, soient q € À et r > 0 dans Q. En utilisant le lemme 12.399, nous avons 


ar = aa" > a? (12.1103) 


parce que a” > 1 par le lemme 12.400. 
En ce qui concerne la limite g — 00, la fonction g, est croissante et non bornée par la proposition 
12.401. Donc sa limite est 00. 
Pour la limite q — —c, nous avons 
1 
lim aî= lim a = lim — =0. (12.1104) 


li 
qg——00 q—20 qg— ad 
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PROPo0oIIDGooTRtI1UD 
Proposition 12.403 (|[1]). 
Soit a > 0. Nous avons 
Dim af = 1. (12.1105) 
Notons que cette limite est une limite dans Q parce que nous n'avons même pas encore défini a” 
lorsque x est irrationnel. 


Démonstration. Nous notons, comme à l’accoutumée, g,(x) = a”. Nous allons prouver que pour 
toute suite (x}) dans Q telle que xy — 0, nous avons aŸk — 1. 


(1) Suite positive Soit une suite de rationnels x, — 0 avec xx > 0. En définissant y, par 


zx = 1/yx nous savons que al/Yk est la solution de x = a. 
Nous posons {}, = a° et notre but est de prouver que {4 — 1. Pour tout k nous avons la 


relation 
ed (12.1106) 


Soit s > 1. Il existe un M > 0 tel que y, > M implique s% > a (proposition 12.401). Donc 
dès que y; > M nous avons ty < 5. 

De la même manière, si r < 1, il existe un À > 0 tel que y, > R implique r*# < a. Donc dès 
que yx > R nous avons {x > r. 

Soit donc un voisinage [r,s[ de 1 (avec r < 1 et s > 1). Nous avons les nombres M et R 
correspondant et nous posons L = max{M, R}. Soit K tel que k > K implique y, > L. Alors 
pour k > K nous avons aussi {} < 8 et tx > r, c’est-à-dire ty € [r, sf. 

Cela prouve que tx — 1. 


(2) Suite négative Supposons maintenant que (xx) est une suite de rationnels vérifiant xx — 0 


avec zx < 0. En posant 24 = —x}, la suite (24) est dans le cas précédent et nous avons 
Lk 7 L 
a = q# = L (12.1107) 
ak 


(3) Suite générale Si x} En 0 avec xy # 0. Nous considérons la suite ty} = a*k. Toute sous- 
suite contient une sous-suite avec zx > 0 ou une sous-suite avec xx < 0. Dans les deux cas, 
la sous-sous-suite converge vers 1. Le lemme 7.61 conclut que tx — 1. 


(4) Conclusion Pour toute suite x} — 0 nous avons g(xx) — 1. Par le critère séquentiel de 
la limite (proposition 7.239) nous avons lim:_,0 ga (x) = 1. 


LEMooKDBPooLQwxMD 
Lemme 12.404. 
Soit a > 0. La fonction 
Ja: Q—R 


tr a” 


(12.1108) 


est continue. 


Démonstration. Soient x € À et une suite æ4 — 0 (toujours dans À) et utilisons le lemme 12.399 : 
dk gran, (12.1109) 


Cela est, dans R, le produit entre une constante (a”) et une suite. La limite est donc le produit 
de cette constante et la limite de la suite (si elle existe). Par la proposition 12.403 nous avons la 
limite a** — 1, et donc 

Hum otege (12.1110) 


k—00 


ce qui prouve la continuité (caractérisation séquentielle, proposition 7.129) de ga. 


12.34. LA FONCTION PUISSANCE 1105 


PROPooQRFSooVzYdJM 


Proposition 12.405 ([1, 160]). 
Soit a > 0 dans R. La fonction 


Ja: R—R 


(12.1111) 
gr af 


est Cauchy-continue. 


Démonstration. En quelque étapes. 


(1) 


Pour a > 1 Avant de nous lancer dans la preuve directe, nous prouvons une petite formule. 
Soit € > 0. Vu que, par la proposition 12.403, lim,_,0 ga(g) = 1, il existe Ô > 0 tel que 
0 < q < Ô implique [1 — g(q)| < €. 

Soient maintenant p,q € À tels que |p — q| < Ô. En utilisant de plus la définition (12.1081) 
et la formule du lemme 12.399, 


: _ Ga(p) : 
POEPOE OISE (211122) 
= |ga(q)|I1 — ga(p — 4)| (12.1112b) 
< |ga(g)le. (12.1112c) 


Nous y allons pour la preuve directe. Soit une suite de Cauchy (g,) dans Q. Nous devons 
prouver que la suite n — ga(qn) est de Cauchy dans R. Soit € > 0. 
La suite (q) étant de Cauchy dans Q, elle l’est également dans R, elle est bornée parce que 
convergente vu que R est complet 10. Vu que g, est croissante ll et que (q,) est bornée, il 
existe M tel que |ga(qn)| < M pour tout n. 
Nous considérons Ô tel que 0 < q < à implique [1 — g(q)| < €, ainsi que N tel que à, > N 
implique |g; — g;| < à (là nous utilisons le fait que (g,) est de Cauchy). Pour de tels N,4,j 
nous avons 

[Ja(di) — Ja(g;)| < Me. (12.1113) 


Donc la suite g(qn) est de Cauchy. 
Pour a =1 La fonction g est constante. 


Pour a =0 Dans ce cas a? = 0 pour tout q, et l’image de toute suite de Cauchy est de 
Cauchy. 


Pour 0 <a <1 Considérons une suite de Cauchy (g;) dans Q. Nous posons b = 1/a, et 
nous utilisons la définition 12.395 ainsi que le lemme 12.396 : 


di 


a = _ = pa, (12.114) 


La suite (—q;) est de Cauchy et b > 1, donc la suite à > b7% est de Cauchy par le point 
précédent. 


12.406. 
L’ingrédient magique qui fait fonctionner la proposition 12.405 est le fait que g(x+y) = ga(T)a(y) 
couplé au fait que lim,-_,0 ga(q) = 1. C’est cela qui débloque la situation pour étendre la fonction 
puissance de À vers R en utilisant le lemme 12.64. 

Le chemin suivi par [402] pour étendre la fonction puissance de Q vers R est un peu différent : 
il définit a° = sup{a tel que q < x,q € Q}. La preuve que cette définition donne x + a° continue 


sur R repose, elle aussi, essentiellement sur le fait que limy-,0 a? = 1. 
Il y a donc une certaine justice. 


140. Théorème 7.272. 
141. Proposition 12.402(2). 
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DEFoo0UJMKooJgcCtq 
Proposition-Définition 12.407 (Fonction puissance|[1]). 
Si a > 0 la fonction 
:Q—R 
ga: Q : (12.1115) 
ze a”. 
est Cauchy-continue par la proposition 12.405. Si x € IR nous définissons 
a = ÿa(t) (12.1116) 


où ga est l’extension de g, donnée par le lemme 12.64. 
Nous allons la noter ga également, et écrire a° la valeur de ga même lorsque x n’est pas un 
rationnel. 


PROPooVADRooLCLOZzP 

Proposition 12.408 (|[1]). 
Quelques propriétés de la fonction puissance. ITEMooQHYRoOJTewyp 
(1) Pour a > 0, la fonction g: x a* est continue sur R. ITEMooTZBLooSGtWTp 
(2) Pour a > 1, la fonction g: x a est croissante. ITEMooSCJBooNV JZah 


(3) Poura >0etx,yeR nous avons 


av aÿ = a+. Do Un 
En particulier, 


Te (12.1118) 


Démonstration. La continuité de x + a” est par construction. Le point (1) est fait. 
Pour le point (2), lorsque a > 1, la fonction f,: Q — R est croissante (proposition 12.402). 
Donc par la proposition 12.66, la fonction x + a” est croissante sur KR. 


Et enfin pour le point (3) F il faut faire un peu plus attention. Soient des suites x; — x et y; — y 


dans Q. Calculons : PUPEUSSSMPALOGPOy Ju 
aa” = (lim aa SUPERoo0C ER p4 Tan 

= tm (rar) SUBEQooEKqNapF 4 Fg 

= im (lin aa) SUBEQOoZEMPapyAnyS 

= lim (Tim a+) 7. 110) 

Tim a% tv SUBEQOOKHKE ap GARD 

 qu+v. SUBEQOONZBF poSaser 


Justifications : 
— Pour 12.1119a. Définition de a” lorsque x € R. 


— Pour 12.1119b. Nous entrons le nombre a” dans la limite. Entrer un facteur dans une limite 
convergente dans R est un acte anodin. 


— Pour 12.1119c. Définition de a”, et renter le nombre réel a” dans la limite sur k. 
— Pour 12.1119d. Utilisation du lemme 12.399, valable pour x;, yr € Q. 


— Pour 12.1119e. Pour à fixé, la suite & + x; +74 est une suite de rationnels qui converge vers le 
réel x;,+4y. Par définition 12.407 de la fonction puissance nous avons alors limy a*iT%r = aitu, 


— Pour 12.1119f. La suite de réels à + x;+y converge dans R vers le réel x+y. Par la continuité 


de tr at (ça fait partie du lemme 12.64 définissant la fonction puissance sur IR) nous avons 
lim, aitu = ay, 
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Vous remarquerez que les limites sur k et sur à ne s’enlèvent pas tout à fait avec la même 
justification. Nous aurions pu invoquer la continuité sur R de t + a pour les deux limites. Mais 
cette continuité, dans le cas d’une suite purement constituée de rationnels, est la définition de la 


prolongation vers R. 


LEMooTPLLooCgpCIn 
Lemme 12.409. 
Soient a,b > 0. Si1 < x < y alors 
a — b < ay — bx. (12.1120) 
Démonstration. Nous posons y = x + s avec s > 0. Alors 
ay — bx = a(x +s)—bx = (a —b)x + as > (a—b)r > a —b (12.1121) 
parce que as > O0 et x > 1. 
PROPooJXHFooCDwxCS 
Proposition 12.410 (|[1}). 
Pour q > 0 dans Q, la fonction 
+ 
: — R 
Jai Q (121122) 
xt x 


est strictement croissante. 


Démonstration. Division selon la généralité de q. 


(1) Si q est entier positif Soit qg=nenN.Sis > 0 alors l'inégalité (x + 5)" > x" découle du 
binôme de Newton de la proposition 3.43. 


(2) Si q est rationnel Soient un rationnel g = m/n et un nombre strictement positif s. Nous 
avons, par la définition 12.391 sous la forme (12.1082) : 


Pants) m4 sa = fonte" (12.1123) 
Nous avons utilisé la stricte croissance de x + x”. Cela donne 
Tata +s)" > Fante) re (12.1124) 


En utilisant encore la stricte croissance de x + x", nous avons le résultat. 


CORooYWNNooLwKmiD 
Corolaire 12.411. 
Soient 1 < b < a dans R et des rationnels strictement positifs p < q. Alors 


ap — bP < al — bi (12.1125) 
Démonstration. Nous notons q = p + r avec r > 0 dans Q. Par la proposition 12.410, 
a" > b". (12.1126) 
Cela nous permet d’utilise le lemme 12.409 pour écrire 


ap — D < aa — bb = af — bf. (2 É127) 


PROPooKWRGooMTbRdAU 
Proposition 12.412 (|1}). 
Soient a,b>0etaeR. Nous avons : 


ab? = (ab). (12.1128) 


Démonstration. Nous supposons que c’est bon pour à € N et à € Z. Pour les autres, nous donnons 
plus de détails. 
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(1) QŸ Soit q = m/n avec m,ne N. Si ar = x et b"/" = y, alors 


a" = a" Fo RENE 


y} = pm (12.1129b) 


RD 


par (12.1082). Nous multiplions (12.1129a) par y” à gauche et par b” à droite : "y" = a 
En tenant compte du résultat pour N, nous avons 


(xy)" = (ab), (12.1130) 


ce qui signifie que le nombre xy est (ab}"”". 


(2) Pour Q7 Soit qe Q*, nous avons le calcul 


1 1 
—4p— a _ _ 4 
ab ni be (ab)"<. (12.1131) 


(3) Pour R Soit une suite de rationnels a; — a. Nous avons 


a%b% = (lim a%) (lim b%) = lim (a%b%) = lim(ab)% = (ab)*. (12.1132) 
A 3 ul o 


Justifications : 
— la proposition 10.27 pour le produit des limites, 
— le résultat dans À que nous venons de prouver, 


— la définition de (ab)® comme limite de (ab)%. 


Pour rappel, la proposition suivante, dans le cas de & € Q* est la proposition 12.410. 
PROPooUOFKooYyGwIr 


Proposition 12.413 ([1]). 


Pour à > 0, la fonction 
Ja: 10,0[—R 


: (12.1133) 
Tr T 


est strictement croissante. 


Démonstration. Nous rappellons que le cas & € Q* est déjà traité par la proposition 12.410. Soient 
x € [0,00{ et s > 0. Nous allons montrer que f(x + s) — f(x) > 0. Pour cela nous décomposons 
en plusieurs cas. 
(1) æ>21 Par la proposition 1.438, nous considérons une suite strictement croissante de ration- 
nels strictement positifs a; — a. Pour tout à nous avons @; > @o. 
En utilisant la stricte croissance de f,, et le lemme 12.400(2), nous avons les inégalités 
1<x% < (x +s)%, et en particulier 


D<(x+s)% — 7%, (12.1134) 


De plus nous avons 1 < x < x +5 et ag < @; pour tout 5. Donc le corolaire 12.411 s’applique 
et nous avons, pour tout 1 : 


O<(r+ 5) — 20 < (x + s)% — ri, (12.1135) 


C’est le moment de passer à la limite à — 0. La seconde inégalité devient non stricte, mais 


la première reste : 
O<(x+s)0—2%0 <(x+s)— x. (12.1136) 


Nous avons donc bien la stricte croissance de f, sur |1, 0. 
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(2) 0<x<1 Nous choisissons encore a; — a strictement croissante dans Q. Pour chaque i, 
nous avons encore 
(x + s)% — 2% > 0. (12.1137) 


Le passage à la limite change l’inégalité stricte en inégalité large, et ne permet donc pas de 
conclure immédiatement. Nous devons donc ruser. Soit k e NN tel que k(x +5) > Let kx > 1 
(existence parce que R est archimédien, proposition 1.423). Nous avons : 


(k(x + s))" — (kr)® > 0 (12.1138) 


par la partie &æ > 1» que nous venons de prouver. Grâce à la proposition 12.412 nous 
pouvons factoriser k® : 


0 < (k(x + s))" — (ke) = k((x + 5) — 2°). (12.1139) 


Vu que k* > 0, cela implique (x + s)* — 2% > 0, ce qu’il fallait. 


Nous avons fini de prouver que la fonction f, était strictement croissante sur ]0, |. 
LEMooJVXQooDPUuuJ 


Lemme 12.414. 
Sip>1letsixe [0,1] alors x < x. 


Démonstration. Vu que p > 1, nous avons p = 1 + a avec a > 0. Nous pouvons donc écrire !#? 


ap = pit 2 ga = xfa(t). (12.1140) 


Vu que f, est croissante (proposition 12.413), que f,(0) = 1 et que fA(1) = 1, nous avons f(x) € 
[0,1] dès lors que x € [0,1]. Donc 
zfa(x) < x. (12.1141) 


Nous prouvons à présent que f, est localement injective ; nous en avons besoin pour prouver la 
continuité. Or cette continuité est nécessaire à prouver que f, est localement bijective. Donc nous 


ne pouvons pas énoncer la bijectivité ici. Ce sera la proposition 12.420. 
PROPooHKTKooCUEBjh 


Proposition 12.415. 
Soient a Z 0 etx e R\{0}. Il existe un voisinage V de x sur lequel 


Ja: V — fa(V) (12.1142) 
est injective. 


Démonstration. Soit x > 0; nous considérons un voisinage V de x inclu à [0,[. Soit y € V ; pour 
fixer les idées nous supposons y < x. Par la stricte croissance de f, sur ]0,0![ (proposition 12.413), 
nous avons fa(y) < fa(x) et en particulier fa(x) Æ fa(y). 

Le cas x < 0 se traite de façon analogue, avec la stricte décroissance de f, sur ]—00,0[. 


Notons que les voisinages sur lesquels f, est injective sont assez grands. Ils peuvent être toute 


une demi-droite, si l’on veut. 
LEMooQTNKooLVEytN 


Lemme 12.416. 
Soient a > 0, une suite de rationnels strictement décroissante a; — & ainsi que les fonctions 


ou: HR 


te ri, 


(12.1143) 


La famille { fa,}ien est équicontinue !#. 


142. En utilisant la proposition 12.408(3). 
143. Définition 7.302. 
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Démonstration. Soient x > 1, et à > 0. Nous allons montrer que {f,,} est équicontinue en x. Soit 
s tel que 1 < x < x +5; le corolaire 12.411 nous enseigne que 


(x + 5) — x? < (x + 5) — x (12.1144) 
dès que p < q. En particulier, f, étant croissante par la proposition 12.413, 
O<(r+s)%—r% < (x +3) — 790, (12.1145) 


Soit e > 0 et Ô tel que s < Ô implique |(x + s)% — 3%] < €. Alors nous avons aussi, pour de tels Ô 
et 5: 
[x + SJ — ma] < (x + 5) — 30] < €. (12.1146) 


En procédant de même pour s < 0, nous trouvons bien que 


fus | te (12.1147) 
pour tout y € B(x, 06). 
Cela signifie que {f;} est équicontinue. 
PROPooUQNZooSSHLar 
Proposition 12.417 (|1]). 
Soit a > 0 dans R. La fonction 
:R—R 
2 (12.1148) 


tx x 
est continue. 
Démonstration. Nous allons subdiviser quelque cas. 


(1) Pour ae N Nous supposons que ce cas va bien. 


(2) Pour ae QT Soit q = m/n avec m,n € N. Soit aussi € > 0. Nous avons : 


rte) = (12.1149a) 
fan(e +9" = (+9). SUBEROOGNCÉgoNtan gr. 
L’équation (12.1149b) s'écrit aussi bien sous la forme 
fn (fmn(e + €) = (& + 97. (12.1150) 
En prenant la limite, 
ma [£a (Fya(e + 6))] = 2° = fan (12.151) 


Vu que f est continue, nous pouvons la permuter avec la limite dans le membre de gauche 
tout en écrivant f/n(x)" = fn ( Pr et) dans le membre de droite : 


fal in fn (e + 9] = fa (mn (e)). (12.152) 
La fonction f, étant injective dans un voisinage autour de x (proposition 12.415), 
Di fm/n (2 + €) = Fmyn(®), (12.153) 


ce qui est la continuité de f»/n en x. 
(3) Pour a e R* 
Nous prouvons séparément le cas x < 1 et le cas x > 1. 


(3a) Si xe]1,0l 
Commençons par x € |1,%|. 
Soit une suite a; — a strictement décroissante dans QT. Le lemme 12.416 nous dit que 
l’ensemble de fonctions {fa,: ]1,00[ — Rj};ex est équicontinu. La convergence simple 
fa; — fa étant par définition, la proposition 7.305 nous dit que la fonction f,: ]1,00[ — 
R est continue. 
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(4) 


(3b) Sixe ]0,1] 
Soient maintenant x € [0,1], et e > 0. Il existe k& € NN tel que kx > 1, et k® > 1. Soit 
01 > 0 tel que B(x, 01) > 0. Si ye B(x, di), alors 


y — a] < kg — 2] = [(ky)T — (kæ)° (12.1154) 
Par ailleurs, vu que kx > 1, la fonction f, est continue en kx. Il existe donc 02 tel que 
ze B(kx, 02) = |2% — (kx)°| < €. (12.1155) 
Nous considérons 0 < min(01,02/k). Si ye B(x,0), alors d’une part 
key — kxl = kly — x| < kô < 62. (12.1156) 
Pour un tel y nous avons donc ky € B(kx, 62) et donc 
[y — 291 < [(ky)* — (kr) < €. (12.1157) 
Donc la continuité de f, en x. 


Pour ae R_ 
Si a > 0, la fonction f_, est donnée par 


f-a(x) = Lo (12.1158) 
et est donc continue (sauf en x = 0 où elle n’existe pas). 
PROPooDWZKooNwXsdV 
Proposition 12.418 (|[1]). 
Soient a > 0 ainsi que x,y € R. Alors 
(a) = (ar = nr, (12.1159) 
Démonstration. Nous découpons en fonction de la nature de x et y. 
(1) x rationnel, y naturel SigeQet ne N alors la formule 
(at) = a" (12.1160) 


découle seulement d’une récurrence sur la formule 12.1117. 


x,yEQ Soient y = m/n avec neZ,meNet q € Q. Nous avons, en utilisant la partie 
déjà démontrée et le lemme 12.397, 


(a?)# _ (nur _ (ay) 4? _ (aa) ir _ a q/ = "1. (12.1161) 


x,y irrationnels 


Soient des suites des rationnels x; — x et y; — y. En utilisant les définitions, 
; : NT E XITU, 
(a®)Ÿ = lim(a®)% = lim (lim a)". RooLETOR RES 
i i j 
Fixons un À pour commencer. Nous avons, par la continuité de f,, (proposition 12.417) 
(lim a%)" = f,, (lim a%) = lim (f,,(a%)) = lim at, (12.1163) 
j j j j 


Nous avons utilisé le résultat déjà démontré dans le cas des rationnels. La suite j — x; 
est une suite dans À qui converge vers le réel xy;, donc la limite sur j redonne la fonction 


puissance : 
(lim a%5)% 2 Jim a = av, FRooNCRE OR TT 62) 
j j 


Le résultat découle maintenant de la prise de limite dans (12.1162) qui revient à prendre la 
limite à — oc de l'expression dans (12.1164) : 


(a®)Ÿ = lim (lim a%5) = lim a°% = a, (12.1165) 
U J ? 
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PROPooJRWCooGiXAYt 
Proposition 12.419. 
Soit à > 0 dans R. Nous avons 
lim x° = oo. (12.1166) 


Æ—> 00 
Démonstration. Nous séparons la preuve en fonction de la nature de a. 
(1) SiaeN C'est le lemme 12.32. 
(2) Sia=1/n Soit n £ 0 dans N, et prouvons que limy_,% æ1/" = 00. La proposition 12.408 
nous indique que x + xl" = fr 


nm 
{ éventuellement infinie par la proposition 12.39. Posons 


l(u) est croissante et continue. Elle possède donc une limite 
: _] . 
Jim Free (12.1167) 


Nous voulons appliquer f, des deux côtés et profiter de la continuité de f, pour permuter 
avec la limite. Si vous avez peur du cas £ = +00, supposez £ Æ +00 et considérez ce qui suit 
comme une preuve par l’absurde que £ = +00. Nous avons : 


fa lin fn (œ)) = lim (fs (x) = lim x = 0. (12.1168) 


donc fn(£) = , et nous concluons que { = ©. 


(3) SiaeQ Nous posons à = p/q avec p,q € N. Alors 
2% = (x1/4)P (12.1169) 
par la proposition 12.418. Autrement dit, 
Jim Tr Jim (fo © f17g)(X) = © (12.1170) 


parce que tant f, que f1,, ont une limite +00. 


(4) Le cas général Nous considérons enfin & > 0 dans R. Le lemme 1.424 nous permet de 
considérer q € À tel que 0 < q < a. La proposition 12.408(2) nous dit que, pour chaque x, 
x1 < x°. Donc 


bons nr (12.1171) 
T—>00 T—>00 


en utilisant le point précédent. 


PROPooEXGKooCqzLor 
Proposition 12.420. 
Soit à > 0. La fonction 
fa: [0,00[ — [0,00 


ps (12.1172) 
Tr T 


est bijective. 


Démonstration. La proposition 12.413 nous dit que f,: [0,0[ — R est strictement croissante. Vu 
que fa(0) = 0, nous savons que f,([0,00[) & [0,æ[. La stricte croissance nous dit également que 
fa est injective. 
Il reste à voir que f, est surjective. Rappelons quelque faits. 
— D'abord une facile : f4(0) = 0. 
— Nous avons lims-_,0 4% = 0 par la proposition 12.419. 


— La fonction f, est continue par la proposition 12.417. 
144 


Le théorème des valeurs intermédiaires ”” conclut que f, est surjective sur [0, |. 


144. Voir 10.90. 
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Le lemme suivant montre en gros que xŸ croît plus rapidement en y qu’en x. 
LemLJOSooEiNtTs 


Lemme 12.421. 
Pour tout a > 0 et a < 1 nous avons la limite 


ln nat = 0 (12.1173) 


n— 00 


Démonstration. Soit k e N plus grand que a. Soit la suite numérique s, = n"a”. Tous ses termes 


sont positifs et 

k 

1 

= ( és ) | (12.1174) 
Sn+1 n +1 a 


Étant donné que n/n + 1 — 1 et que a < 1, il existe un certain rang à partir duquel la suite (s,) 
est décroissante. Deux conclusions : 


— Elle est majorée par une constante M. 
— Elle est convergente par le lemme 10.35. 


Soit { tel que ka! < 1 et n > l alors 
Sn = (n+1)fa"tt< knka"al = kals, < ka M. (121175) 


La majoration est due au fait que dans (n + {) nous avons k termes tous plus petits que n*. De 
la même façon, 
Sono < ka 82n < ka M. (12.1176) 


En posant w(i) = in + il nous avons 
Set) < KM, (12.1177) 


qui est une sous-suite convergente vers 0. Or si une suite est convergente (ce qui est le cas de (s,)), 
toutes les sous-suites convergent vers la même limite. Nous en concluons que 5, — 0. 


12.422. 

Une conséquence est que si vous voulez choisir un mot de passe fort, la longueur du mot est plus 
importante que la taille de l’alphabet choisit : il est plus efficace de choisir une combinaison longue 
qu’une combinaisons mélangeant des lettres, chiffres et symboles spéciaux. 

Exemple : si vous choisissez un mot de passe contenant majuscules, minuscules, chiffres et 
symboles spéciaux complètement mélangés (ne mentez pas, vous ne le faites pas), mais que vous 
ne le choisissez que de taille 6, vous avez 726 possibilités (en supposant un jeu de 10 symboles 
spéciaux). 

Eh bien, en seulement 8 lettres minuscules, vous avez plus de possibilités : 26° > 726. 

De nombreux sites font l'erreur de considérer que 


— « ggzxzheaïiynshunxuydajkwyohgqxz » est un mot de passe faible, 
— « azerty.2019A » est un mot de passe fort. 


Il n’en est rien. Le premier est considérablement meilleur que le second, même si le second, très 
superficiellement, mélange les lettres majuscules, minuscules, chiffres et symboles spéciaux. 

Voilà voilà. La prochaine fois qu’un site vous refusera un mot de passe de 30 lettres minuscules 
mélangées, vous saurez pourquoi il n’y a rien qui marche en informatique, et en particulier pourquoi 


la sécurité générale de nos systèmes d’information est désastreuse. 
THOooHWNWooTewPvt 


Théorème 12.423. 
Soit une matrice À € M(N,C). La suite (A"x) tend vers zéro pour tout x si et seulement si 
p(A) < 1 où p(A) est le rayon spectral de A 
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Démonstration. Dans le sens direct, il suffit de prendre comme x, un vecteur propre de A. Dans 
ce cas nous avons A"x = À"x. Mais fx ne tend vers zéro que si À < 1. Donc toutes les valeurs 
propres de À doivent être plus petites que 1 et p(A) < 1. 
Pour l’autre sens nous utilisons la décomposition de Dunford (théorème 9.259) : il existe une 
matrice inversible P telle que 
A=P {(D+N)P (12.1178) 


où D est diagonale, N est nilpotente et [D, N] = 0. Étant donné que D + N est triangulaire, son 
polynôme caractéristique est 
xDen(X) = [[(Di- X). (12.1179) 
t 

Par similitude, c’est le même polynôme caractéristique que celui de À et nous savons alors que la 
diagonale de D contient les valeurs propres de À. 

Vu que A* = P (D + N)"P, nous allons montrer que |(D + N})"| — 0, et ce sera suffisant. 
Notons r l’ordre de nilpotence de N (c’est à dire N' = 0), et prenons n > r. En utilisant le fait 
que D et N commutent, pour tout n > r nous avons : 


I(D + NY < | > és Jet (12.1180a) 
=0 
<ù() |DI"-*INË] (12.1180b) 
n ÿ°- k k 
2 = (un IN] (12.1180c) 
= SUBEQooDAUQoo 
<c D)" PIÈCE) 
> (e)ocn) A 
r—1 
= cp(D}" > () (12.1180e) 
< ep(D}" — cu SUBEQOJZVPRoEdR FT 
k=0 
r—1 
PO E SUBENo OKON EP 
k=0 
= crp(D}"n" 2, (12.1180h) 


Justifications. 
— Pour (12.1180d). Nous avons posé € = Maxg=1,...r—1 INÉo(D)*. 
— Pour (12.1180f). Lemme 3.44. 
— Pour (12.1180g). On oublie le k! et on remplace k par r — 1. 


Récapitulons ces inéquations : 


ID + NN) < c'o(Dy'n" À (12.1181) 


où c est une nouvelle constante. Du coup si p(D) < 1 alors |(D + N)*| — 0 par lemme 12.421. 


12.35 Densité des polynômes 


12.35.1 Théorème de Stone-Weierstrass 


Voir le thème 33. 
Note : le lemme 12.424 est utilisé dans la démonstration du théorème 12.428 ; c’est pour cela 
que nous l’avons isolé. 
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LemYdYLXb 
Lemme 12.424. 
Il existe une suite de polynômes sur [0,1] convergeant uniformément vers la fonction racine carrée. 


Démonstration. Nous donnons cette suite par récurrence : 


Po(t) = 0 (12.1182a) 
1 
Put) = P,(t) + SC — P,(t)?). (12.1182b) 
Nous commençons par montrer que pour tout t € [0,1], PA(t) € [0,Vt]. Pour Po, c'est évident. 


Ensuite nous avons 


Pau(t) — Vi = P,(t) — Vt+ SE P,(t}?) (12.1183a) 
: 1t- P(t) 
= - D (1-55 Hz) (12.1183b) 
= - D (1- s Lx “R en) (12.1183c) 
<0 (12.1183d) 


parce que Vt < 1 et P,(t) < 1 par hypothèse de récurrence. 

Nous savons au passage que P,(t) est une suite réelle croissante parce que t — P,(t)? > t — 
(V#)? = 0. La suite P,(t) est donc croissante et majorée par V4; elle converge donc. Les candidats 
limites sont déterminés par l'équation 


£=0+ -), (12.1184) 


dont les solutions sont { = +44. La suite étant positive, nous avons une convergence ponctuelle 
de P, vers la racine carrée. Cette suite étant une suite croissante de fonctions continues sur un 
compact, convergeant ponctuellement vers une fonction continue, la convergence est uniforme par 
le théorème de Dini 12.373. 


LemUuxcqŸ 
Lemme 12.425. 
Soit K, un compact de R et fn une suite de fonctions sur K° convergeant uniformément vers f. 
Soient un espace topologique X et une application g: X — K. Alors f\ © g converge uniformément 
vers f og. 


Démonstration. En effet, pour tout x € X nous avons 


|(fn © 9) — (Fo g)lo = sup ln (g(æ)) — F(g(x))| < | fn — floo: (12.1185) 


Par conséquent, si e > 0 est donné, il suffit de choisir n de telle sorte à avoir | f, — fl < € et nous 
avons |(fn ° 9) — (f ° g)lo < €. 


Définition 12.426. 
Nous disons qu’une algèbre À de fonctions sur un espace X sépare les points de X si pour tout 
t1 £ 2 Ù existe g € À telle que g(x1) À g(x2). 


Nous pouvons maintenant énoncer et démontrer une forme nettement plus générale du théorème 
de Stone-Weierstrass. Le théorème 12.428 le donne pour C(X,C) et le théorème 12.427 le donne 
pour C(X,R). 

THO00MDILooGPXDTW 
Théorème 12.427 (Stone-Weierstrass[403]). 
Soient X, un espace compact et Hausdorff. Soit À, une sous-algèbre de C(X,R) contenant une 


fonction constante non nulle. Alors À est dense dans (ct, R), l.l2) si et seulement si À sépare 
les points de X. 
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Démonstration. Nous allons écrire la démonstration en plusieurs étapes (dont la première est le 
lemme 12.424). Nous commençons par la première partie, sur les réels. 


Première étape Pour tout x £ y e X et pour tout à, 6 € KR, il existe une fonction f € À telle 
que f(x) = a et f(y) = 8. 
En effet, vu que À sépare les points nous pouvons considérer une fonction g € À telle que 
g(x) Æ g(y) et ensuite poser 


(g(2) — g(x)). (12.1186) 


Les constantes faisant partie de À, cette fonction f est encore dans À. 


Seconde étape Pour tout n-uples de fonctions f1,..., f, dans À, les fonctions min(f1,..., fn) et 
max(f1,...,/fn) sont dans À. 
Nous le démontrons pour n = 2; le reste allant évidemment par récurrence. Soient f,g € A. 
Étant donné que 


ST ra, fa 


max(f,g) 5 5 (12.1187a) 
min( f, g) = __ = (12.1187b) 


if suffit de montrer que si f € À alors |f| € À. Si f est nulle, c’est évident ; supposons que 
fÆ0et posons M = |f|x # 0. Pour tout x € X nous avons 


ie e [0,1]. (12.1188) 
Nous considérons alors la suite P 

ln = Pa 0 2 (12.1189) 
où Ph est une suite de polynômes convergent uniformément vers la racine carrée (voir 


lemme 12.424). Le lemme 12.425 nous assure que h, converge uniformément vers el dans 


C(X, R). Étant donné que À est également une algèbre, h, est dans À pour tout n et la limite 
s’y trouve également (pour rappel, la fermeture À est celle de la topologie de la convergence 
uniforme). 


Troisième étape Soit e > 0, fe C(X,R) et re X. Il existe une fonction g, € À telle que 


gz(x) = f(x) (12.1190a) 
Gx(y) < (y) +e (12.1190b) 


pour tout ye X. 

Soit ze X\{x} et une fonction h, telle que h,(x) = f(x) et h,(z) = f(z). Une telle fonction 
existe par une des étapes précédentes. Étant donné que f et h, sont continues, il existe un 
voisinage ouvert V, de z sur lequel 


h(y) < f(y) +e (12.1191) 
pour tout y € V.. Nous pouvons sélectionner un nombre fini de points z1,...,2, tels que les 
ouverts V,,,...,V., recouvrent X (parce que X est compact, de tout recouvrement par des 


ouverts, nous extrayons un sous recouvrement fini.). Nous posons 
gx = min(h,...,h2,.) € À. (12.1192) 


Siye X, nous sélectionnons le à tel que h,,(y) < f(y) + e et nous avons 


Gx(y) < hay) < (y) +e. (12.1193) 
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Étape finale Soit e > 0 et fe C(X,R). Pour chaque x € X nous considérons une fonction gy € À 
telle que 

{ gx) = f(x) (12.1194a) 

ga(y) < f(y) + € (12.1194b) 


pour tout y € X. Les fonctions f et g, sont continues, donc il existe un voisinage ouvert W, 
de x sur lequel 


ge(y) > F(y) — e. (12.1195) 
De ces W, nous extrayons un sous recouvrement fini de X : W,,,...,W,,, et nous posons 
D = MAX(Ym1,..., Jn) € À. (12.1196) 
Si ye X, il existe un à tel que 
E(Y) > Jai(y) > f(y) — €. (12.1197) 


La première inégalité est le fait que 4 est le maximum des g4,, et la seconde est le choix de 
i. Donc pour tout y € X nous avons 


fu) — € < pu) < F(y) + €. CR TIOS) 


La première inégalité est ce que l’on vient de faire. La seconde est le fait que pour tout à nous 
ayons gx, (y) < f(y) +e; le fait que w soit le maximum sur les à ne change pas l'inégalité. 


Le fait que les inégalités (12.1198) soient vraies pour tout y € X signifie que | — fl < €, 
et donc que f € Adh ( Adh(A)) = Adh(A). 


Tout cela prouve que C(X,R) € Adh(A). L’inclusion inverse est le fait que C(X, R) est fermé 
pour la norme |.|+, étant donné qu’une limite uniforme de fonctions continues est continue. 
Nous pouvons maintenant nous tourner vers l’énoncé concernant C(X,C). 


ThomAzSMF 
Théorème 12.428 (Stone-Weierstrass[1]). 
Soit X, un espace compact et Hausdorff. Soit une sous-algèbre * A stable par conjugaison "Ÿ de 
C(X,C) contenant une fonction constante non nulle. Alors À est dense dans (ctx, C), l.l2) si 
et seulement si À sépare les points de X. 
Entendons-nous bien : ici A et C(X,C) sont des algèbres à coefficients dans C. 


Démonstration. La preuve de cette version dans C(X,C) va bien entendu fortement reposer sur 
le cas dans C(X,R) que nous venons de prouver. Soit donc À, une sous-algèbre vérifiant les 
hypothèses. 


(1) Re(A) € À Nous prouvons que si f € À, alors Re(f) € À. En effet, vu que À est stable par 
conjugaison, si f € À, alors fe Aet f + f = 2Re(f)e À. 
Nous posons 
A1 = {Re(g) tel que g € A}. (12.1199) 


(1) A; est une sous-algèbre de A Le fait que les élément de A; soient dans À est déjà fait. 
Pour le produit, si g1,h1 € A1, alors il existe g,h € À tels que g1 = Re(g) et h1 = Re(h). 
Nous avons 


(g1 + ig2)(ha + êha) = giha — gaha + i(gih2 + gohu) € À. (12.1200) 


La partie réelle de cela est dans A1, donc 


giho — gah € Aï. FA OU DU) 


145. Algèbre, définition 1.340. 
146. Pour tout g € À, nous avons g € À. 
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Mais comme g1 + ig2 € À, nous avons aussi g1 — ig2 € À et donc 
(g1 — ig2)(h1 + ho) = g1h1 + goho + i(g1ho — g2hi) € À. (12.1202) 
La partie réelle de cela est dans A1. Donc 
gih1 + g2ho € A. (12.1203) 


En comparant avec (12.1201), nous avons gih1 € A1. 


(2) A; sépare les points de X Soient x,y € X ainsi que f € À séparant les points x et y, 
c’est-à-dire 


J(x) # f(y). (12.1204) 


Supposons f1(x) = f1(y). Vu que f sépare, si ce ne sont pas les parties réelles, ce sont les 
parties imaginaires. C'est-à-dire que f2(x) Æ# f2(y). Mais d’autre part, if = —f2 +if1 € À, 
donc en réalité f2 € A1 également. 


Le partie A; dans C(X,R) vérifie les hypothèses de Stone-Weierstrass réel 12.427, donc A; est 

dense dans C(X,R). Le même raisonnement montre que A2 est également dense dans C(X,R) ‘#7 
Soit maintenant le vif de la preuve : f € C(X, C) avec f = u+iv, les fonctions u et v étant dans 

C(X,R). Nous avons des suites uy ES à et Uk if pour des suites (ux) et (v;) dans C(X,R). 
Par le même genre de raisonnements que nous avons déjà fait, nous nous convainquons que 


ux + vx € À pour chaque k. Nous avons 


lux + dus — u — iv < lus — uloo + [vx — vo (12.1205) 


En prenant k assez grand, les deux termes peuvent être rendus plus petit que €. 
CORooNIUJooLDrPSv 

Corolaire 12.429 ([1]). 

Soit B, la boule fermée de centre 0 et de rayon 1 dans R”. La partie C©(B,R") est dense dans 

(C(B,B),|.l). 


Démonstration. Soit f € C(B,B) et e > 0. La fonction donnant la composante à est une fonction 
fi € C(B,R) et il existe donc, par le théorème de Stone-Weierstrass 12.428, une fonction g; € 
C®(B,R) telle que ]gi — fils < €. 

La fonction g dont les composantes sont les g; ainsi construits vérifie |g — fl < ne. 


Attention toutefois que rien n’assure que les fonctions construites par le corolaire 12.429 
prennent leurs valeurs dans B. 

Le théorème suivant est un des énoncés les plus classiques de Stone-Weierstrass. Il découle 
évidemment du théorème général 12.428 (encore qu'il faut alors bien comprendre qu’il faut traiter 
la fonction x + 4/x séparément). Il en existe cependant une preuve indépendante via les polynômes 


de Bernstein, dans le théorème 36.168. Par contre, n'allez pas croire que c’est plus simple. 
ThoGddfas 


Théorème 12.430 (Stone-Weierstrass). 
Soit f, une fonction continue sur un compact K € R à valeurs dans KR. Alors pour tout € > O, ül 
existe un polynôme P tel que | P — fx < €. 

Autrement dit, les polynômes sont denses dans (C°(K,R), |.|+). 


Démonstration. Nous allons prouver que les polynômes sur R, restreins à X satisfont les hypothèses 
du théorème de Stone-Weierstrass 12.427. 


(1) Partie de C°(K,R) Les polynômes sont des fonctions continues par la proposition 12.417. 


(2) Sous-algèbre Les produits et sommes de polynômes restent des polynômes. 


147. Il me semble même que À; = A: et qu'il y a un raccourci possible dans cette preuve en exploitant ce fait. Ecrivez-moi 
pour dire ce que vous en pensez. 
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(3) Contient une fonction constante non nulle Les fonctions constantes sont des poly- 
nômes. 


(4) Sépare les points de À Le polynôme P(x) = x sépare tous les points que vous voulez. 


THOooJGAJooBcTtDH 
Théorème 12.431 (Stone-Weierstrass). 
Soit f € C°(K,R") où K est un compact K € R" à valeurs dans R. Alors pour tout e > O, il 
existe un polynôme P: R° — R’ tel que | P — fx < €. 
Autrement dit, les polynômes sont denses dans (C°(K,R"), |.|x). 


12.36 Primitive de fonction continue 
PropQACVooBnHtRJ 


Proposition 12.432 ([104]). 


Soit un intervalle compact K de R et une suite (fn) de fonctions continues sur K° telles que 
la ci J. Si chacune des fonctions f, a une primitive sur K° alors f également. 


Démonstration. Soit r0 € K et les primitives F, choisies pour avoir F! = f, et F(xo) = 0. 
Nous allons voir que (F,) est une suite de Cauchy dans (K, |.|«). Soient n,m € N et x € K. Nous 
avons 


En — Emlo = “un Ent) — En(x)| (12.1206a) 
XE 


= sup |(F — En)(x)| (12.1206b) 
zeK 


BE DAB 
< sûp (LE — Fulteegle - 201) 7" (218066) 
< sup (|fn — fm diam (K)) RÉAOE AS Robe 
zeK 
dant = fl (12.1206e) 


Justifications. 
— Pour (12.1206c). Théorème des accroissements finis 11.254. 
— Pour (12.1206d). Parce que x € K et que K est borné, |x — xo] est majoré par diam(K). 


Vu que (f.) est de Cauchy, si n et m sont assez grands, cela tend vers zéro. La suite (F,) converge 
donc vers une certaine fonction F. 

Le théorème 12.384 nous permet de permuter la limite et la dérivée pour conclure que F” = f 
et donc que f a une primitive sur K. 


PropKKGAooDQYGKg 
Proposition 12.433 ([104]). 
Soit un intervalle ouvert TI de R et une fonction f: 1 — IR qui admet une primitive sur tout 
compact de I. Alors f a une primitive sur I. 


Démonstration. Nous considérons une suite exhaustive * de compacts K, pour I et xo € Ko. 
Nous considérons aussi F, la primitive de f sur K, telle que F,(x0) = 0 (possible parce que 
xo € Ky pour tout n). Les fonctions F, sont des restrictions les unes des autres, et nous pouvons 
définir 

F:T—-R 


12.1207 
ze F(x) si re Kyn. ) 


Nous avons évidemment F(x0) = 0 et nous allons prouver que F est une primitive de f sur I. 
Soit x e Î vu que I est ouvert, nous pouvons choisir no tel que x € Int(K,,,). Les fonctions F et 


148. Les fonctions F}, étant dérivables sont continues. 
149. Voir le lemme 7.291. 
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Fn Sont égales sur X, et donc sur un ouvert autour de x. Par conséquent Fest dérivable en x et 


F(x) = F,,(x) = f(a). 


Théorème 12.434. 
Soit 1 un intervalle ouvert de R. Une fonction continue sur T admet une primitive 


ThoEXXyooCLwgQg 


150 sur I. 


Démonstration. Sur chaque compact de I, la fonction f est limite uniforme de polynômes !°! 


(théorème de Stone-Weierstrass 12.430). Donc f est primitivable sur tout compact de 7 (proposi- 
tion 12.432) et donc sur 1 par la proposition 12.433. 


12.36.1 Dérivation de la fonction puissance (première) 


Nous n’allons pas complètement résoudre la question de la dérivation de la fonction x + a”; 
il faudrait des logarithmes, et nous ne les avons pas encore définis. Le logarithme sera introduit 


comme fonction inverse de l’exponentielle en 15.81. 
PROPooMXCDooBffXbl 


Proposition 12.435 ([102]). 
Soit la fonction puissance 
Ga: R—R 


Tr qd”. 


(12.1208) 


(1) La fonction g est dérivable. 


(2) La dérivée vérifie l'équation 


(x) = ga(0)ga(t). FaooNUIeR qe 


Démonstration. La fonction g, est continue par 12.408(1). La proposition 12.434 nous dit donc 
que la fonction g, admet une primitive sur KR. Nous notons F une telle primitive. 
Soit xe R. En posant F,(t) = F(x +t), nous avons une primitive de {+ a”a*. En effet 


FD = F'(x+ Sfr ". t|, sat aa. (12.1210) 


Par ailleurs la fonction t + a F(t) est également une primitive de t + a‘at. Donc il existe un 
nombre C(x) tel que 
Fit) = F(x +1) = af F(t) + C(x). (12.1211) 


ed . SUBALIGNooVARJooIcPEHN 
Le nombre F(1) — F(0) est un nombre sans histoires. Nous avons : | 


ÿa(x)(F(1) — F(0 ) = os ÿa(x)F(0) (12.1212a) 
F,(1) — C(x) — F,(0) + C(x) (12.1212b) 

F,(1) — F,(0) (12.1212c) 

= _ pi +x) — F(x). (12.1212d) 


La fonction F' étant dérivable, nous en déduisons que g est dérivable. 
Vu que nous n'avons aucune idée de la forme de F, nous ne pouvons pas tirer beaucoup 
d'informations d’une dérivation des membres de gauche et de droite de (12.1212). 


En ce qui concerne la formule, nous écrivons la fameuse équation fonctionnelle 1°? 
Ga(x + Y) = Ja(£)Ja(y) (12.1213) 
Nous fixons x et dérivons par rapport à y en y = Yo : 
Ga (T + Yo) = Ja(t)ga (yo) (12.1214) 


En posant yo = 0 nous trouvons le résultat demandé. 


150. Définition 12.201. 

151. Si tu veux te passer de Stone-Weierstrass, tu peux prouver que toute fonction continue sur un compact est 
limite uniforme de fonctions affines par morceaux, par exemple. Voir [404]. 

152. Pour rappel, proposition 12.408(3). 
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12.436. 

La démonstration donnée dans [402] s'assure d’abord de l’existence d’une intégrale (lemme 14.249), 
: 1 à ; 

pose ensuite À = (, g(t)dt et fait le calcul suivant : 


1 1 2x+1 
Aga(z) = | nl) astètée = [ ga(z + t)dt = | ga(t)dt. (12.1215) 


A 


Vu que le membre de droite est une fonction dérivable de x, nous concluons que 4 est dérivable. 
Cela demande donc toute la théorie de l'intégration pour prouver la dérivabilité d’une fonction. 
La démonstration donnée ici est à peine mieux. Elle utilise l'existence d’une primitive et donc 
tout le théorème de Stone-Weierstrass 12.430. 
Dans les deux cas, je trouve que la situation n’est pas fameuse. Si vous êtes capable de montrer 
l'existence de la limite 


(12.1216) 


sans recourir à autre chose que des astuces sur les limites, je suis preneur. Ou, au contraire, si vous 
avez un argument pour dire que c’est impossible, dites-le moi également. Ecrivez-moi. 


Nous posons une définition 


DEFooPJKMooUfZzgy 
Définition 12.437. 
Soit a > 0. Nous nommons l'équation fonctionnelle Péuaton] si SOS NeC 
{ f(&+y) = f(x)f() (12.1217a) 
f()—a (12.1217b) 


pour la fonction inconnue f : R — R. 


Note : une équation du même type, avec f(x + y) = f(x) + f(y) sera dans le lemme 17.142. 


DEFooXMQTooSbZzqJ 
Définition 12.438. 
- z | ‘ ; .  EQooGDBYooUoAFPW 
Soit a > 0. Nous nommons l'équation exponentielle l'équation | 
{ = (12.1218a) 
y(1)=a (12.1218b) 
pour la fonction inconnue y: R — R. 
LEMooWUQBooXzjmZv 
Lemme 12.439 ([1]). 
Si elle existe, la solution au problème 
 =y (12.1219a) 
y(0) = 1 (12.1219b) 


vérifie y(x) = 1/y(—-x). 
En particulier une telle solution ne s’annule pas sur KR. 


Démonstration. Supposons que y soit une solution, et posons h(x) = y(x)y(—x). Une dérivation 
montre que h'(x) = 0. Vu que h(0) = 1, nous avons (x) = 1 pour tout x. Par conséquent 
y(æ)y(—-x) = 1 pour tout x. 


PropDJQSooYIwwhy 
Proposition 12.440 (Unicité de l’exponentielle). 
Si elle existe, la solution au problème 
y =Yy (12.1220a) 
y(0) = (12.1220b) 


est unique. 
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Démonstration. Soient y et g deux solutions et considérions la fonction h(x) = g(x)y(—x). Un 
calcul immédiat donne 
h'(æ) = 0 (12.1221) 


et donc h est constante. Vu que (0) = 1 nous avons g(x)y(—x) = 1 pour tout x, c’est-à-dire 


g(x) = = y(x). (12.1222) 


La seconde égalité est le lemme 12.439. 


12.441. 
Nous savons qu'il existe une unique solution de l’équation exponentielle avec a = 1. Avec la relation 


Ja(T) = ga(t)ga(0); (12.1223) 


de la proposition 12.435, nous n’en sommes pas loin. Il faut encore savoir si il existe un a > 0 tel 
que g,(0) = 1. Notre culture générale nous dit qu’un tel réel existe et est la fameuse constante e. 
Nous nous attelons maintenant à la tâche de montrer l’existence de la chose. 


12.36.2 Équation fonctionnelle 


Il n’est un secret pour personne (proposition 12.408(3)) que la fonction 


Ga: R—R 


tr a 


(12.1224) 


vérifie l'équation fonctionnelle (12.1217). Nous pouvons nous demander à quel point cette propriété 
caractérise la fonction puissance. 


PROPooJDPEo0oYTDVEU 
Proposition 12.442 ([102]). 
Encore plusieurs résultats sur la fonction g, avec a > 0. ITEMooZJUEooVoqKul 
(1) La fonction ga vérifie l’équation fonctionnelle. ITEMooCSQXooUDyiMa 
Dos 9 ps nl 
(2) La dérivée vérifie g,, (0) Æ 0. ITEMooCKIHooNuDwrk 
(3) Pour tout a, en posant a = 1/g/,, (0) nous avons 
JU) = 1 (12.1225) 
ITEMooQQFRooWtlViJ 
(4) Il existe un unique e > 0 tel que 
d, = ge. (12.1226) 
ITEMooERTLooWL;j1lnz 


(5) Pour la valeur de e donnée en (4), la fonction ge vérifie l’équation exponentielle (12.1218) 


de = Je (12.1227a) 
g(1)=e. (12.1227b) 


Démonstration. Un point à la fois. 
(1) Pour (1) Le fait que g vérifie l'équation fonctionnelle est la proposition 12.408(3). 
(2) Pour (2) 
La formule (12.1209) de la proposition 12.435 nous assure que 


9 (x) = ga(z)g, (0). FOSC 


Donc g/,(0) = 0 impliquerait que g, est constante, ce qui n’est pas le cas. 
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(3) Pour (3) Par ailleurs la proposition 12.418 nous permet d'écrire 
Ga(aT) = Ja (x). (12.1229) 


En dérivant des deux côtés, EQooIHCDoo€, 
ag (aur) = ga). RO CPE TU) 


En posant donc a = g(0) et en évaluant (12.1230) en x = 0 nous trouvons le résultat. 


(4) Pour (4), existence 


Pour les valeurs de à données par le point (3), nous avons ga (0) = 1, et l’équation (12.1228) 
nous donne alors 


dha(x) = Jaa(t)- (12.1231) 
Comme de plus gaa(0) = 1, cette fonction vérifie bien l'équation exponentielle. 
(5) Pour (4), unicité 
Si a et b font en sorte que g}, = ga et g, = g, alors nous avons aussi g/,(0) = g,(0) = 1 à cause 


de (12.1228). Donc g et g vérifient l'équation de la proposition 12.440 dont la solution est 
unique. Donc ga = gp. 


Pour tout x nous avons 4(x) = g(x). En particulier pour x = 1 nous avons a = b. 


PROPooGBUPooWtWaFI 
Proposition 12.443 ([102]). 
Soit a > 0. Nous considérons l’équation fonctionnelle 12.437 et l’équation exponentielle 12.138 
pour une fonction f : R — R. 


ITEMooYHAVooWzJqB;j 
(1) Si f vérifie l’équation fonctionnelle, alors 
f(a) = a° (12.1232) 
pour tout q € Q. ITEMooQHOMooNVzSxn 
(2) Si f vérifie l’équation fonctionnelle et est monotone, alors f = ga. ITEMooCNXU00ZcrxeB 


(3) Si f vérifie l’équation fonctionnelle et est continue, alors f = ga. 


Démonstration. En beaucoup de parties. Nous commençons par prouver (1). Nous supposons que 
f:R—R est une fonction vérifiant l'équation fonctionnelle °°. 


(1) f(x) > 0 Quel que soit x € R nous avons 


=D: (12.1233) 


Vous noterez que cet argument ne fonctionne pas si f est à valeurs dans © au lieu de R. 


(2) Pour neN Soit ne N. Je vous laisse rédiger la récurrence correctement, mais l’idée est 
que f(1) = a et ensuite que 


fn +1) = f(n)f(D = FO)"S(D = FD (12.1234) 


(3) Pour me7Z Nous avons d’une part que f(—m + m) = f(0) = 1, mais d’autre part que 
f(-m + m) = f(-m)f(m). Donc 1 = f(—-m)f(m); et nous concluons que 


(12.1235) 


153. Bien que ce ne soit pas strictement nécessaire ici, nous rappelons qu’une telle fonction existe par la proposition 
12.442. 
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(4) Pour g=1/n Nous savons que f(1) = a, mais 1= À +...1 (avec n termes), donc 


a= fe +..) = 0 


n n 


ja, (12.1236) 


Cela implique que f (2) = à. La proposition 12.390 indique qu’il existe un unique x > 0 
tel que x° = a. Vu que nous savons déjà que f est partout positive 1°, cette contrainte fixe 
f(/n) et la définition 12.391 nous permet d'écrire 


1e = a" (12.1237) 


(5) Pour ge Q Nous posons q = m/n. Le nombre q peut être écrit sous la forme © = L+. + 


avec m termes. Donc 


1 
n 


PLU +... 2 fly 2 (any 2 qi (12.1238) 


n nm nm n 


où nous avons utilisé le lemme 12.397. 
La preuve de (1) est terminée. 


(1) Démonstration de (2) Nous faisons maintenant la preuve de (2). Nous supposons que f 
vérifie l'équation fonctionnelle et qu’elle est monotone. Pour fixer les idées, nous supposons 


qu’elle est monotone croissante 1°°. 

Nous considérons les parties !°6 
A = {qe Q tel que q < x} (12.1239a) 
B = {qe Q tel que q > x}. (12.1239b) 


Vu que f est croissante, nous avons f(x) > f(q) pour tout ge A et f(x) < f(q) pour tout 
q € B. En passant au supremum et à l’infimum, 


sup f(q) < f(x) < inf (a). (12.1240) 
qe À qgeB 
Mais il existe dans À une suite strictement croissante convergente q; vers x (parce que 
x = sup(A)), donc 
a = lim a (12.1241) 
t 


par la définition 12.407. Et de même, il existe une suite r; décroissante dans B telle que 
x = limr;. Cette suite donne aussi 
= lime", (12.1242) 
t 


Nous avons donc l’encadrement 
a < f(x) < a”, (12.1243) 


A 


qui implique que f(x) = a”. 
(2) Démonstration de (3) 
Nous ne supposons plus que f est monotone. Au lieu de cela nous supposons qu’elle est 
continue. Nous avons déjà vu en (1) que f = ga sur Q. Mais par hypothèse f est continue et 
par la proposition 12.408, g, est continue. La proposition 12.65 conclut que f = g, sur R. 


PROPooLTLWooBGcXAZ 
Proposition 12.444 ([102]). 
Si y vérifie l’équation exponentielle, alors elle est continue, monotone et vérifie l'équation fonc- 
tionnelle. 


154. C’est ici que l'hypothèse de fonction à valeurs dans R est cruciale. Pour f: IR — € ceci ne fonctionne pas, et 
de loin. 

155. Si f est monotone décroissante, soit vous adaptez la preuve, soit vous essayez de voir si on ne peut pas recycler 
le cas croissant en l’appliquant à —f. 

156. Il du meilleur gout de citer le lemme 1.424 pour dire qu’ils sont non vides. 
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12.36.3 Dérivation de la fonction puissance (seconde) 


La proposition suivante donne la dérivée de x + +7 pour tout g € À. La formule donnée est 
encore valable pour x + x°* pour tout «& € R, mais elle demandera plus de théorie pour être 


démontrée, voir la proposition 14.271. 
PROPooSGLGooïgzque 


Proposition 12.445 (|[1]). 
Pour tout a € Q, si fa(x) = 2° alors 


fat) = ar. (12.1244) 
En particulier, f, est de classe C® sur R\{0}. 


Démonstration. Petit à petit. 


(1) Naturel Nous prouvons que (4°) = nx"°! par récurrence en utilisant la règle de Leïbnitz 
de la propositon 12.174(3). 
D'abord pour n = 1 nous avons f1(x) = x et donc 


= 1. (12.1245) 


Supposons que f(x) = kx*—1 pour un certain k € N. Nous prouvons que fia1(x) = (k+1)rf. 
Nous avons 
af tt 2 xx, (12.1246) 


En utilisant la règle de Leibnitz et l'hypothèse de récurrence, 
(a+) = (x)'af + z(x*) = af + (ka 1) = 2f + kaf = (k + 1)”, (12.1247) 
ce qu'il fallait démontrer. 


(2) Rationnel positif Soit donc a = p/q avec p,q € N. Le lemme 12.397 nous permet d'écrire 
P/a() = a/9 = (xP)1/4, Cela donne 


fopate)t = x. (12.1248) 


Nous dérivons cette relation par rapport à x en utilisant à la fois la règle pour les entiers et 
la règle des fonctions composées !°7 : 


Ana) fofate) = par. (12.1249) 


En isolant 1 / (©) dans cette expression et en utilisant le fait que = = x4—b 


le résultat. 


, NOUS trouvons 


(3) Rationnels négatifs 


Soit a = —p/q avec p, q € N. Nous avons x ?/1 = OL En utilisant la proposition 12.174(5) 
p/q 


et le point déjà prouvé sur les rationnels positifs, 


fl, = nn. (—p/g) Pt 


a p/a—1 
p/q F, ae (pia)eP se. (12.1250) 


Notez l’utilisation de la proposition 12.418 au dénominateur. 
(4) Irrationnel 
Ah ah! On vous a bien eu. Les irrationnels, c’est pour la proposition 14.271. 
En ce qui concerne le fait que la fonction f, est de classe C'? sur R\{0}, c'est simplement une 
récurrence. Attention : si le rationnel a est négatif, fA(0) n’est pas défini. Mais, lorsque « est 
positif non entier, à partir d’un certain ordre, les dérivées font intervenir x? avec 6 < 0. D'où la 
restriction à R\{0} du domaine sur lequel f, est de classe C?. 
Si a est positif entier, alors f, est de classe C'? sur tout R parce que toutes les dérivées sont 
nulles à partir d’un certain ordre. 


157. Proposition 12.174(4). 
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12.36.4 Vers les complexes 


Nous avons déjà vu la proposition 12.442 qui dit essentiellement que si une fonction continue 
f:R—R vérifie f(x +y) = f(x)f(y), alors f(x) = a*. Comme indiqué durant la preuve, cette 
proposition (et en particulier sa preuve) ne fonctionne pas pour les fonctions à valeurs complexes. 
L'endroit où cela coinçait est que la contrainte 


Fo A (12.1251) 


n'implique pas grand chose lorsque f est à valeurs complexes. 
Nous allons maintenant attaquer ce problème. 


LEMooDEGEooXheixp 
Lemme 12.446. 
Soit a € C. Si elle existe, la solution au problème 
= oy (12.1252a) 
y(0) =1 (12.1252b) 


pour y: R — S! est unique. 


Démonstration. Soient deux solutions y: et y2. Nous posons A(x) = y1(x)y2(—x). Une dérivation 
donne 


h'(x) = yi(x)ye(—x) — y1(x)yo(—2). (12.1253) 
En y substituant y{.(x) = ayi(x) et y,(—x) = aya(x) nous trouvons (x) = 0. Donc h est constante 
et nous avons A - 
00 O 
yi(æ)yo(—x) = 1 ASS 


pour tout x. Notons que cette identité est encore valable avec y; = y2. Nous avons en particulier 
les égalités y1(x)y1(—x) = 1 et y(x)y2(—x) = 1, et nous notons au passage que y1(x) et y(x) ne 
s’annulent pas. 

En substituant dans (12.1254) la valeur y2(—x) = me nous trouvons 


in) _; (12.1255) 


ce qui signifie y1(x) = y2(x). 


Dans la proposition suivante, S! désigne l’ensemble des nombres complexes de norme 1, dont 
un paramétrage sera donné dans la proposition 18.61(1) : 


S1 = {ei® tel que x € R} = {e* tel que x € [0,2r[}. (12.1256) 
PROPooVJLYoo0zfWCd 
Proposition 12.447 (|[1]). 
Soit une fonction continue f : R — S! vérifiant 


fe +0 = fofo). Fo CET) 


Alors 
(1) f est dérivable, 
(2) f satisfait au système 


f(x) = f(0) f(x) (12.1258a) 
(0) = 1, (12.1258b) 


(3) il existe me R tel que f(x) = ex. 


12.37. POLYNÔMES DE TAYLOR 1127 


Démonstration. Pour chaque m € KR, la fonction 
= er (12.1259) 


vérifie évidemment toutes les conditions. Le but de cette démonstration est de montrer que les 
conditions imposées à f la déterminent de façon univoque (à part ce m). 

La condition (12.1257) nous dit que f(0) = 1. Soit une primitive F de f. Il existe s > 0 tel que 
F(s) > F(0) parce que F” = f et f(0) = 1. 

Soit a € R. La fonction G, donnée par G,(x) = F(x + a) est une primitive de x + f(x) f(a). 
Donc G(x) = f(a)F(x). Cela dit nous avons 


f(æ)(F(s) — F(0)) = f(x)F(s) — f(x)F(0) = G1(x) — Go(x). (12.1260) 


Le membre de droite est évidemment dérivable, et F(s) — F(0) £ 0. Donc f est dérivable. 
Nous dérivons maintenant la relation f(x+y) = f(x)f(y) par rapport à y en y = 0. Cela donne 


f(x) = F'(0)f(x). (12.1261) 


Donc il existe a € © tel que f'(x) = a f(x). 
Jusqu'ici nous avons prouvé qu'il existe a € C tel que 


f(x) = af(x) (12.1262a) 
f(0) = 1. (12.1262b) 


Or le lemme 12.446 donne l’unicité de la solution à ce système, et il ne faut pas chercher loin : la 
solution est 
f(æ) = e°?. (12.1263) 


Pour avoir f(x) € S 1, nous devons de plus imposer que à soit imaginaire pur. Donc, en posant 
a = im, nous avons m € R tel que f(x) = e"?. 


12.37 Polynômes de Taylor 

DEFoAPbS205AyER TB 
Définition 12.448. 
Soit un ouvert Q € €. Une fonction f: à — C est C-analytique sur Q si pour tout 20 € Q, il 
existe une suite complexe (c,) et r > 0 tels que 


O0 
fQ@) = D cnfz — 20)" (12.1264) 
n=0 
pour tout z € B(z0,r). 


Définition 12.449. 
Soit une fonction f: IR — IR. Si il existe, nous définissons le n° polynôme de Taylor de f au 
point a € R par 


mn f(k) 
P=Y Ï U (x — a)". (12.1265) 
k=0 Ê 
Et la série de Taylor de f est la limite : 
10) 
T(x) = Y Ï U (x — a) (12.1266) 
k=0 è 


dans la mesure où la somme converge. 
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Tant que f est n fois dérivable, le polynôme P, existe et vérifie P,(a) = f(a). Nous ne pouvons 
rien en dire de plus pour l'instant. En particulier, si f est de classe C'? il ne faudrait pas croire 
que 

Jim RU) (12.1267) 


pour tout + dans un voisinage de a. Autrement dit, même si toutes les dérivées de f existent, la 
série entière T' n’est pas garantie de 

—— un rayon de convergence LÀ plus grand que zéro, 

— et même avec un grand rayon de convergence, que la limite soit les valeurs de f. 

NORMooADIZooUmevqk 
12.450. 
Il n’est pas très compliqué de construire une fonction f telles que f(0) = 0 et telle que f(*)(0) = 0 
pour tout k, sans pour autant que f soit nulle partout (voir les fonctions plateaux 15.14.1). Les 
polynômes de Taylor d’une telle fonction sont tous identiquement nuls. 
Ceci pour dire qu’en posant 


DO k(k 
ae TO (12.1268) 
n=0 

nous n'avons aucune garantie de T' = f, même pas sur le rayon de convergence de la série entière 

définissant P. Et nous n’avons pas de garanties d’avoir un rayon de convergence plus grand que 0. 
Notons toutefois que les polynômes étant denses pour la norme supremum parmi les fonctions 

continues °°, pour tout compact, il existe une suite de polynômes qui converge uniformément 

uniformément f. Mais ces polynômes ne sont pas spécialement ceux de Taylor. 


12.451. 
Ce que nous venons de dire en 12.450 n’est pas vrai pour les fonctions analytiques {60, Une fonction 
analytique f: Q — R s'écrit, autour de 0, sous la forme 


f(x) = > ant”. (12.1269) 


Demander f%)(0) = 0 pour tout k implique a, = 0 pour tout n, et donc f = 0 sur un voisinage 
de 0. 
La condition d’analycité est donc très rigide. 


Le théorème de Taylor que nous démontrons à présent n’est pas un résultat que va dans le sens 
de limy-,0 Ph(x) = f(x). C’est un résultat qui dit juste que lim,_,4 P,(x) = f(a), et que la limite 
va d'autant plus vite que n est grand. 


Le théorème de Taylor généralise le développement limité au premier ordre de la proposition 
12.172. 


12.452. 
Lorsque le contexte n’est pas ambigu, nous notons simplement P, le polynôme d'ordre n de f au 
point a. De même nous notons le reste 


He) = f(&)= Ft). (12.1270) 
PROPooUYCMooQjexpn 
Proposition 12.453 ([405]). 


Soit une fonction f qui est n fois dérivable sur l'intervalle ouvert I € R contenant a. Alors 


(= Pal) 


æa(x—a)t za (x—a)" 


= 0 (12.1271) 


où Ph est le n° polynôme de Taylor de f autour de x = a. 


158. Définition 15.12. 
159. Théorème 12.430. 
160. Définition 12.448 qu'il faut écrire pour R au lieu de C 
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Démonstration. Pour tout k = 0,...,n nous avons f(*){a) = ) (a) et donc 
RO (a) = 0 (12:1972) 
pour k = 0,...,n. En posant d'autre part s(x) = (x — a)" nous avons s() (a) = 0 pour tout 


k = 0,...,n — 1. Par conséquent la règle de l’Hospital de la proposition 12.197 s’applique au 
quotient R,(x)/s(x)". En l’utilisant n fois, 
Ralr) __ RW(x) 0 


Î = = = (. 12.12 
D st) eee H | NA 


Nous démontrons à présent que le polynôme de Taylor est le seul à avoir la propriété de la 
proposition 12.453. 


Proposition 12.454 ([405]). 
Soit f, une fonction n fois dérivable sur l'intervalle T € R contenant 0. Soit un polynôme Q de 


degré n (ou moins) tel que 
lim EG) _ 6, ERooKPTI een 


za (x—a)" 
Alors Q est le polynôme de Taylor de degré n pour f en a ci-après simplement noté P,. 


Démonstration. D'après la proposition 12.453, la fonction f — P, vérifie la même limite que f — Q. 
Donc P, — Q vérifie également la limite 


=. EnooYBHHo OZ tx 


Nous notons P,(x) = 3" agaf et Q(x) = S 70 ba. La relation (12.1275) donne en particulier 
k=0 k=0 


lim 
z—0 Te 


lim (Pa — Q)(æ) = 0 (12.1276) 
x— 
qui donne ao — bo = 0. Nous continuons par récurrence en supposant que a; = b; pour à = 0,...,k. 
Alors : 
_ (PQ _. ns 
0 = lim pa = Le 2 (A — bj)x (12.1277) 


Le seul terme non nul à droite est celui vérifiant { — (k + 1) = 0. Et ce terme donne l’équation 
ET (12.1278) 


c'est-à-dire ag+1 = bx11. La récurrence continue ainsi jusqu’à k = n, et nous pouvons conclure que 
Q = Ps. 


L'intérêt de cette proposition est que si l’on trouve, par n'importe quel moyen, un polynôme 
Q vérifiant la condition (12.1274), alors nous savons que c’est le polynôme de Taylor. 
ThoTaylor 


Théorème 12.455 (Théorème de Taylor[323, 406]). 

Soit IC R un intervalle non vide et non réduit à un point de R ainsi que a € 1. Soit une fonction 
TE (n) ; : : : Le x 

d I R telle que f (a) existe. Alors sé upe fgnction a définie sur I et à valeurs dans R 

vérifiant les deux conditions suivantes : 


7 (x) a sue 
fa) = . D le a)* + a(x)(x — a)", ÉPACTES 


k 
lim a(t) = 0 (12.1279b) 


pour tout x € I. Ici f() dénote la k-ième dérivée de f (en particulier, fO = f, fO) = fl). 
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Démonstration. Si R,(x) = f(x) — P,(x), il suffit de poser 


(12.1280) 


et d'utiliser la proposition 12.453. 


Remarque 12.456. 
Quelque remarques. 
(1) La formule (12.1279a) est une égalité, et non une approximation. Ce qui serait une approxi- 
mation serait de réécrire la formule dans le terme contenant a. 
(2) Nous avons l'égalité (12.1279a) uniquement sur 1. Pour les x hors de 7, le polynôme existe 
évidemment, mais nous n’avons pas spécialement de fonction «, et d’ailleurs la fonction f 
n’est pas spécialement définie. 


12.457. 
Les conditions 12.1279) sont souvent aussi énoncées sous la forme qu’il existe une fonction a telle 
UBEQooPYABooKpDgdu 
que | 
t 
CUT (12.1281a) 
t—0 17 
he h? 
fa +) = f(a) + hf'(a) + fa) +... + = I + a(h). (12.1281b) 


Le théorème suivant donne une expression pas tout à fait explicite, mais pas mal quand même 


pour le reste de Taylor. 
THOooS1IGRooJTLv1V 


Théorème 12.458. 


Soient un intervalle ouvert I & R ainsi que a € I. Soit encore une fonction de classe CF! 


sur I. 


(1) Pour tout x € I, il existe un ce Ja, x| tel que l'égalité 


f(x) = ÿ FA) (a) é a)* ” ftrH)(o) ce a+ EQooQFMF PAU 


4 k (n+1)! 


soit vérifiée. ITEMooVGBVooGXXvIz 


(2) SoitheR tel que B(a,h) € I. Il existe 0 € [0,1] tel que 


n f(h) (n+1) 
fla+h) = 3 i ue ne + Ÿ = nt, (12.1283) 
PP: 


Démonstration. Pour les besoins de la preuve, nous allons démontrer la formule (12.1282) pour un 
be I au lieu de x. C’est juste que nous allons écrire b au lieu de x parce que nous aurons besoin 
de la notation x dans le courant de la preuve. 

Nous posons 


R(x) = f(x) — P;(x) = f(x) 5 J —@ (x — a}*. (12.1284) 
Cela vérifie R(a) = f(a) — f(a) = 0 et même L 
RO (a) = 0 (12.1285) 
pour tout j = 1,...,n. Nous posons encore 
F(x) = R(x) A) (r— ati. (12.1286) 
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Nous avons FÜ)(a) = 0 pour tout j = 0,...,n ainsi que 
R(b) +1 
= Bree 0, 12.12 
F(b) = R(b) G= at (b — a) 0 ( 87) 
et aussi 
F(a) = R(a) — 0 = 0. (12.1288) 


Bref, la fonction F' vérifie les conditions de la généralisation 12.194 du lemme de Rolle. Il existe 
donc ce Ja, b[ tel que F(#1)(c) = 0. Mais vu que PET (x) = 0, nous avons R(M+1) (x) = fr) (>), 
de telle sorte que 

R(b)(n + 1)! 


(n+1) . 
f (al G—amti (12.1289) 
En injectant cela dans la définition de F 
Ne) 1 
TA) R PE 12.1290 
(D = RG) TT — 0) (12.1290) 
En évaluant en x = b, et en nous souvenant que F(b) = 0, nous trouvons 
, FU (o) 1 
0 = R(b b—a)"* 12.1291 
DT Ga) (12.1991) 
qui est ce que nous voulions prouver. 
Voici un énoncé pour les fonctions à plusieurs variables. 
THOo00TDFRooËEkChgi 


Théorème 12.459 ([107]). 
Si f: E — TR est une application n fois différentiable en a € E alors il existe une fonction €: R — R 
telle que 


f(a+h) = f(a) + dfa(h) + (Pal R)+...+ (12.1292a) 
(A Dal, À) + JAle(lAl) (12.1292b) 
lim e(t) = 0. (12.1292c) 


12.37.1 Fonctions « petit o » 


Nous voulons formaliser l’idée d’une fonction qui tend vers zéro « plus vite » qu'une autre. 
Nous disons que f € o(p(x)) si 
lim 1®) 2 0. (12.1293) 
z0 p(x) 
En particulier, nous disons que f € o(x) lorsque lim,_,0 f(x)/x = 0. 
En termes de notations, nous définissons l’ensemble o(x) l’ensemble des fonctions f telles que 
J(x) 


lim == = 0. (12.1294) 
z—0 Z 


Plus généralement si g est une fonction telle que lim,-_,0 g(x) = 0, nous disons f € o(g) si 


me (12.1295) 
æ—0 (x) 
De façon intuitive, l’ensemble o(g) est l’ensemble des fonctions qui tendent vers zéro « plus vite » 
que g. 
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Nous pouvons donner un énoncé alternatif au théorème 12.455 en définissant h(x) = e(x+a)x". 
Cette fonction est définie exprès pour avoir 


h(x — a) = e(x)(x — a)”, (12.1296) 
et donc ” 
lim G) = lim ex — a) = Jim e(x) = 0. (12.1297) 
L— T L— T— a 


Donc h € o(x”). 
Le théorème dit donc qu’il existe une fonction @ € o(x") telle que 


f(x) = TF, (x) + a(x — a). 12.1298 
fin 
pour tout x € I. 


Remarque 12.460. 
À titre personnel, l’auteur de ces lignes déconseille d'utiliser cette notation qui est un peu casse- 
figure pour qui ne la maîtrise pas bien. 


Exemple 12.461. 


Le développement en série du cosinus sera traité dans la proposition 18.75. A 
PROPooTOXTooMM1ghF 


Proposition 12.462 (Ordre deux sur R”{1]). 
Soit un ouvert Q de R” et a e ( ainsi qu'une fonction f: A — R de classe C?. Alors il existe une 
fonction a: R” — MR telle que 


f(a+h) = f(a) + dfa(h) + (hall h) + |A|fa(n) (12.1299a) 
lim a(h) — 0. (12.1299b) 


Ici, la notation ( f),(h,h) réfère à ce qui est expliqué en 12.357. 


Démonstration. Dans la suite nous considérons t et h tels que toutes les expressions suivantes aient 
un sens, c’est-à-dire que tous les trucs comme a + th restent dans (. Pour h € R"' nous nommons 
en le vecteur unitaire dans la direction de À, c’est-à-dire ey = h/|h| et nous posons 


kn(t) = f(a + ten). (12.1300) 
et nous lui appliquons Taylor 12.455 à l’ordre deux : il existe une fonction B} telle que 
: EQooETDFo0oAmi 
kn(æ) = kn(O) + 2k,(0) + SH (O) + rBn(a). RoETRE sn En) 


avec lim,s_,0 #n(x) = 0. 
En ce qui concerne les dérivées de k nous avons 


k,(0) = dfa(en) (12.1302) 

et 
Ki (0) = ( fa(en; en): (12.1303) 
Il est maintenant temps d'écrire f(a + h) = k(|h|) et de substituer les dérivées de k par les 


différentielles de f dans (12.1301) : 
fa + h) = K(|A|) = (a) + dfa(h) + (Pan, h) + IR8 (nl). "ERA SEN 


Il reste à voir que la fonction a: h — Ba(|h|) tend vers zéro pour h — 0. En prenant la limite 
h — 0 dans (12.1304), il est manifeste que la limite du membre de gauche existe et vaut f(a). 
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Donc la limite du membre de droite doit exister et valoir également f(a). Nous en déduisons que 
la limite de 1 
dfa(h) + 3 (d FJa(h, h) + |A? Ba (Al) (12.1305) 


existe et vaut zéro. La limite des deux premiers termes existe et vaut zéro, donc la limite du 
troisième existe et vaut zéro : 


Jim JAI28a (JA) = 0. (12.106) 


PROPooWWMYooPOmSds 
Proposition 12.463. 
Soit un ouvert Q de R" et une fonction f: ® — R de classe C? et deux fois différentiable sur 
Jz,x + hf. Alors il existe 0 € ]0,1[ tel que 


SU + h) = F(œ) + e(h) + (EP heron(h). (12.1307) 


12.37.2 Autres formulations 


Exemple 12.464. 
Une des façons les plus courantes d’utiliser les formules (12.1279) est de développer f(a +t) pour 
des petits { en posant x = a + t dans la formule : 


ExempleUtlDev 


fa + #) = f(a) + f'(a)t + oO + e(a + DE Fqpevfauronragns 


avec lims,0e(a +) = 0. Ici, la fonction T dont on parle dans le théorème est Tf,(a +t) = 


f(a) + F'(a)t + f'(a)£. 
Lorsque x et y sont deux nombres « proches 6! », nous pouvons développer f(y) autour de 
f(x) : | 


SGD = Fe) + Fu 2) + PR) EL + y — z)(y — 2? Eafydsé 


et donc écrire 


e(y — æ)(y — x). (12.1310) 
De cette manière nous obtenons une formule qui ne contient plus que y dans la différence y—x. A 


12.37.33 Formule et reste 


Proposition 12.465. 
Soient f:TECR—Retaelnt(]). Soit un entier k > 1. Si f est k fois dérivable en a, alors ü 
existe un et un seul polynôme P de degré < k tel que 


PropDevTaylorPol 


f(x) — P(x — a) € o(|x — af) (12.1311) 
lorsque x — a, x Æ a. Ce polynôme est donné par 


f"(a) A f%) (a) p£. 


P(R)= f(a)+f(ah+—, k! 


(12.1312) 


Notons encore deux façons alternatives d'écrire le résultat. Si f e C* il existe une fonction a telle 
que lims_,o a(t) = 0 et 


E  p(n){o 
Ir) . D ) (y a)" +(x—a)"a(x — a). (12.1313) 


161. par exemple dans une limite (x,y) — (h,h). 
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Si f e C*+T alors 


E, f)(a 0 
fa) = » Ï y a)" +(x-—a)"tl£(x — a) BTE | 


n 


[=] 


n 


où & est une fonction telle que E(t) tend vers une constante lorsque t — 0. 


La proposition suivante donne une intéressante façon de trouver le reste d’un développement 


de Taylor. 
PropResteTaylorc 


Proposition 12.466. 


Soient I, un intervalle dans R et f: I — R une fonction de classe C* sur I telle que f**D existe 
sur Î. Soient a € Int(1) et x e I. Alors il existe c € |x, a] tel que 
n (k) (n+1) 
f(x) = Y PO 4 O4, put, (12.1315) 


En (à (n +1)! 


12.37.4 Reste intégral 


Comme son nom l'indique, le « reste intégral » demande de savoir les intégrales. La formule du 
reste intégral sera donc pour après la définition des intégrales, proposition 20.147. 


12.38 Développement limité autour de zéro 


Dans cette sections nous supposons toujours que les fonctions sont définies sur un intervalle 
ouvert de R, 1, contenant 0. 


12.38.1 Généralités 


Définition 12.467. 
Soit f: 1 — IR une fonction définie sur un ouvert T autour de zéro. Nous disons que f admet un 
développement limité autour de O0 à l’ordre n si il existe une fonction a: 1 — R telle que 


f(x) = Pat) + x''a(x) (12.1316a) 
lim a(æ) = 0 (12.1316b) 


où Pa(x) = ao+air+-.-+anx" est une polynôme de degré n. Le polynôme P, est appelé la partie 
régulière du développement. 


La fonction a est appelé le reste du développement et sera parfois noté a. Lorsque P est la 
partie régulière d’un développement limité de f nous notons parfois f -— P. 


Proposition 12.468 (Troncature). 
Si f admet un développement limité d'ordre n alors il admet également un développement limité 
d'ordre n' pour tout n < n. Ce dernier s'obtient en tronquant le polynôme d'ordre n à l’ordre n’. 


Proposition 12.469 (Unicité). 
Si f admet une développement limité alors ce dernier est unique : il existe un unique polynôme Ph 
d'ordre n et une unique fonction a vérifiant simultanément les deux conditions 


fu) = Re) +5" af) (12.1317a) 
lim a(x) = 0. (12.1317b) 
ExTHGooCBcnAy 


Exemple 12.470. 
En ce qui concerne les séries géométriques de raison x nous savons les formules 


n+1 
mn. Le 


l+x+a+...+x (12.1318) 


l—x 
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et 


1 
l+x+a+a +... = 
l—x 


(12.1319) 


pour tout x € |—-0,1[. Comparant les deux, il est naturel d'essayer de prendre 1+7+2?+.::+3%" 
comme développement limité de la fonction f(x) = ri. Pour voir si cela fonctionne, il faut vérifier 


si « le reste » est bien de la forme x”"a(x) avec lim,-_,0 a(x) = 0. 
Le reste en question est donné par 


1 1 1— ati gti x 
1 EL = = x" . 12.1320 
l—x un d l—x LT 1x ‘ l-x 


En posant a(x) = ç*>; nous avons donc bien 


1 
CR nm 2 M 


(12.1321) 


et lims_,0 57, = 0. Cela est le développement limité de f à l’ordre n autour de 0. A 


La formule des accroissements finis est un cas particulier de développement fini. Supposons que 
f soit dérivable en 0. En effet nous pouvons facilement trouver la fonction « qui convient. Sachant 
que f(0) + xf'(0) donne l’approximation affine de f autour de 0, nous cherchons « en écrivant 


f(x) = f(0) + xf'(0) + xa(x). (12.1322) 


Cela nous pousse à définir 
f'(0). FACE ee qSE 


Notons que cette fonction n’est pas définie en æ = 0, mais cela n’a pas d'importance : seule la 
limite limz_,o a(x) nous intéresse. Par définition de la dérivée, 


lim a(x) = lim f(æ) — 70) 


æ—0 æ—0 HA 


f'(0) = 0. (12.1324) 


En conclusion si f est dérivable, son développement limité à l’ordre 1 est donné par 
f(x) = f(0) + xf'(0) + xa(x) (12.1325) 


où æ(x) est donnée par la formule (12.1323). 


12.38.22 Formule de Taylor-Young 


Plus généralement nous avons la proposition suivante qui donne le développement limité de 


toute fonction dérivable n fois. 
PropVDGooCexFwy 


Proposition 12.471 (Formule de Taylor-Young). 
Soit f une fonction n fois dérivable sur un intervalle T contenant 0. Alors il existe une fonction 
a: 1 — R telle que 


f(æ) = f(0) + f'(0)x + TU + 170) a ++ "0 17 z''a(x) 008 


et 
lim a(x) = 0. (12.1327) 


æ—0 


Cette proposition nous permet de calculer facilement des développements limités tant que nous 
sommes capables de calculer les dérivées successives de la fonction à développer. Dans l’exemple 


12.470 nous avons dû utiliser des astuces et des formules pour déterminer le développement limité 
de TH. Au contraire la formule (12.1326) nous permet de trouver le polynôme en appliquant 


mécaniquement une formule simple. 
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Exemple 12.472. 
Utilisation de la formule (12.1326) pour déterminer le développement limité de la fonction 


fa (12.1328) 
Il faut calculer les dérivées successives de f : 
fe (12.1329a) 
x) = . a 
1-x 
1 
Pa = 12.1329b 
(1x)? 
2 
f(x) = TS (12.1329c) 
Avec ces résultats, nous devinons que 
. n! 


a A 2 D oe 7 ! 2 
Pour en être sûr nous le prouvons par récurrence. La dérivée de TT est donnée par 


nn +112)" _ (+1) 
(1 = z}2n+2 = (1 _ x)r+2 (12.1331) 


Évaluées en x = 0, les dérivées successives de f sont f(0) = 0, f/(0) = 1, f"(0) = 2,...,f (M) (0) = n!. 
Utilisant la formule (12.1326) nous avons 


f(æ)=1+z+2 +... +2" +a"a(x), (12.1332) 
conformément à ce que nous avions déjà trouvé. PA 
EXooFLBJooYfuRsG 


Exemple 12.473. 
Soient r € À et la fonction donnée par 


f(x) = (+). (12.1333) 


Nous notons ? le domaine de cette fonction : c’est R si r > 0 ou [—1,00] si r < 0. Si par contre 
r = 0, la fonction est constante et le domaine est 1 = R. 

En ce qui concerne les dérivées 162 : f/(x) = r(1 +x)"-! et plus généralement 
FO (x) = r(r—1)...(r—k+1)(1 +) (12.1334) 


si k > 0. Pour k = 0 nous avons f (@) (0) — 1. Le développement de Taylor-Young est alors 


nm 
G+a) =1+Y At ct res) (12.1335) 
k=1 ‘ 
Notons que que si r est un entier, pour k = r, le produit au numérateur s’annule et le dévelop- 
pement s’arrête. 
Dans le développement de (1 + x)”, nous reconnaissons la formule de (E); sauf que nous ne 
pouvons pas l'écrire avec cette notation lorsque r n’est pas entier. PA 


Cet exemple fonctionnera encore avec r € R au lieu de r € À, mais il faudra la proposition 
15.93 pour la dérivée 


162. Nous utilisons la proposition 12.445. 
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Remarque 12.474. 
Pour alléger la notation et ne pas écrire ... + x"a(x) nous pouvons aussi écrire 


f(&)-1+m+2 +... +a, (12.1336) 


mais il est interdit d'écrire 
f(æ)=1+z+2 +... +a (12.1337) 


en mettant un signe d'égalité entre une fonction et son développement limité 16%, 


Notons cependant que la proposition 12.471 ne donne pas de moyen simple de trouver la fonction 
a. Si la fonction f est très régulière dans l'intervalle J on a le résultat suivant. 


Proposition 12.475 (Reste dans la forme de Lagrange). 
Si la fonction f est dérivable n + 1 fois dans T alors il existe x dans l'intervalle [0, x] tel que 


1 


an ee. (12.133) 


12.38.3 Règles de calcul 


Les règles suivantes permettent de calculer les développements limités des fonctions qu’on peut 
écrire comme combinaison de fonctions dont nous savons déjà le développement. 

Il est toujours possible de calculer le développement limité d’une fonction par la formule de 
Taylor-Young (proposition 12.471). Les règles suivantes peuvent nous économiser de l'effort et du 
temps. 


12.38.3.1 Linéarité des développements limités 


L'opération qui consiste à prendre le développement limité d’une fonction est une opération 
linéaire : connaissant les développements limités de f et de 9, il suffit de les sommer pour obtenir 
celui de f + g. De même, si À est une constante, le développement limité de À f est le développement 
limité de f fois À. 

PROPooAUVPooGRIZYF 
Proposition 12.476. 


NS R. Si f et g sont deux fonctions acceptant des développements limités d’ordre 
n 


f(x) = P(x) + z'a/(x) (12.1339a) 
gx) = Q(x) + x" B(x) (12.1339b) 


avec lim,_,0 a(x) = limz_,0 B(x) = 0, alors la fonction Àf + 1g admet le développement limité 
EqCJFooVpyC 
(\f + mug)(x) = (AP + uQ)(x) + x" (Xa + uB)(x). 00 RSA 


Remarque 12.477. 
La forme explicite du reste ne nous interesse pas. Dans la pratique on écrira toujours (f + g)(x) = 
(P + Q)(x) + x'a(x), où on appelle «& une fonction opportune telle que limz_,9 a(x) = 0. 


Démonstration. Vu les définitions (12.1339) des polynômes P, Q et des restes a et B, l'égalité 
(12.1340) est une conséquence de la linéarité de la dérivation et de la proposition 12.471 
De plus P + Q est un polynôme de degré n dès que P et Q sont des polynômes de degré n, et 


lim (Aa + uB)(x) = lim Aa(x) + lim AO) = 0: (12.1341) 


Par conséquent Àa + 15 est la fonction de reste de À f + ug. 


163. Il faut cependant être très prudents avec la notation abrégée. Elle pourrait nous faire oublier des informations 
importantes, voir les développements des fonctions trigonométriques pour un exemple. 
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ExKPBooJmdFvY 
Exemple 12.478. 
Calculer le développement de la fonction 


f(x)=3ÿ1+r+e ?. (12.1342) 


Le développement de Ÿ1 + x est donné par la formule de l’exemple 12.473 avec a = L. Nous avons 
donc dans un premier temps 


. 1 1(i-1 ete 
ÿ1l+z=1+ 32 + 3 G Er 5 G 1G sr (12.1343a) 
1 1 5 
no. Se + TEA + x a(x). (12.1343b) 


Nous avons alors 


1 1 6) 4 
3Ÿ1+r+e = [1 Lg — La + + ra(a)] + 1 — 2x + 27? — LA + x%6(x) 


3 9 8l 
(12.1344a) 
=4—-r+ aT ge + (a(x) + B(x)). (12.1344b) 
A 


La condition lims_,0 a(x) = 0 signifie que l’approximation qui consiste à remplacer f(x) par 
le polynôme n’est pas une trop mauvaise approximation lorsque x est petit. Cela ne signifie rien 
de plus. En particulier si x est grand, l’approximation polynomiale peut-être (et est souvent) très 
mauvaise. 

À ce propos, notez qu’un polynôme tend toujours vers +00 lorsque x est grand. Une approxima- 
tion polynomiale d’une fonction bornée est donc toujours (très) mauvaise pour les grandes valeurs 
de x. 

À titre d'exemple nous avons tracé sur la figure 12.12 la fonction 


f(x)=3ÿz+1+e 2? (12.1345) 


et ses développements limités d’ordre 1 à 3. Il est particulièrement visible que l’approximation 
est assez bonne pour la partie gauche du graphe sur laquelle la fonction est bien croissante, alors 
qu’elle est franchement mauvaise sur la droite où le graphe ressemble plutôt à une constante 164. 


12.38.3.2 Développement limité d’un quotient 
PROPooMANAooXhuansS 


Proposition 12.479. 

Si PF est le polynôme du développement limité de f à l’ordre n et P, celui de g, alors nous obtenons 
le développement limité de f/g à l’ordre n en effectuant la division selon les puissances croissantes 
de P; par P,. 


Attention : il s’agit bien de faire une division selon les puissances croissantes, et non une 
divisions euclidienne. La division euclidienne de À par B consiste à écrire À = BQ + R avec 
le reste À de degré le plus petit possible. Ici nous voulons avoir un reste de degré le plus grand 
possible. 


12.38.3.3 Développement limité d’une fonction composée 


Proposition 12.480. 

Soient f et g des fonctions admettant des développements limités d'ordre n au voisinage de 0. 
Nous supposons que lims-,0 g(x) = 0. Alors la composée F(g(x)) admet un développement limité 
d'ordre n au voisinage de O qui s'obtient en substituant le développement de g à chaque «x» du 
développement de f, et en supprimant tous les termes de degré plus élevé que n. 


164. Pouvez-vous cependant dire que vaut limz_, f(x) ? 
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(b) Polyôme d'ordre 2 
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(c) Polyôme d’ordre 3 (d) Polyôme d’ordre 4 


FIGURE 12.12: Les développements limités d’ordre de plus en plus grand de la fonction de 
l'exemple 12.478. La fonction est en bleu et les « approximations » sont en ro4ge1rigWUYooCISzeB 


12.39 Développement ailleurs qu’à l’origine 


Il est intéressant de développer une fonction au voisinage de zéro lorsque nous nous intéressons 
à son comportement pour les x pas très grands. Il est toutefois souvent souhaitable de savoir le 
comportement d’une fonction au voisinage d’autres valeurs que zéro. 

Pour développer la fonction f autour de x9, nous considérons la fonction h + f(xo + h) que 
nous développons autour de zéro (pour h). L'objectif est de trouver une polynôme P et une fonction 
a tels que 


f(æ) = P(x) + (x — zo)'a(x) (12.1346a) 
Jim a(x) = 0. (12.1346b) 


En pratique, le développement limité à l’ordre n d’une fonction autour d’un point x0 quelconque à 
l’intérieur de son domaine prend la forme suivante, qui généralise la formule de Taylor-Young vue 
dans la proposition 12.471 


Proposition 12.481 (Formule de Taylor-Young, cas général). 
Soit f une fonction n fois dérivable sur un intervalle T1 contenant xo. Alors il existe une fonction 
a: 1 — R telle que 


f() = f(xo)+f(ro)(x — xo) + ee) (x 20)°+ Er JRag haz] 
(3) (x () (x | 
+ F7 Go) - o) ne to)” Pre Ce — %0)" + (x — zo)"a(x — x) 
et 
lim a(t) = 0. (12.1348) 


t—0 
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12.40 Développement au voisinage de l'infini 


Il est souvent utile de connaitre le comportement d’une fonction pour les grandes valeurs de x 


et de déterminer ses asymptotes éventuelles. La technique que nous allons utiliser consiste à poser 


æ = } et de développer la fonction “auxiliaire” g(h) = f(1/h) autour de h = 0. La limite avec 


h — 0Ÿ donnera le comportement pour æ — 0 et la limite À — 07 donnera le comportement pour 
LD: 

Dans le cas d’une développement autour de +00 nous ne parlons plus de développement limité 
mais de développement asymptotique. 


12.40.1 La fonction puissance : remarques pour la suite 


Il y a encore de nombreuses choses à dire sur la fonction puissance. Pour savoir lesquelles, voir 
le thème 51. 


12.41 Fonctions réelles de deux variables réelles 


Une fonction réelle de 2 variables réelles est une fonction f : AC R? —R:(x,y) > 2 = 


f(x, y). 
Le graphe de f, noté Gr f, est un sous-ensemble de R° : 


Grf= (ay) eR | (ay) e Act z= f(x,4)) 


Les courbes de niveau de la fonction f sont obtenues en posant f(x,y) = À. 


12.41.1 Limites de fonctions à deux variables 


Ici nous n’allons pas entrer dans tous les détails, mais simplement mentionner les quelques 


techniques les plus courantes. 
ThoLimiteCompose 


Théorème 12.482. 
Soient deux fonctions f : IR" — RP et g: IRP — IR. Si a est un point adhérent au domaine de go f 
et si 


(12.1349) 


alors 
linge fit) =« (12.1350) 
Les techniques usuelles sont 


(1) La règle de l’étau. Cette technique demande un peu plus d'imagination parce qu’il faut penser 
à un « truc » différent pour chaque exercice. En revanche, la justification est facile : il y a un 
théorème qui dit que ça marche. 


(2) Lorsqu'on applique la règle de l’étau, penser à 


ll = Va? < 4/22 + 2. (12.1351) 


Cela permet de majorer le numérateur. Attention : ce genre de majoration fonctionne seule- 
ment au numérateur : agrandir le dénominateur ferait diminuer la fraction. 


(3) Il n’est pas vrai que 


lrl = Va? < Vrt < /x4 + 2y4. (12.1352) 


En effet, si x est petit, alors x? > x, et non le contraire. 


12.41. FONCTIONS RÉELLES DE DEUX VARIABLES RÉELLES 1141 


Une technique très efficace pour les limites (x,y) — (0,0) est le passage aux coordonnées 
polaires. Il s’agit de poser 


x = r cos() (12.1353a) 
y = rsin(#) (12.1353b) 


et puis de faire la limite r — 0. 


Si la limite obtenue ne dépend pas de 6, alors c’est la limite cherchée. Voici quelque exemples. 
EXooASMWooCBSyVf 


Exemple 12.483. 
Calculer la limite 
, T—Yy 
lim , 
(x,y)—(0,0) T + y 
Ici la méthode des chemins pour est particulièrement éclairante. Regardons d’abord la fonction 
sur la droite x = y. Nous avons 


(12.1354) 


T—X 
2x 


f(x, y) — 


Donc la fonction est nulle sur toute la ligne. 
Si nous regardons maintenant la ligne verticale x = 0, nous avons 


0. (12.1355) 


f(0,u) = _ = =]; (12.1356) 


donc la fonction vaut —1 sur toute la ligne verticale. A 


Beaucoup d’autres exemples seront donné en 18.233 lorsque nous aurons vu les coordonnées 
polaires. 


12.41.2 Dérivées partielles 


La dérivée partielle par rapport à x au point (x,y) est notée 


CL (a,1) (12.1357) 


et se calcule en dérivant f par rapport à x en considérant que y est constante. 
De la même manière, la dérivée partielle par rapport à y au point (x, y) est notée 


Se) (12.1358) 


et se calcule en dérivant f par rapport à y en considérant que x est constante. 
Pour les dérivées partielles secondes, 


— flan) = (= Lan) = 2. 
— Feu) = (A), = Éty) = Z (D. 
D) = 20) = PL (x, y). 


62 
x neo) van Ch ya (Es Ÿ) ou er (z,y) = ET 0y \ 0x Oyox 


12.41.3 Différentielle et accroissement 


La différentielle totale de f au point (a,b) est donnée, quand elle existe (!), par la formule 


Ô 0 
df(a,b) = CL (a, tar + (a b)dy. (12.1359) 
De la même façon que la formule des accroissements finis disait que f(x + a) = f(x) + af'(x), 
en deux dimensions nous avons que l’accroissement approximatif de f au point (a,b) pour des 
accroissements Azx et Ay est 
Of Of 
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Le plan tangent au graphe de f au point (a, b, f(a, b)) est 


of 


T{a,6) (x, y) = f(a, b) + de 


(a, b)(x — 


a) 


PA 


SL (ab) (u — b) 


(12.1361) 


essayez d'écrire l'équation de la droite tangente au graphe de f(x) au point x = a en termes de la 
dérivée de f, et comparez votre résultat à cette formule. 


Un des principaux théorèmes pour tester la différentiabilité d’une fonction est le suivant. 
ThoProuverDiffable 


Théorème 12.484. 
Soit une fonction f: IR” — IR?. Si les dérivées partielles existent dans un voisinage de a et donc 
continues en a, alors f est différentiable en a. 


Le plus souvent, nous prouvons qu’une fonction est différentiable en calculant les dérivées 
partielles et en montrant qu’elles sont continues. 

Dérivation implicite : Soit F(x, f(x)) = 0 la représentation implicite d’une fonction y = f(x) 
alors 


12.42 Les fonctions à valeurs vectorielles 


Jusqu'à présent nous avons vu des fonctions de plusieurs variables qui prenaient leurs valeurs 
dans R. Nous allons maintenant voir ce qu’il se passe lorsque les fonctions prennent leurs valeurs 
dans R. 

Une fonction d’une variable est dite à valeurs vectorielles lorsque 


ÉTeRSR 
Fe e (12.1362) 
LT) — 2(T 
f(x) 


Les fonctions f;: IR — IR sont les composantes de f. Ce que nous avons raconté à propos des 
dérivées passe facilement : 
fi(a+e)—fi(a) 
fa(a+e)- 

€ 

e)— 

€ 


f(a+ 9 — f{a) 


€ 


(12.1363) 


+e)— fa(a) 
f3(a+e)— f3(a) 


En particulier dès que les fonctions f; sont dérivables, nous avons 
(12.1364) 


comme dérivée de la fonction. Cette dérivée est un vecteur. 


Exemple 12.485. 

Si . 
x'e 

cos(x?) |, 
a +x 


Élae (12.1365) 


alors 

2xe? + x2e? 

—2xsin(x?) 
3x? +1 


f(x) (12.1366) 


A 
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12.43 Fonctions vectorielles de plusieurs variables 


Ce sont les fonctions de la forme 


J:R —R 
“ fix, y, 2) (12.1367) 
UD Ru f(x, y, 2) 
Zz f(x, y, 2) 


En ce qui concerne les dérivées, tout se passe comme avant. Si les dérivées partielles des com- 
posantes f; existent au point a € RŸ, alors 


©x f1(a) °yfi(a) 02f1(a) 
Ô Ô Ÿ Ô 
CL (o) = | Ofo(a) |, SL (a = | dyfo(a) |, SL (o) = | 0, fa) |. (12.1368) 
Cx f3(a) Cyf3(a) 0,.f3(a) 
12.44 Limites à plusieurs variables 
PropLimParcompos 
Proposition 12.486. 
Soit f: DCR" — R". Nous avons 
lim f(x) = 4 (12.1369) 
si et seulement si 
lim Aa =t (12.1370) 
pour toutie {1,...,n} où f(x) dénote la i-ème composante de f(x) et L; la i-ème composante de 


Le R”. 


Cette proposition revient à dire que la convergence d’une fonction est équivalente à la conver- 
gence de chacune de ses composantes. 


Démonstration. L'élément clef de la preuve est le fait que pour tout vecteur u € IR?, nous ayons 
l'inégalité 


fuil < (£ B=lé): Fquieqqorng 


La norme (dans R?) d’un vecteur est plus grande ou égale à la valeur absolue de chacune de ses 
composantes. 

Supposons que nous ayons une fonction dont chacune des composantes a une limite en a : 
limz-,a fi(æ) = Li. Montrons que dans ce cas la fonction f tend vers £. Si nous considérons € > 0, 
par définition de la limite de chacune des fonctions f;, il existent des d; tels que 


[x — arm < à = |fi(x) — | < €. (12.1372) 


Notez que la norme à gauche est une norme dans R’”? et que celle à droite est une simple valeur 
absolue dans R. Considérons Ô = min{;};=1,..n. Si |æ — a] < 6, alors 


If) — 4 = > LA Ge) - 42 < > = Vne = Ve. (12.1873) 
i=1 i=1 


Nous voyons qu’en choisissant les 6; tels que | f(x) — L;| < €, nous trouvons | f(x) — €] < 4/ne. Afin 
d'obtenir | f(x) — {| < €, nous choisissons donc les 6; de telle manière à avoir | f(x) — 4] < e/4/n. 

Nous avons donc prouvé que la limite composante par composante impliquait la limite de la 
fonction. Nous devons encore prouver le sens inverse. 
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Supposons donc que lim,;_,, f(x) = £, et prouvons que nous ayons lim,;-_,, fi(æ) = L; pour 
chaque 1. Soit € > 0 et Ô > 0 tel que |x — a] < Ô implique | f(x) — {| < €. Avec ces choix, nous 
avons 


f(x) — &l < f(x) — 4 < € (12.1374) 


où nous avons utilisé la majoration (12.1371) avec f(x) — { en guise de u. 


De même, pour la continuité nous avons la proposition suivante : 


Proposition 12.487. 

Soit une fonction f: DER" —R'" etae D. La fonction f est continue en a si et seulement si 
chacune de ses composantes l’est, c’est-à-dire si et seulement si chacune des fonctions fi: D — R 
est continue en à. 


Essayez de prouver cette proposition directement par la définition de la continuité, en suivant 


pas à pas la démonstration de la proposition 12.486. 
Propfaposfxposcont 


Proposition 12.488. 
Soit f: R"—R et a, un point du domaine de f telle que f(a) > 0. Alors il existe un rayon r tel 
que f(x) > 0 pour tout x dans B(a,r). 


Cette proposition signifie que si la fonction est strictement positive en un point, alors elle 


restera strictement positive en tous les points « pas trop loin ». 


Démonstration. Prenons € = f(a)/2 dans la définition de la continuité. Il existe donc un rayon Ô 
tel que pour tout x dans B(a, 6), 


fe) — fa) < 2, (121875) 
en d’autres termes, f(x) € B(f(a), 1@), évidemment aucun nombre négatif ne fait partie de cette 


dernière boule lorsque f(a) est strictement positif. 


Corfneqzouvert 


Corolaire 12.489. 
Si f: R°" — MR est une fonction continue, alors l’ensemble 


A={xeR" tels que f(x) Z 0} (12.1376) 


est ouvert. 


Démonstration. Soit x € À. Si x > 0 (le cas x < 0 est laissé en exercice), alors il existe une boule 
autour de x sur laquelle f reste strictement positive (proposition 12.488). Cette boule est donc 
contenue dans A. Étant donné qu’autour de chaque point de À nous pouvons trouver une boule 
contenue dans À, ce dernier est ouvert. 


ExBNOQEWe 
Exemple 12.490. 
Soit GL\(R) l’ensemble des matrices n x n inversibles. Nous allons montrer que GZL,;(R) est un 
ouvert de R””°. L'identification entre les vecteurs et les matrices consiste simplement à « déplier » 
la matrice pour en faire un vecteur. Par exemple, en dimension deux, 


e R“. (12.1377) 


HRN 
© 
Æ N 
Nr 
EE © ND 
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En dimension 3, 


(12.1378) 


© © 
© OO —J © Ct & © D + 
m 
7 
© 


Une matrice est inversible si et seulement si son déterminant est non nul. Or le déterminant 
est un polynôme en les composantes de la matrice. En dimension deux, nous avons 


det (° : = ad — bc, (12.1379) 


mais en écriture « dépliée », nous pouvons aussi bien écrire 


det = ad — bc. (12.1380) 


RL OQ SR 


En dimension 3, le déterminant est donc un polynôme des 9 variables qui apparaissent dans le 
vecteur « déplié ». En général, dans R"”, nous considérons donc le polynôme det: R* -R qui 
à un vecteur X € R"° fait correspondre le déterminant de la matrice obtenue en « repliant » le 
vecteur X. 

Donc dans R", l’ensemble des matrices inversibles est donné par l’ensemble des vecteurs sur 
lesquels le polynôme det ne s’annule pas, c’est-à-dire 


{X € R"° tels que det(X) # 0}. (12.1381) 


Mais le déterminant est un polynôme, et donc une fonction continue. Cet ensemble est par consé- 
quence ouvert par le corolaire 12.489. A 


La proposition suivante montre que la limite peut « passer à travers » les fonctions continues. 
PropLimCompose 


Proposition 12.491 (limite de fonction composée). 
Soit f: R?— R1 et g: R — R’ telles que 


lim g(x) = p Fa GoR RS) 
q FRE) 


Alors nous avons lim,_,,(f 0 g)(x) = q. 


Démonstration. Comme presque toute preuve à propos de limite ou de continuité, nous commen- 
çons par choisir € > 0. Nous devons montrer qu’il existe un Ô tel que |x — a] < ô implique 
lf(g(x)) — al < €. : : 

La limite (12.1382b) impose l’existence d’un Ô tel que [y — p| < Ô implique | f(y) — al < €, 
tandis que la limite (12.1382a) donne un 6 tel que [x — a| < 6 implique |g(x) — p| < Ô (nous avons 
pris 0 en guise de € dans la définition de la limite pour 9). 

Avec ces choix, si |x — a < 6, alors |g(x) — p| < ô, et par conséquent, 


| f(g(x)) — al < €, (12.1383) 


ce que nous voulions. 


1146 CHAPITRE 12. ANALYSE RÉELLE : LIMITES ET DÉRIVATION 


De façon pragmatique, la proposition 12.491 nous fournit une formule pour les limites de 


fonctions composée : . 
im(foga)= lim (y) Fa CESSE) 


Ta y—limz-a g(t) 


lorsque f est continue. 


Remarque 12.492. 
La formule (12.1384) ne peut pas être utilisée à l’envers. Il existe des cas où lims-,4(9 0 f)(x) = q, 
et lims_,a f(t) = p sans pour autant avoir lim,_,, g(y) = q. Par exemple 


2 six>0 
ad 7 (12.1385a) 
0 six <0 


JCæ) = x. (12.1385b) 


Nous avons (go f)(x) = 2 pour tout x, ainsi que lims_,0 f(x) = 0, mais la limite limy_,0 g(y) 
n'existe pas. 


En général, lorsqu'un ensemble est donné par des inégalités, prendre la fermeture consiste à 
transformer les inégalités strictes en inégalités non strictes ; prendre l’intérieur consiste à rendre 
stricte toutes les inégalités; la frontière consiste en gros à transformer toutes les inégalités en 
égalités (nous allons voir que pour la frontière, c’est un peu plus de travail). Comprenez bien que 
cela n’est vrai que « en général ». Il faut toujours bien regarder sur chaque exemple si il n’y a pas 
l’un ou l’autre point problématique. 

La proposition 12.488 sera une des clefs pour dire que si une inégalité stricte est satisfaite en 


un point, alors elle sera satisfaite en tout point dans un voisinage. Voir aussi l'exemple 12.493. 
exoEspVectoNorme0008 


Exemple 12.493. 
Soit f : R — R une fonction continue. Montrer que le sous-ensemble À de R? défini par À = 
{(x, y) eR°; y> f(x)} est ouvert. 

Prouver que l’ensemble B = {(x,y) € IR? tels que y > f(x)} est fermé. 

Nous considérons la fonction g: IR? — IR donnée par g(x,y) = f(x) — y. Cela est une fonction 
continue parce que c’est une différence de fonctions continues. Par définition, 


A = {(x,y) € R?° tel que g(x,y) > 0}. (12.1386) 


Par la proposition 12.488, autour de chaque point (x, y) tel que g(x, y) > 0 (c'est-à-dire autour de 
chaque point de À), il existe une boule sur laquelle g reste strictement positive. L'ensemble À est 
donc ouvert. 

Pour prouver que l’ensemble B est fermé, prouver que le complémentaire est ouvert, c’est-à-dire 
que les points tels que y — f(x) < 0 forment un ouvert. Cela revient au même que ce que nous 
avons fait pour À. 

A 


12.45 Champs de vecteurs 


Un champ de vecteur est une fonction f: IR° — IR. Géométriquement, il s’agit simplement de 
mettre un vecteur en chaque point de l’espace. Cela arrive très souvent en physique. 


Exemple 12.494. 
Si un fluide (eau, gaz) coule dans un tube, en tout point le point a une vitesse, qui sera un vecteur 
généralement dirigé le long du tube. PA 


Exemple 12.495. 
La force d'attraction de la Terre sur une masse m située au point r = (x,y,z) est donnée par 


F(r) = (12.1387) 
F 
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Dans cette expression, tant r que F(r) sont des vecteurs. Nous l’avons représenté sur la figure 12.13. 
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FIGURE 12.13: Le champ de gravitation de la Terre. Labe1FigSQNPooPTrLRQ 


L'application 
F:R*-—R* 
re F(r) 


est le champ gravitationnel de la Terre. 


12.45.1 Matrice jacobienne 


(12.1388) 


La matrice jacobienne de la fonction f: R° — R° au point a e R° est la matrice dont les 


colonnes sont les vecteurs 2É (a), SL(a) et BE (a), c’est-à-dire 


ÆQ #4 EC 
Ja) = |) ZE) Lo) 


Exemple 12.496. 


Si 
æye 
f(a,y,2) = | x? + cos(yz) |, 
TYZ 
alors 
ye xe’ xye 
J(x,y,z) = | 2x —z2sin(yz) —ysin(yz) 
YZ xz Ty 


(12.1389) 


(12.1390) 


(12.1391) 


A 
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12.46 Divergence, rotationnel et l’opérateur nabla 


Nous avons déjà vu le gradient d’une fonction f: R° — R 


Oz f(x, y, 2) 
Vf(æ,y,2) = | f(x, y, 2) Fa RD) 


0, f(x, y, 2) 


Afin de définir la divergence et le rotationnel, nous introduisons V sous une forme un peu plus 
abstraite comme le « vecteur » 


v= |0,|. (12.1393) 


Vue comme ça, la formule (12.1392) est claire. 
Si Fest un champ de vecteurs, nous introduisons la divergence de F' par 


(12.1394) 


Cela est une fonction. Et nous introduisons le rotationnel du champ de vecteur F par 


Ex €Ey €Ez 
VxF=|%œ dy à 
PE, En (12.1395) 


OF, OF, OF, OF, OFy Fr 
= Cu Ey + | — e>. 
Oy 02 0x 02 0x Oy 
Cela est un champ de vecteur. En utilisant le symbole complètement antisymétrique 6;;4, le rota- 
tionnel d’un champ de vecteur peut s’écrire 


VXF = cn Fier. (12.1396) 
ijk 


Le gradient, la divergence et le rotationnel consistent à appliquer simplement à V les trois 
produits qu’on peut effectuer sur un vecteur : 


(1) Le produit d’un vecteur par un scalaire multiplie chacune des composantes : 


0x Or f 
df= af |. (12.1397) 
op Of 


(2) Le produit scalaire d’un vecteur avec un autre vecteur donne lieu à la divergence : 


GE F; 
F, F F 
le LR © © + © . © £ (12.1398) 
8. F, x y FA 
(3) Le produit vectoriel de deux vecteurs : 
Ox Fr Cx Ey Ez 
lee lé 0 Gal: (12.1399) 
op F, Fr Fy F; 


Ces trois opérations joueront un rôle central en électromagnétisme dans les équations de Maxwell. 
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Exemple 12.497. 
Soit F(x,y,2) = tex + tryey + e., c'est-à-dire 


z 
Fausse (12.1400) 
1 
Son rotationnel est donné par 
Ex €Ey €Ez 0 
VxF=|Z À 21] (0-—0)e—(0—0)e, + (y 0e, = ge, = | 0 |. (12.1401) 
T xy ] y 


A 
Afin d'étudier comment se comporte la composition de ces opérateurs, nous aurons besoin de 


ce lemme que nous n’énoncerons pas précisément. 
LemPermDerrxyz 


Lemme 12.498. 
Si f: R° —R est une fonction de classe C?, alors on peut permuter l’ordre des dérivées : 


ze (25) 25) 

2 1)=; L (2 1) (12.1402) 
ù RAC: 
an (8e 


La fonction 
y, 2) (12.1403) 


sera notée 


CE à 


4 12.1404 
Ox0y 
Il y a deux propriétés importantes : 
Théorème 12.499. 
Soit f: R? — R une fonction de classe C?. Alors 
V x (Vf) = 0. (12.1405) 
Si F:R°— R> est un champ de vecteurs de classe C?, alors 
V:({(VxF)=0. (12.1406) 


Démonstration. Ce sont seulement deux calculs qui manipulent les définitions. Pour le premier, la 
divergence de f est le champ de vecteurs 


Of Of Of 
Ms Œ ui y * F Oz 


En mettant ce champ dans la définition du rotationnel, 


ee (12.1407) 


Ex € Ez 
É . ô (of 0 [of 
Vx(Vf)= 3 5 e É (1) Oz GIE 


d 

+ 
| DO) 
LUS 


Ôz 


Ë é . Se (12.1408) 


EG)-3 Ge 
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En utilisant le lemme 12.498, chacun des termes fait zéro. 
La seconde propriété se démontre en utilisant le même type de calcul. 


Remarque 12.500. 

Il n’y a pas de propriétés du même style pour la combinaison V x (V : F) pour le rotationnel de 
la divergence. En effet la divergence d’un champ de vecteur est une fonction, et il n’y a pas de 
rotationnel pour une fonction. 


rt Gradients can't curl. 


WHO'S ON 
MY TEAM? QuHH.…. 
eo 


http://spikedmath.com/501.htmlSpiked math, licence Creative Commons by-nc 2.5. 


12.47 Interprétation géométrique et physique de la divergence 


En physique, on dit qu’un champ de vecteurs à divergence nulle est incompressible. Nous 
allons essayer de comprendre pourquoi. Lorsqu'un fluide incompressible se déplace, il faut qu’en 
chaque point il y ait autant de fluide qui rentre que de fluide qui sort. Nous allons voir sur quelques 
exemples que la divergence d’un champ de vecteurs est le « bilan de masse » d’un fluide qui se 
déplace selon le champ de vecteurs. 

Si en un point la divergence est positive, cela signifie qu’il y a une perte de masse et si la 
divergence est négative, cela signifie qu’il y à une accumulation de masse. 

Prenons par exemple un fluide qui se déplace selon le champ de vitesse montré à figure 12.14. 


RRRAAA 
AARARA 
\AAAAAA 
VNTTTTY 


FIGURE 12.14: Le champ de vecteurs F(x,y) = 2 (1 0kabe1FigBENToONSrys 


Étant donné que la vitesse diminue lorsque x avance, il y a une accumulation de fluide. Regardez 
en effet la quantité de fluide qui rentre dans le rectangle par rapport à la quantité de fluide qui en 
sort. Ce champ de vecteurs a pour équation : 


F(x,y) = - () = «i (12.1409) 


Sa divergence vaut donc 


Fr ‘F, 1 
(VF y) = (cv) + e” (9) = 7. (12.1410) 
=0 


Cette divergence étant négative, il y a bien accumulation de fluide en tout point, et d'autant plus 


que zx est petit. 
ExamDivFrot 


Exemple 12.501. 
Prenons le champ de vecteurs tournant 


F(x,y) = Er. ( . ) (12.1411) 
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représenté à la figure 12.15. Cela est un vecteur qui est constamment perpendiculaire au rayon. 
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FIGURE 12.15: Le champ de vecteurs F(x, y) = (y, — T}iabelFigYQVHooYsCLHQ 


Un fluide dont la vitesse serait donné par ce champ de vecteur se contente de tourner. Intuiti- 
vement il ne devrait pas y avoir de divergence parce qu’il n’y a aucune accumulation de fluide. En 


effet, 


—2xy 2xy 
V - F(x, sf, 12.1412 
CETTE T. ne 
A 
Exemple 12.502. 
Prenons le cas du champ de force de gravitation : 
1 % 
F(x,y,2) = Gi y 20) y (12.1413) 
z 


Nous pouvons rapidement remarquer que V : F = 0. Est-ce que cela peut se comprendre sur le 


dessin de la figure 12.16 ? 


FIGURE 12.16: Le champ de vecteur de la gravité. Nous avons tracé, sur les deux cercles la même 
densité de vecteurs, c’est-à-dire le même nombre de vecteurs par unité de Sugl8éfrigZGUDooEsqCQ 


Essayons de voir combien de fluide entre dans la zone bleue et combien en sort. D'abord, il est 
certain que les vecteurs qui sortent sont plus courts que ceux qui rentrent, ce qui voudrait dire 
qu'il y a plus de fluide qui rentre. Mais on voit également que le nombre de vecteurs qui sortent 
est plus grand parce que la seconde sphère est plus grande et qu’il y a un vecteur en chaque point 


de la sphère. 
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Intuitivement nous pouvons dire que la quantité qui rentre dans la sphère de rayon r1 donnée 
par la taille des vecteurs entrants multiplié par la surface de la sphère, c’est-à-dire 


—. 
nr? |F(x, y, 2)||, anpinorme tes 


mais |F(x,y,2)| = 1 donc la quantité de fluide entrant est 47. La quantité de fluide sortant sera 
dl 


la même. 
Cela explique deux choses 


(1) Pourquoi les forces de gravitation et électromagnétiques sont en 1/r?; c'est parce que nous 
vivons dans un monde avec trois dimensions d’espace. En étudiant très précisément le champ 
de gravitation, certains physiciens espèrent trouver des déviations expérimentales par rap- 
port à la règle du 1/r?; cela pourrait être un signe que l’espace contient des dimensions 
supplémentaires. 

(2) Pourquoi il y a un 47 comme coefficient dans beaucoup d'équations en électromagnétisme : 
en particulier dans certaines anciennes unités de flux. 


A 


Remarque 12.503. 
Nous allons voir plus loin comment s’assurer que l’équation (12.1414) représente bien la « quantité 
de fluide » qui rentre dans la zone délimitée 


12.48 Quelques formules de Leibnitz 


La divergence étant une combinaison de dérivées, il n’est pas tellement étonnant que la diver- 
gence de produits donne lieux à des formules en deux termes. Si f est une fonction et si F et G 


sont des champs de vecteurs, nous avons la proposition suivante. 
PROPooDMWEooNaJBCM 


Proposition 12.504. 
Si F et G sont des champs de vecteurs dont toutes les dérivées partielles existent, alors 


1) V:-(fF)=fV F+F -Vf 
(2) V-(FxG=GVxF-F-VxG 
(3) Vx(FF)=fVxF+VIxF. 


ITEMooFDJTooKTnvKj 


Chapitre 13 


Analyse sur des groupes 


13.1 Action de groupe et connexité 

ThojrLkKZk 
Théorème 13.1. 
Soit G un groupe topologique localement compact et dénombrable à l'infini! agissant continûment 
et transitivement sur un espace topologique localement compact? E. Soit x e E. Alors l’application 


w: G/Stab(x) — E 


Pa (13.1) 


où Stab(x) est le stabilisateur® de x est un homéomorphisme. 
LemkLRAet 


Lemme 13.2. 
Si G et H sont des groupes topologiques tels que G/H et H sont connexes“, alors G est connere. 


Démonstration. Soit f: G — {0,1} une fonction continue. Considérons l'application 
f: G/H — {0,1} 
[gl f(9). 


D'abord nous montrons qu’elle est bien définie. En effet si À € H nous aurions f([gh]) = f(gh), 
mais étant donné que H est connexe, l’ensemble gH est également connexe; la fonction continue 
f est donc constante sur gH. Nous avons donc f(gh) = f(g). 

Étant donné que G/H est également connexe, la fonction f doit être constante. Si g1 et g> sont 


deux éléments du groupe, nous avons f(g1) = f([g1]) = f([g2]) = f(g2). Nous en déduisons que f 
est constante et que G est connexe. 


(13.2) 


13.3. 
La connexité de SO(3) peut être démontrée en suivant les lignes de [108]. Le corolaire 12.91 permet 


de dire que les éléments de SO(3) ont une valeur propre égale à 1. 
THOooYQFNooPaYmaP 


Théorème 13.4. 
Pour tout n > 2, le groupe SO(n) est connete, le groupe O(n) a deux composantes connexes. 


Démonstration. La seconde assertion découle de la première parce que les matrices de détermi- 
nant 1 et celles de déterminant —1 ne peuvent pas être reliées par un chemin continu tandis que 
l'application 
—1 
Mr 1 M (13.3) 
l 


1. Cela signifie qu’il est une réunion dénombrable de compacts 
2. Définition 7.81. 
3. Définition 2.28. 
4. Définition 7.64. 
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est un homéomorphisme entre les matrices de déterminant 1 et celles de déterminants —1. Montrons 
donc que G = SO(n) est connexe par arcs pour n > 2 en procédant par récurrence sur la dimension. 
Nous acceptons le résultat pour G = SO(2). Notons que nous en avons besoin pour prouver 
que la sphère $"—l est connexe. 
Le groupe SO(n) agit, par définition, de façon transitive sur la sphère $”-1, Soit a e S"-1, 
nous avons 


G'a= st (13.4a) 
Ga = SO(n—1) (13.4b) 
où G, est le fixateur de a dans G. Pour montrer le second point, nous considérons {e;}, la base 


canonique de IR” et M € G telle que Ma = e1. Le fixateur de e; est évidemment isomorphe à 
SO(n — 1) parce qu'il est constitué des matrices de la forme 


1 0 0 
0 ne (13.5) 
0 an-11 An—1n—1 

où (aij) € SO(n — 1). L'application 


est un isomorphisme entre G, et SO(n — 1). Le théorème 13.1 nous montre alors que, en tant 
qu’espaces topologiques, 
G/G, = ST. (ri 


L'hypothèse de récurrence montre que Ga = SO(n — 1) est connexe tandis que nous savons que 
S"-L'est connexe. Le lemme 13.2 conclut que G = SO(n) est connexe. 


LemIbrsFT 
Lemme 13.5. 
Une bijection continue entre un espace compact et un espace séparé est un homéomorphisme. 
PROPooTVHJooBRmUCd 


Proposition 13.6. 
Les groupes U(n) et SU(n) sont connexes. 


Démonstration. Soit G(n) le groupe SU(n) ou U(n). Ce groupe opère transitivement sur la sphère 
complexe 
ST = {ze C" tel que [z| = 1}. (13.8) 


En notons, pour chaque k, 24 = æy + iyy, nous considérons l’application continue 
) Ù Uk PP 


8: SE + SP 


(13.9) 
(21, . 1184) mis LART EE . 14e Da 


Vérifions que s prend bien ses valeurs dans $?*-1, Nous avons 


ls(z1.,2n)| = > leel2 + lyxl? = > Vel = 1 (13.10) 
k k 


parce que |%[? = |xxl? + [ykl?. Le lemme 13.5 dit que cette bijection continue est un homéomor- 
phisme. Soit a € CH D nous avons 


Cages (13.11a) 
Ga = G(n—1). (13.11b) 
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La seconde ligne est un isomorphisme de groupe et un homéomorphisme. Il est donné de la façon 
suivante. D'abord le fixateur de e; dans G{n) est donné par les matrices de la forme 


1 0 és es 0 
O0 ay Gin—1 

(13.12) 
À Quii + Onin-i 


Où (@j) € G(n — 1). Par ailleurs si M est une matrice de G(n) telle que Ma = e1, nous avons 
l’homéomorphisme 


5 Ces Gp 
. (13.13) 
Ar M AM. 


Encore une fois, cela est un homéomorphisme par le lemme 13.5. Par composition nous avons 
Ga = G(n—1) et un homéomorphisme 


G{n)/Ga = SET. (13.14) 


Le groupe G, et l’ensemble a étant connexes, le groupe G'(n) est connexe par le lemme 13.2. 


Lemme 13.7 ([370]). 
Si Gest un sous-groupe connexe de GL(n, €) alors son groupe dérivé* l’est également. 


Démonstration. Soit S, l’ensemble des produits de m commutateurs de G : 
Sn = {91; ::: ; Jm Où les g; sont des commutateurs}. (13.15) 


La partie $,, est l’image de G par l’application continue 


Gx...xG—G 
— ——— 
2m facteurs (13.16) 
(g1, h1,g2, ho, +... Im) han a [g1, hi] v.. Lis hs] 


En tant qu'image d’un connexe par une application continue, $,, est connexe par le lemme 7.209. 
Puisque les S,, ont l'identité en commun, le groupe dérivé 


D(G) = Ü Le (13.17) 


est également connexe. 


13.2 Espaces de matrices 


13.2.1 Dilatations et transvections 


Soit un corps commutatif K et n > 2. 
ThoooAZKDooNDcznv 


Théorème-Définition 13.8 ([370]). 
Soit une application linéaire u: E — E dont les points fixes forment un hyperplan noté H d’équa- 
tion H = ker(f) avec f € E*. 


ITEMooGTKRooQSPNolI 
(1) Les affirmations suivantes sont équivalentes : ITEMooZHYRooFGKaifi 
(La) det(u) #1 ooXKLWooTFUMZV 


(1b) L'application u est diagonalisable et a une valeur propre qui vaut det(u) # 1. 


5. Définition 2.2. 
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ooMZPTooCLylbh 
(1c) Image(u — Id) & H. 


ITEMooZHYRooFGKaifiv 
(1d) Il existe une base de E dans laquelle la matrice de u est diag(1, ... Mr) AS AdÉLEx 


(2) Les affirmation suivantes sont équivalentes : ITEMooRTIE0000WCFsa 


(2a) I existe a € H tel que pour tout x EE, u(x) = x + f(x)a. ITEMOoRTIEoo0oWCFsb 


(2b) Dans une base adaptée, la matrice de u est donnée par 


1 


ROPERo Er 


(3) Les conditions (1a)-(1d) sont respectées si et seulement si les conditions (2a)-(2b) ne sont 
pas respectées (elles sont les négations l’une de l’autre.). 


Une dilatation est soit l'identité soit un endomorphisme qui respecte les conditions (1). 
Une transvection est soit l’identité soit un endomorphisme qui vérifie les conditions (2). 


Démonstration. Nous allons prouver plein d’implications ..…. 


(1) (1a) implique (1b) Le théorème de la base incomplète (voir remarque 4.14) permet de 
considérer une base {e1,...,e,} de E telle que {e1,...,en-1} soit une base de H. Dans cette 
base, la matrice de u est de la forme suivante (les cases non remplies sont nulles et les étoiles 
correspondent à des valeurs inconnues mais pas spécialement nulles) : 


1 * 
E PQ0E00GU 

a0cPODE0ogy FE 

1 x 

À 
Le fait que le déterminant de u ne soit pas 1 implique que À Æ 1. Par conséquent le polynôme 

caractéristique 

Xa(X) = (1 XY (à — X) (13.20) 
possède une racine À £ 1, et donc w possède un vecteur propre v pour cette valeur. Le 
vecteur v est linéairement indépendant de {e1,...,e»_1} (parce que vecteur propre de valeur 
propre différente). Par conséquent l’ensemble {ei,...,e»_1,v} est une base par la proposition 


4.18. C’est une base de vecteurs propres et donc une base de diagonalisation !. 


TS 
Le) 
a 


(1b) implique (1c) Nous nommons maintenant {e1,...,en} la base de diagonalisation. 
Nous avons u(e,) = Àe, avec det(u) = À £ 1. Nous avons 


(u — Id)(e») = (À — 1)es é AH, (13.21) 


ce qui prouve que l’image de e, par u — Id n’est pas dans H. 


RS 
Co 
a 


(1c) implique (1d) Reprenons une base {e1,...,,e,} donnant la matrice (13.19). Il existe 


x € E tel que u(x) — x n’est pas dans A, c’est-à-dire tel que u(u(x) — x) £ u(x) — x. Nous 
en déduisons que 
u?(x) — 2u(x) + x # 0 (13.22) 


ou encore que 
(X — 1} (u)x Z 0. (13.23) 


6. Proposition 9.121. 
7. Nous pourrions en dire à peine un peu plus et prouver le point (1d), mais cela ne servirait à rien parce que 
nous voulons prouver les équivalences et qu’il faudra quand même prouver que (1c) implique (1d). 


13.2. 


Nous 


(2) 
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C'est-à-dire que (X — 1)? n’est pas un polynôme annulateur de u. Or ce serait le cas si 
X — 1 était le polynôme minimal (proposition 9.99). Le polynôme caractéristique étant (X — 
1) 1(X — À) (et étant annulateur®), le polynôme minimal est de la forme 


Uu(X) = (13.24) 


(Den sie 
X —1 si À= I. 


Dans notre cas nous venons de voir que ce n’est pas X — 1 et donc c’est (X — 1)(X — À) avec 
ÀÆZ1. 
Nous devons trouver une base de diagonalisation .. .Supposons 


n—1l 


u(en) = » Gex + ÀEn, (13.25) 
k=1 


dans lequel nous venons de prouver que À # 1, et cherchons 
nm 
= Ÿ Die; (13.26) 


de telle sorte à avoir u(e!,) = Àe!,. Nous avons 


n—1 n—1l 
u(e,,) = > pju(e;) + Pnu(en) = Y (np; + mraï)e; + pes. (13.27) 
j=1 j=1 


En égalisant à Ai Pjeÿ, il vient 


Dj + Pnaj = ÀP; (13.28) 
pour tout j = 1,...,n— 1 et la condition triviale p, À = Ap, pour j = n. Nous en déduisons 
que le choix 

PrAj 
— 13.29 


fonctionne (parce que À £ 1 comme nous l’avons démontré plus haut). En bref, il suffit de 
poser 


n—1 
à 
re ” Ne, + Pnên (13.30) 
j=1 
avec Ph au choix pour avoir une base {e1,...,en_1,6,,} de diagonalisation de w avec À £ 1 


comme dernière valeur propre. 


(1d) implique (1a) Évident .. encore faut-il se souvenir d’invoquer l’invariance du déter- 


minant par changement de base. 
avons terminé la première série d’équivalences. Nous continuons avec la seconde. 


(2a) implique (2b) Nous prenons e,_1 = a et nous complétons en une base de H. Pour 
En il suffit de prendre n’importe quel vecteur v tel que f(v) £ 0 (qui existe parce que f = 0 
est seulement un hyperplan), et de le normaliser. 


Dans cette base, la matrice de u a la forme désirée parce que u(e») = Een + f(en)a = en +€n-1 
du fait que en-1 = a et f(en) = 1. 

(2b) implique (2a) Soit {e:,...,e,} cette base. En prenant a = e,_1 et en posant x = 
D Trek nous avons 


n—1 
ur) = > Tkek + Tn(En-1 + En) = T + Lnen-1 = T + TnQ. (13.31) 
k=1 


8. Théorème de Cayley-Hamilton 9.118. 
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Mais puisque f(x) = D, fix, et que f(e;) = 0 pour tout à = 1,...,n — 1 nous avons 
f(x) = fntn. Il n’y a cependant pas de raison d’avoir f, = 1. Mais en définissant 
1 
! 
nn 
nous avons bien u(e’,) = + (en—1 + en) = e/,_1 +e,. Donc dans cette base nous avons encore 
la matrice de u de la forme 


(13.32) 


| (13.33) 


mais cette fois avec f(e,,) = 1. 


Nous avons terminé avec la seconde série d’équivalences. [1 nous reste à prouver que la première 
est équivalente à la négation de la seconde. 
(1) non (1c) implique (2a) Considérons x9 € E tel que f(x0) = 1 et posons a = u(x0) — xo € 

Image(u — Id). Par la négation de (1c) nous avons a € H. De plus x0 € H (sinon f(x0) = 0) 
donc u(xo) £ %o et a Æ 0. 
Nous montrons que ce choix de a fonctionne : u(x) = x+ f(x)a pour tout x € E. Nous faisons 
cela séparément pour x € H et pour x = x. 
Sihe H alors u(h) = het f(h) = 0 donc h+ f(h)a = h = u(h). Six = +0 alors u(xo) = a+xo 
(c’est la définition de a) et x0 + f(xo)a = æo + à. 


TS 
ND 
a 


(2b) implique non (1a) Dans une base adaptée nous avons 


1 


(13.34) 


et donc det(u) = 1, ce qui contredit (la). 


13.9. 
Dans le cas des dilatations et des transvections, les points fixes forment un hyperplan. 

Selon cette terminologie, l'application æ > Àx n’est pas une dilatation mais un produit de 
dilatations. 


Remarque 13.10. 

Nous notons Æ;; la matrice qui possède uniquement 1 en position (4, j). C'est-à-dire que (E;;) — 
dxôj. Soit H l'hyperplan des points fixes de f. Dans une base contenant une base de FH, la matrice 
d’une transvection a pour forme type : 


T() = 1 +ÀE; TU eo) 


avec à £ j et À€ K, et une dilatation a pour forme type la matrice diagonale 
D;(a) = 1 + (a — 1)F% (13.36) 


avec « € K*. 
Bien entendu, en choisissant une base quelconque, les matrices des dilatations et des translations 


peuvent avoir des formes différentes. 
LemooTQJXooGo!xsI 


Lemme 13.11. 
Quelques manipulations de lignes et de colonnes pour les matrices. 
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ITEMooRWANooPAV km 
(1) La multiplication à gauche par Ti;(À) revient à effectuer le remplacement de ligne 
ITEMooHPSMooWBrSXP 
(2) La multiplication à droite par T;;(À) revient à effectuer le remplacement de colonne 
C; > C; + ÀC:. (13.38) 
ITEMooXUGFooKcbrxs 
(3) La multiplication à gauche par Ti;(1)Ti(—1)7;;(1) revient à la substitution de lignes 


Li — L; (13.39) 
EE (13.39b) 


Notons qu’il n’est pas possible d’inverser deux lignes à l’aide de transvections sans changer un 
signe parce que les transvections sont de déterminant 1 alors que l’inversion de lignes change le 
signe du déterminant. 


Démonstration. Point par point. 


(1) Pour (1) Nous devons prouver que 


Ay sikÆi 
TNA). = 13.40 
(T5(VA)y Er si k = à. (13.40) 


Un peu de calcul matriciel avec utilisation modérée des indices donne : 


(TO) A) y = D (T5) ss Ast (13.41a) 
= Ÿ Gks As + Adi Ojs Ast (13.41b) 
= An + Adi A. (13.41c) 


(2) Pour (2) C'est la même chose. 


(3) Pour (3) Si nous appliquons successivement ces trois matrices (de droite à gauche) nous 
effectuons les substitutions : 


Li TL: TL: L'= TI LUI! LI/ 
: Ads suivi de ‘ | , tde ; : ni (13.42) 


En effectuant ces substitutions, 


W=W+L=Li+(L-LU)=L=L; os9 
et 
I=L=L,-L=L;-(Li+L;)=-L, (13.44) 
ce qu'il fallait. 
PropooFDNRooWFfUDd 


Proposition 13.12 ([109)). 
Soient n > 2 et K un corps commutatif. 


(1) Si AE GL(n,K), il existe des transvections U1,...,U,, V1,...,V, telles que 


A = Ui.….. Ur Dn(det(A)) Vi... Vs. FAo0 So REAnS 
ITEMooLRYXooSoKRiA 


(2) L'ensemble des transvections engendre le groupe spécial linéaire SL(n, K). 
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(3) L'ensemble des transvections et des dilatations engendre le groupe linéaire GL(n, K). 


Démonstration. Nous allons montrer que toutes les matrices de SL(n,K) peuvent être écrites 
comme produits de matrices de la forme (13.35). Cela montrera qu’étant donné un endomorphisme 
f et une base pas spécialement liée à f, il est possible d'écrire la matrice de f comme produit de 
transvections dont les hyperplans invariants sont « contenus » dans cette base. Cela suffit à prouver 
que les transvections engendrent SL(n, K) grâce au lemme 1.316. 

Toutes les transvections ont un déterminant égal à 1. Donc le groupe engendré par les trans- 
vections est inclus dans SL(2, K). Soit À € GL(n, K) ; nous allons utiliser le pivot de Gauss pour 
la diagonaliser. Étant donné que À est inversible, sa première colonne n’est pas nulle. Si Aj # 0 
alors une multiplication à gauche par Lii((Au — 1) /A) effectue la substitution 


An —1 


LB D (13.46) 
t 


qui met un 1 en la position (1,1). Notons que si la première colonne est de la forme 


(13.47) 
0 


avec s £ 0 alors il faut plutôt faire les substitutions Lo — Lo + L: et ensuite Li — Li — LL) pour 
obtenir le même résultat. En effectuant le pivot avec A1, une suite d'opérations sur les lignes et 
les colonnes donnent 


l, © 
M... MAN... N = " (13.48) 


où A1 € GL(n—1,K) et det(A1) = det(A). En continuant de la sorte nous arrivons sur une matrice 
diagonale ° 


1 
M..MyANi..Ny=| (13.49) 
a 
avec & = det(A). En d’autres termes nous avons prouvé qu'il existe des transvections U1,...,U, 
et V1,...,V, telles que 
A=Ui...U, Dn(det(4)) Vi... Vs. POFTTF CARE ET)) 


Cela prouve que les transvections et les translations engendrent GL(n, K). Si À e SL(n, K) alors 
D,(det(A)) = 1 et l'équation (13.50) est un produit de transvections. 


Proposition 13.13. 
Le groupe GL(n,R) est engendré par les endomorphismes inversibles diagonalisables. 


Démonstration. Par la proposition 13.12, le groupe GL(n, R) est engendré par les dilatations et 
les transvections. Il suffit donc de montrer qu’à leur tour, ces deux types d’endomorphismes sont 
engendrés par les endomorphismes inversibles et diagonalisables. 

Les dilatations sont diagonalisables et inversibles. C’est bon pour elles. 

Soit une transvection w, et une base {e;};-1,..n dans laquelle w est de la forme (13.18). Nous 
considérons l’endomorphisme d: E — E défini par d(ex) = keg. Cet endomorphisme est diagona- 
lisable parce que son polynôme minimal, sg = [[;_,(X — k), est scindé à racines simples (voir le 
théorème 9.213). 


9. Attention : les opérations sur les lignes et les colonnes ne sont pas des opérations de similitude. Il n’est pas 
question de prétendre ici que toutes les matrices de GL(n,K) sont diagonales, voir la définition 4.110. 
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Nous avons évidemment u = d_lo (dou) où d_! est diagonalisable et inversible. Voyons que 
dou est également diagonalisable en montrant que y4 est son polynôme minimal (qui est scindé à 
racines simples). 

Il suffit de montrer que y4(d o u)(ex) = 0 pour tout k. Ainsi 44 sera un polynôme annulateur 
de do u de degré n, et donc minimal. 


(1) Sik<n—1 Alors u(ez) = ez et (dou—nj)ez; = (k—nj)ez. Donc : 


a(dou)(ex) = (dou—1)(dou—2)...(dou-—nj)ez = (k—1)(k—2)...(k-—njez = 0 (13.51) 


parce que dans le produit des k — 5, il y en a forcément un de nul. 


(2) Sik=n Dans un premier temps, 
(dou —n)en = d(en + En-1) — Nen = nen + (n — 1)en-1 — nen = (n—1)en-1. (13.52) 
Ensuite 


13.53a 
13.53b 
13.53c 
13.53d 


(dou—(n—1)}en_1 = d(en-1) — (n — 1)en-1 
= d(en-1) — (n — 1)en-1 
= (n—1)es_1 — (n — 1ljes-1 


( ) 
( ) 
( ) 
( ) 


Le polynôme u4 est donc un polynôme scindé à n racines simples annulateur de dou, qui est alors 
diagonalisable et inversible (parce que u et d le sont). 

Donc sous la forme u = d_!(du), la transvection « est écrite comme produit de diagonalisables 
inversibles. 


PROPooSAUToo!I1pJoY 
Proposition 13.14 ([148]). 
Soient n > 3 et K un corps de caractéristique différente de 2. Alors 


(1) le groupe dérivé de GL(n, K) est SL(n, K) ; 
(2) le groupe dérivé de SL(n, K) est SL(n, K). 


La preuve utilise le fait que les transvections engendrent SL(n, K) et que les transvections avec 
les dilatations engendrent GL(n,K). Voir la proposition 13.12. 


13.2.2 Connexité de certains groupes 
LEMooIPOVooZJyNoH 


Lemme 13.15. 
Le groupe O(n,R) n’est pas connexe. 


Démonstration. La non connexité par arcs est facile parce que les éléments de déterminant 1 ne 
peuvent pas être reliés aux éléments de déterminant —1 par un chemin continu restant dans O(n) 
à cause du théorème des valeurs intermédiaires 10.89. 

En ce qui concerne la connexité, il faut en dire un peu plus. 

Les éléments de O(n,R) ont des déterminants égaux à 1 ou à —1. Ces deux parties sont des 
ouverts (pour la topologie induite de M(n,R)). En effet soit À € SO(n,R) (la partie contenant 
les déterminants 1; ce que l’on va dire tient pour l’autre partie). Alors, parce que le déterminant 
est une fonction continue sur Mn, R), il existe un voisinage © de À dans M{n,R) dans lequel 
le déterminant reste entre à et à (c’est la définition de la continuité avec € = 1/2). L'ensemble 
OnO(n, R) est par définition un ouvert de O(n, R) et ne contient que des éléments de déterminant 


L: 


La partie O(n,R) de M(n,R) est donc non-connexe selon la définition 7.64. 
LEMooQMXHooZQozMK 


Lemme 13.16. 
Les groupes U(n) et SU(n) sont connexes par arcs. 
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Démonstration. Soient À une matrice unitaire, et Q une matrice unitaire qui diagonalise À. Étant 
donné que les valeurs propres arrivent par paires complexes conjuguées, 


€ 
ei 
QAQ7 = ñ, ; (13.54) 
eôr 
e7t6r 


Le chemin U(t) obtenu en remplaçant 0; par #0; avec t € [0,1] joint QAQ! à l'identité. Par 
conséquent Q1U(#)Q joint À à l'unité. 


Théorème 13.17. 
Les matrices normales !° forment un espace connexe par arc. 


Démonstration. Soient À une matrice normale et U une matrice unitaire qui diagonalise A. Nous 
considérons U(t), un chemin qui joint 1 à U dans U(n). Pour chaque t, la matrice 


A(t) = U(t) TAU(+) (13.55) 


est normale. Nous avons donc trouvé un chemin dans les matrices normales qui joint À à une 
matrice diagonale. Il est à présent facile de la joindre à l’identité. 

Toutes les matrices normales étant connexes à l’identité, l’ensemble des matrices normales est 
connexe. 


PROPooALQCooLZCKrH 
Proposition 13.18. 
Le groupe SL(n,K) est connexe par arcs. 


Démonstration. Soit À € SL(n, K) ; par la proposition 13.12(2) nous pouvons écrire 


A=[[T0 (13.56) 
cX 
où X est une partie de l’ensemble des couples (à, j) dans {1,...,n}. En posant 


Y: [0,1] — SL(n, K) 


t— [[ TX) (13.57) 
cŒX 


nous avons une application continue de À vers 1, qui, à tout t fait correspondre la matrice w(t), 
inversible de déterminant 1. 

Donc tous les éléments de SL(n,K) peuvent être reliés à 1. Par conséquent, SL(n,K) est 
connexe par arcs. 


PROPooVJNIooMByUJQ 
Proposition 13.19 ([110]). 
Le groupe GL(n, C) est connexe par arcs. 


Démonstration. Soient À € GL(n, C) et sa décomposition (13.45). Comme montré précédemment, 
chacune des transvections peut être reliée à 1 par un chemin continu dans SL(n, C). En ce qui 
concerne le facteur de translation, nous ne pouvons pas simplement prendre le chemin donné par 
te Dh (é det(A)) parce que le résultat n’est pas inversible en t = 0. 

Puisque C* est connexe par arcs il existe une application continue a: [0,1] — C* telle que 
a(0) = det(A) € O* et a(1) = 1. Il suffit alors de prendre D,(a(t)) et nous avons un chemin 
continu de À vers 1 restant dans GL(n, ©). 


PROPooBIYQooWLndSW 
Proposition 13.20. 


Le groupe GL(n,R) a exactement deux composantes connetes par arcs. 


10. Définition 12.101. 
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Démonstration. Nous notons GL*(n,R) et GL-(n,R) les parties de GL(n,R) formées des ap- 
plications de déterminant strictement positifs et strictement négatifs respectivement. D’après le 
théorème des valeurs intermédiaires (théorème 10.89), il n’existe pas d’application continue dans 
GL(n, R) reliant GL*(n,1R) à GL-(n,1R) tout en restant dans les applications de déterminant non 
nul!}, 

Montrons que GL+(n,IR) sont connexes par arcs. Si A € GL+(n,R) alors grâce à la décompo- 
sition (13.45), il existe un chemin continu de A vers D, (det(A)). Puisque RŸ sont connexes par 
arcs, il est possible de relier D,( det(A)) à D,(+1) par un chemin continu. 


13.2.3 Densité 
PropDigDensVxzPuo 


Proposition 13.21. 
Les matrices diagonalisables sont denses dans M(n, ©). 


Démonstration. D’après le lemme de Schur 12.100, une matrice de M{n, C) est de la forme 


À *# # 
AD! g “x + JO (13.58) 
D ‘0 À 


Les valeurs propres sont sur la diagonale. La matrice est diagonalisable si les éléments de la 
diagonales sont tous différents. Il suffit maintenant de considérer n suites (eQ zen convergentes 


(r) 


vers zéro telles que pour chaque k les nombres À, +,” soient tous différents. La suite de matrices 


(1) 


À1 + € # # 
Ag = Q 0 # O7’. (13.59) 
0 D 4e 


est alors diagonalisable pour tout k et nous avons limg_,% À = À. 


PropQGUPooVudelJ 
Proposition 13.22. 
Les matrices inversibles sont denses dans l’ensemble des matrices. C'est-à-dire que GL(n,R) est 
dense dans M(n,R). 


Démonstration. Soit À € Mn, R) ; le lemme de Schur réel 9.220 nous permet d'écrire 


À 


Q EQooJ | oi 


avec Q orthogonale. 
Nous allons définir une suite (A;) de matrices inversibles convergeant vers A. Pour cela nous 


(&) 


considérons, pour chaque ?, une suite (er ) telle que À; + eh) Z£0et el) — 0. La matrice Az est la 


(&) 


matrice donnée par (13.60) dans laquelle nous remplaçons À; par À; + €”. 
En ce qui concerne les blocs, ceux dont le déterminant est non nul, nous n’y touchons pas, et 
ceux dont le déterminant est nul, nous remplaçons a par à + ex. 
Avec cela, Q71A;Q est une suite dans GL(n, R) qui converge vers À. 


11. Si w: [0,1] — GL(n,R) est le chemin, la fonction à mettre dans le théorème des valeurs intermédiaires est la 
fonction f: [0,1] — IR tr det (y(t)). 
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PROPooZUHUooQBwufZq 
Proposition 13.23. 
Si À € Min,C) alors 
eM(A) 2 det(e). (13.61) 


Démonstration. Ici, e4 est l’exponentielle, soit d’endomorphisme, soit de matrice définie par la 
proposition 11.263. 

Le résultat est un simple calcul pour les matrices diagonalisables. Si À n’est pas diagonalisable, 
nous considérons une suite de matrices diagonalisables A4 dont la limite est À (proposition 13.21). 
La suite 


ag = e MA) (13.62) 
converge vers el"(4) tandis que la suite 
by = det(ex) (13.63) 
converge vers det(e{). Mais nous avons ay = by pour tout k; les limites sont donc égales. 
CORooOKKSooHrsYOs 
Corolaire 13.24. 
Si X Ee M(n,C) alors 
d 
— | det(et*)] = Ti(X). 13.64 
[det(e*)] | = Tr(x) (13.64) 


Démonstration. Nous écrivons la proposition 13.23 pour tX au lieu de X ; pour chaque t nous 
avons 
det (et*) D AR (13.65) 


La dérivation par rapport à t en { = 0 donne le résultat attendu. 


ThoHZTooWDjTYI 
Théorème 13.25 (Cayley-Hamilton[411, 412]). 
Tout endomorphisme d’un espace vectoriel de dimension finie sur un corps commutatif quelconque 
annule son propre polynôme caractéristique 


Une autre démonstration est donnée par le théorème 9.118. 


Démonstration. La preuve est divisée en plusieurs étapes. 


(1) Endomorphisme diagonalisable Soit u un endomorphisme sur un espace vectoriel V 
de dimension n sur un corps K et y, sont polynôme caractéristique. Nous savons que si À 
est une valeur propre de u alors Xa(À) = 0 par le théorème 9.114(2). En combinant avec le 
lemme 9.92, si x est vecteur propre pour la valeur propre À de u nous avons 


Mae Ua 0. (13.66) 


Donc tant que w possède une base de vecteurs propres nous avons Y4(u) = 0. 


(2) Le cas complexe 


\ 


Nous nous restreignons à présent (et provisoirement) au cas K = ©, ce qui nous donne 


u € Mn, C). Les matrices diagonalisables sont denses dans M(n, C) par la proposition 13.21. 


Mi(n,C 
Si À € M(n,C) nous considérons une suite de matrices diagonalisables A} a A. Pour 


chaque k nous avons par le point précédent 
Xux (ur) = 0. (13.67) 


Chacune des composantes de x4,(ux) est un polynôme en les composantes de uy, ce qui 
légitime le passage à la limite : 
Xu(u) = 0. (13.68) 


Le théorème est établi pour toutes les matrices de M{n,C) et donc aussi pour tous les 
sous-corps de € comme R ou Z. 
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(3) Le cas général 


Par définition, xu(X) = det(u — X 1) ; les coefficients de X sont des polynômes à coefficients 
entiers en les composantes de u. En substituant uw à X nous obtenons une matrice dont 


chacune des entrées est un polynôme à coefficients entiers en les coefficients de uw. Pour 
chaque à et j entre 1 et n il existe donc un polynôme P;; e Z(X1,..., X,2) tel que 


Xu(u)i — P(uu, c.. ss À: (13.69) 


Ces polynômes ne dépendent pas de uw ni du corps sur lequel on travaille. Notre but est 
maintenant de prouver que P;; = 0. 

Étant donné que le cas complexe (et a fortiori entier) est déjà prouvé nous savons que 
pour tout u € M{n,Z) nous avons P(u11,...,Unn) = 0. La proposition 6.184 nous donne 
effectivement P = 0, en conséquence de quoi l’endomorphisme y,(u) est nul. 


Exemple 13.26. 
Pour montrer que chaque composante vA(u) est bien un polynôme à coefficients entiers en les 


b 
coefficients de uw, voyons l’exemple 2 x 2 : u = (° D'abord 


b 


a — X 
ul) = det ( d=X 


) = X?— (a+ d)X + ad — cb. (13.70) 


Le coefficient de X? est 1, celui de X est —a — d et le terme indépendant est ad — cb; tout trois 
sont des polynômes à coefficients entiers en à, b,c, d. Après substitution de X par u, 


Nude — (u?); — (a ci d)ui; + ad — cb. (art) 


C’est bien un polynôme à coefficients entiers en les entrées de la matrice u. A 


13.2.4 Racine carrée d’une matrice hermitienne positive 
PropVZvCln 


Proposition-Définition 13.27. 
Si AE M(n,C) est une matrice hermitienne !? positive, alors il existe une unique matrice hermi- 
tienne positive R telle que À = R?. De plus R est un polynôme (de R[X]) en A. 

La matrice R ainsi définie est la racine carrée de À, et est notée VA. 


Démonstration. En plusieurs parties. 


(1) Existence Étant donné que À est hermitienne, elle est diagonalisable par une matrice 
unitaire (proposition 12.102), et ses valeurs propres sont réelles et positives (parce que À est 
positive). Soit donc P une matrice unitaire telle que 


1 
P*AP = . (13.72) 


An 


avec @; > 0. Si on pose 


R=P , P*, (13.73) 


alors R? = À parce que P*P = 1. 


12. Définition 9.175. 
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(2) Hermitienne positive La matrice À est hermitienne parce que, avec un peu de notation 
raccourcie, À = P*4/aP et R* = P*,/aP. D'autre part, elle est positive parce que ses valeurs 
propres sont les ,/a; qui sont positives. 


(3) Polynôme Nous montrons maintenant que la matrice R est un polynôme en A. Pour cela 
nous considérons un polynôme Q tel que Q(a;) = 4/& pour tout t. Soit {e;} une base de 
diagonalisation de À : Ae; = a;e;. Alors c’est encore une base de diagonalisation de Q(A). 
En effet si Q = Y, ax XF, alors 


Q(A}ei = (D ar AŸ)e; = (D aa es = Q(aijei = Va. (13.74) 
k k 


Les valeurs propres de Q(A) sont donc ,/a;. Nous savons maintenant que Q(A) a la même 
base de diagonalisation de À (et donc la même matrice unitaire P qui diagonalise), c’est-à-dire 
que 
vai 
Q(A) = P* , =R. (13.75) 


Var 


Donc oui, À est un polynôme en A. 
Notons que ce Q n’est pas du tout unique; il existe une infinité de polynômes envoyant n 
nombres donnés sur n nombres donnés. 


(4) Unicité Soit $ une matrice hermitienne positive telle que R? = $? = A. D'abord S 


commute avec À parce que 
SA = 5% = S25 = AS. (13.76) 


Donc $ commute aussi avec Q(A) = R. Étant donné que S et R commutent et sont diago- 
nalisables, ils sont simultanément diagonalisables par le corolaire 9.214. Soient Dr = PRP* 
et Ds = PS P* les formes diagonales de R et S dans une base de simultanée diagonalisation. 
Les carrés des valeurs propres de R et S étant identiques (ce sont les valeurs propres de À) 
et les valeurs propres de R et $S étant positives, nous déduisons que Dr = D$ et donc que 
R= P*DRP = P*DSP =S$. 


Une des applications usuelles de cette proposition est la décomposition polaire. 


13.2.5 Racine carrée d’une matrice symétrique positive 
LemTLIiTAAF 


Lemme 13.28 ([413]). 
Le groupe orthogonal O(n,R) est compact. 


Démonstration. Nous avons O(n) = f-!({1,}) où f est l’application continue À > AfA. En tant 
qu’image inverse d’un fermé par une application continue, le groupe O(n) est fermé. 

De plus il est borné parce que tous les coefficients d’une matrice orthogonale sont < 1, donc 
|Alx pour tout À € Of(n). 


PropPEMDqVvT 
Proposition 13.29. 
Une matrice symétrique définie ou semi définie positive, admet une unique racine carrée symé- 
trique. Le spectre de la racine carrée est la racine carrée du spectre de la matrice de départ. 


Démonstration. Propriétés de la racine carrée d’une matrice symétrique 


(1) Existence Soit T une matrice symétrique et Q une matrice orthogonale qui diagonalise !° 
T : QTQT! = D avec D = diag(;) et À; > 0. En posant R = Q-!YDQ, il est vite vérifié 
que R? = T et que RÀ est symétrique. En ce qui concerne le spectre, À a pour valeurs propres 


les VX. 


13. Théorème 9.221. 
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(2) Unicité 
Soit À une matrice symétrique de T : R? = T. Du coup R et T commutent : RT = R° =TR. 
Par conséquent les espaces propres de T' sont stables sous À. Soit E) l’un d’eux de dimension 
d, et Tr, Rr les restrictions de T'et R à Ex. L'application Tr est une homothétie et RE = 
Tr = ÀÏ. Mais RF est encore une matrice symétrique définie positive, donc nous pouvons 
considérer une base {e1,...,e4} de Ex qui diagonalise Rp avec les valeurs propres u; ; nous 
avons donc en même temps 


R}(e:) = je; (13.77a) 
Tr(e;) — Xe;, (13.77b) 


de telle sorte que y? = À. Mais les valeurs propres de Rp sont positives, sont y; = V À pour 
tout à. En conclusion Rp est univoquement déterminé par la donnée de T. Vu que cela est 
valable pour tous les espaces propres de T' et que ces espaces propres engendrent tout E, 
l'opérateur À est déterminé de façon univoque par 7. 


Notons que nous n’avons démontré l’unicité qu’au sein des matrices symétriques. 


13.2.6 Décomposition polaires : cas réel 


Nous rappelons que ST*{(n,R) est l’ensemble des matrices symétriques strictement définies 
positives, d’après le paragraphe 9.225. 
LemMGUSooPqjguE 
Lemme 13.30. 
La partie ST(n,R) est fermée dans M(n, R). 


Démonstration. En effet si Sy est une suite de matrices symétriques convergeant dans M(n,R) 
vers la matrice À, les suites (S%);; et (5%); des composantes ij et ji sont des suites égales, et donc 
leurs limites sont égales l. Donc la limite est symétrique. 

En ce qui concerne le spectre, le théorème 9.221 nous permet de diagonaliser : Sy = QxDrQ, 
où les Dx sont des matrices diagonales remplies de nombres positifs ou nuls. Comme On) est 
compact |”, nous avons une sous-suite Q,œ) convergente : Q,(x) — Q. Pour chaque k, nous avons 


SA = Qet Po Op (13.78) 


dont la limite existe et vaut À. Puisque pour tout k, D,,(4) = QG SQL) et que le produit 
matriciel est continu, la suite k — D,,4) est une suite convergente dans M(n,R). Nous notons 
D sa limite qui est encore une matrice diagonale contenant des nombres positifs ou nuls sur la 
diagonale. 


À = Jim 5,4) = QDQ"!, (13.79) 


et donc le spectre de À est la limite de ceux des matrices D,,(4). Chacun étant positif, la limite est 
positive. Donc A € ST(n,R). 


LemZKJWqIP 
Lemme 13.31. 
La fermeture de l’ensemble des matrices symétriques strictement définies positives est l’ensemble 
des matrices définies positives : Adh(S**(n,R)) = S*(n,R). 


14. Ici nous utilisons le critère de convergence composante par composante et le fait que nous ne sommes pas trop 
inquiétés par la norme que nous choisissons parce que toutes les normes sont équivalentes par le théorème 11.46. 
15. Lemme 13.28. 
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Démonstration. Le lemme 13.30 nous dit que S*(n, R) était fermé. Nous devons prouver que pour 
tout élément de ST(n,R), il existe une suite (S;) dans ST*(n,IR) convergeant vers S. 
Si Se ST(n,R) alors nous avons la diagonalisation 


À 
S=QDQ" =Q ee Or (13.80) 
À 
où À; > 0 pour tout i. Nous définissons 
À + en 
Ds = _. (13.81) 
Àn + et) 


(i) 


où €}, est une suite convergent vers 0 telle que À; + > 0 pour tout à et k. Typiquement si À; > 0 
alors ) = 0 et sinon «) Le 


Pour tout # nous avons QD,Q7! Ee S++(n,1R) et de plus QD,Q71 — QDQ =S$. 


ThoLHebUAU 
Théorème 13.32 (Décomposition polaire de matrices symétriques définies positives[413, 414, 
415]). 
En ce qui concerne les matrices inversibles : 
: O(n,R) x S**(n,R) — GL(n, R 
f: O(n,R) x S**(n,R) — GL(n,R) . 
(Q,S) = SQ 
est un homéomorphisme !. 
En ce qui concerne les matrices en général : 
: O(n, R) x S*(n,R) — M(n,R 
9: O(n,R) » S*(n, R) — M{n,R) .. 


(Q,5) > SQ 


est une surjection mais pas une injection. 
De plus les mêmes conclusions tiennent si nous prenons (Q, 5) — QS au lieu de SQ. 


ii Avertissement /question au lecteur !! 13.33 
Je crois que les éléments de la décomposition polaire sont des polynômes en M. Ecrivez-moi si 
vous pouvez confirmer ou infirmer. 


Démonstration. Nous commençons par prouver les résultats concernant les matrices inversibles. 


(1) Existence et unicité 
Si M = $SQ, alors MMt = SQQS!t = $?, donc $ doit être une racine carrée symétrique de la 
matrice définie positive MM. La proposition 13.29 nous dit que ça existe et que c’est unique. 
Donc $ est univoquement déterminé par M. Maintenant avoir Q = MS! est obligatoire 
(unicité) et fonctionne : 


QtQ=(s"yYMtmus-t = s-1$25-1t = 1, (13.84) 


donc Q ainsi défini est orthogonale. 


Notons que ceci ne fonctionne pas lorsque M n’est pas inversible parce qu’alors S' n’est pas 
inversible. 


16. Cela est en réalité un difféomorphisme, voir la remarque 13.34. 
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(2) Homéomorphisme 


Le fait que f soit continue n’est pas un problème : c’est un produit de matrices. Nous devons 
vérifier que fl est continue. Soit une suite convergente My, — M dans GL(n, R). Si nous 
nommons (Qx,Sx) la décomposition polaire de M, et (Q, S) celle de M, nous devons prouver 
que Qx — Q et Sy, — S. En effet dans ce cas nous aurions 
: = : _ EqJ 
dim UM) = lim (Qx, 84) = (Q,5) = (M). (P85) 


Étant donné que O(n) est compact (lemme 13.28), la suite (Qx) admet une sous-suite conver- 
gente (Bolzano-Weierstrass, théorème 7.136) que nous nommons 


QLtr — FE O(n). (13.86) 


Vu que la suite (M4) converge, sa sous-suite converge vers la même limite : M; — M et 
vu que pour tout Æ nous avons Sy — M:Q:;", 


Ste + G= ME. (13.87) 


Vu que chacune des matrices $,4}) est symétrique définie positive, la limite est symétrique 
et semi-définie positive {7. Donc G € S*{(n,R) n GL(n, R) parce que de plus M et F étant 
inversibles, G est inversible. En ce qui concerne la sous-suite nous avons 


Mn) = So Qt) > GE = M (13.88) 


où FE O(n) et GE ST(n,R). Par unicité de la décomposition polaire de M (partie déjà 
démontrée), nous avons G = S et F = Q. 

Nous avons prouvé que toute sous-suite convergente de Q% a Q pour limite. Donc la suite 
elle-même converge © vers Q. Donc Qx — Q. Du coup vu que Sy, = M:Q;° est un produit 
de suites convergentes, $4 converge également, vers S': Sy — S. 

Au final l'application fl est bien continue parce que les égalités (13.85) ont bien lieu. 


Nous passons maintenant à la preuve dans le cas des matrices en général. 
Soit À € Mn, R) ; par densité (lemme 13.22), il existe une suite (A;) dans GL(n, R) telle que 
Ay — À. Pour chacun des Æ nous appliquons la décomposition polaire déjà prouvée : Az = QxSy. 
D'abord (Q}) est une suite dans le compact !” O(n, R) et accepte donc une sous-suite convergente. 
Quitte à redéfinir la suite de départ, nous supposons pour alléger les notations que Qx — Q € 
O(n,R). Vu que Q} est inversible, 
5x = QE" A (13.89) 


Le produit matriciel étant continu nous avons $; — S dans M(n,R). Mais S*(n,1R) étant fermé 
(lemme 13.30) nous avons aussi S € ST(n, R). 


RemBJCBooGLiRmG 
Remarque 13.34. 
Pour démontrer que f est différentiable, nous devons utiliser le théorème d’inversion locale 17.50 ; 


cela est fait dans la proposition 17.60. 
CorAWYBooNCCQSf 


Corolaire 13.35. 
Toute matrice peut être écrite sous la forme Q:DQ2 où Q1 et Q2 sont orthogonales et D est 
diagonale. 


Démonstration. Si À € M{n,R) alors la décomposition polaire 13.32 nous donne À = SQ où S 
est symétrique définie positive et Q est orthogonale. La matrice S peut ensuite être diagonalisée 
par le théorème 9.221 : S = RDR-! où D est diagonale et R est orthogonale. Avec ces deux 
décompositions en main, À = $Q = RDR-'Q. La matrice RQ est orthogonale. 


17. Lemme 13.31 
18. Proposition 7.290, pas difficile. 
19. Lemme 13.28. 
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13.2.7 Enveloppe convexe 


Définition 13.36. 


Un point a d’un ensemble convexe C' est un point extrémal si C\{a} est convexe. 
ThoBALmoQw 


Théorème 13.37 ([103]). 

Soit E un espace euclidien de dimension n > 1 et L(E) l’espace des opérateurs linéaires sur E sur 
lequel nous considérons la norme subordonnée à celle sur E. L'ensemble des points extrémaur 
de la boule unité fermée de L(E) est le groupe orthogonal Of(n, R). 


Démonstration. Nous notons B la boule unité fermée de £L(E). Montrons pour commencer que 
les éléments de O(n) sont extrémaux dans B. D'abord si À € O(E) alors |A] = 1 parce que 
|Ax| = [x]. Supposons maintenant que À n’est pas extrémal, c’est-à-dire qu'il est le milieu d’un 
segment joignant deux points (distincts) de la boule unité de L(E). Soient donc T,U € B tels que 
A = }(T +U). Pour tout x e E tel que |x| = 1 nous avons 


1 1 ï Eqk 
1 = Vel = Act = SIT e + Ual < S(ITæl + lUl) < STI + IUT) < 1 (3-00) 
Toutes les inégalités sont en réalité des égalités. En particulier nous avons 


ÎTæ + Ux| = |Tx] + ]Ux|, (13.91) 


mais alors nous sommes dans un cas d'égalité dans l'inégalité de Cauchy-Schwarz (théorème 11.1) 
et donc il existe À > 0 tel que Tx = AUx. Mais de plus les inégalité égalités (13.90) nous donnent 


= (IPel + IUæl) =1 (13.92) 
alors que nous savons que |Tx|,|]Ux|] < 1, donc |Tx] = |Ux| = 1. La seule possibilité est d’avoir 
À = 1. Nous avons prouvé que Tx = Ux pour tout x de norme 1. Nous en déduisons que T = U. 

Au final À n’est pas le milieu d’un segment dans B. 

Nous passons donc à l’inclusion inverse : nous prouvons que les points extrémaux de B sont 
dans O(E). Pour cela nous prenons U € B\O(E) et nous allons montrer que U n’est pas un point 
extrémal : nous allons l’écrire comme milieu d’un segment dans B. 

Par la seconde partie du théorème de décomposition polaire 13.32, il existe Q € Ofn,R) et 
SE ST(n, R) tels que U = Q$S. Nous diagonalisons S à l’aide de la matrice orthogonale P : 


S = PDP ! (13.93) 
avec D = diag(;). En termes de normes, nous avons 
IUT = 181 = D}: (13.94) 


En effet vu que Q est orthogonale, |[Ux| = |QSx| = |Sx| pour tout x, donc |[U] = |S|. De plus 
pour tout æ nous avons 


|Sx| = |PDP x] = |DP x]. (13.95) 
Étant donné que Pl est une bijection, le supremum des |Sx| sera le même que celui des | Dx| 
et donc |S|] = | D}. Étant donné que par définition |U| < 1, nous avons aussi |D| < 1 et donc 
0 < À; < 1 (pour rappel, les valeurs propres de D sont positives ou nulles parce que S est ainsi). 


Comme U # O(E), au moins une des valeurs propres n’est pas 1, supposons que ce soit A. 
Alors nous avons a, 8 € [—1,1] avec —1 < a < B < 1 et À = (a + B). Nous posons alors 


Di = diag(@, À2,...,Àn) (13.96a) 
D; — diag(B, X, cs À) (13.96b) 


20. Définition 11.51. 
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Nous avons bien D; Æ D2 et D; + D: = D. Par conséquent 


U = =(QPD:PT + QPD2P71) (13.97) 


Dir 


avec QPDP 1 £Z QPD; !, La matrice U est donc le milieu d’un segment. Reste à montrer que ce 
segment est dans B. Pour ce faire, prenons x € E et calculons : 


IQPDiP xl = |DiP al < | P' xl = [xl (13.98) 


parce que | D;| < 1 et P-{ est orthogonale. Au final la norme de QPD;P est plus petite que 1 et 
donc U est bien le milieu d’un segment dans B, et donc non extrémal. 


ThoVBzqUpy 
Théorème 13.38 ([416]). 
L’enveloppe convexe de O(n) dans M,(R) est la boule unité pour la norme induite de |.|2 sur R?. 


Démonstration. Nous notons B la boule unité fermée de M(n, R) et Conv (O(n,R)) l'enveloppe 
convexe de O(n,R). Vu que B est convexe nous avons Conv (O(n)) € B. 

Maintenant nous devons prouver l'inclusion inverse. Pour ce faire nous supposons avoir un 
élément À € B\Conv (O(n)) et nous allons dériver une contradiction. 

Remarquons que O(n) est compact par le lemme 13.28 et que par conséquent Conv(O(n)) est 
compacte par le corolaire 8.42 et donc fermée. Nous considérons un produit scalaire (X,Y) + 
X + Y sur M. Vu que Conv (O(n)) est un fermé convexe nous pouvons considérer la projection ?! 
sur Conv(À) relativement au produit scalaire choisi. 

Nous notons P = pro)j . ( ; (n) (A). En vertu du théorème de projection, nous avons 


(A-P)-(M-P)<0 Far p 60) 
pour tout M € Conv O(n). Notons B = A — P pour alléger les notations. L'équation (13.99) s'écrit 
B-M<B:P. FaRpr 380) 

D'autre part vu que B £ 0 nous avons B + B > 0, c’est-à-dire B : (A — P) > 0 et donc 
B'A>B:P. (13.101) 


En combinant avec (13.100), 


B-M<B-:P<B:A. ETES) 


Nous utilisons maintenant la décomposition polaire, théorème 13.32, pour écrire B = QS avec 
QE O(n) et SE S*(n,R). Vu que l'inégalité (13.102) tient pour tout M € Conv(O(n)), elle tient 


en particulier pour Q € O(n). Donc 
B:Q<B:A Sd 0 


Nous nous attachons à présent au produit scalaire (X,Y) — Tr(X!Y) de la proposition 12.123. 
D'abord 


B : Q = Tr(B!Q) = Tr(stQ'Q) = Tr(5*) = Tr(S), Fee 


et ensuite l'inégalité (13.103) devient 


Tr(S) < B : À = Tr(s‘Q'A). (13.105) 


21. Le théorème de projection : théorème 12.142. 
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Nous choisissons une basse {e;} diagonalisant $ : Se; = Xe; vérifiant automatiquement À; > 0 
parce que S' est semi-définie positive ?. Alors 


Et) < Tr(s* 0") (13.106a) 
= ÿ (5'Q Ae;, ei) (13.106b) 
= Ÿ'(Ae;, QSe;) (13.106c) 
< D |Ael| x] |Qeil (13.106d) 
… > À AeB= |Ae;] <1 (13.106e) 
= 2} (13.106f) 


Il faut noter que la première inégalité est stricte, et donc nous avons une contradiction. 


13.2.8 Décomposition de Bruhat 


ThoizlYJ0O 
Théorème 13.39 (Décomposition de Bruhat). 
Soit K un corps; un élément M € GL(n,R) s'écrit sous la forme 
M =T,P,T (13.107) 


où 1 et Tù sont des matrices triangulaires supérieures inversibles et où P, est une matrice de 
permutations © € S,. De plus il y a unicité de ©. 


Démonstration. Afin de rendre les choses plus visuelles, nous nous permettons de donner des 
exemples au fur et à mesure de la preuve. Nous prenons l’exemple de la matrice 


1.3: d 
2 5 6|. (13.108) 
D 7 & 


(1) Existence Soit M € GL(n,R); puisqu'elle est inversible, on à un indice ; maximum tel 
que M, 1 Æ 0. Nous changeons toutes les lignes jusque là, c’est-à-dire que nous faisons, pour 


1<i<u, 
Hoi ie Fe) 


Mi 
Voir le lemme 13.11(3). 


Nous avons donc obtenu une matrice dont la première colonne est nulle sauf la case numéro 
i1. L'opération (13.109) revient à considérer la multiplication par la matrice de transvection 


TO = Ty, (- .) (13.110) 
11 


pour tout à < 1. Pour rappel nous ne changeons que les lignes au-dessus de la à. Du 
l ices T() iangulai éri N donc 1 il 
coup les matrices T}” sont triangulaires supérieures. Nous avons donc la nouvelle matrice 


M: = (IL: _. dv) M pour laquelle toute la première colonne est nulle sauf un élément. 


Dans le cas de l'exemple, le « pivot » sera la ligne (2,5,6) et la matrice se transforme à l’aide 
de la matrice T1 = Ti2(—1/2) : 


| = O\ JT 5 4 0 1/2 1 

E Y 
o 1 oll25 61={2 5 6|. CEE 
CE LE. DE 


22. Définition 9.224. 
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— 


Maintenant nous faisons de même avec les colonnes (en renommant M la matrice obtenue à 


l'étape précédente) : 
M: : 
Ci, (13.112) 


GG Ts 
1 


Mi : . 
1") avec j > 1. Encore une fois ce 
Mi J 


qui revient à multiplier à droite par les matrices Ti;( 
La 


sont des matrices triangulaires supérieures. 


Dans l’exemple, pour traiter la seconde colonne, nous multiplions (13.111) à droite par la 
matrice T12(—5/2) : 


0 1/2 1\ /1 -5/2 0 0 1/2 1 
2 5 6llo 1 ol-{[2 0 6|. (13.113) 
0 7 8 0 0 1 0 7 8 
Appliquer encore la matrice T13(—6/2) apporte la matrice 
0 1/2 1 
2 O0 0. (13.114) 
0 7 8 


Enfin nous multiplions la matrice obtenue par 1 pour normaliser à 1 l’élément « pivot » 
#T 


que nous avions choisi. Dans notre exemple nous multiplions par 1/2 pour trouver 


0 1/4 1/2 
1 O0 0 |. FETE) 
0 7/2 4 


La matrice obtenue jusqu'ici possède une ligne et une colonne de zéros avec un 1 à leur 
intersection, et elle est de la forme 
M'= TMD (13.116) 


où 1 et T2 sont triangulaires supérieures et inversibles, produits de matrices de transvection 
(et d’une matrice scalaire pour la normalisation). 

Il reste à recommencer l'opération avec la seconde colonne (qui n’est pas toute nulle parce 
que le déterminant est encore non nul) puis la suivante, etc. Dans notre exemple de l’équation 
(13.115), nous éliminerions le 1/4 et le 4 en utilisant le 7/2. 

Encore une fois tout cela se fait à l’aide de matrices supérieures parce qu’à chaque étape, les 
colonnes précédent le pivot sont déjà nulles (sauf un 1) et ne doivent donc pas être touchées. 
À la fin de ce processus, ce qui reste est une matrice T MT" qui ne contient plus qu’un seul 1 
sur chaque ligne et chaque colonne, c’est-à-dire une matrice de permutations : P, = TMT" 


et donc 
M=T;1\{(T) 1. (13.117) 


Unicité 
Soient o,0 € S7, tels que T1P,T2 = S1P,$2 avec T; et S; triangulaires supérieures et inver- 
sibles. En posant T = 1253! et $ = T; !S;, nous avons 


PT = SP, (13.118) 


où S et T' sont des matrices triangulaires supérieures et inversibles. Par les calculs de la 
preuve du lemme 4.104, 

{ CRT | = Toi (x (13.119a) 

(SPr}xt = Sxr(; (13.119b) 


et donc 


Tip = Skr(- Fes men) 
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En écrivant cette équation avec & = o(i) (nous rappelons que © est bijective), 
Ta = Sr: (13.121) 


Nous savons que les termes diagonaux de T sont non nuls parce que T' est triangulaire 
supérieure et inversible (donc pas de colonnes entières nulles). Nous avons donc, en prenant 
i=l=K, 

0 £ Trr = So (k)r(R): (13.122) 


La matrice étant triangulaire supérieure, cela implique 


o(k) < r(k). FFE 


De la même manière en écrivant (13.120) avec 1 = r{{(i), 


Ski = To-1(kyr-1(i) (13.124) 
et donc 
'() < TT). (13.125) 
En écrivant cela avec k = a(j), nous avons j < 7-la(j) et en appliquant enfin 7, 
T(j) < o(j). (13.126) 


En comparant avec (13.123), nous avons © =. 


13.3  Sous-groupes du groupe linéaire 


LemOCtdiaE 
Lemme 13.40 ([103]). 
Soit V un espace vectoriel de dimension finie muni d’une norme euclidienne |.|. Soit K un compact 
convexe de V et G, un sous-groupe compact de GL(V) tel que 
u(K)cK (13.127) 


pour tout u € G. Alors il existe a € K tel que u(a) = a pour tout u € G. 


Démonstration. Avant de nous lancer dans la preuve, nous avons besoin d’un petit résultat. 


(1) Un pré-résultat 


Nous commençons par prouver que si vu € L(V) vérifie v(K) € K, alors v a un point fixe 
dans X. Pour cela nous considérons x € K et la suite 


LE. 
ir vi (æo). (13.128) 


Étant donné que K est convexe et stable par v, la suite (xx) est contenue dans X et ac- 
cepte une sous-suite convergente ” que nous allons noter To(n) AVEC D: N — N strictement 
croissante. Soit a € K la limite : 

lim D To(n) = A (13.129) 


n—>00 


Tant que nous y sommes nous pouvons aussi calculer v(xx) : 


RL 
V(Tg) = V e > vi) (13.130a) 


+ i=1 

nee. 

—_ + 
Fi >. (xo) (13.130b) 
TE) sais 


23. C’est Bolzano-Weierstrass, théorème 7.136. 
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— 


La norme |v*+l{(x6) — xo|| est bornée par le diamètre de K, donc en prenant la limite £ — oo 


le second terme de (13.130c) tend vers zéro. En prenant ces égalités en k = (n) et en prenant 
n — 0, nous trouvons 


v(a) = a, (13.131) 


c’est-à-dire le résultat que nous voulions dans un premier temps. 


Une norme sur V 


Nous passons maintenant à la preuve du lemme. D'abord nous remarquons que le groupe G 
agit sur V par u : x = u(x) et de plus, considérant la fonction continue 


a:G—V 


Re (13.132) 


nous voyons que les orbites de cette action sont compactes en tant qu’image par a du compact 
G (théorème 7.211). Nous posons 
v:V—R*t 


x max [u(x)|. 


(13.133) 


Cette définition a un sens parce que l’orbite {u(x) tel que u € G} est compacte dans V et 
donc l’ensemble des normes est compact dans IR et admet un maximum. De plus cela donne 
une norme sur V parce que nous vérifions les conditions de la définition 7.149 : 


(2a) Pour tout x,y € V nous avons : 


v(x + y) = max [u(x) + u(y)] < max (lu(x)| + lu(y)]) < v(x) +v(y). (13.134) 


(2b) Si v(x) = 0, alors l'égalité max [u(x)| = 0 nous enseigne que |u(x)| = 0 pour tout 
u € Get donc en particulier avec u = Id nous trouvons x = (0. 


(2c) Pour tout ÀeRet re V, 


(Xe) = max [u(Ax)| = max Jau(a)| = max [Au(r)| = AL). (13135) 


De plus la fonction v est constante sur les orbites de G. 


Un point fixe 


Pour tout u € G nous posons 
F, = {x e K tel que u(x) = x}; (13.136) 


par le pré-résultat, aucun de ces ensembles n’est vide. Ils sont de plus tous fermés par conti- 
nuité de w (le complémentaire est ouvert). Nous devons prouver que (ec Fu # @ parce 
qu’une intersection serait un point fixe de tous les éléments de G. Supposons donc que 
[ec F, = @. Alors les complémentaires des F, forment un recouvrement ouvert de K 
et nous pouvons en extraire un sous-recouvrement fini par compacité. Soient Lui}. les 
éléments qui réalisent ce recouvrement. Alors 


p 
Pie 26: (13.137) 
i=1 
Nous considérons l’opérateur 
12 
v=-) uwue£(V). (13.138) 
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Puisque X est convexe et stable sous chacun des u;, nous avons aussi v(K) € K et donc il 
existe a € K tel que v(a) = a. Pour ce a, nous avons 


le E P 
ut) LES 


2 Du (ui(a)) (13.139b) 
P i=1 

_ Ÿ ut) (13.139c) 
p i=1 

= y(a (13.139d) 


où nous avons utilisé la constance de z sur les orbites de G. Par ailleurs nous savons que 
v(a) = a, donc en réalité à gauche dans (13.139a) nous avons (a) et toutes les inégalités 
sont des égalités. Nous avons en particulier 


p p 

V 5 su) = >. v (u;(a)). FT ne) 

i=1 i=1 

Notons wo € G l'élément qui réalise le maximum de la définition de v pour le vecteur ÿ;; u;(a) : 
V ù sa) = |uo 5 sa) | < Ÿ luow(a)| < ,v(u(a)). (13.141) 


Mais nous venons de voir (équation (13.140)) que l’expression de gauche est égale à celle 
de droite. Donc les inégalités sont des égalités et en particulier la première inégalité devient 
l'égalité 


| D uou(a)| = > |uouw(a)|. (13.142) 
i i 
En vertu du lemme 11.13, il existe des nombres positifs À; tels que 
uoui(a) = Aauoua(a) = ... = Apuoup(a). (13.143) 
Du fait que uo est inversible nous avons aussi 
ui(a) = Aouo(a) = ... = Apup(a). FEAT) 


Mais par constance de sur les orbites nous avons v{u;(a)) = v(u;(a)) pour tout à et j; en 
appliquant v à la série d’égalités (13.144), nous trouvons que tous les À; doivent être égaux 
à 1. En particulier 

uw(a) = u(a) =... = u(a). (13.145) 


12 
a = v(a) = — 5 ui(a) = u;(a) (13.146) 
Pi 
pour n'importe quel j. Donc 
p 
ae (Fa, (13.147) 
i=1 


ce qui contredit notre hypothèse de départ. 


PropQZkeHeG 
Proposition 13.41 ([116, 103, 417)). 
Soit G un sous-groupe compact de GL(n,R). Alors 
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(1) Il existe une forme quadratique définie positive q sur R” telle que G € O(Q). 
(2) Le groupe G est conjugué à un sous-groupe de O(n,R). 


Démonstration. Nous considérons le (pas tout à fait) morphisme de groupe 


p: G — GL(S(n,R)) 


| ; (13.148) 
UE Puis U'SU, 
et tant que nous en sommes à considérer, nous considérons l’ensemble 
H = {M'M tel que M e G} © S(n,R). (13.149) 


Cet ensemble est constitué de matrices définies positives parce que si (MtMx,x) = 0, alors 0 = 
&Mx,Mx) = |Mx|, mais M étant inversible, cela implique que x = 0. Qui plus est, cet ensemble 
est compact dans GL(n, IR) en tant qu’image du compact G par l'application continue M + MtM. 
L'’enveloppe convexe X = Conv(H) est alors également compacte par le théorème 8.42. Enfin nous 
considérons L = p(G), qui est un sous-groupe compact de GL(S(n, R)) parce que Pypy = Pou € 
p(G). Nous remarquons que p,, étant linéaire, elle préserve les combinaisons convexes et donc pour 
tout u € G, pa(K) € K. 

Bref, L est un sous-groupe compact de GL(n,R) préservant le compact X de S(n,R). Par le 
lemme 13.40, il existe s € K tel que p,(s) = s pour tout u € G. Ou encore : 


ulsu = $ (13.150) 


pour tout u € G. Fort de ce s bien particulier, nous considérons la forme quadratique associée : 
q(x) = xtsx. Cette forme est définie positive parce que s l’est. Nous avons G € O(q) parce que si 
u € G alors 
t tt 
_ L L . 13.151 
qÜux) = (ux)‘sux = x° u'su x = q(x) (13.151) 
=S 
Le premier point est prouvé. 

La matrice s est symétrique et définie positive. Le théorème 9.221 nous permet donc de la 
diagonaliser en diag(A1,..., An) avec À; > 0, et ensuite transformée en la matrice 1, par la matrice 
diag(1/VX;). Nous avons donc une matrice a € GL(n, IR) telle que a!sa = 1,. Avec ça, si u € G, 
nous avons 


(a-lua)t(a-lua) = (a tua) ln(a ua) = atut(at) latsaa ua = atutsua = atsa = 1, (13.152) 


ce qui prouve que a lua est dans O(n,R), et donc que a {Ga c O(n,R). 
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Chapitre 14 


Tribus, théorie de la mesure, 
intégration 


14.1 Tribus 


Vous pouvez vous reporter au thème 23 pour voir plus vite où sont les définitions associées. 


14.1.1 Généralités 


Définition 14.1 (Tribu, espace mesurable[418]). 
Si ( est un ensemble, un ensemble À de sous-ensembles de ( est une tribu si 


(1) QE A; 
(2) AE À pour tout A € A; ItemooPEQNooYiYNtN 
(3) si (Aiien est une suite dénombrable d'éléments de À, alors (J,.n Ai € A. 


Le couple (Q, A) est alors un espace mesurable. 


Def jRsGSy 


Remarque 14.2. 
Nous trouvons parfois la notation 


U Az = Sup Ag. (14.1) 
kEN La 
LemBWN1KfA 
Lemme 14.3. 
Opérations ensemblistes sur les tribus. ITEMooTDXNooFszBzi 
(1) Une tribu est stable par intersections au plus dénombrables. ItemXQVLooFGBQN; 


(2) Une tribu est stable par différence ensembliste. 


Démonstration. Soit (A;);er une famille au plus dénombrable d'éléments de la tribu À. Nous devons 
prouver que (,-, À; est également un élément de A. Pour cela nous passons au complémentaire : 


le ( s) = [JCA. (14.2) 


icl iel 


iel 


La définition d’une tribu implique que le membre de droite est un élément de la tribu. Par stabilité 
d’une tribu par complémentaire, l’ensemble f,-, A; est également un élément de la tribu. 
La seconde assertion est immédiate à partir de la première parce que A\B = A nCB. 


Si (A;);er est un ensemble de tribus (indexé par un ensemble 7 quelconque) alors 


A=NA (14.3) 


iel 


est également une tribu. 
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14.1.2 Tribu engendrée 
DEFooJSAKooSDnGzt 


Définition 14.4. 
Soit D un ensemble de parties de Q. La tribu engendrée par D est l'intersection de toutes les 
tribus de Q contenant D. C’est la plus petite tribu contenant D. Nous la noterons le plus souvent 
o(D) 
LEMooCAUMooEdpjRs 
Lemme 14.5. 
Si (Q, A) est un espace mesurable et si À est une partie mesurable de Q, alors la tribu engendrée ! 
par À est 
o(A) = {9,A,CA,Q}. (14.4) 
DefNOJWooLGKhmJ 
Lemme-Définition 14.6 (Tribu engendrée[419]). 
Soit une application f: S1 — S2 et F une tribu de S1. Alors 


(1) L'ensemble 
F;={BC S2 tel que f (B)e F} (14.5) 
est une tribu sur So. 
(2) C’est la plus grande tribu de S2 pour laquelle f est mesurable. 


Cette tribu est la est la tribu engendrée par f. Elle sera souvent notée o(f). 


Démonstration. Vérifier les trois propriétés de la définition 14.1. 
(1) S2€ F parce que f71(52) = Si e Fr. 
(2) SiBe FF, alors nous prouvons que B° € F;. Nous avons f”-!(B) e F et donc f-(B)°e F. 


(e 


Pour conclure, il suffit de remarquer que f-!(B°) = f-1(By°. 
(3) Si(B;) e Fr, alors 


‘hs [U 5) = Ü f (Be Fr. (14.6) 


Donc Li B; E Fr. 


En ce qui concerne la maximalité, si R € S2 n’est pas dans F} alors f —I(R) n’est pas dans F et 


donc f ne serait pas mesurable. 


PropHYLooLg0OCy 
Proposition 14.7 ([120)). 
Soit S un ensemble et F une tribu de S. Soit une classe N° € P(S) telle que 


(1) Si AEN alors il existe Y EF NN tel que AC Y. 

(2) SiAëeN et BC A alors BEN. 

(3) La classe N est stable par union dénombrable. 
Alors la classe 


T={XVA avec AEN &XEF} (14.7) 


est une tribu. 


Démonstration. L'ensemble T est stable par union dénombrable parce que F et W le sont. De plus 
Set @ sont dans F et donc dans 7. Nous devons voir que 7 est stable par complémentarité. 

Soit donc Ae Net X € F; nous savons que (A 0 X})° = AA X°. De plus il existe Y EF NN 
tel que À € Y et nous pouvons exprimer A° en termes de Y : A° = YU (Y\A). Donc 


(AU XY° = (SU (P\A)) n X° = (Pen X)U ((Y\A) n X°). (14.8) 
eF eN 


Le fait que la seconde partie soit dans W est due au fait que ce soit une partie de Y e W. Nous 
avons donc bien (AU X)°e 7. 


1. Tribu engendrée par une partie, définition 14.4. 
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14.1.3 Tribu induite et engendrée 


DefDHTTooWNoKDP 
Proposition-Définition 14.8 (Tribu induite, tribu-trace[421]). 
Soit un espace mesurable (S,F) et une partie RE S. L'ensemble 
E NOQNooYId 
Fr={ANR tel que Ae F} M 29) 


est une tribu. Elle est la tribu induite de R depuis S. Elle est aussi nommée « tribu trace ». 


Démonstration. D'abord R et @ dont dans FR. Si C € FR alors C = ANR pour un certain À € F 
et nous devons prouver que À n C° est dans FR (le complémentaire de C' dans À). Nous avons 


RnC=Rn(AnRY=RNnAEFR (14.10) 
parce que À° € F. Enfin si C; € FR alors C; = R n À; pour des À; dans F. Nous avons 


UG=URr4)=Rrn((] 4, (14.11) 


ieN ieN ieN 


mais (J, 4; € F donc | J, Ci e Fr. 


PROPooUNNSooMUQKfp 
Proposition 14.9. 
Si R est mesurable dans (Q, A) alors 


Ar ={ANR tel que Ae A} = {SE À tel que SC R}, (14.12) 
où AR est la tribu induite de A sur R. 


Démonstration. La première égalité est simplement la définition (14.9) de la tribu induite. Pour le 
reste, nous notons F = {S € À tel que S € R}, et nous prouvons que Ar = F. 


(1) FcAr SiSeF, alors Se Aet SCR. Don S=SNnRE Ar. 


(2) FRE Ar Dans l’autre sens, si S € Ar, alors il existe À € À tel que S = An R. Donc S € À 
et S € À parce que R et À sont des éléments de À (stable par intersection). 


14.2 Théorie de la mesure 
BefBMWooëMMHàf 


Définition 14.10 ([422|). 
Une mesure extérieure sur un ensemble S est une application m*: P(S) — [0,1] telle que 


(4) m*(S) = 0, 
(2) Si AC B dans S alors m*(A) < m*(B) 


(3) Si les À, sont des parties de S alors 


m°({J A) < SE m°(4) Fa Mon yes 


neN neN 


ItemARKooppZfDaiii 


La différence avec une mesure est que nous ne demandons pas que (14.13) soit une égalité 
lorsque les À,, sont disjoints. 


14.2.1 Mesure sur un ensemble de parties 
DefWUPHooEk1LmR 


Définition 14.11 (Mesure sur un ensemble de parties[123]). 
Soient S un ensemble et C un ensemble de parties de S contenant @. Une mesure positive sur 
(S,C) est une application pu: C — [0,00] telle que 


(1) H(@) = 0, 
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(2) Si A, e C sont des éléments deux à deux disjoints dans C et tels que UJ, A, € C alors 


u( An) — » U(An). (14.14) 
0 n=0 


= 


La mesure est finie si u(S) < © et o-finie si il existe une suite (S,) dans C telle que S = UJ,, Sn 
Et (5h) < ©: 


Remarque 14.12. 
La condition ({) = 0 est nécessaire. Certes, si À € À nous avons 


A(A) = a(A 0 D) = (A) + (2) en VAE) 


parce que À et G sont disjoints. Cela semble indiquer que u({) = 0, mais pas tout à fait : il 
est encore possible d’avoir u(B) = © pour tout B € À, y compris 1() = o. À cause de cette 
exception, la relation (14.15) n'implique pas 4(@) = 0. 


Sans hypothèse sur l’ensemble de parties considéré, nous ne pouvons pas dire grand chose de 
plus. 


14.2.2 Mesure sur une algèbre de parties 
DefTCUoogGDud 


Définition 14.13 (Algèbre de parties[122]). 

Soit S, un ensemble. Une classe D de parties de S est une algèbre de parties de S si 
(1) SED et DeD, 
(2) si AeD alors A ED, 
(3) si A,B ED alors AU BED. 


14.14. 
En anglais, ce sont des field of sets[424]. 


Les algèbres de parties ne sont pas des classes si sauvages que ça ; en témoigne le lemme suivant. 
LemBFKootqXK1 


Lemme 14.15. 
Une algèbre de partie est stable par intersection (finie) et par différence ensembliste. 


Démonstration. Il suffit de remarquer que À n B = (AS U B°)° et que A\B = An Br. 


LemZQUooMdCpq 
Lemme 14.16 ([422]). 
Si D est une algèbre de parties de S et si est une mesure sur (S,D) alors 
(1) siA,B ED avec AC B alors u(A) < u(B) LtenMFUooWCPNnii 


(2) si A, e D et |), An € D alors 
a] Ar) < D u(A). (14.16) 
nm nm 
La propriété (2) est la o-sous-additivité. 
Démonstration. Si A € B alors B = A 0 (B\A) avec À et B\A disjoints donc 
u(B) = n(A) + n(B\A) > a(A). (1417) 
Pour la seconde, on passe par les compléments deux à deux : nous posons 


Bo = S (14.18a) 
Ba = An\ | J B4. (14.18b) 


k<n 
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Ces ensembles sont deux à deux disjoints et [),, B, = U],, An € D, donc 


((J An) = Lu An\ (] Br) < D H(An), (14.19) 


k<n 


où nous avons utilisé la première partie du lemme. 


ProplUOoobjfIB 
Proposition 14.17 (Mesure extérieure à partir d’une algèbre de parties[122]). 
Soient D une algèbre de partie sur l’ensemble S et j1 une mesure sur (S,D). Alors l'application 


a: P(S) — [0, +] 
x LE ta ) tel que A exe (JA) 


sur S et pour tout À € D nous avons L*(A) = (A). 


EqRNJo PRE Sff 


est une mesure extérieure ? 


Démonstration. En plusieurs parties. 


(1) La définition est bonne L'ensemble sur lequel l’infimum est pris n’est pas vide : il suffit 
de prendre À; = S et An>2 = @. 


(2) Le vide D'abord {*(@) = 0 parce que @ € D. Prendre ensuite À, = G. 


(3) u* est croissante Soit X € Y dans P(S). Si une suite (4,) dans D vérifie Y € |), An, 
alors la même suite vérifie X € [J, A». Par conséquent nous avons l'inclusion 


ru ) tel que À, enxelJa) c (ru, ) tel que À, enrc(Ja}, 


(14.21) 


et donc l'inégalité 1*(X) < u*(Y). 

(4) Inégalité par union dénombrable Soit (X,),en une suite de parties de $. Si il existe 
no tel que H*(X»,) = © alors nous avons automatiquement Ÿ,, u*(X,) = co et l’inégalité 
demandée est évidente parce que n’importe quel nombre est plus petit ou égal à oo. Nous 
supposons donc maintenant que H*(X,) < © pour tout n. 


Soit e > 0. Pour tout n > 1 il existe une suite (B() ken dans D telle que X, € |, pl) et 
€ 
pé(A) + 2 > DER”). (14:22) 
k 


Étant donné que 
Léel) (UE): (14.23) 


nous avons % 


€ 
“(Uxn) < XD BE) < Y (ut) + 5) = Dan) +e (14.24) 
nm nm 
Cette inégalité étant valable pour tout €, nous avons bien 


(04%) = Da (x). (14.25) 


(5) Restriction Soit À € D. Nous avons automatiquement 4*(A) < (A) parce que (A) est 
dans l’ensemble dont nous prenons l’infimum (prendre A; = À et Ay>2 = @). 


2. Définition 14.10. 
3. Nous utilisons la somme » 6, (1/2") = 1, proposition 11.122(2). 
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En ce qui concerne l'inégalité inverse nous considérons une suite À, dans D telle que À € 
Ü,, An. Étant donné que À e D et que D est une algèbre de parties nous avons À n 4, € D 
et U),(4 n Ah) = AE D. Par conséquent 


p(4) = H([J(4 n 43) < Xu(A n An) < Xn(An). (14.26) 


n 


Donc tous les éléments de l’ensemble sur lequel nous prenons l’infimum sont plus grands que 
(A). Nous en déduisons que u*(A) > u(A). 


14.2.3 Mesure sur une tribu, espace mesuré 


La définition suivante est une simple copie de la définition générale 14.11 d’une mesure sur un 
ensemble de parties. La seule différence est que l’union d’éléments d’une tribu est encore dans la 
tribu, et la condition (2) ne demande pas de le préciser. 


DefBTsgznn 
Définition 14.18 (Espace mesuré[123, 425]). 
Soit un espace mesurable* (Q, A). 
Une mesure signée sur (Q, A) est une application u: A — |—-,c] telle que 
(1) H(3) = 0, ItemQFjtOjxiii 


(2) 
u [Ü a) L > . Enook JHQooHTAYUS 
i=0 i=0 


si les À; sont des éléments de À deux à deux disjoints. 


La mesure signée 1 est une mesure positive si elle prend ses valeurs dans [0, |]. 

Lorsque 1 est une mesure positive, le triplet (Q, À, u) est un espace mesuré. 

Une mesure est o-finie si il existe un recouvrement dénombrable de ( par des ensembles de 
mesure finie. Si la mesure est o-finie, nous disons que l’espace (Q, A, u) est un espace mesuré 
o-fini. 

La mesure u sur Q est finie si 1{(Q) < 00. 


14.2.4 Mesures sigma-finies 
LEMooXOPMooMmIbmD 


Lemme 14.19 ([126|). 
Soient deux mesures o-finies® pu et À sur le même espace mesurable (Q, A). Il existe des parties 
mesurables ZA telles que 


(1) a(Zn) < © 
(8) A(Zn) < 0 
(3) Una Zn = ©. 
Nous pouvons de plus choisir ces Z, pour qu'ils soient disjoints. 
Démonstration. Le fait que les mesures soient o-finies donne des parties mesurables (X,) et(Yh) 
telles que H(Xn) < 00, A(YA) < 00, [J, Xn = U, Yn = 9. 


Pour chaque i, j € IN? nous posons Z;; = X; n Y:. Nous avons À(Z;;) < A(Y;) < co. De même 
(Zi) < u(Xi) < 0. Et enfin 


Uzi = in y) = (Un) = Ux:- Q. (14.28) 
1j n J 


i 


4. Les définitions de tribus et d'espaces mesurables sont en 14.1. 
5. Définition 14.18. 
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Comme IN? est dénombrable ©, nous considérons une bijection 4: IN — IN? et les ensembles 
Z; = Z(iy répondent à la question. 

En ce qui concerne la possibilité que les (Z;) soient disjoints, supposons qu’ils ne le soient pas. 
Alors il suffit de poser Z7, = X,\ LÉ Z, pour que les Z7, aient les bonnes propriétés tout en étant 
disjoints. 


14.25 Suite du texte 


14.20 ([1]). 
Dans le cas d’une mesure signée, y prend ses valeurs dans |—,c] et non dans [—00,] parce que 
nous ne voulons pas avoir des sommes contenant 00 — co. 

Notez aussi que la condition (14.27) interdit d’avoir, pour un a > 0 fixé, une infinité de parties 
disjointes de mesure plus petite que «. 


Si (Q,4,u) et (S,F,v) sont deux espaces mesurés, alors nous notons 
(9,4, Li) L (5, Ts v) (14.29) 


lorsque A CS, AC F et pour tout À € À, (A) = v(A). 

DefHGsQxHB 
Définition 14.21 (Ensemble mesurable). 
Les éléments de À sont les ensembles mesurables pour la mesure y. 


Si la mesure est o-finie, nous pouvons choisir le recouvrement croissant pour l’inclusion. En effet 
Si (En)nen est le recouvrement, il suffit de considérer F, = (J,<, Ex. Ces ensembles F, forment 
tout autant un recouvrement dénombrable, mais ils vont évidemment croissants. 

Le lemme suivant complète la propriété 14.18(2) lorsque les ensembles ne sont pas disjoints. 


LemPMprYuC 
Lemme 14.22 (Unions et différences ensemblistes dans un espace mesurable). 
Soit un espace mesuré (Q,F, u). ITEMooSUIRooNDVUoB 
(1) Soient À,B € F avec AC B. Alors 
u(B\A) = u(B) — a(A) (14.30) 
ITEMooLEGKoonYmlf 


(2) SiA,BE F avec AC B, alors 
u(4) < H(B). 


(3) SiA,B EF avec AC B, et si u(B) < ©, alors (A) < ©. 


en 
ITEMooMCNBooRGVGq 


ITEMooABPYo0oFQEzqE 
(4) Si (Mh) est une suite d'éléments de F pas spécialement disjoints, alors 


a(J6) < Fate) Ed op 


Démonstration. Point par point. 


(1) Pour (1) Nous décomposons B = A U (B\A) en remarquant que l’union est disjointe et 
que B\A € F par le lemme 14.3. La propriété (2) de la définition de mesure nous donne alors 


u(B) = a((B\A) A) = u(B\A) + n(4) (14.33) 
et donc ; 
A(B) = u(B\A) + u(4) Foot fe z 
comme demandé. 
(2) Pour (2) Il s’agit de reprendre (14.34) : 
EQooXGVQooRu 
A(A) = H(B) — u(B\A) < u(B). FEES) 
6. L'ensemble N est dénombrable par 1.128 et IN? l’est pas 1.131. 
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(3) Pour (3) Il s’agit de continuer (14.35) : 
(A) < u(B) < oo. (14.36) 
(4) Pour (4) Nous considérons la suite disjointe 


My = © (14.37a) 
Mi = Mn\Mi_. (14.37b) 


Nous avons [J, M} = U, My. Nous avons alors le calcul suivant : 
HW) = (JM) = D aQME) = D H(Ma\ ME 1) < D H(M). (14.38) 
k k k k k 


La dernière inégalité utilise le point (2). 


LemAZGByEs 
Lemme 14.23 (|1]). 


Résultats sur les unions croissantes d’ensembles mesurables dans (S, À, u). ItemJWUooRXNPci 


(1) Si (Ax) est une suite croissante d’ensembles u-mesurables dont l’union est mesurable, alors 


Jim (4x) = n([J A1). (14.39) 
k 


ItemJWUooRXNPcii 
(2) Soit Kn, une suite emboîtée d'éléments de À tels que Ky — S. Si À € À alors 


Jim u(AN Kh) = (A). (14.40) 

Démonstration. Pour prouver (1), nous faisons le coup de l’union télescopique, en posant A6 = G: 
00 00 

Ù] 44 = UJ(A4r\A4r). (14.41) 


Les ensembles Ax\Ax%_1 sont deux à deux disjoints, donc la propriété (2) de la définition d’une 
mesure donne 


al Ar) = 4h [Ü (a) (14.42a) 
k 


k=1 ci 
= à u(Ax\Ay 1) (14.42b) 

k=1 
EPA 

k=1 
= lim (A4) — #40) (14.424) 
= Jim u(A). (14.42e) 


où pour obtenir 14.42c, nous avons utilisé le lemme 14.22. 
Le point (2) est une application du point (1). 


Exemple 14.24. 
L'intégration « à la Riemann » n’est pas dans la théorie des espaces mesurés. En effet l’ensemble 


A = {AC [0,1] tel que L4 est intégrable au sens de Riemann} (14.43) 


n’est pas une tribu. Par exemple les singletons en font partie tandis que [0,1] n Q n’en fait pas 
partie bien que ce soit une union dénombrable de singletons. A 


14.2. THÉORIE DE LA MESURE 1187 


Définition 14.25. 
Si u est une mesure nous disons qu'une propriété est vraie u-presque partout si elle est fausse 
seulement sur un ensemble de mesure nulle. 


Par exemple la fonction de Dirichlet est presque partout égale à la fonction 1 (pour la mesure 
de Lebesgue). 


Définition 14.26 (fonction mesurable). 
Une application entre espace mesurés 


f: (0,4) = (0,4) (14.44) 


est mesurable si pour tout B € A!, l’ensemble f-!(B) est dans A. 


LemIDITgAy 
Lemme 14.27. 
Une union dénombrable de parties de mesure nulle est de mesure nulle. 


Démonstration. C’est une conséquence du lemme 14.22(4) : si les A; sont de mesure nulle, 


mn | a) < ÿ_ (Ai) = 0 (14.45) 


i=1 


Ken: 


6 
Il 


Définition 14.28. 
Si (An) est une suite croissante d’ensembles alors la limite est 


(we) 
lim An = (4. (14.46) 
i=0 


Si la suite est décroissante alors la limite est 


00 
lim 4, = (Ai. (14.47) 
i=0 


PropAFNPSsm 
Proposition 14.29 ([127)). 
Soient u une mesure sur ® et (S,) une suite croissante d’ensembles u-mesurables de Q. Nous 
notons 


= lim Sn: (14.48) 
Alors pour tout ensemble mesurable? A € ( nous avons 
u(A n S)= Jim u(A n Sn). (14.49) 


Démonstration. L'inégalité lim u(A n $,) < u(A n S) est simple à prouver. En effet pour tout n 
nous avons À NS, € AnS et donc par le lemme 14.22 nous avons 


U(A N Sn) < (ANS). (14.50) 
En passant à la limite (qui respecte les inégalités) nous avons l'inégalité. 
Nous passons à l'inégalité dans l’autre sens. 


(1) Si D'abord si u(A n S,) = © pour un certain n, alors cela vaut encore © pour tous les 
n suivants, et la limite est 0 sans problème. Donc nous supposons que {(A n $,) < © pour 
tout ne N. 


7. Définition 14.21 
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(2) Une petite hypothèse en plus Quitte à renommer les indices, nous supposons que So = 
SZ. 

(3) S comme union de différences Nous montrons à présent que S = [J,(Sh+1\83). Soit 
x € S. Il existe n > 0 tel que x € $,. Et vu que So = ©, il existe même un n > 0 tel que 
TÉ Sn et TE Sn+1. Autrement dit, pour tout x € S, il existe n > 0 tel que x € Sy+1\Sn. 


Nous avons donc bien 


= Ü (Sn+1\Sn) (14.51) 


Comme annoncé. 


(4) Un bon petit calcul Par conséquent 


AA: Ü Ho Ü 14456) (14.59) 
n=0 n=0 


Étant donné que les ensembles À À (S,:1\5,) sont disjoints, 


HAN S) = ÿ,u(An (Sn+1\Sn)) (14.53a) 

n=0 

= D a((4n San)\(An Sn) (14.53b) 
n=0 

= S (u(An Sur) — p(A n 5h) (14.53c) 
n=0 : 

= Jin An Su) HA AS) subeqpE if, 
n—> 00 Rs 

= lim 4(A n 8h). (14.53e) 


Dans ce calcul nous avons utilisé plusieurs fois le fait que les S, et A étaient mesurables (et 
la propriété de tribu qui dit que À n $, est également mesurable) ainsi que le lemme 14.22. 
Nous avons aussi utilisé la série télescopique dans R pour obtenir (14.53d). 


DefRECXooWwYgej 
Définition 14.30 (À-système[128]|). 
Soit E un ensemble. Un ensemble D de parties de E est un À-système lorsqu'il vérifie les condi- 
tions suivantes : 


(1) siA,BEeD avec AC B alors B\AED, 


(2) si (Ax)x>1 est une suite croissante d'éléments de D alors (J, Ar € D. 
Note : une tribu est un À-système. 


Lemme 14.31 ([428]). 
Une intersection quelconque de À-systèmes dans E est un À-système dans E. 


Démonstration. Soient {Di}er des À-systèmes indicés par un ensemble L. Si A,B€ ÎLE 1, Di alors 
B\A € D, pour tout ! e Let donc B\A € f., Di. De la même façon si (4;) est une suite croissante 
dans fe Pi alors pour tout ! € L nous avons | J, Ag € D. Donc {J, 4x € (y Di. 


Ce lemme est ce qui permet de définir le À-système engendré par une classe À de parties de 


E : c’est l'intersection de tous les À-systèmes de E contenant A. 
LemLUmopazZ 


Lemme 14.32 ([128|). 
Soit C une classe de parties de E (contenant E lui-même) qui soit stable par intersection finie. 
Alors le À-système engendré par C coïncide avec la tribu engendrée par C. 
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Démonstration. Nous notons £ le À-système engendré par C et F la tribu engendrée par C. Étant 
donné que F est un À-système nous avons € € F. Pour montrer l'inclusion inverse nous allons 
prouver que € est une tribu. 

D'abord pour C'E € nous posons 


Gc = {ACE tel que ANCEE}. (14.54) 


et pour F'EE, 
Hr = {AEE tel que An FEE}. (14.55) 


Nous allons montrer que Gc et Hr sont des À-systèmes et que Gc = Hp = €. 
Nous commençons par Gc. Si À, B € Ga avec À € B alors 


(B\A)nC=(BnC)\(AnC). (14.56) 
EE EE 


Puisque £ est un À-système et que (A n C) € (B n C), nous avons bien (B\A)nC'E € et donc 
B\A € Gc. Soit maintenant (A;) une suite croissante dans Gc. Nous avons 


( ÜU A)nC= Ü (Ar n C) (14.57) 


qui est une union d’une suite croissante d'éléments de €. Donc [JF (4, n C)Ee €, ce qui signifie 
que (JF, Àx € Go. Cela termine la preuve du fait que Go soit un À-système. 

Étant donné que C est stable par intersection finie, si X € C nous avons Cn KE C, ce qui 
signifie que À € Gc. Nous avons donc € € Ga. Donc Gc est un À-système vérifiant C EG EE. 
Mais comme € est le plus petit À-système contenant € nous avons en fait Go = €. 

Nous montrons à présent que Hr est un À-système. Si À, B € Hr avec À C B alors (B\A)nF = 
(BnF)\(AnF). Comme € est un À-système et que An F'et BnF sont dans € avec ANFE BnF, 
nous avons 


(BnF)\(AnF)eHr. (14.58) 


Soit maintenant (A;);>1 une suite croissante dans #{p. Pour tout k nous avons A4NFEE, ce qui 
donne 


(MadnF- lunes (14.59) 
k=i k=1 


Donc HF est un À-système vérifiant € € Hp € €. Nous en concluons que pour tout C'E C et pour 
tout FEEË, 
Gc = Hp =E. (14.60) 
Nous allons maintenant prouver que € est une tribu ®. 
(1) SiFEE alors ENF=FEE, ce qui signifie que E € Hp = €. 
(2) SiAE € alors F\AE € parce que € est un À-système et EE €. Donc(AEE. 


(3) Montrons que € est stable par union finie en considérant À, B € €. Comme E est également 
un élément de £ nous avons 


E\AUB)=(E\A4)n(E\B)ee€. (14.61) 


Cela prouve que C(A LU B) € €. Par complémentarité nous avons aussi AUBEE. 
Soient A4 € €, et nommons B, = A; LU ...U A,. Les ensembles B, forment une suite 
croissante d'éléments de €. L'union est donc dans € et ce dernier est, au final, stable par 
union dénombrable. 
Maintenant que € est une tribu nous avons F € € parce que F est la plus petite tribu contenant 
C. Nous en déduisons que € = F, ce qu'il fallait démontrer. 


8. Définition 14.1. 
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Le théorème suivant permet de prouver que la mesure de Lebesgue est l’unique mesure possible 


ayant les bonnes valeurs sur les intervalles (théorème 14.138). 
ThoJDY1sXu 


Théorème 14.33 (Unicité des mesures[128]). 
Soient 1 et v, deux mesures sur (E, A) et un ensemble € de parties de E telles que 


(1) La tribu engendrée par € soit A. 

(2) siA,BEË alors ANBEE 

(3) il existe une suite croissante (Eh) dans € telle que 
(3a) E = lim Ey, 
(3b) (En) et v(En) sont finis pour tout n. 


Alors si les mesures a et v coïncident sur €, elles coïncident sur À en entier. 


Démonstration. Soit (E,) une suite croissante dans € telle que E = lim Æ,,. 


(1) Des restrictions Nous considérons y, et 2A, les restrictions de y et v à Eh, c’est-à-dire 


Un(A) = u(AN En) (14.62a) 
vn(A) = v(An En). (14.62b) 


Puisque les E, sont dans € € À, ils sont mesurables au sens de w et v. Par la proposi- 
tion 14.29, pour tout À € € nous avons alors 


lim 4n(4) = 4(4) (14.632) 
Jim Vn(A) = v(A) (14.63b) 


(2) Ce que nous devons prouver Nous devons donc seulement montrer que pour tout À € À 
et pour tout n € N, un(A) = ”,(A). Pour cela nous nous fixons un n et nous considérons 
l’ensemble de parties 


D ={AE€ A tel que (A) = r(A)}. (14.64) 
Le but sera de prouver que D = A. 
(3) vn = lin sur € Soit AE €. Vu que FE, € €, par hypothèse À n FE, € € et donc 


Un(À) = H(AN En) (14.65a) 
= (A à E,) SUBaEQooUJDPo FOUR) 
— 1n(A). (14.65c) 


Pour (14.65b), nous avons utilisé l'hypothèse comme quoi 4 = v sur €. 


TR 
Æ 
nr 


Encore d’autres parties Nous définissons €’ = € LU {ÆE}. En particulier €’ € D. 


7 
Qt 
nr 


Un = Vn Sur €’ Nous avons déjà vue l'égalité sur €. Il suffit de vérifier l'égalité sur E. Vu 
que En E, = Ey € €, nous avons 


Un(E) = u(E Nn En) = U(En) = v(En) = v(En 0 E) = m(E). (14.66) 


(6) D est un À-système Montrons que D est un À-système. Soient À, B € D avec À € B. 
Alors, étant donné que les mesures y et 7, sont finies, le lemme 14.22 nous donne 


Un(B\A) = Hn(B) — Uin(A) (14.67a) 
MU Eee D: (14.67b) 


Donc un(B\A) = vh(B\A) et B\Ae D. 
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Soit par ailleurs une suite croissante (A;)x>1 d'éléments de D. Le lemme 14.23(1) nous donne 


p—0 


(U] Az) = lim (4). (14.68) 
k= 


Mais puisque pour chaque p nous avons un(Ap) = 7n(4»), nous avons aussi 
Le] Le] 
n((] 49) = 2n((] An). (14.69) 


Donc D est bel et bien un À-système contenant €’. 


(7) Conclusion Par le lemme 14.32, le \-système engendré par €’ est égal à la tribu engendrée 
par €’, mais par hypothèse la tribu engendrée par € est À, donc le À-système engendré par 
E’ est À. Comme D est un À-système contenant €”, nous avons alors À € D et donc À = D, 
ce qu'il fallait. 


ExDMPoohtNA; 
Exemple 14.34. 
La partie € des intervalles de R de la forme ]|a, b[ engendre les boréliens par la proposition 7.130. 
Par conséquent pour vérifier que deux mesures sont égales sur les boréliens de R, il suffit de prouver 
qu’elles sont égales sur les intervalles ouverts. A 


14.2.6 Mesure extérieure 


Nous avons déjà défini la notion de mesure extérieure en la définition 14.10. 


LemULSooBgZLT 
Lemme 14.35 ([122)). 
Soit (S,F,u) un espace mesuré et X € S. Alors 
PE = inf Era ) tel que AE F,XcC Ja} (14.70) 
€ 


Démonstration. Pour montrer l'inégalité >, nous remarquons qu’il y a plus d'éléments dans l’en- 
semble du second membre que dans le premier. En effet si À € F avec X € À alors dans le membre 
de gauche nous pouvons prendre À; = À et Ay>1 = @. 

Pour l'inégalité dans l’autre sens, nous montrons que tout élément de 


ras au 4,7 xe(Jail ExPRAo RER 


est plus grand qu’un élément de 
{u(A) tel que Ae F,X € A}. EqYNMoR TES 


En effet si 4, € F avec X © |], A4 alors en posant À = [J, 44 nous avons À € F avec X © À 
ainsi que p(A) < ÿ,, H(An). Cela prouve que l'élément ÿ,, u(4») de (14.71) est plus grand que 
l’élément u(A) de (14.72). 


14.36. 

La proposition 14.37 pourrait être vue comme un cas particulier de la proposition 14.17 en uti- 
lisant 14.35. Nous en donnons cependant une preuve directe, qui est presque identique à celle 
de 14.17, mais avec une ou deux simplifications. 
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PropFDUooVxJaJ 
Proposition 14.37 ([122]). 
Soit un espace mesuré (S,F,u) et l'application 
*: P(S) — [0,00 
pu: P(S) —> [0, co] . 


X + inf{u(A) tel que AE F,X © A}. 


Alors u* est une mesure extérieure sur S et sa restriction à F est égale à ju. 


Démonstration. Notons que la définition est bonne parce que l’ensemble sur lequel l’infimum est 
pris n’est pas vide : considérer À = S$. 


(1) Le vide D'abord x*(@) = 0 parce que DEF. 
(2) u* est croissante Soit X € Y dans P(S). Si Y € À alors X € À, donc 


— 


— 


inf{u(AÀ) tel que AE F,X € A} < inf{u(A) tel que Ae F,Y € A}, (14.74) 


ce qui signifie que H*(X) < p*(Y). 

Inégalité par union dénombrable Soit (X,),eN une suite de parties de S. Si il existe 
no tel que H*(Xn,) = © alors nous avons automatiquement ÿ,, u*(X,,) = c et l'inégalité 
demandée est évidente parce que n’importe quel nombre est plus petit ou égal à wo. Nous 


supposons donc que L*(X,) < © pour tout n. 
Soit e > 0 et par définition pour chaque n, il existe un À, € F tel que X, € À, et 
U(An) < H*(Xn) + %. Bien entendu nous avons 


Lester (14.75) 


Nous en déduisons que 


BJ X») < 4((] An). (14.76) 
Mais (S,F,u) étant un espace mesuré, 


BJ Ar) < D u(An 


n 


— 


(14.77) 


Au final nous avons les inégalités 


H*([]JX») < #((] An) (14.78a) 


< ÿ H(An) (14.78b) 
< D (Xn) +eN = (14.78c) 
= >, MAÉ E (14.78d) 


Ceci étant vrai pour tout €, 


B*(]Xn) < DH (Xn), (14.79) 


ce qui prouve que {* est une mesure extérieure. 


Restriction Supposons que X € F. Alors si X € À nous avons u(X) < (A); mais en 
même temps, 1(X) est dans lPinfimum qui définit u*(X) donc 


u*(X) < u(X) < inf{u(À) tel que Ae F,X € A} < u(X) < p*(X). (14.80) 


Donc nous avons égalité de tous les éléments de cette chaine d’inégalité. 
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DefTRBoorvnUY 

Définition 14.38. 
Soit S un ensemble et m* une mesure extérieure sur S. Une partie À € S est m*-mesurable si 
pour tout X CS, 

m°(X) = m*(X n A) +m*(X n A. (14.81) 
Remarque 14.39. 
L’inégalité 

m*(X) <m*(X n À) +m*(X n A°) (14.82) 
étant toujours vraie, pour prouver qu’un ensemble est m*-mesurable, il est suffisant de prouver 
l'inégalité inverse : 


mÉ(X) > m*(X n A) + m*(X n A°) (14.83) 


La définition 14.38 est motivée par la proposition suivante. 
Prop0JFoozSKAE 
Proposition 14.40. 
Soit un espace mesuré (S,F,u) et u* la mesure extérieure qui va avec. Alors tous les éléments de 
F sont L*-mesurables. 
En d’autres termes, pour tout À € F et tout X € S nous avons 


U*(X) = LË(X n À) + u*(X n A‘). (14.84) 
Démonstration. Puisque X = (X n A) U (X n A°), et que u* est une mesure extérieure, 
(XX) < LË(X n À) + u*(X n A‘). (14.85) 


Nous devons montrer l'inégalité inverse. 
Soit BE F tel que X € B. D'une part nous avons *N AC BRAEF, donc 


E*(X n À) < L*(B n À) = u(B n À). (14.86) 
Et d’autre part, X n AC BAnhAEF, donc 
u°(X n À) < u(B n À‘). (14.87) 
En rassemblant, 
(XNA) +u(X n A) <u(BnA)+u(BnA)=n(B) "TPS 


La dernière égalité vient du fait que B n À et B A A° sont disjoints et que u est une mesure. 
L’inégalité (14.88) étant vraie pour tout B € F tel que X € B, elle est encore vraie pour l’infimum : 


U*(X n À) + H*(X n A°) < inf{u(B) tel que BE F,X € B} = *(X). (14.89) 
Nous avons donc prouvé que 


(XNA) + p*(X n A°) < p'(X). (14.90) 


Remarque 14.41. 

Notons la duplicité du vocabulaire. Les ensembles u-mesurables sont les éléments de F, qui sont à 
priori les seuls sur lesquels y est calculable , alors que les x*-mesurables sont les parties de S qui 
vérifient une certaine propriété (et 1* est calculable sur toutes les parties de S). 


9. « calculable » au sens où y y vaut un nombre bien défini; après, que ce soit facile ou pas à calculer dans la 
pratique, c’est une autre histoire. 
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14.3 Applications mesurables 


14.3.1 Propriétés 
DefQKjDSeC 


Définition 14.42 (Fonction mesurable). 
Soient (E, A) et (F,F) deux espaces mesurés. Une fonction f: E — F est mesurable si pour tout 


OEF, l’ensemble f-(O) est dans A. 
PROPooEFHKooARJBw\W 


Proposition 14.43. 
Soient (Si, F;) (i = 1,2,3) des espaces mesurables et des fonctions mesurables f: S$1 — S2 et 
g: S2 — S3. Alors la fonction go f: S1 — S3 est mesurable. 


Démonstration. Soit B € F3. Alors 


(of) (B)=f "(9 "(Be f (BR) A. (14.91) 


14.3.2 D'une tribu à l’autre 
LemooVDXJooZNYelH 


Lemme 14.44 ([419]). 
Soit une application f: S1 — S2 et une tribu F2 sur S2. Alors f (PR) est une tribu sur Si 


Démonstration. I] faut prouver les trois propriétés de la définition 14.1 d’une tribu. 
(1) D'abord f est définie sur tout S1, donc f-1(S2) = Si alors que S2 € F2. 
(2) Soit Aëe f (F2), c'est-à-dire À = f-!(B) pour un certain B € F2. En ce qui concerne le 
complémentaire : 


A° = FT (BY = S\f 7" (B) = FT (S2\B) = (8°). (14.92) 
(3) Si (A;)sen sont des éléments de f-1(F2) avec À; = f-!(B;) alors 
BE’ : UF "(8) = f([UB). (14.93) 


Ce qui est dans la dernière parenthèse est dans F2 parce que cette dernière est une tribu. 


Le lemme suivant est également nommé « lemme de transfert ». 


LemOQTBooWGYuDU 
Lemme 14.45 (Lemme de transport). 
Soit f: S1 — S2 une application et une classe C de parties de S2. Alors 
(FT (C)) = f"(o(C)). (14.94) 


Démonstration. Puisque o(C) est une tribu dans S2 alors le lemme 7.6 dit que f-!(o(C)) est une 
tribu qui contient en particulier f-1(C). Nous en déduisons que o(f-1(C)) = f-!(o(C)). 
Réciproquement. Dans $; nous avons la tribu o( FO). Nous pouvons alors considérer la 
tribu 
F;={Bc S5 tel que f”!(B) e o(f”!(C))}. (14.95) 


Montrons que € € F4. Lorsque B € € nous avons f”1(B) e f-1(C) € o(f7!(C)). Du coup Be F4. 
Nous avons alors, en passant aux tribus engendrées : 


(Ce a(Fs) = FF. (14.96) 
Si maintenant B € a(C), nous avons f-!(B)e ol AC): ce qui signifie que 


F7 ((C)) € of (C)). (14.97) 
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Le théorème suivant est important pour prouver qu’une application est mesurable. En effet, il 
permet de ne tester si une application n’est mesurable uniquement que sur une partie génératrice 


de la tribu d'arrivée 10. 
ThoECVAooDUxZrE 


Théorème 14.46. 
Soient des espaces mesurables (S1,F1) et (S2, F2) ainsi qu'une application f : S1 — S2. Si il existe 
un ensemble de parties C de S2 tel que 


— o(C) = F2 
— f-1(B)e F1 pour tout Be C 


alors f est mesurable. 


Démonstration. Par hypothèse, o(C) = F2 et f-1(C) € F1 et nous pouvons utiliser le lemme de 
transfert 14.45 : 


o(f 7" (C)) = FT (o(C)) (14.98) 
qui s'écrit ici 
o(f"(C)) = F(P2). (14.99) 


Mais comme f-1(C) € F1, nous avons aussi o(f”!(C)) € Fi, ce qui signifie que 


f me”. (14.100) 


Cela est exactement le fait que f soit mesurable. 


14.4 Tribu borélienne 


14.4.0.1 Définition 
DEFooQBQGooTaqGdtY 


Définition 14.47 (Tribu borélienne). 

La tribu des boréliens, notée Bor(R‘) est la tribu engendrée par les ouverts de R{. Plus généra- 
lement si Y est un espace topologique, la tribu des boréliens est la tribu engendrée par les ouverts 
de Y. 


PROPooYEkvbWBz 
Proposition 14.48. 
La tribu engendrée par une base dénombrable de la topologie est celle des boréliens. 


Démonstration. Si une base de topologie est donnée, tout ouvert peut être écrit comme union 
d’élément de la base, proposition 7.2. Dans le cas d’une base dénombrable, cette union sera forcé- 
ment dénombrable. Une tribu étant stable par union dénombrable, tout ouvert est dans la tribu 
engendrée par la base de topologie. Les autres boréliens suivent automatiquement. 

Dit avec plus de lettres et moins de phrases, si D est une base dénombrable de la topologie de 
X, et si O est un ouvert de X, nous avons © = | J}?, À; avec À; € D. Puisqu’une tribu est stable 
par union dénombrable {!, nous avons © € (D). En conséquence, Bor(X) € o(D). 

Mais comme D € Bor(X) l'inclusion inverse est automatique. D'où l'égalité Bor(X) = o(D). 


14.4.0.2 Les boréliens de R 


Nous rappelons que la topologie de R est celle des boules donnée par le théorème 7.109. Nous 
rappelons (voir la proposition 7.130 et sa preuve) que les boules ouvertes de la forme B(q,r) avec 
q,r € À forment une base dénombrable de la topologie de R. 


10. Typiquement les ouverts pour les boréliens. 
11. Définition 14.1(3) 
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LemZXnAbtl1l 
Lemme 14.49. 
Soit {qi} une énumération des rationnels. La tribu engendrée par les ouverts o; = |qi, |] est la 
tribu des boréliens. 


Démonstration. Si a < b dans Q alors 04\0y = Ja, b]. Ensuite 


1 
U] 5a\0s_1 = (]J Jab-=]= Ja. (14.101) 
ñ n 
neN* neN* 
Par union dénombrable, tous les intervalles ]a, b[ avec a,b € Q sont dans la tribu engendrée par 
les o;. Ces boules ouvertes forment une base de la topologie de R par la proposition 7.130 et la 
proposition 14.48 conclut. 


Exemple 14.50. 
Les singletons sont des boréliens de R parce que 


{x} = (150,21 U Je, +oo[) (14.102) 


Puisqu'une tribu est stable par union dénombrable, l’ensemble Q est un borélien de R. Et 
comme les tribus sont stables par différence ensembliste (14.3(2)), l’ensemble des irrationnels est 
un borélien de R. PA 


14.4.0.3 Diverses expressions 
LEMooUPYDooPVjiscA 


Lemme 14.51. 
Soient un espace topologique X et un borélien B de X. Nous considérons sur B la topologie in- 
duite!? de X et les boréliens Bor(B) correspondants. Nous avons : 


Bor(B) = {A € Bor(X) tel que AC B}={Bn A tel que AE Bor(X)}. (14.103) 
En particulier, EQooEUNVOOCBU: 
Bor(B) = Bor(X)p. 2101) 
Démonstration. L'égalité 
{A € Bor(X) tel que AC B} = {B n À tel que À € Bor(X)} (14.105) 


est déjà dans la proposition 14.9. 
Nous démontrons maintenant que 


Bor(B) = {An B tel que À € Bor(X)}. (14.106) 


Pour ce faire, nous nous rappelons du lemme de transport 14.45. Soit l'injection canonique f: B — 
X ; pour tout AC X nous avons f-1(4) = An B. 

Nous considérons la classe 7 des ouverts de X. Par définition de la topologie induite, les ouverts 
de B sont les éléments de f-!(T). Donc 


o(f7!(T)) = Bor(B). (14.107) 
Mais d’autre part, 
fr! (o(T)) = {An B tel que À € Bor(X)}. (14.108) 
Donc le lemme de transport 14.45 nous dit que 
Bor(B) = o(f7!(T)) = f-'(o(T)) = {An B tel que A € Bor(X)}. (14.109) 


Pour finir, l'égalité (14.104) se démontre : 
Bor(X)8 = {B n À tel que À € Bor(X)} = Bor(B). (14.110) 


12. Définition 7.24. 
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14.4.1 Applications continues et boréliennes 
DefHHIBooNrpQjs 


Définition 14.52 (Fonction borélienne). 
Une application f : (0, A) — (R4, Bor(R‘)) © est borélienne si elle est mesurable, c’est-à-dire si 
pour tout B € Bor(R‘) nous avons f-!(B) € A. 

Si rien n’est précisé, une application entre deux espaces topologiques est borélienne lorsqu'elle 
est mesurable en considérant la tribu borélienne sur les deux espaces. 


Si À est une tribu sur un ensemble E, nous notons m(A) l’ensemble des fonctions qui sont 
A-mesurables. 

Le plus souvent lorsque nous parlerons de fonctions f: X — Y où Ÿ est un espace topolo- 
gique, nous considérons la tribu borélienne sur Y. Ce sera en particulier le cas dans la théorie de 
l'intégration. 

Le théorème suivant est très important parce qu’en pratique c’est souvent lui, en conjonction 


avec la proposition 14.122 qui permet de déduire qu’une fonction est borélienne. 
ThoJDOKooKaaiJh 


Théorème 14.53 ([419]). 
Soient X et Y deux espaces topologiques. Alors toute application continue f: X — Y est boré- 
lienne !#. 


Démonstration. Pour vérifier que f est borélienne, nous devons prouver que f-!(B) est borélien 
pour tout borélien B de Y. Heureusement, le théorème 14.46 nous permet de limiter la vérification 
aux B appartenant à une classe engendrant les boréliens de Y. 

La classe en question est toute trouvée : ce sont les ouverts. Si © est un ouvert de Ÿ alors 
f-!(O) est un ouvert de X et donc un borélien de X. 


Le théorème suivant donne une importante compatibilité entre l’induction de tribu et l’induc- 
tion de topologie : la tribu induite à partir des boréliens sur un sous-espace topologique est la tribu 


des boréliens pour la topologie induite. 
ThoSVTHooChgvYa 


Théorème 14.54 ([419]). 
Soit X, un espace topologique et Y € X une partie munie de la topologie induite. Alors 


Bor(Y) = Bor(X)y (14.111) 


où Bor(X y est la tribu sur Y induite de Bor(X) par la définition 14.6. 


Démonstration. Nous notons 7x et Ty les topologies de X et Y. 


(1) Bor(Y) € Bor(X)y Si AE 7ry alors À = Y n Q pour un { € rx. Mais puisque Q est un 
ouvert de X, il est un borélien de X, ce qui donne que Y n Q est un élément de Bor(X)y. 
Cela prouve que Ty € Bor(X}y, c’est-à-dire que Bor(X)ÿ est une tribu sur Ÿ contenant les 
ouverts de Y. Nous avons donc 


Bor(X) € Bor(X)y. (14.112) 


(2) Réciproquement L'application Id: (Y,ry) — (X,Tx) est continue parce que si Q est 


ouvert de X alors Id 1{(Q) = An Y € ry. Par conséquent l'identité est une application 
borélienne (théorème 14.53), ce qui signifie que Id_! (Bor(X)) € Bor(Y), ou encore que si 
B € Bor(X), alors Id_!(B) = BnY e Bor(Y). Cela signifie que 


Bor(X)y € Bor(Y). (14.113) 


13. Tribu des boréliens, définition 14.47. 
14. Définition 14.52. 
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CorooMJQYooFfwoTd 
Corolaire 14.55. 
Si U est un borélien de l’espace topologique X, alors les boréliens de U sont les boréliens de X 
inclus dans U : 


Bor(U) = {B € Bor(X) tel que BE U). (14.114) 


Démonstration. Si B' € Bor(U), le théorème 14.54 donne un borélien B € Bor(X) tel que B' = 
B nU. Mais U étant borélien de X, l'intersection B n U est encore un borélien de X. 


Ce corolaire s’applique en particulier lorsque U est un ouvert. 
La proposition suivante montre comment il est possible de construire un espace mesuré à partir 
d’une bijection avec un espace mesuré déjà connu. Attention cependant : la mesure construite dans 


cette proposition n’est pas celle qui est le plus adapté. Voir la proposition 14.292 et le blabla 14.293. 
PROPooXQHTooUxJoyq 


Proposition 14.56. 

Soient un espace mesuré (Q, A, 1), un ensemble ® et une bijection w: Q — Q. Nous posons 
(1) A = p(A), 
(2) w(B) = n{pg"{(B)) pour tout B € A. 


Alors (Q/,.4',y/) est un espace mesuré. 


Démonstration. En plusieurs points. 


(1) 4’ est une tribu Il faut vérifier les différents points de la définition 14.1. D'abord, puisque 
Q € À, nous avons (/ = (Q) € A4’. Pour le complémentaire, si B € À’ alors B = (A) pour 
un certain À € A. Comme À est une tribu nous avons alors (\A € À et donc w(Q\A) € A’. 
Mais comme v est bijective, 


p(A\A) = \y(4) = 0/\B. (14.115) 


Le complémentaire de B est donc bien dans 4’. Pour la troisième condition, soient B; € À’. 
Pour chaque à, il existe À; € À tel que B; = p(A;). Nous avons | J, 4; € À, donc 


U: = UÜvtas) = e(U4:) E À. (14.116) 


Nous avons fini de prouver que ((/,.4’) était un espace mesurable. 


(2) x’ est une mesure positive D'abord #'(@) = u(y7(@)) = u(@) = 0. Ensuite si les À; 
sont disjoints dans 4’ nous avons 


p'( UA) = ji feÜ si) = ji [U Fa) = Due" "(4) = D (A). (14.117) 


i i=0 


PROPooIKYYooCFaDal 
Proposition 14.57. 
Soit une bijection continue d’inverse continue w: Q — Q. Alors 


p(Bor(Q)) = Bor(Q’). (14.118) 
Démonstration. Si À € Bor({/), alors À = (#7 !(A)) € w(Bor(Q)) parce que w est continue et 


donc borélienne (proposition 14.53). Le même raisonnement fonctionne dans l’autre sens parce que 
nous avons supposé que Y est continue et d’inverse continu. 


14.4. TRIBU BORÉLIENNE 1199 


14.4.2 Tribu de Baire 


Définition 14.58. 
Une partie d’un espace topologique est rare si elle est contenue dans un fermé d'intérieur vide. 
Une partie est maigre si elle est réunion finie ou dénombrable de parties rares. 


Exemple 14.59. 


L'ensemble Q dans R est maigre mais n’est pas rare parce que Q = R. A 
PROPooCHTWooZFiSMf 
Proposition 14.60 ([120)). 


Soit X un espace topologique. L'ensemble de parties !° 
Ba(X) = {B L À avec B borélien et A maigre} (14.119) 
est une tribu. Elle est appelée la tribu de Baire de l’espace X. 


Démonstration. Nous allons montrer que les boréliens et les maigres vérifient les conditions de la 
proposition 14.7. 


(1) Si À est maigre, il s'écrit comme A = {J,.ù À; où les R; sont rares. Il existe donc des 
fermés d'intérieur vide F; tels que R; € F;; en particulier À € {]; F;. En tant que fermés, 
F; e Bor(X) ; de plus chaque F; est rare, donc []; F; est maigre. L'ensemble À est donc bien 
contenu dans un ensemble maigre et borélien. 


(2) Soit À maigre et B € À. Nous avons, avec les mêmes notations, À = Ü), R; et B = {UJ;(R;nB). 
Les ensembles R;n B sont encore rares, donc B est une union dénombrable d’ensembles rares. 
L'ensemble B est donc maigre. 


) 


(3) Si les ensembles (4;) sont maigres, alors ils sont unions dénombrables de rares : A; = UJ, RÈ . 
Nous avons alors 
és LU 8% (14.120) 
î (iH)EN? 


et donc |), À; est encore une union dénombrable d’ensembles rares. 


PropGRHootvAWq 
Proposition 14.61 ([120]). 
Une partie B de l’espace topologique X est dans la tribu de Baire de X si et seulement si il existe 
un ouvert U tel que BAU est maigre. 


Démonstration. Nous définissons la relation d'équivalence !° 


A - B si et seulement si AAB est maigre. 
(1) Réflexive Nous avons AAA = @, donc À - À. 


(2) symétrique Nous avons AAB = BAA, donc - est symétrique. 


suivante sur P(X) : nous disons que 


(3) transitive Si À, B,C sont des parties de X alors nous avons toujours 
AACCE(AUBUC)\(AnBnC) = (AAB) 0 (BAC). (14.121) 


Donc si À - Bet B < C' alors AAC est contenu dans une union de maigres et est donc 
maigre. 


(4) Autres propriétés de — De plus la relation d'équivalence —< vérifie À — B si et seulement 
si A° + B°, par le lemme 1.30(1). 
Pour compléter les propriétés de — mentionnons encore le fait que si F est fermé alors 
F < Int(F). En effet FUInt(F) = Fet Fnlnt(F) = Int(F), de telle sorte que FAInt(F) = 
F\Int(F). Cet ensemble est un fermé parce que son complémentaire est F° 0 Int(F) qui est 
une union d’ouverts. De plus F € Int(F) est d'intérieur vide, de telle sorte qu’il est rare et 
donc maigre. 


15. Pour rappel, la tribu borélienne est définie en 14.47. 
16. Définition 1.31 
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Pour la suite de la preuve nous posons 
F = {AC X tel que il existe un ouvert U avec U + A}, (14.122) 


et nous devons prouver que F = Ba(X). 


(1) Fc Ba(X) 
Soit AE F et un ouvert U tel que U + À. Alors nous posons M = UAA qui est maigre. En 
vertu du lemme 1.30(2), nous avons 


À = MAU = (M UU)\(M nU), (14.193) 


ce qui prouve que À est dans la tribu engendrée par les ouverts et les maigres, laquelle tribu 
est contenue dans Ba(X). 

Ba(X)cF 

Nous allons montrer que F est une tribu contenant tous les ouverts et tous les maigres. Alors 
en particulier F contiendra Ba(X). Si U est ouvert, U - U et donc U € F. Si M est maigre, 
alors M - G et donc M € F. Il reste à prouver que F est une tribu. 

(2a) Vide et tout l’ensemble C’est facile : G et X sont dans F. 


(2b) Comlémentaire Commençons par nous souvenir que F + Int(F) dès que F est fermé. 
Si AE F alors il existe un ouvert U tel que À -< U et donc aussi A° < Uf. D'autre part 
U° est fermé, donc U° + Int(U°), donc 


TS 
ND 
nr 


A6 Ve In), (14.124) 


ce qui implique que AE F. 
(2c) Union dénombrable Soit 4, € F et M, = AyAU, avec M, maigre et U, ouvert. 


Nous allons prouver que 
[Ar = (JU. (14.125) 
nm nm 


Pour cela il faut remarquer que 


(U4)A(Utx) c | JA AU) = UM. (14.126) 


Le terme le plus à droite est maigre, ce qui signifie que celui le plus à gauche est contenu 
dans un maigre et donc est maigre lui-même. 


Proposition 14.62. 
Si B est un borélien de X, alors il existe un ouvert U et un maigre M tels que 


(1) BAU est maigre, 
(2) MAU = B, 
(3) BAM est ouvert. 


Démonstration. Puisque B est borélien, il est aussi dans la tribu de Baire et il existe par la 
proposition 14.61 un ouvert U tel que M = BAU est maigre. En prenant ce Ü et ce M, les trois 
conditions sont vérifiées parce que 


MAU = (BAU)AU = B (14.127) 


et 
BAM = MAB = (UAB)AB = U. (14.128) 


Tout ceci par le lemme 1.30(2). 


14.5. ESPACE MESURÉ COMPLET 1201 


14.5 Espace mesuré complet 


14.5.1 Partie négligeable 
DefAVDoomkuXi 


Définition 14.63. 
Soit un espace mesuré (X, À, 1). Une partie N de X est négligeable pour y si il existe Y € À tel 
que N'EY et u(Y) = 0. 

LemVKNoo0COQw 
Lemme 14.64. 
L'ensemble des parties négligeables est stable par union dénombrable. 


Démonstration. Si les ensembles N,; sont négligeables, alors pour chaque À nous avons Y; € À tel 
que N; € Y; et u(Y;) = 0. Alors bien entendu |), N; € (); Yi et en utilisant (14.32), 


#(UY) < DH) = 0. (14.129) 


DefBWAoomQZcI 
Définition 14.65. 
L'espace mesuré (X,F,u) est complet si tout ensemble j1-négligeable est dans F. 


Notons que la proposition 14.7 s'applique si (X,F,u) est un espace mesuré et NW est l’en- 
semble des parties y-négligeables. C’est ce qui permet de donner le théorème suivant, que nous 
redémontrons de façon indépendante de la proposition 14.7. 


thoCRMootPojn 
Théorème 14.66 (Complétion d'espace mesuré[122, 429, 430]). 
Soit un espace mesuré (X,F,u) et N l’ensemble des parties u-négligeables de X. 
(1) Les ensembles suivants sont égaux : 
A={ACX tel que 1B,CEF tel que BE AC C,p(C\B) = 0} (14.130a) 
EqgF 
B={BUNtelqu BEF, NEN?} PTS) 
C={ACX tel que 1BE F tel que AAB € N}. (14.130c) 
Ici AAB est la différence symétrique de À et B, définition 1.29. 
(2) L'ensemble À = A = B =C est une tribu. 
(3) La définition 
!: B — [0,00 
# IDE] (14.131) 
AUNE u(A) 
est cohérente. 
(4) L'application w! ainsi définie est une mesure sur (X, A). 
(5) L'espace (X, A, y/) est complet. 
(6) La mesure y” prolonge li. thoCRMootPojnvii 


(7) La mesure y! est minimale au sens où toute mesure complète prolongeant u prolonge u’. 


Démonstration. Commençons par prouver que les trois ensembles À, B et C sont égaux. 


(1) AC B. Soit À € À. Alors nous avons des ensembles B,C € F tels que B € A € C' avec 
1(C\B) = 0. Alors nous avons aussi À = B L (C\B), ce qui prouve que À € B. 


(2) BEC. Soit À € B, c’est-à-dire que À = B LU N avec B € F et N € N. Nous avons 
évidemment À LU B = A et donc 


AAB = (AU B)\(AnB)= A(AnB)=(BUN)(ANnB)cN. (14.132) 


Pour comprendre la dernière inclusion, si + appartient à À = B L N sans être dans N alors 
xe Bet doncre An B. Par conséquent nous avons AAB € N et donc AAB € N. 
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(3) CE A Soit donc AeC;ilexiste B € F tel que AAB € N ou encore, il existe D € F tel que 
AAB € D avec (D) = 0. Si nous posons B' = B An Det C’ = BU D alors nous prétendons 
avoir 


B'cAcC". (14.133) 


Et nous le prouvons. En effet si x € B n D° alors en remarquant que B se divise en 
B=(BnA)v(Bn(AAB)), (14.134) 


et en nous souvenant que B n (AAB) € D, il vient que B n D° € B n A. Et en particulier 
x € À. D'autre part 

ACBLU(AAB)CBU D. (14.135) 
Nous avons donc bien B' € À € C". Par stabilité de la tribu Æ sous les intersections et 
complémentaires, nous avons aussi B',C"e F. De plus 


C\B'=(BUD)(BnD°)cD, (14.136) 


et donc 
u(C"\B") < (D) = 0. (14.137) 


Nous avons donc prouvé que À € BE C € À, et donc que À = B = C. Nous pouvons 
maintenant noter À indifféremment les trois ensembles. 
Nous prouvons à présent que À est une tribu. 
(1) Tribu : le vide Pas de problème à 9 € A 


(2) Tribu : complémentaire Soit À € À. Alors il existe B,C € F tels que BE AC C' avec 
1(C\B) = 0. En passant au complémentaire, 


Ce AcBr. (14.138) 


Mais B°\C° = C\B, donc u(B°\C°) = 0. 
(3) Tribu : union dénombrable Soit (A,) des éléments de A. Pour chaque n nous avons des 
ensembles By,Cn € F tels queBh € À, € C, avec u(C,\B;) = 0. En ce qui concerne les 


unions nous avons 
Léel4eluo (14.139) 
nm nm nm 


(UG)\(UB) € U(Gr\Bn). (14.140) 


Par conséquent, en utilisant (14.32), 


AE EE CB, ) < <u Cn\Bn) (14.141) 


n 


et 


Cela prouve que UJ,, An € À, et donc que À est une tribu. 

(4) Définition cohérente Soient À, 4’ e F et N,N'E N tels que À LU N = 4! 0 N'. Nous 
considérons Y, Y’ € F tel que NE Y, N'EY'et u(Y) = u(Y’) = 0. En vertu de (14.32) 
nous avons 


(A) < p(A 0 Y) < u(A' 0 Y LU Y') < (A) + u(Y) + u(V) = u(A. (14.142) 


En écrivant la même chose en échangeant les primes, nous prouvons également u(4') < 1(A). 
Au final u(A) = (A), c’est-à-dire 


(AU N) = (A0 N°). (14.143) 


La définition de y/ est donc cohérente. 


14.5. 


(5) 
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x’ est une mesure 


Le fait que y” soit positive et que w/({) soit nul ne pose pas de problème. Il faut voir l’union 
dénombrable disjointe. Si les ensembles 4; = B; L N,; sont disjoints, alors les B; et le N,; sont 
tous disjoints deux à deux. De plus l’ensemble []J, N; est négligeable parce que nous avons 
déjà vu que W était stable par union dénombrable (14.32). Donc 


uw (Union) = #((U2) U (UN) ) = #([JB:) = Ÿ u(B) = > ,n(B: U Ni). 


EN 

(14.144) 
Espace complet Un ensemble y/-négligeable est automatiquement u-négligeable. En effet 
si H est p/-négligeable, il existe B € F et N € N tels que H € BU N avec {(B) = 0. Comme 
N est u-négligeable, il existe Y € F tel que N € Y et u(Y) = 0. Donc HE BUNEBUY 
avec u(B LU Y)= 0. 
Tous les ensembles y-négligeables faisant partie de B, tous les ensembles /-négligeables font 
partie de A. 


Prolongement La mesure y’ prolonge u. En effet si À € F alors A= AU GEeBet À est 
u'-mesurable. De plus w/(A) = p/(A 0 @) = u(A). 


Minimalité 


Soit un espace mesuré complet (X, M,v) prolongeant (X,F,u). Pour À € À nous devons 
prouver que À € M et que w/(A) = (A). Il existe B € F et N € N tels que À = BU N. 
Puisque N est u-négligeable, il est également v-négligeable et donc v-mesurable parce que 
est complète : À e M. Nous avons le calcul 


v(B) < v(B U N) < v(B) + v(N) = v(B). (14.145) 


Vu que le premier et dernier termes de ces inégalités sont égaux, toutes les inégalités sont 
des égalités et nous avons v(B) = v(B 0 N). Nous pouvons enfin faire le calcul 


v(A) = v(BU N) (14.146a) 
= 1(B) (14.146b) 
(2) ne NEC 
_ (BON) SUBEROOBDASGoTHEEMS 
= (A). (14.146e) 


Justifications. 
— Pour (14.146c). La mesure v prolonge y. 
— Pour (14.146d). Définition de y’. 
L'égalité 4/(A) = v(A) est prouvée. 


Définition 14.67. 
L'espace mesuré complet (X, A, x) défini par le théorème 14.66 est l’espace mesuré complété 
de (X,F, ui). 

Nous noterons le complété de (S,F,yu) par (S, À, ) 


ThoUUTooaN1jH 


Théorème 14.68 (Carathéodory[122]). 
Soit S un ensemble et m* une mesure extérieure sur S. Alors RPPooHSWWsi 


(1) l’ensemble M des parties m*-mesurables est une tribu, 


(2) la restriction de m* est une mesure sur (S, M), 
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(3) l’espace mesuré (S, M,m*) est complet". 


Démonstration. Une grosse partie de la preuve sera de prouver la stabilité de M par union dé- 
nombrable quelconque ; cela sera divisé en plusieurs parties. 

(1) Tribu : le vide L'ensemble vide est m*-mesurable. 

(2) Tribu : complémentaire Soit À e M et X € S. La condition qui dirait A° € M est : 


mé (X) = m*(X n A°) + m*(X n À), (14.147) 


qui est la même que celle qui dit que À est dans M. 


(3) Tribu : union finie Soient À,B € M et X € S. Alors, comme m“* est une mesure exté- 
rieure, 


m*(X) < m*(X n (AU B)) +m*(X n (AU B)°) (14.148a) 
= m*((X nn A)U(X n B)) +m*(X n An B°). (14.148b) 
Mais nous pouvons écrire la première union sous forme d’une union disjointe de la façon 


suivante : 


(XnA)U(XnB)=(XnA)v0(XnBn A), (14.149) 
ce qui donne 
m*(X) < m*(X n A) + m*(X n Bn A) + m*(X n An Be) SPL MOPRGEEE) 
= m'(X n A)+m*(X n A°) (14.150b) 
= m*(X) (14.150c) 
parce que les deux derniers termes de (14.150a) se somment à m*(X n A°) parce que B € M. 
La dernière ligne est le fait que À soit m*-mesurable. 


(4) Union finie disjointe Soient {A1,...,A,} des éléments deux à deux disjoints de M. Nous 
allons maintenant prouver par récurrence que 


m (x 0 (4) = D m°(X n 4p. FaPRTep ES 


Si n = 1 le résultat est évident. Sinon, le fait que A,+1 soit m*-mesurable donne 


n+1 n+1 


m* (x 0 ( U Ay)) = = ‘(xo( Ü A) n An41) +m ‘(xo( Ü Ax) ) N Au). (14.152) 
k=1 


Le fait que les A} soient disjoints implique aussi que 


n+1 
A (Ù] 44) N Ann = X n Ann (14.153) 
k=1 
FR +1 
N ( U Ax) NA =Ân ( U Ax) (14.154) 
k=1 = 
et donc 
n+1 n 
mé (x 0 ((] 41)) = mé (A 0 Aux) + m* (x 0 ([] 4x)) (14.155a) 
=] k=1 
Æ m*(X n Anti) + D, m*(X n Ar) (14.155b) 
k=1 
n+1 
2" *(X n Ay). (14.155c) 


17. Définition 14.65. 
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La relation (14.151) est prouvée. 
Notons qu’en particularisant à X = S nous avons 


m*( Ü Ax) = 5 m“*(Ay) (14.156) 


k=1 k=1 
dès que les Az sont des éléments deux à deux disjoints de M. 


(5) Union dénombrable disjointe Soit (4,)ren une suite d'éléments deux à deux disjoints 
dans M. Nous allons prouver les affirmations suivantes : 


— (J,, An e M 
— MA(Un An) = Lam (An) 


où toutes les sommes et unions sur n sont entre 1 et oo. 


(5a) Première affirmation 


Nous posons À = |), 4x et B, = [JE_, Ar. Nous savons que B, € M pour tout n par 
le point précédent. Donc si X € S' nous avons 


m*(X) = m*(X Nn Bn) + m*(X n B°) FaGXPREgE 
= ÿ m*(X n Ay) + m*(X n B°) (14.157b) 

k=1 
> > m°(X N Ag) +m*(X n A°) (14.157c) 

k=1 


où nous avons utilisé la relation (14.151) sur les B, ainsi que le fait que A° € B% (parce 
que By € À). L’inégalité (14.157a) étant vraie pour tout n, elle est vraie à la limite : 


m*(X) > 5 m*(A n Àg) +m*(X n A°) (14.158a) 
k=1 
> m° (UGC n A4) + m*(X n A°) = m* (x n (U4)) +m*(X n A°) 
k k 
(14.158b) 


> m°(X n A) +m*(X n A‘), (14.158c) 
ce qui signifie que À € M. 


(5b) Seconde affirmation En particularisant à X = A et en tenant compte des faits que 
À n Ar = AZet An A =, 


Le] 
m*(4) > D m*(4 n 4x) + m*(4 n A°), (14.159) 
k=1 


c’est-à-dire que pour tout n nous avons 


m*([] 4) > S m*(Ay). (14.160) 
keN k=1 


L’'inégalité est encore vraie à la limite, et l’inégalité inverse étant toujours vraie pour 
une mesure extérieure, 


m* (4) = D m*(4). (14.161) 


(6) Union dénombrable quelconque Soit maintenant une suite (A»)nen d'éléments de M 
que nous ne supposons plus être disjoints. Nous nous ramenons au cas disjoint en posant 


B: — A (14.162a) 


Ba = Ann (| J 4)’, (14.162b) 
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c’est-à-dire que nous mettons dans B, les éléments de À, qui ne sont dans aucun des A4 
précédents. Autrement dit, nous posons Bo = @ et By = A»\Bn-1. L'ensemble M étant 
stable par réunion finie, par complément et par intersection finie nous avons B, € M. De 
plus les B, sont disjoints, donc 


O0 O0 
U À — U Be M. (14.163) 
k=1 k=1 


La première égalité se justifie de la façon suivante : si x € [J_, Ax alors nous notons n9 le 
plus petit n tel que x € À, et alors x e B,,. 

(7) Espace complet Nous prouvons à présent que (S, M,m*) est un espace mesuré complet. 
Soit N une partie m*-négligeable de $ et Y € M tel que m*(Y) = 0 et N € Y. D'abord 
m*(N) = 0 parce que 


Mm°(N) <m*(Y) = 0. (14.164) 
Si À € S nous avons 
XANEN=mIXAN)-0 (14.165a) 
XNNCX—m*(X n NS < m*(X). (14.165b) 
Donc 
Mm'(X NN) +m*(X n N°9) < m*(X), (14.166) 


ce qui montre que N est m*-mesurable. 


14.69. 
Ce théorème nous pousse à adopter des éléments de notation. Lorsqu'un espace mesuré (S,F, ji) 
est donné, nous noterons 


(S, M, p*) (14.167) 


l’espace mesuré construit de la façon suivante. D'abord u* est la mesure extérieure associée à u 
par la proposition 14.37. Ensuite M est la tribu des parties 4*-mesurables, qui est bien une tribu 
parce que 4* est une mesure extérieure (14.68). La proposition (14.40) dit alors que F € M. De 
plus 14.68 nous explique que si À € F alors (A) = u*(A). Tout cela pour dire que 


(S,F,u) € (S,M,u*). EDF opus 


Et enfin, 14.68 nous dit que l’espace mesuré (5, M, 1*) est complet. 
Ex0IXoosScTC 


Exemple 14.70. 

Montrons un cas dans lequel (S, M, u*) n’est pas o-fini. Soit S un ensemble non dénombrable et 
F la tribu des parties de S qui sont, soit finis ou dénombrables, soit de complémentaire fini ou 
dénombrable. Nous y mettons la mesure 


{ si À est au plus dénombrable (14.169) 


da sinon. 


Cette mesure n’est pas o-finie parce qu'aucune union de dénombrables est non dénombrable. De 
plus (S,F,u) est complet parce que toute partie contenue dans un ensemble fini ou dénombrable 
est fini ou dénombrable (1.139). 


(1) F n’est pas P(S) La tribu F est différente de P(S). En effet S étant infini, il existe 


par 1.150 une bijection @: {1,2} x S — $. Alors l’ensemble w({1} x S) est non dénombrable 
et son complémentaire 


p({1} x 5)° = p({2} x S) (14.170) 


n’est pas dénombrable non plus. Cet ensemble n’est donc pas de F. 
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(2) M est P(S) En effet, soit À € S ; il faut prouver que pour tout X € S$ nous avons 
U*(X) = (XX n À) + pH (X n À‘). (14.171) 


Nous prouvons cela en séparant les cas, suivant que X est dénombrable ou non. 
Si X est fini ou dénombrable, alors X n À et X n À° le sont également, et nous avons 
U*(X) = u(X) = 0 ainsi que 4*(X Nn À) = H*(X n A°) = 0. 


Si au contraire À n’est pas dénombrable, 


U*(X) = inf u(A) = oo, (14.172) 


parce que X n'étant pas dénombrable, l’ensemble À ne l’est pas non plus et (A) = oo. 
Mais comme X n’est pas dénombrable, soit X An À, soit X n A° (soit les deux) n’est pas 
dénombrable non plus; par conséquent 


d*(X © À) + p*(X n A°) = 00. (14.173) 


Par conséquent (S,F,u) Æ (S, M, u*). Mais puisque (S,F,u) est complété nous devons avoir 
(S,F,u) = (S,F, à). Tout cela pour dire que nous avons un exemple avec 


(S,M,u*) Z (S,F, à). (14.174) 
A 


Nous avons deux façons de créer un espace complet à partir de (S,F, ji). 
(1) Partir de la mesure extérieure * et construire (S, M, u*). 
(2) Partir des ensembles u-négligeables, construire F et ensuite LS, F, Â). 


Ces deux façons ne sont pas équivalentes en général comme le montre l’exemple 14.70. Mais il sera 


montré par la proposition 14.74 que si (S,F,u) est o-fini alors les deux sont équivalent. 
LemAESoofkMpi 


Lemme 14.71. 


Soit (S,F,u) un espace mesuré. Alors pour tout X € S tel que L*(X) < © il existe AE F tel que 
XCAetp*(X) = (À). 


C'est-à-dire que u* a beau être défini sur toutes les parties de S, ce qu’il faut rajouter pour 
être -mesurable, c’est pas grand chose. 


Démonstration. Par définition de la mesure extérieure associée à y en tant qu’infimum, pour tout 
n > 1, il existe À, € F tel que X © Au et u(An) < H*(X) + Æ. Nous posons À = (1,1 An et 
nous vérifions que ce À fait l’affaire. 

D'abord À € F parce qu’une tribu est stable par union dénombrable. Ensuite pour tout n > 1 


nous avons 
1 


on”? 
et à la limite p(A) < H*(X). Mais X € À implique u*(X) < (A) parce que 4*(X) l’infimum d’un 
ensemble contenant (A). 


(A) < (An) < HP (X) + (14.175) 


LemXOUNooUbtpxm 
Corolaire 14.72. 
Soit une mesure u et la mesure extérieure a* associée ©. Une partie N de X est négligeable si et 
seulement si L*(N) = 0. 


18. Par la proposition 14.37. 
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Démonstration. Si 1* est la mesure extérieure associée à 4 et si N est 1-négligeable alors u*(N) = 0 
parce que 
H*(N) < w°(N) = a(Y) = 0 (14.176) 
pour un certain Ÿ mesurable de mesure nulle contenant N. 
D'autre part si u*(N) = 0 alors le lemme 14.71 donne une partie mesurable À telle que N € A 
et (A) = 0, c’est-à-dire que N est négligeable. 


LemOAEoocBDa0O 
Lemme 14.73. 
Si l’espace mesuré (S,F,u) est o-fini alors l’espace mesuré (S, M, *) est également o-fini. 


Démonstration. Puisque (S,.F, 1) est o-fini, nous avons une suite croissante À, d'éléments de F 
tels que UJ,, A, = S et telle que (A) < © pour tout n. Étant donné que F € M, cette suite 
convient également pour montrer que (S, M, u*) est o-fini parce que u*(A,) = (A) < 00. 


La proposition suivante montre que si (S,F, 41) est o-finie alors nous avons l'égalité. 
ProplIHooAïbf; 


Proposition 14.74. 
Soit (S,F,u) un espace mesuré o-fini, * la mesure extérieure associée et M la tribu des ensembles 


u*-mesurables }*. Alors 
(SM, p°) = (S,F, à). (14.177) 


Démonstration. La proposition 14.40 indique que tous les éléments de F sont u*-mesurables, c’est- 
à-dire que F € M. Mais l’espace (S, M, 1*) est complet par le théorème de Carathéodory 14.68, 
donc par minimalité du complété (14.66(7)), 


(S, À, à) € (S,M, p*) (14.178) 


au sens où F € M et si AE F alors À(A) = *(A). Notons que cette inclusion est vraie même si 
la mesure n’est pas o-finie. 
Nous passons à l'inclusion inverse. Soit À € M, c’est-à-dire que pour tout Ÿ € S nous avons 


L*(Y) = (TN A) + CT n À). FaTzopeqigE 
Nous allons montrer que À € À en séparant les cas suivant que *(A) = ©, ou non. 


(1) Si p*(A) < co 
Par le lemme 14.71, il existe X € F tel que À € X et u*(A) = u(X). Comme (S,F,u) & 


(S, M, 1*) nous avons alors 
| p* (4) = (X) = *(X). FPE 


Nous écrivons la relation (14.179) avec ce X en guise de Ÿ, et en nous souvenant que X n À = 
A et X n A = X\A: 

B°(X) = p (A) + p (XNA). (14181) 
En tenant compte de (14.180) et du fait que 1*(A) < ©, nous pouvons simplifier et trouver 
u*(X\A) = 0. Le lemme 14.71 nous donne alors B € F tel que X\A € B et u(B) = 
u*(X\A) = 0, c’est-à-dire que X\A est négligeable. Par conséquent X\A € À. En écrivant 


A = X\(X\A), (14.182) 
nous avons écrit À comme différence de deux éléments de À et nous concluons que À € À. 
(2) Si u* (4) = © 


Le lemme 14.73 nous indique que ($, M, u*) est o-fini et il existe donc une suite (S,,),>1 dans 
M telle que (J,, S, = Set u*(S,) < co. L'ensemble À A $, est un élément de M vérifiant 


u* (A n Sn) < a*(Sn) < ©, (14.183) 


ce qui implique que An $, € À par la première partie. Maintenant À = U, (An Sn) € F par 
union dénombrable d'éléments de la tribu F. 


19. C’est bien une tribu par 14.68(1). 
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PROPooAMIEooRomnMG 
Proposition 14.75 ([1]). 
Soit un espace mesuré (Q,F,u). Nous considérons un mesurable M € F ainsi que 


— la tribu induite Fu = {AN M tel que AE F}, 

— la tribu complétée À de F dans (, 

— la tribu complétée Hs de Fu dans M (où nous avons considéré la mesure restreinte 20 de 

bi). 

— la tribu induite (F)m = {An M tel que Ae F} de À sur M. 

Alors 
(Fu = Fu. (14.184) 

Démonstration. L'utilisation de la proposition 14.9 nous donne déjà les expressions alternatives 


(F)m = {An M tel que Ae f} = {AC M tel que Ae À} (14.185) 


et 
Fu = {An M tel que Ae F} = {AC M tel que Ae F}. (14.186) 
Pour prouver (F jt + il faudra faire deux inclusions, et nous avons l'embarras du choix. 


(1) Première : Fu c {M n À tel que Ae À} Un élément de Fu est de la forme BU N 
où B € Fm et où NN est négligeable?! dans M. Vu que B € Fu, il existe À € F tel que 
B = An M. Vu que B et N sont dans M nous pouvons « factoriser » l’intersection : 


BUN=MMn(AUN) (14.187) 
avec N négligeable dans M et donc également négligeable dans (. Donc AUNE F. 
(2) Deuxième : {M n À tel que Aef}c Fu 


Soit À € f. Nous avons une partie négligeable N de ( et un élément B € F tels que 
À = B 0 N. Nous avons la décomposition 


Mn(BUN)=(MnB)v(MnN). FRAONMNE RCE TER) 


Il s’agit maintenant de nous assurer que cette décomposition implique que MR(BUN)E Fu 
Soit MN, € F tel que u(N1) = 0 et N € M. Puisque M n MN € F (intersections dans une 
tribu), nous pouvons écrire 

MOnNeMnN (14.189) 


avec u(M à N;) = 0. Cela pour dire que M An N est négligeable dans M. La décomposition 
(14.188) est donc bien une union d’un élément de Fwy avec un négligeable de M, et donc 
bien un élément de Fwy. 


14.76. 

La principale application de la proposition 14.75 est le cas où F = Bor(R”) et M est un borélien B 
de R”. Dans ce cas, la proposition explique que la tribu de Lebesgue sur B (complétée depuis les 
boréliens de la topologie induite) est donnée directement par l’intersection entre B et la tribu de 
Lebesgue de R”. Donc sans devoir passer par la topologie induite, les boréliens et la completion : 


nee 


Leb(R")m = Bor(R"). (14.190) 


Exemple dans la proposition 18.70 qui donne une structure d'espace mesuré dans S! à partir de 
la mesure de Lebesgue sur C. 


20. Ce n’est pas ce qu’il se passe dans le cas de S1 par rapport à C, voir la proposition 18.72(3) bien que S soit 
un borélien de C. 
21. Pour rappel, une partie est négligeable quand elle est inclue à une partie de mesure nulle. 
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14.5.2 Prolongement 


Le théorème suivant est parfois nommé théorème d’extension de Carathéodory, par exemple sur 


Wikipédia. Le théorème de Carathéodory en étant un des ingrédients principaux, on comprend. 
ThoLCQoojiFfz 


Théorème 14.77 (Prolongement de Hahn{[122]|). 
Soit À une algèbre de parties d’un ensemble S et j1 une mesure sur (S, A). Soit F = o(AÀ) la tribu 
engendrée par À. Alors 

(1) La mesure u se prolonge en une mesure m sur F. 

(2) Si u est o-finie alors le prolongement est unique et m est o-finie. 


(3) Si u est finie, alors m l’est aussi. 


Démonstration. La proposition 14.17 nous donne une mesure extérieure 4* sur S' dont la restriction 
à À est u. Si M est la tribu des parties 1*-mesurables de S'alors le théorème de Carathéodory 14.68 
nous dit que (5, M, 1*) est un espace mesuré. 
(1) AC M Cette partie est une adaptation de ce qui a déjà été fait dans la preuve de la 
proposition 14.40. Soit À € A et X € S : nous devons prouver la relation de la définition 14.38. 
Comme {* est une mesure extérieure nous avons automatiquement 


LE (X) SX n A) + p*(X n A°). (14.191) 


Il reste à prouver l'inégalité inverse. Soit une suite Bz d'éléments de À telle que X € UJ, B4 ; 
nous avons alors 


Le) 


u*(X n À) < p'((] Bin 4) < 2 H* (Br © À) = Ÿ (Br N À) (14.192) 
k 


où nous avons utilisé la définition 14.10(3) ainsi que le lemme 14.15. De la même façon, 


p(X n A) < D H(Br n A‘). (14.193) 
k 
Mettant les deux bouts ensemble, en remarquant que By n À € À et donc que u*(By n A) = 
u(Br N À), 
a*(X n À) + H*(X n A°) “2 By N À) + u(Bx n A°) - DH (Bk). (14.194) 


La somme 4*(X à A) +u*(X n A°) est donc inférieure à chacun des éléments de l’ensemble 
sur lequel on prend l’infimum pour définir ?? 4*(X), donc 


L*(X n À) + H*(X n A°) < p*(X). (14.195) 
A fortiori nous avons o(4) € M et donc ($S,o(A),u*) est un espace mesuré. Cela prouve 


l'existence d’une mesure prolongeant u à o(4). 


(1) Unicité 
Nous supposons à présent que u est o-finie. Soient m1 et m2 deux mesures prolongeant y et 
définies sur une tribu contenant A. Nous posons 


= {A € À tel que (A) < co}. (14.196) 


Dans l’optique d'utiliser le théorème d’unicité des mesures 14.33, nous prouvons que o(A) — 
o(C). Vu que y est o-finie, il existe une suite croissante ($,) d'éléments de À telle que 
S = {(J, Sn et u(Sn) < 00. Alors si À € À nous avons À = |), (A n $,), et donc À € o(C). 


22. Définition 14.20. 
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Donc À € o(C). Mais étant donné que € € À nous avons aussi o(C) € o(A). Au final 
o(A) = o(C). 

Les mesures m1 et m2 sont des mesures sur o(C) coïncidant sur € (parce que € € À). De 
plus la classe € est stable par intersection finie et contient une suite croissante dont l’union 
est S (parce que est o-finie). 

Le théorème 14.33 nous dit alors que m1 et m2 coïncident sur o(C) = o(À). 


(2) Extension finie et o-finie 


Enfin si u est o-finie il existe S, € À avec u(S,) < 00 et UJ, Sh = 5. Ces ensembles vérifient 
tout autant m(S,) = u(S,) < © pour tout prolongement m de Ji. 
Idem si y est finie, tout prolongement est fini. 


ExKCEoo1lsZrL 
Exemple 14.78 ([122|). 
Soit À, l'algèbre de parties de R formée par les réunions finies d’intervalles de la forme |—co, a, 
[a, b[ et [b,+oo[ avec —00 < a < b < +00. Notons que les singletons ne font pas partie de À parce 
que [a,a[= G. Nous posons 


(14.197) 


da sinon. 


{ si A= 9 


Cela donne une mesure (non o-finie) sur (R, 4). 
Nous allons prouver que la tribu engendrée par À est la tribu des boréliens et que y accepte 
(au moins) deux prolongements distincts à o(4). 
D'abord nous avons 
Ja, b[ = (1-00, af U [b, +o0f) n [a bf, (14.198) 


donc toutes les boules ouvertes appartiennent à o(A). Ces dernières comprenant une base dénom- 
brable de la topologie de R (par la proposition 7.130), tous les ouverts de R sont dans o(4). 
Par conséquent Bor(R) < (R‘). Mais en même temps tous les éléments de À sont des boréliens, 
donc Bor(R) = o(A) parce que la fermeture en tant qu’algèbre de parties est plus petite que la 
fermeture en tant que tribu. 

La mesure de comptage prolonge u parce qu’à part l’ensemble vide, tous les éléments de A 
sont infinis. Notons que les singletons sont dans o(4), donc la mesure de comptage prend d’autres 
valeurs que 0 et +00. 

Par ailleurs la mesure 


0 i À = 
(A) = nd (14.199) 
+00 sinon 
est également une mesure prolongeant y à o(A) = Bor(R). 
La mesure de comptage et x’ sont deux prolongements distincts de u. AN 


Exemple 14.79 ([422]). 
Nous montrons maintenant une mesure non o-finie qui se prolonge en deux mesures distinctes, 
toutes deux o-finies. 

Nous considérons la même algèbre À de parties que celle donnée dans l’exemple 14.78, mais 
cette fois vue sur À uniquement. La mesure de comptage m sur (Q,.4) n’est pas o-finie. 

Puisque les singletons sont des boréliens, nous avons o(4) = P(Q), ce qui fait que (Q, o(4),m) 
est un prolongement o-fini de m. L'espace mesuré (Q,o(.4),2m) est également o-fini et est un 
prolongement distinct de (Q,.4,m). A 

PROPooURDCooJEsjzR 
Proposition 14.80. 
Soient des espaces mesurés (S1,F1,u1) et (S2,F2,u2) ainsi qu’une application ÿ: S1 — S2 avec 
les hypothèses suivantes : 
(1) ç est une bijection, 


(2) & est mesurable d’inverse mesurable, 


1212 CHAPITRE 14. TRIBUS, THÉORIE DE LA MESURE, INTÉGRATION 


(3) si a(A) = 0 alors 2(p(A)) = 0, 
(4) si bo(A) = 0 alors ju (77 (A)) = 0. 
Alors 
2 = (À). (14.200) 


Démonstration. Nous prouvons que f2 & p(F). Vu la symétrie des hypothèses, l'inclusion inverse 
se fera de même. 

Soit A e F2. Nous avons À = BU N avec Be Pet N , une partie 2-négligeable. Nous 
considérons N; € F2 tel que w2(N;) = 0 et N € Ni. Notre but est maintenant de prouver que 
p_l(BUN)ef. 

Comme w est une bijection, nous avons 


og (BUN)=% (Buy l(N). (14.201) 


Là-dedans, w !(B) € F1 parce que @ est borélienne. Il nous reste à voir que @ !(N) est w1- 
négligeable. Puisque N € Ni, nous avons 6 1(N) € 6 l(N;) où y l(Ni)e F1. 

Par construction, 42(N;) = 0 et par hypothèse, u; (w" 1 (N)) = (. 

Au total, 


po (BUN)=w !(B)u w !(N) ef. (14.202) 
=, — =, — 
eF 1-négligeable 


14.5.3 Mesure image 


Le produit d’une mesure par une fonction est défini par la propriété 14.205. 
PropJCJQooAdqrGA 


Proposition-Définition 14.81 (Mesure image[419]). 
Soient (S1,F1) et (S2,F2) des espaces mesurables. Soit $: S1 — S2 une application mesurable. Si 
mi est une mesure positive sur S1 alors l’application définie par 


m2(42) = mi(yw7"(A42)) (14.203) 


est une mesure positive sur (S2, F2). 
La mesure m2 ainsi définie est la mesure image de m1 par l'application &. Elle est notée 
p(ma). 


Démonstration. Il y a deux choses à vérifier pour avoir une mesure positive . D'abord pour 
l’ensemble vide : 


ma(@) = ma (gp (2) = mu(2) = 0: (14.204) 


Ensuite pour l’additivité. Soient À, dans F2 des parties deux à deux disjointes et telles que 
Ü, An € F2. Alors nous avons 


ma([ JA) = m] (6e An)) (14.205a) 


= ma (| Jr" "(42)) (14.205b) 
= ÿ m(p(An)) (14.205c) 
= ÿ ma(An). (14.205d) 


23. Définition 14.18 


14.5. ESPACE MESURÉ COMPLET 1213 


Lemme 14.82. 
Soient deux espaces mesurables (S1,F1) et (S2,F2) ainsi que deux mesures u et v sur (S1,F1). Si 
y: S1 — S2 est mesurable et si u < v alors (ui) < y(v). 


Démonstration. Soit B mesurable dans (S2,F2) (c’est-à-dire B € F2). Alors 


e(u)(B) = u(p7"(B)) < v(v7"(B)) = e(v)(B). (14.206) 


Il est naturel de se demander comment il faut intégrer par rapport à une mesure image. La 
réponse sera dans le théorème 14.212. 


14.5.4 Régularité d’une mesure 


Certaines mesures ont de la compatibilité avec la topologie. Nous allons étudier ça. 
LEMooCGKXooYWjRwk 


Lemme 14.83 ([431]). 
Soit un espace topologique métrique (Q, d). Nous considérons sa tribu des boréliens?* Bor(Q) ainsi 
qu'une mesure finie p sur (Q, Bor(Q)). 
Soit un borélien À de ( ete > 0. 
Il existe un fermé F et un ouvert V de Q tels que 
({)FecAcCV 
(2) u(V\F) < e. 


Démonstration. Soit la famille D des parties D de ( qui vérifient la propriété suivante : pour tout 
e > 0, il existe un fermé F et un ouvert V de Q tels que FE DEV et n{V\F)<e. 
Nous allons prouver que D est une tribu qui contient tous les ouverts. 


(1) D contient les ouverts Soit un ouvert D. Nous posons 


Fh = {x € ( tel que d(x, D°) > 277}. (14.207) 


(la) F, est fermé 
Le lemme 7.143 montre que le complémentaire FŸ est ouvert. Donc F, est fermé. 


(1b) DEUJ,eNFn Sixe D, alors il existe Ô > 0 tel que B(x,6) € D (parce que D est 
ouvert). Donc d(x, V®) > 6. Donc x € Fn pour 27" < 6. 


(1c) Un nc D Sixe Fn, nous avons d(x, D°) > 0, c’est-à-dire que x n’est pas dans D°. 
Autrement dit, x € D. 


(1d) yen Fn = D Nous avons donc l'égalité 


D=|Jr. (14.208) 
neN 


Vu que Fn € Fh+1, le lemme 14.23(1) nous indique que 


Jim 4(Fn) = a([] Fr) = u(D). (14.209) 
keN 


Étant donné que la mesure est finie, nous pouvons écrire cela sous la forme 
u(D) — p{Fn) — 0. (14.210) 
Pour chaque n nous avons l’encadrement 


Fee D (14.211) 


24. Définition 14.47. 
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où F, et D sont ouverts. Lorsque € est donné, il suffit de prendre n assez grand pour avoir 
U(D\Fn) < € pour avoir un encadrement de D par un fermé et un ouvert (D lui-même) dont 
la différence des mesures est plus petite que €. 


Tout cela pour dire que D e D. 


(2) D est une tribu Il faut vérifier les trois points de la définition 14.1. 


(2a) QED Nous venons de voir que les ouverts sont dans D. Or { est un ouvert. 


(2b) De D implique De D Soit F fermé et V ouvert tels que F € D € V. Nous avons 
aussi 


VFeDe Fr (14.212) 
où V° est fermé et Æ° est ouvert. De plus FA\VS = V\F et donc 
u(F\VS) = u(V\F). (14.213) 


Nous pouvons donc choisir F et V pour avoir u(F\V) < €. 


(2c) Un Die D Soient D; e D. Pour chaque n nous posons 
FeDieV (14.214) 


en choisissant V, et F, de telle sorte que u(VA\Fn) < 277€. 


Nous posons 


N 
"= (JF, (14.215) 
n=0 
et 
00 
Y=(Jr. (14.216) 
n=0 


Chacun des Yyw est fermé en tant qu’union finie de fermés (lemme 7.6(2)). Mais Y ne l’est 
pas spécialement #. Le lemme 14.23 nous dit cependant que u(Y) = limn_ H(YN). 


Nous posons 


(0e) 
D={J2, (14.217) 
n=0 
ainsi que 
V = Va. (14.218) 
neN 


La partie V est ouverte dans ( comme union d’ouverts (c’est dans le définition d’une 
topologie). Nous avons, pour tout N, l'encadrement 


= Ü F,cYcDcey. ner) 


n=0 
Nous prouvons à présent que limw_, H(V\Yw) = 0, de telle sorte que l'encadrement 


(14.219) dise que D € D. 


D'abord nous avons 


V\Y c U AY FqooYVVBoel Enr 


parce que si x € V\Y,, alors x € V; pour un certain , mais vu que x n’est pas dans Ÿ, il 
n’est dans aucun des F, donc en particulier pas dans F; et x € V,\F;. 


25. Par exemple A, = [1/n,2] sont des fermés dont l’union est ]0,2] qui n’est pas fermé. 
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Un peu de calcul : 
SUBEQOOCSQY ao Ent y 


( 
& nu UF) 0 


co 
a ÿ, u(Va\Fs) AAROS ROC ELEL ES 
n=0 
co 
= ÿ2te (14.221d) 
n=0 . à 
5e nn 


Justifications : 

— Pour (14.221a), c’est le lemme 14.22. 

— Pour (14.221b), c'est (14.220). 

— Pour (14.221c), c’est le lemme 14.22(4). 

— Pour (14.221e), c’est la série géométrique (11.318). 


Nous choisissons maintenant N assez grand pour que {{Y) — u(Yn) < €. Nous avons 
alors l’encadrement 


NEereDer (14.222) 
a(V\YN) = a(V) — an) = u(V) — HT) +u(Y) — u(Yn) <2e+e= 3e (14.223) 
<2€ 


Nous avons donc montré que D était une tribu contenant les ouverts. Donc D contient tous les 
boréliens. 


LEMooZDFVooFUgFGZ 
Lemme 14.84 ([131)). 
Soit un espace topologique métrique (Q, d). Nous considérons sa tribu des boréliens Bor(Q) ainsi 
qu'une mesure y sur (Q, Bor(Q)). 
Soient un ouvert W € Q tel que u(W) < © et un borélien À tel que AE W. Soit aussi € > 0. 
Il existe un fermé F et un ouvert V tels que 
(1) H{V) < «, 
(2) H(V\F) <e, 
(3) t Fc AC V. 


Démonstration. Vu que la mesure de W est finie, nous considérons la mesure finie 


v: Bor(Q) — [0,u(W)] 


(14.224) 
Br nBnW). 


La partie À étant borélienne ; par le lemme 14.83, nous avons un fermé F et un ouvert Vi ouvert 
tels que 
FcAcV (14.225) 


et v(V1\F) < €. Nous posons V = VW nW ; vu que AE Wet AC Vi nous avons aussi Ac WnW 
et donc l’encadrement 
FcACVeEW. (14.226) 


En ce qui concerne la mesure : 


u(V\F) = u(V) — u(F) = u(VoW)-uFnW)=1v(B)-71(F) <e. (14.227) 


1216 CHAPITRE 14. TRIBUS, THÉORIE DE LA MESURE, INTÉGRATION 


ThoPKGEooVrpsGU 
Théorème 14.85 ([419]). 
Soit X un espace métrique et m une mesure positive bornée sur (X, Bor(X)). Alors si B est un 
borélien, 


(1) Régularité extérieure : m(B) = inff{m(Q)où Q est un ouvert contenant B} 

(2) Régularité intérieure : m(B) = sup{m(F)où F est un fermé, F € B}. 
Démonstration. Soit F l’ensemble des B € Bor(X) tels que pour tout € > 0, il existe (, ouvert et 
F4 fermé tels que F: € BE, et m(Q.\F.) < €. Nous allons montrer que F 

— est une tribu 

— contient les ouverts 

— est inclus dans la tribu borélienne (ça c’est dans la définition de F). 
De ces trois points nous déduirons que F = Bor(X). 


(1) Æ contient les ouverts Soit ( un ouvert de X. Alors (° est fermé et d(x,Q°) = 0 si et 
seulement si x € (° par la proposition 7.285. Nous pouvons donc écrire 


| _—. 
PA N {x e X tel que d(x,(°) < . (14.228) 


n>1l 


En passant au complémentaire et en posant F, = {x € X tel que d(x, Q°) > 1} nous avons 


Q= [JF (14.229) 


n>1l 


Chacun des F} est fermé parce que F, est l’image réciproque du fermé [E, | par l’appli- 
cation æ + d(x,(°) qui est continue. De plus les F, forment une suite croissante, donc le 
lemme 14.23 nous assure que m(Q) = lim,_, m(F,). Et le lemme 14.22 que m(Q\F,) = 
m(Q) — m(Fn). 

Soit € > 0. Il existe alors ne > 1 tel que 


m(Q\Fn) = m(Q) — m(Fn) < €. (14.230) 
Bref si ( est ouvert nous considérons (, = Q et Fe = F. et nous avons 
Merriente (14.231) 


avec m(QN.\Fe) < €. 
L'ensemble F contient les ouverts. 


(2) F est une tribu Il y a à vérifier les trois conditions de la définition 14.1. 


(2a) Les ensembles faciles Les ensembles X et G sont dans F parce qu’ils sont ouverts 
et fermés. 


(2b) Complémentaire Soit BE F, soit € > 0 et les ensembles Æ: et ® qui vont avec. 
Alors en passant au complémentaire nous avons 


McHcrF (14.232) 
De plus 
FAO = AO = FA OAr.. (14.233) 
Par conséquent 
m(FAQË) = m(QA\Fe) < €. (14.234) 


Cela montre que B°Ee F. 
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(2c 


) Union dénombrable Soient (B,) une suite d'éléments de F et € > 0. Pour chaque 


n, le lemme 14.83 nous permet de choisir un ouvert (,, et un fermé F, tels que F, € 


By € An et 
€ 
NE) < D” (14.235) 


Puisque Q,\B, € Q,\F, nous avons aussi 


m(Qn\Bn) < MQn\Fn) < _— (14.236) 


Nous posons Q = |), A (un ouvert) et B = U),-; Bx ainsi que À = [JF (qui 
n’est pas spécialement fermé). 

Le but est de majorer m(Q\F) où Fest un fermé qui est encore à déterminer. Calculons 
déjà ceci : 


A\8 =[J9, 0 (JB) (14.237a) 
= [U D) n fl 2) (14.237b) 
. U (a _ (N B)) SUBENOOAUBT RC RUÈREX 


| Jun 8°) SUBEQooDZ6q0KGHobn 
= JR\B,). FUPEAOO CE pese 


Justifications. 
— Pour (14.237c). Pour toute suite d’ensembles on a ([J, 4x)" = (, Aÿ. 


— Pour (14.237d). Si x e Q,n(f, B£) pour un certain n, alors en particulier x € (7, B£ 
&veB. DoncreQ,nB;: 


— Pour (14.237e), notez que l’union n’est pas spécialement disjointe. 


Par conséquent, 


00 00 
mA\B) < D m(Qn\Bn) < D He = . (14.238) 
n=1 n=1l 
De la même façon nous avons 
Le] 00 00 
B\A = (U 8 n(U&) eUBR\r. (14.239) 
n=1l k=1 n=1 


Nous avons alors le inégalités de mesures 


Û18 
3. 
œ 
E- 
= 


m(B\A) < (14.240a) 
n=1 

< > m(Qn\Fn) (14.240b) 
n=1 

< F. (14.240c) 


C’est vraiment dommage que À ne soit pas en général un fermé, sinon il répondrait à 
la question. Nous posons F1 = F1 et F7 = [Jf_, F4. En tant qu’unions finies de fermés, 
les F} sont des fermés (lemme 7.6(2)). De plus la suite (F7) est croissante et l’union est 
A. Par le lemme 14.23(1) nous avons 


n—00 


= m([ JF) = = lim m(F). (14.241) 
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Il existe donc n. tel que 
m(A) — m(Fr,.) < € (14.242) 


Nous posons F = F7... Comme F € À nous avons aussi m(A\F) = m(A) -m(F) < €. 
Et en plus FE AC B€ Q, ce qui donne bien la propriété voulue F € B € Q. Il reste 
à nous assurer de m(Q\F). Nous avons d’abord 


De 


m(B\F) = m((B\A) U (A\F)) = m(B\A) + m(A\F) < Fa (14.243) 
Et enfin : 
m(Q\F) = m((Q\B) U (B\F)) = m(Q\B) + m(B\F) < L (14.244) 


Et donc à redéfinition près de €, c’est d'accord. 


Il est donc établi que F est une tribu. Qui plus est, l’ensemble F est une tribu incluse aux 
boréliens et contenant les ouverts. Ergo F = Bor(X). 


(3) Régularité extérieure Soit B un borélien et € > 0. Alors il existe F+ fermé et (: ouvert 
tels que F € BE et m(Q.\F.) < e. Vu que B € ( pour tout €, nous avons aussi 


m(B) < inf m(Q). (14.245) 


Mais comme m(Q.) > m(B) pour tout €, nous avons en réalité m(B) = infem(Q). 

Soit maintenant un ouvert Q tel que B € {. Nous devons prouver l’existence d’un € > 0 tel 
que m(Q.) < m(Q). Cela permettra de conclure que lPinfimum sur tous les ouverts contenant 
B est égal à l’infimum sur les ouverts de la forme Q,.. 


Nous posons m(() = m(B) + Ô et avec € < Ô nous avons 
m(Q\B) < m(Q4\Fe) < € (14.246) 


et donc aussi 
m(Qe) < m(B) + €< m(B) + 6 = m(Q). (14.247) 


(4) Régularité intérieure Elle se fait de même. 


DefFMTEooMjbWKK 
Définition 14.86. 
Soit X un espace topologique et m une mesure positive sur (X, Bor(X)). ItemTTPTooStDcpu 
(1) m est une mesure de Borel si elle est finie sur tout compact. 
(2) m est régulière extérieurement si VB € Bor(X), 
m(B) = inff{m(Q) tel que Q est ouvert et BE Q} (14.248) 
(3) m est régulière intérieurement si VB € Bor(X), 
m(B) = sup{m(K) tel que K est compact et K € B} (14.249) 
(4) m est une mesure régulière si elle est régulière dans les deux sens. 
(5) m est une mesure de Radon si elle est de Borel et régulière. 
PropNCASooBnbFrc 


Proposition 14.87. 
Soit X un espace localement compact et dénombrable à l'infini Alors toute mesure de Borel sur 
(X,Bor(X)) est de Radon. 


26. Définitions 7.81 et 7.85. 


14.5. 
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Démonstration. Nous avons une suite exhaustive ?7 de compacts X, tels que 


(1) 


X = |) xx = [JInt(xs). (14.250) 
k>1 k>1 


Régularité intérieure Soit B, un borélien de X ; nous avons B = | J,.,(Bn X%) et comme 
cette union est croissante, 


m(B) = Jim m(B n X%) (14.251) 


par le lemme 14.23(1). Dans la suite, il va y avoir beaucoup de considérations sur les topologies 
induites. Nous nommons 74 la topologie de X% induite depuis celle de X. Il ne faudra pas 
confondre les expressions « un compact de X% » et « un compact dans X% ». La première 
parle d’un compact pour la topologie 73. La seconde parle d’un compact pour la topologie 
de X, inclus dans X%. 


Si a < m(B) alors il existe k > 1 tel que a < m(B n X4), c’est-à-dire 
a <m(B n Xx) < m(B). (14.252) 


Mais (Xz,m) est un espace mesuré borné parce que m est de Borel et X% est compact. Par 
conséquent la (restriction de la) mesure m est régulière sur l’espace mesuré (X}, Bor(Xx)) 
par le théorème 14.85. De plus l’ensemble B n X, est un borélien de (X%,74) parce que 


Bn X% € Bor(X)x, = Bor(Xx) (14.253) 


où nous avons utilisé la propriété de compatibilité entre topologie induite et tribu des borélien 
du théorème 14.54. Il existe donc un fermé F4 de (X4,7%) tel que 


Fes (14.254a) 
m(B n Xx) < m(Fe) + €. (14.254b) 
En mettant bout à bout les inégalités nous avons trouvé 


a<m(Bn X%) <m(F:) + €. or PSS) 


L'ensemble F: est un compact de (X,Tx). En effet X4 étant fermé de (X, 7x), le lemme 7.25 
nous dit que F4 est un fermé de (X,7x). Mais X% étant compact, Fc est un fermé inclus dans 
un compact, il est donc compact (lemme 7.91). 

Enfin nous prouvons la régularité intérieure de la mesure m, c’est-à-dire que 


m(B) = sup{m(K) tel que K est compact dans B} (14.256) 


en vérifiant les deux conditions de la définition 1.444. D'abord m(B) > {m(K) tel que ...} 
parce que m(B) > m(K) pour tout K € B. Ensuite prenons € > 0, et considérons l'inégalité 
(14.255) avec a = m(B) — €. Alors nous avons 


m(B) — 2e < m(Fe). (14.257) 


Cela prouve que m(B) — 2e n’est pas un majorant de {m(K) tel que ..….}. 


Régularité extérieure 


Soit un borélien B de X. Si m(B) = © alors tous les ouverts contenant B ont mesure infinie 
et m(B) en est évidemment l’infimum. Nous supposons donc que m(B) < 0. 

Nous notons 7; la topologie induite de X sur Int(X4). Nous posons By; = B n Int(X}). 
L'espace (Int(X k); m) est un espace mesuré borné et By € Bor Int(X}) }. Il existe donc un 
ouvert (% de (Int(Xx), 7x) tel que By € Qz et 

€ 


m(Qx\Bx) < DE 


(14.258) 


27. Définition 7.291. 
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De plus Int(X}) est un ouvert de (X,7x), donc en réalité Q} est un ouvert de X. Nous posons 


00 
Q= (JA (14.259) 
k=1 


qui est encore un ouvert de (X,Tx). 
Il est temps de voir que Q vérifie m(Q\B) < €. Pour cela, 


AB = ([J®@) n (8) (14.260a) 
= ([J) n (NB) (14.260b) 


=c ÜGx n B£) (14.260c) 
= U Qx\Bp), (14.260d) 
k 
ce qui donne au niveau des mesures : 

(0e) 00 € 

m(Q\B) < Ÿ m(Q\Br) < Ÿ ne (14.261) 
k=1 k=1 

[1] 
RemooUAGCooRHpjxd 


Remarque 14.88. 
Exprimé sur R\, la proposition 14.87 s'exprime en disant que toute mesure de Borel sur R° est 
régulière. Typiquement, l’espace X dont il est question est un ouvert de R". 


14.5.5 Théorème de récurrence 


Soient X un espace mesurable, 4 une mesure finie sur X et D: X — X une application mesu- 
rable préservant la mesure, c’est-à-dire que pour tout ensemble mesurable À € X, 


4(671(4)) = p(4). (14.262) 


Si À € X est un ensemble mesurable, un point x € À est dit récurrent par rapport à À si et 


seulement si pour tout p € N, il existe £ > p tel que d"(x) € A. 
ThoYnLNEL 


Théorème 14.89 (Théorème de récurrence de Poincaré.). 
Si À est mesurable dans X, alors presque tous les points de À sont récurrents par rapport à A. 


Démonstration. Soit p € N et l’ensemble 
(we) 
Up = (J # (4) (14.263) 


des points qui repasseront encore dans À après p itérations de ©. C’est un ensemble mesurable en 
tant que union d’ensembles mesurables (pour rappel, les tribus sont stables par union dénombrable, 
comme demandé à la définition 14.1), et nous avons donc 


U(Up) < U{X) < 0. (14.264) 
De plus U, = d P(Uo), donc u(U,) = u{Uo). Vu que U, € Uo, nous avons 


u(Uo\Ur) = 0. (14.265) 


28. Définition 14.42. 
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Étant donné que À & UÜo nous avons a fortiori que 
{x e À tel que x # U,} € Uo\Up, (14.266) 


et donc 
u{x € À tel que x # U,} = 0. (14.267) 


Cela signifie exactement que l’ensemble des points x de À tels que aucun des (x) avec & > p 
n’est dans À est de mesure nulle. 


14.6 Mesurabilité des fonctions à valeurs réelles 
Nous allons parler de la mesurabilité de fonctions 
f: (SF) — (R, Bor(R)) (14.268) 


où R = R L {+0}. 

normooGAAJooUPCbzG 
14.90. 
Nous convenons que 0 x +00 = 0 parce que nous voulons qu’une droite (qui est un rectangle dont 
une mesure est 0 et l’autre 0) soit de mesure nulle dans IR?. 


Les produits et sommes +00 + +oo et +oo x +oo sont ceux que l’on croit. Sauf bien entendu 
+00 — et 1/0 qui ne sont toujours pas définis. 


LEMooBLOLooAdNViv 
Lemme 14.91. 
L'ensemble B est un borélien de R si et seulement si il existe un borélien Bo de R tel que B soit 
Bo ou Bo L {+} ou Bo L {—w} ou Bo LU {+0, —-œ}. 


Démonstration. Comme la topologie usuelle sur R est la topologie induite de celle sur R, la tribu 
induite l’est aussi par le théorème 14.53. Donc si B est un borélien de R, l’ensemble BA R est un 
borélien de R. 


LemooCRVJooQosHPq 
Lemme 14.92 ([419]). 
Si So est l’ensemble des intervalles du type 


ll fl: Ja,+l (14.269) 


avec —0 < a < BP < +0 alors o(So) = Bor(R). 


Démonstration. Les intervalles ]a, B[ engendrent la topologie de IR?°, donc Bor(R) € o(So). De 
plus le lemme 14.3 nous autorise à dire que 


(In, +00] = {+00} € (So). (14.270) 


n>1l 


Par conséquent tous les ensembles énumérés dans le lemme 14.91 font partie de o(So). Cela implique 


que Bor(R) € (So). : 
Pour l'inclusion inverse, o(So) est engendré par des parties qui font partie de Bor(R), donc 


o(So) € Bor(R). 


14.6.1 Fonctions à valeurs réelles sur un espace mesurable 
THOooWHFLooKYGsOm 


Théorème 14.93. : 
Soient un espace mesurable (S,F) et une fonction f: S — MR. Les propriétés suivantes sont équi- 
valentes. 


29. Parce toutes les boules sont des intervalles de ce type et que les boules forment une base de topologie, propo- 
sition 7.130. 
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ITEMooHAMHooYLqUhVi 
(1) La fonction f est mesurable. ITEMooHAMHoOYLqUHVi À 


(2) L'ensemble {f < a} est dans F pour tout a €] 


ue) 


ITEMooHAMHooYLqUhViii 


(3) L'ensemble {f < a} est dans F pour tout ae R 


Démonstration. Plusieurs implications à prouver. 
(1) (1)=(2) Puisque f est mesurable et que [—, a[ € Bor(R), nous avons f”1([—00, af) € F. 
(2) (2)=(1) Nous posons À = {[—0, af tel que a € R}. 
Nous avons À € So (le So du lemme 14.92). Et de plus, 


1 
Ja, BL = [-c, BNT-00, a] = [-æ, 80 [ ][-c,a + ©. (14.271) 
n>1l 
Donc |a, B[ € o(A4). 
Et aussi : 
— 1 
la, +00] = R\ (}[-00,a + =, (14.272) 
neN Lu 
ce qui donne |a, +00] € o(A). 
Au final, Sÿ € (À) et donc o(So) € o(A). Le lemme 14.92 nous dit que a(So) = Bor(R). 
Nous avons donc bien o(So) = o(A) = Bor(R). 
Par ailleurs, nous savons que f-1(A4) € F parce que les éléments de À sont de la forme 
{f < a}. Cela donne o(f-1(4)) = F. Mais o(f-!(4)) peut aussi s’exprimer par le lemme 
de transport 14.45 : o(f-1(4)) = f-!(o(4)). En combinant les deux, 


Feb) (14.273) 


et en remplaçant o(A) par Bor(R) nous avons ce que nous voulions : 


f'(Bor(R)) € F, (14.274) 
ce qui signifie que f est mesurable. 
(3) (3)=(2) Nous avons 
{f<a}={J{f<a-2} (14.275) 
n>1 Fe 


donc ceci est une union dénombrable d'éléments de F. Et {f < a} est dans F. 
(4) (1)=(3) Nous avons 
{f<a}={f <a}t F7 ([-00, al). (14.276) 
Le premier ensemble est dans F par (2). Ensuite [—00,a] est un fermé de R et donc un 


borélien de R. Son image réciproque est donc un élément de F parce que f est mesurable. 
Au final nous avons bien {f <a}eF. 


LemFOlheqw 
Lemme 14.94 ([132|). 
Une fonction f: X — IR est mesurable si et seulement si f-!(1) est mesurable pour tout I de la 
forme ]a, |. 


Démonstration. Nous devons prouver que f-!(A) est mesurable dans X pour tout borélien À de 
R. Nous posons 
S={ACR tel que f !(A) est mesurable dans X} (14.277) 


et nous prouvons que c’est une tribu. D'abord f-!(R) = X, et X est mesurable, donc R € S. 
Ensuite si À € S alors f-1(A°) = f-1(A)°. En tant que complémentaire d’un mesurable de X, 
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l’ensemble f-1(A)° est mesurable dans X. Et enfin si 4, € S alors f-1([J, 4,) = UJ, f-!(A4) qui 
est encore mesurable dans X en tant qu’union de mesurables. 

Donc S est une tribu qui contient tous les ensembles de la forme ]a, |. Le lemme 14.49 conclut 
que S' contient tous les boréliens de R. 


LEMooMYUFooKqdDNc 
Lemme 14.95. : 
Soit R = R LU {+}. Soit À € R. Les parties {x > À}, {x > À}, {x < À} et {x < À} sont des 


boréliens de R. 
LEMooAITEooOMjHxvh 


Lemme 14.96. 
Soit une application mesurable f: (0, A) — (R U {+0}, Bor). Soit }E R ; nous définissons 
FOR 


14.278 
w > min (f(w), À). ) 
Alors fx est mesurable 


Démonstration. Soit À mesurable (i.e. borélien) dans RU {+}. Nous devons montrer que f, !(A) 
est mesurable. Pour cela nous écrivons 


A= (4 nfx> x) U (4 n{x< x). (14.279) 


Par définition f\ ne prend jamais de valeurs plus grandes que À, donc f, 1(A DR À}) = 7. 
D'autre part, f1(4An{x < X}) = fl(An{xr < X}). 


Étant donné que À et {x < À} sont boréliens %, l'intersection À n {x < À} est borélienne, et 
donc 

f, (4) = f(Anfz< X}) € A. (14.280) 

LemIGKvbNR 


Lemme 14.97 ([132)). 
Soit fn: X — IR une suite de fonctions mesurables*!. Alors sup, f, est mesurable. 


Démonstration. Nous avons 


(sup fn) (la, o]) — {xe X tel que (sup f,)(x) > a} (14.281a) 
L GIE e X tel que f(x) > a} (14.281b) 
=(J #5" (la, ol). (14.281c) 


Étant donné que f, est mesurable et que Ja, w] est mesurable, chacun des f7 1 (Ja, œ]) est mesurable 
dans X. L'ensemble (sup fh) 1 (Ja, ]) est donc une union dénombrable de parties mesurables. Il 
est donc mesurable. 

Le lemme 14.94 conclut que sup f, est mesurable. 


PropFYPEOIJ 
Proposition 14.98. 
Si fn: X — R est une suite de fonctions mesurables et positives, alors la fonction *’ Ed 
mesurable. 


Démonstration. Nous considérons les fonctions sx(x) =  . fn(x) qui valent éventuellement 00 
en certains points. Nous avons 


NPC e sk(x), (14.282) 


donc le lemme 14.97 nous donne la mesurabilité de la somme de f}. 


30. Lemme 14.95. 
31. Ici X est un espace mesuré et R est muni des boréliens. 
32. Définition 12.375 pour la série de fonctions. 
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ooUDHFooJjKscR 
Définition 14.99. 
Soit (S,F) un espace mesurable. Une partition mesurable dénombrable de S est une suite 
(Sn)n>1 de parties de S telles que 


(1) Sn € F pour tout n, 
Rnb sinsék, 


(3) S = Ün>1 Sn- 
LEMooXAPQooPpZUmP 


Lemme 14.100 (Lemme de recollement). 
Soit (S,) une partition mesurable dénombrable de l’espace mesurable (S,F). Soit (S',F') un autre 
espace mesurable et des fonctions mesurables 


fn: (Sn Fs,) — (5,77) (14.283) 
où Fs, est la tribu induite. Alors la fonction 


: (S,F) — (S",F' 
f ( ) (14.284) 
Te fn(r) STE Sn 
est mesurable. 


Démonstration. Soit 4’ e F'; nous devons prouver que f-!(4/) e F. Nous savons que 


FA) = U #49), FORTE ESS 


n>1l 


qui est une union dénombrable d'éléments f, (4) e Fs,. 
Puisque $, € F nous avons F5, € F parce qu’un élément de F5, est de la forme S, n B avec 
B € F. Ainsi, pour chaque n nous avons 


(AN eFs, cF. (14.286) 


Au final l'égalité (14.285) écrit f—1(4') comme une union d’éléments de F et est donc un élément 
de F. 


PROPooOUDDVooFEmmTX 
Proposition 14.101. 
Soit (S,F) un espace mesurable et des applications mesurables f,g: S — IR. Alors les fonctions 
suivantes sont mesurables : 


(1) Àf pour tout }eR 
(2) f + g si elle existe. 
(3) 1/f si elle existe. 


(4) fg. 


Démonstration. Commençons par clarifier « si elle existe ». La fonction f + g n'existe pas au point 
x € S si f(x) = + et g(x) = —-00. La fonction 1/f n’existe pas au point x € S si f(x) = 0. Voir 
le point 14.90. 


(1) La partie où f + g existe est mesurable La partie de S sur laquelle f + g existe est 


{x € S tel que (f(x), g(x)) Æ (+00, —0), (f(x), g(x)) Æ (—00,+00)}. (14.287) 


Nous avons 
{(f,g) = (+00, —-)} = {f = oo} n {g = —-w} (14.288) 


33. Définition 14.8. 
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qui est un ensemble mesurable parce que, par exemple, 


{+00} = ([n, +00]. (14.289) 


n>1l 


Le cas (—%0,+0) est identique, et au final la partie de S sur laquelle f + g n’existe pas est 
mesurable. Par complémentarité la partie sur laquelle f + g existe est également mesurable *. 


(2) Idem pour la partie sur laquelle 1/f existe Idem. 


(3) Mesurabilité de Àf Si À = 0, nous avons une fonction constante dont la mesurabilité est 
évidente *. Nous supposons À > 0. Alors 


{Af <a}={f <a/}}jer. (14.290) 
Pour À < 0 nous avons de la même manière 
{\f <a}={f>a/} er. (14.291) 


Ce dernier point est suffisant pour que Àf soit mesurable par le théorème 14.93(3) et par 
complémentarité. 

(4) Mesurabilité de f+g Soit a € R; le théorème 14.93 nous demande d’avoir envie de 
prouver que {f + g <a}e F. Nous avons 


f(x) + g(x) < a (14.292) 
si et seulement si 
f(x) <a— g(x) (14.293) 
si et seulement si 
1q € Q tel que f(x) < q < a — g(x). (14.294) 
Donc 
{f+g<a}=(]J({f<ants<a-d), (14.295) 
gen 


qui est une union dénombrable d'éléments de F. Donc {f+g < a} e F et f+g est mesurable. 
Note qu’en toute rigueur il faudrait « nlà où f + g est définie » un peu partout, mais cela 
ne change rien parce que l’intersection de deux parties mesurables est mesurable. 


(5) Mesurabilité de 1/f Soit a € R. Si a > 0 alors 


Q/f<a}={f<ouif>i}er. (14.296) 


et si a < 0 alors : 
(Sa = SOUS ETeF (14.297) 


(6) Mesurabilité de fg Nous allons la prouver en plusieurs fois. 


(6a) Si f est mesurable alors f? est mesurable Si a < 0 alors {f? < a} = @.Si a > 0 
nous avons 


{f<a}={-Va<f<yva}er. (14.298) 

(6b) fl4 est mesurable Soit AE F, et prouvons que f 14 est mesurable. Par définition, 
f(x) sixeA 

il _ 14.299 

(14) { (14.299) 


34. Parfois on a envie de dire que l’affirmation « À est mesurable » ne passe pas le test de Popper. 
35. Prenez quand même le temps d’y penser. 
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Nous posons 


A . L L (14.300) 
et _ 
fr: . a (14.301) 
Alors nous avons 
(Laf)(x) = be , u | 4 (14.302) 


Les ensembles À et 4° forment une partition mesurable dénombrable de $. La fonction 
f1 est mesurable; pour prouver que f2 est mesurable, nous l’écrivons f2 = f © j4 où 
jA: À — $S est l'injection canonique. L'application 


jA: (4, F4) — (S,F) (14.303) 


est mesurable parce que si B € F alors j1"(B) = ANBE F1. D'autre part l’application 


fi: (SF) — (R, Bor(R)) (14.304) 
est mesurable par hypothèse. La composée f> — f o j4 est alors mesurable par la 
proposition 14.43. Le lemme de recollement 14.100 nous donne alors la mesurabilité de 


fla. 


(6c) Le produit fg est mesurable Nous posons 


— 


F={xes tel que |f(x)| < +0,|g(x)| < wo}. (14.305) 


En tant qu'intersection de deux ensembles mesurables, F est mesurable. Par la partie 
précédente, les applications f; = filr et g,y = glr sont mesurables. L'application 
f1 + g: S — R est encore mesurable. Par conséquent l’application 


fin = =((f +) — fi — gi) (14.306) 


1 
2 
est mesurable. 


Voyons maintenant ce qui se passe en dehors de F. Nous allons utiliser le lemme de 
recollement sur la fonction 


(fig)(x) sirxeF 


—00 sitreU 

(fg)(x) = (14.307) 
0 site V 
+00 sireW 


où F,U,V,W forment une partition mesurable dénombrable * de S. Pour le sport nous 
montrons que {4 est mesurable : 


( ) ( ) 
U ({f = +00} n {g < 0}) ( ) 
U ({g =—o}n{f> 0}) (14.308c) 
U ({g = +o} n{f < 0}). ( ) 


36. Définition 14.99. 
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ooABKWooPbfS0Z 
Proposition 14.102. 
Si fn: S — R est une suite de fonctions mesurables, alors les fonctions inf, f, et sup, fn sont 
mesurables. 


Démonstration. Nous avons les découpages 


{inf fa < a} = [J{fn <a}eF (14.309) 


nm 


et 


Eupf<a=-(Nn<der. EgoonYkVonpp qu 


Le théorème 14.93 permet de conclure. 


Note : pour (14.310) nous ne pouvions pas utiliser les inégalités strictes parce que {sup,, fn < a} 
n’est pas spécialement égal à (,, {fn < a}. 


LEMooMGUUooMGwknZ 
Lemme 14.108. 
Soient des fonctions mesurables f;: ® — R (i=1,...,n). Alors la fonction 
:Q—R 
À (14.311) 
ze max{fi(z),..., fn(x)} 
est mesurable. 
14.104. 
La proposition 14.102 nous permet de définir les parties positives et négatives de f par f* = 
sup(f,0) et f— = sup(—f,0). Ce sont des applications mesurables. Nous avons les décompositions 
fe (14.312) 
FRE (14.312b) 
CORooNXYUooEcvD1P 


Corolaire 14.105. 
Si f: S —R est mesurable alors les applications Fa 
cations S — R*. 


et |f| sont mesurables en tant qu'appli- 


Démonstration. Nous faisons la preuve pour f*. Nous savons que f*: $ — R est mesurable par 


la proposition 14.102. Nous considérons l'injection canonique j: R* — R et 
Tu 

fi . (14.313) 

ze f(x). 


Alors ff = jo f* est mesurable. Et c'est bien cela que nous voulions. 


Note : f* et f° sont exactement les mêmes fonctions. Elles ne diffèrent que par la tribu que 
nous considérons sur l’espace d'arrivée. Nous allons à partir de maintenant les noter toutes deux 


LME 


Remarque 14.106. 
L'application |f| peut être mesurable sans que f le soit. Soit en effet une partie À & F, et posons 


J(æ) = l __. (14.314) 


—1 sixe À°. 


Alors f-!({1}) = A n’est pas mesurable alors que |f|(x) = 1 pour tout x. 
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Il est temps d’aller relire les définitions 10.42. 
PropooMFIBooJzaleK 


Proposition 14.107. 
Si les fonctions fn: S — IR sont mesurables alors les fonctions lim sup f, et liminf f, sont mesu- 
rables. 


Démonstration. Par le lemme 10.44 nous écrivons limsup,, fn(x) = infn>1supz>h fk(x). Pour 
chaque k nous considérons la fonction g; = sup,>7 fn. Par la proposition 14.102, les fonctions 


gx sont mesurables. En utilisant encore la même proposition, infh>1 9K est encore mesurable. 
PropooDXBGooSFqrai 


Proposition 14.108 ([133]). 
Si fn: $ — R est une suite de fonctions mesurables dont la limite ponctuelle existe, alors la limite 
est mesurable. 


Démonstration. Si la limite existe, elle est égale à la limite supérieure par le lemme 10.45. Or la 
limite supérieure est mesurable par la proposition 14.107. 


14.6.2 Fonction étagée 
DefBPCxdel 


Définition 14.109 ([134]). : : 
Soit (S,F) un espace mesurable et une fonction f: S — (R, Bor(R)). Îl serait dommage de 
confondre les trois concepts suivants. 


— Une fonction simple est une fonction dont l’image est constituée d’un nombre fini de 
valeurs. 


— Une fonction étagée est une fonction simple qui est elle-même une fonction mesurable. 


— Une fonction en escalier est une fonction étagée dont les valeurs sont constantes sur des 
intervalles : ce sont donc des fonctions constantes par morceaux. 


Dans les trois cas, la fonction f peut être écrite comme somme de fonctions caractéristiques : 
p 
f(x) = Ÿ a;l4,(x) (14.315) 
j=1 


où A; = f l(a;). Ce qui change est la nature des À. 
— Si f est simple, les A; sont quelconques. 


— Si f est étagée, les À; peuvent être choisis mesurables parce que {a;} est un borélien, ce qui 
fait de À; = f (a) un choix mesurable. 


— Si f est en escalier, les À; sont des intervalles. 
Définition 14.110. 


La forme canonique d’une fonction simple f est la suivante. Soit {@;};=1 
prises par f et A; = f-l(a;). La forme canonique de f est alors 


…t les valeurs distinctes 


, 


l 
f= D aila. (14.316) 
i=1 


LEMooNWLTooCDuRQI 
Lemme 14.111. 
Si f est une fonction simple dont la représentation canonique est 


l 
f =) œl4, (14.317) 
i=1 


alors 


(1) les A; sont disjoints, 
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(2) l’union est égale à tout l’ensemble : S = U); Ai. 


ii Avertissement /question à la lectrice !! 14.112 
Le lemme 14.113 et le théorème 14.115 disent la même chose alors que la preuve du théorème 14.115 
est beaucoup plus compliquée.La démonstration du lemme serait fausse ? 

M'est avis que ce que le théorème donne en plus est la convergence uniforme en cas de fonction 


bornée. La suite (14.318) ne va pas converger uniformément. 
LemYFoWqms 


Lemme 14.113 (Limite croissante de fonctions étagées[1]). 
Soit f: (S,F) — R une fonction positive mesurable. Il existe une suite fn: S — R de fonctions 
étagées positives telles que fn — f ponctuellement et fn < f. 


Démonstration. Nous considérons (q,) une suite parcourant tous les rationnels positifs *’ avec 
go = 0 pour être sûr. Pour n € N nous définissons la fonction 


fn(x) = max{q tel que à < n, gi < f(x)}. F0 OKI To GETEN 


L'ensemble sur lequel le maximum est pris n’est pas vide parce que go = 0. La fonction f, est simple 
parce qu’elle ne prend que n valeurs différentes. Nous avons aussi, par construction, f,(x) < f(x). 
Et aussi pour tout x € S, f,(x) — f(x), parce que Q est dense dans R. 

En ce qui concerne le fait que f, soit mesurable, nous notons {r0,...,r1} l’ensemble des 
{qo, -.., 4n} classés dans l’ordre croissant. Nous posons en plus r,+1 = +00. Nous avons alors 


fn (rs) = {ze S tel que f(x) > ra, f(x) < rx} = {f > rx} N {f < rer}. (14.319) 


En tant qu'intersection de deux ensembles mesurables, le théorème 14.93 dit que f} (rx) est 


mesurable. 


Remarque 14.114. 
Pour avoir f, < |f| nous pouvons poser 


sue . tel que à (14.320) 


min{g; tel que à 
THOooXHIVooKUddLi 
Théorème 14.115 (Théorème fondamental d’approximation, thème 24[419, 431, 435]). 
Soit un espace mesurable (S, À). 


(1) Soit une fonction mesurable f: S — [0,+00]. Alors il existe une suite croissante de fonctions 
En: S — [0,+00[ étagées Ÿ positives dont la limite ponctuelle est f. 


(2) Si de plus f est bornée, la convergence est uniforme. 
(3) Idem pour f à valeurs dans R ou C. 


Démonstration. Nous découpons l'intervalle [0,n] en plusieurs morceaux. 


{ ot (14.321) 


n, | sk = n27, 


Nous posons 8, x = f AS) Ce sont des ensembles mesurables parce que f est mesurable. Et de 
plus, pour chaque n, la suite (S, x)x>0 est une partition mesurable finie de S. Nous posons 


On = D ons (14.322) 


C'est-à-dire que sur chaque $,,, nous approximons f par le bas. La fonction w, est étagée et 
positive : 0 < w,(x) < f(x) par construction. 


37. Nous rappelons que Q est dénombrable et dense dans R par la proposition 10.16. 
38. Définition 14.109. 
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Croissance Nous allons voir que @n < Pn+1. Soit k £ n2".Sixe S, x alors w,(x) = S et 
nous avons aussi la décomposition 


Sn,k = Sn+1,2k U Sn+1,2k+1:- (14.323) 
Site Sn+1,2k AlOTS Pn+1(T) = Sr EE Le = Pn(x). Et si re Sn+1928+1 alors 


2kR+1 k+i 
Pre) = Sr = 5 > Pn(z). (14.324) 


Il reste à traiter le cas x € {f > n}. Dans ce cas nous avons w,(x) = n. Il y a encore deux 
cas à traiter : 
{f>zn}={fefnn+1[}u{fefn+1,ol]}. (14.325) 


Pour plus de simplicité dans les notations, nous notons n = n2”, c’est-à-dire que J, 3 est le 
1,4 avec le k le plus grand possible. Nous avons 


na = [nn+i1[u[n+1,00] (14.326) 


Le premier élément se décompose en 141% avec k < n + 1 (nous préciserons plus tard 
exactement les valeurs de k) tandis que le second est [n +1,œ]= 1,12. 


Pourzes, +1nF1 NOUS avons 


n + 1)27+1 
Pn+1(€) = _ = n+1> Yn(x). (14.327) 


Si au contraire f(x) € [n,n + 1[ nous devons précisément voir quels sont les k qui font en 
sorte que /h+1x% recouvre [n,n + 1[. Le plus petit k est donné par + = n, c'est-à-dire 
k = n2"*l et le plus grand k est donné par HET < n+1, c'est-à-dire & = 2%+l{n +1) — 1. 
Donc si f(x) e [n,n + 1[ alors x e S,+11 avec 


RES ES (nd Dore (14.328) 
Dans ce cas 
k n2+i 
Brit) = on+1 Z on+1 =n— Pn(t). (14.329) 


Convergence ponctuelle Si f(x) < © alors il existe * n9 € NN tel que f(x) < no. Pour 
n > no nous avons f(x) < n et donc w,(x) se calcule à partir d’un des intervalles de taille 
1727 


k+1 
on 


(14.330) 


Donc 
1 


ne) — f(x) < 35 (14331) 
ce qui signifie que limy_,0 Pn(æ) = f(x). 
Si f(x) = +0 alors f(x) > n pour tout n. Et alors w,(x) = n pour tout n, ce qui donne 
bien @n(x) — 00. 
Convergence uniforme Soit f bornée : 0 < f(x) < M pour tout x € $. Soit aussi € > 0. 
Nous prenons no > M tel que 56 < €. Alors pour tout n > no nous avons 


1 l 
0 < f(x) — nr) < a < Sn < €, (14.332) 
Notez qu'il n’y a pas de valeurs absolues parce que nous savons déjà que la limite est crois- 
sante. 


39. Le vrai snob citera ici le lemme 1.421. 
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ThofrestemesurablesXYYX 
Théorème 14.116 (Doob{[118]|). 
Soit une application mesurable“ X: Q — Rd. Une application Y : Q — RP? est Ax-mesurable si 
et seulement si il existe une fonction borélienne f : R4 — R? telle que Y = f(X). 


Démonstration. En séparant Ÿ par coordonnées, et en séparant, pour chacune, les parties positives 
et négatives, nous supposons que Ÿ est à valeurs réelles positives. Le théorème 14.115 dit qu’il existe 
une suite croissante d'applications Ax-mesurables et étagées 4%,: Q — [0,1 telles que wn — Y 
ponctuellement. 

Vu que y, est étagée, il existe des Ax-mesurables 4,7 € Q tels que on = DK 0 aklA,, AVEC 
ang > 0. Par la définition 14.6 de la tribu engendrée par une application, il existe un borélien 
Br € R tel que An = Xl (Br). Avec ça nous avons 


Sn 
En = D AnklA,s (14.333a) 
k=0 
= Ÿ anrlx-1(B,r) (14.333b) 
k 
= Ÿ ank(18,x ° À) (14.333c) 
k 
= > Ank 1 a) oX. (14.333d) 
k 
Nous posons 
fn: R—R+t 
en 14.334 
În = D Ank LB, ) 
k=0 


Pour x € R, il n’y a que deux possibilités. Soit x € X(Q), soit non. Si x n’est pas dans X(Q), 
alors il n’est dans aucun des B,,4 et nous avons f,(x) = 0 pour tout n. Si x e X(Q), alors il existe 
w € ( tel que x = X(w). Dans ce cas 


fn(x) = fn (X(w)) = Pn(w), (14.335) 
qui est croissante en n. De plus si x = X(w), nous avons 
fn(x) = Pn(w) — Y(w). (14.336) 
Nous avons donc montré que pour tout x, nr fh(x) est convergente : 


0 si ré X(Q) 


Y(w) six = X(w). SL 


n—00 


lim f(x) = 
Nous notons f = limy_ fn, et nous avons 


Yu) = lim pn(u) = lim (fr 0 X)(u)) = lim fn(X(w)) = F(X(u)) = (fo X)(w). (14.338) 


Nous avons donc bien trouvé une application f: IR — R telle que Y = f o X. 


14.6.3 Fonctions réelles à variables réelles 
Nous nous focalisons à présent sur le cas des fonctions 


f: (R; Bor(R)) — (R, Bor(R)). (14.339) 


40. Elle est notée X parce que l’application usuelle de ce théorème est en théorie des variables aléatoires. 
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NORMooNFOMooYnaf1N 
14.117 ([1}). 
Anticipons un peu pour expliquer pourquoi ce que nous allons faire maintenant est suffisant pour 
ce que nous avons en tête !. Toutes les fonctions mesurables 


f: (R; Bor(R)) — (R, Bor(R)) (14.340) 
seront à fortiori mesurables au sens de 
f: (R,£Leb(R)) — (R, Bor(R)) (14.341) 


où £eb(R)) est la tribu de Lebesgue sur R, c’est-à-dire la tribu complétée de celle des boréliens 
(définition 14.139). 


14.118. 
Nous allons maintenant donner quelques conditions pour que des fonctions soient mesurables au 
sens de la tribu des boréliens sur l’espace d’arrivée et de départ. Ces résultats seront donc immé- 
diatement applicables à la théorie de l'intégration où nous considérons la tribu de Lebesgue sur 
l’espace de départ. 

Autrement dit, les résultats présentés ici sont un peu plus forts que ce dont nous avons réel- 
lement besoin ...ou alors ce sont les hypothèses que nous allons poser en théorie de l'intégration, 


ui seront un peu plus fortes que nécessaires. C’est une question de point de vue. 
CorooJYDVooCrXVun 


Corolaire 14.119. 
Si I est un intervalle de R, alors toute application monotone f: 1 — R est borélienne. 


Démonstration. Puisque f est monotone, l’ensemble {f < a} est un intervalle. Or tous les inter- 
valles sont boréliens, donc f est mesurable par le théorème 14.93. 


Définition 14.120. 

Si T est un intervalle de R, une fonction f: 1 — KR est monotone par morceaux si il existe une 
suite strictement croissante de points (x;);ez dans T telle que f ait la propriété sur chacun des 
ouverts ]x;,%;+1[.. 


Remarque 14.121. 
Quelques remarques. 


(1) Dans cette définition, les points sont numérotés par Z et non par N parce que nous nous 
laissons la liberté d’avoir une infinité de points de chacun des deux côtés. 
(2) La notion de C1 par morceaux sera la définition 20.34. Attention : ce ne sera pas la même. 
PropooLNBHooBHAWiD 
Proposition 14.122. 
Soit 1 un intervalle de R et une fonction f: 1 — KR. Si f est continue ou monotone par morceaux 
sur T alors elle y est borélienne. 


Démonstration. L'ensemble {]x;,x;41[}jez L {æi}iez forme une partition mesurable dénombrable 
de I (les singletons sont des boréliens). À une belle redéfinition près de la numérotation (deux 
fois Z va dans NN), nous les appelons (1,),en, et nous définissons les fonctions f, comme étant les 
restrictions de f aux intervalles 1}. 
Toute fonction sur un singleton est mesurable. Toute fonction continue sur un ouvert est mesu- 
rable (théorème 14.53). Toute fonction monotone sur un ouvert est mesurable (corolaire 14.119). 
Le lemme de recollement 14.100 donne alors la mesurabilité de f. 


14.123. 
Toutes les fonctions que nous pouvons écrire explicitement sont mesurables ...en tout cas toutes 


41. Pour rappel, nous avons en tête de définir une théorie de la mesure afin d’y définir des intégrales. En particulier 
nous allons étudier l'intégrale de Lebesgue et en ce qui concerne R”, nous aurons la tribu de Lebesgue. 
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celles que l’on trouve en pratique. En effet nous avons déjà toutes les fonctions continues par 
morceaux via la proposition 14.122 et ensuite toutes les limites par la proposition 14.108. Cela 
donne les séries, les dérivées, les primitives, etc. 


14.7 Tribu produit 


14.7.1 Produit d’espaces mesurables 
DefTribProfG£fYTuR 


Définition 14.124. 
Si A1 et A2 sont deux tribus sur deux ensembles (1 et (2, nous définissons la tribu produit 
A1 © A2 comme étant la tribu engendrée par 


{X x Y tel que X € ÀA1,Y € A}. (14.342) 


Ces ensembles sont appelés rectangles de (Q:,.A1) @ (Q2,. 4). 
PropLJJWooKqW1Tr 


Proposition 14.125 ([436]). 
Soient deux espaces mesurables (S1,F1) et (S2,F2). Si C; est une classe de parties de S; avec 
F; = o(Ci) et S; EC. Alors 

ASP ol X Co) (14.343) 


Démonstration. Nous notons p1 et p2 les projections de S1 x S2 vers S5 et S:. Nous commençons 
par prouver que 


Fi @ F2 = o(pr (Fi) y ps; (P)). ea$GPBopEpAHEg 


En effet cette union est dans F1 @ F2 parce que ce sont tous des produits de la forme A; x S2 et 
S1 x A2 où À; € F;. Inversement, tous les produits de la forme A; x A2 sont dans la tribu engendrée 
par l’union parce que 

À; X A9 = (A: X S2) [A] (Si X A2). (14.345) 


Par conséquent, la partie pr (F1) U P> 1(72) engendre tous les produits qui engendrent la tribu 
F1 © F2. L'égalité (14.344) est donc correcte. 
Si C1 € C1 alors 


pr (Ci) = Ci X So = C X Co (14.346) 
et donc pr (C1) € C1 x C2. En utilisant le lemme de transport 14.45 nous avons alors 
_ _ = EqDQLYooV 
pr (A) =» (o(C1)) = o(p1 "(C)) € a(E1 x C2) nn VE 7) 
et de la même façon, Rs 
pz (F2) € (C1 x Co). É 1118) 


Vu les relations (14.347), (14.348) et (14.344) nous avons 
F1 ® F2 = o(pr (F1) LU pr (P2)) € o(C1 x Co). (14.349) 
Réciproquement, si C1 € C1 et C2 € C2 alors 


Ci x Co = (Ci x S2) n (Si x Co) = p' (Gi) np (Co) e F8 F2. (14.350) 


14.7.2 Le cas des boréliens 


Si X: et X2 sont des espaces topologiques et si nous notons O; l’ensemble de leurs ouverts, par 
définition Bor(X;) = o(Q;). De plus par la proposition 14.125 nous savons que 


(O1 x Où) = Bor(X1) ® Bor(Xo). FA0RMS opte 
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LemDEDQooJyzXgC 
Lemme 14.126. 
Si (X;,O;) sont des espaces topologiques, alors 


Bor(X1) ® Bor(X2) € Bor(X1 x X2) (14.352) 


Démonstration. Si À; € O; alors A1 x A2 est un ouvert de X1 x X2 (voir la définition 7.15). Par 
conséquent, O1 x O2 est contenu dans l’ensemble des ouverts de X1 x X2 ou encore 


Oi X Oo = Bor(X; X X2), (14.353) 
et donc 
o(Oi X Où) (est o(Bor(X: X X>)) (14.354) 
finalement, par (14.351) 
Bor(X1) @ Bor(X2) € Bor(X1 x X2). (14.355) 


Il n’y à en général pas égalité, mais nous allons immédiatement voir que dans (presque) tous 


les cas raisonnables, les boréliens sur un produit sont le produit des boréliens. 
PropNAAJooBPbjkx 


Proposition 14.127 ([436]). 
Soient (X1,d1) et (X2,d2) des espaces métriques séparables. Alors 


Bor(X1 x X2) = Bor(X1) @ Bor(X2). (14.356) 


Démonstration. Nous savons par le lemme 7.231 que tout ouvert de X3 x X2 est une réunion 
dénombrable d'éléments de O1 x O2. Donc tout ouvert de X1 x X2 est dans Bor(X1) @ Bor(X2). 
Par conséquent 

Bor(X1 x X2) € Bor(X1) @ Bor(X2). (14.357) 


L’inclusion inverse étant déjà acquise par le lemme 14.126, nous avons l'égalité. 


CorWO00ooHcoEEF 
Proposition 14.128. 
Les boréliens sur R\ sont ceux qu’on croit. 


(1) Bor(R?) = Bor(R) @ Bor(R) 
(2) Bor(R"*1) = Bor(R\) @ Bor(R) 


Démonstration. Cela n’est rien d’autre que la proposition 14.127. 


Proposition 14.129. 
Soit un espace mesurable (S, F) et des applications fr: S — R (k=1,...,N). Alors l'application 


f: (SF) — (RŸ,Bor(R")) 


(14.358) 
gr (fi(x),.…., fn(x)) 
est mesurable si et seulement si chacun des f; est mesurable. 
Démonstration. Division en deux. 
(1) Condition nécessaire Nous supposons que les f; sont mesurables. Nous avons 
“(IT Jak, bel) = {x € S tel que fi(x) € lai, if,--: fn(x) € Jan, bn} (14.359) 
= f fr (ar. bref) (14.359b) 


Cela est une intersection finie d'éléments de F et est donc un élément de F. Mais les pavés 
ouverts engendrent Bor(R\) parce qu'ils sont une base dénombrable de la topologie (pro- 
position 14.48). Le théorème 14.46 nous assure alors que f est mesurable parce que l’image 
inverse d’une base de la tribu est mesurable. 
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(2) Condition suffisante Si f est mesurable alors en particulier 


fo(laobl) = f'(Rx...xlabxRx...xR)er. (14.360) 


Pour cela nous avons utilisé la proposition 14.128 qui nous indique que le produit dans la 
parenthèse est un borélien de R\ en tant que produit de boréliens de R. 

Encore une fois f} l'tombe dans F pour une base dénombrable de la topologie de R et est 
donc mesurable. 


14.8 Mesure de Lebesgue sur R 
SecZTFooX1kwk 
Nous notons $ l’ensemble des intervalles *? de R. 


Proposition 14.130. 
L'ensemble des réunions finies d'éléments de S est une algèbre de parties de IR que nous allons 
noter As. 


Démonstration. Nous devons vérifier la définition 14.13. Les ensembles R et @ sont des intervalles 
et font donc partie de As. 

Si AE As se décompose en union d’intervalles de la forme (az,bx) avec k = 1,...,n (ici nous 
mettons des parenthèses au lieu de crochets parce qu’à priori nous ne savons pas). Alors 


nm 
A° = (J(br, ax) (14.361) 
k=0 
où nous avons posé bg = —00 et an:1 = +00. Ici encore les parenthèses sont soit fermées soit 


ouvertes en fonction de ce qu’étaient celles dans la décomposition de À. Quoi qu’il en soit, cette 
décomposition de AÀ° montre que À° € As. 
Enfin si À,B € As alors À LU B € As. 


Lemme 14.131. 
Tout élément de As admet une décomposition minimale unique en réunion finie d’intervalles. Cette 
décomposition est formée d'’intervalles deux à deux disjoints. 


Démonstration. Nous allons montrer que si À € As, alors la décomposition minimale consiste en les 
composantes connexes * de À. Pour cela nous rappelons que la proposition 10.52 dit qu’une partie 
de R est connexe si et seulement si elle est un intervalle. D’abord cela nous dit immédiatement 
que les composantes connexes de À forment une décomposition de À en intervalles. Nous devons 
prouver qu'elle est minimale. 

Soit {Cx}x=1..n leS Composantes connexes de À. Aucun connexe de R contenu dans À ne peut 
intersecter plus d’un des C%, et par conséquent nous ne pouvons pas décomposer À en moins de n 
intervalles. 

Pour l’unicité, soit {/4}=1...n un ensemble de n intervalles tels que (JF, 14 = A. Chacun des 
I, intersecte un et un seul des C4. En effet si x e 4 n Ci et ye 13 n C;, alors [x, y] € 14 parce que 
14 est un intervalle. Mais C; étant le plus grand connexe contenant x, [x,y] € C; et de la même 
façon, [x, y] € C;. Par conséquent C; et C'; sont tous deux la composante connexe de x et y. Nous 
en déduisons que C; = C;, c’est-à-dire à = 3. 

Par ailleurs nous avons 14 N 1, = @ dès que k Æ | parce que sinon l’ensemble 14% L 1, serait 
connexe et la décomposition des {/x}x=1..n ne serait pas minimale : en remplaçant 14 et 1; par 
I% L 1j on aurait eu une décomposition contenant moins d’éléments. Donc à renumérotation près 
nous pouvons supposer que 14 intersecte C} si et seulement si k — [. 

Dans ce cas nous devons avoir 1x = C%, sinon les éléments de C%\14 ne seraient pas dans 
UÜii li. 

42. Définition 1.21. 
43. Définition 7.67. 
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Définition 14.132 (longueur d’intervalle[422]). 
Si I est un intervalle d’extrémités a et b avec —00 < a < b < +0 alors nous définissons la 
longueur de T par 


b — ji —D<a<b< +00 
{(I) = ne S (14.362) 
© si a où b est infini 
Si AE As et si sa décomposition minimale est À = [Jr_, 1x, alors on définit 
nm 
£(A) = ÿ LH). (14.363) 


Le lemme suivant nous indique que nous pouvons calculer la longueur d’un élément de Ag sans 
savoir la décomposition minimale, pourvu que l’on connaisse une décomposition disjointe. 


LemIUQooEzHun 
Lemme 14.133 ([122]). 
Si 
p 
B=|JJ (14.364) 
r=1 
est une décomposition de B € As en intervalles deux à deux disjoints alors 
P 
&B) = ÿ A). (14.365) 


Démonstration. Nous prouvons dans un premier temps le résultat dans le cas où B = I est un 
intervalle. Soit Z un intervalle et une décomposition en intervalles disjoints 1 = (JF, J,.. Nous 
montrons qu'alors {(1) = ÿ}_, {(J,). Nous verrons ensuite comment passer au cas où B est un 
élément générique de À4s. 
(1) Si B = TI est un intervalle infini 
Si I est infini alors un des J, soit l’être et donc 37, {(J,) = o = #(I). 


(2) Si B = TI est un intervalle ininfini 


Pour chaque r = 1,...,p nous notons a; et b, les extrémités de J,. Vu que les J,; sont 
connexes et disjoints, si ax < & alors by < &, sinon l’ensemble (non vide) ]«, b4[ serait dans 
l'intersection 14 n 1, qui, elle, est vide. Plus généralement, si x € Jy et y € Jy avec x < y alors 
pour tout x’ e J4 et tout y € Jy nous avons x’ < y. Vu qu'il y a un nombre fini d’ensembles 
J,, nous pouvons les classer dans l’ordre croissant : 


a < bi < 42 < bo < ... < b_1 < a € b,. (14.366) 
Vu que les J, sont disjoints et que leur union est connexe nous avons en réalité 
a = à < bi = a2 < b2 = a3 <... < bp_1 = ap by, (14.367) 


donc une somme télescopique donne 


(TI) = b— a = » =) 20 (14.368) 
r=1 


(3) Si B n’est pas un intervalle Soit {1;}x=1..n la décomposition minimale de B. Alors 


à — {(B) — Se L(Tx) —= »' (U T4 [A] de) (14.369) 


Mais 1; est un intervalle et s’écrit comme union disjointe 14 = [J}_,(14 n J,), donc par la 
première partie 


h- 5 ÿ UN Je) = > ÿ: Un J). (14.370) 
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Ici J, est un intervalle qui se décompose en J, = [Jf_,(1x n J,), donc nous pouvons encore 
utiliser la première partie : 


A=D ), (14.371) 


ce qu'il fallait. 


LemPIOooRLkbo 
Lemme 14.134. 
Si À,B € As avec AC B alors {(A) < {(B). 


Démonstration. Nous avons évidemment B = AU B\A. Notons que B\A € As par le lemme 14.15. 
Si {/4} est une décomposition disjointe de À et {J;} une de B\A alors {14} L {J;} est une décom- 
position disjointe de À L B\A et le lemme 14.133 nous dit que 


4(B) = L(A V B\A) = £(A) + {(B\A). (14.372) 


Par conséquent {(B) > {(A). 


LemUMVooZJgMu 
Lemme 14.135. 
Si I est un intervalle et si il se décompose en 


NE (14.373) 
neN 


où les 1, sont des intervalles disjoints, alors 
00 
ii) = ) 4) (14.374) 
n=1 
Démonstration. Nous allons encore diviser la preuve en deux parties suivant que J soit de longueur 


finie ou pas. 


(1) Si Z est de longueur finie 


Soient a et b les extrémités de 7 : —co < a < b < +00. Pour tout N > 1 nous avons 


N N 
Din) = (JB) < 40). (14.375) 
n=1 


La première égalité est le lemme dans le cas d’une union finie 14.133. L’inégalité est le 
lemme 14.134. Cela étant vrai pour tout N, à la limite N — © nous conservons l'inégalité : 


N U(In) < ED). (14.376) 
> 


Nous devons encore voir l’inégalité inverse. Pour cela nous supposons que a < b. Sinon 
{(1) = 0 et tous les 7, doivent être vide sauf un qui contiendra seulement {a} (si 7 le 
contient). 


Soit € > 0 avec € < b — a et l’intervalle 
[a + rh = 1 = [a’,W] I. (14.377) 
Si les a, et le b, sont le extrémités des 1, alors 


Wver-|)re {ie 7 Un + el = (Jia, 8, [ (14.378) 


n>1l n>1l n>1 


1238 CHAPITRE 14. TRIBUS, THÉORIE DE LA MESURE, INTÉGRATION 


où nous avons posé a, = an — €/2"*? et b!, = bn + e/2"*2, Nous avons donc recouvert le 
compact # [a/,b/] par des ouverts. Nous pouvons donc en extraire un sous-recouvrement fini 
(c’est la définition de la compacité), c’est-à-dire une partie finie F de N telle que 


Rive Last (14.379) 
neF 
Le lemme 14.134 nous dit alors que 
O=H—a< (| Jia, BD < D (6, - a). (14.380) 
neF neF 


La seconde inégalité se prouve en recopiant “ la preuve de 14.16. Nous continuons le calcul : 


€ € 
O< D (bn— an) + D, nn Di (En — an) + >. (14.381) 
neF neF neF 
Mais b’ — a = (b— a) — 5, donc 
Ce DT (14.382) 
2 2 
neF 
D'où nous déduisons que 
(1)=b-a< D (bn—amn) +E€< D (bn—an)+e= D U(M)+e. (14.383) 
ner neN neN 
Cela étant valable pour tout € nous déduisons que 
tie » 4h). (14.384) 


neN 


(2) Si I est de longueur infinie 


Étant donné que I est un intervalle de longueur infinie, il doit au moins contenir un ensemble 
du type |—00, a] ou [a, +oo[ ; donc pour tout M > 0, il existe N > 1 tel que 


&(Ln[-N,N] > M. (14.385) 
Mais Zn [-—N,N] est un intervalle et 


IRAN] = [J BnI-NN] (14.386) 
neN 


qui est une union disjointe. Par conséquent, 


M < (IN [-N,N]) = Sn [-N,N]) < SA). (14.387) 


Cela étant vrai pour tout M > 0, nous concluons que 


SU) (14.388) 
neN 


Remarque 14.136. 

Pour la preuve de 14.135 nous ne pouvons pas classer les 1, en ordre croissant comme nous l’avons 
fait dans la preuve de 14.133. En effet si Z = [0,1] et que nous recouvrons [0, £[ et ]2,1] par une 
infinité d’intervalles chacun, nous ne pouvons plus les classer par ordre croissant. 


44. Lemme 10.20. 
45. Nous ne pouvons pas invoquer directement le lemme 14.16 parce que nous n’avons pas encore prouvé que £ 
était une mesure sur (R, 4s). 
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PropULFoodgXrR 
Proposition 14.137 ([122]). 
La fonction L ainsi définie est une mesure o-finie sur l’algèbre de parties As. 


Démonstration. Le fait que £ soit o-finie provient par exemple du fait que £ (]-n, n[) = 2n tandis 
que [J,,]-n,n[ = R. 

Nous devons à présent prouver que £ est additive. Soient (4;);en des éléments disjoints de As, 
avec leurs décomposition minimales 


n 
= LI (14.389) 
k=1 
Pour chaque à € NN, le lemme 14.135 nous indique que 
SA) (14.390) 
keN 


L'ensemble N * IN est dénombrable et nous pouvons considérer la décomposition 


Ua= (J 5. (14.391) 


ieN (i,k)EN xXN 
Cette décomposition n’est pas spécialement minimale * mais elle est disjointe. Le lemme 14.135 


donne 
u(JA4= D «= (5 ei) ) = S'HA). (14.392) 


(i,k)EN xXIN ieN \keN ieN 


La décomposition de la somme sur IN? en deux sommes sur IN est faite en vertu de la proposi- 
tion 11.112. 


14.8.1 Mesure et tribu de Lebesgue 
ThoDESooEyDUe 


Théorème 14.138. 
Il existe une unique mesure À sur (R, Bor(R)) telle que 


À(]a,b[) = b—a (14.393) 
pour tout a < b dans R. 


Démonstration. L'existence provient du théorème de prolongement de Hahn 14.77 : la mesure £ 
sur (As) se prolonge à o(As) = Bor(R). 

Nous ne pouvons pas prouver l’unicité en invoquant la partie unicité de Hahn (c’est tentant 
parce que £ est o-finie) parce que dans ce théorème nous ne fixons la valeur de À que sur une toute 
petite partie de As. Nous allons cependant voir que cette petite partie suffit à garantir l’unicité. 

La classe 

= {]a, b[ tel que — © < a < b < +} (14.394) 


est stable par intersection finie et engendre la tribu borélienne. En effet D contient toutes les boules 
et donc une base dénombrable de la topologie de R (proposition 7.130). Donc tous les ouverts de 
R sont dans o(D) et o(D) = Bor(R). Nous pouvons donc dire grâce au théorème 14.33 qu'il y a 
unicité de la mesure sur Bor(R) lorsque les valeurs sur D sont fixées. 


DefooYZSQooSOcyYN 
Définition 14.139. 
La mesure de l’espace mesuré (R, Bor(R), À) donné par le théorème 14.138 est la mesure de 
Lebesgue sur (R, Bor(R)). 
Nous définissons aussi la tribu de Lebesgue par la proposition 14.74 : (R, Leb(R), À) est 
l’espace mesuré complété de (R, Bor(R). À): 


46. A1 pourrait contenir [0,1] et A2 contenir ]1,2]. 
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Remarque 14.140. 
Il n’est pas évident que la tribu de Lebesgue soit plus grande que celle des boréliens, ni que la tribu 
des parties soit plus grande que celle de Lebesgue. Nous mentionnons cependant les faits suivants. 


(1) Il existe des ensembles mesurables non-boréliens, et cela ne nécessite pas l’axiome du choix. 
Un argument classique de cardinalité est donné dans [420]. La construction la plus explicite 
que j'aie trouvée est dans [437], mais ça a l’air de demander des connaissances précises sur 
les ordinaux. 


(2) Vu que l’ensemble de Cantor C' est mesurable de mesure nulle (proposition 14.159), tout 
sous-ensemble de Cantor est mesurable de mesure nulle parce que la tribu de Lebesgue est 
complète par définition. Le cardinal de P(C') est strictement supérieur à la puissance du 
continu, alors que le cardinal de l’ensemble des boréliens est au plus égal à la puissance du 
continu. Donc il existe des non boréliens contenus dans Cantor; de tels non boréliens sont 
alors mesurables au sens de Lebesgue. 


(3) Si nous admettons l’axiome du choix alors il existe des ensembles non mesurables au sens de 
Lebesgue. Nous en verrons un dans l'exemple 14.153. 


Exemple 14.141 (Un ouvert contenant tous les rationnels et de mesure arbitrairement petite). 
Il est possible de construire un ouvert de R contenant Q et de mesure de Lebesgue plus petite que 
€. Pour cela si (q) est une énumération des rationnels, il suffit de prendre 


00 
€ 
O= |] B(qn; ni (14.395) 


Cela est un ouvert comme union d’ouverts, ça contient tous les rationnels, et sa mesure se majore. 
En effet le théorème 14.138 donne X(B(qn: +)) — 5. Vu que ces boules ne sont à priori pas 
disjointes, le lemme 14.22 donne 

€ 


NO)< D, 


n=1l 


de (14.396) 


par (11.318) avec q = L. 

Par complémentarité, nous pouvons construire un ensemble fermé de mesure non nulle et ne 
contenant aucun rationnel. Et même un fermé dans [0,1], de mesure 1 — € ne contenant aucun 
rationnel. 

Cela peut surprendre parce qu’il existe des tonnes de suites d’irrationnels qui convergent vers 
des rationnels ”, et il semble difficile de créer un ensemble contenant beaucoup d’irrationnels tout 
en préservant la propriété de fermeture vis à vis des suites convergentes. A 


Exemple 14.142 (Mesure finie, non borné). 
Il existe des parties de R qui sont de mesure finie sans être bornés. Par exemple en posant 


4= Ü Bt, +5. (14.397) 


La partie À n’est pas bornée parce que que N € À. Mais en termes de mesure, 


00 
1 
X(4) < ÿ 7 < (14.398) 
n=1l 
en vertu de la somme de la série géométrique, proposition 11.122. AN 


14.8.2 Propriétés de la mesure de Lebesgue 


Proposition 14.143. 
Tout ensemble dénombrable de R est mesurable de mesure nulle. 


47. SigeQ etre R\Q alors la suite (q+r/ 10*) « est une suite d’irrationnels convergente vers le rationnel q. 
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Démonstration. Un point de R est un intervalle de mesure nulle. Si D est dénombrable, il est 
union disjointes et dénombrable de points. Le lemme 14.135 nous dit alors que sa mesure est 


MD) = EE A({ai}) = 0. 


Remarque 14.144. 
Il existe cependant des ensembles non dénombrables et tout de même de mesure nulle. Par exemple 
l’ensemble de Cantor (voir la proposition 14.159). 


PropooUACLooLMIUuY 
Proposition 14.145. 
La mesure de Lebesgue est invariante par translation, c'est-à-dire que si À est mesurable alors 
À(A) = À(A + à) pour tout réel a. 


Démonstration. Nous commençons par les intervalles ouverts : 
À, b[ + a) = X(Ja+ a,b+ af) = (b+ a) —(a+ a) = b— a = À(Ja,bf). (14.399) 


D'après ce qui est dit dans l’exemple 14.34, la mesure de Lebesgue sur les boréliens est invariante 
par translation. 

Si À est mesurable alors il existe un borélien B et un ensemble négligeable N tels que À = BON 
par la caractérisation 14.130b de la complétion. Alors A+a=B+abN+aet N + a est encore 
un ensemble négligeable. Donc À(A + à) = a(B + a) = À(B). 


La mesure £ définie sur l’algèbre de parties As (voir proposition 14.137). La proposition 14.17 
nous donne donc une mesure extérieure par 


X'(X) = inf{D (An); An € As, X € | JAu}. FaJGXoogdne 


La proposition suivante montre que cette mesure extérieure peut être exprimée seulement avec 
des intervalles ouverts. 


PropITNOooDcfwun 
Proposition 14.146. 
Nous avons 
XX) = inf{ >, {(ln); In sont des intervalles ouverts et X & LS (14.401) 
n>1 n 


Démonstration. Nous savons que dans la définition (14.400), chacun des À, est une réunion dis- 
jointe d’intervalles (pas spécialement ouverts) deux à deux disjoints ; donc 


X'(X) = inf{D (ln); € S,X | Ji}. (14.402) 


Soit € > 0. Si À © |), 1», pour chaque n > 1 nous considérons un intervalle ouvert J, tel que 
I € J, et {(1n) + % < {(Jh). Faisant cela pour chacun des découpages de X en intervalles nous 
trouvons 


X(X) < inf{y, Un) J\ est ouvert et X € U In} + €. (14.403) 
nm nm 

Étant donné que € est arbitraire nous avons l'égalité. 

PropMXIoojpKvd 
Proposition 14.147 ([422|). 
SiXCR est tel que X*(X) < © alors ItenCJUoozrDILi 
(1) Pour tout e > 0 il existe un ouvert (. tel que 

XcA. (14.404a) 
À) < XX) + €. (14.404b) 
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ItemGJUoozrDILii 
(2) Il existe une intersection dénombrable d’ouverts G telle que 
XcG (14.405a) 
À(G) = X(X). (14.405b) 
Démonstration. Pour (1), la proposition 14.146 nous a déjà dit que 
XX) = imf{y {(1n) l est un intervalle ouvert, X € LIRE (14.406) 
n nm 
donc si € > O, il existe des intervalles ouverts /, tels que 
*e U de (14.407a) 
nm 
D EIn) < X'(X)+ €. (14.407b) 
nm 
Si nous posons (: = [],, Z,, alors nous avons bien 
Xe, (14.408a) 
X(Q) < DER) < MX) + €. (14.408b) 
nm 


En ce qui concerne (2), pour chaque k > 1 nous considérons l’ensemble Q,,; obtenu comme 
précédemment avec € = 1/k et nous posons G = PE Q:;/,. Cela est une intersection dénombrable 
d’ouverts vérifiant X € G (parce que X € (:/, pour tout k) et donc A*(X) < À*(G) = A(G). De 
plus pour tout £ nous avons 


À(G) < (Qyr) < XX) + . (14.409) 
pour tout k. En faisant £ — © nous avons 
X(G) < (X). (14.410) 


Au final 
À(G) < X'(X) < X(G), (14.411) 


d’où l'égalité. 


Corolaire 14.148. 
Une partie N © R est négligeable si et seulement si X*(N) = 0. 


Démonstration. Nous savons que si N est négligeable il existe un borélien YŸ tel que N € Y avec 
X(Y) = 0. Par conséquent 
XN) < X(FY) = XF) = 0. (14.412) 


Pour l'implication inverse nous supposons que À*(N) = 0 et nous prenons l’ensemble G définit 
par la proposition 14.147(2) : c’est un borélien contenant N et tel que ÀA(G) = A*(N) = 0. 
L'ensemble N est donc négligeable. 


ThoHFXo0o0UNFRN 
Théorème 14.149 (Régularité extérieure de la mesure de Lebesgue). 
Pour tout mesurable À C R nous avons 
À(A) = inf{A(Q);Q ouvert contenant A}. (14.413) 


Démonstration. Nous commençons par le cas où B est un borélien. 


48. Définition 14.63. 
49. Au péril d’être lourd nous rappelons que À* est défini sur toutes les parties de MR. 
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(1) Si B borélien, À\(B) < © 
Soit e > 0; par la proposition 14.147(1) il existe un ouvert (. contenant B tel que À(Q.) < 
X*(B)+e. Vu qu'ici B est borélien, \*(B) = À(B) et nous concluons que pour tout € il existe 
un ouvert (. tel que 


BcQ (14.414a) 
À(Q) < A(B) +e, (14.414b) 
et donc 

À(B) = inf{A(Q); Q ouvert contenant B }. (14.415) 


(2) Si B borélien, ÀA(B) = +0 
Dans ce cas linfimum est pris uniquement sur des ouverts { tels que À(Q) = co. 


(3) Si À est mesurable non borélien 


Nous passons maintenant au cas où À est mesurable sans être borélien. Il s’écrit donc À = BU 
N avec B borélien et N négligeable par la proposition 14.66, et par définition ÀA(A) = À(B). 
Si Y est un borélien tel que N € Y et ÀA(Y) = 0 alors 


(A) = X(B) = inf{X(N) tel que A ouvert, B € (} FAP PAT Ua) 
< inf{A(Q) tel que Q ouvert, BUN CA} PP PE AT ED) 
< dnf AA(Q 0 Y”) tel que 9”, Y” ouverts, B € Q,Y crpaTHooppqEe) 
< nf, (97) + X(Y°) tel que À, Y’ ouverts, BcQ,Y ARS PAT en 
< inf {A(Q) tel que Q/ ouvert, B € Q} TOR, PPATES) 
= (B). (14.416f) 


Justifications : 
— (14.416a) Le cas borélien déjà fait. 


— (14.416b) Les ouverts tels que BU N € Q vérifient a fortiori B € (; nous avons donc 
agrandit l’ensemble sur lequel l’infimum est pris. 


— (14.416c) Parmi les ouverts ( qui recouvrent B LU N, il y a ceux de la forme (/ LU Y” où 
Q/ recouvre B et Y” est un ouvert contenant Y. Donc nous avons rétréci l’ensemble sur 
lequel l’infimum est pris et par conséquent agrandit l’infimum. 


— (144164) Mesure d’une union majorée par la somme des mesures. 


— (14.416e) Vu que Y est borélien, A(Y) = infy7 ouvert{ A(Y”) tel que Y € Y’} = 0. Donc 
pour tout (/ et tout e > 0, nous pouvons trouver un Ÿ”’ vérifiant les conditions tel que 
À(Q7) + À(77) < A(Q/) + e. 


Toutes les inégalités sont des égalités en en particulier (14.416b) donne 


À(A) = inf{A(Q) tel que ( ouvert, BU NC A}, (14.417) 
ce qu'il fallait. 
PropEZNoofLkVb 
Proposition 14.150 ([122]). No 
Si À est mesurable dans R et si e > O alors il existe un ouvert ( et un fermé F4 tels quel L . 
Fe AcQ. (14.418a) 
A(QA\FS) < €. (14.418b) 


Démonstration. Nous commençons par le cas où À est un borélien, que nous noterons B. 
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(1) Première étape 


Montrons qu’il existe un ouvert U. tel que 


Hell (14.419a) 
X(UA\B) < =. (14.419b) 
Si ÀA(B) < © alors le théorème 14.149 nous donne un ouvert U. tel que B € U. et A(U.) < 
À(B) + $. Nous avons alors 


X(QA\B) = AN) — À(B) < (14.420) 


NI 


Si par contre ÀA(B) = , nous posons B, = Bn[-n,n] et e, = e/2"T1. Pour chaque n nous 
avons un ouvert (, tel que 


Fed, (14.421a) 
€ 
À(G,,\ Ba) < TES (14.421b) 
Par conséquent en posant Q = [),., Q, nous avons ” 
Be (14.422a) 
XA\B) < A JR\B:)) < D AMQ\B) = 2. (14.422b) 
n n>1 2 


La première étape est terminée. 


(2) Deuxième étape 


Nous prouvons à présent qu'il existe un ouvert (Q. et un fermé F° tels que 


Fe Re; (14.423a) 
X(NA\B) < 5 (14.423b) 
AB\E,) < _ (14.493c) 


L'ouvert (., nous l’avons déjà de l’étape précédente. Pour le fermé, nous appliquons la 
première étape au borélien B°; ce qui nous trouvons est un ouvert G. tel que 


B° ce G (14.424a) 
X(GA\B°) < _. (14.424b) 


En posant F4 = G% nous avons un fermé tel que F4 € B et 
X(B\F.) = X(F°\B°) = X(GA\B°) < … (14.495) 


(3) Dernière étape 


Les ensembles F et ( trouvés à la deuxième étape donnent bien les relations (14.418). En 
effet Q.\F: = (Q.\B) LU (B\F:), donc 


AA.) < X(N\B) + MB\F.) = €. (14.496) 


Nous passons au cas où À — BL N est mesurable. Nous commençons par prendre les Q. et F+ qui 
correspondent à B : 

FecBEQ,. (14.427a) 

X(Q\FS) < €. (14.427b) 


50. Nous utilisons la petite relation ensembliste (U, An)\( U, Bn) CU, (An\Bn). 
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Soit Y un borélien tel que N € Y et ÀA(Y) = 0 puis un ouvert Y” tel que A(Y’) <e et Y € Y’. 
L'existence d’un tel Y”’ est assurée par la proposition 14.149 appliquée à Y. Nous vérifions que les 
ensembles Fe et ( LU Y” fonctionnent. En effet QU Y/\Fe € (Q.\F:) LU Y”, donc 


FeBUuNedur (14.428a) 
X((QA\E.)) < X(QA\F.) + AY) < 2e. (14.428b) 
Donc en réalité il faut choisir (9, F7 et A(Y”) < e/2. 
THOooJNMCooPMvCDq 
Théorème 14.151 (Régularité intérieure de la mesure de Lebesgue). 
Si À est mesurable dans R alors 
À(A) = sup{A(K); K compact contenu dans A}. (14.429) 


Démonstration. Par la proposition 14.150 nous avons 


X(A)= sup  X(F). FATPERO ARE) 


F fermé dans À 


Pour un tel F nous posons K, = F n[-n,n] qui est compact °! et contenu dans B. De plus le 
lemme 14.23(2) nous dit que 
ÀX(F) = Jim ÀA(Kn) (14.431) 


Donc tous les À(F) peuvent être arbitrairement approchés par un ÀA(K) avec K compact dans 4, 
et le supremum (14.430) n’est pas affecté en nous restreignant à prendre des compacts contenus 
dans B : 

À(A) = sup X(F) = sup AK). (14.432) 


F fermé dans À K compact dans À 


14.8.3 Fonctions mesurables 


Lemme 14.152. 
Soit une fonction f : R — R mesurable telle que A(f Æ 0) > 0. Alors il existe une partie mesurable 
M et m > 0 tels que (M) > 0 et f(x) > m pour tout x € M. 


Démonstration. Nous notons 
D ={xeR tel que f(x) > 0}, (14.433) 


et nous supposons que À(D) > 0 pour fixer les idées (si ce n’est pas le cas, nous prenons pour D 
la partie où f est strictement négative). 
Nous posons 


Ai = [L,co[ (14.434a) 
A (14.434b) 
n n—l 


Ces parties À, sont disjointes ; donc les parties 


Dh = {re R tel que f(x) € A} (14.435) 
sont également disjointes. Vu que [J, 4, = ]0,00[, nous avons D = UN Dr. Vu que 
00 
X(D) = Ÿ X(Dh) > 0, (14.436) 
n=1 
il existe au moins un N tel que A(Dy) > 0. Pour x € D nous avons 
1 1 
E An = : 14.4 
(a) € An = [El (14437) 


Donc pour x € Dn nous avons f(x) > +. 


51. parce que fermé et borné, théorème de Borel-Lebesgue 10.24. 
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14.8.4 Ensemble de Vitali (non mesurable) 
EXooCZCFooRPgK;j;j 


Exemple 14.153 (Un ensemble non mesurable au sens de Lebesgue[438]). 
Nous considérons l’ensemble quotient R/Q:; chaque classe intersecte l'intervalle [0,1]. Grâce à 
l’axiome du choix (voir 1.9) nous pouvons construire un ensemble V contenant un représentant 
dans [0,1] de chaque classe. Un tel ensemble est un ensemble de Vitali. Nous allons prouver 
que V n’est pas mesurable. 

Supposons que V soit mesurable. Alors tous les ensembles de la forme V + q (q € À) sont 
mesurables et ont même mesure par la proposition 14.145. Nous posons 


= [J W+pcet-12. (14.438) 


Cela est une union disjointe d’ensembles mesurables. Donc 


X(A4)= D, AV +0). (14.439) 
qe R 
—1<q<l 


Vu que À € [-1,2] nous avons À(A) < 3 et donc tous les termes de la somme doivent être nuls. 
Nous avons donc À(A) = 0. 

Prouvons toutefois que [0,1] € À, ce qui serait une contradiction. Soit x € [0,1]: il est dans 
une des classes de R/Q et donc il existe v € V tel que x — v € Q. De plus x,v € [0,1], donc 


—1<xz-v<l. (14.440) 


Cela fait que x € V + (x — v) € À. Nous avons donc x € À et donc [0,1] € A. En conséquence de 
quoi nous aurions À(A) > 1. A 


14.8.5 Ensemble de Cantor 


Nous considérons la fonction donnant l'écriture décimale des nombres définie en (11.343). 


DefIYDooVIDJs 
Définition 14.154 (Ensemble de Cantor). 
Soit Ko = [0,1[ et les ensembles K, définis par la récurrence 
l l 
Ki (GE) U GE +2)). (14.441) 
L'ensemble 
K={\K, (14.442) 
nZ0 


est l’ensemble triadique de Cantor. 


Les principales propriétés de l’ensemble de Cantor sont qu’il est non dénombrable (proposi- 
tion 14.158) et borélien de mesure nulle (proposition 14.159). 


14.155. 

L'idée de base pour prouver que l’ensemble X est non dénombrable est que ses éléments sont les 
nombres qui s’écrivent en base 3 sans utiliser le chiffre 1. En prenant un nombre sans 1 écrit en base 
3, en changeant tous les 2 en 1 et en lisant le résultat en base 2, nous obtenons tous les nombres 
possibles en base 2 et donc une quantité non dénombrable. L'idée est donc simple et astucieuse. 
La mise en musique est un peu plus délicate parce qu’il faut faire attention aux queues de suites ; 
c’est pour cela que nous avons construit l’ensemble de Cantor en partant de [0,1[ et non de [0,1]. 


Le lemme suivant dit précisément ce que nous entendons en disant que les éléments de l’ensemble 
de Cantor sont les nombres qui s’écrivent en base 3 sans utiliser le chiffre 1. Nous rappelons que 
D3 est l’ensemble des suites constituées de 0, 1 et 2, et qui ne se terminent pas par une suite infinie 
de 2, voir 11.130 pour une définition précise. 
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LemAZGoosKzEm 
Lemme 14.156 ([1]). 
SoitneNetxe D3 (définition 11.130) ; nous avons pa(x) € Ky € si et seulement si œ1,...,7n € 
{0,2}. 


Démonstration. Nous procédons par récurrence en commençant avec n = 1. Si æ1 = 1 alors 


(x) os EL? (14.443) 
&)= e . | 
MNVES AS es 

Notons que w3(x) = 3 est impossible parce que ça demanderait une queue de suite de 2. Par 
conséquent pa(x) — [O, 1[\(3, 3[= K1. 


Nous passons à la récurrence. 


(1) Sens direct 
Nous supposons que æ1,...,%n+1 € {0,2} et nous montrons que w3(x) € Kh+1. Nous consi- 
dérons deux cas suivant que x: vaut 0 ou 1. Pour comprendre pourquoi nous divisons les 
cas suivant la valeur de x1 et non de x», faire un dessin de comment X} se transforme en 
Kh1 et remarquer dans X°, les deux premiers segments ne sont pas une division du premier 
segment de X1, mais bien une copie des deux segments de K1. 
Écrivons encore @3(x) : 


n+1 Tk 00 Tk 
gs(x) = ÿ, el > ge (14.444) 
k=1 k=n+2 
(la) Six; =0 Alors nous avons 
< Tk < Tk+1 
3p3(x) = » DEL ÿ, ee = pole. Mn ht) (14.445) 
k=2 k=1 
Vu que par hypothèse x2,...,2,+1 sont dans {0,2} nous avons 3w3(x) € K, par hypo- 


thèse de récurrence. Cela implique que w3(x) € Kn+1. 
(1b) Six =2 Alors 


2 _ Tk 
= 7 _ 14.446 
pa(x) 3 +2 GR” ( ) 
=2 
et 
. Tk+1 

3ps(x) -2= Ÿ 2e = p(T2,..., Tnt1s...), (14.447) 

k=1 


et donc là nous avons 3w3(x) — 2€ K,, ce qui implique encore w3(x) € Kn+1. 


(2) Sens réciproque 


Nous devons maintenant prouver que w3(x) € Kh+1 implique æ1,...,%n+1 € {0,2}. Par le 
même calcul que précédemment nous avons soit 


3pa(x) = para, ...,Tn+1,--.), (14.448) 
si æ1 = 0, soit 
3p3(x) — 2 = p3(%2,...,Æn+1,...), (14.449) 


si æ1 = 2. Dans les deux cas, si x, = 1 pour un certain 2 < ! < n + 1, alors l'hypothèse de 
récurrence donne que ces éléments ne sont pas dans K, et donc w3(x) pas dans Kh+1. 


CorSEDooJmeXt 
Corolaire 14.157 ([1]). 
En posant E = {x € D3 tel que x; Æ 1Vi} nous avons K = w3(E). Et plus précisément, v3: E — K 
est une bijection. 
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Démonstration. Nous divisons la preuve en trois étapes. 


(1) Image contenue dans À Sixe E et n € IN nous avons 71,...,%n € {0,2} et donc 
wa(x) € K, par la proposition 14.156. Donc 


ps(x) € () Kn = K. (14.450) 


(2) Injective L'application w3: E — K est injective parce qu’elle est déjà injective depuis D3. 


(3) Surjective Soit pe K € [0,1[. Vu que w3: D3 — [0,1[ est surjective (théorème 11.133), il 
existe x € D3 tel que w3(x) = p. Pour tout n nous avons w3(x) € K, et donc æ1,...,2, € {0,2} 
et donc au final x € E. 


PropTPPooDySbm 
Proposition 14.158 (|[1]). 
L'ensemble de Cantor est non dénombrable. 


Démonstration. Nous avons prouvé à la proposition 11.134 que l’ensemble D2 n’était pas dénom- 
brable. Nous allons à présent prouver que l’application 


ÿ: Do —K 


cr Yw3(c en remplaçant les 1 par des 2) 


(14.451) 


est une bijection. Le fait que #Ÿ soit injective est une conséquence du fait que ce soit la composition 
de deux applications injectives (le remplacement et 43). Il faut par contre montrer que l’image est 
égale à K, en notant qu’il n’est pas évident à priori que l’image soit contenue dans K. 


L'opération qui consiste à remplacer les 1 par des 2 est une bijection ID2 — IE. Le coro- 
laire 14.157 nous dit aussi que w3: IE — K est une bijection. En tant que composée de bijections, 
4 est une bijection. 


Étant en bijection avec D2 qui n’est pas dénombrable par la proposition 11.134, l’ensemble de 
Cantor n’est pas dénombrable. 


PropBEWooXZdKN 
Proposition 14.159 (Ensemble de Cantor). 
L'ensemble de Cantor”? est borélien, non dénombrable et de mesure nulle. 


Démonstration. Nous reprenons les notations de la définition 14.154. Le fait que l’ensemble de 
Cantor soit non dénombrable a été prouvé dans la proposition 14.158. 

L'ensemble de Cantor étant une intersection dénombrable de boréliens, il est borélien par le 
lemme 14.3. Vu que K, € [0,1[ nous avons FKn < à et + (Kn +2) > 3, donc K, est une union 
disjointe de 2” intervalles de mesure 2/3". Nous avons donc 


= G) (14.452) 


L'ensemble de Cantor étant contenu dans chacun des K,,, sa mesure est plus petite que la mesure 


de chacun des K, (lemme 14.22) et donc A(K) < (2)" pour tout n; ergo A(K) = 0. [ 


14.8.6 Mesure positive sans intervalle 


Vu que la mesure de Lebesgue est basée sur la mesure des intervalles et quelques extensions, 
nous sommes en droit de croire qu’une partie de mesure strictement positive de R doit toujours 
contenir un intervalle, éventuellement à partie de mesure nulle près. Eh bien non. 


52. Définition 14.154 
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EXooVZVIooXZvDaE 
Exemple 14.160 ([439]). 
Soient une énumération (g;) de Q n ]0,1[ et une suite (r;) telle que 7, r; < à. Quitte à prendre 
r; plus petit, supposons de plus que B(q;,r;) € [0,1]. 
Nous posons Jn = B(qn;Tn/2), J = [0 Jn et 


B = [0,1]\J. (14.453) 


Les parties J; ne sont pas disjointes, donc, en notant À la mesure de Lebesgue, 


00 


1 
O< X(J)< D AC) < &. (14.454) 
i=0 * 
Mais, par définition, l’union [0,1] = B L J est disjointe, donc 
1= À([0,1]) = À(J) + A(B). (14.455) 
Nous en déduisons que | 
5 < A(BIi< 1 (14.456) 


Je plaide que cette partie B ne contient non seulement aucun intervalle, mais qu’il est impossible 
de le compléter par une partie de mesure nulle pour obtenir un intervalle. 


Soit un intervalle Z dans [0,1]. Il existe q; € 1 et donc * 
Le ET. (14.457) 
Donc il n'existe pas de parties de mesure nulle qui, ajoutée à B, contiendrait 1. A 


Vous voulez un truc dingue à propos de la partie J de l’exemple 14.160 ? Le théorème 14.151 
nous dit qu'il existe dans J des compacts de mesure arbitrairement proches de À(J). Il existe donc 
des compacts non seulement de mesure strictement positive mais même de mesure assez grande, 
tout en étant infiniment découpés. 


14.9 Intégrale par rapport à une mesure 


14.161. 
Nous n’en avons pas encore terminé avec la théorie de la mesure, mais nous devons quand même 
définir les intégrales et voir quelques propriétés avant de continuer avec la mesure parce que la 


définition de la mesure sur un espace mesurable produit ** passe par une intégrale. 
NORMooFZEDoo!xSgLe 


14.162. 

En théorie de l'intégration, la convention est la suivante : pour une fonction f: X — IR, nous 
considérons sur À la tribu des ensembles mesurables au sens de Lebesgue sur X, tout en gardant 
celle des boréliens sur l’ensemble d'arrivée. C'est-à-dire qu’en théorie de l’intégration, c’est 


f: (X, Leb(X)) — (R, Bor(R)). (14.458) 


En particulier, f: IR" — IR” sera mesurable si pour tout borélien À de R"° l’ensemble f—1(A) est 
Lebesgue-mesurable dans IR”. 

Étant donné qu’il est franchement difficile de créer des ensembles non mesurables au sens 
de Lebesgue, il est franchement difficile de créer des fonctions non mesurables à valeurs réelles. 
L'hypothèse de mesurabilité est donc toujours satisfaite dans les cas pratiques. 

Voir aussi le point 14.117, et les résultats qui suivent. 


53. C’est ici que nous utilisons le fait que r; est choisi pour que B(q:,ri) ne déborde pas de [0,1]. Sinon il aurait 
fallu chipoter et prendre seulement une partie de la boule. 
54. Théorème 14.239. 
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14.9.1 Définition pour les fonctions à valeurs positives 


Voir le thème 30. 
Une mesure y sur un espace mesurable (Q,.4) permet de définir une fonctionnelle linéaire sur 
l’ensemble des fonctions mesurables Q — IR. Cette fonctionnelle linéaire est l’intégrale que nous 


allons définir à présent. 
DefTVOooleEst 


Définition 14.163. 
Soient (Q, A, ui) un espace mesuré ainsi que Y € A. Notre but est de définir 


J fdu (14.459) 
Y 


que nous nommons intégrales de f sur Y pour la mesure 11. 


(1) Fonction étagée Si f est une fonction étagée*”, et si sa forme canonique est f = > 014, 
alors nous définissons 


J fau = D'œu(Y n A5). Faoo6 Aro ff ao 
Y i 


(2) Fonction mesurable à valeurs positives Pour une fonction A-mesurable f : Q — [0,1] 
nous définissons l'intégrale de f sur Y par 


Î Jdu = sup { J du où d est une fonction étagée telle que 0 < Ÿ < FE CAO) 
Y Y 


Remarque 14.164. 

Toute fonction mesurable à valeurs dans [0, +] est intégrable (l'intégrale vaut éventuellement 
+00). Au moment où une fonction commence à prendre des valeurs positives et négatives, nous 
demandons à pouvoir intégrer séparément les parties positives et négatives. C’est pour cela que 
nous disons qu’une fonction f à valeurs dans R est intégrable si |f| l’est. 


14.165. 
Le nombre Fe f est défini directement par (14.461) complètement indépendamment d’une éven- 
tuelle limite limz_,0 F J. Cette limite sera traitée dans le lemme 14.254. 

NORMooXTGBooKDnAhZ 
14.166. 
Si la fonction n’est pas mesurable ? Alors nous n’avons pas défini son intégrale. Supposons la plus 
simple des fonctions non mesurables sur Q : la fonction indicatrice d’une partie non mesurable : 


J(x) = Ü (14.462) 


O0 sinon. 


où À € { n’est pas mesurable °F. 

Nous supposons que l’espace mesuré (Q,F,u) est complet (définition 14.65). Vu que À n’est 
pas mesurable, il n’est pas contenu dans une partie négligeable (parce que l’espace est complet), et 
nous voulons que l'intégrale ne soit pas nulle ; sinon on se demande bien à quoi sert une intégrale. 

Toute fonction étagée minorant f est forcément nulle en dehors de À. Dès que B est une partie 
mesurable de mesure non nulle dans À, le complémentaire de B dans À est encore non mesurable, 
et nous voulons encore que l’intégrale de f sur ce complémentaire soit non nulle. 

Mais comme À n’est pas mesurable et que 14 n’est le supremum d’aucune suite de fonctions 
mesurables (lemme 14.97), bien que le supremum qui définirait l'intégrale de f existe (toute partie 
de R a un supremum), il est sans espoir que ce supremum ait un sens que l’on puisse interpréter 
en tant que mesure de f. 


55. Définition 14.109. 
56. Ça existe, par exemple 14.153. 


14.9. INTÉGRALE PAR RAPPORT À UNE MESURE 1251 


LEMooHAUGooWITETb 
Lemme 14.167. 
L'intégrale d’une fonction positive nulle presque partout est nulle. 


Démonstration. Soient un espace mesuré (Q,.4, u), et une fonction mesurable f: Q — [0,00]. Nous 
posons 

Q, = {ze Q tel que f(x) # 0}. (14.463) 
L'hypothèse est que u(Q;) = 0. Nous devons prouver que " Jdu = 0. Vu que f est positive, nous 
utilisons la définition 14.460. Soit une fonction étagée positive Ÿ minorant f. Nous la décomposons 
en 


= D Vrla, (14.464) 
k=1 


où les Ax sont mesurables et 4% € [0,01[. Nous allons prouver que v;u(Ax) = 0 pour tout k, en 
séparant trois cas. 


(1) Si A4NQ; = Soit re Ar. Nous avons 


0 = p{x) = Yxla(x) = Yr. (14.465) 
k 


Donc x = 0. 
(2) Si AC Q4 Alors, par le lemme 14.22, n(Ax) < n(Q};) = 0 et donc Yxu(Ax) = 0. 
(3) Si A4NQ, #4 A4 Soit re A4%\Q.. Nous avons 


dr = d(x) < f(x) = 0, (14.466) 


et donc encore 4 = 0. 


Nous avons donc prouvé que pour toute fonction étagée positive minorant f, 


L vd = D duu(s) = 0. (14.467) 
Q k=1 


Le supremum est donc nul. 


14.9.2 Premières propriétés 


14.168. 
Si (Q,.4,u) est un espace mesurable, et si Y est un élément de À, nous avons l’espace mesurable 
(Y, Ay,uy) donné par 


— Ay={BnY tel que BE A}, 
— y = pb. 
Et là, nous arrivons à un problème de notations parce que e Jdu peut désigner l'intégrale de f 


sur Ÿ dans (Q,.4,u) ou l'intégrale de f sur ŸY dans (Y, 4;., uy). 
Heureusement, nous allons tout de suite montrer que ces deux choses sont identiques. 


Lemme 14.169. 
Soit un espace mesuré (Q, À, 1) ainsi que Y € A. Nous considérons une fonction f: ® — R* qui 
est A-mesurable et intégrable sur Y. 

Alors, avec des notations que j'espère être claires, 


(1) f est Ay-mesurable, 
(2) f est (Y, Ay, uy)-intégrable, 
(3) nous avons l'égalité 


| Îlr (14.468) 
(M Ay ny) 
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Démonstration. Nous considérons les deux ensembles suivants : 


S1 = {Ÿ étagées sur Ÿ et majorées par f|y} (14.469a) 
S2 = {4 étagées sur ( et majorées par f}. (14.469b) 


Nous considérons l’application suivante : 
S: Si — S9 
Y(x) sizeY (14.470) 


L'application s est une bijection. 
Pour Ÿ € Si nous avons 


nm 
= D Vrlaily (14.471) 
k=1 
avec À € Ay € À et 14, y : Ÿ — {0,1}. Nous avons aussi 


s(d) = D Vrla, (14.472) 
k 


avec 14,: Q — {0,1}. 
En ce qui concerne les intégrales de ces fonctions étagées, nous avons 


. = D Yxuy(ArNY) (14.473a) 
AY UY k=1 
L 5 7. nl) 
k=1 
| an (14.473c) 
CSL AH 


Justifications. Pour passer à (14.473b) nous avons utilisé d’abord que Ax € YŸ et ensuite que 
ay (4x) = u(Ax). 


Nous sommes maintenant prêts à prouver l'égalité du lemme. Nous avons ceci : 


| fly = sup{ d tel que Ÿ € S:} (14.474a) 

(M Ay ny) (M Ay ny) 
= sup{ s(ÿ) tel que Ÿ € Si} (14.474b) 

(YEQ,A,u) 
= sup{ 4 tel que 4 € So} (14.474c) 

(NEA, Au) 
= | f (14.474d) 

(YEN, Au) 

LemooPJLNooVKrBhN 


Lemme 14.170. 
Si (Q,A,u) est un espace mesuré et si BE À alors 


u(B) = [ 1dpui = [ 18. (14.475) 


Démonstration. La fonction caractéristique d’une partie mesurable est une fonction étagée dont la 
forme canonique est 1g = 1 : 1g +0 x Îge. Son intégrale est donc 


[rod = 1 x u(B) +0 x u(B°) = y(B) (14.476) 


parce que 0 x u(B°) = 0, même si 1(B°) = ©, comme nous l’avons convenu en 14.90. 
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PROPooGTMVooPHcrR1l 
Proposition 14.171 ([1}). 
Soient une fonction f: (Q, A, u) — R* et une fonction g intégrable sur Q telle que f < g. Alors f 
est intégrable. 


Démonstration. Une fonction étagée qui minore f minore également g. Donc l’ensemble sur lequel 
il faut faire le supremum pour définir e jf est inclus dans celui pour Le g. Le second supremum 
étant fini, le premier l’est également. 


LEMooSPOFooBxDEAV 
Lemme 14.172. 
Soient un espace mesuré (Q, A, 1), une fonction f: 9 — R* et Y € A. Nous avons : 


[ “= L flydu. EQooSBDKopPTDECr 


Démonstration. En plusieurs parties, selon la généralité. 


(1) Si f est étagée Nous posons f = 7, fklA, avec fx € R*. Dans ce cas, 


fly = » fklany (14.478) 
k 


est encore une fonction étagée. Donc nous avons d’une part 


[ fly = [ D ftlauny = D fe(Ar ax) (14.479) 
Q QT T 
et d’autre part, 
J fdu = feu( © A), (14.480) 
F k 
(2) Si f est à valeurs positives Nous posons 
S1 = {Ÿ étagées sur Q tel que 0 < Ÿ < fly} (14.481) 
et 
S2 = {dly tel que Ÿ étagée avec 0 < Ÿ < f}. (14.482) 


Nous prouvons que S1 = S2. 
Si ÿ € Si, alors 

O<Y<fly<f. (14.483) 
De plus comme # = 0 hors de Y nous avons d = V1y. 


Pour l’autre inclusion, soit 0 < Ÿ < f pour une fonction étagée Ÿ et montrons que Y1y € S1. 
L'application Y1y est étagée sur ( et vérifie 


0 < ly < fly (14.484) 


parce que Ÿ < f. 


(3) L'égalité à prouver Dans l'égalité 14.477 à prouver, le membre de droite est, d’après la 
définition 14.461, 


[ fly = sup{ 6 tel que Ÿ € Si}. (14.485) 
Q 


Il nous reste donc à prouver que fs f se calcule de la même façon avec les éléments de So. 
D'abord nous copions la définition : 


J = sup{ | d tel que 0 < Ÿ < f}. (14.486) 
Y Y 
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Ensuite nous réfléchissons un peu. Si 0 < Ÿ < f avec d = D}, Yx14,, alors 
J d = D H(Ar NY)ÿr = J dly = [ dly. (14.487) 
Y F Y (e) 
La dernière égalité est la partie déjà faite, à propos des fonctions étagées. Nous avons donc 


bien 
J Î = sup{ | s tel que 5 € So}. (14.488) 
Y Y 


14.9.3 Propriétés plus avancées 
14.9.3.1 Convergence monotone 


Le théorème suivant est très utile parce que le théorème fondamental d’approximation 14.115 


donne les fonctions étagées qu’il faut. 
ThoRRDooFUvEAN 


Théorème 14.173 (Théorème de la convergence monotone ou de Beppo-Levi[440]). 
Soit un espace mesuré (Q, À, u) et (fn) une suite croissante de fonctions mesurables à valeurs dans 
[0,0]. Alors la limite ponctuelle lim,_,« fn existe, est mesurable et 


MR = | ba nd EaFEA TRE) 


cette intégrable valant éventuellement 00. 


Démonstration. La limite ponctuelle de la suite est la fonction à valeurs dans [0,0] donnée par 
fie) = ln fc): (14.490) 


Ces limites existent parce que pour chaque x la suite f,(x) est une suite numérique croissante. 
Nous notons 


1 = [ fdu. (14.491) 


Nous posons par ailleurs 


Mn = [ fe. (14.492) 


Cela est une suite numérique croissante qui a par conséquent une limite que nous notons 1 — 
limy_0 1. Notre objectif est de montrer que 1 = 16. D'abord par croissance de la suite, pour tous 
n nous avons 1, < 10, par conséquent 1 < 15. 

Nous prouvons maintenant l'inégalité dans l’autre sens en nous servant de la définition (14.461). 
Soit une fonction étagée h telle que hk < f, et une constante 0 < C' < 1. Nous considérons les 
ensembles 


En = {x € Q tel que f(x) > Ch(x)}. (14.493) 


Ces ensembles vérifient les propriétés E, € En41 et [JF_, En = Q. Pour chaque n nous avons les 


inégalités 
[ În > ] Re c h. (14.494) 


Si nous prenons la limite n — © dans ces inégalités, 


lim | fn >C lim J h= c ho: (14.495) 
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Par conséquent limy_,0 { fn > C 1e h. Mais étant donné que cette inégalité est valable pour tout 
C' entre 0 et 1, nous pouvons l'écrire sans le C': 


im [> fr. F6) 


n—> 00 


Par définition, l’intégrale de f est donné par le supremum des intégrales de h où À est une fonction 
simple dominée par f. En prenant le supremum sur À dans l’équation (14.496) nous avons 


lim [ fn > [ f, (14.497) 


n— 00 


ce qu'il nous fallait. 


Remarque 14.174. 

La proposition 14.115 ainsi que le lemme 14.113 montrent qu’une fonction mesurable peut-être 
écrite comme limite croissante de fonctions simples. Cela permet de démontrer des théorèmes en 
commençant par prouver sur les fonctions simples et en utilisant Beppo-Levi pour généraliser. 


Remarque 14.175. 
Une des raisons de demander la positivité des fonctions f, est de n’avoir pas d’ambiguïté à parler 
d’intégrales qui valent 00. Si par exemple nous prenons Q = [0,1] et que nous considérons 


f(x) = É _ (14.498) 


Ce sont des fonctions intégrables, mais la limite étant la fonction 1/x, l'égalité (14.489) est une 
égalité entre deux intégrales valant 00. 


CorNKXwhdz 
Corolaire 14.176 (Inversion de somme et intégrales). 
Si (un) est une suite de fonctions mesurables positives ou nulles, alors 
00 Le] 
fu = D (14.499) 
i=0 i=0 


Démonstration. Nous considérons la suite des sommes partielles de (u») : fn(x) = Y 29 wi(æ). Le 
théorème de la convergence monotone (théorème 14.173) implique que 


Jim = [in Fe (14.500) 


Nous remplaçons maintenant f, par sa valeur en termes des u; et dans le membre de gauche nous 
permutons l'intégrale avec la somme finie : 


Jim S Ju = lbs Un (14.501) 
i=0 


i=0 


ce qu'il fallait démontrer. 


14.9.3.2 Lemme de Fatou 
LemFatouU0OQqyk 


Lemme 14.177 (Lemme de Fatou). 
Soit (Q,A,u) un espace mesuré et fn: ® — [0,0] une suite de fonctions mesurables. Alors la 
fonction f(x) = liminf f,(x) est mesurable et 


| liminf f,du < lim it | nd. (14.502) 
a a 
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Démonstration. Nous posons 


9n(x) = inf fi(x). (14.503) 


izn 


Cela est une suite croissance de fonctions positives mesurables telles que, par définition, 
Jim gn(x) = Jimint f,(&): (14.504) 
Nous pouvons y appliquer le théorème de la convergence monotone, 
ju foto) = fümint CE) (14.505) 
Par ailleurs, pour chaque à > n nous avons 


Jo < [a (14.506) 


en passant à l’infimum nous avons 


Jo < inf [# (14.507) 
izn 
et en passant à la limite nous avons 
fin inf fn = Jim Jo < Jim int | : lim inf inf fi. (14.508) 


L’inégalité donnée dans ce lemme n’est en général pas une égalité, comme le montre l’exemple 


suivant : 
1 es 
Red PA 7. (14.509) 
Ia] sit est impair. 


Nous avons évidemment gn(x) = 0 tandis que Vo2 ji = 1 pour tout 1. 

ThoooCZCXooVvNcFD 
Théorème 14.178 ([122]). 
Soient f,g des fonctions étagées positives °T sur (Q, A, u). Alors si a € [0,0] nous avons 


(1) 


[ (af)du = a | fdu. (14.510) 
F ” ITEMooBLEVooDznQTY 
(2) 
[ (f + g)du = Ï fdu +| gd. (14.511) 
F L L ITEMooUJRAooQkoQyD 


(3) Si ax e R* et si les fx sont étagées positives, 


JL D a) = > ak ([ fau) (14.512) 


Démonstration. En ce qui concerne le produit par un nombre, tout repose sur le fait que 
(af) (aa) = FT (ai), (14.513) 


ce qui fait que si la représentation canonique de f est f = Ÿ,; a;l 4, alors la représentation canonique 
de af est af = > ;(aa;)14,. Donc 


[ afdu = 2 aai(4) L Dr au(À;) = af fdy. (14.514) 


57. Pour le cas plus général, voir 14.186. 
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Pour la somme c’est plus lourd. Soient les formes canoniques 


f=) œl4 (14.515a) 
g= 7 b;ls,. (14.515b) 
j 


Vu que l’union des B; est ( nous avons l’union disjointe A; — U,; À; n B; et donc u(A;) = 
>; (Ai n B;). Nous avons donc pour les intégrales : 


[ fdu = > & D HA; n B;) (14.516a) 
[ gdu = D be D H(Bx N Ai). (14.516b) 
À k l 
Pour la somme : 
Ï fdu + Ï gdu = DC + d)u(Ax NB). (14.517) 
Q Q EI 


Nous devons maintenant évaluer [,(f + g)dy. Pour cela nous remarquons que si c € (f + g)(Q) 
(l’ensemble des valeurs atteintes pas f + g), alors nous notons 


Ie = {(k,1) tel que ax + b = c} (14.518) 
et nous avons 
{f+g=c}= L] (4nB), (14.519) 
(kDeIe 


et comme cette union est disjointe, nous pouvons faire la somme des mesures : 


n(f+g=ce)= ÿ u(4nB). (14.520) 
(kl)ele 


Cela nous permet de faire le calcul suivant : 


[ (f+g)dn= D, œ(f+g=0) (14.521a) 
. cœ(f+9)(Q) 
= Nc > u4&nB) (14.521b) 
æ(f+9)(Q) (KDE 
= D (ax + h)u(Ar NB) (14.521c) 
ce(f+9)() (RE 


Dans cette double somme, tous les couples (k,!{) sont tirés une et une seule fois parce qu’ils sont 
tous dans un et un seul des J,, donc 


I (f + g)du = >, > (ag + b)u(Ax N Bi) (14.522a) 
L ce(f+g)(Q) (kDETe 
= N (ar + b)u(Ax N Bi) (14.522b) 
(k) 
= [ fdu + [ gd. (14.522c) 
Q A 


Remarque 14.179. 

Si f = Jyarl4, n’est pas une décomposition canonique, il n’en reste pas moins que chacun des 
14, est la forme canonique de lui-même. Donc le théorème 14.178 s’applique et nous avons quand 
même 


[ fdu = Ÿ axu(A). (14.523) 
eo k 


1258 CHAPITRE 14. TRIBUS, THÉORIE DE LA MESURE, INTÉGRATION 


PROPooOUVDEooDJvDau 
Proposition 14.180. 
Soient deux fonctions mesurables f,g: ® — [0,+c]. Alors 


[Lu +9) = [ + [ g- (14.524) 


Démonstration. Soient des suites f, — f et 91h — g fournies par le théorème fondamental d’ap- 
proximation 14.115. Par le théorème de la convergence monotone 14.173 nous avons d’une part 


ln, [Qu + on) = [ur +9 (14.525) 


n—00 e 


et par le théorème 14.178 nous avons d’autre part 


lim Cu + on) = jm (fn + Jan) = [+ fo (14.526) 


n—00 


où nous avons encore utilisé la convergence monotone. 
En égalant les deux, nous avons notre résultat. 


14.9.4 Fonctions à valeurs réelles 


L'intégrale d’une fonction à valeurs dans [0,+00] étant faite, nous passons aux fonctions à 


valeurs dans [—c0,+0|. 
DefTCXooAstMY1 


Proposition-Définition 14.181 ([1]). 
Soit une fonction mesurable f: Q — IR. Nous considérons les deux fonction suivantes à valeurs 
dans [0, +c] : 


42 JO si f(x) <0 

J7 (x) = Fe si f(x) > 0. (14.527a) 
0 si f(x) > 0 

f (@) = . C0 (14.527b) 


. . + ame 
Nous avons À, |f| < © si et seulement si |, f* < oo et À, f— < co. 
Dans ce cas nous disons que f est intégrable au sens de Lebesgue et nous posons 


[ = [ fe [ f- EqUHSopNÉ EU 


Démonstration. Vu que f est mesurable, les fonctions f* et f- sont également mesurables et nous 
avons l'égalité 
fl= ST +. (14.529) 


La proposition 14.180 nous dit alors que 


[ fl = [ FR [ (14.530) 


Dans cette égalité, tous les nombres sont dans [0, ]. Le membre de gauche vaut +00 si et seulement 
si au moins un des deux de droite vaut +00. 


Nous verrons comment donner un sens à Fe f dans certains cas où f n’est pas intégrable sur Q 
dans la section 14.13.7 sur les intégrales impropres. 
Nous définissons aussi 


a(F) = [ J (14.531) 


si f est une fonction mesurable sur (. 
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LEMooMWKToo!IKomSiw 
Lemme 14.182. 
Pour f:Q —R nous avons (,,|f| < 0 si et seulement si \,, f existe et est finie. 


Démonstration. Deux sens. 


(1) = La proposition 14.181 nous indique que a fret Fe Jf_ sont finies. Dans ce cas, la partie 
« définition » de 14.181 donne ,, f = f, f* — f, 7 < 0. 


(2) = Nous n’avons défini 5 f que dans le cas où les intégrales de f* et f— sont finies. 


Ce lemme justifie pourquoi nous appelons l’espace L! l’espace des « fonctions intégrables ». 


Remarque 14.183. 
Dans R, quasiment toutes les fonctions et ensembles sont mesurables. En effet la construction 
d’ensembles non mesurables demande obligatoirement l’utilisation de l’axiome du choix; de tels 
ensembles doivent être construits « exprès pour ». Il y a très peu de chances pour que vous tombiez 
sur un ensemble non mesurable de R sans que vous ne vous en rendiez compte. 

Il y en a un en l'exemple 14.153. 


Remarque 14.184. 
« Mesurable » ne signifie pas « intégrable ». Par exemple la fonction 


f:R—R 


. siw£0 (14.532) 
ww 
do si uw — (0. 


est mesurable, mais non intégrable. 


14.9.5 Additivité de l’intégrale 
LemPfHgal 


Lemme 14.185. 
Soit une fonction f: Q — R telle que |f(x)| < g(x) pour tout x € À. Si g est intégrable, alors f 
est intégrable. 


Démonstration. La fonction g est manifestement à valeurs réelles positives. La proposition 14.171 
nous dit alors que |f| est intégrable. Ensuite c’est au tour de la proposition 14.181 de conclure à 
l’intégrabilité de f. 


PROPooFIYEooCpdmwZ 
Proposition 14.186. 
Soient deux fonctions intégrables sur (S,F,u) et à valeurs dans C. Alors f + g est intégrable et 


[Lu + g)du = [ fdu + L gd. (14.533) 


Démonstration. En plusieurs étapes suivant la généralité de f et g. 


(1) Si f et g sont étagées et positives C’est le théorème 14.178(2) déjà prouvé. 


(2) Si f et g sont à valeurs positives Le théorème fondamental d’approximation 14.115 nous 
permet de considérer des suites croissantes de fonctions étagées positives (fx) et (gx) qui vé- 
rifient fr — f et gx — g. 


Pour chaque k nous avons 


[Gi + ad = [au + [and Fee Oo g IE 
S S S 


De plus, la suite & + fx, +94 est une suite croissante de fonctions étagées positives convergeant 
vers f + g. Le théorème de la convergence monotone 14.173 nous permet donc de passer à 
la limité dans (14.534) et de permuter toutes les limites avec toutes les intégrales, des deux 
côtés. 
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(3) f et g à valeurs réelles Il faut diviser le domaine en de nombreuses régions suivant les 
signes de f, g et f + g. 


Nous prouvons à présent l’additivité de l’intégrale pour des unions finie. Une version pour les 


unions dénombrables sera donnée dans les propositions 14.203 et 14.204. 
PropOPSCooVpzaBt 


Proposition 14.187 (o-additivité finie). 
Si A, B € Q sont des parties disjointes de (Q, A, hi) et si f: Q —R est intégrable sur À L B alors 
les intégrales \, f et |, f existent et 


Lr=fr+pr (14.535) 


Démonstration. Vu que À et B sont disjoints, La, = 14 + Ip. En utilisant alors le lemme 14.172 
et la proposition 14.186 nous avons le calcul 


Los fase frasfnse frs (14.536) 


14.9.6 Fonctions à valeurs vectorielles (dimension finie) 


Nous voulons intégrer des fonctions du type 
JA —V (14.537) 


où (? et V sont des espaces vectoriels. Nous expliquons à présent plus précisément le cadre. 
NORMooTQBIooBaScjt 


14.188. 
Nous considérons à présent un espace vectoriel normé (V,|.|) de dimension finie, et un espace 
mesuré (Q,.4,u). 

Attention à ne pas confondre espace de départ et espace d’arrivée. Vu que V est un espace 
topologique, nous avons bien entendu les boréliens de V, et pour peut que nous ayons une mesure 
sur V (qui qui n’est pas compliqué à créer à partir de celle canonique de R” et un isomorphisme), 
nous avons déjà une définition de V3 Jfdu lorsque f: V — KR. 

Ici nous nous proposons non d'intégrer f: V — R mais bien f: (Q,A,u) — V où V est un 
espace vectoriel normé. 

Le lemme suivant est le point de départ pour définir les intégrales de fonctions à valeurs dans 
un espace vectoriel de dimension finie. Pour les fonctions à valeurs dans un espace de dimension 
infinie (par exemple de Banach), il existe des choses, mais c’est un peu plus compliqué. 

LEMooCVHDooLJASAs 
Lemme 14.189 ([1]). 
Soit un espace vectoriel V réel de dimension finie, muni de la norme N. Soient une base {e;} de V, 
et une fonction f: (Q, A,u) — V telle que la norme N(f):Q — R* soit intégrable. Nous notons 
fi les composantes de f : f(x) = ÿ; fi(x)e:. 

Alors pour chaque 1, 

(1) la fonction | fil: Q — R* est intégrable, 
(2) la fonction fi:  — R est intégrable. 


Démonstration. Si V était un espace muni d’un produit scalaire, et si la base {e;} était ortho- 
normée, ce serait facile parce que la norme majore toutes les composantes. Hélas, ce n’est pas 
spécialement le cas. La base {e;} n’est pas spécialement orthonormée et même la norme N ne 
dérive pas spécialement d’un produit scalaire. 

Nous allons utiliser l’'équivalence de toutes les normes en dimension finie (théorème 11.46) pour 
nous ramener au cas d’une norme euclidienne. 
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Nous considérons sur V la norme « euclidienne » construite sur la base {e;} : | D wie;| = ÿ;, [vil 
Par équivalence des normes nous avons des nombres non nuls À et À tels que 
N(v) < Av, (14.538) 
et 
fu] < AN (v) (14.539) 
pour tout v € V. Pour un à fixé nous avons alors les majorations 
N(fi(z)ei) < Mlfi(r)eil < MI f(x)| < MAIN (F(x)): (14.540) 
En posant N; = N(e;) nous avons la majoration * 
A2 
j < ——N 14.541 
| f(x) Ne) (F(x)) ( ) 
L'application 
ART 
il (14.542) 
ze |fi(x)| 


est donc une fonction à valeurs réelles positives, majorée par une fonction intégrable (la fonction 
ze N(f(x))). Elle est donc intégrable par le lemme 14.185. 
La fonction f; elle-même est alors intégrable par la proposition 14.181. 


Notons que ce lemme est en réalité très simple si V est un espace vectoriel normé dont la norme 
découle d’un produit scalaire, comme c’est le cas pour C. D'ailleurs, il ne faut pas se voiler la face : 
le cas d’intégrales de fonctions à valeurs dans C sera dans le Frido le cas de loin le plus courant. 
À , 4 . 

À ce propos, nous n’avons pas encore défini ce que nous voulons noter ls du lorsque f est une 


fonction à valeurs vectorielles. Comblons vite ce manque ... 
PROPoo0FSMooLhqUsc 


Proposition-Définition 14.190 ([1]). 
Soit une fonction f: Q — V où V est un espace vectoriel normé de dimension finie. Soit une base 
{e;} de V. Si la fonction | f|: ® — R* est intégrable, alors 


(1) toutes les composantes f;: ® — R sont intégrables, 


(2) le vecteur 
2 se PRoon GEO EU 
7 


ne dépend pas de la base choisie. 


Dans ce cas, la fonction f est dite intégrable et nous définissons 


[ Jdu = XIE Jije:. (14.544) 


Démonstration. Le fait que les composantes soient intégrables est le lemme 14.189. Soient deux 
bases de V, {e;} et {sa}, liées conformément à (4.219) par la relation s4 = Ÿ}; Q;ve; pour une 
certaine matrice inversible Q. Nous avons pour tout x € Q : 


f(œ) =) fi(æ)ei =). fa()sa (14.545) 


avec fa(x) = »; fi(x)Q:i par la proposition 4.115. 

Notons pour être pointilleux que les ensembles {e;} et {s,} ne sont pas indexés par le même 
ensemble, de telle sorte que f; ne peut pas être confondu avec f,, même lorsqu'on attribue des 
valeurs à à et à «. 


58. Vous notez l’utilisation de la condition (3) de la définition 7.149 de la norme pour « convertir » la norme N 
en valeur absolue. 
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Comme combinaisons linéaires des fonctions f; qui sont intégrables, les fonctions f, sont inté- 
grables (proposition 14.186). En écrivant {| f par rapport à la base {s,} nous trouvons : 


JL J AE | J > Hte)Q, de) ÿ Que, (14.546a) 
a a À j 
= Z [E A)QsQudre, (14.546b) 
j ai 
— > ftadre, (14.546c) 
J 
- (| "e. (14.546d) 
j 


où nous avons permuté des sommes finies et des intégrales des fonctions f;, à valeurs dans KR en 
vertu de la proposition 14.186 


La proposition suivante est, pour les intégrales à valeurs vectorielles, analogue à la proposition 


14.181. 
PROPooNSCPooCMkrZl1l 


Proposition 14.191. 
Soit une fonction mesurable f: Q — (V,{|.]). Soit une base {e;} de V et la décomposition f — 


D ee 


Nous avons équivalence entre ITEMooYLADooCXKEds 
(1) Sal < © ITEMooLEYEooQTGunt 
(2) Salfil < © ITEMooYDDAooMKwDIR 


(2) fe ce ei <a 


Démonstration. L’équivalence entre les points (2) et (3) est la proposition 14.181. Nous démontrons 
l’équivalence entre (1) et (2). 

Vu que toutes les normes sont équivalentes sur V, nous considérons en particulier la norme 
associée à la base {e;} donnée par 


N(x) = > (2. (14.547) 
i 
Il existe des constantes À et À telles que 


MD ()|) < |f(æ)| < N(> 1i(x)l) (14.548) 


pour tout x € (1. 
La première inégalité dit que si {, |f| < c, alors MY; (, |f —il) < 00. Et vu que chacun des 
termes est positif, ils sont tous finis. 
La seconde inégalité donne l’implication réciproque. 


14.9.7 Quelques propriétés 


Le lemme suivant nous aide à détecter des fonctions presque partout nulles. 
Lemfobnwt 


Lemme 14.192. 
Soit f une fonction mesurable positive ou nulle telle que 


[ fdu = 0. (14.549) 
Aa 


Alors f = 0 u-presque partout. 
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Démonstration. L'ensemble des points x € Q tels que f(x) Æ 0 peut s’écrire comme une union 
dénombrable disjointe : 


{x e A tel que f(x) # 0} = Ü E; (14.550) 
avec 


Eo = {x € Q tel que f(x) > 1} (14.551a) 


E; = {x € ( tel que - - < FE) < (14.551b) 
i+l i 
Si un ne ensembles Æ; est de mesure non nulle, alors nous pouvons considérer la fonction simple 
h(x) = : 1g, dont l'intégrale sur ( est strictement positive. Par conséquent le supremum de la 
définition (14.461) est strictement positif. 
Nous savons donc que u(E;) = 0 pour tout ti. Étant donné que la mesure d’une union disjointe 
dénombrable est égale à la somme des mesures, nous avons 


u{x € Q tel que f(x) Æ 0} = 0, (14.552) 
ce qui signifie que f est nulle 4-presque partout. 
CorjLYism 
Corolaire 14.193. 
Soit f une fonction mesurable sur l’espace mesuré (Q, À, u) telle que 
[ A it (14.553) 
Q 
Alors f < 0 presque partout. 
Démonstration. Nous avons l'égalité d’ensembles 
{f15>0 # 0} = {1;>0 # 0}. (14.554) 


Mais lemme 14.192 implique que f1r-0 est nulle presque partout, c’est-à-dire que la mesure de 
l’ensemble du membre de gauche est nulle par conséquent 


u{15>0 # 0} = 0. (14.555) 


Cela signifie que la fonction f est presque partout négative ou nulle. 


LEMooLXVGooUDuQzc 
Lemme 14.194 (|[1]). 
Soit un espace mesuré (Q, À, 1) ainsi qu’une partie X € À telle que 1(X) > 0. Si f: Q — R vérifie 
f > 0 sur X, alors 


] f>0. (14.556) 
X 
Démonstration. Nous posons, pour n € N, 
An = {xextel ee - } (14.557) 
n={veztelque = > f(x PPT ; 
Ao = {x € X tel que f(x) > 1}. (14.558) 


Nous avons l’union disjointe X = [J}°, Ai, et done p(X) = D u(Ai). Nous en déduisons qu'il 
existe à € N tel que u(4;) > 0. Nous posons alors 
v'X—-R 
0  siréA (14.559) 
Tr 
l/2i sixe À. 
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Cette fonction Ÿ est étagée et vérifie 0 < # < f. Comme l'intégrale de f sur X est le supremum 
des intégrales de ce type de fonctions, nous avons 


1 


[. fdu > [. Ydu = 3; H(Ai) > 0. (14.560) 


ii Avertissement /question à la lectrice !! 14.195 
Je n'ai pas vérifié le lemme suivant. Ecrivez-moi si vous avez une démonstration. 


LEMooVZXFooZAQWKY 
Lemme 14.196. 
Si fe L'(Q, A, y) et si f, fdu = 0, alors a(A) = 0 
14.9.8 Permuter limite et intégrale 
14.9.8.1 Convergence uniforme 
PropbhKknth 


Proposition 14.197 (Permuter limite et intégrale). 
Soit fn — f uniformément sur un ensemble mesuré À de mesure finie. Alors si les fonctions fn et 
f sont intégrables sur À, nous avons 


Jim [. Un [. Jim fn. (14.561) 
Démonstration. Notons f la limite de la suite (f,). Pour tout n nous avons les majorations 
[sauf raul< [1 ra (14.562) 
< [lé fodu (14.562b) 
= H(A)| fn — flo (14.562c) 


où (A) est la mesure de A. Le résultat découle maintenant du fait que | f, — fl — 0. 


Il existe un résultat considérablement plus intéressant que cette proposition. En effet, l’intégra- 
bilité de f n’est pas nécessaire. Cette hypothèse peut être remplacée soit par l’uniforme convergence 
de la suite (théorème 14.198), soit par le fait que les normes des f, sont uniformément bornées 
(théorème de la convergence dominée de Lebesgue 14.200). 

ThoUnifCvIntRiem 


Théorème 14.198 ([441]). 
La limite uniforme d’une suite de fonctions intégrables sur un borné est intégrable, et on peut 
permuter la limite et l’intégrale. 

Plus précisément, soit À un ensemble de u-mesure finie et f,: À — R des fonctions intégrables 
sur À. Si la limite f, — f est uniforme, alors f est intégrable sur À et nous pouvons inverser la 
limite et l'intégrale : 

Jim ; = [. Jim fn. (14.563) 
Démonstration. Soit € > 0 et n tel que | fn — fl < € (ici la norme uniforme est prise sur À). 
Étant donné que f, est intégrable sur À, il existe une fonction simple w, qui minore f, telle que 


Def 


La fonction w, + € est une fonction simple qui majore la fonction f. Si 4 est une fonction simple 
qui minore f, alors 


< €. (14.564) 


[. Ù < [. Pn+Ee< [. În + eu(A). (14.565) 


Par conséquent le supremum qui définit ( À J existe, ce qui montre que f est intégrable. Le fait qu’on 
puisse inverser la limite et l'intégrale est maintenant une conséquence de la proposition 14.197. 
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Remarque 14.199. 
L'hypothèse sur le fait que À soit de mesure finie est importante. Il n’est pas vrai qu’une suite 
uniformément convergente de fonctions intégrables est intégrables. En effet nous avons par exemple 


la suite 
: 
fa(æ) = See (14.566) 


0 sinon 


qui converge uniformément vers f(x) = 1/x sur À = [1,00{. Le limite n’est cependant guerre 
intégrable sur À. 


14.9.8.2 Convergence dominée de Lebesgue 
ThoConvDomLebVdhsTf 


Théorème 14.200 (Convergence dominée de Lebesgue). 
Soit une suite de fonctions (fn)nen sur (9, A, u) à valeurs dans © ou R. Nous supposons que 


(1) Pour chaque n nous avons fn € L'(Q, A, p), 
(2) fn — f simplement presque partout sur Q, 
(3) Il existe une fonction g € L'(Q) telle que 


[n(x)| < gx) (14.567) 


pour presque 5 fout ze { et pour tout n E N. 
Alors 
(1) f est intégrable, 
(2) mn Vo fn = Vo 
(3) limy-s00 fo ln — f| = 0. 


Démonstration. La fonction limite f est intégrable parce que |f| < g et g est intégrable (0. Par 
hypothèse nous avons 
—g(x) < fn(x) < g(x). (14.568) 


En particulier la fonction 9n = fn +g est positive et mesurable si bien que le lemme de Fatou 14.177 
implique 


[ liminf g9n < lim it | On: (14.569) 
a (o 


Évidemment nous avons liminf g, = f + g, de telle sorte que 


[ + fs < imint | 9, = imint | + Je (14.570) 


et le nombre ( g étant fini, nous pouvons le retrancher des deux côtés de l'inégalité : 
E XGKR. 
J Far J À. HookGKRo Aus 


Afin d'obtenir une minoration de { f nous récrivons (14.571) pour la suite de fonctions k, = —f, — 
k = — f : 
[* < liminf J he (14.572) 


En utilisant le lemme 10.47, nous obtenons 


-[; < imint | -f, = “tnsup | (14.573) 


59. Si il n’y avait pas le « presque » ici, ce théorème serait à peu près inutilisable en probabilité ou en théorie des 
espaces L?, comme dans la démonstration du théorème de Fischer-Riesz 27.44 par exemple. 
60. Par le lemme 14.185 
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et donc 
imsup | f, < J' (14.574) 
En combinant avec (14.571), nous avons la suite d’inégalités 
lim sup | fu < [ < lmint | £. (14.575) 


La limite supérieure étant plus grande ou égale à la limite inférieure, les trois quantités sont égales. 
Nous prouvons maintenant le troisième point. Soit la suite de fonctions 


hn(x) = |fn(x) — f(x) (14.576) 
qui tend ponctuellement vers zéro. De plus 
Rn(z) < |fn(z)| + 1f()1 < 2g(x), (14.577) 
ce qui prouve que les h, majorés par une fonction intégrable. Donc 
lim [ [fn — f] = lim [ hA{z)dr - | lim |fn(x) — f(x)| = 0 (14.578) 


Remarque 14.201. 
Lorsque nous travaillons sur des problèmes de probabilités, la fonction g peut être une constante 


parce que les constantes sont intégrables sur un espace de probabilité. 
CorCvAbsNormwEZdRc 


Corolaire 14.202. 
Soit (ai)jen une suite numérique absolument convergente. Alors elle est convergente. Il en est de 
même pour les séries de fonctions si on considère la convergence ponctuelle. 


Démonstration. L'hypothèse est la convergence de l'intégrale {, |a|dm(i) où dm est la mesure de 
comptage. Étant donné que |a;| < |a;|, la fonction a; (fonction de à) peut jouer le rôle de g dans le 
théorème de la convergence dominée de Lebesgue (théorème 14.200). 


14.9.9 Additivité de l’intégrale de Lebesgque 


Les propositions 14.203 et 14.204 démontrent la même chose. La différence est la méthode uti- 
lisée pour permuter une somme et une intégrale. Dans le premier cas, nous utilisons la convergence 
monotone (et sommes obligés de séparer le cas où f est positive), alors que dans le second cas, nous 
utilisons la convergence dominée de Lebesgue, et nous ne devons pas faire de séparation d’après la 
positivité de f. 

PROPooTFOAooJBwmCV 
Proposition 14.203 (o-additivité dénombrable[1]). 
Si (A;);en sont des parties mesurables disjointes de (Q, A, u) et si f: Q — R est intégrable sur 
UE o Ai alors les intégrales fa, fdu existent et 


[ ” LS >| Fe (14.579) 


Démonstration. En deux cas d’après la positivité de f. 


(1) Si f est positive Nous posons fn = F1 À. Cette suite de fonctions vérifie la limite 
i=0 “ ? 


dim fu = flUe, A (14.580) 


De plus, pour chaque N nous avons 
N 


|. di [ru dE h À … ie : COS 


Justifications : 
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— La proposition 14.172 pour l'introduction de la fonction caractéristique de U), 4; 
— La proposition 14.187 qui traite le cas de la sous-additivité finie pour la dernière égalité. 


La suite (fnv)Aen est une suite croissante de fonctions mesurables 61 et positives. Donc le 
théorème de la convergence monotone 14.173 s'applique et 


00 N 
= | limf fn . = [ fdu. 14.582b 
|. No” ET U: A É 


(2) Si f est à valeurs réelles Si f est à valeurs dans R, alors f = f} — f_ où f+ et f- sont 
intégrables. Nous avons alors 


P Ai Le 12 + 1. = (14.583) 

2 [, Lu A J- (14.583b) 

_ ( Je - | f_) SURRRe ONF PAR, 
Ak Ag 


_ > [ f. SUBEQooVZNMaoR RE AL 


Justifications : 
— Pour (14.583c), c’est l’associativité de la somme, proposition 11.91. 
— Pour (14.583d), c’est la proposition 14.186. 


PROPooDWYNooWKJmEV 
Proposition 14.204 (o-additivité[442]). 
Soit un espace mesuré (Q, A, u). Nous considérons des parties disjointes {A;};en de ( telles que 
UE 0 4x = A. $i f € L'(Q), alors 


[ fdu = à [. fdp. (14.584) 


HSE Bo ot AP posons Q, = [Jr_9 Ar ainsi que fn = f1a,. Pour chaque N € N nous avons 


N 
> ] Fr | f EAeCAA SEEN 
k=0 Ar Uro 4x 

— J (14.585b) 


Qù 
L [I " SUBEQOoJZLQpoflQges 
A 


Justifications : 
— Pour (14.585a), c’est la proposition 14.187 qui traite du cas de sommes finies. 
— Pour (14.585c) c’est la proposition 14.203. 
L'idée est maintenant de passer à la limite des deux côtés de (14.585). Voici le raisonnement : 


— Nous montrons qu’à droite, la limite existe et vaut ” du. 


61. La fonction f elle-même est mesurable; c’est inclus dans la définition de « intégrable ». 
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— Le fait que la limite du membre de droite existe implique l’existence de la limite du membre 
de gauche. 


— La limite du membre de gauche vaut > di, du. 


La limite du membre de droite s’établi avec le théorème de la convergence dominée de Lebesgue 
14.198. 


— Nous avons convergence simple f, — f parce que Les À; = (1. 
— La fonction g = |f| est intégrable sur ( parce que f € L'(Q) par hypothèse. 


— Pour tout n € N et pour tout x € Q nous avons |f,(x)| < g(x) parce que |f,(x)| est soit égal 
à g(x) soit égal à zéro suivant que x € (, ou non. 


Donc le théorème de la convergence dominée est applicable. La limite du membre de droite de 
(14.585) existe et vaut : 


dim [ = [ Fe (14.586) 


Nous pouvons alors prendre aussi la limite du membre de gauche dans (14.585) et obtenir le résultat 
attendu. 


14.9.10 Produit d’une mesure par une fonction (mesure à densité) 
PropooVXPMooGSkyBo 


Proposition-Définition 14.205 (Produit d’une mesure par une fonction[1, 443]). 
Soit un espace mesuré (Q,F,u) et une fonction mesurable positive w: A — R*. Alors la formule 


(w : a)(A) = [. wdyi (14.587) 


pour tout À € F définit une mesure positive sur (Q,F) appelée produit de la mesure 1 par la 
fonction w. La fonction w est la densité de la mesure w : j1 par rapport à la mesure 1. 


Démonstration. D'abord (w : u)() = 0 parce que le lemme 14.170 donne 


de [uiodn - L Ga = 0 xt) 0 (14.588) 


où nous avons (éventuellement) utilisé deux fois la convention 0 x 00 = (. 
Ensuite si les ensembles À; sont des éléments deux à deux disjoints de F alors nous avons 
00 
Lo, 4, = Di LA, et donc 


(w - (40 -| 


où nous avons utilisé la o-additivité dénombrable de l’intégrale de la proposition 14.203. 


wap = > wap = D (w - u)(Ai). (14.589) 
i=0 Ÿ Ai i=0 


Lee] 
i=0 Ai 


En particulier nous parlons souvent de mesure à densité par rapport à la mesure de Lebesgue. 
C’est alors la construction suivante. 


Définition 14.206. 
Si u est une mesure sur R‘, une fonction f : RT — R est une densité pour si pour tout À € R 
nous avons 


A = [. Statde (14.590) 


où dx est la mesure de Lebesgue. 
Si la mesure u\ admet une densité, nous disons que c’est une mesure à densité par rapport à 
la mesure de Lebesque. 
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Exemple 14.207. 
Toutes les mesures n’admettent pas de densité. Par exemple la mesure de Dirac donnée par 


”. L si0e À EQooDMFCOpIEN AE 


O0 sinon. 
n’a pas de densité par rapport à la mesure de Lebesgue. A 


La mesure z de l’exemple 14.591 admet, au sens des distributions, la mesure de Dirac ô comme 


densité, mais c’est une autre histoire qui vous sera contée une autre fois. 
PropooJMWAooDzfpmB 


Proposition 14.208 ([143]). L 
Soit une fonction mesurable w: (S,F,u) — R*. 
(1) Si f: S — R+ est mesurable, alors f : (w : u) = (fw) : u. 
(2) Si f: S — R ou € est mesurable, elle est w : p-intégrable si et seulement si fw est u- 
intégrable. Dans ce cas, nous avons encore f * (w : u) = (fw) : pu. 


Attention : dans le cas où f est à valeurs dans ©, alors il faut que w soit à valeurs finies dans R 
parce que nous n'avons pas défini 0 x z lorsque z € C. 


Démonstration. Nous commençons par prouver le résultat pour la fonction caractéristique de l’en- 
semble mesurable A. Nous avons : 14 - (w : w)(B) = , Lad(w : us). Mais par définition, l’inté- 
grale d’une fonction indicatrice est la mesure de l’ensemble indiqué. En passant sur le fait que 
1418 = 148, 


] Lad(w : u) = (w : u)(An B) = J 14 pwdu = J l4lpzwdu = Ï Lawdu = (law) : u(B). 
B S S B 
(14.592) 
Supposons maintenant que f soit une fonction étagées qui s'écrit f = ÿ 4 axl4, où les Az sont 
des ensembles mesurables disjoints. Alors le calcul est le suivant, en utilisant le fait que sur A4, on 


a ax = f(x) : 


J:(g:°H)B =] fd(g : h) (14.593a) 
B 
= D ag : 4)(Ar NB) (14.593b) 
k 
= D ak 1 gdpe (14.593c) 
= ] J(x)g(x)du(x) (14.593d) 
AkNB 
= D (fg : u)(4x n B) (14.593c) 
k 
= (fg : x)(B) (14.593f) 


parce que les A4 n B forment une partition de l’ensemble B (voir le point (2) de la définition 14.18). 

Si f: S — R* est mesurable, le théorème 14.115 donne une suite croissante f, de fonctions 
étagées positives convergeant (ponctuellement) vers f. Vu que la fonction w est positive, nous avons 
aussi la limite positive et croissante wf, — wf. Aïnsi l’utilisation du théorème de la convergence 
monotone est justifié dans le calcul suivant : 


[rate - 0) nf pdt - 0) = im, [ (wfdu = [udu (14.594) 
S S S S 


Nous passons maintenant au cas général où f est une fonction à valeurs dans R ou € (avec w 
finie dans ce dernier cas). Nous avons la chaine d’équivalences 


æ f est (w : 1) intégrable 
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& |fl est (w : u)-intégrable 
& |flw est u-intégrable 
& |fw| est 1-intégrable. 

Si cela est le cas, la formule se démontre en se ramenant au cas déjà prouvé des fonctions 

positives en utilisant les (fw)* = f*w, (fw)- = f-w etc. 


14.9.11 Mesure et topologie 
EXooKQDRooVMWaEC 


Exemple 14.209 (Un compact n’est pas toujours de mesure finie). 
Soit l’espace mesurable (R, Bor(R)) réel avec ses boréliens et la fonction 


W: (R, Bor(R)) _ (R, Bor(R)) 


El six #0 (14.595) 
Tr 
+00 six =0. 


Essayons d’étudier la mesure de densité w par rapport à la mesure de Lebesgue. 


(1) w est mesurable Soit un borélien B de R. Si B ne contient pas © alors w-!(B) est un 
borélien de R par continuité de l'application restreinte w: R\{0} — R. Ici nous avons par 
exemple appliqué la proposition 14.122 à chacun des deux intervalles ]—00,0[ et ]0,00[. Si 
+00 € B alors 


w_1(B) = w!(B\{w}) U w 1({co}) = w71(B\{w}) U {0}, (14.596) 
qui est borélien par union de boréliens. 
(2) Mesure produit La proposition 14.205 nous assure alors qu’en posant ©? 
1 
at) = Ï te (14.597) 
g |®| 


où À est la mesure de Lebesgue, nous avons une mesure. 


(3) Mesure du singleton 


Pour avoir les idées claires, nous pouvons nous demander la mesure a({0}). Nous cela nous 
devons calculer 


Ï La Ï todite) (14.598) 
0 


0} FA 
où là, l’abus de notation n’est plus possible. Mais quelle que soit la fonction étagée h — 
D; &lA, considérée, 


l h(x)dA(x) = > œÀ(A; n {0}) = 0. (14.599) 
{0} i 


Attention : ceci n’a rien de particulier à la fonction x > 1/|x|. Lorsqu'une mesure a une 
densité par rapport à Lebesgue, la mesure d’un singleton sera toujours nulle. 


(4) Mesure de la boule compacte 


Il n’en reste pas moins que p([—1,1]) = 00. 
A 


14.210. 

En réalité, il n’y a pas de liens forts entre mesure et topologie. Un espace topologique est une 
chose, et y mettre une mesure en est une autre. Bien entendu, une topologie étant donnée, nous 
pouvons considérer la tribu des boréliens et y mettre une mesure un peu quelconque. Il n’y a pas 
de choix canonique. 


62. Avec un mini abus de notation : si 0 € B, cette notation n’est pas tout à fait correcte. 
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Notons que même dans l’exemple de compact de mesure infinie 14.209, la mesure introduite 
n’est pas sans lien avec la topologie de R. En effet pour avoir une mesure à densité par rapport à 
Lebesgue, nous avons dû prendre une application mesurable par rapport à la tribu des boréliens, 
laquelle est éminemment liée à la topologie. Il y a donc parfaitement moyen de construire des 
espaces mesurés tenant compte de la topologie, et ayant des propriétés qui ne sont pas celle 
attendues. 


Quand les choses sont faciles, ça se passe bien. La proposition suivante dit qu’une fonction 
continue sur un compact y est intégrable ; sauf que pour dire cela de façon précise, il faut un peu 


bosser parce qu’il y a de écueils à éviter, tels que l’exemple 14.209. 
PROPooKFRSooANZzg1T 


Proposition 14.211 (|1}). 
Soit un espace mesuré (K, A, u) et une fonction f: K — R. Nous supposons pas mal de trucs 
techniques : 


(1) La mesure est finie : u(K) < 00. 


, . . 63 
(2) L'ensemble K est par ailleurs un espace topologique compact *”. ITEMooBKYHoolnxUGL. 


(3) La fonction f est continue pour les topologies de K et de R. ITEMoo JCNUooJzI1KI 


(4) La fonction f est mesurable pour la tribu À de K et la tribu des boréliens de R. 
Alors f est intégrable sur K et | |f| < 00. 


L'hypothèse (4) ne se déduit pas nécessairement de l’hypothèse (3). Dans les cas usuels, nous 
avons bien « continue implique mesurable », mais si À n’a aucun rapport avec la topologie . ..hum 


Démonstration. Si nous écrivons f(x) = f*(x)— f(x) avec f* et f” prenant des valeurs positives 
ou nulles{444]|, en vertu de la proposition 14.181, si nous devons prouver séparément | jte 
fe f— < ©. Nous allons donc prouver cette proposition en plusieurs étapes. 


(1) Si f est positive La fonction f est continue sur X qui est compact (même en tant qu’es- 
pace topologique en soi ; il n’est pas nécessaire d’être compact dans quelque chose), donc elle 
a un maximum par le théorème 7.138 nommons M ce maximum. Donc f: X — [0, M]. De 
plus la mesure y sur K est finie et vérifie disons u(K) = m. 


Soit une fonction étagée h: K — R* majorée par f. Nous notons 


= D œl4,(x) (14.600) 
où les À; sont des éléments de A. Vu que 0 < h(x) < f(x) < M, nous avons °{ 
Le -ÿ œu(K n A) < D) My(K 0 À;) < My(K) = Mm (14.601) 
i=1 


parce que les À; sont disjoints et vérifient [J; 4; = K (lemme 14.111). 
Donc tous les éléments de l’ensemble sur lequel nous prenons le supremum dans la définition 
(14.461) sont contenus dans [0, Mm]. Le supremum est donc dans [0, Mm] et est alors 
strictement plus petit que l'infini. 

(2) Si f est positive ou négative Nous appliquons la première partie séparément à f* et 
f_. Et nous avons alors que f est intégrable et 


Lu =Lr+fr < ©. (14.602) 


63. Nous ne prétendons pas que la tribu À soit liée à la topologie de K. 
64. Définition (14.460). 
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THOooVADUooLiRfGK 
Théorème 14.212 ([443]). 
Soient deux espaces mesurables (S1,F1) et (S2, F2) ainsi qu'une application mesurable w: S1 — S2. 
Soit encore ui, une mesure positive sur (S1,F1). 


Si f: S2 — R ou C est mesurable alors, ItemooKMBIooZpHJSS 


(1) f est o(u)-intégrable si et seulement si f o & est u-intégrable. ItemooLAPYooUreDEl 


(2) dans le cas où f est w(u)-intégrable, nous avons 


[ fd(o(u)) = Ï (fo p)du. FAooÉ CET EEO) 


Si 


Démonstration. L’intégrabilité est la définition 14.181, et demande que | f| soit intégrable. L'égalité 
(14.603) a un sens si les deux membres sont infinis. Tant que les fonctions considérées sont positives, 
le point (1) est immédiat. Ce n’est qu’au moment où les fonctions considérées deviennent à valeurs 
dans € ou R que l’intégrabilité de |f| commence à jouer parce qu’il faut que f* et f— soient 
séparément intégrables. 

Nous allons prouver la formule (14.603) pour des fonctions de plus en plus générales. Pour la 
suite nous notons y! = (1). 


(1) Pour f = 18, B mesurable Soit B € F2. Nous avons 1804 = 1,-1(8). Donc en utilisant 
le lemme 14.170 nous avons 


[ 2edu = (8) = a(e48)) = | 1-1 = [ Que vdu (14.604) 
S2 Si Si 


(2) f est étagée positive 


La fonction f peut être écrite sous la forme 
n 
f= ) œls, (14.605) 
k=1 


avec By € P2 et ax € R*. Nous avons alors, en utilisant la sous-additivité de l’intégrale du 
théorème 14.178(3), 


fdu' = >. dk J 18, du (14.606a) 
S2 k S2 
=» ai | (Lp, © v)du (14.606b) 
k 51 
L J (y axlr,) o dy (14.606c) 
Si k 
= Î (f o v)d. (14.606d) 
Si 


(3) f à valeurs dans R*+ 


Vu que f est mesurable, par le théorème 14.115 il existe une suite croissante de fonctions 
étagées positives convergeant vers f. Soit donc cette suite, fn: S2 — R*. Les fonctions fh 04 
sont étagées et positives et nous avons aussi la limite ponctuelle et croissante f, o & — fo 
parce que w est continue. Le théorème de la convergence monotone (théorème 14.173) permet 
d'écrire ceci : 


fdu! = in | du = in | (fn © v)du = J (fov)du. (14.607) 
S2 S2 Si 


É 
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(4) Pour f: 52 — R ou C 
C’est maintenant que l’intégrabilité va jouer. Nous avons |f| 0 4 = |f o |, donc 


J \fldu! = J ice J old: (14.608) 
S2 Si Si 


ce qui montre que f est y/-intégrable si et seulement si f o & est y1-intégrable. 
De plus si f = f* — f- alors fo ={(fov)t, f-ow=(fov).,et de façon similaire pour 
les parties imaginaires et réelles. 


14.10 Mesure à densité 


14.10.1 Théorème de Radon-Nikodym 


Définition 14.213 ([445]). 
Soient 1 et v deux mesures sur l’espace mesurable (Q, A). Nous disons que la mesure u est dominée 
par v si pour tout ensemble mesurable À, v(A) = 0 implique (A) = 0. 

Nous disons que la mesure signée® v est absolument continue par rapport à la mesure 
positive 1 si pour tout À € À, nous (A) = 0 = (A) = 0. Dans ce cas nous notons 


V & Ji. (14.609) 


DEFooRZARooTbtJac 


Définition 14.214 ([425]). 
Deux mesures signées ui et v sur (Q, A) sont mutuellement singulières si il existe E,F € A tels 
que 


En F = (14.610a) 
u(A) = u(AnE) (14.610b) 
v(A)=v(AnF). (14.610c) 
Nous notons ce fait par 
LP: (14.611) 
LEMooDIGPooJqEwGl 


Lemme 14.215 (|1]). 
Soient deux mesures positives À et 1. Nous avons À L 1 si et seulement si il existe des parties 
mesurables E', F" telles que 


POST ARCS 
QE NF =@ 
(3) (F7) = A(E7) = 0. 
Démonstration. En deux parties. 
(1) = Nous supposons que y L À, c'est-à-dire qu’il existe E, F tels que En F = G, u(A) = 
u(A n E) et ÀA(A) = ÀA(AN F) pour tout mesurables A. 


Nous posons R = Q\(E LU F). C’est la partie de Q sur laquelle ni y ni À n’agit. Il suffit de 
poser F”=FURet E' = E pour avoir ce qu’il faut. Par exemple, 


u(F") = u(F U R) = u((FUR)NE) = u(@) = 0. (14.612) 


, et de même pour les autres vérifications. 


65. Définition 14.18. 
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(2) = I suffit de poser E = E’ et F = F' et de vérifier. Par exemple, vu que l’union EULF =0Q 
est disjointe, 
u(4) = (An E) +u(AnF)=yAnNE). (14.613) 


LEMooVOJDooFgbuSE 
Lemme 14.216 ([146|). 
Soit un espace mesurable (Q, A). Nous considérons 


(1) des mesures positives finies (An )neN; 
(2) une mesure positive u 


telles que Àn L u pour tout n. Alors 
00 
Dal (14.614) 
n=1 


Démonstration. Nous utilisons la caractérisation du lemme 14.215 pour des mesures mutuellement 
singulières. 
Pour chaque n nous avons des mesurables 4, et B, tels que À, L B, = Q, A4, n B, = @ et 
H(An) = An(Bn) = 0. 
Nous posons À = {J7_, 4, et B = Q\A. Nous avons bien entendu AU B=Qe An B=G. 
(1) A4(B) = 0 pour tout À Pour chaque k nous avons B € By parce que si x € B, alors en 
particulier x € Q\ AZ = By. Nous avons donc 


Donc, par croissance de la mesure, 
X(B) = À(Q\A) < À(Q\4z) = Ag(Bz) = 0. (14.616) 


(2) AB) =0 Il s’agit de sommer : A(B) = 5%, Ag(B) = 0. 
(3) u(A) =0 Nous avons 


u(A) = u( U An) < D H(An) = 0. (14.617) 


LEMooYYIIooCUfGxA 
Lemme 14.217 (|[1|). 
Soient À et v des mesures positives o-finies ainsi qu'une mesure positive 1 telle que À Lu etr Lu. 
Alors 
Cia je (14.618) 


Démonstration. Nous considérons des mesurables disjoints (X,) comme dans le lemme 14.19. Pour 
chaque n nous avons les mesures finies À, et v, données par 


A1(4) = X(A n X4) (14.619a) 
vn(A) = v(A n Xh). (14.619b) 


Ces mesures vérifient À, L y et #, L y. De plus les (X,) étant disjoints, nous avons ÀA(A) — 
Du An(A) et (A) = ÿ,, (A). Nous pouvons donc utiliser le lemme 14.216 : 


oe FRAC E AN) 


A8 


n=1l 


Par associativité de la somme (tous les termes sont positifs), pour chaque mesurable A nous avons 


SCAn + 2n)(4) = D An(4) + D vn(A4) = À(A) + v(4) = (À + v)(4). (14.621) 


n 


Cela pour dire que le membre de gauche de (14.620) est bien À + v. 
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Définition 14.218. 
La mesure u est portée par la partie E € À si pour tout À € À, 


u(A) = {An E). (14.622) 


Définition 14.219. 
Soit une mesure signée u et une partie mesurable À. 


(1) La partie À est négative si u(A') < 0 pour tout À! mesurable dans À. 
(2) La partie À est nulle si u(A') = 0 pour tout À’ mesurable dans À. 


(3) La partie À est positive si u(A') > 0 pour tout A! mesurable dans À. 
PROPooBLNXooRRxxVv 
Proposition 14.220 ([425]). 
Soit un espace mesuré (Q, À, 1) où u est une mesure signée. Si une partie D € A vérifie 1(D) < 0, 
alors il existe une partie négative À € D telle que (A) < (D). 


Démonstration. Nous définissons des parties À; par récurrence en commençant par poser A9 = D. 
Ensuite, si À, est défini, nous posons 


tn = Sup{u(B) tel que B € À,,B € A}. (14.623) 


Nous avons t, > 1(@) = 0. Par définition du supremum, il existe B, mesurable dans À, vérifiant 
H(Bn) > tn/2 > 0. Nous posons alors 


An+1 = An\Bn- (14.624) 
Enfin nous posons 
A= D\| JB. (14.625) 
nZ0 


Vérifions que À possède les propriétés demandées. 
(1) AC D Par définition. 


(2) (A) < H(D) 


(2a) Les B; sont disjoints Nous avons 


Ba © An=A=D\|)B:, (14.626) 
n>0 
et donc B, n By = @ pour tout k < n. Cela montre que les B; sont disjoints. 
(2b) u(A) < (D) Étant donné que B, € D pour tout n, l'égalité À = D\ Üh>o Bn peut 
être écrite 
D=AU)B (14.627) 


n>0 


où à droite nous avons une union disjointe. Bref, au niveau des mesures nous avons 


a(A) = u(D) — Ÿ x(Bn) < H(D) (14.628) 


parce que u(B,) > 0 pour tout n. 
(3) AC An Par définition À = D\,,-9 BA alors que 4, = D\ 25 Bn. Donc en partant de 
D, pour construire À, on enlève plus de choses que pour construire À,. Donc À € 4h. 


(4) À est une partie négative Supposons que À n’est pas une partie négative : il existe À’ 
mesurable dans À tel que 4(4') > 0. En particulier, 


A CAC Ah. (14.629) 
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La partie À’ est donc dans l’ensemble sur lequel on prend le supremum pour construire 4h. 
En d’autres termes, t, > u(4’) > 0, et donc 
in … mA) 


2 2 


HE) (14.630) 


Et avec tout ça, 


a(A) = (D) - Ÿ u(Bn) < HD) - Ÿ ee = FPONDENE 


(5) Conclusion Nous avons dit, dans la définition d’une mesure négative que y ne prenait 
jamais la valeur —00. L’inégalité (14.631) est donc une contradiction et nous concluons que 
À est une partie négative pour y. 


LEMooVFEWooUÿXcPS 
Lemme 14.221 ([425|). 
Soient une mesure positive u et une mesure signée v. Si v L y et si v & pu, alors v = 0 


Démonstration. Vu que u L v, il existe E € À tel que 
u(A) = u(AnE) (14.632a) 
v(A)=v(AnE) (14.632b) 


pour tout À € À. 
Soit À € À. Nous avons u(A Nn E°) = 0 parce que u(A) = (ARE) +u(An ES) et (An E) = 
A(A). Étant donné que v y} nous avons aussi /(A n E°) = 0. Donc 


v(A) = v(An ES) = 0. (14.633) 


LEMooABVVooMvxl1Ro 
Lemme 14.222. 
Soient une mesure positive 1 ainsi que deux mesures signées 11,12 telles que 1 L u et 2 L u. 
Alors vi + vo L y. 


Démonstration. Nous avons des parties E1, F1, E2, F2 € À telles que 


{ v1(A) = 1 (A [A] F) (14.634a) 

u(A) = p(An Ei), (14.634b) 
et 

{ va(A) = va(A [A] P) (14.635a) 

(4) = (An E>), (14.635b) 


et En E = Get En = @. Nous posons E0 = Ein Es et F6 = FE 0 F5, et nous allons prouver 
que 21 + va L y vérifiant que le couple (Æ5, Fo) vérifie les conditions de la définition 14.214. 


(1) En = Nous avons : 
FE [A F6 = (Ei [A] E2) [A] (F LU FE) — (Ei [A] Es [A] F) LU (E: [A] Es [A] F5) — S. (14.636) 


(2) u(A) = u(A n Eos) Nous prouvons maintenant que u(A) = (A n Es) pour tout À € A. 
Nous écrivons d’abord 


E TMOK F 
u(A) = g(A n E) = u(A n Ei n E2) + (A 0 (E1\E2)), TPE 63) 
et, de la même façon, 


(A) = u(A [A] E2) = u(A [A] Es [A] E:) + u(A [A] (E>\E1)). (14.638) 
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En faisant la différence entre les deux, 0 = p{A n (E1\E2)) — (A n (E2\Ei)), c’est-à-dire 
u(A n (E1\E2)) = (An (E2\E1)). (14.639) 
En particulier pour À = Q nous avons 
U(E\E2) = H(E2\Ei). (14.640) 


Nous savons, par définition de E1 que u(A) = y(A Nn E:) pour tout À € À. Nous écrivons 
cette égalité pour À = (Æ2\E1) : 


U(E1\E2) = p((E2\Ei) N Ei) = (@) = 0. (14.641) 


Nous en déduisons que u(E2\E1) = 0 et donc que u(A n (E2\E1)) = 0 pour tout À € À. Et 
enfin nous repartons de (14.637) : 


u(A) = H(A RE) = p(A On Ein Eo) + u(A 0 (E1\E2)), (14.642) 
=u(ÂnE) T 


autrement dit, u(A) = (A n Eo), comme nous devions prouver. 


(3) (A4) = 7(An F5) Nous allons prouver que pour à = 1,2 nous avons (A) = v,(A n F5). 
Nous commençons par écrire À n F5 comme union disjointe en partant de 1.27(2) : 


An F5 — (A [A Fi) U (A a P) (14.643a) 
= (An EF) ((4nB)\(AnE)). cf. justif. (14.643b) 


Justification : pour tout ensembles X et Y nous avons X U Y = X U(Y\X). 


Ayant écrit À n F5 comme une union disjointe, nous pouvons calculer 1 dessus. Nous posons 
R=(AnB)\(An Fi), et nous calculons un peu : 


(An F0) = (An Fi) + v1(R) = v1(A) +u(Rn Fi) = v1(A) +1(S) _ v1(À). (14.644) 


Le même jeu en permutant les rôles de 1 et 2 donne (A n F6) = (A). 


(4) Conclusion Nous avons (A) = (A n F6) et (A) = (A n F6). En faisant la somme, 
c’est bon. 


PROPooIBLHooTMfEJW 
Proposition-Définition 14.223 (Décomposition de Hahn[125]). 
Soit une mesure signée 1 sur (Q, A). Il existe des parties mesurables N, P € Q telles que 


(Na P = UN; 
BD NnP=p, 
(3) N est négatif pour y, 
(4) P est positive pour J1. 


Un tel couple (N, P) est une décomposition de Hahn pour lu. 
De plus si (N,P) et (N',P') sont deux décompositions de Hahn pour y, alors les parties °6 
NAN’ et PAP! sont nulles pour y. 


Démonstration. D'abord l'existence puis l’« unicité ». 


Existence 


66. La partie AAB est la différence symétrique (définition 1.29). Dire que NAN est nulle pour y signifie que 
pratiquement tout est dans l’intersection. Nous avons donc unicité de la décomposition à partie nulle près. 
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Nous posons d’abord No = @, et nous construisons des parties N4 par récurrence. Nous posons 
Sn = inf{p(D) tel que D € Q\N,, D € A}. (14.645) 


Notes : il est possible d’avoir s, = —c, et comme D = fonctionne dans l’infimum, nous avons 
Sn < 0. Vu que 5, est un infimum et qu'il est négatif, il existe une partie mesurable D, € Q\N, 
telle que u(D,,) < %. Pour cette partie nous avons 


u(Dh) < _ < 0. (14.646) 
La proposition 14.220 dit qu’il existe une partie mesurable À, € D, qui est négative pour y et 


qui vérifie u(A») < u(DA). Nous posons alors, pour notre récurrence : 


Na+1 = Nn U An: (14.647) 
Nous posons ensuite 
N=|JA (14.648a) 
n>0 
P=û (14.648b) 


et nous prouvons que (N,P) fonctionne. Nous avons immédiatement que N LU P = Q et que 
NhnP=(ÿ. 


(1) N est négative pour y Nous avons, pour tout n que N, = @ L Aj L ...U A4n_1. Donc 
Nh © N pour tout n > 1. 


Notons aussi que les À, sont disjoints. En effet 
An € Dn € Q\Nn = Q\(Ai1 U... U Ani). (14.649) 


Donc À, n’intersecte aucun des A4 avec k < n. 


Nous pouvons maintenant que N est une partie négative. Soit B € N. Notons que chaque 
A, est négatif, donc u(4, n B) < 0 parce que, évidemment, 4, n B € B. Etant donné que 
l’union N = (ER A, est disjointe, nous avons 


u(B) = Ÿ(B n An) < 0. (14.650) 
n>0 


Donc m(B) < 0 et nous avons montré que N est une partie négative. 


(2) P est positive pour 4 Nous y allons par l’absurde. Supposons avoir D € P avec (D) < 
0. Nous avons déjà vu que NM, € N, donc Q\N € Q\N,. En ce qui concerne D, 


DeP=ANNcAM. (14.651) 


Donc sy < u(D) < 0. Nous avons alors le calcul 


HN) = Ÿ; H(An) (14.652a) 
n20 

< > H(Dh) cf. justif. TTEMOOMRE oo L ET 
n20 

< 5 4) TT 
n20 

2 (14.652d) 


Justifications. 
— Pour (14.652b). Nous avons u(A4,) < 1(D,) par choix de À,. 
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— Pour (14.652c). Parce que u(D,) < # < up). 


Vu que y ne prend pas la valeur —c, nous avons une contradiction. Nous en déduisons que 
P est positive pour y. 


« Unicité » 
Supposons avoir des couples (N, P) et (N’, P'). Nous avons d’abord 
P\P'=PnN' (14.653) 


parce que si x € P\P)/, alors x € P (ça c’est facile), et x € P\P' € Q\P' = N'. Dans l’autre sens si 
ze PnN',alors re N'CQn P'. De même nous avons P\P = P'AN. 


En utilisant la formule (1.11) de la différence symétrique, 
PAP'={(P\P)U(P\P)=(PAN')U(P'nN). FHOOUZE Vos DaagEs 
Nous trouvons de la même façon 
NAN'=(PAN'}U(P'AN). EPA be) 


En ce qui concerne les mesures, PAN'C Pet P est positif, donc (PA N') > 0. Mais PAN'C N 
et N'est négatif, donc {(P n N')) < 0. 

Nous en déduisons que u(P n N') = 0. Pour la même raison, u(P' n N) = 0. Nous déduisons 
alors de (14.654) et (14.655) que u(PAP") = (NAN) = 0. 


Lemme 14.224. 
Soit une décomposition de Hahn (N, P) pour la mesure signée u. Nous posons 


u_(4) =-u(AnN) (14.656a) 
u+(4) =u(An P). (14.656b) 


Alors 
(1) u- et + sont des mesures positives. 


(2) = prend ses valeurs dans [0, | 


Démonstration. Vu que N est négative pour y, pour toute partie mesurable À, nous avons {(An 
N) <0 et donc 
u-(4) =-yu(AnN)> 0. (14.657) 


Par ailleurs u prend ses valeurs dans |—00,%]. De cette façon —u ne peut pas descendre jusqu’à 
—00. 


DEFooGICVooKZWLrB 
Définition 14.225 (Décomposition de Jordan). 
Soit une mesure signée u sur (Q,A). Un couple de mesures positives (u_,1+) est une décompo- 
sition de Jordan de 11 si il existe une partie mesurable E telle que 


(1) H-(E) = 0 
(2) H+(Q\E) = 0 
(3) H= bu. 


LEMooTVFRooAPdbuP 
Lemme 14.226 ([1]). 
Soit une mesure signée y et une décomposition de Jordan (u-,u+). Si E est un mesurable vérifiant 
les conditions de la définition 14.225, alors (Q\E, E) est une décomposition de Hahn. 


67. Je n'ai vu ce passage correctement justifié nulle part. Voir ma question sur le wikipédia anglophone[447], qui fait la 
même « faute » que [425]. Écrivez-moi si vous comprenez leur démarche. 
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Démonstration. Supposons que À € E. Alors u_(A) = 0 parce que u_(E) = 0 et u_ est une 
mesure positive. Nous avons alors 


u(4) = u+(4) — n_(A) = u+(4) > 0. (14.658) 


Cela prouve que E est une partie positive pour u. Le même raisonnement montre que (\E est une 
partie négative pour y. 


DEFooDYFPooITNRII 
Proposition 14.227 (Décomposition de Jordan[425]|). 
Soit une mesure mesure signée a sur (Q, 4). 
(1) Il existe une unique décomposition de Jordan (u-,p41+) pour y. LTEMooDMVXo0TXBFnM 


(2) Si (N,P) est une décomposition de Hahn, alors la décomposition de Jordan de u est donnée 
par 


u_(4) =-u(AnN) (14.659a) 
u+(4) = u(An P). (14.659b) 


Démonstration. Nous prouvons l'existence directement en prouvant le point (2). Vérifions les trois 
points de la définition 14.227. Nous posons E = P, et nous vérifions 


u-(E) = -u(EnN)=-HERN)=-H(S) = 0. (14.660) 


, et de même n+(Q\E) = 4 (N) = (AN N) = 0. Enfin, vu que Q = NU P est une union disjointe, 
nous avons u(À) = u(AnN)+u(An P)=-p (A) + u;(À). 

Il nous reste à prouver l’unicité de la décomposition de Jordan. Nous supposons que (u-,p1+) 
et (_,1}) sont des décompositions de Jordan de u. Nous avons donc des mesurables E et F tels 


que =v;—1v_ =} —p- et 


u_(E) = (14.661a) 
+ ee = (14.661b) 
BF) (14.661c) 
V4 ee = 0. (14.661d) 


Le lemme 14.226 nous indique que (Q\E,E) et (Q\F,F) sont des décompositions de Hahn pour 
Lu. Aussi, pour prendre des notations plus intuitives, nous posons 
N=QE P-E 
Or paf (14.662) 
W_=v_ pi =v, 
La partie unicité de la décomposition de Hahn 14.223 implique que NAN' et PAP! sont des 


parties nulles pour y. Étant donné que N’\N € NAN, la partie N'\N est également nulle pour 
a. Idem pour N\N’. Enfin nous avons l’union disjointe 


N'=(N'hnN)u(N\N), (14.663) 
et nous pouvons calculer 

u!_(A) = -u(A n N°) (14.664a) 
=-u((ANNSA(N'ON)) -u((4AnN'n(N\N)) (14.664b) 
=-u(ANNON)-u(An(N\N) (14.664c) 
a a 

= -H{AnN) East PLUG) 

= u_(À). (14.664f) 


Justifications. 
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— Pour (14.664d). Nous avons 
u(A n (N\N") = u(An (N\N)) = 0 (14.665) 


parce que N\N'et N’\N sont des parties nulles pour y. Bref le passage (14.664d) consiste à 
remplacer un truc nul par un autre. 


— Pour (14.664e). Nous avons l’union disjointe N = (N'n N)U (N\N'). 


Nous avons prouvé que y/_(A) = (A), et donc que y! = u_. Nous faisons de même pour 
! 
+ — H+. 


THOooKSISooPAqZcp 
Théorème 14.228 (Radon-Nikodym{425, 1]). 
Soit un espace mesurable (Q, A). Nous considérons 
(1) u, une mesure positive o-finie. 
(2) v, une mesure signée ® 


Alors 


ou non telle que |v| est o-finie. 


(1) Il existe un unique couple de mesures signées va, vs tel que 


V = Va + Vs (14.666a) 
Va € (14.666b) 
té. 1 (14.666c) 


(2) Il existe une unique (à égalité presque partout près) fonction mesurable et intégrable® f: Q — 
R LU {+00} telle que 


Va(À) = [. fdu (14.667) 


pour tout À € À. 


(3) Siv > 0 alors a > 0, >0 et f > 0. 


Démonstration. Nous commençons par l’unicité. 


Unicité des mesures et de la fonction 


Séparément. 


(1) Unicité des mesures Nous supposons avoir deux tels couples (7,,7,) et (v,,1/!). Nous 
avons donc 24 + V4 = v et 1}, +1 = v. En faisant la différence, 


Va — Va = (V—vs)—(v— vi) = vi vs. (14.668) 


D'autre part, vu que v, L y et nl L uw, le lemme 14.222 donne # — v, L y. Enfin %, & y et 
VE & Ji, donc V4 — v}, & JL. Au final nous avons 


Va <y (14.669a) 
vs Lu (14.669b) 
Va — LV, = VE — Vs. (14.669c) 


Tout cela avec le lemme 14.221 nous donne v, — 1}, = 4 — vi = 0. 


68. Mesure signée, définition 14.18. 
69. Intégrale ne signifie pas L!. Nous demandons juste que l'intégrale existe, si elle vaut co, c'est bon pour nous. 
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(2) Unicité de la fonction 


Soient deux fonctions f,g: Q — RL {æw} vérifiant la contrainte. Pour toute partie À € À, 
nous avons 


v(À) = [. fdu = l gd. (14.670) 


Nous écrivons cette égalité pour la partie A = {f > g}: 
| (f — g)du = 0. (14.671) 
{f>9} 


Vu que sur la partie {f > g} nous avons f — g > 0, nous avons u({f > g}) = 0 par le lemme 
14.194. Nous trouvons de même que u({f < g}) — 0. Au final, nous avons f = g presque 
partout. 


Existence, u positive finie, v positive et finie 


Nous commençons par prouver la partie existence en supposant que y est finie et que 7 est 
positive et finie. Nous introduisons l’ensemble suivant : 


fest mesurable } (14.672) 


H=)tf Q—Rt oo} tel 
{s U {co} tel que … 


L'ensemble # n’est pas vide parce que la fonction f = 0 est dedans (ici nous utilisons l’hypothèse 
supplémentaire que y > 0). Nous notons 


a = sup{[” fdu tel que f € H}. (14.673) 


Nous avons 0 < a < (Q) < 00. En vertu du lemme 1.447 nous pouvons prendre une suite (f,) 
dans # telle que 


a = limn — © | Îndu (14.674) 
Q 
et 
[ Jndpi < [ În+1dp. (14.675) 
Q Q 
(1) Les fonctions 9 
Pour chaque n > 1 nous notons 

n: QAR 

L (14.676) 


ze max{fi(x),...,fn(x)}. 


Nous nous fixons provisoirement un n. 


(2) 9ÿn € H 
Pour chaque x € Q, il existe un € {1,...,n} tel que g(x) = f;(x). Pour À € À nous posons 
A1 = {re Q tel que gn(x) = fi(x)} (14.677a) 
A2 = {re Q tel que g(x) = f2(x)}\ A: (14.677b) 
(14.677c) 
Ag+1 = {x € Q tel que g(x) = fx+1(x)}\ (A1 L ... U Az) (14.677d) 
$ (14.677e) 
An = {x € Q tel que gn(x) = fn(t)}\(A1 L ... LU A1) (14.677f) 


14.10. MESURE À DENSITÉ 1283 


(3) 


(4) 


Ces ensembles sont disjoints et A = | J}_, A», de telle sorte que 


[. In = D L Indy} (14.678a) 
= D) [. fidu (14.678b) 
< D VADcE. justif SUBBQo TULRap PE 
= (A). (14.678d) 


Justification de (14.678c). Vu que f; € #, nous avons | ” fi < v(A;). Bref, nous avons prouvé 
que fa Indu < (A), et donc que 9n € H. 

9n est mesurable Les applications f, sont mesurables, et g, est définie comme un maxi- 
mum sur les f;(x). Donc g, est mesurable (lemme 14.103). Nous ne fixons plus le n. La 
suite (9h) est croissante. Donc la limite f = lims_,+ 9n existe, et elle est mesurable par la 
proposition 14.107. 


PITEMooGLPCooB;jBAd 
(. her P 00 ooBj m 
Le théorème de la convergence monotone 14.173 va plus loin et nous dit que f est intégrable 
et 


fdu = lim | gndu < v(A). M LD | 
A RUE JA 


Nous avons donc encore f € H et donc aussi 


[ fdu < à. (14.680) 
Q 


Mais cette inégalité tient aussi dans l’autre sens : 


[ fdu = in | IndH (14.681a) 
a a 
> in | fndu (14.681b) 
a 
= @. (14.681c) 


Nous avons donc prouvé que ‘a fdu = à < ©, et donc que f € L!(Q, À, y). 


Résumé pour l'instant Nous avons construit une fonction f € L!(Q, A, u) telle que pour 
tout À € À, 


] Fu (2), (14.682) 
A 


Les mesures Nous définissons à présent les applications 7, et v, en espérant qu’elles fonc- 


tionneront. D'abord nous posons 
va(A) = J fan. Fo ER o ER 
A 


Et ensuite nous posons 2, = v — 1. I] nous reste à prouver que f,v, et v, satisfont à toutes 
les conditions. 


D € Li 


Si (A) = 0 nous avons 
Va(À) = ] fdu = 0 (14.684) 
A 


par le lemme 14.196. 
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(8) v, est positive 


Nous avons 
vs(A) = v(A) — v,(A) = v(A) — [. fdu > 0, (14.685) 


par l'inégalité (14.679). 
(9) v, est finie 
Nous savons que 7, et finie et que Le fdu = à < co. Donc v, est finie. 
(10) z Lu 
Nous introduisons la mesure signée Àn = vs; — 1 , et nous considérons la décomposition de 
Hahn pour chacun des X,, (proposition 14.223) : les couples (N,, P,). Nous considérons aussi 
les fonctions h, = f + l1p,. 


(10a) h, € H La fonction h; est mesurables parce que f et P, le sont. En termes d’intégrale 
nous avons 


] hdi = ] fins AE) (14.686) 
A A nm 
= (4)+2%(An Ps) (An P) Pret ES) 
=;(4)-2,(4)+4(ÂnP2)-X(4nE) (14.686c) 
= 2(4) — (2 (A NP) + (A 0 Nn)) + (A n P) suEAoouIMA EE 
— Àn(A n Ph) cf. justif. 


v(A) — v,(A N Ny) — An(A N Pn) (14.686e) 
EURE EX 

v(A) ar era : PIRE 

Justifications. 

— Pour (14.686b). La définition (14.683) de w). 

— Pour (14.686d). Parce que P1 L Nh = Q est une union disjointe. 


— Pour (14.686f). Parce que v, est une mesure positive. Donc (A n N,) > 0. Et 
aussi parce que, par construction, À, est positive sur Ph. 


Bref, nous avons déjà prouvé que là hhdu < (A). Cela signifie que h, € H. 
(10b) (PA) = 0 Nous avons vu en (4) que [,, fdu = a. Nous pouvons alors faire le calcul 


suivant : 
BE HXD 
a> | Rndu cf.justi. . PES 
Q 
1 
= | dure [ dd (14.687b) 
(e) nm Ja 
1 
= a + —u(P}n). (14.687c) 
n 


Justification pour (14.687a) : parce que h, € H et que a est le supremum. 
En soustrayant & des deux côtés, nous avons 0 > L (Ph) pour tout n. Comme y est 
une mesure positive, nous en déduisons que u(P,) = 0. 


(10c) Définition de P Nous posons P = (JF, Pa 
(10d) u(P) =0 Vu que x(P;) = 0 pour tout n, nous avons u(P) < ÿ,,, (Ph) = 0. 
(10e) 7,(Q\P) = 0 


Nous avons (Q\P € Q\P, = N,. Donc pour tout n nous avons 
AnO\PI< AN.) = 0: (14.688) 
En utilisant la définition de À, nous avons 


M (AP) = (OP) — E(O\P), (14.689) 


14.10. MESURE À DENSITÉ 1285 


et donc, pour tout n, 


va(Q\P) < =u(Q\P). (14.690) 


1 
n 
En faisant n — 0 nous trouvons 7,(Q\P) < 0. Et comme 7, est une mesure positive, 


nous en déduisons que 7,(Q\P) = 0. 
Nous avons fini de prouver que v, L y. 


Nous avons donc terminé la première partie de la preuve, c’est-à-dire la partie où nous supposions 
que est finie et v est positive et finie. Nous passons à présent à un cas un peu plus général. 


Existence, 4 positive o-finie, v positive et o-finie 


Vu que u et v sont o-finie, le lemme 14.19 dit qu’il existe des X} mesurables tels que Q = 
Ühz1 Xns H(Xn) < © etv(Xh) < 00. Nous supposons de plus que ce X, sont disjoints Fe 
Nous considérons à présent les mesures finies u» et 7, définies par 


Un(À) = u(AN X}) (14.691a) 
Vn(A) = v(A NX») (14.691b) 
(14.691c) 


Par la partie déjà faite, nous pouvons faire une décompo n pou chaque n : il existe des mesures 
: 1 BEQSooLONIooÂksRgK 
Vn,as Vn,s et une fonction fn € L'(Q, A, ju) telles que | 


on 


Una A) = ] ÎndUn (14.692a) 
A 

Un — Vn,a + Vn,s (14.692b) 

Mae Le (14.692c) 

vise. (14.692d) 

Nous allons directement changer les f, pour qu'ils soient plus faciles à traiter. Nous posons ! 

ixeX 
gn(x) = L PARLE SES (14.693) 
0 sinon. 


Pour ces fonctions nous avons, parce que u, est nulle en dehors de X,, 


J IndUn = ] IndUn = J Îndlin = ] nds = van (A): (14.694) 
A ANnXn ANXn A 


Autrement dit, les fonctions g, fonctionnent aussi bien que les fonctions f,. Pour ne pas alourdir 
les notations, nous gardons (14.692), mais nous supposons que f, est nulle en dehors de X,. 
Notez aussi que pour tout À € À nous avons l’union disjointe À = [JA n X,, de telle sorte que 


p(4) = Su(A n Xn) = Ÿ Hn(A), (14.695) 
nm nm 
et nous pouvons écrire 

TÉDINTS (14.696) 

n>0 

Nous posons 

f= D fn (14.697a) 

n>1l 
= Ÿ ne (14.697b) 

n>1l 
DE (14.697c) 

n>1l 


70. Si ce n’est pas le cas, poser Yn+1 = Xn+1\Yn. 
71. Cette partie est de l'invention personnelle. J'espère que c'est correct. Redoublez de vigilance. 
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et nous prouvons que cela fait l'affaire. Notons que les fonctions f, sont L!; cela ne signifie pas 
que f soit Ll, mais nous ne le demandons pas. La fonction f est certainement intégrable parce 
qu’elle est positive. Au pire | À di = © pour certains A. C’est la vie. 

Nous devons vérifier les points suivants : 


— Va(À) = mn Jdu 

— V= Va + Vs 

— Va 

— vs L y. 

(1) {4 dfu = v(A) Voici un calcul : 


[ru || Zfrn (14.698a) 


= ù La 62 fn) dur cfjustif.  SUPEROONTE AO gggTS 
- > La fade cf. justif  SUREQOOMTN ep ETe 
_ D) La fidux cf. justif.… PEINE ERUeTS 
= > Vka(A) (14.698e) 
= mA). (14.698f) 


Justifications. 


— Pour (14.698b). Les XZ sont disjoints et leur union fait (Q. Nous pouvons donc tran- 


quillement couper l'intégrale en morceaux "?. 


— Pour (14.698c). Nous permutons la somme et l'intégrale avec le corolaire 14.176 : 


— Pour (14.698d). Vu que f, = 0 sur X% tant que k # n, tous les termes de la somme sur 
n sont nuls sauf le terme n = k. 


Voila déjà une belle première vérification de faite. 
(2) v=rv+ys 
La proposition 11.93 nous permet de fusionner le sommes. 


(va + vs)(A) = D vna(A) + D Un,s(A) 


(14.699) 
=Y (vna(A) n. vns(A)) = Vun(A) = (A). 
le db 
Supposons que (A) = 0. Vu que l’union (Q = U),, X,, est disjointe, nous avons 
0 = y(4)= Ÿ (AN Xn) = Ÿ Hn(A). (14.700) 
n>1 n 


Nous en déduisons que u,(A) = 0 pour tout n parce que 4, est une mesure positive. Étant 
donné que Una Jin, NOUS avons Zn. a(À) = 0 pour chaque n. En faisant la somme, 


Va(A) = D Una(A) = 0. (14.701) 


(4) v,; LH Nous décomposons en petites parties. 


72. Ce découpage est également de l'invention personnelle. Quadruplez de vigilance. 
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(da) 2», L 4x pour tout n et & Nous vérifions la définition 14.214 avec E = X% et F — 
X», qui sont disjoints. Nous avons d’une part que 7 (A) = 1(A n X%), et d'autre part 
que uk (A N X4) = u(AN Xx N XX) = p(AN Xx). Donc (A) = ux(An XX). 
Et d'autre part ”, 


Vn,s(À) = Un(À) — vna(A) (14.702a) 
= v(ANX —n)— ] dite (14.702b) 
A 
= v(ANX —n)— J eds fa =" 0 sur O\X. (14.702c) 
ANXn 
= v(AN Xn) — Una(A N Xn). (14.702d) 


Le membre de droite ne change pas si nous prenons À NA X, au lieu de À. Donc le 
membre de gauche non plus. Nous en déduisons que 2n,s(A) = vns(AN Xn). 


(4b) vn,s L Appliquer le lemme 14.216 à u = Ÿ,, Un. 
(4c) v, L & Appliquer le lemme 14.216 à v, = D}, Vns. 


Existence, 1 positive o-finie, v signée, |v| o-finie 


Nous sommes enfin dans le cas général. Vu que |r| est o-finie, les deux parties de la décompo- 
sition de Jordan * (#_,v,) de v sont des mesures positives a-finies. Nous pouvons donc appliquer 
tout ce que nous venons de voir aux mesures r_ et v, séparément : nous avons des mesures positives 
Vas V+,s, V-,Q et v_,s telles que 


Va + Vs = V4 (14.703a) 
dis (14.703b) 
a L (14.703c) 
Va + Vs = (14.703d) 
PRE (14.703e) 
es LU (14.703f) 
Nous posons alors 
De =D de (14.704a) 
Dr = Us — DS (14.704b) 


et nous vérifions que toutes les conditions sont respectée. D'abord 


Va + Vs = Va — Va + Vs — Vs = VE —V_ = y. (14.705) 


Ensuite si V4 a & fi Et V_ a & fl, NOUS AVONS Va = V+ a — Va ji parce que le fait d’être dominée 
passe à la somme finie ”. Et enfin, le lemme 14.217 assure que v, L y. 


CorZDkhws 
Corolaire 14.229. 
Si 1 est une mesure o-finie dominée par la mesure o-finie m, alors u possède une unique fonction 


de densité. 
CorDomDens 


Corolaire 14.230. 
Soient 1 et m, deux mesures positives o-finies sur (Q,A). Alors m domine 11 si et seulement si ji 
possède une densité par rapport à m. 


73. Invention personnelle, octuplez de vigilance. 

74. Proposition 14.227. 

75. Je n’ai pas dit que ça ne passait pas aux sommes dénombrables. Je suis prêt à parier que non, mais jy ai pas 
vraiment réfléchi. 
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Démonstration. Si u est dominée par m, alors la décomposition u = 1 +0 satisfait le théorème de 
Radon-Nikodym. Par conséquent il existe une fonction f telle que 


u(A) = l fdm. (14.706) 


Cette fonction est alors une densité pour y par rapport à m. 
Pour la réciproque, nous supposons que y a une densité f par rapport à m, et que À est un 
ensemble de m-mesure nulle : 


m(A) = [ Ladm = 0. (14.707) 


Cela signifie que la fonction 1 4 est m-presque partout nulle. La fonction produit 1 4f est également 
nulle m-presque partout, et par conséquent 


(A) = [ 1afdm = 0. (14.708) 


ii Avertissement /question au lecteur !! 14.231 
Est-ce que la démonstration de cela ne demande pas la convergence monotone d’une façon ou d’une 
autre ? 


14.10.2 Mesure complexe 
DefGKHLooYjocEt 


Définition 14.232 (Mesure complexe[148]). 
Si (Q,.A) est un espace mesurable, une mesure complexe est une application 1: À — € telle que 
(1) u(g) = 0, 
(2) La o-additivité : si les éléments A; € À sont disjoints, alors ÿ,; p(A;) = (U, Ai). 
Notons que la série ÿ,, u(Ai) est alors nécessairement absolument convergente. En effet changer 


l’ordre de la somme ne change pas l’union, et donc ne change pas la valeur de la somme. Si 
o: N — N est une permutation, 


Du) = A([] Act) = #((] A) = D (As). (14.709) 


Le théorème 11.97 dit alors que la somme doit être absolument convergente. 


ThoZZMGooKhRYa0 
Théorème 14.233 (Radon-Nikodym complexe "). 
Soit u une mesure positive sur (Q,. A) et v une mesure complexe. Alors 
(1) Il existe un unique couple de mesures complexes 14, v, sur (Q, À) tel que 
(la) v=va+vs 
(1b) va < Hi 
(ié) à Le 
(2) Ces mesures satisfont alors va L vs. 
(3) Il existe une fonction intégrable h: Q — © telle que v4 = hu. 
(4) La fonction h est unique à u-équivalence près. TtenDIX0o0Fa0kgev 


(5) Si de plus v & a alors v = hy. 


Démonstration. No proof. 


76. L'histoire du nom de ce théorème est intéressante. Lorsque monsieur et madame Rèmederdonnukodym ap- 
prirent que leurs amis, les Rèmedelaboulechevelue avaient appelé leur fils Théo, ils décidèrent d’en faire autant. C’est 
en souvenir de ces circonstances que monsieur Nikodym (prénommé Radon) décida de faire des math. 
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RemSYRMooZPBhbQ 
Remarque 14.234. 
Le point (5) est souvent utilisé sous la forme 
v(A) -| 1a(w)h(w)du(w) = ] h(w)du(w). (14.710) 
eo A 
14.10.3 Théorème d’approximation 
ThoAFXXcVa 


Théorème 14.235 (Théorème d’approximation, thème 24[431]). 
Soit un espace topologique métrique (Q, d). Nous considérons sa tribu des boréliens Bor(Q) ainsi 
qu'une mesure y sur (Q, Bor(Q)). 

Soient un ouvert W € Q tel que p(W) < © et un un borélien A tel que À € W. Soit aussi 
e > 0. 

Il existe un fermé F € W et une fonction f € C(Q,R) vérifiant 


() FeACW, ITEMoo0ZVJooSViuds 
(2) flr =1, ITEMooIEFSooHXYZrK 
(3) flwe = 0 ITEMooSOQVooBbvf gy 


(4) |f — Tan: <e 
Démonstration. Par le lemme 14.84, il existe un fermé F' et un ouvert V tels que 
FcACVEW (14.711) 


et u(V\F) < e. Nous posons alors 


ae, V°) 
d(x, VS) + d(x,F) 


Ï(æ) = (14.712) 


Le dénominateur de cette expression ne s’annule jamais parce que si d(x, V®) = 0, c’est que x € V°. 
Mais alors x n’est pas dans V et donc pas dans F non plus. La partie F étant fermée, d(x, F) > 0 
par lemme 7.144. De plus la fonction f est continue par le lemme 7.145. 


(1) Pour (2) Sixe F, alors d(x, F) = 0, et f devient 


f(x) = dy = 1 (14.713) 


(2) Pour (3) Sixe W*, alors x € V° et d(x, V®) = 0 si bien que f(x) = 0. 


(3) Pour (4) Les premiers points montrent que 
le Te ily: (14.714) 
Mais nous avons aussi, par ailleurs, 
Î1r < 14 < 1y. (14.715) 


Ces deux encadrement, par le lemme 1.429 donnent l'encadrement 


[If — La < 1v — Ir. (14.716) 
En ce qui concernent les intégrales nous avons alors 
[ [La — fl < [ (1v — 1r)du (14.717a) 
Q L LA _ à(F) PHRAN NE TS Er 
< €. (14.717c) 


Pour (14.717b), c’est le lemme 14.170. 
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14.11 Produit de mesures 
LemAQmWEmN 


Lemme 14.236 (Propriété des sections[132]). 
Soient A1 et A2 des tribus sur_les ensembles (1 et (2. Si A € A1 © A2 alors pour tout x € (1 et 


y € D, les ensembles | ee 
A1(y) = {x e Q tel que (x,y) € A} (14.718a) 
Aa(x) = {y Ee OM tel que (x, y) € A} (14.718b) 


sont mesurables. 


Démonstration. Soit y € M ; nous allons prouver le résultat pour A;(y). Pour cela nous notons 
S={AE À; @ A tel que Vy € Q, Ar(y) € A1}, (14.719) 


et nous allons noter que S est une tribu contenant les rectangles. Par conséquent, S sera égal à 


A © A». 


(1) Les rectangles 


Considérons le rectangle À = X x Y et si y € (2 alors 
Ai(y) = {x € Q: tel que (x,y) € X x Y'}. (14.720) 


Donc soit y € Ÿ alors Ai(y) = X € A, soit y # Ÿ et alors Aj(y) = @ € A1. 
(2) Tribu : ensemble complet 


Nous avons (Q; x (M € S parce que c’est un rectangle. 


(3) Tribu : complémentaire Soit À € S. Montrons que A° € $. Nous avons d’abord 


(A)1(y) = {x € Q: tel que (x, y) € A°}. (14.721) 
D'autre part 
Ai(y)° = {x € Q tel que (x, y) # A} = {x € Où tel que (x,y) € A°} = (A)1(y). (14.722) 


Vu que À; est une tribu et que par hypothèse Aj(y) € A1, nous avons aussi Ai(y)° € S, et 
donc (A‘)1(y) € A1, ce qui prouve que AE S. 


(4) Tribu : union dénombrable Soit une suite A, € S. Nous avons 


([] Anh (y) = {x € Qù tel que (x,y) € [ J An} (14.723a) 


= GIE € ( tel que (x,y) € An} (14.723b) 
: BIENO (14.723c) 


et ce dernier ensemble est dans À; parce que c’est une union dénombrable d'éléments de 41. 
Nous avons donc prouvé que $ est une tribu contenant les rectangles, donc $ contient au moins 


A1 @ A). 


Corolaire 14.237. 
Si f: A x Do — R est une fonction mesurable T7 sur X x Y alors pour chaque y dans , la 
fonction 


jy: X—R 


un (14.724) 


est mesurable. 


77. Définition 14.42. 
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Démonstration. Soit © un ensemble mesurable de R (ï.e. un borélien), et y € (2. Nous avons 


(0) = {xe X tel que f(x, y) € O} = A:(y) (14.725) 


où 
A = {(x,y) € Q x M tel que f(x, y) € O} = fl (O). (14.726) 


Ce dernier est mesurable parce que f l’est. 


ThoCCIsLh0O 
Théorème 14.238 ([132] ©). 
Soient (Q;, A;, ui) (i = 1,2) deux espaces mesurés o-finis. Soit A € A1 Q A2. Alors les fonctions !° 


x pa(Ao(x)) (14.727a) 
y p1(A1(y)) (14.727b) 


[ po(Ao(x))dun (x) = [ pa (Ai(y)) dou). ETS) 


Q2 


sont mesurables et 


Démonstration. Nous supposons d’abord que 1 et u2 sont finies et nous notons D le sous-ensemble 
de A1 © A2 sur lequel le théorème est correct. Nous allons commencer par prouver que D est un 
À-système. 


(1) À-système : différence ensembliste Soient À, B € D avec À C B. Nous avons 


(B\A)1(y) = {x € (1 tel que (x, y) € B\A} (14.729a) 
= {x € Q tel que (x, y) € B}\{x € (1 tel que (x, y) € A} (14.729b) 
= Bi(y)\Ai(y). (14.729c) 

Vu que Ai(y) € Bi(y) et que les mesures sont finies le lemme 14.22 nous donne 
1 ((B\A)1(y)) = 1 (B1(y)) — m1 (A1(y)), (14.730) 


et similairement pour 1 + 2. Les deux fonctions (de y) à droite étant mesurables, nous avons 
la mesurabilité de la fonction y — y ((B\A)1(y)). 

Prouvons la formule intégrale en nous rappelant que la formule (14.728) est supposée correcte 
pour À et B séparément : 


| (BA do) = [ 
Q2 


= Ï u2(B(x))du (x) - | u2(A2(x)) du (x) (14.731b) 
Q1 Q 


M (BG)du( - | (AG) (ira) 


2 Q2 


= L u2((B\A)o(x))dun (x). (14.731c) 


(2) À-système : limite de suite croissante 


Soit (4) une suite croissante dans D ; nous posons By = An\A»n-1 et Ao = @ de telle sorte 
à travailler avec une suite d’ensembles disjoints qui satisfait UJ, An = UJ, BA. Vu que la suite 
est croissante nous avons An-1 € À, et donc B, € D par le point déjà fait sur la différence 
ensembliste. Nous avons : 


(J Bn1(y) = {x € Q: tel que (x, y) € U By} (14.732a) 


= GIE € (1 tel que (x, y) € B;} (14.732b) 


= UB)1(y). (14.732c) 


nm 


78. Modèle non contractuel : des notations et la définition de À-système peuvent varier entre la référence et le 
présent texte. 
79. Voir la notation du lemme 14.718. 
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Par conséquent, par la propriété (2) d’une mesure nous avons 


pa ((}] Bhji(y)) = D m((Bn)1(y)). (14.733) 


n 


En tant que somme de fonctions positives et mesurables, la fonction 


y D ((Bahi(y)) (14.734) 


est mesurable par la proposition 14.98. Il faut encore vérifier la formule intégrale. Le gros du 
boulot est de permuter une somme et une intégrale par le corolaire 14.176 : 


[En dut D) Lu pa ((Bn)1(0))dua(u) (14.735) 

nn) [ po ((Bn)o(x))du (x) (14.735b) 
- [ Ÿ 2((Bn)2(2))dyn (x) (14.735) 
- [ p2(([J B)(y))drn (a). (14.735) 


Maintenant que D est un À-système contenant les rectangles, le lemme 14.32 dit que la tribu 
engendrée par D (c'est-à-dire A1 @ 42) est le À-système D lui-même. 

La preuve est finie dans le cas de mesures finies. Nous commençons maintenant à prouver dans 
le cas où les mesures u1 et u2 sont seulement o-finies. Nous considérons des suites croissantes 
Qin — ; d'ensembles mesurables et de mesure finie : ;(Q;in) < 00. D'abord remarquons que 


pa((4 n O5 x E2,j)a(x)) = pa Ao(e) 0 Rs) los FE PEA ES) 


En effet, 
O = (A [A] Q X E) j)2(x) (14.737a) 
= {y e (M tel que (x,y) e AN Q:,; x E;} (14.737b) 
= {y e (M tel que (x, y) € À x (;} n {y € ( tel que (x, y) € ,; x No}. (14.737c) 


Si y € Qi; alors {y € (M tel que (x, y) € Q:,; x O2 ;} = M; et dans ce cas 
Q = {y (= Qo tel que (x, y) EeAX Q 5} NN Q ; = Aa(x) [A E j. (14.738) 


Et inversement, si x # (Q; alors O© = G. Dans les deux cas nous avons (14.736). 
Les ensembles À À (:,; x (,; étant de mesure finie, nous pouvons leur appliquer la première 
partie : 


Le rta nas x Rage) )dun(e) = [ (Ans x (D) )da(u), (4780) 
[ve (aa(o) 9 5) dia) = | en (AG 0 Ms)10, (dt. (14.740) 


Ce que nous avons dans ces intégrales sont (par rapport à j) des suites croissantes de fonction 
positives ; nous pouvons donc permuter une limite et une intégrale. En sachant que si k — ©, alors 


L1,5(æ) — (14.741a) 
2 (Ao(x) nn Q, 5) > 2 (Ao(x)), (14.741b) 


nous trouvons le résultat demandé. 
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ThoWWAjXzi 
Théorème-Définition 14.239 ([449, 450]). 
Soient u; des mesures o-finies sur (Q;,.4;) (i = 1,2). 


(1) Il existe une et une seule mesure, notée 1 @ 2, sur (O1 x O2, A1 © A2) telle que 
EqfPt 
(1 ® u2)(A1 x A2) = m1(A1)u2(A2) PVAD) 


pour tout A1 € À et A2 € A. 


(2) Cette mesure est donnée par la formule ®° 


(1 @ u2)(A) = [ L(A2(x))du(x) = [ pa (Ai(y))dua(y). FPS) 


Q2 
Cette mesure est la mesure produit de 1 par 2. 


(3) La mesure 1 © 2 ainsi définie est o-finie. 


Démonstration. La partie « existence » sera divisée en deux parties : l’une pour prouver que les 
formules (14.743) donnent une mesure et une pour montrer que cette mesure vérifie la condition 
(14.742). 
(1) Unicité 
L'ensemble des rectangles de (1 x (2 engendre la tribu A1 @ 42, est fermé par intersection 
et contient une suite croissante d’ensembles P, x À, de mesure finie (u(P; x Rh) < 00) telle 
que Pn X Rn — (1 x Oo. Cette suite est donnée par le fait que u1 et 2 sont o-finies. En 
effet si (Xh) et (Y,) sont des recouvrements dénombrables de (1 et (2 par des ensembles de 
mesure finie, en posant Ph, = (JE, XK et Rn = [JE Yx nous avons bien une suite croissante 
de rectangles qui tendent vers (1 x (2. Avec ces rectangles en main, le théorème 14.33 donne 
l’unicité. 
(2) Les formules définissent une mesure Le théorème 14.238 dit que ces formules ont un 
sens et que l'égalité entre les deux intégrales est correcte. Nous prouvons à présent qu’elles 
déterminent effectivement une mesure sur ((1 x (2, A1 © 42). 


Pour tout À € Ai @ A2, (A) > 0 parce que y est donnée par l'intégrale d’une fonction 
positive. 

En ce qui concerne la condition d’unions dénombrable disjointe, soient AÛ) des éléments 
disjoints de À; @ 42 ; nous commençons par remarquer que 


[Ü sv (x) = {y € Oo tel que (x, y) € Ü AG) (14.744a) 
2 i=1 


i=1 


{y € Oo tel que (x,y) e AN} (14.744b) 


Il 
Ca 


Il 
un 


I 
C8 
D 
NT 

oi 


Il 
un 


(14.744c) 


Par conséquent, 


Lio { U sc) dun(x) (14.745a) 


{, i=1 
= [ X e(4f/(a)) duo (14.745) 
Ll'i=1 
j 1l pis > pa(AQ (x))dyn (x). (14.745c) 
1 i=1 


80. Voir les notations du lemme 14.236. 
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où nous avons utilisé l’additivité de la mesure u2. À ce niveau, il serait commode de permuter 
la somme et l'intégrale. Pour ce faire nous considérons la suite (croissante) de fonctions 


fn(e) = Ypo (AŸ (x). (14.746) 


Nous pouvons permuter la limite et l'intégrale grâce au théorème de la convergence mono- 
tone 14.173 ; ensuite la somme se permute avec l'intégrale en tant que somme finie : 


u (Ü av = Jim > : (AŸ (x))dn(æ) (14.747a) 
i=1 i 


n— 00 
i=1 1 
_ lim S'y(AË 
= Pa u(A®) (14.747b) 
Le] 
_ Y u(A®) (14.747c) 


(3) Elles vérifient la condition Prouvons que les formules (14.743) se réduisent à (14.742) 
dans le cas des rectangles. Soit donc À = X1 x X2 avec X; € A;. Alors 


Aj(y) = {x € Q: tel que (x,y) € X1 x X2} (14.748) 
et 

pa (Ai(y)) = Lx,(y)a4 (A5), (14.749) 

donc 
G Sua)(4) = | (Ar(u))dua tu) (14.750a) 
= [XD 1x (de(s) (14.750b) 
= mi) [ Lx tda(u) (14.750c) 
= (X1)H2(X2). (14.750d) 


Pour cela nous avons utilisé le fait que l’intégrale de la fonction caractéristique d’un ensemble 
mesurable est la mesure de cet ensemble. 


DefUM1BCAO 
Définition 14.240 (Produit d'espaces mesurés). 
Si (Q;,A;,;) sont deux espaces mesurés, l’espace produit est l’ensemble (1 x Q2 muni de la tribu 
produit A1@A> de la définition 14.124 et de la mesure produit 11 @u2 définie par le théorème 14.239. 


Remarque 14.241. 

Il n’est pas garanti que la tribu A4; @ 42 soit la tribu la plus adaptée à l’ensemble S1 x S2. Dans le 
cas de R", il se fait que c’est le cas : en prenant des produits des boréliens sur IR on obtient bien 
les boréliens sur R\, voir proposition 14.128. 


14.12 Tribu et mesure de Lebesgue sur R‘ 


DEFooSWJNooCSFeTF 
Définition 14.242 (Mesure de Lebesgue). 
En plusieurs étapes. 
(1) D'abord nous avons la mesure Àn sur R\ définie sur 
(R", Bor(R) @ .… @ Bor(R)) (14.751) 


comme le produit À @ ...@ À via la définition 14.240. 
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(2) Ensuite nous nous souvenons du corolaire 14.128 qui donne Àn comme une mesure sur 
(RŸ,Bor(R")). (14.752) 


(3) Et enfin nous considérons la completion de la mesure An (théorème 14.66), que nous notons 


encore ÀN. 
PropSKXGooRFHQst 


Proposition 14.243 ([435]). 
Tout ouvert de IR” est une union dénombrable et disjointe de cubes semi-ouverts. 


Démonstration. Nous allons même montrer que ces cubes peuvent être choisis sur un quadrillage. 
Soit G un ouvert de R”. Soit {Q!};ex un découpage de R” en cubes semi-ouverts de côté 1 et 
dont les sommets sont en les coordonnées entières. Ils sont de la forme 


n 


Ï [rs re +11 (14.753) 
i=1 


où les n; sont des entiers. Ce sont des cubes disjoints. Nous considérons ensuite pour chaque k > 1 
le découpage (Qi de R” en cubes de côtés 27 qui consiste à découper en 2 les côtés des 
cubes du découpage QK-1). Ces cubes forment encore un découpage dénombrable de R” en des 


cubes disjoints. Ils sont de la forme 
nm 
Ni M +l 
[Be ne (14.754) 
i=1 


où les n; sont encore entiers. Ensuite nous considérons € l’union de tous les Q®°) contenus dans G. 

Montrons que € = G. D'abord € € G parce que € est une union d’ensembles contenus dans 
G. Ensuite si x € G, il existe une boule de rayon r autour de x contenue dans G'; alors un des 
ensembles Q®°) avec 271 < 5 est contenue dans B(x,r) et donc dans €. 


) 


: ; 5 : : k+1 
Bien entendu l’union qui donne € n’est pas satisfaisante par ce que les Q{ sont contenus 


k : : : < . 
dans les Q! ) : les intersections sont donc loin d’être vides. 
Nous faisons ceci : 


RO) = {Q{)contenu dans G} (14.755a) 
RE+D = {QT contenus dans G et pas dans RW}. (14.755b) 


En fin de compte l’union de tous les ensembles contenus dans les R() forment encore R”, mais 
sont d’intersection vide. 


Les cubes dont il est question dans cette preuve, de côtés 2-F sont souvent appelés des cubes 
dyadiques. 


14.12.1 Propriétés d’unicité 


CorMPDAooDJRrom 
Corolaire 14.244. 
La mesure Àn est l'unique mesure sur (RV, Bor(R\)) à satisfaire 
N N 
(] [la bi]) : El lai — b;| (14.756) 
i=1 i=1 


Démonstration. Par définition de la mesure produit, Ày est l'unique mesure sur (R\, Bor(R) @ 
.… © Bor(R)) à satisfaire la condition. La proposition 14.128 conclut. 


Vu que les compacts de R” sont les fermés bornés (théorème 10.24), et que tout borné est dans 
un tel produit d'intervalle, la mesure de Lebesgue est une mesure de Borel (définition 14.86(1)). 
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THOo0oTMWHooThsDH; 
Théorème 14.245 ([451]). 
La mesure de Lebesgue est invariante par translation. Autrement dit si À est mesurable dans R” 
et siae R” alors À + a est mesurable et 


An(A + a) = An(À). (14.757) 


Démonstration. Nous supposons que À est borélien; sinon il l’est à ensemble négligeable près. 
Nous nommons 1 la mesure donnée par 


(A) = Àn(A + à). (14.758) 
Vu que 


t u 


N 
li Ï [rm sl) = AN ([ [Er + Gns 8n + An[) = [I |Sn — Tnl. (14.759) 
n=1 


Vu qu’il y a unicité de la mesure vérifiant cette propriété (corolaire 14.244), nous avons y = Àn. 


Pour la suite nous notons Q le cube unité de R\ : Qo = ([0, in 
ThoCABFooHbUzWc 
Théorème 14.246 ([451]). 
Soit u une mesure positive sur R\ telle que 
(1) u soit invariante par translation (des boréliens), 
(2) H(Qo) = 1. 
Alors ji = ÀN. 


Démonstration. Pour simplifier l’écriture nous faisons N — 2. Notre but est de prouver que 
d([0,r[ x [0,r’[) = rr/ pour tout r,r'e R. 


(1) Longueur —=1/J Soient J, K des entiers. Nous pouvons diviser le cube Q5 en rectangles de 
côtés 1/J et 1/K : 


j—1 j k—1 k 
Qo= Ut (14.760) 
ia es J °J K °K 
1<k<K 
où l’union est disjointe. En ce qui concerne la mesure nous commençons par utiliser la sous- 
additivité : . _—. 
JL 7 = 
H(Qo)= Ÿ, H ( Ra ) | (14.761) 
er J 'J K °K 
1<k<K 


Nous utilisons ensuite, sur chacun des termes séparément l’invariance par translation selon 
. . 
les vecteurs (2,0) et (0, 1) : 


1 1 1 1 
= _ Dao) = Ke (02 TE ET). 14.762 
u(Qu) Em F0 el) = Ka (lh Sixt). (4762 
1<k<K 
et donc 
à (3 sk 0) = : : _ (14.763) 


(2) Longueur L/K 
Soient L, M des entiers et calculons : 


OL. O0 M L 1+1. om m+l 
n (L el 1) - n (L [x[=, ù (14.764a) 
FL Ta: ne FF: K' _K 
0<m<M—1 
Oo 1 0 1 
= LMy (5 RE rl) (14.764b) 
= LM x > ; É (14.764c) 


D 
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Nous avons donc, pour tout J, K, L, M : 


; (io.5 fo, 2) = - ' = (14.765) 


c’est-à-dire que pour tout r,s € Q* nous avons 
a([0,rf x [0,s[) = rs. (14.766) 


(3) Longueur réelle Nous passons au cas de longueur réelle. Soit a > 0 et une suite croissante 
de rationnels r, — a. Une telle suite existe par la proposition 10.17. L’intervalle [0, a[ s’écrit 
sous la forme d’une union croissante [0, a[ = [J,-,[0,rA[ ; le lemme 14.23(1) peut être utilisé 
et nous avons 


u([0, a[) = w (Uri) _ Jim g([0,rf) = lim mr = 4. (14.767) 


n>1 
Enfin, si a, a’ € R, l’invariance par translation donne 


u([a, aT) = u([0, a’ — af) = a — a. (14.768) 


Par unicité de la mesure ayant cette propriété, nous avons 4 = Àn. 


CorKGMRooHWOQGP 
Corolaire 14.247. 


Si u est une mesure positive sur R\ invariante par translation et telle que a(Qo) = C < © alors 
H = CAN. 


Démonstration. Si C > 0 nous considérons la mesure . u qui vérifie (à 1)(Qo) = 1. En conséquence 
du théorème 14.246, du = Àn et un = CAN. 

Si au contraire C = 0 alors nous pouvons paver R avec des cubes Q; de côté 1 qui ont tous 
mesure 0. Par conséquent, RV = {J?, Q;, done u(R\) = Y,u(Q;) = 0. Par conséquent y = 0 
parce que toute partie de RŸ a une mesure au maximum égale à celle de R". 


14.12.2 Régularité 


Les différentes notions de régularité pour une mesure sont données dans la définition 14.86. Ce 
sont essentiellement des questions de compatibilité entre la mesure et la topologie. 


Proposition 14.248. 
La mesure de Lebesque est une mesure de Radon sur tout ouvert de R". 


Démonstration. Soit V un ouvert de R\. C’est localement compact et dénombrable à l'infini. Il 
suffit de prouver que Àn est de Borel sur V pour que le théorème 14.87 conclue à la régularité de 
la mesure de Lebesgue. 

Soit K un compact de V. Par la proposition 7.96 c'est également un compact de RV. Par 
conséquent X est dans un pavé fermé de R\ du type 


N 
ke lat) (14.769) 
n=1 
et donc en passant par le corolaire 14.244, 


MANS [IG — an) < ©. (14.770) 


Nous avons démontré que À reste fini sur tout compact de V. 
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14.13 Propriétés de l’intégrale de Lebesgue 


Un lemme qui a l’air de rien, mais qui au final est souvent utilisé ; tellement qu’on l’oublie un 


peu. 
LEMooWKSWooPptdEm 


Lemme 14.249 (|1]). 
Soit un compact K de R et une fonction continue f: IR — IR. Alors l'intégrale 


J f (14.771) 
K 


existe et est finie. 


Démonstration. Vu que f est continue sur le compact K, elle y atteint une borne supérieure °! que 
nous nommons M. 

Soit À tel que B(0,R) contienne X. La fonction (M + 1)13(0,r) majore strictement f sur le 
mesurable B(0,R). L'ensemble sur lequel nous prenons le supremum dans la définition (14.461) 
de lintégrale de f est majoré par le nombre fini (M + 1)u(K). Le supremum existe et est fini 
(proposition 1.444). 


Le lemme suivant est la contrepartie du côté des intégrales de l’invariance par translation de 
la mesure de Lebesgue démontrée dans le théorème 14.245. 


LEMooGKOGooPLYaU0D 
Lemme 14.250 (Invariance par translation). 
Soient f intégrable sur R° et a e R°. Alors en posant 
en D 
- (14.772) 
ze f(x +a) 
nous avons 
il fdi = gd. (14.773) 
Rd Rd 
Nous pouvons aussi écrire 
f(x + a)d}(x) = f(é)dACE). (14.774) 
Rd Rd 


14.13.1 Quelques limites dans les bornes 


Dans le cas de l’intégrale de Lebesgue définie par 14.163, si f est une fonction sur KR et si À est 
la mesure de Lebesgue, nous avons une définition directe de 


Î © fax (14.775) 
0 


Nous sommes cependant en droit de nous demander si nous n’aurions pas également ceci : 
. " EQooDVKKooCi 
lim | = | fdx. A0) 


Lorsque l'intégrale considérée est celle de Riemann, l'égalité (14.776) est une définition. Ici, ça va 
être une propriété, voir le lemme 14.254. 


14.251. 
Tant que nous sommes à parler de limites dans les bornes, nous aurions pu vouloir, pour les séries, 
suivre le chemin suivant : 


— Définir l'intégrale de Lebesgue sur un espace mesuré. 


81. Nous ne nous lasserons jamais de citer le théorème de Weierstrass 7.138. 
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— Prendre au passage le cas particulier de ax = (a où a: N — R est une fonction mesurable 
pour la mesure de comptage. 
— Démontrer qu'avec ces définitions, D_0 ax = limnw + ak. 


Or le dernier point est pris comme définition et son égalité avec l'intégrale pour la mesure de 
comptage est une propriété ®?. Pourquoi ? Parce que la définition 14.18 de mesure positive demande 
déjà d’avoir défini les sommes sur N. 


LEMooOUPKLooGucWjb 
Lemme 14.252. 
Soit une partie mesurable À € R* de mesure finie. Alors 
Jim \(A a [M, of) = (. (14.777) 
Démonstration. La fonction 
f:R-Rt 
(14.778) 


zr (An [x,ol) 


est décroissante et bornée vers le bas par 0. Elle possède dont une limite £/ > 0 (corolaire 10.56). 
Nous allons prouver que £ = 0 en calculant la limite sur les entiers. 
Nous posons Jx = [k,k +1[. Pour n € N nous avons : 


f(n) = A(A A [n, oo) (14.779a) 
= X( Ü (A n Jx)) (14.779b) 
k=n 
= > ÀX(A N Jg). (14.779c) 
k=n 


Mais nous savons par hypothèse sur la mesure de À que 


\(Aÿ = ji X(A n Jr) < ©. (14.780) 
k=0 


Donc f(n) est une queue de série convergente. Elle tend donc vers zéro par le lemme 11.90. C’est- 
à-dire que 
lim f(n) = 0. (14.781) 


n—00 


Et comme lim,;_,… f(x) existe et vaut £, la seule possibilité est £ = 0. 


LEMooMUHWooZPbMDb 
Lemme 14.258. 
Soit une fonction mesurable f : R — R*. Alors 
00 
im | fdÀ = 0. (14.782) 
Démonstration. Nous posons 
ee] 
Fa) = Î fax. (14.783) 
PA 


Nous commençons par prouver que c’est une fonction décroissante. En effet, 


Nous avons utilisé 14.187. 


82. Proposition 14.257. 
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Vu que f prend ses valeurs dans R*, nous avons F(x) > 0 pour tout x. La fonction F est 
décroissante et bornée vers le bas. Donc elle a une limite : 


lim F(x) =L> 0. (14.785) 


T—00 


Supposons £ > 0 et posons 0 < € < £. Soit M tel que pour tout x > M nous ayons 
F. EQooZVKI 
Î f>m foozVERoe pres 
HA 


Soit ae R* tel que 
O0 
Î FC) — bdtl < €. (14.787) 


En vertu de (14.786) nous considérons ao > a tel que 
(0e) 
| F=k > M (14.788) 
ao 


Nous construisons la suite strictement croissante (az) de la façon suivante : 


00 
J fJ=k>m (14.789) 
ak 
et 
ak+1 
Î f-Hl<e. (14.790) 
ak 
Donc pour k nous avons 
Ak+1 
J f>zlk-ezm-e. (14.791) 
ak 


Mais 


[ _ » [” f> Dit — €) = ©. (14.792) 


Nous avons une contradiction. 


LEMooKGZDooWiKiHR 
Lemme 14.254 (|[1|). 
Soit f: R — R intégrable sur [a, 0] pour la mesure de Lebesgue. Alors la limite 


lim Î (14.793) 
b— co [ab] 
existe et vaut 
ji Ï = Ï £ (14.794) 
bo Jjab] [a,00] 


Démonstration. Vu qu’on a le droit de découper les domaines d'intégration en domaines disjoints, 
et que l’ajout d’un point ne change rien à la mesure de Lebesgue, nous avons pour tout be [a, ol 


que 
1 f= | f+ Ï f. (14.795) 
[a,oo|] [ab] [b,o0| 


Nous avons l’intention de prendre la limite b — 0. Le lemme 14.253 nous assure que la limite de 
la dernière intégrale existe et vaut zéro. Donc la limite de l’intégrale du milieu existe et vaut celle 
à gauche. 
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14.13.2 Mesure de comptage et série 
DEFooILJRooByDzhs 


Définition 14.255 (mesure de comptage). 
Soit (S,F) un ensemble mesurable. La mesure de comptage sur (S,F) est la mesure définie par 


ee si À est fini 


= (14.796) 
+00 sinon. 


Cette mesure est utilisée pour voir des séries comme des intégrales sur (N, P(N),m). 
LEMooDTFHooLVsvAw 


Lemme 14.256. 
Si m est la mesure de comptage sur N et si P(N) est l’ensemble des parties de N, alors le triple 
(N, P(N), m) est un espace mesuré o-fini. 
Démonstration. Bien entendu l’ensemble des parties de N est une tribu sur N. Nous devons donc 
seulement vérifier les conditions de la définition 14.18. 
Si À est une partie de N, alors m(A) € [0,] parce que c’est soit le cardinal de À soit 00. 
Le cardinal de l’ensemble vide est zéro (ça fait partie de la définition du cardinal 1.122). 
Soient des parties deux à deux disjointes {A;}ier de N. Posons À = (J,, Ai. Si I est infini 
dénombrable, alors l’union est infinie : prendre par exemple la partie S$ = {min(A;)};er qui est en 
bijection avec 1. Nous avons alors d’une part 


m((] 4) > m(S) = ©, (14.797) 


et d'autre part 
D m(Ai) > D 1 = ©. (14.798) 
iel iel 

Si par contre J est fini, alors le lemme 1.124(5) dit que 

m({] Ai) = Card ((JA:) _ D m(Ai). (14.799) 
iel iel iel 

Le fait que notre espace soi o-fini se voit par exemple en posant E, = {0,...,n}. Chaque E, 
est de mesure finie, et leur union est {J,,.x En = N. 


PROPooPNQAooDRLcCm 
Proposition 14.257 (|[1]). 
Soit l’espace mesuré (N,P(N),m) *. Nous considérons une application a: N — R* {c'est à dire 
une suite de nombres réels positifs). 
(1) L'intégrale \X a dm < © si et seulement si la série aussi : D%_9 4n < 00. 


(2) Si fx a dm existe, alors 


[ioum = Ÿ on EUOOFIRHogE PET) 


Démonstration. Nous allons travailler avec la définition 14.163 de l’intégrale et 14.109 pour les 
fonctions étagées. 
(1) Si l'intégrale est < 0 Nous supposons que [Ç adm < co. La proposition 14.203 nous 
permet de découper N en parties disjointes. Nous choisissons de voir N = [J,.n{i} et donc 
de considérer l'égalité 


O0 
adm = Ï adm. (14.801) 


Vu que m({i}) = 1 et que a est constante sur {i}, nous avons de adm = &;, et donc 


[. adm = » di. (14.802) 


83. Définition 14.18. 
84. La mesure de comptage sur IN est donnée en la définition 14.255. 
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Si la somme est < Le terme général a, tend vers zéro ®?. En particulier, pour chaque 
r ER, il n'existe qu’un nombre fini d'éléments de la suite a plus grands que r. 


Soit une fonction étagée #: IN — R* minorant a. Vu qu’elle est étagée, elle ne prend qu’un 
nombre fini de valeurs différentes que nous nommons {a;}, et les parties A; = 4 !(a;) sont 
finies parce que Ÿ minore a. 

Avant de faire un petit calcul, posons quelque notations. D'abord Z = #!(0). Nous avons 
N =), 4; U Z. Nous posons aussi À = U), À;; c’est le support de #. 


Nous pouvons maintenant faire un calcul pour l'intégrale de # sur N : PRO 
Î dm = Ÿ ai Card(Ai) def. (14.460) (14.803a) 
N i 

: s\ D wW(k)) SUBEQOOTIMMQPRTEnE 
à keA; 

= 5 (k) RPBEUOOGOBRe GERS 
kel; À; 

= D px) + D (k) (14.803d) 
keA keZ 

= D (). (14.803e) 
keN 


Justifications. 
— Pour (14.803b). Pour tout k dans À; nous avons Y(k) = œ. 


— Pour (14.803c). Les À; sont disjoints et chacun est fini. La proposition 11.107 fait le 
boulot. 


Étant donné que 4 minore 4, nous avons donc montré que 
['édm = 3 #0 < X an. (14.804) 
N keN keN 


Donc l'intégrale de toutes les fonctions étagées minorant a est majorée par la série de a. Donc 
l’intégrale de a existe et est majorée par cette somme. 


(3) Valeur de l’intégrale Nous supposons encore que la série est finie. Nous avons déjà prouvé 


que 


[. adm < Ÿ° an. FRONT AE 


Nous allons prouver l’inégalité inverse en trouvant une bonne suite de fonctions étagées. Soit, 
pour chaque NE N, 


bN:N—Rt 
_ É sik<N (14.806) 
O0 sinon 


Cela est une fonction étagée qui minore a. Nous pouvons donc reprendre le calcul (14.803) : 


N 
Î pdm = D bn(k) = D ax. (14.807) 
N E=Ù0 


keN 


Par définition de la série, nous avons 


00 


lim [. bvdm = Ÿ a. (14.808) 


N 
Hs k=0 


Donc le supremum des intégrales de fonctions étagées est au moins égal à SE ax. Nous 
avons prouvé l'inégalité inverse de (14.805), et donc l'égalité (14.800). 


85. Proposition 11.89. 
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EXooDMAUooWWVZbq 
Exemple 14.258. 
L’intervalle Z = [0,1] muni de la tribu de toutes ses parties et de la mesure de comptage est un 
espace mesuré non o-fini. A 


14.13.3 Théorème de la moyenne 
LEMooUXNPooXpTxtx 


Lemme 14.259 ([1]). 
Soit A connete par arcs®°, soit f: À — R continue ainsi que à, B € f(A) avec à < B. Pour tout 
y € [a, B], il existe x € À tel que f(x) = y. 


86 


Démonstration. Soient a,b € À avec f(a) = a et f(b) = 5. Vu que À est connexe par arcs, il existe 
une application continue 7: [0,1] — À telle que (0) = a et y(1) = b. Le théorème des valeurs 
intermédiaires appliqué à la composée f o + dit qu'il existe to € [0,1] tel que (f o y)(to) = y. Nous 
avons donc le résultat avec x = (to). 


ThoooEZLGooMChwLT 
Théorème 14.260 ([1, 160]). 
Soit Q un compact connexe par arcs et une fonction continue f: Q — IR. Si À est la mesure de 
Lebesgue, alors il existe a € Q tel que 


1 
fo) = [L fdX (14.809) 


Démonstration. En posant 1 = fo JdÀ nous avons immédiatement 
min(f)X(Q) < I < max(f)A(Q) FqooTYQ contra 


où le minimum et le maximum existent parce que f est continue sur un compact. Si une des 
deux inégalités est une égalité alors la fonction est constante. En effet supposons que la première 
inégalité soit une égalité ; si la fonction n’était pas constante, il existerait une boule sur laquelle 
f serait strictement supérieure à min(f). En intégrant d’abord sur cette boule et ensuite sur le 
complémentaire nous obtenons une intégrale plus grande que min(f)A(Q). 

Vu que f est continue sur le compact Q, il existe à, 8 € Q tels que f(a) = min(f) et f(B) = 
max(f). Vu que min(f) < I/A(Q) < max(f), le lemme 14.259 montre qu’il existe a € Q tel que 
f(a) = I/X(Q). Autrement dit, 


1 
= [ Fax (14.811) 


14.13.4 Primitives et intégrales 
DEFooGLJDooFeZBBC 


Définition 14.261. 
Si a < b nous posons 


b 
J f(#)dt = Î : (14.812) 
a [ab] 


Si par contre a > b nous posons e == 
PropEZFRsM)j 
Proposition 14.262 (Primitive et intégrale[323]). 
Soit f une fonction intégrable sur [a,b] et continue sur ]a,b[. Alors la fonction 
F:[a,b| -R 
14.813 


la,x] 


est l’unique primitive de f sur |a,b[ s’annulant en x = a. 


86. Définition 10.61. 
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Démonstration. Nous devons prouver que F est dérivable et que pour tout x0 € ]a, b] nous avons 
F'(x0) = f(x0). Soit € > 0. Par continuité de f en xo, il existe une fonction a: R — R telle que 


f(xo + h) = f(xo) + a(h) (14.814) 


avec limp_,0 a(h) = 0. Cette dernière limite signifie qu’il existe un Ô > 0 tel que |a(h)|] < € pour tout 
h tel que |h| < 6, c’est-à-dire pour tout h € B(0,6). À partir de maintenant nous ne considérons 
plus que de tels h. 

Notre travail maintenant est de prouver que Fest dérivable en x0, et de montrer que la dérivée 
est f(xo). Pour cela, 


zo+h 
F(o + h) — F(ao) = | F(b)dt (14.815a) 
. [ten + pat (14.815b) 
0 
h 
- | [f(xo) + a(t)]dt (14.815c) 
à h 
L hf(uo) + | a(#dt. (14.815d) 
0 


Nous avons donc montré que pour tout € > 0, il existe un Ô (défini via la fonction a) tel que 
[h| < Ô implique 
F(xo + h) — F(xo) 


h f(xo) 


_. (14.816) 


Cela signifie que 


_—. F(xo + h) — F(xo) 


lim 1 = f(x0), (14.817) 


qui n’est rien d’autre que le fait que F est dérivable en x9 et que sa dérivée est f(xo). 


Le fait que Fs’annule en x = a est par sa définition. L’unicité provient du corolaire 12.202. 
ThoRWXooTqHGbC 


Théorème 14.263 (Théorème fondamental du calcul intégral). 
Soit f une fonction continue sur un intervalle ouvert I contenant strictement l’intervalle [a, b] € R 
et F une primitive de f sur I. Alors 


[rc = ro - re (14.818) 


Démonstration. Nous avons vu par la proposition 14.262 que la fonction 


G:[a,b| —R 
Le (14.819) 
se [ dt 
était l’unique primitive de f sur Ja, b[ à s’annuler pour x = a. Nous avons évidemment 
b 
J f{bjdt = GO). (14.820) 


Si F est une primitive quelconque, il suffit de soustraire sa valeur en x = a : G(x) = F(x) — F(a) 
et donc 


[ro - cœ = rt F(a), (14.821) 


comme il fallait le prouver. 
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Le théorème fondamental s'écrit souvent sous la forme ?? 


s@ = 1 + [rat EaooBBCYoaNeurn 


Sous cette forme, il faut penser que nous calculons f(x) en un point pas trop éloigné de a, en 
sachant f(a) et en intégrant la dérivée entre les deux. 


Remarque 14.264. 
Le lien entre primitive et intégrale est fondamentalement lié à l’invariance par translation de la 
mesure de Lebesgue, et non à la construction précise de cette mesure. Mais en même temps, la 
mesure de Lebesgue est l’unique à être invariante par translation. 

Quelque remarques. 


(1) Le théorème fondamental du calcul intégral est à utiliser pour calculer des intégrales des 
fonctions réelles lorsqu'on a des primitives sur un domaine strictement plus large que le 
domaine sur lequel nous voulons intégrer. 


(2) Une version pour les intégrales impropres sera donnée au corolaire 14.276. 
(3) Une primitive est forcément une fonction continue parce qu’une primitive est dérivable. 


(4) Le théorème fondamental du calcul intégral ne sert pas qu’à calculer des intégrales à partir 
de primitives. Il sert aussi à démontrer des résultats plus théoriques, comme le théorème 
12.384. 


(5) En vertu du corolaire 12.202, une fonction ne possède qu’une seule primitive à constante 
près. 


14.13.5 Exemples et applications 


Si f est une fonction définie sur un intervalle 1 et y admettant des primitives, nous notons 
[ (x)dx (14.823) 
l’ensemble des primitives de f sur 1 : 
[ rtmar = {F(x) + C tel que CE R} (14.824) 


où Fest une quelconque primitive de f. 


Exemple 14.265. 
Une primitive bien connue de f: x + x? est la fonction F': x — %. Nous écrivons donc 


<8 
far = +C. (14.825) 
Cela est un abus de notations terrible pour dire en réalité 


3 
{x — +C'tel que CE R}. (14.826) 


En termes de notations, nous posons 


J "fat = FO = F(b) — F(a). TR OPÉ RS) 


t=a 


87. Par exemple dans les théorèmes du reste des polynômes de Taylor 15.53 et de Cauchy-Lipschitz 17.42. 
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Remarque 14.266. 

La valeur de l'intégrale ne dépend pas de la primitive qu’on choisi pour le calculer, car si Fi et 
F2 sont deux primitives de f alors F1 = F2 +C'et F1(b) — Fifa) = (F2(b) + ©) — (Ba) + ©) = 
F)(b) — F(a). 


Remarque 14.267. 
Si l'intervalle d'intégration est réduit à un seul point alors la valeur de l'intégrale est zéro. Nous le 
savions déjà, et cela est cohérent avec le théorème fondamental car Ÿ° f(t)dt = F(a) — F(a) = 0. 


Remarque 14.268. 


Toute intégrale d’une fonction impaire sur un intervalle symétrique par rapport à l’origine est nulle. 
PROPooJYIAooXLkbMx 


Proposition 14.269 (|[1]). 
Soient des espaces vectoriels normés E et F où F est de dimension finie. Nous considérons une 
fonction f: E — F de classe C} ainsi qu’un chemin y: [0,1] — E de classe C! également. 

Alors nous avons l'égalité 


1 
Î 6) = (10) — F0). (14.828) 


Démonstration. Nous posons 
g:[0,1]—F 
te (fo7y)(e). 


Cette fonction vérifie g/(t) = (df);«(1(#)) par le lemme 12.292. Le théorème fondamental du 
calcul intégral *” nous permet donc d'écrire 


(14.829) 


1 


1 
[ COMICION LE [ g'(#)df = g(1) — (0). (14.830) 


Notons que g est continue grâce aux hypothèses de classe CT pour + et f. 


14.13.6 Permuter limite et dérivée 
NORMALOoGYUEooKrY;jyz 


14.270 ([323]). 
Voici une preuve alternative du théorème 12.384. Elle utilise des intégrales ; elle demande donc 
plus de dépendances. 


Énoncé Soient une suite de fonctions f;: R — IR, une fonction f:IR — LR et une fonction 
g: R — R telles que 


(1) f; est de classe C1 pour tout 1, 
(2) f; — f simplement, 


(3) f! — g uniformément sur tout compact. 


Alors 
(1) f est de classe C!, 
(2) ‘à — 9; 


(3) f; — f uniformément sur tout compact. 


88. Sinon l'intégrale dont nous allons parler n’est pas définie au sens où nous n’en avons pas donné de définition. 
Voir 14.188. 
89. Théorème 14.263. 
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Preuve Nous commençons par considérer æ0 € R et un intervalle compact K contenant x9. Nous 
montrons que f’(xo) = g(xo) en plusieurs étapes. 


(1) 


Une formule intégrale Par hypothèse, les fonctions f; sont continues (en particulier sur 
un ouvert contenant K), et le théorème fondamental de l’analyse 14.263 donne 


f(x) = fi(xo) + [ f!(t)dt FRooFUBZ 000 RReE 


pour tout x € K. Nous avons envie de prendre la limite à — © en permutant la limite avec 
l'intégrale. Pour cela nous allons utiliser la convergence dominée de Lebesgue. 


Convergence dominée La convergence uniforme sur tout compact des fonctions continues 
f! vers g donne la continuité de g, théorème 12.367. En particulier g est bornée et donc 
intégrable sur le compact [x0,x]. Mais il en faut plus pour le théorème de la convergence 
dominée de Lebesgue (théorème 14.200). Soit a > 0; il existe N tel que pour tout à > n nous 
ayons | f} — g| < a. Avec cela nous avons 


Lfi(æ)| < |g(x)| + a (14.832) 


pour tout x € K. En particulier, la fonction x + g(x) + a fonctionne pour la convergence 
dominée et nous pouvons permuter la limite et l’intégrale dans (14.831). 


Passage à la limite 


En passant à la limite à — © dans (14.831) nous trouvons 


f(æ) = f(xo) + [ “Aie EQooAECSopZpo hd 


To 


Premières conclusions 


Il suffit maintenant de prendre la dérivée de (14.833) au point x = x0 grâce à la proposition 
14.262 : 

F'(xo) = g(xo). (14.834) 
Cela nous donne l'égalité f” = g parce que xo était arbitraire. 
De plus g est continue comme limite uniforme des fonctions continues f/. Plus précisément, 
pour voir la continuité de g en 0, prendre un ouvert borné B(x0,r) autour de xo, et ensuite 
un compact À contenant cet ouvert. La convergence uniforme f? — g sur K implique la 
convergence uniforme sur B(x0,r) et donc la continuité sur B(xo,r) (théorème 12.367). 


ji — f uniforme sur tout compact 


Un compact n'étant pas spécialement connexe, nous ne pouvons pas reprendre le travail 
fait jusqu'ici sans prendre une petite précaution. Soit un compact L. Cette partie de R 
étant bornée °°, nous pouvons prendre r assez grand pour que L € B(0,r). Nous posons 
K = B(0,r) et nous prouvons la convergence uniforme f; — f sur K. A fortiori, cela 
donnera la convergence uniforme sur L. 

Prenons la différence entre (14.833) et (14.831) : 


SC) — A = (ro) — fi(eo) + Î | 9 — fé (14.835a) 
< Geo) io) + | [160 — Hoia PROMESSE) 
De ee (14.835c) 


Notez les valeurs absolues autour de l'intégrale dans (14.835b). Elles sont nécessaires parce 
que x est dans un voisinage de 0, sans que nous sachions si æ > x0 ou x < 0 (ça change le 
signe de l'intégrale). 


90. Par le théorème de Borel-Lebesgue 10.24 
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Nous avons donc 

Lf— fil <I(F — fi)(xo)| + diam(K)|g — fi] (14.836) 
où diam(ÆK) est le diamètre de K, c’est-à-dire la plus grande distance entre deux éléments 
de X c’est un nombre fini parce que K est borné. Il majore évidemment |x — x0|. Le membre 
de droite tend vers zéro si à — @ parce que nous avons convergence simple f; — f et donc 
(f — fi)(xo) — 0, et parce que nous avons convergence uniforme sur tout compact, donc 


lg — fl] — 0. 
Nous avons donc bien lim;_,% | f — f;] = 0, c’est-à-dire convergence uniforme de (f;) vers f 
sur K. 
La proposition suivante est la généralisation à IR de la proposition 12.445. 
PROPooKTASooGngEDh 
Proposition 14.271. 
Pour tout a ER, si fA(x) = x°* alors 
fix) = ax" t, (14.837) 


Au niveau du domaine, c’est R auquel il faut enlever {0} si a — 1 < 0. 


Démonstration. Soient a € R et une suite de rationnels &; qui converge vers @. Les plus amateurs 
d’abstraction diront (a;) € a en référence à la proposition 1.403. 
Nous notons f(x) = 2° et f;(x) = æ%. Par définition nous avons 


Ji — fa (14.838) 


ponctuellement. De plus en utilisant la proposition 12.445 nous savons que f(x) = xl, En 
posant g(x) = ar®-! nous avons donc 
fi — 9. (14.839) 


ponctuellement. Mais f! est continue pour tout 4 et g également. Donc la convergence f; — f, est 
uniforme sur tout compact °!. Le théorème 12.384 nous permet de permuter limite et dérivée pour 
avoir g = f/. 


14.13.7 Intégrales impropres 
SecGAVooBOQddUu 


Définition 14.272 ([323|). 
Une fonction f: D € R — KR est localement intégrable sur un intervalle T1 si f est intégrable 
sur tout intervalle compact contenu dans I. 


PropCJAooQhNYkp 
Proposition 14.273. 


Soit f:[a,b] — R une fonction intégrable. Alors 


[, f= lim Le f. EaPPHopBRDTIE 


æ—b— 


Démonstration. Notons que la valeur de f en b n’a strictement aucune importance parce que 
l'intégrale de Lebesgue ne dépend pas du choïx de la valeur de la fonction en un ensemble de 
mesure nulle ; et en même temps la limite à gauche de (14.840) ne dépend pas non plus de la valeur 
de f en b. Bref si f n’est pas définie en b, nous pouvons poser f(b) = 42. 

Notons de plus que du point de vue de l'intégrale de Lebesgue, Viab] et dat sont identiques et 


valent toutes les deux (4 (lorsque ça existe). 
Supposons d’abord que f est positive. Alors nous posons f, = f Lab 1}. Ponctuellement nous 
avons la limite croissante f, — f et de plus 


lim = lim [., Fe (14.841) 


x—b— n—00 


91. Proposition 12.374. 
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Chacun des f, est intégrable sur [a,b]. Le théorème de Beppo-Levi 14.173 implique que f est 
intégrable sur [a,b] et que 


b b 
Jim | fn = [ f. (14.842) 
Cela montre que dans le cas d’une fonction f positive nous avons bien (14.840). 


Si f n’est pas positif, alors nous la décomposons en partie positive et négative f = f* — f— et 
par définition de l'intégrale d’une fonction non positive, 


li = li + ne : 
im Î im | / im | / (14.843) 


æ—b— 


Il peut cependant arriver que la limite lim,_,p ç f existe alors que f n’est pas intégrable sur 
[a,b]. C’est l’ennui des fonctions non positives. Un exemple classique est 


Î ” sn() y, FAP OP PRE A) 


t 
. DEFOooINPOooWWObEz 
Définition 14.274 ([152]). 
Si : 
je J f (14.845) 
æ—b J, 


existe alors nous disons que l'intégrale est convergente en b. Ce procédé de limite est l’intégrale 
impropre de f sur [a,b]. 


Exemple 14.275 (Intégale impropre). 


Nous considérons la fonction f: [0,%0[— R définie par 


(14.846) 
si x e [2n — 1,2n|. 


Ë sixe[2n—2,2n-—1[ 


Par la divergence de la série harmonique, fo |f| n'existe pas. La fonction f n’est donc pas intégrable 
au sens de Lebesgue (définition 14.181). 
Cependant pour tout n pair nous avons 


[ f=0. (14.847) 
0 


Du coup pour tout x > 0 nous avons 
HA HA 
Î f = Î (14.848) 
0 2n 


où 2n est le plus grand nombre pair inférieur à +. Nous avons [x — 2n] < 2 et |f(x)| < À pour 
x € [2n,x]. Donc 


ds 2 
Fe (14.849) 
2n nm 
Nous avons par conséquent 
HA 
in, [ f =0, (14.850) 
ce qui signifie que l'intégrale de f sur [0,|[ converge au sens des intégrales impropres. PA 


L'intégrale (14.844) est une intégrale convergente mais la fonction n’est pas intégrable (parce 
que pour être intégrale il faut que |f| soit intégrable). Nous pouvons ainsi dire que cette intégrale 
converge mais n’existe pas. 

Le corolaire suivant nous autorise à utiliser le théorème fondamental du calcul intégral 14.263 
même dans les cas limites. 
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CorMUIooXREleR 
Corolaire 14.276. 
Si f est localement intégrable sur [a,b] et si F est une primitive de f sur tout ouvert de [a,b] alors 


[ f- lim F(x) — F(a). (14.851) 


Démonstration. Pour chaque x dans [a, b[ nous avons 
A 
J f = F(x) — F(a). (14.852) 
a 


La proposition 14.273 nous explique que la limite + — b7 du membre de gauche existe et vaut 
le f. Donc également le membre de droite : 


b œ 
J f — lim J f= lim F(x) — F(a). (14.853) 


æ—b— ab 


La convergence des intégrales de fonctions _ en 0 et © est une question classique de l’intégra- 
tion. De plus ces fonctions servent souvent à utiliser une théorème de comparaison (type intégrale 
dominée de Lebesgue). 


PropBKNooPDIPUc 
Proposition 14.277. 
Deux intégrales remarquables. 
(1) Nous avons 
| 
Î — = (14.854) 
o 2° 
si et seulement si a > 1. ITEMooJFSXooHmgnE) 
(2) Nous avons 
ne 
Ï — = (14.855) 
1 2° 


si et seulement si a < 1. 


Démonstration. La fonction Æ admet la primitive F(x) = = sur tout compact de ]0, 1. 


FA 
; 1 
t°2 de dire que a JL vaudra 


Le corolaire 14.276 nous perme 


| 1 
lim > 
x—0-+1-axt— 


(14.856) 


Cela est strictement plus petit que © si et seulement si à < 1. 


14.14 Changement de variables dans une intégrale multiple 


Dans ce qui suit, U et V sont des ouverts de R\ et @: U — V est un C!-difféomorphisme. 
Nous notons Q l’ensemble des cubes fermés dans U dont les côtés sont parallèles aux axes. 


92. Tout ce que nous avons fait avec la borne b de l’intégrale fi reste valable avec la borne a. 
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14.14.1 Des lemmes 


Lemme 14.278 ([451|). 
Soient u et v deux mesures de Borel sur l’ouvert U de R". Si (Q) < v(Q) pour tout Q € Q alors 
u(B) < v(B) pour tout borélien B. 


LemooJYCGoo!IkkDVn 


Démonstration. Si Q est un cube semi-ouvert, c’est-à-dire de la forme 
III Gn> An +A[CU (14.857) 


alors Q est une réunion croissante de cubes fermés du type [a, +e, an +h—e], et donc u(Q) < v(Q) 
par le lemme 14.23(1). La propriété est donc vraie pour les cubes semi-ouverts. 

Si ( est un ouvert, alors il est réunion disjointe dénombrable de cubes semi-ouverts par la 
proposition 14.243. Donc pour tout ouvert Q € U nous avons u(Q) < v(Q). En vertu de la 
proposition 14.87 et de la remarque 14.88, les mesures 4 et v sont régulières, et l’inégalité au 
niveau des ouverts se répercute en inégalité pour tout boréliens de U : 


u(B) < v(B) (14.858) 


pour tout B € Bor(U). Notons que U étant ouvert dans RA, les boréliens de U sont exactement 
les boréliens de R\ inclus dans U par le corolaire 14.55. 


LemooJCEDooBRyjRg 
Lemme 14.279 ([451|). 
Soit une application 0: U — R\ de classe C! où U est ouvert dans R\. Pour tout Q € Q nous 


avons 
An (8(Q)) < sup Id8.| Van (Q). (14.859) 


Démonstration. Nous notons h la longueur du côté du cube. Le théorème des accroissements 
finis 12.325, pour la composante 0; donne, pour u, v € Q : 


EqgooFZMAo 
\9;(u) — 8;(v)| < sup|(d8:)[[u — v| < sup |(d#).|r. 4 PÉLSEO) 
8€Q s€Q 
D'autre part nous avons (nous écrivons pour N = 2 pour être plus court) : 


dOs(u) = . O1(s +tu)ei + 02(s + tuez | = (d01)s(u)e1 + (dô2).(u)e2. (14.861) 


al 


Donc pour chaque à : |d8,| > ||(d6;).|, et nous continuons la majoration (14.860) : 

(a) — &i(v)| < sup |(d9,).1 < sup dB. (14.862) 
s€Q s€Q 
Les points 0(u) et O(v) sont donc dans un cube de côté sup,co |d0,|h, ce qui permet de majorer 
AN (0(Q)) par 
N N 
Av (8(Q)) < (supldtln) = (suplast) ax (14.863) 
s€Q s€ 


où le dernier facteur provient de l'égalité AN = An(Q). 


14.14.2 Déterminant et mesure de Lebesgue 


Dans la suite, Qo désigne le cube unité : Qo = ([0, 19" 
ThoBVIJooMkifod 
Théorème 14.280 (Interprétation géométrique du déterminant[151]). 
Soit une application linéaire T: RN — R\. Alors pour tout borélien B de R\, 


An(T(B)) = |det(T)|An(B). (14.864) 
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Démonstration. Nous considérons la mesure positive 4 donnée par u(B) = An(T(B)), qui est bien 
une mesure par la proposition 14.81. Cette mesure est invariante par translation parce que Àw 
l’est : 

u(B + a) = An(T(B) + a) = An(T(B)) = u(B). (14.865) 


De plus, T(Qo) est borné et nous notons 1(Q0) = €’. Nous avons u = C'An par le corolaire 14.247. 
(1) C(TTD2) = C(T:)C(D2) Par définition, 


C(AiB)An(B) = An((T17)(B)) (14.866a) 
= AN(T(PB)) = C(D)AN(B(B)) = C(N)C(B)AN(B).  (14.866b) 


Par conséquent la fonction C'est multiplicative : 
C(DiT2) = C(T)C(B). (14.867) 


Et en plus, C(Id) = 1. 


(2) Matrice diagonale En guise de T', nous considérons l’application linéaire diagonale donnée 
par De; = dje;, ou, sous forme matricielle, D = diag(d1,...,dn) qui fait 


T(Qo) = [0, dif x ... x [0,dnl (14.868) 

La mesure de cela est |d1 -:-dn|, ce qui nous donne 
C(D) = |d...dn| = |det(D)|. (14.869) 
(3) Matrice orthogonale Nous considérons maintenant T = U où U est une matrice ortho- 


gonale (UUT = 1). Une matrice orthogonale est une isométrie ** qui conserve donc la boule 
unité : UB(0,1) = B(0,1). Nous avons 


An(B(0,1)) = An(UB(0,1)) = C(U)An(B(0,1)) (14.870) 


par conséquent C(U) = 1, et 1 est justement le déterminant de U. 


(4) Matrice quelconque Nous savons par le corolaire 13.35 de la décomposition polaire que 
toute matrice peut être écrite sous la forme T = U DU2 où Ü,; sont orthogonales et D 
est diagonale. Donc C(T) = C(U1)C(D)C(U2) = det(U1) det(D) det(U2) = det(U2DU2) = 
det(T') parce que le déterminant est multiplicatif (proposition 9.13(1)). 


Ce théorème donne une interprétation géométrique du déterminant en tant que facteur de 
dilatation des volumes lors de l’utilisation d’une application linéaire. Si T est une application 
linéaire quelconque, 


N(T(Qo)) = |det(T)lAn(Qo) = | det(T)|. (14.871) 


Le déterminant de Test le volume de l’image du cube unité par l’application T. 
De la même façon, en utilisant l’application linéaire T(x) = ax nous avons pour tout borélien 
B : 
An(aB) = a" )n(B). (14.872) 
Une dilatation d’un facteur a des longueurs provoque une multiplication par a des volumes. 
LEMooULSMooCimcIT 


Lemme 14.281. 
Tout hyperplan** de R” est de mesure de Lebesque nulle. 


93. Proposition 9.43. 
94. Définition 9.301. 
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Démonstration. Dans le cas d’un hyperplan vectoriel, il s’agit de prendre le théorème 14.280. En 
posant B = R”, et en considérant l’application linéaire de projection de IR" vers l’hyperplan, on a 
le résultat parce que le déterminant d’une telle application est nul. 

Si l'hyperplan n'est pas vectoriel, alors nous utilisons l’invariance par translation ® et nous 
nous ramenons au cas vectoriel. 


Cor THDQooWMSbJe 
Corolaire 14.282 ([435]). 
Tout ouvert de R" est une union dénombrable de cubes presque disjoints %. 


Démonstration. Il suffit de prendre les cubes de la proposition 14.243 et de les fermer. Ce que l’on 
ajoute est de mesure nulle °?. 


Remarque 14.283. 

La proposition 14.243 est une propriété seulement de la topologie de R” alors que le corolaire 
14.282 fait intervenir la mesure de Lebesgue parce qu’il faut bien dire que les intersections sont de 
mesure (de Lebesgue) nulle. 


14.14.3 Ensembles négligeables 
LemWHKJooGPuxEN 


Lemme 14.284 ([453]). 
L'image d’une partie négligeable de RŸ par une application Lipschitz est négligeable. 


Démonstration. Soit N une partie négligeable de R% et une application Lipschitz f : N — Ré. Soit 
Q © R un cube borné de côté r. Pour tout x,x/e N n Q nous avons 


f(x) — f(x) < Cr — x'| < Cr. (14.873) 


Donc f(N nQ) est dans une boule de rayon Cr. Mais comme toutes les normes sont équivalentes °* 
sur R% nous pouvons tout aussi bien prendre la norme ||.|; au lieu de la norme |.|2 (qui est toujours 
la norme prise implicitement lorsqu'on parle de R”), de telle sorte que les boules soient des cubes. 
Quoi qu’il en soit, f(N n Q) est contenu dans un cube de côté 2Cr et au niveau de la mesure 
extérieure, 


m*(f{N n Q)) < (2Cr) = (2C}/rf, (14.874) 


ou encore 


m(f(N n Q)) < (2C)°m(Q) (14.875) 


parce que rŸ est la mesure du cube Q. 

Soit maintenant € > 0; vu que N est négligeable, il existe un ouvert ÜU contenant N et tel que 
m(U) < €. Ce U est une union presque disjointe de cubes dyadiques (Q,) par le corolaire 14.282. 
Nous avons alors 


m*(F(N)) = m* (FUN n Q)) (14.876a) 
= m*( Usa N Qn)) (14.876b) 
<> _ (FN n Qn)) (14.876c) 
< S'AC)m(Q) (14.876d) 
= CC) MU) (14.876e) 
eV0ie (14.876f) 


95. Théorème 14.245. 

96. « presque » au sens où les intersections éventuelles sont de mesure de Lebesgue nulle. 
97. Voir le lemme 14.281. 

98. Proposition 11.44 
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Au final, m*(f(N)) < (20C)%e. L'ensemble N est donc négligeable parce que le lemme 14.72 le dit : 
m*(N) = 0. 


Corolaire 14.285. 
Un sous-espace vectoriel strict de R\ est négligeable. 


Démonstration. Un sous-espace vectoriel strict de RV de dimension k < N est l’image de 
A = {tiei +... +trex tel que t; € R} (14.877) 


par une application linéaire. Ce À est un pavé de mesure de Lebesgue nulle. Donc l’image est 
négligeable par le lemme 14.284. 


14.14.4 Parties et fonctions mesurables 


Pour rappel, la notion d'application de classe C! est donnée par la définition 11.227. 
PropRDRNooFnZSKt 


Proposition 14.286. 
Soient U et V des ouverts de RŸ et @: U — V un C'-difféomorphisme. Si E & U est mesurable, 
alors Q(E) est mesurable”. 


Démonstration. Si E est mesurable, il existe un borélien B et un ensemble négligeable N tels que 
E = BU N. Vu que est un homéomorphisme, l'application dl est borélienne parce que continue 
(théorème 14.53). Nous avons 


g(B) = (9-1)"(B), (14.878) 


c’est-à-dire que g(B) est l’image inverse de B par 9 !. L'ensemble (B) est donc borélien. 

Il reste à voir que O(N) est négligeable. Soit Q € U un cube compact. L'application dp: Q — 
£L(R4,R%) est continue et donc bornée (par la remarque 11.233) sur le compact Q. Par les accrois- 
sements finis (théorème 11.254), l'application @ est donc Lipschitz sur Q. La partie O(N An Q) est 
alors négligeable par le lemme 14.284. Pour conclure, 


GUN) = UJE(N n Q:) (14.879) 


où les Q; sont tous des cubes compacts. Donc O(N) est une union dénombrable d’ensembles négli- 
geables ; ergo négligeable lui-même par le lemme 14.64. 


Proposition 14.287. 
Soient U et V des ouverts de R\ et o: U — V un C'-difféomorphisme. Si f: V — C est mesurable, 
alors f oo: U — C l’est. 


Démonstration. Soit À une partie mesurable de C. Il nous faut prouver que 
(fo gp)" (4) = #7" (f7"(4)) (14.880) 


soit mesurable. Par hypothèse , f—!(A) est mesurable. Vu que 6 est un C!-difféomorphisme, elle 
et son inverse sont mesurables par la proposition 14.286. Donc l’image du mesurable f-1(A) par 
dl est encore mesurable. 


PROPooSEJJoo!IfGUkW 
Proposition 14.288. 
Si f: R° — R’ est de classe C© et si N est une partie de mesure (de Lebesgue) nulle dans R”, 
alors f(N) est également de mesure nulle. 

PROPooIESAooBsThho 
Proposition 14.289. 
Soit une application f : R° — IR qui s’annule une quantité dénombrable de fois. Soit N de mesure 
nulle dans R°. Pour tout € > 0, il existe d € R” tel que |ô] < € et tel que la fonction x + f(x +0) 
ne s’annule pas sur N. 


99. Ici « mesurable » parle de mesurabilité au sens de la tribu de Lebesgue, c’est-à-dire pas seulement les boréliens. 
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Démonstration. Soient {x;};en les racines de f. Pour chaque 4, nous notons 
F; = {Ôe R" tel que x; +0 e N}. (14.881) 


Chacun de F; est de mesure nulle, et done [J?, F; est de mesure nulle. Il suffit de prendre 6 € 
B(0,e)\Ù); F;, et nous avons x; + hors de N pour tout 1. 


14.14.5 Le théorème et sa démonstration 
THOooUMIWooZUtUSg 


Théorème 14.290 (Changement de variable[453, 451]). 
Soient U et V des ouverts de R\ ainsi qu’un C'-difféomorphisme @: U — V. Nous notons J, la 
fonction 


Jé: RV —R 
(14.882) 
a+ det(d@s). 
Alors : ItemVWYDooUzimyfi 
(1) Si E CU est borélien, alors @(E) est borélien et 
An (4(E)) = J lé, (14.883) 
E 
2 N : —] _ : 
c'est-à-dire 7 (An) = IJél : An. ITEMooEZUBooGBuDOS 
(2) Si f: V — [0, +00] est mesurable alors la fonction 
x [J$l: U — [0,00 
(Fo 9) x Hgl: U — [0,0] _. 
ti (fo )(x)Jé(x)IdAN (x) 
l’est également et !00 
EqRANEo0oQSE 
IPS RED OI CIC) RANCE APE 
U U 
Fo ITEMooAJGDooGHKnvj 


(3) Si f: V — © est mesurable alors elle est intégrable si et seulement si (f o d) x ||: U — © 
est intégrable. Si c’est le cas, alors nous avons encore la formule de changement de variables : 


[ra - 1. POIL FOOT AMOETÉEES 


Démonstration. Attention : la preuve va être longue. 


(1) Le fait que @(E) soit borélien lorsque Æ l’est est la proposition 14.286. En ce qui concerne 
la formule annoncée, il faut travailler. 


(1a) Inégalité dans un sens (cubes) Nous commençons par prouver l'inégalité 


Xw(6(Q)) < [L Jo(æ)dr EgooQCXXop6 Gex 


pour tout Q € Q. On peut diviser le côté du cube Q en k éléments de longueurs égales. 
Le cube est alors divisé en 4Ÿ petits cubes d’intérieurs disjoints. Nous les nommons Q; 
(i=1,...,kN) Nous avons alors 


> AN(Q:) = D (Int(Q:)) - An ([]JImt(Q:)) < An(Q) < > An(Q:). (14.888) 


La dernière inégalité est le fait que les intersections ne sont pas disjointes. Toutes ces 
inégalités sont en réalité des égalités et en particulier : An(Q) = ÿ;; An(Qi). 


100. L’intégrabilité d’une fonction est la définition 14.181 qui stipule que l'intégrale de |f(x)| est finie. L'égalité 
proposée a un sens si les deux membres sont infinis. Il n’y a donc pas d’hypothèses d’intégrabilité obligatoire pour 
écrire une intégrale lorsque la fonction a des valeurs positives. 
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Soit a € Q;. Posons 
O:U—U 


0 — (dha)* 0 ® 


Cela appelle deux commentaires. D'abord l’application dp, : U — V est inversible parce 
que 6 est un difféomorphisme (lemme 11.246). Ensuite, l'application @ est la composée 
de (dpa) (qui est linéaire) et de 6 qui est de classe C! ; donc 0 est de classe C1. Donc le 
lemme 14.279 s’applique. La différentielle de @ n’est pas trop compliquée à écrire parce 
que nous avons la formule de différentielle d’une composée (théorème 11.242) et le fait 
que (da)! qui est linéaire et donc sa propre différentielle (lemme 11.238). Nous avons 
donc d0 = (dpa) ! o d@, et le lemme donne 


(14.889) 


ÀN ((dpa) "p(a)) < de |(dpa)"* 0 dps| AN (Q:) (14.890) 


Étant donné que (da)! est une application linéaire, la proposition 14.280 s'applique, 
et donc 


A (da) té(a)) = |det(dda) "An (d(a)). (14.891) 
Le déterminant d’une application réciproque est donné par la proposition 9.13(4) : 
det ((dpa) =) = (14.892) 
det (da) Jé(a) 
Recollant les morceaux, 
1 = 
An (#(Q:)) < sup |(dba) "0 dés| An (Q:), (14.893) 
Jé(a) sEQi 
ou encore : 
n(8(Q:)) < Lé(a)l sup I(dé) 7 0 dés] Aw(Qn). (14.894) 
SEGi 


Vu que a et s sont proches l’un de l’autre (on peut choisir encore la taille du cube), 
nous pouvons espérer que (dp,)-! ne soit pas loin d’être l'inverse de d@,. Et c’est en 
effet le cas. Pour s’en assurer, remarquons que l’application 


dp: Q; — £L(RY,R") (14.895) 


est continue et même uniformément continue parce que Q; est compact. De plus la 
composition de différentielles étant un produit de matrices nous pouvons permuter la 
limite dans le calcul suivant : 


lim (dba)=! 0 dés = (da)? o lim dés = 1. (14.896) 


Donc si e > 0 est donné, il existe 6 tel que pour tout s € B(a,6), |(dpa) todp;—1| < €. 
En ce qui concerne les normes, si | À — 1| < € alors |A] < |A — 1} + [1] < e +1. 

Cela étant dit, nous nous souvenons que nous avions découpé U en un nombre fini de 
cubes Q; d’égales dimensions ; il suffit de prendre k suffisamment grand pour que la 
diagonale des cubes sot plus petite que le minimum des 6;. Avec un tel découpage, 


sup |(dpa) * o dps| < 1+e (14.897) 


SEC; 


et par conséquent 


An (d(Q:)) < (1+ 9) Ja) (Q:) ÉgooQRINon ZE 


où nous avons ajouté un indice à au point a pour nous rappeler que nous avons choisi 


a € Qi. 
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Le théorème de la moyenne 14.260 appliqué à l'intégrale fo, HJ4(t)IdAn(t) donne l’exis- 
tence d’un a; € Q; tel que 


ai = [, Jyldan. (14.899) 


Ce point a; vérifie l’inégalité (14.898) comme tout point de Q;. Nous sommons ces 
inégalités sur tous les à : 


An (o(Q)) < 2) An (d(Q:)) (14.900a) 


< (1+ 2 a " or) An (Qi) (14.900b) 


=(L+ MY | [JéldAn (14.900c) 
à Qi 


= +9" | BAL (14.900d) 
Q 


où nous avons utilisé le fait que 19 = ÿ,;1o, presque partout. En prenant le limite 
€ — Ü nous trouvons 


An (o(Q)) < [ BALE (14.901) 


L’inégalité (14.887) est prouvée. 


(1b) Inégalité pour les boréliens 


Soit B un borélien de U. Vu que U et V sont des ouverts de R\, les mesures de Lebesgue 
sur U et sur V sont les mêmes que celles sur R° par le corolaire 14.55. 

Par les définitions 14.205 et 14.81, les applications y et v définies par y = !(Ax) et 
v = |J,|An sont des mesures positives sur U (de Borel, qui plus est). L’inégalité (14.887) 
à peine prouvée s'écrit 1(Q) < v(Q) pour tout cube Q. Le lemme 14.278 nous dit alors 
que l'inégalité tient pour tout borélien. 


(1c) Inégalité dans l’autre sens 


En utilisant la notation de la mesure image et du produit d’une mesure par une fonc- 
tion !01, nous pouvons écrire l'inégalité prouvée sous la forme 9 1(Ay) < [J;[An. En 
inversant les rôles de U et V (et donc de 6 et @!) nous avons aussi 


(AN) < [J-1/AN. (14.902) 


En y appliquant 9! et le lemme 14.81, 


An < 87 1(lJy-l An). FaooË Ro EDS) 


Nous prouvons à présent que D (ls ‘ AN) _ (la o 6) + p-l(Ax) en appliquant 
à un borélien B de U. D'une part 


P (|Jy-al * An)(B) = (IJ4-1] : An)O(B) (14.904a) 
= J |J4-1[dAN, (14.904b) 
g(B) 


101. Définition 14.81 et 14.205 
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et d’autre part, 


(14-110 d) : #7 (a )B = 


: 1g(x)(|Js-1| 0 #)(x)d(d 7 (An))(x) (14.905a) 


18(67 (x) (My-il 0 6) (871 (x))dAw te) CE DOSS) 


N 
sir (14.905d) 


Justification : 
— Pour (14.905b), le théorème 14.212(2). 
L'équation (14.903) devient alors 


An & (14110 d) : #7! (an). (14.906) 


Nous allons faire le produit de cette mesure par |J;| en nous souvenant que J,(x) = 
det (dx). Par le lemme 11.246 nous avons aussi (dpy) ! = dP sx) et donc, par la 
propriété 9.13(3) du déterminant, 


1 1 
Ja(x) = — | (14.907) 
F7 det(dél)  Jy-1(é(x) 
Nous avons 
[ol * An < [ol * (lai 0 d) + (AN). (14.908) 
En utilisant la proposition 14.208, il s’agit de multiplier la mesure @ !(Ax) par la 
fonction 
ze [J(x)Zs-1(d(x))| = 1. (14.909) 
Nous avons donc bien 
Ml * An < (A), (14.910) 
et donc l'égalité 
gl + An = #7 (Aw), (14.911) 


c’est-à-dire le point (1). 

(2) Le fait que la fonction proposée soit mesurable est le fait que la mesurabilité n’est pas 
affectée par produit et composition (propositions 14.101 et 14.43), et le fait que pour les 
mêmes raisons, l’application J,: U — IR est également mesurable. En ce qui concerne la 
formule nous allons la démontrer dans le cas de fonctions de plus en plus générales. 


(2a) Pour les fonctions indicatrices Soit B un borélien de U. Considérons la fonction 
Î — LB): Alors 


CS ECO TON OES RE TUNEENC TC) te 
4 RN RN 


parce que V = @(U) et B € U, donc 14{p)leçu) = le). D'autre part, pour calculer 
l’autre membre de (14.885) nous remarquons que f = 1;(p) = Îg 0 =, ce qui donne 


L G)htl(e = | 1aldax = Fialdan. RER 
U U B 


L'ensemble B étant borélien, il est extrêmement mesurable, ce qui fait que le point (1) 
s’applique : les expressions (14.912) et (14.913) sont égales. 
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(2b) Pour les fonctions étagées 


Soit f: V — R* une fonction étagée : 

f(x) = Ÿ &la,(x) (14.914) 
i=1 

Nous pouvons faire le calcul suivant : 
Ï fdAn = Ï D &ladAN (14.915a) 

V V 

NE 
— >, & Ï 14, dAN 1e SERGE) 
n 14 


- > Lea o b)(x)|Js(x)IdAN (x) OYXHSPOENBETT 


= di lL 15-1(41/6(7)IdAn (x) (14.915d) 
7 [Eté ante) 1J6(&)IdAn (x) (14.915e) 
+ 
=(f06)(æ) 
= Le 0 D)|JéldAN. (14.915f) 


Justifications : 
— Pour (14.915b) : linéarité de l'intégrale, théorème 14.178(2) 10? 


— Pour (14.915c) : le cas des fonctions indicatrices est utilisé pour chaque à entre 1 et 
ni 


(2c) Fonction mesurable positive Soit f: V — [0,0]. Par le théorème fondamental 
d’approximation 14.115, il existe une suite croissante de fonctions étagées et mesurables 
Pn: V — [0,00[ dont la limite ponctuelle est f. Nous avons alors le calcul suivant : 


[oran = im [end Sn 
Jin, [ (en © 6) alé cet aa EAN 
L Jim (on © 8) JéldAn SO EPE ETES 
= [ro dla OA DGA 


Justifications : 
— Pour (14.916a), c’est le théorème de la convergence monotone 14.173. 
— Pour (14.916b), c’est le présent théorème pour la fonction étagée w,. 


— Pour (14.916c), c’est encore la convergence dominée, justifiée par le fait que w, o ® 
est également une suite croissante : si x EU alors @n+1(0(x)) > gn(d(x)). 


— Pour (14.916d), c’est la limite ponctuelle p,(d(x)) — f(d(x)). 


(3) La partie sur l’intégrabilité repose sur le fait que |f| 0 = |f o @|. Ici |.| est le module et non 
une valeur absolue. Les faits suivants sont équivalents : 


— la fonction f: V — C est intégrable 
— la fonction |f|: V — R est intégrable. 


102. Il est remarquable que nous n’utilisons cette linéarité que pour les fonctions étagées. 
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— la fonction (|f| 0 6)|J5|: U — R est intégrable (par le point (2)). 
— la fonction (fo p)|J;l: U — R est intégrable. 


En ce qui concerne la formule, il s’agit seulement d'appliquer le point (2) aux parties positives, 
négatives, imaginaires et réelles de f. 


Notons que la formule peut être écrite sous la forme 


(f,g)v = (ob, (go 8) Jl, A O1 0 


qui est plus pratique lorsqu'on parle de produits scalaires. Pour rappel, D: U — C'est un C!- 
difféomorphisme. 


14.291. 

La formule de changement de variables peut être comprise de la façon suivante. Si @ est linéaire 
alors le facteur |J;| est la mesure de l’image par @ d’une portion de R? de mesure 1, sinon |J;| 
est le rapport entre la mesure de l’image d’un élément infinitésimal de volume de RP et sa mesure 
originale. 

Soit plu, v) = g(u,v)es + h(u,v)e2 un difféomorphisme dans R?. Soit (x0, yo) l’image par @ de 
(uo, vo). On considère le petit rectangle R de sommets (wo, vo), (uo + Au, vo), (uo + Au, vo + Av) 
et (wo, vo + Av). L'image de R n’est pas un rectangle en général, mais peut être bien approximée 
par le rectangle de sommets (x0, Yo), (to, Yo) + PuAu, (to, Yo) + Pu AU + PyAU et (to, Yo) + PyAV 
et son aire est [pu x D |AuAv. La valeur |, x @,| est exactement |J,;] 


14.14.6 Exemples 


Énormément d'exemples sont disponibles avec les coordonnées polaires et toutes leurs varia- 
tions. Cependant les fonctions trigonométriques ne seront vues que plus tard; les coordonnées 
polaires, cylindrique et sphériques seront vues en section 18.13 et les exemples d'utilisation pour 
les intégrales seront dans la section 18.15. 

Un exemple avec une exponentielle sera donnée dans l’exemple 15.104. 


14.15 Changement d’espace mesuré 
PROPoo1ILOEooBiumKD 

Proposition 14.292 (|[1]). 
Soit un espace mesuré (Q, A, u). Soit un ensemble Q' et une bijection ÿ: Q — Q. Nous posons 

(1) A = (A), 

(2) w(B) = u(g"!(B)) pour tout B € A. 
Soit enfin une fonction mesurable f : Q — X. 

Alors 

(1) Le triple (9, A’, y/) est un espace mesuré. 

(2) L'application f o w-!: (Q! — X est mesurable. 

(3) Nous avons l'égalité 


[san = | (fow ljdy!. (14.918) 
a Q/ 


Démonstration. La proposition 14.56 montre déjà que (Q/,.4', x”) est un espace mesuré. 

Soit une partie $ mesurable dans X. Alors f-!($S) est mesurable dans ( par hypothèse sur f, 
c’est-à-dire que f_1(S) € À. Ensuite (0 f1)(S) est mesurable dans (/ par hypothèse sur 4. Cela 
prouve que f ol est une application mesurable. 

Nous avons encore à prouver l'égalité d’intégrale. Par la définition 14.163 nous avons 


[ fdu = sup{S aiu(4)} (14.919) 
i=1 
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où le supremum est sur tous les n et tous les choix de À; € À, a; € R* tels que f|4, > a. Vu que 
A = (A), si À; € À et a; sont choisis, nous avons aussi 


Jop |oas > (14.920) 
avec @(À;) € 4’. Donc pour un choix de {(4;,a;)} donné, 
D œn(As) = D au (w(A;)). (14.921) 
i=1 i=1 


Au final, 


[ fdn = sp au(Ai)} = Poe ap (w(A:i))} = Le fo dy. (14.922) 


=] 


REMooUMYYooNFiKOs 
Remarque 14.293 (Ce n’est pas la mesure que nous voulons). 
La mesure donnée par la proposition 14.292 n’est pas celle que nous voulons d'habitude sur Q. 
Anticipons un peu pour comprendre. Prenons l'exemple de la partie C? de R donnée par 


C'= {(x,y) e R° tel que y = x°,x € ]0,3[}. (14.923) 


(1) La façon correcte de définir la longueur de C'est de prendre une limite d’approximations par 
des morceaux de droites, comme fait à la définition 21.3. 


(2) Cette définition de la longueur peut être exprimée sous forme intégrale par le théorème 21.9 
qui nous assure que 


= [ Iw'(e)ldt = [ V1+482dt £ p'(C). (14.924) 
0 0 


En effet, w/(C) = p{p71(C)) = u(10,3[) = 3, alors que pour tout t nous avons V1 +48 > 1 
et donc {(C') > 3. 


(3) Donc y’ n’est pas exactement ce que nous aurions pu vouloir appeler la « mesure » de C.. 


(4) La mesure à considérer sur © doit donc plutôt être quelque chose comme le produit de la 
mesure y’ par la fonction |4/|. Mais cela est une autre histoire qui vous sera contée une autre 
fois. ITEMooJTKCooYQknqo 

(5) Dans le cas de S!, nous avons w(x) = eï*, et |w'/(x)| = 1. Donc la mesure donné ici est 
probablement bien celle que nous voulons. Peut-être à coefficient + près pour avoir une 
normalisation yw/(S1) = 1. Cela est également une autre histoire qui vous sera contée une 
autre fois ; par exemple dans la proposition 18.70. 


14.16 Théorème de Fubini-Tonelli et de Fubini 


Nous rappelons que IR”? muni de la mesure de Lebesgue est un espace mesuré o-fini, conformé- 
ment à la définition 14.18. 

Le théorème de Fubini-Tonelli parle de fonctions à valeurs réelles positives et non de fonctions 
à valeurs complexes. Le truc est que ce théorème va servir de base pour construire les autres. Si 
nous avons une fonction à valeurs complexes, elle se décompose en parties réelles et imaginaires qui 
elles-mêmes se décomposent en parties positives et négatives. Au final, les preuves pour f: Q — € 


se ramènent à appliquer quatre fois le théorème pour f: Q — R*. 
ThoWTMSthY 


Théorème 14.294 (Fubini-Tonelli[432]). 

Soient (Q;,A;,u;) deux espaces mesurés o-finis, et (Q, A, u) l’espace produit. Soit une fonction 
f: x O2 — R une fonction mesurable et positive (valant éventuellement © à certains endroits) 
Alors : 
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ITEMooUTMNooVIBdpP 
(1) Les fonction 
Fixer [ f(x, y)du(y) DOS EU 
Q2 
et 
Re [ due (14.996) 
Qi 
sont mesurables. ee ITEMooFKQUooCoCOLV 
(2) Toutes les intégrales imaginables existent et sont égales : | ARS 
Le revatn Susan - [| re wdueto | auto (14.927a) 
Q x Qo Q: Qo 
= [TT rc dra(a | x) (14.027) 
Q2 LJQ 


où tous les membres de l’égalité valent éventuellement +00. 


Démonstration. Commençons par prouver le théorème dans le cas d’une fonction caractéristique 
d’un ensemble mesurable : f(x, y) = La(x,y) pour un certain ensemble À € Q; x (2. Dans ce cas, 


Fi(a) = [ La(e, v)dua(y) = [ Lay (r)dua(u) = po(Ai(x)), (14.928) 


et nous avons déjà vu au théorème 14.238 que cette fonction F1 était alors mesurable. En utilisant 
maintenant les égalités (14.743) ainsi que le fait que 14(x,y) = 14,(x)(y) nous avons 


[ _ La d(r @ n)(a ni) = (a © 2) (14.929) 
- | u2(A2(x)) du (x) (14.929b) 
Q1 
= [TT tacotidt | auto (14.920c) 
. [ | [ 1 AC dre] din(x). (14.929d) 


Le théorème étant valable pour les fonctions caractéristiques, il est valable pour les fonctions 
simples (définition 14.109) par linéarité de l’intégrale. 

Si f n’est pas une fonction simple, alors la proposition 14.115 nous donne une suite croissante 
de fonctions simples et positives convergeant ponctuellement vers f. La partie du théorème sur les 
fonctions simples dit que pour chaque n l'intégrale 


[ Found (14.930) 
A xQ 


peut être décomposée comme il faut en suivant la formule (14.927). Il faut pouvoir permuter la 
limite et l’intégrale dans chacun des cas. D'abord le théorème de la convergence monotone 14.173 
appliqué à l’espace (1 x 2 dit que 


Jim Fe, y)d(u1 @ u2)(x, y) = [ Fe, y)d(un © 2)(x, y). (14.931) 
(1 x Oo O1 xQ2 
Ensuite, pour chaque x € Q:1, les fonctions 
On(y) = | fn(x,y)du(x) (14.932) 


Q1 
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forment une suite croissante de fonctions mesurables ; nous leur appliquons encore le théorème de 
la convergence monotone : 


lim On(y)du2(y) (14.933a) 


n— 00 QD 


[, ENRICTITC] dyto(y) (14.933b) 


n—00 


lim | Ja ai(e)| dpa(y) 
Q2 Q: 


-[ | : Sad (| 0 (14.933) 


où nous avons utilisé une seconde fois Beppo-Levi. 


Remarque 14.295. 
Les formules (14.927) sont bien, mais ne garantissent en aucun cas que f € L1(Q; x Op) : il faut 


encore que ces intégrales soient finies. 
CorTKZKwP 


Corolaire 14.296 ([450]). 
Soient (Q;, A;, x) deux espaces mesurés o-finis, et (0, A, u) l’espace produit} ®. Soit une fonction 
mesurable f: Q — IR ou C. Alors les conditions suivantes sont équivalentes 


ITEMooZRAXOoTRDI1Z 
1 
(1) FE L (Qu x QD), ITEMooJMPLooZKwuxQC 
(2) 
[ jl ldue| di < O0, (14.934) 
Q Q2 
ITEMooLLBCooTRycwG 
(3) 
[ | au du2 < O0. (14.935) 
Qo Q1 


Démonstration. Nous commençons par supposer que f est à valeurs dans R. La notation |f|, pour 
l'instant, dénote donc bien la valeur absolue et non le module. 

La fonction | f| est mesurable et positive par hypothèse et par le fait que si f est mesurable, alors 
[fl l'est également par le corolaire 14.105. Le théorème 14.294(2) nous dit alors que les intégrales 
suivantes existent et sont égales : 


L.. Lfd © ue) = [L | (A alé] d(z) = [ | [ a md] . 


Attention : rien ne dit encore que ces intégrales sont finies. 


(1) (1) implique (2) et (3) Si fe L!(Q; x Q) alors |f| y est également. Cela implique que 
le membre de gauche de (14.936) est fini. Les deux autres sont alors également finis. 


(2) (2) ou (3) implique (1) Les expressions à droite de (14.936) sont finies. Donc celle de 


gauche également. Cele signifie que |f| € L1(Q x M2). Par conséquent f est également dans 
LA (Q2 X Q). 


Nous passons maintenant au cas où f est à valeurs dans C. Nous décomposons 


f=fR+ifr (14.937) 


où fr et fr sont des fonctions réelles. Nous avons 


Lun < Le + Pur EnooZE0Aop Yu 


103. Définition 14.240. 
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Donc si fr et fr sont dans Ll(Q), la fonction f le sera aussi. De même, 


[ |fR| < É | fl, (14.939) 


qui donne l'inverse : si f € L!(Q) alors fr, fr € L!(Q). Bref, f est intégrable sur Q si et seulement 
si fr et fr le sont. 
Supposons que f € L1(Q x M2). Alors 


[. If due | dy < [. [ PA] + 1: n | ni < 00 (14.940a) 


où nous avons appliqué (1) implique (2) aux fonctions fr et fr qui sont dans L!(Q; x Qo) parce 


que f y est. 
[ If. 1] < 0. (14.941) 


Dans l’autre sens, si 
alors en remplaçant |f| par | fRr| ou par | fr| nous restons fini. En appliquant alors « (2) implique (1) » 
nous trouvons que fr et fr sont dans L!(Q; x QD). Et cela implique que f € L!(Q1 x Qo). 
ThoFubinioYLtPI 


Théorème 14.297 (Fubini[450]). 
Soient (Q;,A;,;) deux espaces mesurés o-finis, et (Q, À, u) l’espace produit. Soit 


fe L'((Q,4),C), (14.942) 
c’est-à-dire une fonction à valeurs mesurable et intégrable sur (. Alors : ITEMooVFGWooZTePQS 
(1) Pour presque tout x € %, la fonction y f(x,y) est L'(Q). ITEMooCYMKooUdizni 
(2) Si nous posons 
prtz) = | f(x, y)duo(y); (14.943) 
Q2 
1 
Ru ItemQMiolgiii 
(3) Nous avons la formule d’inversion d’intégrale 
[ Fd(u @ 2) = [ pFdm (14.944a) 
Q Q 
| | J(æ, dut) da (x) (14.944b) 
Q LJQ 
— [ | Fa sdta (| dpa(y). (14.944c) 
Q LJQ 


Démonstration. Nous commençons par supposer que f est à valeurs réelles : f e L! ((Q x D,A41@ 
A), R). Nous décomposons la fonction f en parties positives et négatives : f = f* — f— avec f* 
et f positives ou nulles. Nous avons évidemment 


[ Fa [ |f| < co. (14.945) 
Qi xQ2 Q1 x Q2 


Donc f+ et f- sont des éléments de L!(Q; x Q). 


(1) Pour (1) 
Nous posons 


px (x) = [ f(x, v)dua(y) (14.946) 
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pour tous les x € (; pour lesquels cette intégrale est bien définie. Vu que f* est positive et 
mesurable, le théorème de Fubini-Tonelli 14.294(1) s'applique donc pour nous dire que f+ 
est mesurable. 


De plus le résultat (14.927) appliqué à f* donne 
E SETW C 
['epdu=[  famen<e Fi 
Qi Q1 xQ2 


Le fait que le tout soit fini est une conséquence du fait déjà mentionné que f* € L!(Q: x O2). 
Vu que @/+ est une fonction positive, l'inégalité (14.947) signifie que w,+ € L'(Q:, 1). 
En particulier, @;+(x) < 0 pour presque tout x € (1. C'est-à-dire pour presque tout x € (1 : 


: f(x, y)dpo(y) < oo, (14.948) 


et sachant que f* > 0 nous avons f*(x, : )e L!'(Q2) pour presque tout x. 
(2) Pour (2) 
Partout où w/+ et w- sont finies nous avons 


PF = Pf+ —Pf-; (14.949) 


et comme cela a lieu presque partout, nous pouvons considérer une partie mesurable À € Q:; 
telle que (A) = 0 et ox) = py+(x) — wy-(x) pour tout x hors de À. Bref, nous posons 


_. AE AS 
ir NOR (14.950) 
0 si x € À. 


Cette fonction g est mesurable et g = @; presque partout. De plus 


Ï |gldpu - | gl <| Pf+ +] Pp- < 00. (14.951) 
Q1 A° A° A° 


La dernière inégalité est le fait que w+ sont dans L\(Q:;). Et notons au passage que nous 
aurions pu laisser toutes les intégrales sur (1 sans faire de précisions sur la distinction entre 
Q et A° parce que la partie de (Q; sur laquelle 6,+ sont infinies est trop petite pour changer 
la valeur de l'intégrale. 
Nous avons donc g € L'(Q:), et par conséquent également y € L'(Q:) parce que ces deux 
fonctions sont égales presque partout (les classes sont égales). 

(3) Pour (3) 
En utilisant l'équation (14.947) nous avons 


[ pfdp . sci = [ Pf+ - | Pf- (14.952a) 
Q: Q1 Q: 
= [ f*du— | {du (14.952b) 
Q1 x (2 Qi x Qo 
_ Î fi (14.952c) 
Q1 xA2 


Et toutes ces intégrales sont finies. 


Et c’est maintenant que nous considérons le cas complexe. Nous décomposons f = fr +ifr 
avec des fonctions réelles fr et fr. Comme déjà mentionné autour de (14.938), les fonctions fr et 
fr sont intégrables. Nous leur appliquons le théorème. 

Les valeurs de x pour lesquelles fr(x, : ) et fr(x, : } ne sont pas dans L!(Q2) forment un 
ensemble de mesure nulle, nommons le À. En posant 


ee = E +ifi(ay) six e A° (14.063) 


0 si x € À, 
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nous avons que g(x, : ) est intégrable pour tout x € A‘. Vu que pour ces valeurs de x nous avons 


g(x, y) = f(x, y) nous en déduisons que pour x € A° nous avons aussi f(x, : }e L!(Q). 


Les autres points se traitent de la même façon !04. 


NORMooKIRJooPvyPWQ 
14.298. 
En pratique, il n’est pas toujours évident qu’une fonction soit intégrable sur Q x Q2. Pour permuter 
des intégrales sur une fonction à deux paramètres nous faisons comme suit. 


(1) Nous testons l’intégrabilité en chaine de |f|, et si c’est bon, le corolaire 14.296 nous donne 
Î E L(Q; X Q). 
(2) Nous utilisons le théorème de Fubini 14.297 pour séparer et permuter les intégrales comme 


des ingénieurs. 


Si la fonction (x,y) — f(x)g(y) satisfait aux hypothèse du théorème de Fubini alors 


fo, J)g(y)dr @ dy — ( 0,7 (mdr) ([ vuas) FPE USA) 


Le théorème de Fubini est souvent utilisé sous cette forme. 


Exemple 14.299 (Nécessité d’avoir des mesures o-finies). 
Nous montrons que le théorème ne tient pas si une des deux mesures n’est pas o-finie. Soit Z = [0,1]. 
Nous considérons l’espace mesuré 


(I, Bor(1), À) (14.955) 


où Bor(1) est la tribu des boréliens sur Z et À est la mesure de Lebesgue (qui est o-finie). D'autre 
part nous considérons l’espace mesuré 


(1, P(1),m) (14.956) 


où P(1) est l’ensemble des parties de ZI et m est la mesure de comptage. Cette dernière n’est pas 
o-finie parce que les seuls ensembles de mesure finie pour la mesure de comptage sont des ensembles 
finis, or une union dénombrable d'ensemble finis ne peut pas recouvrir l'intervalle I. 

Nous allons montrer que dans ce cadre, l’intégrale de la fonction indicatrice de la diagonale sur 
1? ne vérifie pas le théorème de Fubini. Étant donné que Bor(J) € P(I) nous avons 


Bor(1?) « Bor(1) @ P(1). (14.957) 
Soit À = {(x,x) tel que x € T}. La fonction 


SR 


(14.958) 
(x,y)e x y 
est continue et À = g”_!({0}) est donc fermé dans 1?. L'ensemble A est donc un borélien de Z? et 
par conséquent un élément de la tribu Bor(1)@P(1). La fonction indicatrice 14 est alors mesurable 
pour l’espace mesuré 


(I x I,Bor(1) @ P(1),1@ m). (14.959) 
Pour x fixé nous avons 
1 si y = 
il ,Y) = = 1;, , 14.960 
A(%, y) L 2 + }(y) ( ) 


104. Attention : je n'ai pas vérifié explicitement. C'est juste une intuition. Vérifiez et écrivez-moi pour dire si c'est bon 
ou non. 
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ét done 
i- | ( [ intra) dX(x) (14.961a) 
= [ ( [ 1 (dm (u)) Etes (14.961b) 


» Ï (m({x}))a(x) (14.961c) 
I 
= | 14X(x) (14.961d) 


= 1. (14.961) 


Par contre le support de LA étant de mesure nulle pour la mesure de Lebesgue, nous avons 
Ï La Ge dCi = 0 (14.962) 
I 


et par conséquent 
A2 = ] (| ia(m mx) dm(y) = 0. (14.963) 
1 I 


Nous voyons donc que le théorème de Fubini ne s’applique pas. A 
EXooLUFAooGcxFUW 


Exemple 14.300. 
Nous nous proposons de calculer l'intégrale suivante en utilisant le théorème de Fubini : 


G= J e "dx = VT (14.964) 
R 


2 1 DS : . 212 . 
* n’a pas de primitives parmi les fonctions élémentaires. 


alors que la fonction x + e” 
Nous allons le faire de deux façons. Une première directe en utilisant le théorème de Fubini sur 
un domaine non borné, et une seconde en utilisant Fubini sur un domaine borné, et en passant à 


la limite ensuite. 


(1) Fubini, domaine non borné 


Par symétrie nous pouvons nous contenter de calculer 


Le) 
en - | e "dx. (14.965) 
0 


L’astuce est de passer par l'intermédiaire 


= J EH) rdy Eqintanfequt 


= J (| eve") dy (14.966b) 
R+ \Jr+ 
: 2 
_ ( [ ge ax) (14.966c) 
R+ 


= GÀ (14.966d) 


L'intégrale (14.966a) se calcule en passant aux coordonnées polaires et le résultat est H = 7. 


Nous avons alors G — VE et 


J ee = Vr. (14.967) 
R 


1328 CHAPITRE 14. TRIBUS, THÉORIE DE LA MESURE, INTÉGRATION 


(2) Fubini, domaine borné, puis limite Une variante, qui n’applique pas Fubini sur un do- 


maine non borné. Nous commençons par écrire 


+00 5 +R 5 
L= ] e * dx:= lim e * dx (14.968) 
—00 R— +00 _R 


et puis nous faisons le calcul 


+R 3 +R : 
I? = ln (( e * da Er 7) 
ee À Ja _R 


Herr see Enr 


(l 
L= 
+5 
8 
—, 
#] 
8 
+ 
e 
S 
= 
à 
LE 


T 
+5 
8 
® 
a 
+ 
LA 
à 
à 
à 
a 


où K est le carré de demi-côté À centré à l’origine et de côtés parallèles aux axes et CR est 
le cercle de rayon R centré à l’origine. 

La première étape à justifier est simplement l'application de Fubini. Pour le passage de 
l'intégrale du carré vers le cercle, définissons 


IKk(r)= | f, Icr)=]| f (14.970) 
Kr Cr 


où K, est la carré de demi-côté r et C, est le cercle de rayon r. Le demi-côté du carré inscrit 
à Cy est V2, donc pour tout r nous avons 


Ix(V?r) > Ic(r) > Ix(r), (14.971) 
et en prenant la limite, nous avons évidement 

lim Zx(V2r) = lim Zx(r), (14.972) 

r—00 r—00 


et donc cette limite est également égale à lim,_,+ 1c(t). 
Il ne reste qu’à calculer la dernière intégrale sur le cercle en passant aux coordonnées polaires : 


27 R 
| ee) dr dy = Î de | re" dr = r(1 — EE Y. (14.973) 
ee. 0 0 


La limite donne T, nous en déduisons que 
Ss E T 
J e dr = V. BPUTE 
— 00 


FA 


Le théorème de Fubini-Tonelli nous permet également d’inverser des sommes et des séries. En 
effet une somme n’est rien d'autre qu’une intégrale pour la mesure de comptage : 


à = [. Andm(n). (14.975) 


La proposition suivante montre comment il faut faire. 
ProplnversSumIntFub 


Proposition 14.301. 

Soient les espaces mesurés (N, P(N),m), (R”, Bor(R”), À) où À est la mesure de Lebesgue ainsi 
qu’une suite de fonctions positives fn: R4 — R. Nous supposons de plus que la fonction fn soit 
intégrable pour tout n et que les résultats forment une suite sommable. Alors 


2 je fn(x)dx = Le >, fittidr (14.976) 


neN 
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Démonstration. Nous pouvons la récrire le membre de gauche sous la forme 
Ï ( f(n, ar) dm(n) (14.977) 
N R? 


avec la notation évidente f(n,x) = f,(x). Prouvons que la fonction f: N x R4 — R ainsi définie 
est une fonction mesurable pour l’espace mesuré 


(N x R‘, P(N) @ Bor(R°), m @ À). (14.978) 
Si AC R, nous avons 
F1 (A) = {J{n} x fr (4). (14.979) 
neN 


Chacun des ensembles dans l’union appartient à la tribu P(N) x Bor(R‘) tandis que les tribus 
sont stables sous les unions dénombrables. La fonction f est donc mesurable. Comme nous avons 
supposé que f était positive, le théorème de Fubini-Tonelli s’applique et nous avons 


L ( (n.a)am(n)) ee [. D An(r)dr. (14.980) 


neN 


ThoFubini 

Théorème 14.302 (Fubini). 
Soit (x,y) — f(x,y) € R une fonction intégrable sur Bn X Bm € R"*" où PB, et Bn sont des 
ensembles mesurables de R" et R7. Alors : 

(1) pour tout x € B,, sauf éventuellement en les points d’un ensemble G € B, de mesure nulle, 

la fonction y € Bm — f(x,y) ER est intégrable sur Bm 
(2) la fonction 
B,\G—R 

(14.981) 
put f(x, y)dy 


est intégrable sur B\G. 


(3) On a 
LL. f(x, y)dxdy = IR (a fa.sd) dx. (14.982) 


Notons en particulier que si f(x,y) = w(x)®(y), alors fn. p(y)dy est une constante qui peut 
sortir de l’intégrale sur B,, et donc 


Ï p(x)o(y)drdy = Ï etox | p(y)dy. ESS) 
BnX*Bm Ban Bn 
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Chapitre 15 


Suites et séries de fonctions 


Les généralités sur les suites et séries de fonctions, c’est dans la section 12.32. 


15.1 Séries de fonctions 


15.1.1 Intégration de séries de fonctions 
ThoCci01Z 


Théorème 15.1. 
La somme uniforme de fonctions intégrables sur un ensemble de mesure fine est intégrable et on 
peut permuter la somme et l'intégrale. 

En d'autres termes, supposons que Y7_0 fn converge uniformément vers F sur À avec u(A) < 
0. Si F'et f, sont des fonctions intégrables sur À alors 


[Fe )du(x 2 => f fn(æ)du(x). (15.1) 


Démonstration. Ce théorème est une conséquence du théorème 14.198. En effet nous définissons 
la suite des sommes partielles 


N 
EN = D fn. (15.2) 
n=0 


La limite limnw_, FN = F est uniforme. Par conséquent la fonction F est intégrable et 


je-mfr-mfés-mÉfe- pe os 


La première égalité est le théorème 14.198, les autres sont de simples manipulations rhétoriques. 


Le théorème suivant est une paraphrase du théorème de la convergence dominée de Lebesgue 


(14.200). 
ThoockMHn 


Théorème 15.2. 
Soient des fonctions (fn)nen telles que DE fn soit intégrable sur (Q, À, u) pour chaque N. Nous 
supposons que la somme converge simplement vers 


f(æ) = ÿ. f(x) (154) 


et qu'il existe une fonction g telle que 


(15.5) 


N 
D fl 
n=0 


pour tout N E N. Alors 
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(1) Yo fn est intégrable, 


(2) on peut permuter somme et intégrale : 


N CO 
dim. [ D fran = (É D (15.6) 


(4) 
=; (15.7) 


lim 
N—co Q 


N 00 
D =, 
n=0 n=0 


D fn 
n=N 


= Jim 
N—co Q 


ThoCSGaPY 
Théorème 15.3. 
Soit f, des fonctions C'[a, b] telles que 


(1) la série Ÿ,, fn(to) converge pour un certain xo € [a b], 

(2) la série des dérivées Ÿ,,, f, converge uniformément sur [a, b]. 
Alors la série Ÿ,, fn converge vers une fonction F et 

(1) La convergence est uniforme sur [a, b]. 


(2) La fonction F est dérivable 
(3) Ex) = Zn f(x). 


15.1.2 Différentiabilité 
LEMooPIWYooZEofkW 


Lemme 15.4. 
Soient E et F deux espaces vectoriels normés. Si la suite (T,) converge vers T dans L(E, F), alors 


D n) Ge raie) (15.8) 
n=0 


n=0 


pour tout v € E nous avons 


LEMooEYARooNExmiw 
Lemme 15.5 ([154)). 
Soit un espace métrique V. Soient un compact K et un ouvert U contenant K. Alors il existe Ô > 0 
tel que 
{x e V tel que d(x, K) < 6} EU. (15.9) 


Démonstration. Pour chaque x € K, nous posons 
Az = {a > 0 tel que B(x, a) € U}. (15.10) 


Le théorème 7.8 indique que À, contient toujours des éléments strictement positifs (parce que K 
est dans U qui est ouvert). Nous considérons la fonction 


J:K—R 


(15.11) 
x sup{a > 0 tel que B(x, a) € U}. 


Nous prouvons que f est continue. Soit € > 0. Soit y € B(x,e). 


(1) f(x) —e< f(y) Nous prouvons que pour tout à € A3, le nombre a — € est dans À, c’est- 
à-dire que B(y,a — €) € U. Soit a € B(y,a — €). Nous avons 


d(x, a) < d{x,y) + d(y,a) <e+(a—e) = a. (15.12) 


Donc ae U. 


Cela signifie que pour tout à € À,, nous avons a —e € À,,, ou encore que A; —e © À, En 
passant au supremum, sup(A3) — € < sup(4,,). Nous avons donc bien f(x) — e < f(y). 
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(2) f(y) <e+ f(x) Soit > 0. Il existe un élément u hors de U tel que d(x, y) < f(x) +e. Cet 
élément vérifie donc 


F(y) < d(y,u) < d(y,x) + d(x,u) < e+ f(x) +e. (15.13) 
Pour tout € > 0 nous avons f(y) < e+ f(x) +. En prenant la limite € — 0 nous trouvons 
fu) < f(x) +e. 


(3) f est continue Nous avons montré que si y € B(x,e), alors | f(x) — f(y)| < €. Cela signifie 
que f est continue en x € K. 


(4) Conclusion La fonction f est continue sur le compact X. Elle est donc bornée et atteint 
ses bornes !. Soit 5 = min{f(x) tel que x e K}. Comme dit plus haut, f(x) > 0 pour tout x. 
Donc 6 > 0. 

Sixe V vérifie d(x, K) < 6, alors il existe y € K tel que d(x,y) < ô. Par minimalité de 6, 
nous avons f(y) > Ô et donc B(y,0) € U. En particulier x € B(y,0) € U. 


PROPooGRXXooWcZyJG 
Proposition 15.6 ([154)). 
Tout ouvert connexe par arcs d’un espace vectoriel normé est connexe par arcs de classe C1. 


Démonstration. Soient un espace vectoriel normé V, et un ouvert connexe par arcs ÜU. Nous consi- 
dérons x, y € U et un chemin continu 7: [0,1] — U joignant x à y. 


(1) Utilisation du lemme La partie +([0,1]) est compacte parce qu’elle est l’image par une 
application continue d’un compact (théorème 7.211). Par le lemme 15.5, il existe 0 > 0 tel 
que pour tout € [0,1], B(+(t),6) « U. 

(2) Uniforme continuité L’application + est continue sur le compact [0,1]. Le théorème de 
Heine 12.81 nous dit que 7 est alors uniformément continue : il existe 7 > 0 tel que pour 
tout t,t’e [0,1] tels que [t — #| < n, nous ayons d(+(t),7(#)) < 6. 


(3) La courbe Nous considérons une subdivision 0 = to < ti < ... < tn = 1 telle que 

lt —t; 1] < n°. Nous notons P; = y(t;) et Q; = y(t:11). Soient les applications Ÿ 

:R—V 
à à ; , | (15.14) 
tit Qi + Bt" (1 —t)Q: + 3t(1 —t)"P; + (1 —t) Pi. 
Nous considérons ensuite les reparamétrisations des 4; de [0,1] vers [t;,t;41] : 
Oi: R—V 
( t—t; ) (15:15) 
tr Pi : 
bi41 — 


Ces applications sont de classe C!. Enfin nous posons 
CSS 4 EQooIQHHooGsprq 
té ait) sitelti,til. | 


(4) Ce qu’il faut voir Petite pause pour lister les choses que nous devons vérifier. 


— #(0) = +(0), #(1) = +() 


— 4 est continue. 


— 1 est à valeurs dans U. 
— 4 est de classe CT. 


1. Théorème de Weierstrass 7.138. 

2. Êtes-vous capable d’en prouver l'existence ? Prenez un entier z > m et tx = k/z. Notez l’utilisation du lemme 
1.421 que je me lasserai jamais de citer. 

3. Ce sont des courbes de Bézier d’ordre 3 de points de contrôle P;, P;, Qi: et Qi. 
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On y va... 
(5) (0) et d(1) Nous avons 


Y(0) = co(0) = v0(0) = Po = (0), (15.17) 
et, utilisant le fait que t{, = 1, 


= bn—1 
bn nu Én—1 


Y(1) = on-1(1) = Pn-1 ( ) = a) = On =) = #0): (15.18) 


(6) Ÿ est continue Nous devons vérifier la continuité aux raccords, c’est-à-dire que nous de- 
vons prouver oi(t;+1) = o;+1(t;). D'une part oi(t;+1) = Di(1) = Q; = y(ti41), et d’autre part 
rit) = pi+1(0) = Pit = be )e C’est bon. 

(7) À valeurs dans U Nous devons vérifier que gi([0,1]) & U. Nous avons bien sûr P, € 
B(P;,6), mais nous avons aussi Q; € B(P;,6). En effet, [t;71 — t;] < n de telle sorte que 
Qi = Y(tin) € B(7(6),6) = B(P;,6). Le nombre n à été choisi pour ça. 

Le nombre 6 à été choisi pour avoir également B(P;,6) € U. Bref, P,; et Q; sont dans B(P;, 6) 
qui est convexe { et contenue dans U. Pour te [t;,t::1[, le point w;(t) est une combinaison 
convexe de P; et Q; : 


#9 + SÉ(1 — +) + 341 — +)? + (1 — +) = 1. (15.19) 


Donc vit) e B(P;,0) € U. 


(8) + est de classe CT Nous avons p{(t) = 64(1 — t)(Q; — P;). Donc pour tout à nous avons 
p/(1) = g/(0) = 0. En ce qui concerne #’ nous avons 


lim d'(t) = d'(t:) = 0 (15.20) 
tt. 
et 
lim w'(t) = lim gi-1(t) = 0, (15.21) 
tt. né 


d’où la continuité de #. 


Nous en déduisons que # est de classe C! par le théorème 12.341. 


Remarque 15.7. 

Quelle est la forme de l’image de la courbe C1 définie en (15.16) ? L'image est une ligne brisée : une 
suite de segments de droites. Elle fait un angle à chaque raccord. Il est contre-intuitif qu’une ligne 
faisant des angles puisse être de classe C!, mais c’est pourtant le cas. Le fait est que #’ s’annule à 
chacun de ces raccords, de telle sorte que Ÿ’ est quand même continu. 


ii Avertissement /question à la lectrice !! 15.8 
Le théorème 15.9 se démontre ici avec des intégrales. Je suis presque certain qu’on doit pouvoir 


adapter la démonstration du théorème 12.387 pour ne pas avoir à utiliser d’intégrales. 
ThoLDpRmXQ 
Théorème 15.9 ([455]). 


Soient E et F deux espaces vectoriels normés, ® un ouvert connexe par arcs. Soit (u,) une suite 
de fonctions un: Q — F' telle que 


(1) pour tout n, la fonction u, est de classe C1 sur Q, 
(2) la série Ÿ,, un converge simplement sur Q, 


(3) la série des différentielles Ÿ,, (dun) converge normalement sur tout compact de Q. 


4. Une boule est convexe, proposition 8.28. 
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Alors la somme u = Ÿ,,u, est de classe CT sur Q et sa différentielle est donnée par 
Le] 
du = Ÿ dun. (15.22) 
n=0 


Démonstration. Pour chaque n, la fonction dun: Q — £L(E,F) est une fonction continue parce 
que u, est de classe CT. La série convergeant normalement, la fonction 0 dun est également 
continue par la proposition 12.379. La difficulté de ce théorème est donc de prouver que cela est 
bien la différentielle de la fonction Ÿ,, uw», c’est-à-dire que 


d 5 n) _ : dun (15.23) 


Soient a,x € (. Nous considérerions bien le segment [a,x|, mais vu que ( n’est supposé que 
connexe par arcs de classe CT (la proposition 15.6 pour que l’arc puisse être choisi C1), nous ne 
pouvons pas faire mieux pour joindre a à x que choisir un chemin de classe C1 


7: [0,1] — Q (15.24) 


tel que (0) = a et y(1) = x. 
L’astuce est de poser 
n: [01l—R 
fn: 10,1] : (15.25) 
EE (dun)(+) (> Co 
et d’en étudier l'intégrale ©. 


(1) Permuter somme et intégrale Nous voudrions permuter la somme et l'intégrale dans 


l’expression h D, Jfitt)dt. Pour cela nous commençons par regarder quelques majorations de 
normes. 


D'abord > est de classe C'!, ce qui fait que +/ est continue. Vu que la norme est une application 
continue, la fonction t — |y/(t)| est également continue sur le compact [0,1]. Elle est donc 
majorée par une constante que nous nommons M. C’est le théorème de Weierstrass 7.138. 


Ensuite nous avons le calcul 
CO = du), QE) < du), OI < Miduilo < 00. (15.26) 
Justifications : 
— Pour la première inégalité. C’est le lemme 11.59. 
— Pour la seconde inégalité. Il s’agit de l’inégalité évidente 


Iduilxs = sup  |(du)z| (15.27) 
zey([0.1]) 


Notons que la norme |.|, ne réfère pas à un supremum sur Æ, mais seulement sur 
l’image de 7. Nous aurions pu faire preuve d’un peu de créativité dans les notations. 


— L'application du; est continue sur le compact 7([0, )e Donc le supremum est fini et 
atteint. 


Maintenant nous posons 
gn(t) = D, fit). (15.28) 


Nous avons la majoration 


lgn (I < D 1H < M D Iduilo < 00. (15.29) 
i=0 = 


5. Cela revient à étudier l’intégrale de la forme différentielle du, sur le chemin +. Voir la définition 20.44 et tout 
ce qui s’en suit. 
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Le fait que le tout soit fini est l'hypothèse de convergence normale sur tout compact. Le 
compact en question est ([0,1]). 


C’est le moment d’utiliser le théorème de la convergence dominée de Lebesgue 14.200. At- 
tention aux notations un peu décalées. Nous avons 9n — 372, fi (convergence simple) et 
|gn(t)| < À où À est une constante que nous voyons comme une fonction constante inté- 
grable sur le compact [0,1]. Nous permutons la limite et l'intégrale : 


1 © 1 | 
[ 2, #(Od = k (lim gn)(t)dt (15.30a) 


1 


= lim | gn(t)dt (15.30b) 
n—00 0 
in 
= lim D Ji(tdt (15.30c) 
F0 5 
nm 1 
= lim > | fi(t)dt (15.30d) 
PP ÿ=0 V0 
00 1 
= N | f(bdt. (15.30e) 
i=0 0 


Accroissements 


Nous pouvons maintenant faire le petit calcul suivant : 


1 
hi (dun)(e) (y/())dt = > (un (+(1)) — ün(7(0))) = . (un(x) r un(a)) — u(x) — u(a) 
(15.31) 
où nous avons utilisé le théorème fondamental du calcul intégral sous la forme de la propo- 


sition 14.269. 


Nous retenons l'égalité 


L : 
u(x) = u(a) + [ D (dun) (7 (#)}dt. A 


Remarque La formule (15.32) n’est pas une forme de formule des accroissements finis qui 
parlerait d'évaluer une fonction u en x en partant de a et en intégrant du le long d’un chemin 
joignant a et x. 


Ce serait le cas si nous pouvions permuter la somme et la différentielle qui se trouvent dans 
l’intégrale. Or permuter somme et différentielle est précisément l’objet du théorème que nous 
sommes en train de prouver. 


Différentielle 


Forts de la formule (15.32), nous calculons du,(v), c’est-à-dire la différentielle de uw au point 
a appliquée au vecteur v € E. Pour cela, nous savons que { est ouvert, donc ( contient une 
boule de rayon r autour de a, ce qui nous permet de dire que pour un a donné, le point a+ sv 
est dans Q pour tout s € B(0,e) lorsque € n’est pas trop grand. Pour chacun de ces 5, nous 
considérons un chemin de classe C1 joignant a à a + sv. Ce chemin sera noté 


%s: [0,1] — A (15.33) 
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et y(0) = a, (1) = a + sv. Nous avons le calcul 


dua(v) = Luca + su)] Le (15.34a) 
LE j 
-£ il DT Gi@)at] (15.34b) 
Le 1 : 
» [ (dun)a,(0 Fe (6) dt] r FUBPRooP EPS en 
0 


» (un(a + sv) — un (a) (15.34d) 


s=0 


un(e +su)],., (15.340) 
sy Lunça + s0)] Ar) 
= Ent) (15.34g) 
= (Xdun)a) () (15.34h) 
= (Dém) Co. HRERooN ent 


Justifications : 
— Pour 15.34c. Permuter la somme et l'intégrale comme plus haut. 


— Pour 15.34f. Permuter une somme et une dérivée classique des fonctions IR — F' données 
par s + uA(a + su). Il s’agit d’utiliser le théorème 12.384 sur chaque composantes dans 
F. 


— Pour 15.34i. Chaque du, est une application du, : E — L(E,F). Au fait près que la 
notation est plus lourde, il s’agit simplement d’une définition de la somme ponctuelle 
d’une suite de fonctions : },,, fn(a) = (3, fn)(a). Dans ce cas-ci, le tout est encore un 
élément de £(E, F) que nous appliquons à w. 


LEMooRIQTooLomsqD 
Lemme 15.10. 
Sur [4,1], étudier la convergence de la série 


f(x) DE (=). (15.35) 


Etudier la convergence de la série dérivée ; en déduire que 


> Co SRE In(2). (15.36) 


(y) = > cu Faseryexonreirs 


Cette série de puissance converge absolument pour [y| < 1, voir l’exemple 4 de la page 123bis du 
cours de première. Cette série converge également simplement en y = —1, par le corolaire de la 
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page 123 du même cours 6. Nous sommes dans le cas d’une série de puissance dont le disque de 
convergence est centré en 0, et dont le rayon est 1, mais qui converge (en plus) simplement sur un 
des bords du disque. Cela est le cadre du théorème 12.378 qui nous permet de dire que pour tout 
€ > 0, la série (15.37) converge uniformément sur [—1,1 — €]. 

La fonction f(y) est donc continue sur [—1,1—6], et donc en particulier sur [—1,0]. Par ailleurs, 
la fonction y(x) est continue en x # 0. En tant que composée de fonctions continues, la fonction 
jte F(u(x)) est continue sur [à,1]. 

Nous la mettons la série des dérivées sous la forme d’une série de puissances : 


= À > É = :) ESerieDerr]reize 


n—1 


Afin d'éviter tout malentendu, nous insistons sur le fait que g est la série des dérivée de la série f. 
Nous ne savons pas encore si g existe (c’est-à-dire si elle converge), ni si sa somme est la dérivée 
de f. C’est cela que nous allons tenter d'établir maintenant. 

Nous posons à nouveau y(x) = it, et nous savons que la série de puissances ÿ,, y” converge 
uniformément pour y € [—-1+e,1 — €] pour tout € > 0. En repassant aux variables x, pour tout 
€ > Ü, nous avons convergence uniforme de la série 


> (=). (15.39) 


n=0 


sur le compact x € Er 1], ou, pour parler plus simplement, sur x € [ + €, a] pour tout € (petit) 

et a (grand). Nous avons donc également convergence uniforme de la série des dérivées (15.38) sur 

le même intervalle. Maintenant, le théorème 15.9 montre que la série des dérivée est bien la dérivée 
de la série, c’est-à-dire que 

g(x) = f(x) (15.40) 

sur lé, 1]. Notez que la convergence uniforme sur tout compact de la série des dérivées est suffisante. 

Une bonne nouvelle est qu’il est possible de sommer explicitement la série ÿ} y". En effet, il 


est montré à la page 115 du cours de première que Y_9 zh = 1e _ donc 
a Es 1 EgFormSomG 
diet | de, 
k=0 PO Ho 


lorsque |y| < 1. Du coup, nous avons simplement 


ren LÉ (E) LÉ) if) 0 


FA 


donc la fonction f a la forme simple f(x) = In(x) + C. Notez bien le petit jeu de variables 
de sommation. Au départ g(x) est une somme qui part de 1 avec un exposant n — 1, et nous 
la transformons en une somme qui part de 0 avec un exposant n. C’est cela qui nous permet 
d'appliquer la formule (15.41). 

Étant donné que f(1) = 0, nous avons 


f(x) = (x) (15.43) 


pour tout x € [à +€,1]. Mais nous avons vu que la fonction f était continue sur (à, 1]; Étant donné 
que In(x) et f(x) sont deux fonctions continues sur [, 1] qui sont égales sur tout compact [£+e,1], 
nous déduisons que ces deux fonctions sont en réalité égales sur tout l’entièreté du compact [à, 1]. 


En particulier, en x = i, nous avons 


Ces “ 1)" = In(1/2) = —In(2). (15.44) 


6. Un étudiant avait dit se souvenir qu’Abel s’appliquait seulement aux séries alternées ; c’est ce corolaire (critère 
des séries alternées) qui l’a induit en erreur. En effet, Abel (proposition 5, page 122) est plus général, mais s’applique 
particulièrement bien aux séries alternées. 


15.2. SÉRIES ENTIÈRES 1339 


15.2 Séries entières 


Dans cette section nous allons parler de séries complexes autant que de séries réelles. L'étude 
des propriétés à proprement parler complexes des séries entières (holomorphie) sera effectuée dans 
le chapitre dédié, voir le théorème 26.60 et ses conséquences. 


15.2.1 Disque de convergence 


Une série de puissance est une série de la forme 
a egseriepui 
> cx(z — 20)* (15.45) 
k=0 


où 20 € € est fixé, (cx) est une suite complexe fixée, et z est un paramètre complexe. Nous disons 
que cette série est centrée en 20. 


Définition 15.11. 
Une série entière est une somme de la forme 


(ce) 
Ja (15.46) 


AVEC An, Z € À. 


Une série entière peut définir une fonction 


fe} at (15.47) 


Le but de cette section est d'étudier des conditions sur la suite (a,) qui assurent la continuité de 


f ou la possibilité de dériver ou intégrer la série terme à terme. 
DefZWKOZO1 


Définition 15.12. 
Soit en An?" une série entière. Le rayon de convergence de cette série est le nombre 


R = sup{r e R* tel que la suite (anr”) est bornée} € [0, wo]. (15.48) 


La boule B(0,R) est le disque de convergence de la série. 
Dans le cas d’une série de la forme Ÿ,, an(z — 20)", le disque de convergence est l’ensemble 
|z = 2o| < KR. 


15.15. 

Notez que le disque de convergence proprement dit est ouvert. Donc, pour être correct, on devrait 
parler de la frontière pour parler de la partie |[z] = À. Toutefois, nous désignerons souvent cette 
partie en parlant du bord du disque. 


15.14. 
En réalité, il serait plus correct de parler du rayon de convergence de la suite (a,) parce qu’au 
moment où on l’étudie, nous ne savons pas encore si la somme existera. Il ne devrait donc pas être 
autorisé d’écrire « étudions le rayon de convergence de Ÿ;, an" ». 

Le rayon de convergence d’une série ne dépend que des réels |a,|, même si à la base a, € C. 


15.15. 

Sur Wikipédia[456]|, le rayon de convergence est défini par le supremum des |z| tels que la série 

D anz" converge. Je vous invite à vous étonner que cela est équivalent à la définition donnée ici. 
Il est dingue que demander que la suite (a,r”) soit bornée soit suffisant pour que la série 

converge. En réalité ce n’est pas tout à fait le cas ; les séries qui convergent sont celles pour |2| 
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strictement plus petit que le rayon de convergence. Et là ça marche. En effet, si x < R, il existe 
un r tel que x < r < R. Nous considérons € donné par x = er, qui vérifie e < 1 et nous avons 


Ant" = an(er)" = (anr")e" — 0. (15.49) 


Le critère d’Abel 15.18 va formaliser ça. 
REMooYOTEooKvxHSf 


Remarque 15.16. 
Si pour tout n nous avons [b,| > |a,| alors le rayon de convergence de la série Ÿ,,, a,z" est au 
moins aussi grand que celui de la série »,, b,2". Cela y compris lorsque l’un ou l’autre des rayons 


de convergences est infini. 
LEMooVCTNooCQHkzs 


Lemme 15.17 ([1]). 
Le rayon de convergence pour la suite b, = an:x est le même que celui pour a». 


Démonstration. Soit r > 0. Nous avons r"b4r" = an4gr"+F. Vu que les & premiers termes d’une 
suite ne changement pas le fait que la suite soit bornée, la suite (a,r”),>x est bornée si et seulement 
si la suite (a,r")hen est bornée. 


LemmbWnFI 
Lemme 15.18 (Critère d’Abel). 
Soit R > 0 le rayon de convergence de la somme Ÿ,, anz" et ze C. 


(1) Silz| < R alors la série converge absolument. 


(2) Silz| > R alors la série diverge. 


Démonstration. Démonstration en deux parties. 


(1) Silz| < R alors la suite (a,z”°) est bornée et il existe un nombre M ER tel que la,fr" < M 
pour tout n. Nous considérons alors un r tel que |z| < r < R et nous pouvons calculer : 


nm 
la:27] = er (El) < M (2) (15.50) 
r 


F 

Vu que |z| < r nous tombons sur la série géométrique (11.316) qui converge. Par le critère 
: à D 2 Le! n 

de comparaison ‘ la série Ÿ,,_0 |[an2"| converge. 


(2) Par définition du rayon de convergence, la suite (a,z”°) n’est donc pas bornée et la série ne 
peut pas converger à cause de la proposition 11.89. 


CORooCUDSooTfMvAB 
Corolaire 15.19. 
Soit une série entière Ÿ,,, an2". Soit un nombre p tel que 


(1) La série converge pour |z| < p. 
(2) La série diverge pour |z| > p. 


Alors le rayon de convergence est p. 


Démonstration. Nous notons R le rayon de convergence de la série. 


(1) R>p SiR< p, nous prenons r strictement entre R et p. Le critère d’Abel 15.18 nous dit, 


pour |z| = r, que la série diverge. Par hypothèse, elle converge ; contradiction. 


(2) R<p De même si À > p, alors nous prenons p < r < R. Le critère d’Abel nous dit que la 
série diverge pour |z] = r. L'hypothèse nous dit le contraire. Nouvelle contradiction. 


7. Lemme 11.115. 
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15.20. 

Le critère d’Abel parle bien de convergence absolue, et non de convergence normale. Pour chaque 
t, la série Y, [ant*| converge. Si par contre nous posons uz(t) = axt*, nous n'avons à priori pas 
la convergence normale Y, |ux|x, même pas si la norme est la norme supremum sur B(0,R)*. 
Prenons comme exemple simplement ay; = 1 pour tout k. Pour tout || < 1, la série »;, t* converge 
absolument (série géométrique), mais nous aurions |ux|x = 1 et donc divergence évidente de 


Dr luklloo- 


La proposition suivante sera surtout utile lorsqu'on parlera de dérivée. 
PropHDIUooKTbVSX 


Proposition 15.21 ([157]). 
Quel que soit le nombre a € R, les séries Ÿ,, anz2" et >, n°anz" ont même rayon de convergence. 


Démonstration. Nous posons 


E={reR" tel que (a,r") est borné } (15.51a) 
E'={reR tel que (n°*anr”) est borné } (15.51b) 


Nous allons prouver que E = E’ (et donc leurs supremum seront égaux). 


(1) Sia>0 
Dans ce cas E’ € E est facile. Nous prouvons l'inclusion dans l’autre sens. Si E est vide, c’est 
évident. Nous supposons que E n’est pas vide, et nous considérons r € E, et nous montrons 
que r € FE’. Pour cela nous prenons un nombre s tel que r < 5 < sup(Æ). Nous avons 


n'anr =n an ( ) s=n ( ) Ans”. (15.52) 
8 8 


Mais r/s < 1, donc le lemme 12.421 dit que n°(r/s)" — 0. Cela est donc borné par une 
constante M. Donc 
nan" < Mans”. (15.53) 
Mais la suite (a,s”) est bornée. Donc la suite n°*a,r” est également bornée, ce qui prouve 
quereEË. 
(2) Sia <0 Même raisonnement, mais en inversant les rôles de Æ et F/, et en adaptant un 


peu ?. 


Remarque 15.22. 
Au fond, cette proposition n’est rien d’autre que dire que dans n°r”, l'effet « convergent » est r” 
qui est une décroissance exponentielle tandis que l’effet « divergent » est n® qui a une croissance 


seulement polynomiale. 
LEMooNAWTooHWqKBK 


Lemme 15.23 ([158]). 
Soit une suite (un) de réels strictement positifs. Si 


fa = (15.54) 


n—>00 Un 


l/n 


alors la suite (un) a une limite et elle vaut L également. 


Démonstration. Nous commençons par supposer que £ > 0; nous ferons le cas £ = 0 après. Soit 
e < L. L'existence de la limite dans l'hypothèse dit qu’il existe N tel que pour tout n > N nous 


ayons 
int € Be) EneoDt ES 


8. 1l y aurait par contre bien convergence sur tout compact ? Chère lectrice, dites moi ce que vous en pensez 
9. Je n'ai pas vérifié; écrivez-moi si ça pose un problème. 
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Écrivons un produit télescopique : 
TU 
|] (15.56) 
UN EN Up 


Mais chacun des facteurs du produit est soumis à l'encadrement (15.55), donc 


u/ 


CDN ET < (+, (15.57) 
UN 
et donc, en multipliant par un > 0 nous avons 
un(£— ON < un < un(£ + TA. (15.58) 


La fonction t + t1/" est croissante !° : nous pouvons l’appliquer aux inégalités sans changer le sens : 


n—N n—N 


ue + sut (r dr. (15.59) 


Pour rappel, à ce point le N est fixé pour correspondre au € < £ que nous avons choisi. 
1/n 


Vu que 1/n € À nous invoquons la proposition 12.403 pour dire que lim» un = 1. De plus 
(n — N)/n — 1 de telle sorte que 
(Utd ne 4e (15.60) 
Nous considérons donc un N’ tel que pour tout n > N’ nous ayons 
FRAC Li 0 9) <e (15.61a) 
lux te Hg + ee 9) 2e (15.61b) 
Pour tout n > max(N, N') nous avons 
(L—e)—-e< ur (£ — Es sure ur (£ + à <(£+e)+e. (15.62) 
Donc, 
Hedesu re Lie (15.63) 


Cela prouve que la limite lim, uk! "existe et vaut 4. 
Et si / = 0? Dans ce cas, il existe N tel que pour tout n > N nous avons 


Un+1 
Un 


0< (15.64) 


Ensuite il faut recommencer tous les calculs, avec pour seule différence que tous les membres de 
gauche sont 0. 


LEMooDWNZooXwejrF 
Lemme 15.24 (Règle de Cauchy[459, 458]). 
Soit une suite (x\) dans un espace vectoriel normé. Nous posons 
p = limsup|r, |". (15.65) 
n—00 
Alors : ITEMooZZBIooUYrtYL 
(1) Sip < 1, la série Ÿ,,.ù %n est absolument convergente. ITEMooQGKNoOOFeFRd 


2) Sip > 1, alors la série Tn est ne converge pas. 
neN 


Démonstration. En deux parties. 


10. Proposition 12.413, en notant que les arguments sont tous bien positifs. 
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(1) Pour (1) Soit € > 0 tel que p + € < 1. Le lemme 10.46 nous dit que l’ensemble 


Ur > y+e (15.66) 


Se = {ne N tel que |r;| 
est fini. Quitte à prendre une queue de suite, nous supposons que $. est vide, c’est-à-dire que 
[tn| < (p + €)" pour tout n. En posant q = p+e, nous voyons que |x,| < q" avec q < 1. La 
comparaison avec la série géométrique 11.122(1) conclut. 


(2) Pour (2) Alors en prenant € tel que p — € > 1, nous avons une infinité de termes vérifiant 
Im] > pe" > 1. 


ThoSerPuissRap 


Théorème 15.25 (Formule de Hadamard{460]). 
Le rayon de convergence ! de la série entière 3, anz" est donné par une des deux formules 


. = lim sup /|ag| ÉqRay Cons) 


où 
dk+1 
ak 


du 


1 
= lim 


k—00 


lorsque ax est non nul à partir d’un certain k. 
Si une de ces formules donne 1/R = 0, alors le rayon de convergence est infini. 


Démonstration. En deux, voire quatre parties. Nous allons utiliser le corolaire 15.19, en commen- 
çant par supposer que la limite supérieure n’est ni 0 ni 0. 


(1) Première formule, si |2| <R Posons L = limsup, ,, (lan|[/"). Si [2] < À, alors 


1 
lim sup |a,2°[/7 = limsup [as|/"|2| < LT = (15.69) 


donc la règle de Cauchy du lemme 15.24 conclut à la convergence de la série. 


(2) Première formule, si |z] > R C'est exactement le même calcul, mais l'inégalité arrive 
dans l’autre sens : 


1 
lim sup [a,2°[/7 = limsup [a,|[/"[2] > LT 1 (15.70) 
donc la règle de Cauchy du lemme 15.24 conclut à la divergence de la série. 
(3) Première formule, si la limite est O Si limsup 4/[ax|!/* 
calcul donne : 


— 0, alors toujours le même 


limsup |a,z°[/7 = 0 (15.71) 


et donc la série converge pour tout z. D'où le rayon de convergence infini. 


(4) Première formule, si la limite est © Soit z€e C. La partie 


S={ne N tel que [a,|[/" > 1/2|} (15.72) 


est infinie. Pour chaque n € $, nous avons la,z"| > 1. La suite des a,z° ne convergeant 
pas vers zéro (il y a même une infinité de termes plus grands que 1), la série ne peut pas 
converger (proposition 11.89). 


(5) Seconde formule Le lemme 15.23 nous ramène au cas de la première formule. 
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> 


FIGURE 15.1: À l’intérieur du disque de convergence, la convergence est absolue. En dehors, la 
série diverge. Sur le cercle proprement dit, tout peut arriver. LabelFigDisqueConv 


Notons que le critère d’Abel ne dit rien pour les points tels que |z — z0| = À. Il faut traiter ces 
points au cas par cas. Et le pire, c’est qu’une série donnée peut converger pour certain des points 
sur le bord du disque, et diverger en d’autres. Le théorème d’Abel radial (théorème 15.40) nous 
donnera quelques informations sur le sujet. 

Il y à un dessin à la figure 15.1. 

Si les suites a, et b, sont équivalentes, alors les séries correspondantes auront le même rayon 
de convergence. Cela ne signifie pas que sur le bord du disque de convergence, elles aient même 
comportement. Par exemple nous avons 


Ci" 


n 


1 1 
_ Fe 15.73 
NT (15.73) 
En même temps, en z = —1 la série 
n 


(15.74) 


De 
n>1 
converge par le critère des séries alternées !?. Par contre la série 


> (+ ” E) 2 (15.75) 


n>1l 


ne converge pas pour 2 = —1I. 


Exemple 15.26. 

Soit a € R et considérons la série Le 14n2" où an est la n-ième décimale de a. Si a est un nombre 
décimal limité, la suite (a,) est finie et le rayon de convergence est infini. Sinon, pour tout N il 
existe un n > N tel que a, # 0 et la suite (a,) ne tend pas vers zéro. Par conséquent la série 


D ane (15.76) 


diverge pour z = 1 et le rayon de convergence satisfait R < 1. Nous avons aussi |a,| < 9, de telle 
manière à ce que la série soit bornée et par conséquent majorée en module par 92”, ce qui signifie 
que R > 1. 

Nous déduisons alors À = 1. A 


15.2.2 Somme et produit de séries 
THOo0oSDQQoolawBOk 


Théorème 15.27. 
Soient D, an2" et D ,b,z2" deux séries de rayon de convergences respectivement R, et Ri. Si R, est 
le rayon de convergence de Ÿ,,(an + bn)2", nous avons 


FR, =minfhR,; Pi} (15.77) 


11. Définition 15.12. 
12. Théorème 11.127. 
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THOooINHDooZxErnp 
Théorème 15.28. 
Soit une série Ÿ,, an 2" de rayon de convergence R. 


(1) Si À ZÆ0 la série Ÿ,,(Aan)z" a le même rayon de convergence que la série Ÿ}, an2" 


(2) Silz| < Ra nous avons 
OO 


Si (AG, 27 = À Fi (15.78) 


n=0 


LEMooNYAXooKUuQFe 
Lemme 15.29 ([1]). 
Soient deux suites de nombres complexes (a) et (b,). Soit ne N. Nous avons : 


n n  n—l 
à. à ubr = D (D b;)a. (15.79) 
k=0 1=0 j=0 


Démonstration. Le problème est qu’à gauche la borne de la somme sur ! dépend de k; cela nous 
empêche de permuter les sommes !*, Qu’à cela ne tienne : nous complétons la somme en introduisant 


Dr 


0 sinon. 


1 sil<k 
= (15.80) 


Nous avons alors 


n 


nm k n n 
. > Qbk_1 = >: > Ok bk-1 = ù Ok Qbk-1 = > (a >, br) (15.81a) 
k=0 SR — 


k=0 1=0 k=0 1=0 1=0 
n n—l n n—l 
Job o)e) (6) (15.81b) 
1=0  j—=0 I=0 j=0 
LEMooLPBCooRWuvJB 


Lemme 15.30 ([1]). 
Si la série . anz° à un rayon de convergence R, alors nous avons 


O0 OO 
( >, ae . Fils (15.82) 
n=0 n=0 


et les rayons de convergences sont égaux à R. 
PROPooPKGEooZKyxwo 


Proposition 15.31 ([161]). 
Soient (an) et (b,) des suites dans €. Nous supposons que Ÿ., an est absolument convergente |? et 
que Dh b, est convergente. 

Alors en posant 


—) ab (15.83) 


la série Ÿ,,, Cn est convergente et 


5 En = (Dai)(2,6;). (15.84) 


13. Vu que toutes les sommes sont finies, ce ne sont certainement pas les questions de convergence qui nous 
retiennent. 
14. Définition 11.81. 
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Démonstration. Nous commençons par quelques notations sur les sommes partielles et leurs limites. 
Nous posons An = Yo 4n; Bn = x_0 On €t nous avons, par hypothèse, les convergences 4, +, 4 
C 
et Bn — B. 
En ce qui concerne la somme partielle pour les (c,), en appliquant le lemme 15.29, 


n nm _k 
Ch — > CE — >, > ag} — >», ( bj)a = » aBh-1. (15.85) 


Soit € > 0. 


(1) Des indices assez grands Nous définissons N;, N2 € N de la façon suivante : 


— Vu que B; — B, il existe N € N tel que pour tout j > N,[B; -B|<e. 


— Vu que ÿ,, a, converge, la proposition 11.89 nous dit que |a;| — 0 (ce n’est pas ici que 
nous utilisons la convergence absolue). Il existe donc M € NN tel que Ja;| < e/N1 pour 
tout à > No. 


— Nous considérons N > N; + N. 


. Je O0 2 
(2) Un majorant Vu que la série Ÿ;, a, converge absolument, la somme ÿ ,_,|a| est bornée. 
De même, la suite j + |B; — B| est bornée et nous choisissons M assez grand pour majorer 
les deux en même temps : 


ce 

>: lan Nr de 
n=0 
IBj-B|<M Vi. (15.86b) 


(3) Et on calcule un peu Nous avons assez préparé de notations et de majorations. C’est le 
moment de prouver que Cn — A, B — 0. Nous avons 


nm 
\Cn — AnB| = | D; ax(Bn-1 — B)| (15.87a) 
1=0 
nm 
< D [ul Bn-1 — B (15.87b) 
1=0 
n—N; n 
— lullBn-i + D lullBa-B] (15.87c) 
1=0 I=n—-Ni+1 
n—N; n 
BE IQFZ 
< lale + M 5 || joie PES 
1=0 I=n—-Ni+1 
£ BEQooKAJF 
<M+M D + v (ooe) 
nait TE 


= 96M. IFRS CREER 


Justifications : 


— Pour (15.87d). Dans la première somme, n—l >n—(n—N;) = N;,donc|B,_;-B]<e. 
Dans la seconde somme nous avons seulement majoré |[N,,_1 — B| < M. 


— Pour (15.87e). Dans la première somme, il s’agit de la majoration (15.86a). Dans le 
seconde somme, { >zn-N+1>N+N-N +1 > N2 +1, ce qui implique 
ll < e/M. 


— Pour (15.87f). La somme contient n — (n — NM + 1) +1 = Ni termes. Chaque terme 
valant e/N1. 
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(4) Conclusion Nous avons prouvé que pour tout € > 0, il existe N tel que [C, — A,B] €. 
Nous écrivons maintenant 


Œ == Did 2 (15.88) 


Vu que Ch — A,B — 0 et que A,B — AB, la somme des deux suites converge vers l° 


0+ AB = A et donc 
Cn — AB. (15.89) 


Le théorème suivant donne une formule (dit « produit de Cauchy ») pour le produit de deux 
séries entières. Nous en donnons une adaptation dans le cas de séries de puissances dans une algèbre 


normée dans la proposition 11.95. 
ThokPTXYC 


Théorème-Définition 15.32 (Produit de Cauchy dans C[462]). 
Soient D, an2" et > ,b,2" deux séries de rayon de convergences respectivement Ra et R,. La série 


entière S (5 na) ” “APE ER 


n=0 \k=0 
est le produit de Cauchy des séries Ÿ,, an2" et >, bn2". 


Nous notons R, le rayon de convergence de la série. ITEMooFOVPooBaVknN 


(1) Nous avons l'inégalité R, > min{Ra, Ro}. 
(2) Si |z| < min{Ra, Ri} alors 


Ÿ | 5 0) m2 | ÿ ms") S ne) | ERooscxHoop QE 


n=0 \i+ji=n n= 


ITEMooHRNZooWvi igD 


Démonstration. En plusieurs parties. 

(1) Préambule Nous allons fixer z, et utiliser la proposition 15.31. Ce que nous appelons ay 
là-bas est a,z"° ici. Idem pour les b, qui sont b,z" et c, qui devient c,2”. Vu que z sera fixé, 
tout cela n’est pas très profond. 

Ces substitutions sont très courantes lorsque nous prouvons des résultats sur les séries entières 
comme corolaires de résultats généraux sur les séries. 

(2) Pour (1) Sifz| < min{Ro, Rs}, alors les séries »},, anz” et »,, b,2" sont absolument conver- 
gentes par lemme d’Abel 15.18. La proposition 15.31 pour les suites (a,2") et (b,z”) fait alors 
le boulot : en posant 


nm 
ne) be (15.92) 
k=0 


la série Ÿ,, 2" converge et vaut le produit des deux. 

La série ÿ}, 2" converge sur {2 € © tel que |z] < min{Rs, Ri}}. Donc en posant r < 
min{ Ra, Ro}, la suite (c,r") est bornée (dans C) et nous avons que À, > r (utilisation très 
littérale de la définition du rayon de convergence). Donc R, > min{R4, Ri}. 


(3) Pour (2) Le travail est déjà fait. 


Exemple 15.33. 
Montrons un produit de Cauchy dont le rayon de convergence est strictement plus grand que le 
minimum. D'abord nous considérons 


A=i=2 (15.93) 


15. C’est la proposition 10.28. 
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c’est-à-dire ag = 1, a = —1, ay>2 = 0 avec À, = ©. Ensuite nous considérons 


de. (15.94) 


c’est-à-dire B = (1— z) let R, = 1. Le produit de Cauchy de ces deux séries valant 1, le rayon 
de convergence est infini. 

Notons qu’alors l'égalité (15.91) a lieu dans B(0,1), mais pas au-delà. 

Donc le « produit de Cauchy » de deux séries peut ne pas être égal au produit des deux séries, 
au sens où il est possible que le produit existe là où une des deux séries n'existe plus. A 


Exemple 15.34. 
Nous montrons que 


Din+1l)z" = (15.95) 


pour xe]-1,1|. 
Étant donné que pour tout r dans |—1,1[ la suite (n+1)r" est bornée, le rayon de convergence 
est correct. Pour les + dans ce domaine nous avons 


EC Enr 1 (++) EqDUT 


m=0 


Nous devons expliciter ce produit de Cauchy en utilisant le théorème 15.32. Pour tout à nous avons 
ai = bj = 1. Par conséquent le produit (15.96) devient 


>. > = ÿ (n+1)r". (15.97) 


a 


Nous voulons maintenant faire le produit de Cauchy à plus que deux facteurs. Pour cela nous 
prouvons d’abord un certain nombre de lemmes traitant de la combinatoire du problème. 
Nous posons, pour n, N € N: 


N 
VAN) = {x e N° tel que > nn, APPROCHES) 


LEMooRKEVooDdpuHt 
Lemme 15.35. 
Nous avons 


CN +1) cu L ne) (15.99) 


y=0 xeVy(N) 


Démonstration. En deux parties. 


(1) Première inclusion Un élément de [J}_5Usey,çn(t: — y) est un élément ze NV+1 de 
la forme z = (x,n — y) tel que x € V,(N). Donc 


D x= Dn+ (n—-y)=y+in-y=n. (15.100) 


Donc z € VA(N +1). 


(1a) L’autre inclusion Un élément de V,(N + 1) est de la forme z = (x,y) avec x € NV 
et ye N. Posons t = YŸ, x;, de telle sorte que x € V(N). 


Vu que 2 € V,(N + 1) nous avons d’autre part y = n — d t=n—-t. 
i=1 
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La proposition suivante généralise le produit de Cauchy du théorème 15.32 au cas de plus de 
deux facteurs. Nous ne pouvons cependant pas considérer 15.32 comme un cas particulier de 15.36, 
parce que la démonstration va utiliser le cas à deux facteurs. 


PROPooJPVVooLqSdSn 
Proposition 15.36 (Produit de Cauchy{1]). 
Soient des nombres complexes a; tels que les séries entières 
00 
()= Y'a (15.101) 
k=0 


soient convergentes avec un rayon de convergence R;. Nous posons 


N 
m= }} [és (15.102) 


2eVA(N) i=1 


et nous appelons R, le rayon de convergence de la série Ÿ;, Cn2”. 
(1) Nous avons l'inégalité R, > min{Ri} . 
ITEMooUVNXooLxlawx 


(2) Pour |z|] < min{R;} nous avons l'égalité 


F6 = ÿ >. Las CALE D à 1 


Démonstration. Nous prouvons cela par récurrence sur N. D'abord pour N = 1 nous avons V,(1) = 
{n}. Donc €, = HE Qix, = Gin et donc la série à droite dans (15.103) est seulement + Ain? = 
s1(2). 

Nous supposons le théorème prouvé pour toutes valeurs jusqu’à N et nous prouvons pour N +1. 
Si |z| < min{;} alors toutes les séries convergent et en utilisant l’associativité du produit dans C 
nous avons : 


N+1 N Le N 
IT 0) - [Hn) svt = DT ON [ai |7sv4(2). (15.104) 


=1 \rev,(N) i=1 


Nous allons maintenant utiliser le produit de Cauchy à deux termes du théorème 15.31. Notez que 
c’est bien l’utilisation de ce théorème qui nous permet d’obtenir la convegence dans notre pas de 
récurrence, et non l'hypothèse de réccurence actuelle. Bref, nous posons 


N 
be= D, [ [a (15.105a) 


xEVE(N)i=i 
dx = AN+1,k- (15.105b) 


L'utilisation du produit de Cauchy à deux facteurs donne le coefficient de 2” sous la forme suivante 
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(justifications plus bas) : 


= } by (15.106a) 
YE Va (2) 


N 
_ 2 [ Laisian in (15.106b) 


YE Vn (2) re Vi (N) i=1 


N 
Do SUBEGooFPEMp ok Ed 


y=0 ze V,(N) i=1 


N 
» El dix; AN +1,y SVÉRAo ORNE 
(&,y)EVa(N+1) i=1 
N+1 


+ [ia (15.106e) 


zeVa(N+1) i=1 


Justifications : 


— Pour (15.106c). L'ensemble V,(2) n’est pas très compliqué à expliciter : 
VAa() = {(y,n — y) tel que y = 0,...,n}. (15.107) 


— Pour (15.106d). La somme porte sur les (x,t) avec x € NV et ye N tels que (x,y) est dans 
VA(N + 1), et la justification de l'égalité est le lemme 15.35. 


15.2.3 Convergence normale 


Théorème 15.37. 
Une série entière converge normalement sur tout disque fermé inclus au disque de convergence. 


Démonstration. Toute boule fermée inclue à B(0, À) est inclue à la boule B(0,r) pour un certain 
r < R. Nous nous concentrons donc sur une telle boule fermée. 

Pour chaque n nous posons un(z) = an2” que nous voyons comme une fonction sur B(0,r). 
Pour tout ne N et tout ze B(0,r) nous avons 


lunco < |an2°| < lan|r”. (15.108) 


Étant donné que r < R la série ÿ,, la, |r” converge et la série »;, |u,| est convergente. La série 
Du än2” est alors normalement convergente. 


Exemple 15.38. 

Encore une fois nous n’avons pas d’informations sur le comportement au bord. Par exemple la 
série >, 2" a pour rayon de convergence R = 1, mais sup,eg(01) |2"| = 1 et nous n’avons pas de 
convergence normale sur la boule fermée. A 


La convergence normale n’est donc pas de mise sur tout l’intérieur du disque de convergence. 
La continuité, par contre est effective sur la boule. En effet si 20 € B(0, À) alors il existe un rayon 
0 < r < R tel que B(20,r) € B(0,R). Sur B(z0,r) nous avons convergence normale et donc 
continuité en 29. 

La différence est que la continuité est une propriété locale tandis que la convergence normale 
est une propriété globale. 


Proposition 15.39. 
Soit f(z) = Ÿ,, an2”° avec un rayon de convergence R. Si Ÿ |a,|R" converge alors 


(1) la série Ÿ,, an2" converge normalement sur B(0,R), 


15.2. SÉRIES ENTIÈRES 1351 


(2) f est continue sur B(0, R). 


Démonstration. La conclusion est claire dans l’intérieur du disque de convergence. En ce qui 
concerne le bord, chacune des sommes partielles est une fonction continue. De plus nous avons 
lun] < lan|R?, dont la série converge. Par conséquent nous avons convergence normale sur le 
disque fermé. 


Le théorème suivant permet de donner, dans le cas de fonctions réelle, des informations sur la 


convergence en une des deux extrémités de l’intervalle de convergence. 
ThoLUXVijs 


Théorème 15.40 (Convergence radiale de Abel). 

Soit f(x) = D, ant" une série réelle de rayon de convergence 0 < R < 0. 
(1) Si an R" converge, alors f est continue sur [0, R]. 
(2) SiY,, an(—R)" converge, alors f est continue sur [—R, 01]. 


La proposition 15.100 donnera un exemple d'utilisation pour la série de In(1 — x) (qui n’est pas 
encore définie à ce moment). 

Le résultat suivant permet d'identifier deux séries complexes lorsque leurs valeurs sur IR sont 
identiques. 


Proposition 15.41. 
Soient les séries f(z) = Da,z” et g(z) = > b,2" convergentes dans B(0,R). Si f(x) = g(x) pour 
x € [0, R[ alors an = bn. 


Démonstration. Soit no le plus petit entier tel que as, # bn,. Pour tout z € B(0, R) nous avons 


fe) — 80) = ; (an — bn)2" = 204 (z) (15.109) 
pla)= Ÿ lan = barre. (15.110) 
n>0 


Par le théorème 15.27 le rayon de convergence de % est plus grand que À et la fonction 4 est 
continue en 0. Étant donné que (0) = Any — On) À 0 et que Y est continue nous avons un p tel 
que © £ 0 sur B(0,p). Or cela n’est pas possible parce que au moins sur la partie réelle de cette 
dernière boule, 4 doit être nulle. 


PropSNMEooVgNqBP 
Proposition 15.42 ([163, 1]). 
Si la série entière Ÿ,,-94n2" à un rayon de convergence R alors 
(1) La somme est une fonction holomorphe ! dans le disque de convergence. ItemUULDooEGRNi A 
(2) La somme est différentiable et 
(ce) 
du (z) = . nant Va (15.111) 
n=1 
(3) De plus pour tout 0 € B(0,R), on pose!" 
St)= Y'ass? (15.112a) 
n2Z0 
O0 
Tai », nan2 1 = (n + l)an127. (15.112b) 
n>1l n=0 
Alors nous avons s s 
_ EqVQDP 
jee APP ASE) 
220 Z— 20 


16. Définition 12.316. 
17. Pour rappel, dans tout ce texte, B(a,r) est une boule ouverte. 
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Démonstration. Nous allons prouver, en utilisant le théorème 15.9, que la somme est une fonction 
différentiable et que la différentielle est C-linéaire. La proposition 12.322 nous dira alors que la 
somme est C-dérivable. 

Nous posons uh(2) = a,2", qui est une fonction de classe C!. En ce qui concerne sa différentielle 
nous considérons 29 € B(0, R) et nous avons (si n = 0 alors la différentielle est nulle) 


d 
(dun)20(2) = lun(o +t)] (15.114a) 
= San (20 + |. (15.114b) 
d n—1 
= [nana k)|. (15.114c) 
7 JE (15.114d) 


En cours de calcul nous avons développé (20 + tz)" et gardé seulement les termes de degré 1 en t. 
Il y en a n et ils sont tous égaux à 297 142. 

La convergence simple ÿ,,u, est dans les hypothèses. Il reste à prouver que la somme des 
différentielles converge uniformément sur tout compact autour de z0 ne débordant pas du disque 
ouvert de convergence. Soit À un compact autour de 20. Dans le calcul suivant nous utilisons une 
première fois la norme uniforme de du, vu comme fonction de K vers £L(C, C) et une fois la norme 
opérateur l* de (du), comme application linéaire € — C : 


ldun|k = sup |(dum)2| (15.115a) 
zoEK 
= sup sup (dun): (2)| (15.115b) 
zoEK |z1=1 
= sup sup [nanzÿ l2l (15.115c) 
z0€K |2|=1 
= sup nla||20l""{. (15.115d) 
zocK 


Vu que z + |2l"-l'est une application continue sur le compact K, elle atteint son maximum 


(théorème 7.138). Nous considérons zx, un point qui réalise le supremum. Ce nombre est dans le 
disque de convergence parce que X est un compact autour de 26. 

Nous devons prouver que »,, nla,||z2x|""! converge. Vu que |zx| est une constante (par rapport 
à n) nous pouvons étudier la convergence en écrivant |zx|" au lieu de |zx["7{. 

La suite (a,|zx|"*) est une suite bornée. En considérant un majorant M de {|an|r" }nen, nous 
avons en particulier |a,||2x["* < M pour tout n. Nous considérons de plus r de telle sorte que 
K € B(0,r) € B(0,R). En particulier |[zx| < r et nous avons 


nm nm 
nan||zk|" < rjan|r" (E) <nM (=) (15.116) 
T 


r 


Nous savons que ce qui est dans la parenthèse est plus petit que 1, mais que ÿ,, nx" converge dès 
que |x| < 1. Par conséquent 


D Idunlx (15.117) 


converge et le théorème 15.9 fonctionne : du = D%°_, dus et la somme Y,, u, est de classe C1. 
La différentielle de Ÿ,, u\ s'exprime explicitement par 


dus (2) = » nazi le, EaJBFMoR}U 4er 
n=1 


Cette forme montre que du, est une application C-linéaire et donc la somme est C-dérivable par 
la proposition 12.322. Ergo holomorphe sur le disque de convergence par définition 12.316. 


18. Définition 11.51. 
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En ce qui concerne la formule (15.113), elle provient de la formule (12.860) : f’(20) est donné 
par la facteur multiplicatif de du,,. En l'occurrence la formule (15.118) nous donne 


f'(20) = D nanzÿ (15.119) 


n>1l 


15.2.4 Dérivation 


Lemme 15.43. 
Soit une série entière Y'a," de rayon de convergence R. Les séries 


LemFVMaSD 


An n+1l 
15.120 
>» n +l à 
et 
d,naate (15.121) 
n>1 


ont même rayon de convergence R. 


Notons toutefois que nonobstant ce lemme, les séries dont il est question peuvent se comporter 
différemment sur le bord du disque de convergence. En effet la série 


” Len (15.122) 


diverge pour 2 = 1 alors que 


> = a. (15.123) 


converge pour z = 1. 
Les théorèmes de dérivation et d’intégration de séries de fonctions (théorèmes 15.1 et 15.3) 
fonctionnent bien dans le cas des séries entières. Ils donnent la proposition 15.44 pour la dérivation 


et 15.49 pour l'intégration. 
ProptzOIuG 


Proposition 15.44. 
Soit la série entière 


00 
f(œ) = D ane” (15.124) 
n=0 
de rayon de convergence R. Alors la fonction f est C1 sur |-R, R[ et se dérive terme à terme : 
Le] 
HOENR  n (15.125) 
n=1 
pour tout x e ]-R,R|. 


à J #02 Le) - Es L 
Démonstration. Nous savons que la série 5%_, nant"! a le même rayon de convergente que celui 
de la série f. En particulier cette série des dérivées converge normalement sur tout compact dans 
]-R, R[ et la somme est continue. Le théorème 15.3 conclut. 


Remarque 15.45. 
À part lorsqu'on parle de fonction R — R, la notion de classe C* s'entend au sens de la différen- 
tielle, et non de la dérivée, voir les définitions 11.227. C’est cela qui explique la structure de la 


démonstration de la proposition 15.42. 
CorCBYHooGhgara 


Corolaire 15.46 ([463, 1]). 
La somme d’une série entière est de classe C'© sur le disque ouvert de convergence. 
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Démonstration. La proposition 15.42 a démontré en réalité nettement plus : sur le disque ouvert 
de convergence, la somme est une fonction holomorphe. Il n’est cependant pas possible de conclure 
ainsi parce que le fait qu’une fonction holomorphe est C'® ne sera démontré qu’au coût de nombreux 
efforts dans le théorème 26.60(3). 


(1) Cas réel Nous considérons la série entière ÿ}, a,x" pour x € R de rayon de convergence 
R. Une simple récurrence sur la proposition 15.44 donne le résultat. 


(2) Cas complexe Attention : le fait d’être de classe CF est le fait d’être k fois différentiable. 
Rien à voir avec la C-dérivabilité. 


En ce qui concerne la différentiabilité nous avons la proposition 15.42 qui dit que dans le 
disque de convergence, la fonction u(z) = Ÿ;, a,2" a pour différentielle l'application du: € — 
Lo (©, C), 

du: © — La(C,C) 


co) 15.126 
dus (2) = ( D (n + 1)anr126)2. ) 
n=0 
Nous allons éviter de considérer la différentielle seconde comme une application 
du: © — L(C,L(C,C)) (15.127) 


parce que ça nous mènerait trop loin pour parler de la différentielle k°. Au lieu de cela nous 
allons considérer l’isomorphisme d’espace vectoriel 


ÿ: © — Le(C, ©) 


(15.128) 
20 > V(20)z = 20z. 
Dans cette optique nous écrivons : 
00 
duzy = BCD (n + 1)an+126) (15.129) 
n=0 
ou encore : 
(7! 0 dju(zo) = D ,(n + 1)an+126. (15.130) 
nZ>0 


Nous allons prouver par récurrence que l'égalité suivante est vraie (y compris le fait que la 
somme converge) : 


(91 0 d\Fu(zo) = . Ce) (15.131) 
n=0 É 


Prouvons d’abord que cette somme converge pour tout k. Nous avons (n + k)!/n! < (n + k)* 
et donc il suffit de prouver que la série de coefficients n*a, converge. C’est le cas par la 
proposition 15.21. 

Nous pouvons calculer la différentielle de (#7! 0 d)*u en dérivant terme à terme en utilisant 
(encore) la proposition 15.42(2) : 


(n +k)! 


(ce) 
d((#”1 o d)fu), (2) = à " GANG (15.132a) 

00 

k+1)! 
=). Kb : ) Anh 1282. (15.132b) 
_ n! 
Nous appliquons #71 à cela : 
00 
L n+k+1)! " 

CRT CEE EURE (15.133) 


k= 


© 
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(3) Dérouler à l’envers 
Nous allons maintenant utiliser la proposition 12.287 pour montrer que u est de classe C* 
pour tout k. Nous avons démontré que (47! 0 d)Fu était différentiable. Par conséquent, 
d((#=!od)"" lu) est différentiable et donc (#7! od)*"1 est de classe C1. En continuant ainsi, 
(#1 0 d)*—lu est de classe C! et u est de classe CÀ. 


Le lemme suivant est encore essentiellement valable dans un espace de Banach (proposi- 


tion 11.261). 
LemPQFDooGUPBvF 


Lemme 15.47. 
Plusieurs choses sur des séries entières. 


(1) La série entière Ÿ,,0 24 a un rayon de convergence 1 et converge vers la fonction 


i 
2 (15.134) 


(2) Lorsque |w| = 1, la série 


: : _ > ae _ EqssHZop pu QREZ 


a un rayon de convergence égal à 1. ITEMOOHFVHooPCgzZV 


(3) Si |w| = 1, la série 
zS 


! 
= (EU s! wstk+1 


(15.136) 


1 1 CT nl 
D ED 


a un rayon de convergence égal à 1. 


Démonstration. Les coefficients de la série sont a, = 1 lorsque n est multiple de k et a, = 0 
autrement. Donc pour r = 1 la suite r'*a, reste bornée l?. Cela prouve que le rayon de convergence 
est au moins 1. Par ailleurs si r > 1 alors clairement la suite (a,r”) n’est pas bornée. Cela prouve 
le rayon de convergence égal à 1. 

Soit donc z € B(0,1). Nous avons, par le lemme 15.30, 


oo co e 
D ) (1— 2) = à PLU Y Z(m+1)k (15.137a) 
n=0 n=0 n=0 
00 (we) 
14 Sant SE (15.137b) 
n=1l n=0 
oO Le] 
is D POLE > Ar+Dk (15.137c) 
n=0 n=0 
=i (15.137d) 


En ce qui concerne la série (15.135), elle s'obtient facilement : 


1 1 1 1 A /z\s À 
_ = = re, 15.138 
W=s les D, 2e ’ 


La troisième série s’obtient en dérivant la seconde, ce qui est permis dans le disque de conver- 
gence par la proposition 15.44. 


Remarque 15.48. 
Sur le bord du disque de convergence, la série ÿ., z"# ne converge pas. En effet le rayon étant 1, 
sur le bord nous avons la série »;, ek® ont la norme du terme général ne tend pas vers zéro. 


19. Utilisation directe de la définition 15.12. 
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15.2.5 Intégration 
PropfeFQWr 


Proposition 15.49. 
Soit la série entière D a,x” de rayon de convergence R. 


(1) Pour tout segment [a, b] € |-R, R[ nous pouvons intégrer terme à terme : 


bf{ © co b 
J S os) dx = > an | D'or (15.139) 
& \n=0 n=0 4 


(2) La série entière obtenue en intégrant terme à terme a le même rayon de convergence que 
celui de la série de départ. 


Démonstration. La première assertion est un cas particulier du théorème général 15.1. Pour le 
rayon de convergence, le lemme 15.43 fait le travail. 


Vu que le rayon de convergence ne varie pas par la dérivation ou par l’intégration et qu’une 
série entière est de classe C® sur son disque de convergence, nous pouvons dériver terme à terme 
autant de fois que nous le voulons sans faire de fautes dans le disque de convergence. 


15.3 Séries de Taylor 

SECooDWRMooUKSuPh 
15.50. 
Avant de commencer, une petite formule de dérivation toute simple que nous allons utiliser souvent : 


0 il>k E 
CCE TA) 
DZ sinon. 


Dans les cas où il est permis de dériver terme à terme, nous avons la formule 


l 
F0) = Dute0 = Data FPT 
k k=p : 


15.3.1 Polynôme de Taylor d’une série entière 


Le polynôme de Taylor d’une fonction définie par une série entière s'obtient en tronquant la 


série. Cela est une assez bonne nouvelle que nous allons démontrer maintenant. 
PROPooQLHNooRsBYbe 


Proposition 15.51 ([1]). 
Soit une série entière 


Fe) =) ae (15.142) 
k 


de rayon de convergence R > 0. 
Pour tout n € N, il existe une fonction a telle que 


ftG)= S agz* + a(x)x" no dE «0 3) 
k=0 
et 
lim at) = 0. (15.144) 


Tout ceci étant convenu que 
— l'égalité (15.143) est uniquement valable sur le disque de convergence, 


— La fonction à dépend de n. 
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Démonstration. Le corolaire 15.46 nous indique que f est de classe C® sur |—R, R[ et que nous 
pouvons dériver terme à terme. 
En utilisant la formule (15.141) et en l’évaluant en x = x0, tous les termes s’annulent sauf 
k =D: 
f®)(0) = plap. (15.145) 
Le théorème de Taylor 12.455 nous indique alors qu'il existe &: R — R telle que lims_,9 a(t) = 0 
et 


= Ÿ axxf + ax)”. (15.146) 


15.3.2 Une majoration pour le reste 
LEMooOUVPIooAPWFOm 


Lemme 15.52. 
Soit une fonction f: R — R dérivable n + 1 fois sur B(a,R). Alors pour tout x € B(a,r), 


f(x D) Ce GG) 0 (à + [.. [Ts \(un)dun . du. (15.147) 


Démonstration. Nous allons intensivement utiliser le théorème fondamental du calcul intégral 
14.263 sous la forme de la formule (14.822). Nous avons d’abord 


f(x) = f(a) + [ f'(u1)du: = [ [f'(a) + [ f'(uo)dus|dur.. (15.148) 


a 


Toute l'astuce de ce théorème est de continuer à substituer f(*)(t) par f(9) (a) plus une intégrale 
de a à t de f (ED pu. Nous démontrons ainsi par récurrence que 


f(x +5 ee eo a+ [Ts )(un)dum … du. 00 TO) 


La preuve de cela se fait en substituant 


Fur) = F0 (a +” FD (uni )dun +1 (15.150) 


et en remarquant (encore par récurrence par exemple) que 
T Un —1 x — a)" 
J . dune dy = EL (15.151) 
; , n! 


Le théorème suivant donne majoration du reste du polynôme de Taylor. Il est un premier pas 
dans la démonstration de formules comme 


Jim _P,(x) = f(x) (15.152) 


lorsque P, est un polynôme de Taylor autour d’un point a £ x. Nous ne saurions trop insister sur 
le fait que de telles formules ne seraient valables que pour une classe relativement restreintes de 


fonctions. 
THOOOEUVEooXZJTRL 


Théorème 15.53 (Inégalité de Taylor[464]). 
Soit une fonction f: IR — R dérivable n + 1 fois et telle que |f(*+V(x)| < M, sur B(a,d). Alors 


[Ra (x)| < 


M. 


où Ra(x) = f(x) — P,(x) et où P, sont les polynômes de Taylor autour de a € R. 
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Démonstration. Nous pouvons écrire la formule du lemme 15.52 pour n + 1 au lieu de n; cela 
donne 


FC) = Pafz) + [- (15.154) 


et donc 
et 2180) s@= [. [” FR (15.155) 


En effectuant toutes les intégrales nous trouvons 2° 


[Rn(x)| < 


< Gr = (15.156) 


Cette formule pour le reste est très bien, mais pour l’exploiter au maximum de ses possibilités, 
il faudra la notion de convergence de suite de fonctions, et en particulier la notion de série de 
fonctions, pour pouvoir écrire 


D #(K){a 
So ) x (15.157) 
lorsque cela est possible. Nous renvoyons donc aux séries de Taylor, section 15.3, et en particulier 
aux fonctions analytiques de la sous-section 15.3.3. 


15.3.3 Fonctions analytiques 
SUBSECooXKHWooEzqGRJ 


Nous avons vu les polynômes de Taylor et déjà noté qu’il n’est pas en général vrai que 
lim Pn(t) = f(x) pour des x même proches du point autour duquel les polynômes de Taylor 
P, sont calculés. 

Nous allons maintenant étudier la classe des fonctions pour lesquelles la série de Taylor est 
égale à la fonction de départ. D'abord une proposition montrant que les coefficients de Taylor sont 


les seuls pour lesquels il est possible d'espérer avoir une telle propriété. 
PROPooTRWVOoETTtbP 


Proposition 15.54 ([165]). 
Soit une fonction donnée par la série entière 


9) = Den (x — a)" (15.158) 


sur la boule de convergence B(a, R) avec R > 0 (hypothèse : le rayon de convergence est strictement 
positif). Alors 


(15.159) 


Démonstration. Par hypothèse, nous avons un rayon de convergence À > 0, et le corolaire 15.46 
nous indique que f y est de classe C'?. Et nous pouvons dériver terme à terme par la proposition 
15.44. Cela pour dire qu’il nous est autorisé d’utiliser la formule (15.141) pour calculer les dérivées 
de f au point a. Nous avons d’abord 


œ I 
MOST (15.160) 
n=p 
et donc 
f®)(a) = CpD! (15.161) 


qui donne immédiatement le résultat. 


20. Je me demande si je n'ai pas une faute entre n et n + 1 quelque part. Relisez attentivement et écrivez-moi si vous 
trouvez une faute. 
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Proposition 15.55. 
Soit l'intervalle I = B(a,r). Si il existe M tel que 


| (x)| < PT (15.162) 


re 
pour tout x € B(a,r). Alors nous avons la convergence simple 


Pan — f (15.163) 


sur B(a,r). Ici, P, est le polynôme de Taylor d'ordre n pour la fonction f autour du point a. 
Démonstration. Vu que nous avons |f()(x)| < Mn! pour tout x, nous pouvons poser 


M 
Mn = —n! (15.164) 


Tr? 
dans le théorème 15.53 pour le faire fonctionner. Nous avons alors 


M 1 , 
PACA nn qe YL al+i = 


M 
n +1 


T—a 


(15.165) 


(x — al 


T 


Vu que x € B(a,r) nous avons |x — a] < r et donc [(x — a)/r|" < 1. Nous pouvons aussi majorer 
[x — a] par r et écrire 
TM 


Ra < 
Rnta)l < 


(15.166) 


Nous avons donc bien limy_, Rn(x) — 0. 


15.4 Algèbre engendrée par une matrice 


Nous allons en dire le strict minimum indispensable pour notre propos. Pour plus de détails, 


voir [466], et pour nettement plus de détails, [467]. 
DEFooXPFVooZzPXER 


Définition 15.56. 
Si AE Mi(n,K), alors l’algèbre engendrée par A est l'intersection de toutes les sous-algèbres de 


M(n,K) contenant À. 
LEMooZGFYooUHvxLy 


Lemme 15.57 ([166, 1]). 


Si le polynôme minimal? de A est de degré p, alors la partie {1, A, 4?,..., AP} est une base de 
Alg(A). 


Démonstration. La partie proposée est libre parce qu’une combinaison linéaire de ses éléments est 
un polynôme de degré p — 1 en À. Une annulation d’un tel polynôme serait contraire au fait que 
le polynôme minimal est de degré p. 

Cette partie est génératrice parce que, étant elle-même une sous-algèbre de M(n) contenant À, 
elle contient Alg(A). 


CORooQ"TUQooDtjljc 
Corolaire 15.58 ([1]). 
L'’algèbre Alg(A) est commutative. 


Démonstration. Écrire deux combinaisons linéaires d’éléments de la base donnée par le lemme 
15.57, et notez que les produits ne font intervenir que des produits de À. 


Une bonne question est de savoir si e{ est dans Alg(A). Pour le savoir il va falloir d’abord 
définir l’exponentielle ; rendez-vous donc au lemme 15.61. 


21. Toute matrice a un polynôme minimal par le lemme 9.94. 


1360 CHAPITRE 15. SUITES ET SÉRIES DE FONCTIONS 


15.5 Exponentielle sur une algèbre normée 


15.5.1 Définition 


Dans ce qui suit, nous considérons une algèbre commutative. 
DEFooSFDUooMNsgZY 


Proposition-Définition 15.59 (Exponentielle[1]). 
Soit (A,|.|) une algèbre? commutative de dimension finie sur © munie d’une norme d’algèbre. 


Pour x € À nous définissons 
2 : 
exp(x) = NT. Fo TE 


Cette définition a les propriétés suivantes : 
(1) C’est bien défini pour tout x € A. C'est-à-dire que pour chaque x, la série (15.167) converge. 


(2) Cela donne une application continue exp: À — A. ITEMooC CT Root EhC an 


(3) La fonction exp est différentiable et 
(dexp)»(y) = exp(x)y, PETER 


le dernier produit étant la structure d’algèbre sur À. 


Démonstration. Pour la différentiabilité de exp, nous voulons utiliser le théorème 15.9. Pour cela 
nous posons 


(15.169) 
(1) Convergence simple Nous prouvons la convergence simple, c’est-à-dire pour chaque x 


séparément, de la série (15.167) dans deux buts. D’abord de nous assurer que la définition 
posée de exp a un sens, et ensuite pour commencer à vérifier les hypothèses du théorème 15.9. 


Nous montrons que les sommes partielles forment une suite de Cauchy. Nous fixons x € À et 
nous posons 


fi Re 
>, (15.170) 
k=0 
Soient p > q, deux entiers. Nous avons : 
p k p k p k 
œ Ix°] Ix|*  EQooYNZNo 
k=q+1 k=q+1 k=q+1 


où nous avons utilisé le fait que la norme sur À soit une norme d’algèbre. 

C’est le moment d'utiliser la série exponentielle donnée dans le lemme 11.124 que nous 
appliquons avec t = |x|. La série donnée par les coefficients ay = |x|*/k! converge et ses 
sommes partielles forment en particulier une suite de Cauchy. Donc ce que nous avons à 
droite dans (15.171) peut être rendu arbitrairement petit lorsque p et q sont grands. 


(2) ux est continue Il s’agit de remarquer que (x +h)* = x +hC(x, h) où Cest une fonction 
bornée de À (lorsque h est dans un voisinage de 0 € À). Donc 


IG +R) — "| < 1A||C(&, h)| — 0. (15.172) 


Candidat différentielle de ux Nous trouvons à présent un candidat à être différentielle 
de u4. Pour cela nous faisons le calcul suivant, sans trop nous soucier de la rigueur : 


RS 
Co 
a 


1 
= kart = ug_1(x)y. (15.173) 


(u)a(u) = Efustr +4] = 4 


22. Définition 1.340. 


15.5. 


(4) 
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ux est différentiable Nous fixons x € À et nous posons T(y) = ux_1(x)y. Ensuite nous 
vérifions que cela vérifie la définition de la différentielle : nous devons calculer 


. L k_,k k—1 
pa LC +R) —ue(e) = TU) LL, (@ HR af kaËTTR | QERooNPKGOGUREIAU 
h—0 IR] hi KR] 


Vous vous souvenez de la formule pour (x + h)*? Essayez de vous en souvenir. Le premier 
terme est x°, et le second est kx*— 1h. Pour le reste c’est un polynôme dont tous les termes 
contiennent au moins h?. Nous avons donc 


R2P(x,h) 
—1 — = 0. 15.175 
he el Mn, 
Nous en concluons que u4 est différentiable et que 
(dux)(y) = Ux-1(T)y. (15.176) 


ux est de classe C! Nous devons démontrer que la différentielle est continue ; cela est la 
continuité de l’application 


dux: À — £(A, À) 


ne (15.177) 


La topologie sur À est celle de la norme, et celle sur £(A, À) est celle de la norme opérateur 


associée à la norme sur À. Nous avons ?* : 
lim |(dug)z+n — (dux)x|] = lim sup [ux-1(x + h)y — ug-1(x)y| (15.178a) 
h0 h0 |y|=1 
< lim sup fux+1(x + h) — ux-1(x)||y| (15.178b) 
R+0 let 
= lim lux+1(r + h) — ux-1(x)|. (15.178c) 


Le fait que cette limite vaille zéro est maintenant la continuité de ux_1. 


Convergence normale sur tout compact 


Soit un compact X de À. Par le théorème de Borel-Lebesgue 10.24, K est fermé et borné. 
C’est pour ceci que nous avons supposé que À était de dimension finie sur KR. Soit donc R > 0 
tel que |y| <_R pour tout y € K. Nous avons 


| + Rk-1 


LT LT 
lduxlx = sup \(du)e1 = sup: el (5.179) 
XE XE 


—— < su , 
il ei Wei 
Mais la série > à ie converge. Nous avons donc la convergence normale demandée. 


Conclusion 


Le théorème 15.9 conclut que l’exponentielle est de classe C1 et que sa différentielle est 
donnée par la formule 


(dexp)x(y) = D (du)x(y) = >. (dux)x(y) = > ux(x)y = exp(x)y. (15.180) 


EN 
Il 
e] 
En 
Il 
En 
EN 
Il 
(=) 


Notez le jeu d'indices : dux = 0 lorsque k = 0 (ce qui permet de faire commencer la somme 
à 1) et ensuite duy fait intervenir uy_1 (ce qui fait revenir le départ de la somme à k = 0). 


23. N'oubliez pas de faire à part le cas k = 0 parce que ce qui suit n’est correct que pour k > 1. 
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15.60. 
Lorsque nous disons que la différentielle de l’exponentielle est l’exponentielle elle-même, nous 
référons au point 15.59(3) : la différentielle de exp en x est l’opérateur de multiplication par 
exp(x). 

Nous pouvons comprendre maintenant que exp est même de classe C® parce qu’à chaque 
différentiation nous tombons sur la même fonction, laquelle est de classe au moins C1. 

Cependant, pour formaliser ça, il faut un peut travailler. Le cauchemar des différentielles suc- 
cessives d’une application À — A est que les espaces en jeu sont des emboîtements terribles de 
£(A, £(A,£(A, A))). 

Ce qui nous sauve est que l’espace £(A, V) est un A-module, quel que soit V. En particulier 


lorsque V est lui-même déjà un emboîtement. Faisons un lemme pour voir comment ça fonctionne. 
LEMooCEVGooFVXndZ 


Lemme 15.61 ([1]). 
Si À e M(n,K) avec K = R ou ©, nous considérons l’algèbre Alg(A) engendrée par A°*. Alors 


eME(A) © Alg(A). (15.181) 


Démonstration. Le lemme 15.57 nous dit que Alg(A) est une algèbre de dimension finie. Elle est 
commutative par le corolaire 15.58. Donc la proposition 15.59 s'applique. 


15.5.2 Différentielles 
LEMooHKQVooQTrHHW 


Lemme 15.62 ([1]). 
Soient deux espaces vectoriels normés E et V tels que V soit un E-module”. Nous supposons les 
normes soient telles que |xvy < |x|slvlv. 

Soit une fonction différentiable f: E — V telle que la différentielle df : E — L(E,V) soit de 
la forme 


dfa(y) = yg(x) (15.182) 


pour une certaine fonction différentiable g: E — V. 
Alors f est C*, et deux fois différentiable telle que 
df:E— L(E,L(E,V)) 


(D f)a(y)z = 2(dgx)(y) (15.183) 


pour tout x,y,2€ E. 


Démonstration. En plusieurs étapes. 


(1) f est C! Nous savons, par hypothèse, que f est différentiable. Il faut montrer que sa diffé- 
rentielle est continue, en remarquant déjà que g est continue parce que différentiable. 


Soit xx > +, et calculons fx, — dfx|| : 


Idfxx — dfx|| = ps Idfxx (y) — dfx(y)| 
yl= 
= sup |(g(xx) — g(x))yl 
yl=1 (15.184) 
< sup |g(xx) — g(x)||yl 
yl= 
= |g(tx) — g(x)||. 
ë £L(E,V) ss Heu 
Donc nous avons bien dfr, — dfx, Ce qui signifie la continuité de df. Donc f est de classe 


Cs 


24. Définition 15.56. 
25. Définition 1.323. 
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(2) f est deux fois différentiable 


Pour montrer que df est différentiable, nous mettons directement dans la définition (11.226) 
le candidat 


T;(h): R—V 
T(h)z = zdg;(y). 


Nous devons vérifier la limite suivante : 


(15.185) 


lim dfxih — dre — T(R) 0. FAeoTEGRe sens 
h—0 


Etudions la norme du numérateur : 


Idfa+n — dfx — Tr(h)| — DIE Idfx+n(y) = dfx(y) T(h)y| (15.187a) 
y| = 

= ue lyg(x + h) — yg(x) — ydgx (h)| (15.187b) 
y| = 

< Iylllg(x + h) — g(x) — dge (h)|. (15.187c) 
v| = 


La limite (15.186) se déduit donc de la différentiabilité de g. 


Note : la partie démontrant que f est C1 n’est pas strictement obligatoire parce qu’en vérifiant 


que f est deux fois différentiable, nous vérifions de facto que df est en particulier continue. 
LEMooTUWQooMCCDcm 


Lemme 15.63 ([1]). 
Soient des algèbres normées À et V telles que V soit un A-module vérifiant |xv| < |x|lv] pour 


tout x Ee A etve V. Alors L(A,V) est un A-module vérifiant |xal < |x||al pour tout x € À et 
ae L(A,V). 


Démonstration. C’est un simple calcul utilisant la norme opérateur : 


Izal = sup |(xa)y| = sup Ixa(y)| < sup Ixlla(y)| = 1xl sup la(y)| = Ixilal. (15.188) 
Iyl=1 lyl=1 Iyl=1 lyl=1 


PROPooTBDAooQouzSk 
Proposition 15.64 ([1]). 
La fonction exp: À — À est de classe C et vérifie, pour tout k > 1 la récurrence 


(dk exp}:(y) = y(d*-lexp)z. (15.189) 
Démonstration. La formule proposée fonctionne avec k = 1 : 


(dexp):(y) = yexp(x). (15.190) 


C’est la relation 15.168. 

Nous considérons 4 > 1, nous supposons que exp est de classe C7! et k fois différentiable. 
Nous allons prouver que exp est alors de classe C* et &+1 fois différentiable, et que la différentielle 
de d* exp est donné par la formule 


(ET exp);(y) = y(d* exp)z. (15.191) 

Pour nous mettre au clair avec les espaces en présence, nous supposons que 
d-lexp: À — L(A,V) (15.192a) 
d'exp: A — L(A,L(A,V)) (15.192b) 


pour un certain espace vectoriel normé V, lequel est un de ces terrifiants emboîtement de type 
£(A, L(A, £(A, A))). Il est bien un espace vectoriel normé, et également un A-module parce qu’on 
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peut toujours définir la multiplication d’un élément v € V par un élément x € À comme étant la 
multiplication par x du résultat final de l’évaluation emboîtée, laquelle se termine par un élément 
de À. Donc tout se met bien. 
Quoi qu’il en soit, nous posons 
Ty) = y(d* exp}x (15.193) 


et nous vérifions ce que cela donne dans la définition de la différentielle. Si nous avons 


lim (d*exPhaæn — (df exp}e — Te(h) 


= 0 (15.194) 
h—0 [Lal| 


alors nous aurons prouvé tout ce qu'il nous faut. 
Le numérateur est une application À — £(A, V); nous en écrivons la norme comme il se doit : 


(d* expatn — (d° exp)z — T(h)| = se (dE exp)o+n(y) — (d° exp)a(y) — R(d° exp)xy| 
(15.195a) 
= sup |y(d°-'expzrn — y(d°-Texp)x — h(d° exp)xy| 
. (15.195b) 
= sup |y(d° exparn — y(d° exp) — hy(d° Texp}x| 


ly|=1 
(15.195c) 


< |(-L'explarn — (d*-lexp)x — h(d*-lexp}zl|  (15.1954) 
= (dE T'exp;n — (d*-Lexp)x — (d*exp)(h)|.  (15.195e) 


Dans ce calcul nous avons utilisé le lemme 15.63 et T,(h)y = h(d* exp);y. Maintenant, la limite 


Le IG -T'exphern — (4-1 exp}a — (d* exp}e(A)|. 
ie ln] 


(15.196) 


n’est rien d’autre que la limite arrivant dans la définition du fait que d" exp est la différentielle de 
d*-lexp. Cette limite est donc zéro comme nous voulions le prouver. 


Le théorème suivant est très important parce qu’il permet de définir l’exponentielle d’une 
matrice. Et les exponentielles de matrices sont utiles, entre très nombreuses autres choses pour 
résoudre certaines équations différentielles. 


THO00FGTQooZPiVLO 
Théorème-Définition 15.65 ([1]). 
Soit une algèbre normée A (pas spécialement commutative). La formule 
D LE 
exp(x) = 2 rl (15.197) 


définit une fonction différentiable dont la différentielle est donnée par 


(dexphe(y) = D ET EQoOFGPPopZKHEEU 


(+j+1)! 


i,jEN 
15.66. 
Nous ne démontrons pas cela ici. 

Il s’agit d’une adaptation de la proposition 15.59. Là où il faut faire attention, c’est dans 
l'équation (15.174) : il n’y a pas k termes x*-lh dans (x + h)*, mais £ termes de la forme x'hæ. 
C’est pour cela que la différentielle n’est pas donnée par T(y) = ux_1(x)y, mais bien par la somme 
(15.198). 

M'est avis en réalité que toute la démonstration du théorème 15.149 passe facilement au cas 
présent. 


26. La fonction exponentielle est, j'en suis quasiment certain, de classe C'©. Si vous connaissez un moyen pas trop 
douloureux de prouver cela, faites-le moi savoir. 
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15.5.3 Exponentielle de matrice 
SECooBYQBooZifJsg 


Proposition 15.67 ([168]). 
Soient des matrices À, P € M(n, C) telle que P soit inversible. Alors ?? 


eP "AP 2 pleAP, (15.199) 


Démonstration. Pour chaque m € N nous avons (Pt AP)" = P-LAMP, Ensuite, 


= k = 
P-TAP (PT AP) _ | 
. : = no RÉ (15.200) 
k k 
Nous avons utilisé la proposition 11.94 pour sortir P-! à gauche et P à droite de la somme. 
PROPooFLHPooRhLiZE 
Proposition 15.68 ([168]). 
L'’exponentielle de matrice vérifie ITEMooCVALOOEfLQCyT 
0 
(1) e = ITEMooNGPWooIyPEQt 
A _ LA 
(2) ATef = e” A" ITEMooEOSMooQ)j c jA 
(8) exp(A)' — exp(4) ITEMooROPJooMarenu 


(4) Si AB = BA alors AeP = eP A et eÂeP = ePeA, 


Démonstration. Point par point. 


(1) Pour (1) Juste substituer À = 0 dans la définition. Tous les termes tombent sauf le premier. 
Il faut utiliser le fait que A° = Id. 


(2) Pour (2) Il faut utiliser la proposition 11.94 pour écrire 


A* Am AÀ AF Am A 
A2 x -) = | : Am. te 0 


k! k! 


(3) Pour (3) Pour chaque k nous avons l'égalité (4*)! = (At)F. En utilisant encore le coup de 
la queue de suite qui converge vers zéro, 


2 t\k 
Sel D (4) 0e (15.202) 


k=N+1 


(4) Pour (4) Pour prouver AeP = eP A, c’est le même genre de manipulations que (15.201). 


Maintenant, vu que À et e? commutent, l'égalité à peine prouvée montre que e{ et eP 
commutent. 


PROPooKDKDooCUpGzE 
Proposition 15.69 ([168]). 

Soient À € Mi(n,C) ainsi que s,te C. Alors 
de (15.203) 
Démonstration. Nous calculons le produit e*4et4 par le produit de Cauchy de la proposition 11.95 : 

t* . sl ; Do nn nm nm 
— En PS = LL nm 
à — DE na _) NE | (15.204) 
k l n=0 m=0 


27. La définition de l’exponentielle de matrice est 15.59 où la convergence de la somme est celle de la norme 
opérateur 11.51. 
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À ce point, nous multiplions et divisons par n! et nous réarrangons la somme de la façon suivante : 


” mm Nm 
CEDS _ >, a oi SR (15.205) 
n=0 m=0 


Nous reconnaissons la somme sur m comme étant un binôme de Newton pour (t + s)". Nous 
avons donc finalement 


n! 


k …: > (( + s)A) _ et+s)A (15.206) 
n=0 


La proposition suivante dit que les exponentielles de matrices sont inversibles. Elle ne dit pas 
que toutes les matrices inversibles sont des exponentielles. Ce sera la proposition 15.129. 


PROPooRERRooMutKcg 
Proposition 15.70 ([168]). 
Si A e M(n,C), alors e* est inversible et 
(ef Le (15.207) 
Démonstration. Il suffit de prendre s = 1 et t = —1 dans la proposition 15.69 et nous avons 
eAe—À = e0 = 1. (15.208) 
Cela prouve que e4 est inversible et que son inverse est e 4. 
PROPooSDNNooQtHkhA 
Proposition 15.71 ([168, 1]). 
Soit AE M(n,C). Nous considérons l'application 
p: R — M{n,C) 
be etA (15.209) 
Nous avons la formule de dérivation 
w'(t) = AetA, (15.210) 
Démonstration. L'application 4 est une fonction composée de 
:R—M{n,R 
Î FN (15.211) 
tr tA 
et 
exp: Mn, R) — M(n,R 
De PAG EUrS MCE (15.212) 


Ar ef, 


Et nous avons © = expof. Il y a un choix difficile à faire. Soit nous travaillons dans M(n, R) et nous 
allons devoir invoquer le théorème 15.65, soit nous travaillons dans l’algèbre Alg(A) engendrée par 
A (définition 15.56) qui est une algèbre commutative ?” qui nous permet de n’utiliser que 15.168, 
qui est quand même plus basique. 

Coup de théâtre, nous prenons la seconde solution et nous réécrivons les fonctions f et exp de 
la façon suivante : 


y: R — Alg(A) 
ns (15.213) 
se décompose en 
: R — Alg(A 
Î g(A) (15.214) 
tr tA 


28. Proposition 3.43. 
29. Corolaire 15.58. 
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et 
exp: Alg(A) — Alg(A) 


A+ exp(À). 


Le fait que ces applications soient bien définies est le lemme 15.61 qui assure que les espaces 
d'arrivée sont bien dans Alg(A). Et c’est parti pour le calcul : 


d/(u) = do(1) SUBEQooFDPQaBgTDXE 
exp (dal) SUBEUOOVOF RDF ES 
= exp (f(u))dfu(1) 2 1 
_ uAA SUBEROOBMAQGQNSpzRT 


(15.215) 


Justifications : 
— Pour 15.216a. Pour la dérivée, nous utilisons le corolaire 12.266. 
— Pour 15.216b. La règle de la différentielle en chaine du théorème 11.241. 
— Pour 15.216c. La formule (15.168). 
— Pour 15.216d. Parce que f(u) = uA et que df\(1) = À. 


Le théorème suivant montre que le produit d’exponentielle de matrices suit la règle usuelle 
tant que les matrices commutent. Cela est cependant plutôt l’exception que la règle. À priori nous 


avons e{eP & eA+B, 
THOooXCPEooYGyLOp 


Théorème 15.72 ([168]). 
Soient À, B € Mn, ©) telles que AB = BA. Alors 


eAtB = AB, (15.217) 


Démonstration. Vu que À et B commutent nous avons Ae!P = et A (proposition 15.68(4)). En- 
suite nous posons 
g(t) = ettATB)e-tBetA (15.218) 


Nous calculons la dérivée de g en utilisant la règle de Leïbnitz et la proposition 15.71 : 
g'(t) = (A à Bee tee 
Te: do. (15.219) 


+ et(A+B),-tB (Aer 


Vu que À, B et À + B commutent, nous pouvons réarranger les facteurs en 


g'(t) . (A F7 Fe) a" 
SP: nu ne (15.220) 
_ Aet(A+B),—tB,—tA 


Enfin, cela fait 


g'(t) = (A+ B -B- AjetA+B)e-tBetA LG, (15.221) 
Donc g est constante et nous avons 
EAP PE 0) = 1 (15.222) 
En multipliant à droite par e!4etP nous trouvons 


CRE ge (15.223) 


comme annoncé. 
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15.6 Exponentielle et logarithme dans les réels 
Pour avoir une vue synthétique du plan, voir le thème 49. 


15.6.1 L’équation différentielle 


Pour la suite nous notons y une solution de l’équation y = y, y(0) = 1, et nous allons en 
donner des propriétés indépendamment de l’existence, donnée par le théorème 15.75. 


PropTLECooEiLbPP 
Proposition 15.73. 
Quelques propriétés de y (si elle existe) : 
(1) Pour tout x € R nous avons y(x)y(—x) = 1. 
(2) y(x) > 0 pour tout x. 
(3) y est strictement croissante. 
Démonstration. Nous posons w(x) = y(x)y(—x) et nous dérivons : 
px) = y'(x)y(—x) — y(x)y (x) = 0. (15.224) 


Donc w est constante %, Vu que (0) = 1 nous avons automatiquement y(x)y(—x) = 1 pour tout 
De 
Les deux autres allégations sont simples : si y(xo) < 0 alors il existe t € ]0, xo[ tel que y(t) = 0, 


ce qui est impossible parce que y(t)y(—t) = 1. La stricte croissance de y s'ensuit. 
PROPooGGUIooExVHPM 


Proposition 15.74. 
Quelques formules pour tout a, be R etne Z : ITEMooMPSUoobQpVQJ 


(1) y(a+b) = y(a)y(b) 
(2) y(na) = y(a)" 


(3) y (£) = 4/y(a). 


Démonstration. Nous posons h(x) = y(a + b — x)y(x) et nous avons encore h/(x) = 0 dont nous 
déduisons que À est constante. De plus 


h(0) = y(a + b)y(0) = y(a + b) (15.225) 


et 
R(b) = y(a)y(b). (15.226) 


Vu que h est constante, ces deux expressions sont égales : y(a + b) = y(a)y(b). 
Forts de cette relation, une récurrence donne y(na) = y(a)” pour tout n € N. De plus 


a a\® 
y(a) = y (° x n) = (©) | (15.227) 
ce qui donne y(a) = y(a/n)" ou encore y(a/n) = ?/y(a) 
Enfin pour les négatifs, si n € N, 
Ce CE (15.228) 
y(—na) = = ="y(a) %. . 
y(na)  y(a)" 
Et de la même façon, 
a 1 1 
y = a = = \/y(a). 15.229 
Le ta (a) (15.220) 


30. Proposition 12.188. 
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15.6.2 Existence 


Jusqu'ici nous avons donné des propriétés d’une éventuelle fonction y qui vérifierait l’équation 
différentielle. Il est temps de montrer qu’une telle fonction existe. 


ThoKRYAooAcnTut 
Théorème 15.75. 
La série entière — 
zx ÉQETE200Ra RE 
= .230 
“he 2 ( 
définit une fonction dérivable solution de 
= e DS nn (15.231a) 
y(0) = 1. (15.231b) 


Démonstration. La formule de Hadamard (théorème 15.25) donne le rayon de convergence de la 
série (15.230) par 


1 .…. + 1 
= 1 = li : 15.232 
Rd à  wbtl 0 Ce 


Donc nous avons un rayon de convergence infini. La fonction y est définie sur IR et la proposi- 
tion 15.44 nous dit que y est dérivable. Nous pouvons aussi dériver terme à terme : 


00 


Le k k—1 co k k—1 
y{x) = Ÿ = = Y = _ >. =) DS = (a). (15.233) 


k=0 ° k=1 1 il 


Notez le petit jeu d'indice de départ de k. Dans un premier temps, nous remarquons que k = 0 
donne un terme nul et nous le supprimons, et dans un second temps nous effectuons la simplification 
des factorielles (qui ne fonctionne pas avec k = 0). 


15.76. 

Nous savons que la fonction y existe parce qu’une solution de l’équation différentielle y = y, 
y(0) = 1 est donnée par la fameuse série (théorème 15.75). À part cela, ce qui a été fait avec cette 
équation différentielle ne permet pas de prouver l’existence de y. Donc, du point de vue de « définir 
l’exponentielle par son équation différentielle », c’est pas encore gagné. Notons au passage que le 
nombre e n’est pas encore bien défini via l'équation différentielle. 


15.6.3 Le nombre de Neper e 


Nous savons par le théorème 15.75 que x + exp(x) est une solution de l’équation différentielle 
exponentielle (avec la bonne condition initiale). Or une telle solution est unique par la proposition 
12.440. 


Définition 15.77 (Le nombre de Neper). 


Nous notons e le nombre exp(1). 
PropCELWooLBSYmsS 


Proposition 15.78. 
Pour tout x E R, nous avons 


exp(x) = e*. RROQBFERSRR RES 


Démonstration. Soit y vérifiant la fameuse équation différentielle. Nous savons que y = exp parce 
que c’est l’unique solution (proposition 12.440). Nous avons : 


y(x) = y(1)°. (15.235) 


Siqge Q alors qg = a/b et 


vo =u(g)=u(axr)=0(s) = (om va ve (15.236) 
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Le résultat est prouvé pour les rationnels. 

En ce qui concerne un élément général x € R, la fonction x + y(x) est continue sur R, et la 
fonction x + e* également (proposition 12.407). Ces deux fonctions étant égales sur Q, elles sont 
égales sur R par la proposition 7.246). 


Une conséquence des propositions 15.78 et 12.402 est que EqLOIUooHxnEDn 
lim e° =0 (15.237a) 
T—> — 00 
lim e° = +00, (15.237b) 
%— +00 


et en particulier, 
exp: IR — 10,00 
b el (15.238) 


xt e” 
est une bijection. 
LEMooXFAXooLVbebl 
Lemme 15.79. 
Nous avons l’encadrement 2.5 < e < 2.8. 


Démonstration. Vu que tous les termes de la série exponentielle sont strictement positifs, nous 
avons 


Lo 
= = 2.5. 15.2 
= RE ui = (15.239) 


Pour la majoration, nous notons que k! > 2F à partir de k = 4. Donc nous gardons les termes 
k = 0,1,2,3 sous la forme 1/k! et nous remplaçons les autres par 1/2” : 


Re 
< : 15.24 
e itit2tct 2m (15.240) 


Nous pouvons calculer explicitement la somme en utilisant la série géométrique de la proposition 
11.122(4) : 


O0 
1 1 l 1 1 
= ] = —. , 
D _ Fe de a ; (15.241) 
k=4 
En remettant tout ensemble, 
a . (15.242) 
: de 2 


PROPooFRKUooZyhHIC 
Proposition 15.80 ([169]). 
Le nombre e est irrationnel. 


Démonstration. En vertu de la proposition 15.78, nous avons e* = exp(x) pour tout réel x. En 
particulier pour x = 1, 


1 
e = 2 _ (15.243) 


Supposons que e = p/q pour certains p,q € N avec q Æ 0 (notez que ça signifie q > 1). 
Nous avons 


Lol D gl 
Y q: q° 
k=0 k=q+1 


Dans le membre de gauche, 


qgle = qe = (g—1)peN. (15.245) 
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Dans la première somme du membre de droite, vu que g > k, nous avons 
q 
q! 
, 15.246 
DE (15.246) 


= Le) ! à 
Nous devons donc avoir D a+i 4 € NN. Nous allons maintenant prouver que ce n’est pas le cas. 
Nous avons : 


00 00 1 
se 15.247a) 
F ( 
k=1 (g : D k=1 IBÉSET 
_. > | (15.247b) 
= —— | 
a+ 1 =2 .. 
— HE ” > a | (15.247c) 
LL q+2 | 
1 Se 1 
. : + 2 ce Pres (15.247d) 
Î Z 1 
= li — 15.247 
[+ Ë gene] ER 
1 e 1 
|| ——_— 15.247f 
“| + ar 
1 1 
= > 15.247g) 
k ( 8 
CE A nr D 


C’est le moment d’utiliser la série géométrique de la proposition 11.122(2). Vu que q > 1 nous 
avons 1/(q + 1) < 1 et la somme fonctionne : 


00 
q! 1 1 1 
= —. 15.248 
Der) q ) 


k=1 


Nous avons donc ” 


q! 1 
< — <—-<l. 15.249 
2 à VAS 


Donc ce terme n’est pas un nombre entier, ce que nous avions énoncé. 


15.6.4 Application réciproque : logarithme 
DEFOoËELGOooGiZQjt 


Proposition-Définition 15.81. 
L'application exp: R — ]0,00[ est une bijection. L'application réciproque 


In: ]0,0[ — R (15.250) 
est le logarithme. 


Démonstration. Le fonction exponentielle est dérivable, toujours strictement positive, donc stric- 
tement croissante. Les limites en +0 sont 0 et +00. Le théorème des valeurs intermédiaires 10.89 
nous dit que c’est une bijection. En effet, l’injectivité est la stricte croissance. En ce qui concerne la 
surjection, soit y € [0,00[. Vu que la limite en —c est zéro, il existe À € R tel que exp(x) < y pour 
tout x < À, et de la même façon, il existe BE R tel que exp(x) > y pour tout x > B. Si a < A et 


b > B alors exp(a) < y et exp(b) > y, donc y est dans l’image de [a, b] par l’exponentielle. 
LEMooCYGTooEjXEUu 


Lemme 15.82 ([1]). 
Le logarithme est une fonction continue. 
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Démonstration. C’est une conséquence du théorème de la bijection 12.54(4), et de la continuité de 
l’exponentielle sur KR, qui est une partie du théorème 15.75. 


PROPooPDJLooXphpEM 
Proposition 15.83 (Dérivée du logarithme). 
Pour tout se R* nous avons 
; 1 
In'(s) = -. (15.251) 
5 
Démonstration. L'application exp: IR — ]0,00[ est une bijection continue dérivable*!. La propo- 
sition 12.180 s'applique donc et pour tout x € R nous avons 


1 


In’ (exp(x)) = TE (15.252) 


Le théorème 15.75 nous indique que exp/(x) = exp(x). Donc pour tout x nous avons In’ (exp(x)) = 


ne): Vu que x est arbitraire et que exp est surjective sur R*, pour tout s € |0,0|[ nous avons 


In/(s) = : (15.253) 


PROPooLAOWooEYvXmI 
Proposition 15.84 ([1]). 
Pour tout x,ye R et pour a > O0 nous avons 


in(=) ho) (15.254) 

el 
m(xy) = In(x) + In(y), ET 189545 

el 
m(a*) = xIn(a) ÉAooE JUS ont cars 

el 


af = ea), (15.257) 


Démonstration. Nous avons, par la proposition 12.408, 


1 1 
—In(x) _ = = 15.258 
7 en(x) T 


En prenant le logarithme des deux côtés nous trouvons 


TX 


hé () (15.259) 


Nous pouvons continuer avec la suivante. 
Par définition, In(xy) est donné par exp (In(xy)) = xy. Mais nous avons aussi, par la proposi- 
tion 12.408 : 
en(æ)+n(y) _ en(x) M(y) = xy. (15.260) 


Nous avons donc démontré (15.255). 
La relation (15.256) de démontre d’abord pour x € N, puis pour x € Q et enfin pour x € R. Si 
n € N alors la relation (15.255) donne immédiatement 


ma”) = nln(a). (15.261) 


pour tout a € R. 


31. Dérivable (et donc continue) par le théorème 15.75. Bijection par la proposition 15.81. 
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Sim,ne N, le nombre a" est par définition le x > 0 tel que 
a" = @. (15.262) 


En prenant le logarithme des deux côtés : In(x”?) = In(a”) et en utilisant la relation déjà démontrée 
pour N nous trouvons min(x) = nln(a) et donc 


In(a”/") = In(x) = — In(a). (15.263) 


La relation est donc démontré pour In(aî) avec q € Q*. 
Nous passons à q = —m/n € QT, c'est-à-dire toujours m,n € N. Nous avons, en utilisant la 
proposition 15.84, 


ma *) = m(r) = —In(a{) = —-gIn(a). (15.264) 

Enfin si x € R nous considérons une suite de rationnels z, — x. Pour chaque k nous avons 
Inter) = na). (15.265) 
Nous prenons la limite deux deux côtés. À droite nous avons tout de suite xæin(a), et à gauche, 


par continuité de la fonction In (lemme 15.82) et de la fonction puissance (définition 12.407) nous 
trouvons In(a”). 


LemPEYJooEZlueU 
Lemme 15.85. 
Si a,b € ]0,0[ alors 
In(ab) = In(a) + In(b) (15.266) 
et 
1 
in ( :) = In(b). Faro 6) 
Démonstration. Nous posons f(x) = In(ax) qui est une fonction dérivable *. Alors f’(x) = Æ = À. 
Cette fonction f est donc une primitive de _ et il existe une constante K telle que 
f(x) = n(x) + K. (15.268) 
Vu que In(1) = 0 nous avons K = f(1) = In(a). Donc 
In(ax) = n(x) + In(a). (15.269) 


En ce qui concerne la seconde formule à démontrer, nous avons 


es (5e) 2h G) + In(b). (15.270) 


Étant donné que In(1) = 0 nous en déduisons la formule (15.267). 


15.86. 
La formule (15.256) en particulier est pratique pour réexprimer des fonctions puissances compli- 


quées en écrivant EQooYEWC 
| _ 00 
= en(a ee e?m(a) Q PSE | 


Cela aide à calculer la dérivée de x + a”. 
Notons que certains prennent (15.271) comme définition de la fonction puissance. 


32. Dérivée du logarithme, proposition 15.83. 
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15.6.5 Approximations numériques de € 


Nous donnons maintenant quelques approximations numériques de e, particulièrement ineff- 
caces. 


Lemme 15.87. 
Nous avons 
2<e<3. (15.272) 


Démonstration. Nous savons que y(0) = 1 et y(0) = 1. La fonction y est strictement croissante 
(et donc sa dérivée aussi). Nous avons donc y/(x) > 1 pour tout x € ]0,1], et donc 


y) >1+1x1=2. (15.273) 


Sachant que 2 > y/(x) pour tout x € ]0,1[ nous pouvons refaire le coup de l’approximation affine, 
cette fois en majorant : 
y) <1+2x1=3. (15.274) 


De la même façon nous savons que 
1 1 
—) > 1+—- 15.275 
Ho) > 14 (15.275) 


parce que y/ est minoré par 1 sur |0, 2. Avec cela nous avons aussi la majoration 


1 1 1 1 1 
y(—) <1+-x{14+ Slt (15.276) 
n n n he. n 
Et enfin nous pouvons donner l’encadrement, valable pour tout n : 


INT 1 L'NT 
LES) Sn ele re (15.277) 
n n On 
Pour n = 10 nous trouvons 
2.50 < e < 2.83. (15.278) 


Bien que ce soit à mon avis humainement pas possible à faire à la main nous avons, pour 
n = 100 : 
2.70 <e < 2.7317 (15.279) 


Cela reste un encadrement très modeste. 
Une méthode plus efficace consiste à calculer directement le développement de définition 


e = exp(1) = > : (15.280) 


def u(Kk): 


return the kth term in the expansion of ?’e’? 


return 1/factorial(k) 


def sum_u(n): 
wun 
return the sum of the ?’n’ first terms, that is with 
k froim O0 to n=1: 


51[S 
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L=f 


return 


u(k) for k in range(O,n) |] 
sum(L) 


sum_u (5) # This is a fraction 


sprint (s) 
r|print( numerical _ approx(s) ) 
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tex/sage/sageSnip013.sage 


ii Avertissement /question au lecteur !! 15.88 


Comment trouver, avec cette méthode, un encadrement pour e ? 


Ce petit programme, avec 5 termes donne e + 65/24 + 2.708. Avouez que c’est déjà bien mieux. 


15.6.6 Résumé des propriétés de l’exponentielle 


Théorème 15.89. 
Les choses que nous savons sur l’exponentielle : 


(1) Il y a unicité de la solution à l’équation différentielle | 


y = y 
y(0) = 1. 


| 


ThoRWOZooYJOGgR 

ITEMooETKKooLNoaRD 
subeqBKJNooJQtbBD 

(15.281a) 

(15.281b) 


(2) L'équation différentielle (15.281) possède une solution donnée par la série entière 


(3) Cette solution est une bijection y: R — ]0,|. 


(4) La fonction y ainsi définie est de classe CT. 


(5) Elle est également donnée par la formule 


A 


exp(x) = e 


où e est défini par e = exp(1). 
(6) Elle vérifie 


Nous nommons exponentielle cette fonction. 


Démonstration. Point par point. 
(1) 
(2) 
(3) 


C’est la proposition 12.440. 
C’est le théorème 15.75. 


Le rayon de convergence de la série (15.282) est infini 
sur IR. Le fait que ce soit une bijection est dû au 
(proposition 15.73) ainsi qu'aux limites (15.237). 


ÉqUARS op QAR 


ItemYTLTooSnfhOu 


(15.283) 


EQooVEKUoR RE IN 


(théorème 15.75) ; elle est donc définie 
fait qu'elle est strictement croissante 


Vu que y = y, y est dérivable. Mais comme y est alors égale à une fonction dérivable, y! est 


dérivable. En dérivant l'égalité y/ = y nous obtenons y” = y et le jeu continue. 


C’est la proposition 15.78. 
C’est la proposition 15.74(1). 
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ExooLRHCooMYLQTU 
Exemple 15.90 (Un endomorphisme sans polynôme annulateur[276]|). 
l’exponentielle permet de donner un exemple d’un endomorphisme n'ayant pas de polynôme an- 
nulateur * : l’endomorphisme de dérivation 


D: C®(R, R) — C°(R,R) 


15.285 
: (15.285) 


n’a pas de polynôme annulateur. En effet supposons que P = 3 a; XF en soit un, et considérons 
les fonctions f\: t — et. Nous avons 


= P(D)f = Y'a D (f)= ah = POS. (15.286) 
k k 
Par conséquent À est une racine de P pour tout À € R. Cela implique que P = 0. 
D'ailleurs si on y pense bien, cet exemple n’est qu’un habillage de l’exemple 9.98. AN 
ExZLMooMzYqfK 


Proposition 15.91. 
Quelques propriétés du logarithme. 


(1) Le logarithme est une application dérivable et strictement croissante. 

(2) Le logarithme est la primitive de x + À qui s’annule en x = 1. 
Démonstration. Elle est donc bijective, d’inverse continue et dérivable par le théorème 12.54 et la 
proposition 12.180. 


La dérivée de la fonction logarithme peut être calculée en utilisant la formule (12.467), mais 
aussi de façon plus piettone en écrivant l’expression suivante, valable pour tout x € R : 


In (exp(x)) = x, (15.287) 


que nous pouvons dériver en utilisant le théorème de dérivation des fonctions composées : 


In’ (exp(x)) exp'(x) = 1. (15.288) 
Mais exp'(x) = exp(x), donc 
In/(y) = ; (15.289) 


pour tout y dans l’image de exp, c’est-à-dire pour tout y dans l’ensemble de définition de In. 
Par ailleurs, exp(0) = 1 donc 


In(1) = In (exp(0)) = 0. (15.290) 


En ce qui concerne l’unicité d’une primitive s’annulant en x = 1, c’est le corolaire 12.202. 


15.6.7 Dérivée de la fonction puissance 
EXooGMRIooUucRez 


Exemple 15.92. 
Soit la fonction f(x,y) = xŸ, définie en 12.407. Nous allons en calculer les dérivées partielles au 
point (1,2). Notons que f n’est pas définie pour x < 0, mais que cela n’a pas d'importance parce 
que nous pouvons nous restreindre à un voisinage du point (1,2). La première dérivée partielle est 
facile : 

101,2) = (ur tou=(19) = 2: 


Pour la seconde, il faut utiliser les propriétés de l’exponentielle et du logarithme. D'abord le 
logarithme est par définition l’application réciproque de l’exponentielle (définition 15.81), donc 


zŸ = exp (In(x”)). (15.291) 


33. En dimension finie, le lemme 9.94 dit qu’il y en a toujours un. 
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Ensuite nous calculons en utilisant la proposition 15.84 : 


_ ynx = ynx _ 21n(1) 
2,f(1,2) y (e Le (ne ._. In(1)e2r0), (15.292) 


Cet exemple est facilement généralisable aux fonctions de la forme x + u(x)(®). Voici une 
proposition qui dit comment faire. 


PROPooKUULooKSEULJ 
Proposition 15.93 ([1]). 
Soit une fonction dérivable u: R — R et a > 0. Nous avons 
(a“)” = u/In(a)a”. (15.293) 
Si de plus u(x) > 0 pour tout x, nous avons 
(ut) = au'ut” 1. (15.294) 


Démonstration. Nous considérons la fonction f(x) = a“(). Vu que f(x) > 0 pour tout x, nous 
pouvons en prendre le logarithme et écrire l'égalité, valable pour tout x : 


f(x) = em(a"®) 2 exp (u(x) In(a)). (15.295) 
Sachant la dérivée de l’exponentielle, cela n’est rien d’autre que la dérivée d’une fonction composée : 
f'(x) = In(a)u/(x)e"(®) Ma), (15.296) 


Pour l’autre, nous posons 
g(x) = u(x)”, (15.297) 


qui peut encore s’écrire sous la forme 


gle) = et (ut), (15.298) 


Ici encore, c’est la dérivée de fonctions composées qui donne le résultat. 


15.6.8 Dérivée du logarithme 
LEMooTGCBooJdkLpg 


Lemme 15.94. 


Siu: R — ]0, 00! est dérivable alors In(u)' = mn 


Démonstration. Cela est une conséquence du théorème de dérivation des fonctions composées : si 
g(x) = In(u(x)) alors 


g'(x) = In’ (u(x))u'(x) = ——u'(x). (15.299) 


15.6.9 Taylor pour l’exponentielle 
PROPooQBRGooAhGrvP 


Proposition 15.95 (Développement de l’exponentielle). 
Pour tout entier n, il existe une fonction a: R — R telle que lims_,o a(t) = 0 et 


e? = 5 + ata(x). (15.300) 


Démonstration. Il s’agit de la proposition 15.51 appliquée à la série entière (15.59). 
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15.6.10 Analycité 


Vu que exp(x) est défini par une série entière (définition 15.59) et vu la proposition 15.54, il 
n’est pas étonnant que exp soit analytique. Traitons ce cas. 


Exemple 15.96 (Analycité de l’exponentielle). 
Soient a € R et R > 0. Nous démontrons que exp est analytique sur B(a, R). Si f(x) = e”, alors 
f(x) = e* pour tout n (équation (15.231a)). Nous avons donc 


[F0 (x) < e°+A (15.301) 
pour tout x € B(a, R). Nous partons de l’expression (15.53) du reste : 


Ma 
(n +1)! 


ettR 
LB alt pre, (15.302) 


IRa(æ)l < im +1) 


Mais nous avons la limite 


Rn+I 

Hi —_—— 15.303 
n=0 (n+ LI ( ) 
pour tout À. 

Donc avec les polynômes de Taylor P, calculés en a, nous avons P, — exp simplement sur KR. 

Nous pouvons donc développer la fonction exponentielle autour de n’importe quel point, et 
avoir convergence des polynômes vers l’exponentielle sur tout IR. Vous accepterez cependant que 
si a et x sont éloignés, la convergence P,(x) — exp(x) peut être extrêmement lente. A 


15.6.11 Autres propriétés et petits calculs 


Lemme 15.97. 
Si les suites (u,) et (vn) sont équivalentes ** et si (v,) admet une limite l différente de 1, alors les 
suites (Inu,) et (Inv,) sont équivalentes. 


Démonstration. En effet si u, = v,a(n) alors en utilisant la formule du lemme 15.85, 


nu») = In(vn) + In (a(n)) = In(v) (: + en : (15.304) 


et comme a(n) — 1, la parenthèse tend vers 1. 


15.6.12 Taylor pour le logarithme 


Vu que In(0) n’existe pas, il n’est pas question de développer In autour de x = 0. À la place, 
nous allons le développer autour de x = 1 et plus précisément nous allons étudier Taylor pour la 
fonction f(x) = In(1 + x). Les résultats seront résumés dans la proposition 15.100. 


PROPooWCUEooJudkCV 
Proposition 15.98 ([1]). 
Soit la fonction 
: [—-1,00[ — R 
f] (15.305) 
ze In(1+x). 
Pour tout n, il existe une fonction a: R — R telle que lims_,0 a(t) = 0 et 
nm (—1 k+1 
or, ni + a(x)x" (15.306) 


pour tout x dans le domaine de f. 
Notez la somme qui part de k = 1 et non k = 0. 


34. Définition 10.32. 
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Démonstration. Nous utilisons la formule de Taylor-Young (proposition 12.471). La première dé- 
rivée de f se calcule en utilisant le lemme 15.94 : 


1 


f(x) = l1+zx 


(15.307) 


Pour les dérivées suivantes, c’est juste du calcul et nous pouvons prouver par récurrence que 


F0 (x) = (k — DID EQOOKEAUOR GTI, JF 


(1+x)F 


En ce qui concerne l'évaluation en zéro : 


0 ik=0 
F0) - — 1)1(—1)5#1 . (5508) 


Du fait que f(0(0) = In(1) = 0, la somme commence à k = 1 et non k = 0. Nous avons 


LR 0) _ 
f(x) = à i Os + a(x)z" = di "+ a(æ)r". (15.310) 


Nous étudions les polynômes de la série de Taylor pour 


f:]-1,0[—R 


15.311 
ze In(1+x). ) 


Les dérivées successives de f ont déjà été calculées en (15.308). Nous développons autour de 
x = 0. Donc f(0) = In(1) = 0 et pour les autres, 


ft) (0) = (DATE =—1)f. (15.312) 


Pour les polynômes de Taylor, nous avons 


P(x) = % CT (15.313) 
k=1 


où vous noterez la somme qui part de 4 = 1 et non de k = 0. Nous avons aussi la série de Taylor 
de f donnée par 


re = À Car ERpOREM ETES 
k=1 


La somme est une limite ponctuelle, là où elle existe. 
Jusqu'à présent, la seule certitude à props de Test que T(0) = f(0) = 0. Pour le reste : 


— Rien ne dit que T(x) existe pour d’autres x que x = 1. 


— Et même si T(x) existait pour d’autres x (c’est-à-dire si le rayon de convergence de (15.314) 
était strictement plus grand que zéro), rien n’assurerait que la valeur serait celle de f. 


— Et même si T(x) convergeait vers f sur son disque de convergence, ce ne serait pas encore 
assez pour dire que f est analytique, parce que l’analycité demande que les séries de Taylor 
autour de chaque point converge vers f. Or ici nous ne parlons encore que de T' qui est la 


série autour de x = 0. 
LEMooWMGGooRpAxBa 


Lemme 15.99. 
La série de Taylor de x + In(1 + x) autour de x = 0 converge sur |—1,1]. Elle ne converge pas 
pour x = —I. 
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Démonstration. En ce qui concerne le rayon de convergence de T', nous utilisons la formule de 
Hadamard * avec 


= k+1 
Ak = > (15.315) 
Ce que nous trouvons est 
1 . ak+1 : k 
= | = | — |] ; 15.316 
R el | al ( 


Le rayon de convergence de T est donc 1. Nous avons donc que P, — T sur |—-1,1{, et peut-être 
que P, — T'en x = +1. 
Pour x = —1. L’intuition nous dit que ce serait In(0) qui n’est pas défini. C’est le cas parce que 


nf _J\k+1f_1\k n 
PA Dev L = Le He (15.317) 
k=1 k=1 


La limite n — oo diverge. Donc T' n’est pas définie en x = —1. 
Pour x = 1 par contre, 
nm (ire 
=) = (15.318) 
k=1 


36 


Le critère des séries alternées *”” nous donne la convergence de cette série. 


Nous savons maintenant que la série de Taylor T converge sur |—1,1], et que T(0) = f(0) = 
In(1) = 0. Le premier gros morceau intéressant vient maintenant : nous allons prouver que T(x) 


converge vers ce que nous croyons, c’est-à-dire In(1 + x) en personne. 
PROPooKPBIlooJaNsqx 


Proposition 15.100. 
Pour tout x € |-—1,1] nous avons 


m4) =» CUT x Faute) 


De plus nous avons 


> = = (2). “ES. 


Démonstration. Il s’agit d'utiliser l'expression du reste fourni par le théorème 12.458. Pour tout 
x € |-—1,00|, il existe un c € |0,x[ (le c dépend de x) tel que 


PC aa 


Paz) — f(x) = +1) (15.321) 
Cela est parce que f est de classe C'?. Calculons un peu : 
fte#1) c) 
P, (x) — f(x) = 7 re dé, (15.322a) 
_1}n! 
CPR (15.322b) 


(1 + ct (n +1)! 


=  ( = 1 (15.322c) 


n+1l \1+c 


Lorsque æ > 1, il n’y a aucune garantie sur la convergence de cela pour n — ©. Pour rappel, 
ce [0,x{. Si par contre x € |—1,1[, alors nous savons que 


| sr (15.323) 


< 
l+c 


35. Théorème 15.25. 
36. Théorème 11.127. 
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et donc convergence P,(x) — f(x) — 0. 
Jusqu'ici nous avons prouvé que pour la série de Taylor converge vers In(1+x) pour x € [-1,1[. 
Nous avons également vu que la série converge pour x = 1. Donc la fonction 
2 (TA 
gx) = D ——:" (15.324) 
k 
k=1 
est continue sur |—1,1] et égale à In(x + 1) sur |—1,1[. Vu que f: x In(x + 1) est continue sur 
]-1,0[, nous avons également g(1) = f(1) = In(2). 
Ceci nous mène au dernier point de notre proposition : g(1) = In(2) s'écrit précisément 
o0 k+1 
—1 
56) (15.325) 
eh À 


15.101. 
La formule (15.320) peut sembler très chouette pour trouver des approximations de In(2). Le 
problème est qu’elle ne donne aucune idée de l’erreur commise en tronquant la série. 

Vous pouvez, certes, écrire ceci : 


1 1 1 1 47 
nr (15.326) 
Hélas, ce calcul n’a aucune valeur pour affirmer que In(2) doit être proche de 0.78. Ni même pour 
affirmer que In(2) < 1. 

Avoir des valeurs numériques de In(2) (c’est-à-dire que « chiffres corrects devant ou derrière 
la virgule ») demande d’avoir un encadrement. Cela doit donc se faire avec des formules de séries 
avec reste ; les formules exactes qui demandent de sommer jusqu’à l’inifini sont inutiles pour avoir 
des approximations numériques. 

Dans le cas de In(2), une approximation numérique sera donnée à l’aide de Taylor avec reste 
intégrale dans la proposition 20.145. 


Lemme 15.102. 


Soit la fonction’ 
In(1 
Fi =) (15.327) 
à 
(1) Elle admet un prolongement de classe C® sur |-1,00. 


(2) f(0) = 1. 
La seconde condition étant évidemment avec un abus de notation entre f et son prolongement, 
parce que f n’est pas définie en zéro. 


Démonstration. La difficulté étant de voir que f a un prolongement en zéro et qu’elle y est de 
classe CT. 


La proposition 15.100 nous donne l'égalité 


o0 (Ter 
M(+z)= ÿ +R (15.328) 
k=1 
UBE RLQUooEZNFD 
pour tout x € |-1,1]; en particulier pour æ# = 0. Nous faisons le petit calcul suivant : / PAPERS 
1 1 o0 (=1)rr . 
=n(+x) == >» ——E (15.329a) 
00 
=] n+1 
> CUT yn-1 (15.329b) 
n=1l me 
00 
(1)? n 
— D _ x (15.329c) 


1 
[®) 


37. Pour la définition du logarithme, c’est la définition 15.81. 
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Ce calcul n’est pas valable pour x = 0, mais ça ne nous empèche pas de poser 


T(x) = 5 en (15.330) 


qui, lui, est bien définie en zéro. Le rayon de convergence de la série Test égal à 1, de telle sorte 
que 
T:]-11[—-R (15.331) 


de classe C®, et est égale à f sur [—1,1[\{0}. 
La série T est donc le prolongement demandé. En ce qui concerne f(0), c’est un abus pour 
écrire T'(0) qui vaut immédiatement 1. 


Notons qu’un calcul de limite 
(15.332) 
donnait la valeur f(0) = 1. Donc prolonger avec f(0) = 1 était la seule possibilité pour avoir une 


fonction continue. De là à dire que le prolongement ainsi créé est de classe C®, c’est une autre 
histoire, qui est résolue par les séries entières. 


15.6.13 Développements et calcul de limites 
Lors d’un calcul de limite, développer une partie d’une expression peut être utile. 


Exemple 15.103. 
À calculer : 


(15.333) 


8 


Cela est une indétermination de type 5. Le développement limité du numérateur nous donne 


une fonction a(x) telle que lim;_,0 a(x) = 0 et 


AE), A + r?a(x) 


x 
= | 15.334 
L L 1 5 + za(x) (15.334) 

Sur le membre de droite la limite est facile à calculer : 

. In(1+x) ; x 
Big TT à lim (1 =5+ za(x)) = (15.335) 
A 

15.6.14 Une petite intégrale 

EXooNI0OZooWxciAC 


Exemple 15.104. 
Soit V la région trapézoïdale de sommets (0,—1), (1,0), (2,0), (0, —2), comme à la figure 15.2(a). 
Calculons ensemble l’intégrale double 
Ï End. 
V 


avec le changement de variable *” #(x,y) = (x + y,x — y). C'est-à-dire que nous considérons les 
nouvelles variables 

à (15.336a) 
= T—Y. (15.336b) 


PRES 
è & 


38. Proposition 15.98. 
39. Théorème 14.290. 
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Il faut remarquer d’abord que le changement de variable proposé est dans le mauvais sens. On 
écrit alors g{u,v) = #l(u,v) = ((u + v)/2,(u — v)/2), c’est-à-dire 


— : É (15.337a) 
= ; … (15.337b) 


La région qui correspond à V est U, le trapèze de sommets (—1,1), (1,1), (2,2) et (—2,2), qu'on 
voit sur la figure 15.2(b) et qu’on décrit par 


U={{u,v)eR?|1<v<2, -v<u< vw}. 


À À 
NN 
—1 
—2 LabelFigZTTopXtHkpissLabelShbFig2lToiétiRFi@ZTToOXtHkcissLab 
(a) La région V (b) La région U = 6 !(V) 


FIGURE 15.2: Avant et après le changement de variable&abe1FigZTTooXtHkci 


Le déterminant de la matrice jacobienne de #7! est Ji; 


(15.338) 


1 
Jy-1(u,v) = | 5: 


DIENIR 
DIR 


On a alors, en utilisant le fait que F(x) = ae*/* est une primitive de f(x) = e*/* (proposition 


15.75) ainsi que le théorème fondamental de l’analyse (théorème 14.263), 


” u 2 pv ” 
Leave [ea [| die et). 
V u 2 1) 2 4 


A 


15.7 Vitesses des puissances, de l’exponentielle et du logarithme 


15.7.1 Un peu de théorie 


Voici une série de résultats qui lient les vitesses des polynômes, du logarithme et de l’exponen- 


tielle. 
LEMooNYFVooXjFShk 


Lemme 15.105. 
Si P est un polynôme et si a > 0, alors 


: — at _ 
Jim e Pis) =0 (15.339) 


Démonstration. Nous prouvons par récurrence que pour tout n, nous avons e7%2x" 3 (, D'abord 


nous écrivons . 


Ra De (15.340) 
et ensuite la règle de l’Hospital 12.198 nous donne 
1 
lim = lim = 0. (15.341) 
æ—00 eat æ—00 qeit 


40. En utilisant 12.408(3). 
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En ce qui concerne la récurrence, c’est encore la règle de l’Hospital : 


n n—1 
lim 2 = Jim 2 = 0. (15.342) 
æ—00 eat a t— eat 
PROPooKVIFooGdKpfP 

Proposition 15.106. 

Nous avons : ITEMooCDSQooSIctbz 
(1) Pour tout à > 0, il existe N tel que Im(n) < n° pour tout n > N. LTEMooZMAWoOoTHDNAd 
(2) Pour tout p > 0 et tout a > 0, il existe N tel que 

In(n)? < n° (15.343) 
pour tout n > N. ITEMooBLNOooZQNTfd 
(3) Pour tout n > 1 nous avons la limite 
lim z"*In(#) = 0. (15.344) 
æ—0+ 
ITEMooMLNMooAyJTox 
(4) Nous avons 
.  In(1—-x) 
lim = —1. (15.345) 
æ—0+ A 
ITEMooIQEKooBionsK 
(5) L’exponentielle croit plus vite que tout polynôme, et plus vite que logarithme : 
EqExpD tP i 
Jim "(Int)" = 0 SE at 
pour tout n et pour tout «. ITEMooDUQWooNvAvmR 


(6) Pour tout n > 0, nous avons la limite 


lim æ'el/? = oo. (15.347) 


aæ—0+ 


Le point (1) et sa généralisation (2) nous font dire que le logarithme croît moins vite que 
n'importe quel polynôme. 


Démonstration. En plusieurs parties. 


(1) Pour (1) En effet, nous avons, par la règle de l’Hospital (proposition 12.197), 


a ax"! 


, — ._ "s 

de In(x) ns 1/x nee (5e) 
quand « > 0. La dérivée du logarithme est dans la proposition 15.91. 

(2) Pour (2) Il faut prendre le N qui convient à l’item (1) pour n°”. Ainsi nous avons In(n) < 
n°? et donc In(n}? < n°. 


(3) Pour (3) Lorsque x # 0 nous avons 


_ In(x) 


= 15.349 
Ts (15.349) 


&"In(x) 


qui est un cas ©. Nous nous en remettons à la règle de l’Hospital 12.198. D'abord nous nous 
assurons de la limite des dérivées : 


= lim = 0. (15.350) 


æ—0+t nr NL  »0+ nn x 


La règle de l’Hospital conclut à l’existence de la limite demandée et à son égalité à 0. 
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(4) Pour (4) En effet, par la règle de l’Hospital 12.197, 


1 


Ron en LE; Fais SR0Y 


xæ—0 x x—0 1 æ—0 1 — x 


(5) Pour (5) Notons f(x) = e *2{(Inx)" et f(x) = e-*/?2x%, Le lemme 15.105 donne tout de 
suite lim, fa(x) = 0. 


En ce qui concerne f1, l’item (2) nous indique que nous avons 
fi(æ) = e%/2(Inx)" < e%/2% (15.352) 


dès que x est assez grand. Le lemme 15.105 nous dit alors que limz-,% f2(x) = 0. 
Enfin, nous avons 
6e ne) = fie)ole) (15.353) 
et donc la limite demandée. 
(6) Pour (6) Nous passons au logarithme : 
1  næln(x)+1 


In(z'el/?) = In(x°) +In(el/?) = nin(x) + — L : (15.354) 


Grâce à la limite déjà prouvée en (3), le numérateur tend vers 1 lorsque x — 0*. Donc le 
tout tend vers +00. Au final, 


lim z'el/ = lim en(e"e"?) 2 oo. (15.355) 
æ—0+ aæ—0+ 


EXo0oQNCJooFpnvnf 
Exemple 15.107. 
Le lemme 12.421 à déjà prouvé la limite 
lim n°a” (15.356) 
n—00 
pour tout a > Üet a < I. 
L'utilisation de propriétés de l’exponentielle nous permet de donner une nouvelle preuve, plus 
courte ‘|. 
Le théorème 15.89 et la proposition 15.84 nous permettent de passer à l’exponentielle. Pour 


chaque n nous avons : 
n'a? = € In(n)+nin(a) ÉaLKLqopET Ten 
Ce qui est dans l’exponentielle est 


in(n) 


œln(n) +nin(a) = n(a + In(a)). (15.358) 


Dans la parenthèse, In(a) < 0 et Inn) — 0. Donc ce qui est dans l’exponentielle (15.357) tend vers 
—® et au final l'expression demandée tend vers zéro. A 


Remarque 15.108. 
Vous ne pouvez pas à priori considérer l’exemple 15.107 comme une preuve alternative au lemme 
12.421, parce que vous n'êtes pas sûr que dans toute la théorie permettant de définir l’exponentielle 


(en particulier la convergence de Y}, x*/k!), le lemme n’est pas utilisé 42. 


41. C’est toujours facile de prétendre qu’une preuve est plus courte qu’une autre lorsqu'on utilise en une ligne des 
très gros théorèmes qui ont mis dix pages à être démontrés. 
42. Faites la vérification et dites moi si c'est bon. 
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Lemme 15.109. 
La fonction de Riemann 


(= » _ (15.359) 


n 


est de classe C© sur ]1,|. 


Démonstration. Afin de faire le coup du compact, nous étudions la convergence uniforme de la 
série sur tout compact de ]1,œ01[. Soit e > 0, et regardons ce qu’il se passe sur un compact dont le 
minimum + est 1+e. Dans ce cas, n° > n!l*°, et donc f(x) = L < —. Étant donné que la série 
numérique D; — converge, la fonction de Riemann converge uniformément par le critère de 
Weierstrass (théorème 12.382). Nous avons donc convergence uniforme de la série sur tout compact 
de |1,%{, ce qui fait que € est une fonction continue pour x > 1 par le théorème 12.380. 

Nous allons à présent utiliser le théorème 12.384 pour prouver que la fonction de Riemann est 
C1. Il faut donc prouver que la série des dérivées (n° *) = —In(n)n * converge uniformément sur 
tout compact de ]1,00|. 

Nous prenons encore une fois un compact X dont le minimum est 1+e. D'abord, nous majorons 
le logarithme par un x° : lorsque n est assez grand, nous avons 


fn <nn (15.360) 


la proposition 15.106(1) nous dit que pour tout a > 0, il existe un n à partir duquel cette inégalité 
est valide. Etant donné que 1 + e est le minimum du compact, nous pouvons encore majorer en 


remplaçant + par 1+€: 


, 1 
m(n)n << —— (15.361) 


 pitea 


. Je su . Je Le] 
Afin de pouvoir utiliser le critère de Weierstrass, nous devons nous assurer que la série ÿ,,_; — 


converge. Cela n’est vrai que si 1 + € — &« > 1, mais le choix de « étant encore arbitraire, nous 
choisissons 0 < a < €. 

Ainsi, la série des dérivées converge uniformément sur tout compact et nous en déduisons que 
cette série est bien la dérivée de la fonction de Riemann qui est C!. 

Afin de traiter les dérivées d’ordre supérieur, il faut calculer 


(n7#) = (—1)(In(n)}/n*, (15.362) 


et remarquer que lims-,0 æ°/(In(x))? = 00. Par conséquent y a encore moyen de remplacer le 
logarithme par un x°*. Le reste de la preuve est la même. 


Ici se termine la preuve de ce lemme. Nous restons cependant sur notre faim en ce qui concerne 
la convergence uniforme de la série sur l’ouvert |1,00|{. En effet, nous avons prouvé la convergence 
uniforme sur tout compact (et cela nous a suffit pour prouver le lemme), mais nous n’avons pas 
prouvé que la série n’était pas uniformément convergente sur |1,0| pour autant. 

Nous allons montrer qu’il n’y à pas uniforme convergence en prouvant que si x est assez proche 
de 1, alors la suite des sommes partielles de Ç(x) est aussi proche que l’on veut de la suite des 


sommes partielles de r L qui, elle, diverge. 


Lemme 15.110. 

Nous avons 
lim Ç(x) = (15.363) 
æ—1+t 


où la limite est une limite à droite : la limite à gauche n'existe pas. 


Démonstration. Soit M > 0. Prouvons que e tel que C(1 +e) > M. D'abord, choisissons un k tel 


que 
k 

> 

n=1 


43. Pour rappel, un compact dans R a toujours un minimum. 


> M, (15.364) 


3H 
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et choisissons un € tel que 
1 1 


Max 
ne{1,.….,k} 


Un tel choix de € est possible pour tout a. Maintenant, nous choisissons « de façon à avoir ka < 6. 
Avec ça, nous avons 
k 


k k 
l l l 1 
>; n » ni+e = > É x) < ka < 5. (15.366) 
n=1l 


n=1 n=1l 


En prenant © tel que M — >*_.(1/n) < &, nous trouvons ainsi un € tel que ue —— > M. Cela 
prouve le lemme. 


Armé de ce lemme, il est maintenant aisé de prouver que la série définissant la fonction 
de Riemann n’est pas uniformément convergente sur ]1,00[. Prenons la kième somme partielle 
sel) = Se (CR, Pour chaque k, cela est une fonction bornée de x (y compris en x = 1), donc 
SUPre]1,00[ Sk(æ) = My. Armé de cette majoration, nous faisons 


Isx— Co = sup (x) — sx(x)) > sup (C(x) — M4) = oo, (15.367) 


æe]1,00[ 


il n’y a donc pas moyen que la limite de |Ç — s4|x quand 4 — © soit nulle. Il n’y a donc pas 


uniforme convergence de € sur l’intervalle ]1, 0. 
PropBQGBooHxNrrf 


Proposition 15.111. 
Pour tout polynôme P et pour tout a > 0 la fonction f(x) = P(x)e-% est intégrable sur [0, of. 


Démonstration. Nous avons f(x) = P(r)e-%*/2e-4%/2 et par la vitesse comparée des exponentielles 


et polynômes , pour un certain M > 0 nous pouvons affirmer que P(x)e-%/ 2 < 1 sur [M,oof. 
Dès lors 
élire, (15.368) 
qui est intégrable. 
EXooAGEUooQdQkrs 


Exemple 15.112. 
La fonction logarithme (définition 15.81) n’est pas définie pour x < 0. Par conséquent la fonction 
f(x) = xln(|x|) n’est pas définie en x = 0. Elle est bien définie pour x < 0 et vérifie 


lim x n(lr|) = 0 (15.369) 
Nous pouvons donc définir la fonction 
FR—R 
xn(ix|) six £0 (15.370) 
ZT 
si x = 0. 


Contrairement à la fonction initiale f, cette fonction f est définie et continue en 0. 
Notez que sur le graphe de la fonction f, la courbe est bien régulière en x = 0. 


44. Définition 14.181. 
45. Voir 15.106 et 15.105. 
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VA 
DEFooFJZXoo!IVrzvk 


Définition 15.113. 

Soient deux suites (an) et (bn) dans R. Nous disons que 
(1) an — © plus vite que (b,) si limn — ca,/b} = 00. 
(2) an — © aussi vite que (b,) silimn — oa,/b, existe et est finie. 
(3) an — 0 plus vite que (b,) si limn — oa»/bn = 0. 


(4) an — 0 moins vite que (b,) silimn — oa,/by = ©. 


Exemple 15.114. 
Deux petits exemples. 
(1) Les suites a, = n? et b, = n tendent toutes deux vers 00, mais (a,) va plus vite parce que 
An/On = N — ©. 
(2) Les suites an — 1/n et b, = 1/n? tendent toutes deux vers 0, mais (a,) va moins vite parce 
que an/bn = n — ©. 
PA 


15.115. 
Je vous laisse cogiter sur l’énoncé suivant : si À est un ensemble de suites tendant toutes vers 0, 
alors il existe une suite qui converge vers © plus vite que tous les éléments de À. 
Lorsque À est dénombrable, à mon avis, il suffit de prendre x, = (maxi. m{al,2})?. 
Lorsque À n’est pas dénombrable, je ne suis pas sûr. Écrivez-moi si vous avez une idée. 


Lemme 15.116. 
Si an — ©, i existe une suite tendant vers © plus vite. 


Démonstration. Il suffit de prendre b, = a?. 


Lemme 15.117. 
La suite a, = n! tend vers © vite que l’exponentielle b, = e”. 


Démonstration. Nous devons étudier le comportement de n!/e” lorsque n est grand. Étant donné 
que e < 3 (lemme 15.79), nous avons 


nl 1xX2x3x47-8 5 [ANT 
A = 3 (5) (15.371) 


Et comme 4/3 > 1 nous avons bien n!/e" — co. 
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15.7.2 Nombres premiers 


Le théorème suivant dit que la somme des inverses des nombre premiers diverge. Cela est à 


comparer avec la proposition 11.123 qui dit que la somme des inverses des carrés converge. 
ThonfVruT 


Théorème 15.118. 


Soit P, l’ensemble des nombres premiers. Alors la somme Y; L'diverge et plus précisément, 


peP p 
1 
ÿ => In(In(x)) —In(2). (15.372) 
P<T 
peP 
Démonstration. Nous posons 
Sx = {q < x avec q sans facteurs carrés} (15.373) 
et 
= {pe P tel que p < x}. (15.374) 
Si 
Ky = {(q,m) tels que q n’a pas de facteurs carrés et gm°? < x}, (15.375) 


alors nous avons 
Kz=|(]J (] (@m) (15.376) 
QESx m<\/x/q 


Par définition et par le lemme 3.24 nous avons aussi 
{n < x} = {qm? tel que (q,m) € Ky}. (15.377) 


Tout cela pour décomposer la somme 


on. EG 


n<x IESx m< /x/ qESx dei 


Nous avons aussi 


1 1 1 1 
[i+i)-1+ 554 >» ES » ce (15.379a) 


PE P> PEPx P,4E Pr P,QTEP> 
p<q p<q<r 
l 1 1 
BA+ DEN + D —+... (15.379b) 
PEPx p P:4€ Pr pq p,greP. ii 
pq<x pqr<x 


Les sommes sont finies. Les sommes s'étendent sur toutes les façons de prendre des produits de 
nombres premiers distincts de telle sorte de conserver un produit plus petit que x; c’est-à-dire que 
les sommes se résument en une somme sur les éléments de $, : 


_ [> :) -TI(+3)> 34 Fanoilfs 


La première inégalité est simplement le fait que 1+u < e" si u > 0 (directe de la définition 15.89). 
Les inégalités suivantes proviennent du fait que le logarithme est une primitive de la fonction 


inverse (proposition 15.91) : 
n+1 dt 
DH D (15.381) 


n>x n>x 
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Nous prolongeons ces inégalités avec les inégalités (15.378) et (15.380) : 
In(x) < > = < C D : < C'exp | S .) : (15.382) 
n>x de qESx 9 


En passant au logarithme, 
In (In(x)) < In(C) + = (15.383) 


Ceci montre la divergence de la série de droite. Nous cherchons maintenant une borne pour C. 
Pour cela nous écrivons 


4 _ 1 
— < 1 15.384 
» a #2 n{n = 1) ( a) 
n=1l n=2 
À 1 1 
= ] — — 15.384b 
ji à (= — 1] à) 
1 
=1+1- + (15.384c) 
< 2. (15.384d) 


Donc C'< 2. 


Ce théorème prend une nouvelle force en considérant le théorème de Müntz 17.7 qui dit qu’alors 
l’ensemble Span{x? tel que p est premier} est dense dans les fonctions continues sur [0,1] muni de 
la norme uniforme ou ||.|2. 


15.7.3 Quelques limites 


Nous voyons à présent quelques calculs de limite et de développements mettant en scène des 


logarithmes et exponentielles. 
composel 


Exemple 15.119. 
Pour trouver le développement de la fonction f(x) = e ?*, il suffit d'écrire celui de et et de 
remplacer ensuite t par —2x. Le développement à l’ordre 3 de la fonction exponentielle est : 


di 
 =1+t+ D LÉ Bat). (15.385) 
Le développement de f(x) = e-?* sera donc 
dy bp 
f(œ) = 1 — 2x + ; " 8x#a(—2). (15.386) 


Donc le polynôme de degré 3 partie régulière de g est : 
4 
1 — 2x + 2x? — LE (15.387) 


et la fonction reste correspondante est : 


a(x) = —-8a(—2x). (15.388) 
A 
Exemple 15.120. 
Nous savons les développements 
+ 
fx) =mfi+x) -x-— + (15.389) 
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et 
x 
sin(x) + æ — ra (15.390) 


Nous obtenons le développement d'ordre 3 de la fonction x In (1 +sin(x)) en écrivant 


(1 +stnte)) (a 9) 2 (a e) +1 (e 2) EacxNom QE, 


2 6 3 6 


Il s’agit maintenant de trouver les termes qui sont de degré inférieur ou égal à 3. 


D'abord _ ’ | 
(2 =) = ae (15.392) 


2x 5 _ 
(: _ =) = a (x : =) n RS. (15.393) 


En replaçant tout ça dans (15.391) nous trouvons 


Nous avons alors aussi 


2 3 


In (L+ sin(a)) + & + — (15.394) 
Fa 
ExBCDookjljhjk 
Exemple 15.121. 
Calculer | 
lim eU?4/1 + 472 — 2x. FaREeo LEE 
x— 


Nous allons effectuer un développement asymptotique de la partie « difficile » de l’expression posant 


d’abord x = 1/h. Si f(x) = el/%4/1 — 4x2 alors 


g(R) = PH LS +4 = = (i + h+ha(h)) (2 + RB(R)). (15.396) 


La première parenthèse est le développement de e* et la seconde celui de Ÿh? + 4. Nous nous 
apprêtons à faire la limite x — 0 qui correspond à h — 0*, nous pouvons donc supposer que 
h > 0 et omettre la valeur absolue. En effectuant le produit et en regroupant tous les termes 
contenant h?, a(h) ou B(h) dans un seul terme hy(h), 


f(h) = (2 +2h + hy(h)) = +2 +y(h) = 2x +2 + y(1/x) (15.397) 


où 7 est une fonction vérifiant lims_,0 y(t) = 0. 
Nous sommes maintenant en mesure de calculer la limite (15.395) : 


lim eV/%V/1+ 22 —92x = lim (2x+2+(1/x) — 2x) = 2. (15.398) 
L— —_ 


15.8 Trigonométrie hyperbolique 


Définition 15.122. 
Les fonctions cosinus hyperbolique et sinus hyperbolique sont les fonctions définies sur R par 
les formules suivantes : 


cosh(x) — — (15.399a) 
sinh(x) = —_— (15.399b) 


Si vous ne vous rappelez plus la définition de e*, c’est 15.59. 
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PROPooUNHHoo!IksdoJ 
Proposition 15.123. 
Quelques propriétés algébriques des fonctions trigonométriques hyperboliques. 


(1) cosh(—x) = cosh(x) 
(2) sinh(—x) = —-sinh(x) 
(3) cosh?(x) — sinh?(x) = 1 


ITEMooSJBDooAiRg;j 
(4) cosh?(x) + sinh?(x) = cosh(2x) 
(5) cosh(x) cosh(y) + sinh(x) sinh(y) = cosh(x + y) ITEMoo0JRFooUCUaD1 
(6) cosh(x) cosh(y) — sinh(x) sinh(y) = cosh(x — y) 
(7) cosh(x) sinh(y) + sinh(x) cosh(y) = sinh(x + y) 
(x) ( 


(y) (x 
(8) cosh(x) sinh(y) — sinh(x) cosh(y) = — sinh(x — y). 


Démonstration. Si s’agit simplement de remplacer les définitions et d'utiliser les formules concer- 
nant les puissances, dont la formule (12.1117). 


PROPooAOOHooXvLfrZ 
Proposition 15.124. 
Quelques propriétés analytiques des fonctions trigonométriques hyperboliques. 


(1) cosh'(x) = sinh(x) 
(2) sinh’(x) = cosh(x). 
(3) cosh(x) = 1. 


ITEMooZNZLooNMQFWr 


Démonstration. Pour les dérivées, il s’agit d'utiliser la dérivation de l’exponentielle, laquelle est 
facile par le théorème 15.89(1). 

Pour (3), nous commençons par les x > 0. D'abord cosh(0) = 1. Ensuite cosh'(x) = sinh(x) — 
EE. Vu que æ > 0 nous avons e* > ee > (. Donc la dérivée de cosh est strictement positive 
sur |0,œ[. La fonction y est donc partout plus grande que cosh(0) = 1. 


Pour les x < 0, nous avons la fait que cosh est paire. 


PROPooQLNYoo!I!IOUdvm 
Proposition 15.125. 
La fonction sinh: R — R est bijective. 


Démonstration. En deux parties. 


(1) Injective Sisinh(a) = sinh(b), alors le théorème de Rolle 12.192 affirme qu'il existe c € ]a, b| 
tel que sinh’/(c) = 0. Mais la proposition 15.124 nous dit que sinh’(x) = cosh(c) > 1. Donc 
impossible. 


(2) Surjective Nous avons 


lim sinh(x) = —0 (15.400) 
et 
Jim sinh(x) = 00. (15.401) 


Soit y € R. Il existe m < 0 tel que sinh(m) < y et M > 0 tel que sinh(M) > y. Le théorème 
des valeurs intermédiaires 10.89 nous enseigne qu’il existe x € [m, M] tel que sinh(x) = y. 


PROPooWEHGooUBqSHY 
Proposition 15.126 (|[1]). 


UBEQSooBIYDooIBuduV 
Soient a,beR tels que a? — b? = 1. Il existe un unique (x,o) € R x {+1} tel ol us Nos 


a = ocosh(x) (15.402a) 
b = sinh(x). (15.402b) 
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Démonstration. Vu que le sinus hyperbolique est une bijection %, il existe un unique x € KR tel que 


sinh(x) = b. Maintenant un petit calcul : 
2x —2% _ 9 2x —2x 9 
a = 1 + sinh(x)? = 1+ = , Re ï ee cosh(x)?. (15.403) 


Vu que cosh(x)? = a?, il existe un unique o € {+1} tel que o cosh(x) = a. 


Les représentations graphiques sont ceci : 


PORTE ; 
2 
11. 
z 4 
= Snits) D AE _ be dem. 


La tangente hyperbolique est donnée par le quotient 


sinh(x) 
tanh(x) — | 15.404 
nn cosh(x) A 
15.9 Séries entières de matrices 
15.9.1 Différentiabilité 
PropAMBXKgV 
Proposition 15.127. 
Soit (an) une suite dans © de rayon de convergence R et la fonction 
f: Min, C) — Mi{n,C) 
00 15.405 
Ar ÿ ax AF ) 
k=0 


Alors 
(1) La différentielle de f sur B(0,R) est 


dfA(U 


ES 


ja DA AI AE, Fa a00) 


c’est-à-dire que l’on peut différentier terme à terme. (Ici c’est À qui est dans B(0, R)) 


46. Proposition 15.125. 
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(2) La convergence de la somme 15./06 est absolue. 
(3) La convergence de la somme 15./06 est normale sur tout compact. 
(4) La fonction f est de classe C* sur B(0, R), c'est-à-dire que la fonction À + dfA est continue. 


Notons que df1 n’est pas tout à fait une série entière. Cependant, en ce qui concerne les normes, 
c’est tout comme si ça l'était. 


Démonstration. Nous posons uy(A) = ay AF, qui est une fonction de classe C? et dont la différen- 
tielle est donnée par 


d d 
dux)A(U) = fu(4+t0)] = [(4a+tuy] 15.407 
(ux)a(U) = Eux(A +40)] = a [CA +0] (15.407) 
en distribuant le produit nous trouvons tout un tas de termes dont seuls ceux contenant exactement 
une fois {Ü ne vont pas s’annuler. Etant donné que U et À ne commutent pas nous avons l’expression 


un peu moche 
k—1 


(dur) A(U) = D ar AU ANT, (15.408) 
1=0 
En ce qui concerne la norme, nous regardons celle de (dux)A pour un À fixé; c’est-à-dire que nous 
en regardons la norme opérateur : 


k=1 k—1 
I(dux) AI = Lu UD a AU ANT] < D all ANAATE ET < klag[]AFL (15.409) 
1 1=0 1=0 


Pour donner la convergence nous considérons un nombre r tel que | A] < r < R, de telle sorte que 
la suite (a,r"”) soit bornée par un nombre M et que nous puissions écrire 


à _ H@llAÏË  Ælaul à [AIN LM, (IAIN* arcs 
dux)A| < kla||AÏ#-* = = ele se _ EN 
\(dux) al < Klael|A] er ) 


dont la série converge. Nous avons donc convergence absolue de la série 
00 
D (dur) À. (15.411) 
k=0 


Passons à la convergence normale sur tout compact. Nous nous fixons r < À et nous nous intéres- 
sons à la norme de dux sur B(0,r), c’est-à-dire 


Iduglo = sup |(dux)A|. (15.412) 
xeB(0,r) 


Vu que B(0,r) est compact, ce supremum est un maximum et nous pouvons noter Ax la matrice 
qui le réalise. Nous réalisons alors les mêmes manipulations que pour (15.410) : 


- pi 
Iduxlo = I(dux)a,l < Karl Alf < Ælarlré = = Elalr®. (15.413) 


Nous prenons maintenant r < ro < R et M, un majorant de (a,r$), de telle sorte qu’en multipliant 
et divisant par Fe 


klaglré r# _ kM : 
Idug|ho < ASE ue (=) (15.414) 
T T0 T ro 


dont la série converge. Nous avons donc convergence normale sur tout compact. Par voie de fait 
conséquences nous avons continuité de la série 


Le) 


D (dux) A (15.415) 


k=0 


et convergence vers dfA par le théorème 15.9. 


15.10. EXPONENTIELLE DE MATRICES 1395 


PropQIIURAh 
Proposition 15.128. 
Si le rayon de convergence de la série u(A) = Yo ax A* est R, alors 
(1) elle converge normalement sur tout compact de B(0, R) ; 
(2) la fonction u y est de classe CT. 
Démonstration. Nous posons 
ug: M(n,R) — M(n,R) 
(15.416) 


Ar ag AF 


qui est évidemment une fonction de classe C®°. Nous étudions la j° différentielle en m, pour k > j 
(dans une série, nous ne nous intéressons pas aux premiers termes). La j° différentielle appliquée 
à v1 appliquée à v, etc s'exprime de la façon suivante : 


s 6 (u(m + LU + + tv) : (15.417) 


j ji pre 
(Push loir Vi) du‘ dt, t;=0 


Dans le produit (m + tivi +---+ tju;)* , seuls les termes contenant exactement une fois chacun des 
t; ne s’annulera pas après avoir fait la dérivée et évalué en t; = 0. Combien de termes cela fait ? 
Parmi les # facteurs, il faut en placer j qui ne sont pas m (cela fait (5) possibilités), et puis il faut 
ordonner ces j termes, cela fait encore j! possibilités. Au final, 


s k\. _ — 
Ka) < leu ( tn À = au PGHralE + (15418) 
où P(k) = mn est un polynôme de degré j. 
Afin d'étudier la convergence normale sur tout compact de la série des du, nous considérons 


r < ro <_R et nous allons prouver la convergence normale sur B(0,r). Vu que c’est un compact, il 
existe une matrice my € B(0,r) telle que 


Id'uxlco = |(d'ux)ma | (15.419a) 
< Jax|P(k)Imx| "7 (15.419b) 
< Jax|P(k)r* 7 (15.419c) 
= leIP GE), x (15.419d) 

TJ 
k k 
AE, (2) (15.419e) 
rJ ro 
M r \ 
< PR (2 ao 
PU) (=) (15.419f) 


où M est un majorant de a,r6. Vu que r/ro < 1, la somme sur k converge et nous avons convergence 
normale sur tout compact de 


O0 Le) 
Ya A* = ÿ d(axA*) (15.420) 
k=0 k=0 


avec un peu d'abus de notation. 


15.10 Exponentielle de matrices 

PropKKdmnkD 
Proposition 15.129. 
Une matrice complexe est inversible si et seulement si elle est une exponentielle. 


Autrement dit : 
GL(n, ©) = eM(O), (15.421) 
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Démonstration. Nous avons déjà prouvé dans la proposition 15.70 que toutes les exponentielles 
étaient inversibles. Ici nous nous concentrons sur la réciproque. 
Soit À € GL(n, ©) ; nous allons donner une matrice B € Mn, ©) telle que À = exp(B). D'abord 
remarquons qu'il suffit de prouver le résultat eur une matrice par classe de similitude. En effet si 
; ; ; gqqACuGK 
A = exp(B) et si M est inversible alors 


exp(MBM" 1) = Y BEM) (15.422a) 
 K! 

=) SM BAM (15.422b) 
D HI 

= Mexp(B)M!. (15.422c) 


Donc MAM-! = exp(MBM!). Nous pouvons donc nous contenter de trouver un logarithme 
pour les blocs de Jordan. Nous supposons donc que À = (1 + N) avec N° = 0. En nous inspirant 
de (15.319), nous posons {7 


m—1l 
cd 


No (15.423) 
mm — 


#2 
D(t) D 
et nous allons prouver que eÜ) = 1 + N. Notons que N étant nilpotente, cette somme ainsi que 
toutes celles qui viennent sont finies. Il n’y a donc pas de problèmes de convergences dans cette 
preuve (si ce n’est les passages des équations (15.422)). 
Nous posons S(t) = e?{t) (la somme est finie), et nous avons 


S'(t) = D'(t)eP® (15.424) 


Afin d'obtenir une expression qui donne S”’ en termes de S, nous multiplions par (1 + 4N) en 
remarquant que (1 +{4N)D'(t) = N nous avons 


(1+4N)S"(t) = NS(t). (15.425) 


En dérivant à nouveau, 
A 
(L + EN)S"(t) = 0. A9 35%) 
La matrice (1 +{N) est inversible parce que son noyau est réduit à {0}. En effet si (1 +4N)x = 0, 
alors Nx — — 1x, ce qui est impossible parce que N est nilpotente. Ce que dit l'équation (15.426) 
est alors que S”(t) = 0. Si nous développons S(t) en puissances de { nous nous arrêtons au terme 
d'ordre 1 et nous avons 


S(t) = S(0) +45S"(0) = 1 +tD'(0) = 1+4N. (15.427) 


En t = 1 nous trouvons S(1) = 1 + N. La matrice D(1) donnée est donc bien un logarithme de 
1+N. 


15.10.1 Diagonalisabilité d’exponentielle 
PropCOMNooIErskN 


Proposition 15.130 ([112]). 
Si AE M(n,R) a un polynôme caractéristique scindé, alors À est diagonalisable si et seulement si 
eÀ est diagonalisable. 


Démonstration. Si À est diagonalisable, alors il existe une matrice inversible M telle que D — 
MTAM soit diagonale (c’est la définition 9.209). Dans ce cas nous avons aussi (M-!AM)* — 
MTAËM et donc MleÂM = eM"AM 2 D qui est diagonale. 

La partie difficile est donc le contraire. 


47. Le logarithme d’un nombre n’est pas encore définit à ce moment, mais cela ne nous empêche pas de poser une 
définition ici pour une application des réels vers les matrices. 
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(1) 


Qui est diagonalisable et comment ? Nous supposons que e4 est diagonalisable et nous 
écrivons la décomposition de Dunford (théorème 9.259) : 


A=S+N (15.428) 


où S est diagonalisable, N est nilpotente, [S, N] = 0. Nous avons besoin de prouver que 
N =0. 

Les matrices À est S commutent ; en passant au développement nous en déduisons que À et 
e$ commutent, puis encore en passant au développement que eÀ et e° commutent. Vu que 
S est diagonalisable, e° l’est et par hypothèse e4 est également diagonalisable. Donc e4 et 
eŸ sont simultanément diagonalisables par la proposition 9.216. 

Étant donné que À et S commutent, nous avons eV = eA—$ = e4e—$, et nous en déduisons 
que eN est diagonalisable vu que les deux facteurs e4 et e-% sont simultanément diagonali- 
sables. 


Unipotence 
Si r est le degré de nilpotence de N, nous avons 


N° NT EqmHiy 
N 
—I=N+— +... - 56 | 
e + 5 + + Ga ) 
Donc . 
IN? N'-1 
N k 
1) =IN+<— +... + —— 15.430 
Fm ( LÉ LE 5) 


où le membre de droite est un polynôme en N dont le terme de plus bas degré est de degré 
k. Donc (eV — 1) est nilpotente et eV est unipotente. 

Si M est la matrice qui diagonalise eV, alors la matrice diagonale MeV M est tout autant 
unipotente que eV elle-même. En effet, 


(M-IeNM - 1)" = 5 () (1) M ("M (15.431a) 
k=0 
= M! o (jar ser] M (15.431b) 
k=0 
= Mt(eN _ 1) M (15.431c) 
= 0 (15.431d) 


La matrice Me" M est donc une matrice diagonale et unipotente ; donc Me M = 1, ce 
qui donne immédiatement que eN = 1. 


Polynômes annulateurs 


En reprenant le développement (15.429) sachant que eŸ = 1, nous savons que 
IN? N'-1 
N+— +... = (. 15.432 
EAN (ee, 
Dit en termes pompeux (mais non moins porteurs de sens), le polynôme 
X? XT—1 
QX)=X+—+...+ (15.433) 
2 (r —1)! 


est un polynôme annulateur de N. 

La proposition 9.99 stipule que le polynôme minimal d’un endomorphisme divise tous les 
polynômes annulateurs. Dans notre cas, X7 est un polynôme annulateur et donc le polynôme 
minimal de N est de la forme XF. Donc il est X” lui-même. 

Nous avons donc X”" | Q. Mais Q est un polynôme contenant le monôme X donc X” ne 
peut diviser Q que si r = 1. Nous en concluons que X est un polynôme annulateur de N. 
C'est-à-dire que N = 0. 
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(4) Conclusion 
Vu que Dunford ® dit que À = S + N et que nous venons de prouver que N = 0, nous 
concluons que À = $ avec S diagonalisable. 


15.11 Étude d’asymptote 


Lorsqu'une fonction tend vers l'infini pour x — ©, une question qui peut venir est : à quelle 
vitesse tend-t-elle vers l’infini ? 
Il est « visible » que la fonction logarithme ne tend pas très vite vers l’infini : certes 


Jim In(x) = +00, (15.434) 


100000 © 10442, Sans contestations possibles, 


mais par exemple In(100000) + 11.5 tandis que e 
l’exponentielle croit plus vite que le logarithme. 


Soient f et g deux fonctions dont la limite x — 00 est 00. Si 


AP (15.435) 
2 g(x) 
nous disons que g tend vers © plus vite que f ; si 


in Jeu (15.436) 
0 g(x) 
nous disons que f tend vers © plus vite que g, et si 


m f@) =a€eR (15.437) 


10 g(x) 


avec a £ 0 alors nous disons que f tend vers l’infini à la même vitesse que ag(x). 


Exemple 15.131. 
La fonction x ++ x? tend vers l'infini plus vite que la fonction x + /x. A 


Dans cette section nous allons nous contenter de déterminer les fonctions qui tendent vers l’infini 
aussi vite qu'une droite oblique, que nous appellons asymptote et que nous voulons déterminer. 


Exemple 15.132. 
Déterminer les asymptotes obliques (s'ils existent) de la fonction 


f(x) = el/74/1 + 472. (15.438) 


Tout d’abord nous remarquons que lim;_,% f(x) = 0. Nous sommes donc en présence d’une 
branche du graphe qui tend vers l'infini. Ensuite, 


1 
LEE ee er] +422. (15.439) 
Z— 0 TT T—00 HA 


Donc le graphe de f tend vers l’infini à la même vitesse que le graphe de la fonction y = 2x. Nous 
aurons donc une asymptote oblique de coefficient directeur 2. De façon imagée, nous pouvons 
penser que le graphe de f et celui de y = 2x sont presque parallèles si x est assez grand. Afin de 
déterminer l’ordonnée à l’origine de l’asymptote, il nous reste à voir quelle est la « distance » entre 
le graphe de f et celui de y = 2x : 
lim f(æ) — 2x = lim el/°4/1 +47? — 2x. (15.440) 
Æ— T— 
Cette limite a été calculée dans l’exemple 15.121 et vaut 2. 
Nous concluons que le graphe de la fonction f admet l’asymptote 


y = 2x + 2. (15.441) 
A 


48. Théorème 9.259. 
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15.12 Développement en série 


15.12.1 Série génératrice d’une suite 


Soit u, une suite telle que le rayon de convergence de 
00 
=) dt (15.442) 


soit strictement positif. Alors la série f est la série génératrice de la suite (u,). 
Grâce au théorème 15.44 nous pouvons la dériver terme à terme autour de z = 0. En utilisant 
la petite formule (15.140) nous trouvons 


100 = Du art BY 


et donc 


(15.444) 


D'où le nom de série génératrice. Cela est évidemment intéressant seulement si nous connaissons 
une autre forme pour f par ailleurs. 

Nous en utiliserons une pour déterminer les partitions d’un nombre en parts fixes, proposi- 
tion 26.99. 


15.12.2 Développement en série et Taylor 
DefwmRzKh 


Définition 15.133. 
Soit une fonction f: © — © et 20 € C. Nous disons que f est développable en série entière 
dans un voisinage de 2 si il existe une série Ÿ,,, anz" de rayon de convergence R > 0 etr < R tel 


que 
ve) 


An(z — 20)” (15.445) 


n=0 
pour tout z € B(z0,r). 
Proposition 15.134. 


Si V est un ouvert dans © alors l’ensemble des fonctions V — © développables en série entière 
forme une C-algèbre. 


Démonstration. Les séries entières passent aux sommes et aux produits en gardant des rayons de 
convergence non nuls. 


ThoTGPtDj 
Proposition 15.135. 
Si f est développable en série entière à l’origine alors elle est C° sur un voisinage de l’origine et 
le développement est celui de Taylor : 


0 f(n) 
e=), FO) (15.446) 


pour tout x dans un voisinage de 0. 


Démonstration. Si f(x) = Da,x", nous savons que f est C! et que nous pouvons dériver terme 
à terme (au moins dans un voisinage). De plus le fait de dériver ne change pas le domaine. Par 
récurrence, la fonction est C'? sur le voisinage. En dérivant k fois la série ÿa,x” nous trouvons 


(we) 
= Donfn-1)...(n—k+ljart À. (15.447) 
n=k 
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En calculant en x = 0 nous trouvons 


f%) (0) = klar, (15.448) 
d’où le terme général 

(k) 
ce) (15.449) 

k! 

Si f est une fonction et si la série 
00 
Pe) 

Ty(x) = à TT (15.450) 


converge, alors cette série est la série de Taylor de f. 


Remarque 15.136. 
La série de Taylor d’une fonction n’est pas liée à sa fonction de façon aussi raide qu’on pourrait le 
croire. Même dans le cas d’une fonction C® il peut arriver que T}(x) Æ f(x). 

Il peut aussi arriver que f ne soit pas développable en série entière. 


Exemple 15.137. 
Nous considérons la fonction : 
el $ixz0 


J(æ) = ren (15.451) 


Nous avons 


2 ,—1/x? 5 0 
fo) = 1% he (15.452) 
0 si æ = (. 


Note : pour la seconde ligne nous devons faire explicitement le calcul 


FO — FO) LL Le 0 
LA 


— lim -e 
t—0 t 


f'(0) = lim 


lim (15.453) 


Plus généralement nous avons f ()(0) = (0, et par conséquent la série de Taylor converge (triviale- 
ment) vers la fonction identiquement nulle. 
Cette fonction n’est donc pas développable en série entière vu qu'il n'existe aucun voisinage de 


zéro sur lequel la série de f coïncide avec f. A 
ExwobBAlW 


Exemple 15.138. 
Développement de f(x) = arctan(x). Nous savons que 


. 1 
_ 1+x2? 


f(x) (15.454) 


alors que nous connaissons le développement 


Lun Fatara 


1 
= y)? 15.4 
ee 2 x) (15.456a) 
1 2 
— ae 15.4 
mer x 1)"x (15.456b) 
2 a2n+1 
arctan(x) = » (—1) et +C. (15.456c) 
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Notons que dans la dernière nous avons évité d’écrire la somme depuis n = 0 (qui serait un terme 
constant) et nous avons écris explicitement « +C' ». Etant donné que arctan(0) = 0, nous devons 


poser C = 0 et donc 
g2r+l 


arctan(x) = > 7 


el 


, 15.4 
2n +1 (ES st) 


A 


15.12.3 Resommer une série 


Nous avons vu comment trouver la série correspondant à une fonction donnée. Un exercice 
difficile consiste à trouver la fonction qui correspond à une somme donnée. 


15.12.3.1 Les sommes du type »,, P(n)x" 
Pour calculer 
D PET (15.458) 
où P est un polynôme de degré m nous commençons par écrire 
P(n) = ao + œfn +1) +ao(n+1)(n+2)+..-+am(n+1)...(n+m). (15.459) 


Nous décomposons alors la somme en m sommes de la forme 


(k) 
O0 l O0 
D a+ En = x D se) . (15.460) 
n=0 EL n=0 


Effectuons par exemple 


= Î 
Ve e lg (15.461) 


Notons que dans un usage pratique, ce terme devra être ensuite dérivé trois fois, de telle manière 
que les termes « correctifs » n’interviennent pas. Cette méthode ne demande donc que de calculer 
les dérivées successives de 1/(1 — x). 


Exemple 15.139. 
Calculons la fonction 


00 
fe)e Ya (15.462) 
n=0 
D'abord nous écrivons 
n° = —1+7(n +1) — 6(n + 1)(n + 2) + (n + 1)(n + 2)(n +3). (15.463) 


Nous avons 


D(n+1)r" = D s) . (= 1) - nr. (15.464) 
n=0 


n=0 


De la même façon, 


Sn + 1)(n + 2)a" = Œ ci = ren: (15.465a) 


L x —1)$ 
6 
n 
2 1)(n + 2)(n + 3)x" = co (15.465b) 
En remettant tout ensemble nous obtenons 

(0e) 

1 7 12 6 
3,,n 

Joe + + + . (15.466) 
= 12 13 Y 

= 1—x (x—1) (x — 1) (x — 1) 


Nous pouvons vérifier ce résultat en traçant les deux courbes et en remarquant qu’elles coïn- 
cident. 
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| Sage Version 4.7.1, Release Date: 2011-08-11 
| Type notebook() for the GUI, and license() for information. 


sage: n=var(’n’) 


sage: S(x)=sum( [ n*x3*xx**n for n in range(0,30) ]  ) 

sage: f(x)=-1/(1-x)+7/((x-1)#x2)+12/((x-1)*xx3)+6/( Cx-1)%x*x4  ) 
sage: S(0.1) 

0.214906264288980 

sage: f(0.1) 


0.214906264288981 
sage: f.plot(-0.5,0.5)+S.plot(-0.5,0.5) 


15.12.3.2 Les sommes du type > ,x"/P(n) 


Si P(n) a des racines entières, nous pouvons le décomposer en fractions simples et utiliser la 
somme 


Le) 
D . = —n(l- x). (15.467) 


n=l 


Nous avons par exemple 


o n n+1l 
1 
5 —- : (15.468a) 
dn+1 xAn+I 
n=0 n=0 
LE m(1— x) 
= = | 15.468b 
- = - (15.468b) 
n=1 
Notez le changement de point de départ de la somme au passage. 
Autre exemple : 
00 nm 00 n 2 
x 1 x x 
_ 15.469 
> n+3 à o D tp | ic 
n=0 n=1 
Infx—1) 1 1 
: 15.469b 
2e 2 2% 
Si le polynôme possède des racines non entières, les choses se compliquent. 
Exemple 15.140. 
Calculons 
ce x" 
. 15.4 
> 2n +1 0) 
n=0 
Si x > 0, en posant { = 4/x nous trouvons 
00 n 90 2n+1 
T 1 t 
= ! 15.471 
> 2n +1 t > 2n +1 
n=0 n=0 
Étudions 
2 La 
H(t) = ——. 15.472 
Œ => 2n +1 


Nous avons 


H'(#) = ÿ ADN EE Fapnrien 
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Une primitive de cette fonction est 


1, |t+1 
=In|—|. 15.474 
5 nf = : ) 
En t = 0, cette fonction vaut 0 qui est la bonne valeur. Donc nous avons bien 
1, |t+1 
H(t) = =In}—|. 15.475 
= ju (15.475) 


Notons que ce que l'équation (15.473) nous dit est que H(t) est une primitive de 1/(1 —#?). Il 
faut choisir la bonne primitive en fixant une valeur. 
Nous avons donc 


oc a 
1 1 
D M RE (15.476) 
nl 7 2x Vz—1 
pour æ > 0. Nous devons encore trouver ce que cela vaut pour x < 0. 
Nous posons successivement X = —x puis g(X) = f(—X). Ce que nous devons calculer est 
o0 dre 
| 15.477 
DS 2n +1 
Fi 


Si nous posons 


h(t = Y ee (15.478) 
alors 
HG = Der = SPP =: = _. (15.479) 


par conséquent h(t) = arctan(t) (cela avait déjà été déduit à l’envers dans l’exemple 15.138). 
Au final 


5 = es 


00 n 2x Va-—1 : 
. a — { arctan(V—x) : E 
D en si æ < 0 (res) 
n=0 . 
1 si x = 0. 
Notons qu'elle est continue en zéro à gauche et à droite. 
A 
Exemple 15.141. 
Nous considérons l’exemple suivant : 
(0e) x" 
= ; 15.481 
= (15.481) 
n=0 
Nous posons { = Ÿ/x, et nous substituons 
n tn 1 t3n+2 
__— _ | (15.482) 
3n+2 3n+2 t23n+2 
Nous devons étudier la fonction 
00 Hn+2 
t) = 15.483 
W=Y (15.483) 
n=0 
Nous avons 
HO EE à fr = — — (15.484) 


n=0 


Notons que g(0) = 0. A 
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Exemple 15.142. 
Calculer le nombre 


Le] 

eu Eat 

: 485) 
> 2n +1 2 ) 
n=0 

Nous aurions envie de dire que cela est f(—1) pour la fonction f donnée en (15.480). Le problème 

est que le rayon de convergence de f étant 1, rien n’est garanti quand au fait que la fonction y soit 

continue en æ = —1. En particulier nous devons justifier le fait que 


x” 1 


no D im. — arctan(4—x). (15.486) 


Ce qui nous sauve est le critère d’Abel radial (théorème 15.40). En effet la série 


> a FA 


2n +1 


étant convergente avec r = —1, la série correspondante est continue sur [—1,0]. Nous pouvons 
donc calculer la série (15.485) en posant x = —1 dans (15.480) : 


Le] 
(C1 * 
= 15.488 
> 2n+1 4 
n=0 
Note : la série (15.487) ne converge pas avec r = 1. La fonction f n’est pas continue en 
m—=T, A 
ExGxzL1P 
Exemple 15.143. 
Nous avons 
= l 
Dong = —_—. (15.489) 
LTN2 
= (1 — x) 
En effet si nous désignons par f la somme à gauche, nous trouvons que f = g/' avec 
(0e) 
g(x) = > Fe (15.490) 


15.12.3.3 Sage, primitives et logarithme complexe 
oo0PWYooDDSZWx 


15.144. 
Attention : Sage pourrait nous induire en erreur si nous n’y prenions pas garde. En effet ce que 
vous ne savez pas mais que Sage sait, c’est que 


In(—1) = ir. (15.492) 
Par conséquent Sage se permet de donner des primitives sans valeurs absolues dans le logarithme : 
sage: f(x)=1/x 


sage: f.integrate(x) 
x |--> log(x) 
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La primitive à laquelle on s'attend d’habitude est In({x|). Ici la réponse est correcte parce que si x 
est négatif nous avons 


n(x) = In ((—-1)|x|) = In(—1) +n(|x|). (15.493) 


Cette fonction est donc décalée de la primitive usuelle seulement de la constante In(—1). 
Un exemple plus élaboré : 


sage: h(x)=1/(1-xxx2) 

sage: H=h.integrate(x) 

sage: H 

x |--> -1/2*log(x - 1) + 1/2*xlog(x + 1) 
sage: H(0O) 

-1/2*Ixpi 


Exemple 15.145. 
Encore une fois il faut faire attention en demandant la primitive à Sage : 


| Sage Version 4.7.1, Release Date: 2011-08-11 | 
| Type notebook() for the GUI, and license() for information. | 
sage: f(x)=x/(1-xx+3) 

sage: F=-f.integrate(x) 

sage: F(0) 

-1/3*xIxpi - 1/3*xsqrt(3)*arctan(1/3*sqrt(3)) 


Cette fois la primitive proposée diffère de celle qu’on cherche de la constante complexe 


ae (15.494) 
3 
Mais il y à pire si nous voulons tracer. Nous voudrions définir la fonction F2(x) = F(x) — F(0). 


Mathématiquement c’est bien de cette fonction que nous parlons, mais : 


sage: F2(x)=F(x)-F(0) 
sage: F2(x) 
1/3*Ixpi - 1/3*sqrt(3)*arctan(1/3*x(2%xx + 1)*sqrt(3)) + 
+1/3*xsqrt(3)*xarctan(1/3*xsqrt(3)) - 1/3xlog(x - 1) + 1/6*1og(x72 + x + 1) 

sage: F2.plot(x,-0.1,0.1) 
verbose O0 (4101: plot.py, generate_plot_points) 

WARNING: When plotting, failed to evaluate function at 200 points. 
verbose O0 (4101: plot.py, generate_plot_points) 

Last error message: ’unable to simplify to float approximation? 


Il refuse de tracer. Pourquoi? La partie complexe de l’expression de F> est mathématiquement 
nulle, mais elle est en deux parties : 


1 
3 + la partie imaginaire de — 3 In(x — 1). (15.495) 


Lorsque Sage tente de tracer, il donne à x un certain nombre de valeurs et calcule une valeur 
approchée de In(x — 1). Cette dernière ne se simplifie pas avec le nombre exact m/3. Sage reste donc 
avec une partie imaginaire qu’il ne peut pas tracer. 

Notez la nuance : 


sage: In(-0.1) 

-2.30258509299405 + 3.14159265358979*I 
sage: ln(-1/10) 

Ixpi + log(1/10) 
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Du coup nous avons aussi 


sage: F2(-0.1) 
1/3*xIxpi - 1/3*xsqrt(3)*xarctan(0.266666666666667*xsqrt(3)) 
+ 1/3*sqrt(3)*xarctan(1/3*xsqrt(3)) - 0.0474885065133152 - 1.04719755119660%I 


A 


15.12.3.4 Nombres de Bell 


Ici nous montrerions bien le théorème 15.166 sur les nombres de Bell parce que c’est essentiel- 
lement un résultat sur les séries entières et leurs manipulations. Hélas, il demande un tout petit 
peu d’équation différentielle (presque rien). Donc il est postposé jusqu’en page 1419. 


15.13 Séries entières de matrices 


secEVnZXgf 
Nous nous proposons d'étudier des séries de la forme 
00 
>, ax AF (15.496) 
k=0 


où À est une matrice. L'essentiel de la théorie va rester. Nous considérons une norme algébrique 
(définition 11.56), c’est-à-dire | AB| < |A||B|. 


15.13.1 Rayon de convergence 


La notion de rayon de convergence de cette série reste la même : c’est la définition 15.12 qui ne 
dépend que des coefficients az; et pas du tout de ce qu’on met à côté dans la somme. Evidemment 


il faudra montrer que dans le cas des matrices, le nom « rayon de convergence » n’est pas usurpé. 
PropFIPooSSmJDQ 


Proposition 15.146. 
Soit (an) une suite dans € de rayon de convergence R et A € M{n,R) une matrice vérifiant 
|AÏ < _R. Alors la série 


00 
>, 44” (15.497) 
k=0 


converge absolument, c’est-à-dire que 3 |ax AF| < 00. 
Démonstration. Nous avons les majorations 
lan A1 < Jan/]A"] < lan [ANT (15.498) 


Par hypothèse |A| < R et R est un supremum, donc il existe r tel que |A] < r < R avec (anr”) 
borné. Nommons M un majorant de la suite (a,r”). Alors nous avons 


Tr 


AJ" A|\* 
lan A] < lat < M (A1) (15.499) 


La série du membre de droite converge parce que c’est une série géométrique de raison plus petite 
que 1, proposition 11.122. 


15.13.2 Convergence et rayon spectral 


Le concept de rayon spectral permet aussi de donner des informations sur la convergence de 
séries de matrices. Pour rappel le rayon spectral d’une matrice est le maximum du module de ses 
valeurs propres (définition 11.57). Le rayon spectral de la matrice À est noté p(A). 

La proposition suivante sera redémontrée indépendamment dans le théorème 15.148. 
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PROPooDJFLooBqgEPT 
Proposition 15.147 ([112]). 
Si AE M(n,C) est telle que p(A) < 1, alors A" — 0. 


Démonstration. Nous nous plaçons dans une base des espaces caractéristiques ” de À, c’est-à-dire 
que nous supposons que la matrice À a la forme 


XMi+N 
1 ... FarE"880) 


\Al+N, 


où les À; sont les valeurs propres de À et les N,; sont nilpotentes. En effet nous savons que l’espace 
caractéristique F\, est l’espace de nilpolence de À — À;1. Si nous notons À; la restriction de A à 
cet espace, la matrice N,; = À; — À;1 est nilpotente. Du coup À; = Àyi + N; et nous avons bien la 
décomposition (15.500). 

Nous avons donc 4” — 0 si et seulement si (N;+À;1)" — 0 pour tout 4. Soit donc N nilpotente 
et À < 1 (parce que nous savons que toutes les valeurs propres de À sont inférieures à un). Nous 


avons 
n r—1 
Q1+Ny = Y () AUENÉ = VS () AMENE, (15.501) 
k=0 k=0 


Nous voyons que le nombre de termes dans la somme ne dépend pas de n. De plus pour chacun de 
termes, la puissance de N ne dépend pas non plus de n. Le terme 


() AK € PR) (15.502) 


où P est un polynôme tend vers zéro lorsque n devient grand parce que c’est un cas polynôme fois 
exponentielle. 


THO0oOMNLGooKETwhh 
Théorème 15.148 (Thème 40[381]). 
Soit À € M(n,K) (K = R ou C). Les affirmations suivantes sont équivalentes cer soozsMxSt 


: ki = 
(1) limx_,0 A° = 0 ITEMooYBGEo0XAZVbD 


(2) p(A) <1 ITEMooEJSQooTqkBbo 
(3) Yo A* converge. 

Dans le cas où ces conditions sont vérifiées, nous avons aussi 
— 1 — À est inversible, 


2 0 A = (1-4)! 


Démonstration. Nous supposons qu’une norme est donnée sur K” et nous considérons sur M(n, K) 
la topologie associée à la norme subordonnée °°. Nous subdivisons la preuves en différentes impli- 
cations. 


(1) (1) implique (2) Sip(A) > 1, en combinant la proposition 12.114 avec la proposition 12.116, 
nous avons 


14" > (e(4))" > 1 (15.503) 


Mais la limite A . 0 signifie la limite || 4'| 0. Le fait que tous les éléments de la 


suite soient plus grand que 1 empêche cette limite. 


49. Voir le théorème 9.257 
50. Si on parle de convergence d’une suite, c’est qu’il y a une topologie quelque part. 
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(2) (2) implique (1) 
Vu que p(A) < 1, il existe € > 0 tel que p(A)+e < 1. Par le lemme 12.115 il existe une norme 
N sur Mn, K) telle que N(A) < p(A) + € < 1. Notons que cette norme N dépend de À et 
de €. 


Avec cette norme nous avons 


N(AË) < N(Aÿ E, 0. (15.504) 


Cela signifie que A* 20 L'équivalence entre toutes les normes sur M{(n, K) donne alors la 


convergence A HU, 0. 
Pour une preuve alternative de cette implication, voir la proposition 15.147. 

(3) (3) implique (1) 
La convergence d’une série implique que la norme du terme général converge vers zéro par 
la proposition 11.89. Nous avons donc | A| — 0, ce qui signifie AF — 0, et donc p(A) < 1 
parce que (1) implique (2). 


(4) p(A) < 1 implique 1 — À est inversible 


Si u est une valeur propre de 1 — À alors 
det ((1 — À) — u1) = det (A — (1-y)1), (15.505) 


donc 1 — y est une valeur propre de À. Donc les valeurs propres de 1 — À sont les nombres 
1 — À; où les À$ sont les valeurs propres de À. Par hypothèse, nous avons À; < 1 pour tout à, 
donc les valeurs propres de 1 — À sont toutes non nulles. Donc 1 — À est inversible (pas de 
noyau). 


(5) Le reste Nous montrons à présent que si p(A) < 1 alors 3 4 A converge vers 1 — A. 
Pour cela nous savons déjà que 1 — À est inversible. Nous posons 


Bis=ltAd.… +4 (15.506) 
ce qui donne immédiatement AB» = À + 4? +...+ A"+1, Nous avons donc 
= = be Are (15.507) 


Nous savons que lim»_,0 À = 0, donc 


Le] 
(1— A) ÿ Af = lim (1— 4)B4 = lim (1 — 4**1) = 1. (15.508) 
LD k—00 


k—00 


Notez au passage que nous avons permuté la somme avec le produit matriciel (voir 11.5.2). 


15.13.3 Exponentielle et logarithme de matrice 
subsecXNcaQfZz 


La définition de l’exponentielle dans le cas des matrices est celle sur les algèbres normées non 
commutatives, 15.65. 


PropXFf0i0Ob 
Proposition 15.149. 
L'application 
exp: M(n,R) — M(n,R) 
20 k 
1 . (15.509) 
k=0 


est une application de classe C®. Sa différentielle en zéro est l’identité : (dexp)o = Id. 
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Démonstration. En ce qui concerne la continuité, nous savons que le rayon de convergence de la 
suite _ est infini ; la proposition 15.128 conclut. 
Pour la différentielle, c’est la proposition 15.127 qui nous permet d'écrire 


d LS en : y kt°-IUR 


+ l | 
t=0 dt — k!l = = k! 


dexpo(U) = [ep(v))] =Ùt (15.510) 


parce que seul le terme k = 1 n’est pas nul. 


Nous avons vu par la proposition 15.129 que toute matrice complexe inversible a un logarithme. 
Nous allons maintenant parler de logarithme de matrices réelles avec une condition sur la norme. 
La formule ci-dessous montre explicitement que le logarithme est réel. 


mn: {A e Mn, R) tel que |A — 1] < 1} — M(n,R) 


a (4 1e" (15.511) 


Ar 3 1)F 
Er k+1 


LemQZIQxaB 
Lemme 15.150. 
Si |m| < 1 dans M(n,R), alors nous posons 


am = Paye ee 


—i . +1 
Cette fonction a les propriétés suivantes. 
(1) Elle est de classe C?. 
(2) Elle est un bon logarithme au sens où 
em(+m) L 1 + m. (15.513) 
(3) Elle vérifie l’approximation 
In(1 + m) = m + a(m) (15.514) 
où o a la propriété que 
lim # (=) = (15.515) 
Jim ko (=) = 0. . 
Démonstration. Le rayon de convergence de la suite ax = ee ie est 1. Donc l’application donnée 


est C® sur B(0,1) par le théorème 15.128. 
D’après la formule (15.512) nous avons 


ÿ mit 
o(m) = ) (—-1) (15.516) 
_ [+1 
Nous avons alors 
00 | mi+1 
= ÿ (—1) PQ D (15.517) 
et donc 
Im[+1 en (mit k-300 
< 15.518 
le 1 < D ET < D : on 


Cela prouve la dernière assertion. 
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Proposition 15.151. 
Soit V un espace vectoriel de dimension finie et A € End(V). Nous considérons la fonction 


: R — End(V 
Î Fr. M) (15.519) 
Cette fonction vérifie 
FO) AE, (15.520) 


Démonstration. Si nous posons fr(t) = ne alors la fonction f est la somme : f — sr Jr. Nous 
allons permuter la somme et la dérivation à l’aide du théorème 15.9. Vu que 


ktk—1 A* 
POS (15.521) 


la suite des dérivées converge normalement sur R, nous pouvons dériver terme à terme pour obtenir 


20 A* / 20 : AF 20 Û AF 
Dr Le De 


k=0 


= AetÀ, (15.522) 


Notez le jeu au niveau du point départ de la somme : elle passe de 0 à 1 parce que le terme zéro 
est nul, mais la simplification È = ŒD n’a pas de sens pour k = 0. 


LemQEARooLRXEef 
Lemme 15.152 ([170]). 
Soit À € End(V) où V est un espace vectoriel réel de dimension finie. Si nous notons X; (i = 


1,...,r) les valeurs propres distinctes de A alors il existe un polynôme P € R[X| tel que 
T 
let] < P(f) 3 ere), (15.523) 
i=1 


Démonstration. Le polynôme caractéristique de À se note, d’après le corolaire 12.110 de la façon 


suivante : ; 


xA(X) = [IX - 19" (15.524) 
i=1 


où m; est la multiplicité de la valeur propre À;. Le lemme des noyaux 9.89 nous dit qu’en posant 
V; = ker(A — À;1)" (15.525) 


nous avons V = @'_, V;. Nous nommons p;: V — V la projection canonique de E sur V; ainsi que 
x; la composante de x € V dans l’espace caractéristique V; et nous posons À; = p;o À. Les espaces 
caractéristiques sont stables par À (lemme 9.254), donc (Ax;); = Ax;. Par conséquent ÿ;; A;p; = A 


parce que 
(D piApi)(x) = D (Az): = > Ati = A) 5 = Ar: (15.526) 


v 


En ce qui concerne les puissances de À nous avons de même 


AŸT; . À; A læ; — AA? tr; . A"x;, (15.527) 
nn, — 
EV; 
et donc : 
D Aïpi = A7. (15.528) 
i=1l 


En particulier, 


eh = Dethin, SRE) 
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C’est de cette exponentielle de matrice que nous devons étudier la norme. 
La décomposition de Dunford du théorème 9.259 est toujours un bon plan pour traiter avec les 
exponentielles : nous avons À = 5 + n avec 


s=) Apr n= D (A— Arl)pr. (15.530) 
k k 


Nous montrons que la décomposition de Dunford de p;A est p; À = p;s + pin. Nous avons 


Pis = > AkDiPk = Xipi (15,541) 
k 


qui est bien diagonalisable. De plus les espaces caractéristiques sont stables par n, donc pin est 
nilpotent. Enfin ils commutent : 


[pis, pin] = Ai(pin — pinpi). FAN ToRE LE 


Vu que n préserve les espaces caractéristiques, lorsque v € V4 avec k à nous avons p;np;v = 0 et 
pinv = 0. Mais si v € V; alors 


DiNDiU = DEN = NV (15.533) 


et pinv = nv, donc les opérateurs pin et pinp; sont égaux et (15.532) donne bien zéro. En ce qui 
concerne l’exponentielle de À; nous avons 


ePiA = ePisepin = e*iPi exp ((A _ X1)pi). (15.534) 


Nous pouvons maintenant sérieusement nous attaquer à la norme de etÀ de l'équation (15.529). 
D'abord nous avons |p;| = 1 parce que l'opérateur p; est l'identité sur au moins un vecteur (en 


fait tout ceux de l’espace caractéristique V;). En utilisant les propriétés de la norme opérateur °!, 
nous trouvons dans un premier temps °? 
t 
jet4] < De |< Det" | 2. M4 ape (15.535) 
i= 
= P;(|t| 
où 1; est l’opérateur identité sur V;. Petit détail dans le calcul : 
le\Pi| < 2. À Ip = (15.536) 


Notons que tous les termes de P;(|t|) et P; (lél) sont positifs, de telle sorte que nous pouvons majorer 
en ajoutant des termes partout. À la place d’avoir P;(|#|) comme coefficient de [et] nous majorons 
en mettant }}°_, P;(|t|) comme coefficient : 


il < De (141) = = AD 1) = PI) À etre), (15.537) 


i=1 i=1l 


L'arrivée de la partie réelle est une égalité usuelle pour les nombres complexes : [e®+bi| = et|ebi| = 
a 
ef. 


51. Surtout le fait que ce soit une norme d’algèbre, lemme 11.61. 
52. Si les valeurs propres de À sont À;, celles de tA sont tx. 
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15.13.4 Calcul effectif de l’exponentielle d’une matrice 
SUBSECooGAHVooBRUFub 


Nous reprenons l’exemple de [471]. Soit À une matrice dont le polynôme minimum s'écrit 
P(X) = (X —1}(X — 2). (15.538) 
Par le théorème 9.89 de décomposition des noyaux nous avons 
E = ker(A — 1)? @ ker(A — 2). (15.539) 


En suivant les notations de ce théorème nous avons P1(X) = (X — 1)?, PB(X) = X —-2et 


Q1(X) = X — 2 (15.540a) 
Q2(X) = (X —1)?. (15.540b) 
En posant 
R1(X) = -X 
1(X) (15.541) 
Ro(X) T 1, 
nous avons une solution de Bezout : 
R1Q:1 + R2Q2 = 1. (15.542) 


Conformément au théorème 9.89(3), le projecteur p; sur ker (P;(A)) est (R;Q;)(A) : 


P1 — PTOjKer(A-1)2 = —A(A En 2) 


; (15.543) 
p2 — PTOJxer(A—2) — (A = 1) 


Passons maintenant au calcul de l’exponentielle **. Nous avons évidemment 
E VIOW 
ei = ep + ep». PP 


Afin de nous adapter au projecteurs que nous avons en main, nous écrivons À = 1 + (A — 1) et 
nous utilisons la proposition 15.68(4) : 


A = el+AT) L E1QAT 2 eeAT1, (15.545) 


Pour tout x, nous avons (A — 1)*p1(x) = 0 dès que k > 2. Donc nous avons 


LE 
ep (ei ee lpi(x) = eÿ, 4 _ pi(x) = epi(x) + e(A — 1)p1(x) = eApi(x). (15.546) 
- ! 


En ce qui concerne p2 nous faisons de même en partant de e4 = e2leA-21 . 
go k 
ÀA—1 
eApa(x) = e? > ( Fi ) pa(x) = e?po(x). (15.547) 
k=0 | 
En recollant les morceaux avec (15.544), 
As = s. : 2 2 2 
ef (x) = eApi(x) + e“pa(x) = —eA*(A — 2)x + e*(A —1)°x. (15.548) 
Au final nous avons prouvé que 
el (A 2)4e (A0 (15.549) 


53. Définition 15.65. Thème 49 
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15.14 Lemme de Borel 


15.14.1 Fonctions plateaux, Urysohn, partition de l’unité 
subsecOÜSYAooXXCVjv 


Vous voulez une fonction de classe C'©° nulle sur un ouvert, mais qui n’est pas nulle partout ? 
En voici une. 


LEMooFLUSooKaZRRY 
Lemme 15.153. 
La fonction 
LE gx>0 
p(x) = ' no (15.550) 
0 sinon. 
est de classe CT. 
Démonstration. Pour tout polynôme P nous avons la limite °{ 
el/x 
= (. (15.551) 


. 
20+ P(x) 


De là, en écrivant les dérivées successives de 4, il est facile de voir qu’elles sont continues en 
zx = 0. 


LEMooRVSIooKcpWok 
Lemme 15.154. 
Soit m > 0. Il existe une application mn € C(R) vérifiant 
1 si x < 0 
lt) = *< 0 sir >Mm (15.552) 


positive six € [0,m|. 
Démonstration. Nous partons de la fonction & du lemme 15.153. Ensuite nous considérons 


fo gtt)dt 
fo e(t)dt 


Yn(z) = 1 (15.553) 


Cette fonction est encore de classe C'®. En effet, le dénominateur Lo p(t)dt est un simple nombre 
strictement positif sans histoires tandis que la proposition 14.262 dit que x + Fe p(t)dt est une 
primitive de 4. Vu que est déjà de classe C?, sa primitive l’est également. 


LEMooFFPVooDKGUAp 
Lemme 15.155 ([239]). 
Soient a < b dans R. Il existe une fonction f € C'°(R) telle que 
CUDÉ FE, 
(2) f = 0 sur |—0, al, 
(OT = Leur [Bol 


Démonstration. C’est une variation sur le thème de la fonction du lemme 15.154; il s’agit de la 
retourner, dilater et décaler. Posez successivement f(x) = Ym(—x), f(x) = fi(mx/(b — a)) et 
f(x) = fofx — a) et je crois que le compte est bon. La fonction f3 est celle que nous cherchons. 

PROPooAZJZooTYWjzb 


Proposition 15.156. 
Soient a < b < c < d dans R. Il existe une fonction f € C'°(R) à valeurs positives telle que 


(1) f(x) = 1 sixefb,cl 
(2) supp(f) € [a, d]. 
54. Voir la proposition 15.106(3). 
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Démonstration. Nous considérons la fonction Ÿ,, du lemme 15.154, et nous considérons les fonc- 


tions 
1 sit <cC 
f(x) = Ya-c(x — c) = 40 siz>d 
positive sixe [c,d]. 
0 siT<a 
fa(x) = W(b—a)(b—x) = 41 six >b 
positive sixe [ab]. 


(15.554a) 


, (15.554b) 


et finalement la fonction suivante répond à la question des fonctions plateaux sur R : 


(x) = f(x) f2(x). 


APE 


Une variation sur le même thème est l’existence de fonctions infiniment dérivables à support 


compact, c'est-à-dire des fonctions dans C?(R) = Z(R“). 


Lemme 15.157 (|1]). 
Pour tout n e N nous avons 


Nous prouvons ensuite que 


LEMooLHIFooWpbauN 


(15.556) 


(15.557) 


(15.558) 


Pour cela nous considérons € > 0. Soit M > 0 tel que x'*e-* < € pour tout x > M. Nous considérons 


ô tel que 0 < x < Ô implique 1/x > M. 
Pour de tels +, nous avons e-l/?/x" < €. 
Nous montrons enfin que 


(15.559) 


Pour cela, soit € > 0. Soit Ô tel que 0 < x < à implique HR < €. Soit d’ tel que 1 < x < 1 +0’ 


implique 1 — x? < 6. Avec ça, nous avons 


, e-VG-:) 
1<x<1+0 Tommy 


Proposition 15.158. 
La fonction £: RT — R donnée par 


Ex) = LS si x € B(0,1) 


0 sinon. 


est de classe C® et à support compact. 


(15.560) 


PROPooAHLKooMFMgFq 


561 
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Démonstration. Le fait que le support soit compact est le fait qu’un support est toujours fermé 
(c’est dans la définition) et que le support de £ est borné, contenu dans B(0, 1). Le vrai travail est 
de montrer que cette fonction est de classe C®. 

Nous commençons par voir en dimension 1. C’est à dire la fonction 


f:R—R 
e VU) si [x] <1 (15.562) 
Tr 
0 sinon 


Le lemme 15.157 dit que f est continue. En ce qui concerne les dérivées de f, vous pouvez montrer 
par récurrence que 


P(x) ; 
1 
0) = {E (æ) . rl < (15.563) 
0 sinon 


où P, est un polynôme. Le lemme 15.157 (encore lui) nous indique que f (n) est continue. 
Pour que £ soit de classe CT, il suffit maintenant d’invoquer la proposition 7.158 qui dit que 
la norme est une application de classe C'?. 


CORooHHZXo0XmwGmC 
Corolaire 15.159. 
Il existe une fonction £ € D(B(0,R)) telle que {, É(x)dx = 1. 


Démonstration. Prenez la fonction de la proposition 15.158. Si À < 1, faites une redéfinition 
£2 = (Az) pour que le support soit dans B(0, À). Ensuite, si l'intégrale n’est pas 1, encore une 
redéfinition £3 = 12. 


Il ne faudrait pas croire pour autant que tout est toujours rose au pays des fonctions C? à 
support compact. 


Proposition 15.160. 
Si D est une fonction C? non nulle à support compact sur R, alors d'/d n’est pas bornée. 
Plus présisément, nous posons D = {x€e R tel que b(x) Æ 0}. Alors la fonction 


J:D—R 


ze d'{x)/6(x) D 


n’est pas bornée. 


Démonstration. Quitte à décaller et à multiplier, nous supposons que (0) = 1. Sinon vous consi- 
dérez xo tel que (x) = yo À 0 et vous adaptez tout le reste de la démonstration à vos frais. 

Vu que ® est continue, la partie Z = {x >0€ R tel que d(x) = 0} est fermée. Elle est également 
bornée vers le bas par 0. Donc elle possède un minimum que nous nommons à : 


a = min{x > 0 tel que (x) = 0}. (15.565) 


Les valeurs de 6 qui vons nous intéresser sont : 


Lo arets = 
Enfin, nous posons 
M = sup{#(x)/6(x)}setoat- (15.567) 


Nous supposons que M < 00 ®. 


55. Vous pouvez ne pas supposer cela et voir le reste de la preuve comme une démonstration que M = oo. Ici nous 
allons faire par l’absurde et montrer une contradiction en supposant que M < co. 
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Nous posons 
F:[0,a| —R 
. f g'(t) " (15.568) 
o @(t) 
Vu que @ est de classe C'? et que x est dans [0, a[ sur lequel @ ne s’annule pas, cette intégrale n’a 
rien d’exceptionnel. 
Nous pouvons majorer F' de la façon suivantes : 


: 8 W(t) T : - . 
F(x) = | SE a< | Mdt = Mx < Ma. (15.569) 


La proposition 14.262 lie primitive et intégrale; celle de d'(x)/@(x) est In ((x)) nous avons 
donc 


F(x) = n(6(x)) — In(6(0)) = In (6(x)). FRoocENRonen ia 


Mais vu que lims_,4 (x) = 0, nous avons lims_,4 F(x) = ©, d’où la contradiction. 


Notez que l’expression 15.570 montre que #'(x)/(x) tend vers —00, ce qui est logique : la 
dérivée est négative alors que 6 reste positive. Ce que dit la proposition est qu’une fonction C? à 
support compact tend plus vite vers zéro que sa dérivée. 


15.14.2 Lemme de Urysohn 


Le lemme d’Urysohn comprend de nombreuses variantes plus ou moins générales %6. En voici 


une parmi les plus simples. 
LEMooECTNooKagaRU 


Lemme 15.161 (Lemme d’Urysohn). 
Soient un ouvert U de R et un compact K inclus dans U. Il existe une fonction f : R — [0,1] de 
classe C'® telle que 

(1) f(x) = 1 pourxeK, 


(2) supp(f) € U. 


Démonstration. Vu que K est compact, il est borné (théorème 10.24). Nous posons b = min(K) 
et c = max(K). En particulier b et c sont des éléments de ÆX et donc de U{. Comme {{ est ouvert, 
il existe des boules centrées en b et c contenues dans {. Soit r le rayon de telles boules : 


B(b,r) cU (15.571a) 
Fier) et. (15.571b) 
Nous posons a = b—reU et d=c+7r EU. Nous considérons à présent la fonction plateau f de la 


proposition 15.156. Elle est de classe CT et vérifie f(x) = 1 pour x € [b,c] = K ainsi que f(x) = 0 
hors de [a, d] € U. 


15.162. 
Notons que la fonction du lemme d’Urysohn 15.161 n’épouse pas spécialement très bien la forme 
de X. Si par exemple K = [0,1] U [10,11], la fonction f sera égale à 1 au moins sur [0,11]. 


LEMooGZXYooZqFzyc 
Lemme 15.163 ([1]). 
Si une fonction f : R" — R est intégrable, et si s € IR alors l’application 
fs: R'—R 
(15.572) 
ze — f(x/s) 
est intégrable et 
Js = J J. (15.573) 
R? n 


56. Pour une version sur R”, voir la proposition 27.64. 
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Démonstration. Il s’agit d'appliquer le théorème 14.290(2) au changement de variable O(x) = x/s. 


Nous avons f; — L o @, et 


1 
(dh)av = —v, (15.574) 
s 
de telle sorte que le déterminant de d® soit une constante et vaille det(d®) = 1/5". Enfin @ est une 
bijection de R". Nous avons tous les ingrédients pour faire le changement de variables : 


fade = | Gode) = | as (15.575) 
R* R" ? g(R") 


Pour une fonction plateau sur Q € R”, voir le lemme d’Urysohn, proposition 27.64. 


15.14.3 Le lemme de Borel 


Lemme 15.164 (Lemme de Borel[103]). 
Soit (an) une suite dans R. Il existe une fonction u € C?(R) telle que u)(0) = ay pour tout 
k> 0. 


LemRENlIEL 


Démonstration. Soit ÿ € C?(R) une fonction telle que (x) = 1 si [x| < à et telle que supp(y) € 
]-11[. 

Nous commençons par considérer une suite de réels strictement positifs (AZ) dont nous fixerons 
une valeur précise plus tard, et nous posons 

ak 

JE —= Cr) re. (15.576) 
Nous allons étudier la convergence et les propriétés de u(x) = X5_0 fx(x). 

Calculons (formellement) la m°dérivée de fx : 


” ap + [M ni (m- 
ACER EE a CT (15.577) 
° 1=0 
= 5 M) VU D (pr) (15.577b) 
—— F2 l k 9 kX DE . 


Notons que nous travaillons à m fixé et que nous ne nous intéressons qu'aux termes avec Æ assez 
grand ; nous pouvons donc supposer k > m. De toutes façons pour Y #9 fx, on a la classe C®, et 
la permutation de la somme avec tout ce qu’on veut. Vu que 4 est continue à support compact 
nous pouvons poser 
Mn = max |g/|o = max max|[oÜ)(x)|. (15.578) 
O<j<m 


0O<j<m xeR 


Nous continuons en nous fixant un x € R et un k > m. 


Si el > 5. alors gl") (Ayx) = 0 parce que À est strictement hors du support de w qui est 


]-1,1]. Donc pour |x| > — 


Si par contre |t| < À nous avons les majorations 


m < me m— m— 1 _ 
ALT (œ)] < eu X ( ) lu LOU D (1x) ET (15.579a) 
nl ns rip it Si 
Mn <(1/Xk)F 7! 
m— 1 fm 
< |ax| Mn] el re y ( ) (15.579b) 
" 1=0 
M. m—kom 
< le & ne (15.579c) 


_ _ lælMm2" APE 9) 


(ke m)!ARlE 
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où pour faire disparaitre la somme de coefficients binomiaux, nous avons remarqué que } 72 (7) 
est le nombre total de termes dans le développement de (a + b)”, c’est-à-dire 2. Nous voulons, 
pour m fixé, étudier la convergence de la somme de cela. Notons que le 2” n’a en particulier 
strictement aucune importance parce qu’on travaille à m fixé. 


Nous fixons maintenant la valeur des À4 : 
Àg = max{laz|,1}. (15.580) 


Avec cela, en nous souvenant que nous n'étudions que les termes k > m, le dénominateur de 
(15.579d) est réellement croissant en k, donc nous avons la majoration 


LA) (æ)| < TS Il (15.581) 
Au final nous avons 
eee, Mme (15.582) 
Fe OS (Re 
Et la somme de cela converge sans difficultés. Donc la série 
O0 
u(x) = D f(x) (15.583) 
k=0 


converge normalement et donc uniformément sur IR. Nous pouvons alors permuter la somme et la 
dérivation par le théorème 15.3. Donc 


00 
ut) = NE FE) (15.584) 
k=0 
est continue. En particulier, pour évaluer en zéro, on peut faire 
Le] 
an (De (0). (15.585) 
k=0 
Nous avons _. 
fe(x) = COMORES (15.586) 


Pour calculer la dérivée en zéro, il suffit de la calculer sur un voisinage sur lequel @(Axx) est la 
constante 1 ; un tel voisinage existe pour tout k. À ce moment le calcul est classique : 


m ik = 
FEV (e) = LRO ET (15.587) 
O0 sinon. 
Finalement nous avons bien o 
ut) (0) = 51 (0) = ax. (15.588) 
k=0 


Remarque 15.165. 
Pour prouver le lemme de Borel, la première chose qui passe par la tête est la fonction toute simple 


u(x) = N —T". (15.589) 


Évidemment si on calcule les dérivées successives de cette fonction, nous trouvons les bons résultats. 
Le problème est la convergence. Rien qu’en prenant ax = k!k*, la série ne converge pour aucun x 
positif. L'idée de multiplier chacun de f}; par une fonction plateau sur un petit intervalle autour 
de zéro à plusieurs avantages. D'abord on conserve les dérivées correctes parce qu’on ne touche 
pas à la valeur des f, sur un petit voisinage. Ensuite cela ne modifie pas la continuité ; et enfin en 
multipliant par (xx), ça calme méchamment les divergences parce que Àz;x passe vite au dessus 
de 1 (et donc en dehors du support de @) si ÀZ est grand. D'où le fait qu’il soit normal que les À4 
soient de l’ordre des az. 
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15.15 Nombres de Bell 


Théorème 15.166 (Nombres de Bell[103]). 


Soient n > 1 et B, le nombre de partitions distinctes de l’ensemble {1,. 


que Bo = 0. Alors 


(1) La série entière 
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ThoYFAzuSg 


.,n} avec la convention 


00 
B. E 
D Tu 15 SOU) 
20 n! 
a un rayon de convergence R > 0 et sa somme est donnée par 
fee + (15.591) 


pour tout x E ]-R,R|. 


(2) Pour toutke N, 


nn (15.592) 
—- ‘ 


(3) Le rayon de convergence de la série (15.590) est en réalité infini : R = ©. 


Démonstration. (1) Soient n > 1 et 0 < k < n. Nous notons E} l’ensemble des partitions de 


{1,...,n+1} pour lesquelles le « paquet » contenant n + 1 soit de cardinal k + 1. Calculons 
le cardinal de E4. 

Pour construire un élément de E%, il faut d’abord prendre le nombre n + 1 et lui adjoïindre 
k éléments choisis dans {1,...,n}, ce qui donne (2) possibilités. Ensuite il faut trouver une 
partition des (n +1) —(k +1) = n — k éléments restants, ce qui fait B,-_% possibilités. Donc 


Card(Ey) = 4 Le. (15.593) 
L'intérêt des ensembles E, est que {E0,..., E,} est une partition de l’ensemble des partitions 
de {1,...,n+1}, c’est-à-dire que Bh41 = Y5_0 Card(£;), ce qui va nous donner une relation 


de récurrence pour les B; : 


— » Card(Ey) = > o nn > (," ) = ÿ () Be (15.594) 


k=0 k=0 1=0 1=0 


où nous avons utilisé un petit changement de variables ! = n—k. Afin d'étudier la convergence 
de la série (15.590), nous allons montrer par récurrence que pour tout n, B, < n!. D'abord 
pour n = 0 c’est bon : B1 = 1 parce que la seule partition de {1} est {1}. Supposons que 
l’inégalité soit vraie pour une certaine valeur k#, et montrons qu’elle est vraie pour la valeur 
k +1. 


Ba =) ()e< D ()r en ll nu) gp < le +1) = (n + 1) 


1=0 = 1=0 
<1 
(15.595) 
où nous avons utilisé la formule (3.77) du coefficient binomial : (7) = ET: 
Donc pour tout x € IR nous avons 
B 
0 < are” < jf? (15.596) 


et donc la série a un rayon de convergence au moins aussi grand que celui de la série géomé- 
trique, c’est-à-dire que 1. Donc À > 1. Nous nommons R ce rayon de convergence. 
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Soit x € |-R,R]. Pour une telle valeur de x à l’intérieur du disque de convergence, la 


proposition 15.44 nous permet de dériver terme à terme la série °" 
- “ SR 
Re + 
= 15. 
fe) = ++ (15.597) 
=0 k=0 
pour obtenir 
00 (0e) 
By+1 k Bet k 
= (+= x (15.598a) 
enter) 2 À! 
LL (02)r-S (Em) 
- cie 2. (15.598b) 
! 1 — 
md Er U(I—k)! 


ou cette = nous reconnaissons un produit de Cauchy (proposition 15.32) avec a = 
Ë et bn = =. Vu que ce sont deux séries ayant un rayon de convergence plus grand que zéro, 
É ie : encore un rayon de convergence plus grand que zéro et nous pouvons prendre le 


produit des séries : 
Pi os 1 
f'{x) = | pa) | us“) = j{rle" (15.599) 
1=0 k=0 


Étudions l'équation différentielle y = ye*. D’abord par un argument en lacet de chaussure *, 
une solution est de classe C?. Ensuite si une solution est non nulle, elle est de signe constant. 
En effet si y(xo) < 0 et y(x1) = 0 (on choisit x1 minimum pour cette propriété parmi les 
nombres plus grands que 9) alors il existe *” un t € ]x0,æ1[ tel que y/(t) > 0, ce qui donnerait 
y(t) > 0, ce qui contredirait la minimalité de 1. 
Nous prétendons ® que cette équation différentielle a un espace de solutions de dimension 1. 
En effet, si y = ye* et g = ge” alors en posant @ = y/g nous obtenons tout de suite 4 = O, 
ce qui signifie que Y est constante, ou encore que y et g sont multiples l’un de l’autre. 
Si nous en trouvons une non nulle par n'importe quel moyen, c’est bon. Une solution étant 
dérivable est continue, donc l'équation f” = fe® nous indique que f’ est continue. Une solution 
non nulle va automatiquement accepter un petit voisinage sur lequel la manipulation suivante 
a un Sens : 

PC) _ x 


fa) 


donc In(|f(æ)|) = e* +C'et f(x) = Ke pour une certaine constante. Il est vite vérifié 
que cette fonction est une solution de l’équation différentielle y/(x) = y(æ)e* et par unicité, 
toutes les solutions sont de cette forme. Autrement dit, l’espace des solutions est l’espace 
vectoriel Span{x + e**}. Étant donné que f(0) = 0, nous devons choisir K = L et donc 


(15.600) 


flr)= -e = (15.601) 


Nous commençons par écrire la fonction f comme une série de puissance. La partie simple 
du calcul : pour x € ]-R, R|[, nous avons 


SE FPS BD 


Notons que cela n’est pas une série de puissance en x parce qu’il y a la double somme. Nous 
allons inverser les sommes au moyen du théorème de Fubini sous la forme du corolaire 14.296. 


æ\k 


57. C’est ici qu’on utilise la convention Bo = 0 et ça aura une influence sur le choix de la constante K plus bas. 
58. Genre ce qui est fait pour prouver 15.89(4). 

59. Théorème de Rolle 12.192. 

60. Ou alors on utilise le théorème 32.16 avec M(x) = e” dans les cas n = 1 et ?! = ]-R,RI. 
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Pour cela nous considérons la fonction 
a:NxXxN—R 


(kæ)! (15.603) 
KU! 


Dre 


et nous mettons la mesure de comptage! sur IN_et N°2. Nous commençons donc à vérifier 
sr se : : PRREASFRERERX 
l’intégrabilité variable par variable de |a| : 


[. ([. tk Dm) dm(k) = Ÿ 2 EA ne 


k=0 
À 
_, + (15.604b) 
k=0 
< : k|x| 
Nous devons montrer que cette dernière somme va bien. Pour cela nous posons uy = ‘ . 


et nous remarquons que “= — (. Donc la double intégrale (15.604) converge, ergo a € 


L'(N x IN), ce qui nous permet d'utiliser le théorème de Fubini 14.297 pour inverser les 


sermes intégrales sommes dans l'équation (15.602) : 
le 1j vil 11/Sk! 
= NN (kr) = N S xl. (15.605) 
e É— k! I! ZA el — k! 


/ Je DES : T . Je 
Cela est un développement en série entière pour la fonction Lee , dont nous savions déjà 


le développement (15.590) ; par unicité du développement nous pouvons identifier les coeff- 
cients : 


Hs (15.606) 
é— k! 


(4) Le développement (15.602) étant en réalité valable pour tout x et tous les calculs subséquents 
l’étant aussi, le développement 
ve) 
z B 
e—1 non 
e = à PL (15.607) 
n= 


est en fait valable pour tout x, ce qui donne à la série entière un rayon de convergence infini. 


61. Nous passons outre les avertissements et menaces de Arnaud Girand. 
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Chapitre 16 


Représentations et caractères 


16.1 Représentations et caractères 


Définition 16.1. 

Si G est un groupe, l’ensemble des homomorphismes Hom(G, C*) est un groupe pour la multipli- 
cation. Un élément de Hom(G,C*) est un caractère abélien. Le nom « abélien » vient du fait 
que le caractère prenne ses valeurs dans C*. Nous notons G = Hom(G!, C*). 


Théorème 16.2. 
Soit G un groupe abélien fini. Alors G est isomorphe à G. 


L’isomorphisme n’est pas canonique. 


Démonstration. Etant donné la structure des groupes abéliens finis donnée par le théorème 5.23, 
nous commençons par nous concentrer sur G = Z/nZ. Nous allons montrer que 


Hom(Z/nZ) = U, = {£e C tel que €" = 1}. (16.1) 


Pour cela nous avons l’isomorphisme 


(16.2) 


Notons que si f € Hom(Z, C*), alors f(k) = f(1)*, donc w est bien un isomorphisme. Cela nous 
amène à définir 
w: Hom ((Z/n7,+), HET, # )) — Un 
fe fQ). 


Remarquons que pour tout f € Hom(Z/nZ,C*) on a bien f(1)" = 1. En effet si [k] € Z/nZ, alors 
f([k]) = f(L)F et en particulier 


(16.3) 


FO)" = f(In]) = (0) = 1. (16.4) 


Donc f(1) € U,. Le est injective parce que si f(1) = g(1) alors f = g du fait que f(k) = f(1)F = 
gQ)* = g(k). 

Nous en sommes à avoir prouvé que Hom(Z/nZ,C*) + U, (introduit au lemme 19.2). I faudrait 
encore montrer que U, = Z/nZ. Pour cela nous nous rappelons du lemme 19.5 nous ayant raconté 
que le groupe U, des racines de l’unité était cyclique et d’ordre n. Il est donc bien isomorphe à 
Z/nZ. 

Passons au cas où 

G=7Z/d2 x Z/d22Z x ... x Z/d,Z. (16.5) 
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Dans ce cas nous montrons que 


k 
. YX Hom(Z/d;Z, C*) — Hom(G, C* 
a X om(Z/ ) om( ) (16.6) 


Nisses ME)diie ring) = ML loR). 


Ce a est injectif parce qu’en appliquant l'égalité 


a(X1:+:.,Xx) = A(xi:.:-, Xe) (16.7) 


à l'élément g = (0,...,1,...,0) alors nous trouvons x;(1) = x{(1) parce que X;(0) = 1. Du coup 
Xi = Xi: 
L'application a est en plus surjective. En effet si y € Hom(G', C*), alors nous définissons 


Xi(gi) = Aix 0e 0), (16.8) 


et nous avons alors @(X1,...,Xx) = X. 
Nous devons encore montrer que « est un homomorphisme. Si y,’ € . Hom(Fa,, C*), 
alors 


16.9a 
16.9b 
16.9c 
16.9d 


a(xx')(g1, ……., 9x) = Gixi) (gi)... (xexx) (9e) 

= X1(91)... Xk(gk)X1(g1) - : XL (9x) 
= a(x a diis398) 
(a(Ma(x)) (91, ...,9r). 


(16.9a) 
(16.9b) 
(16.9c) 
(16.94) 


Donc a(xx’) = a(x)a(x). 


Théorème 16.3. h 
Soit G& un groupe abélien fini. Les groupes G et G sont isomorphes et un isomorphisme canonique 
est donné par a: gr f, donné par 


F0 = X(g). (16.10) 
Démonstration. D'abord f, est bien un caractère de G parce que 
x) = (xx) (9) = x(9)xX (9) = fax) f(x). (16.11) 
Le fait que « soit un homomorphisme de groupes est direct : 
Fog (x) = X(99°) = X(9)x (9°) = fa) fo (X) = (fafs)(x): (16.12) 


D'autre part nous savon que G et G ont le même cardinal. Il suffit donc de prouver l’injectivité 
de à pour être sûr de la bijectivité. Pour cela nous devons prouver que si g Z e alors f, Æ f.. Nous 
savons que pour tout caractère y € G, fe(x) = x{e) = 1. Donc pour tout g € G\{e}, nous devons 
trouver x € G tel que xX(9) # 1. 

En vertu de ce que nous connaissons sur la structure des groupes abéliens finis (théorème 5.23), 
nous commençons G = Z/nZ et considérons le caractère donné par Y([1]) = e27/". Ce x est un 
isomorphisme entre G et U(n) ; nous n’avons Y([k]) = 0 que si [k] = [n] = [0]. Pour rappel dans 
Z/nZ, le neutre est e = 0 et non e = 1. 

Passons au cas général : 

G=Z/n2 x... x Z/ngZ (16.13) 


Sig=(g1,...,9x) est non nul dans @, alors il existe k tel que gx Æ 0 et on prend 


X(91::..,9k) = Xk(9k) (16.14) 


où 4 est le caractère x,([1]) = e2TŸ"#x, Ce y est alors un caractère non trivial de G. 
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16.1.1 Crochet de dualité et transformée de Fourier 
Si G' est un groupe abélien, nous définissons le crochet de dualité entre G et G par 
É. GRH 
(gx) = X(9). 


Notons que l’image de ce crochet n’est pas C* entier, mais seulement le groupe unitaire U(n) où 
n est l’exposant ! de G!. 
Si f,g sont des applications de G dans C, alors on leur associe le produit scalaire 


9 = a ON. (16.16) 


seG 


(16.15) 


LEMooCSTVooJfhzEU 
Lemme 16.4. 
Les caractères de G forment une base orthonormée de C® pour ce produit scalaire. 


Démonstration. Étant donné que les x(s) sont des nombres complexe de module 1, nous avons 


x(s)x(s) = 1 et par conséquent €y, x) = 1. 
Si par contre y Æ Y/, alors il existe s<G tel que YX(s0) À X/(s0). Dans ce cas en effectuant un 
changement de variable s — 595 dans la sommation, 


XX) = : DOME) (16.17a) 

seG 
= _ D X(505)X/(505) (16.17b) 

seG 
2 CON OO) (16.170) 

seG 
Donc nous avons trouvé 

XL — Xx(s0)x'(s0)) = 0. (16.18) 


Mais vu que Y(50) À X/(s0), la parenthèse est non nulle (pour rappel x(s0) est un complexe de 
module 1) et par conséquent y, x/> = 0. 

Nous déduisons immédiatement que les caractères forment une famille libre parce que si Ÿ,, aix; = 
0 (la somme est sur tous les caractères), alors en prenant le produit scalaire avec Y4, 


DES xD = 0, (16.19) 


et donc ax = 0. 

Les caractères forment donc un système libre orthonormé. De plus l’espace engendré à la bonne 
dimension parce que le cardinal de l’ensemble des caractères est la dimension (complexe) de l’espace 
des fonctions de G dans C parce que, en utilisant l’isomorphisme entre G et aA 


Card G = Card(G) = dimg €. (16.20) 


Du fait que les caractères forment une base orthonormée, nous pouvons écrire, pour toute 


f= D xx Fes ts 


xeG 


application f:G—C, 


À une fonction f: G — € nous associons la transformée de Fourier 


A 


FC 0 


Me. (16.22) 


1. Définition 1.264. 
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Nous avons donc aussi une espèce de formule d’inversion 


p= X fGx (16.23) 


xeû 


qui n’est qu'une réécriture de 16.21. 


16.1.2 Groupes non abéliens 


Nous avons vu que le groupe des caractères G contenait toute l'information sur un groupe 
abélien. Malheureusement, pour les groupes non abéliens, ça ne va pas suffire, et nous allons 
introduire la notion de représentations, dont les caractères seront un cas particulier de dimension 
un. 


Proposition 16.5. 
Soit G un groupe (pas spécialement abélien). Nous avons 


G = Hom (G/D(G),C*). (16.24) 


Démonstration. Ce qui fait fonctionner la preuve est le fait que si f: G — C* est un homomor- 
phisme, alors f s’annule sur D(G). L’isomorphisme est 


ne 0 no 
Cette application est bien définie parce que si f est un homomorphisme, 
F(aklE = (a). (16.26) 
D'autre part Ÿ est un homomorphisme de groupe parce que 
W(fif2)[gl = (fif2)(9) = fig) fo) = (Pi) Tglb(P2)Tgl = (#(ñ)#(2)) (ol. (16.27) 


Pour l’injectivité de w, soit f1 et f2 telles que d(f1) = Y(f2). Alors pour tout g € G nous avons 
D(f1)l9] = b(2)[9] (16.28) 


et donc f1(9) = f2(9). : : 
Enfin 4 est surjective. En effet, soit f € Hom (G/D(G), C*). Alors nous obtenons #(f) = f en 
posant 


f(g) = flgl- (16.29) 


Il faut juste vérifier que le f ainsi défini est dans G!, c’est-à-dire que f (g192) = f(g1)f(g2). 


Cette proposition nous montre que 
G = G/D(O), (16.30) 


alors que G/D(G) est abélien; il n’est donc pas tellement possible que G contienne beaucoup 
d'informations intéressantes sur G. 


16.1.3 Représentations linéaires des groupes finis 


Si dim V = 1, alors GL(V) = C* et les représentation sont les caractères abéliens. 
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ExKUAyUD 
Exemple 16.6. 
Considérons le triangle équilatéral À, B,C donné par les points 


A = (16.31a) 


B = (5 o) (16.31b) 
= 3; ne (16.31c) 


(16.314) 


Dans la base (pas orthonormée) { A, B} de R?, ces trois points sont donnés par 


a-() #0) e-() vs 


Le groupe symétrique S3 agit sur le triangle par permutation des sommets. Vues dans la base 
{A, B}, les transpositions correspondent aux matrices 


p(AB) = Ë )) (16.33a) 
p(AC) = L 1) (16.33b) 
p(BC) = È n. (16.33c) 


Cherchons la matrice correspondante à la permutation (A, B,C). Vu que À est envoyé sur B, 
: 0 ; à : 
la première colonne sera ? (). et comme B est envoyé sur C, la deuxième colonne sera ( . 
Nous avons donc 


p(ABC) = È . (16.34) 


Nous vérifions que p(ABC)C = À : 


p(ABC)C = É ” we = () = (16.35) 


Par ailleurs, la permutation (A, B,C') se décompose en (4, B,C') = (A,C)(A, B) et nous pou- 
vons vérifier que 


p(AC)p(AB) = - È 1) = Ë s = p(ABC). (16.36) 
A 


Définition 16.7. 
Si (V,p) et (V',p!) sont deux représentations du groupe @, alors nous définissons la somme 
directe par (V @V’,p@ pl) donné par 


p(g) 0 ) 
®p! = ( e GL(V @V'). 16.37 
(0® p )(g) 0 #9) ( ) (16.37) 
Nous noterons souvent 2V pour la représentations (V, p)@(V, p) et plus généralement l'écriture 
V = PkiW (16.38) 


signifiera la représentation somme de k; termes de la représentation W;. Ici encore un abus est 
commis entre la représentation (p;, W;) et l’espace W;. 


2. Les colonnes sont les images des vecteurs de base. 
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16.1.4 Module 


Nous considérons la C-algèbre G[C] des combinaisons (formelles) d'éléments de G à coefficients 
dans ©, c’est-à-dire l’ensemble 


G] = {D as} (16.39) 


seG 
avec le produit hérité de la bilinéarité : 


. » asbyst = DD asbs-ut, (16.40) 
st 


seGteG 


et la somme 


03) + Dub = = Ÿ (as + be)s. (16.41) 


seG 


Le tout est une C-algèbre agissant sur V par 


ù ss) U = D asp(s)v € V (16.42) 


seG 
Les sous-modules indécomposables seront les représentations irréductibles. 


Définition 16.8. 
La représentation (V,p) du groupe G est irréductible si les seuls sous-espaces invariants de V 
sous p(G) sont V et {0}. 


Exemple 16.9. 
La représentation de $3 sur IR? donnée par les permutations des sommets d’un triangle équilatéral 
donnée dans l’exemple 16.6 est irréductible. AN 


La question qui vient est de savoir si une représentation possédant des sous-espaces invariants 


peut être écrite comme la somme de représentations irréductibles. 
PropHeyoAN 


Proposition 16.10. 
Soit (V,p) une représentation linéaire de dimension finie d’un groupe fini. Si Wi est un sous- 
espace stable, alors il existe un sous-espace Wa également stable et tel que V = Wi ® Wa. 

Toute représentation linéaire est décomposable en représentations irréductibles. 


Démonstration. Soit P: V — V un projecteur sur WA, c’est-à-dire que P? = P et P(V) = W1. 
Pour construire un tel projecteur, on peut par exemple prendre un supplémentaire de W dans V 
puis utiliser la décomposition °. Nous considérons l'opérateur 


Pa = & 2: P(9) oPop(g) !. (16.43) 
gE 


Prouvons que ce Pa est encore un projecteur. D'abord pour tout g € G nous avons 


p(9)Pap(g) * -2 D P(gs)Pp(gs) 7 = Pc. (16.44) 
seG 


La dernière égalité est un changement de variables dans la somme. Cela signifie que P&p = pPa. 


3. La démonstration marche aussi pour les groupes compacts, mais il faudrait des intégrales. 

4. c’est-à-dire si p n’est pas irréductible. 

5. Ou encore prendre une base de W, l’étendre en une base de V et définir P comme l’annulation des coefficients 
des vecteurs « complétant » la base. 

6. Et c’est ça qui demande un peu de technique pour écrire la preuve dans le cas d’un groupe compact : il faut 
une mesure de Haar. 
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Nous avons même PGP = P parce que si v € W1, alors 


PG(v) = a > p(s)P p(s) lv (16.45a) 
seG WW. 

= a . p(s)p(s) lv (16.45b) 

2. (16.450) 


Pa Pe = pe D Pn()Po() (16.46a) 
g 

= _ D P(g)PaPp(g) (16.46b) 
g 

= _ D P(g)Pp(9) * (16.46c) 
g 

= Ps (16.464) 


Donc P& est un projecteur, est stable sous les conjugaisons par p(g) et commute avec p(g). Nous 
décomposant Id de façon évidente en 


Id = Pg + (Id—Pg). (16.47) 


Étant donné que l'opérateur Pg commute avec tous les p(g), les noyaux de PG et Id —Pg sont des 
sous-espaces invariants. Vu que P« est un projecteur, nous avons q(Pa) = 0 avec g(X) = X FX) 
Pour appliquer le lemme des noyaux (théorème 9.89), nous remarquons que g(X) = X(X — 1) et 
donc 

V = ker PG@ ker(Pc — 1). (16.48) 


Si nous posons W2 = ker Pe, il reste à voir que ker(Pc — 1) = W1. D'abord W1 € ker(Pc — Id) 
parce que si w € WA, ce dernier étant stable, 


1 - 
Pew = = D p(9)P p(9) ‘w (16.49a) 
|G| G —.—— 
ge eWi 
1 
a 16. 
a DE (16.49b) 
geG 
= w. (16.49c) 


Pour prouver l'inclusion inverse, nous savons que PG et P sont des projecteurs tels que P&P = P, 
ce qui signifie que l’image de P« est inclue à celle de P, c'est-à-dire à W1. Mais Image(Pc) = 
ker(1 — Pc), donc 

ker(1 — Pc) = Image(Pc) € Image(P) = W1. (16.50) 


La représentation p se décompose donc en deux sous-représentations (p, W1) et p, W2. Si l’une 
des deux n’est pas irréductible, le processus peut recommencer. Vu que la dimension de V est finie, 
toute représentation se décompose en une somme finie de représentation irréductibles. 


16.1.5 Structure hermitienne 


Soit (p, V) une représentation de G sur un espace vectoriel complexe V. Nous voulons munir 
V d’un produit scalaire hermitien (définition 9.172) tel que les opérateurs p(g) soient tous des 
isométries. C'est-à-dire que nous voudrions définir {u, va de telle sorte à avoir 


Cp(g}u, p(g)v)a = <u, v}a (16.51) 
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pour tout g € G. Nous commençons par considérer un produit hermitien €.,.) quelconque et puis 
nous définissons 
(u, v)G nn 


D p(g}u, p(g)v). (16.52) 


1 
GT & 
Nous devons vérifier que c’est un produit. La seule des conditions dont la vérification n’est pas 
immédiate est celle de positivité. Pour tout g € Get tout v € V, nous avons {p(gjv, p(g)v) est 
positif et nul si et seulement si p(g)u = 0. Étant donné que p(e)v = v, parmi les termes de la 
somme 

1 
we = D <p(g)v, p(g)v), (16.53) 
geG 


au moins un est strictement positif (pourvu que v # 0); les autres sont positifs ou nuls. Par 
conséquent {v,v)a = 0 si et seulement si v = 0. 

Donc les groupes finis peuvent être vus comme des parties de groupes d’isométrie. De la même 
façon, en utilisant une mesure de Haar pour faire la moyenne, nous pouvons plonger les groupes 
compacts dans des groupes unitaires. 


16.1.6 Caractères 


Définition 16.11. 
Soit (V,p) une représentation linéaire du groupe G. Le caractère de p est la fonction 


:G—C 
” (16.54) 
sr Tr (p(s)). 
Par invariance cyclique de la trace, nous avons 
Xp(sts71) = Xp(t), (16.55) 


ce qui fait que le caractère est une fonction constante sur les classes de conjugaison. 
D'après sa fiche wikipédia, le marquis de Sade, passionné de théâtre, faisait des représentations qui avaient du caractère. 


Un caractère irréductible est un caractère d’une représentation irréductible. 


Définition 16.12. 
Une application f : G — © est centrale si elle est constante sur les classes de conjugaison. 


Les traces sont des applications centrales. 

L'ensemble des fonctions centrales sur un groupe fini (ou tout au moins ayant un nombre fini 
de classes de conjugaison) est un C-espace vectoriel de dimension égale au nombre de classes, et 
nous pouvons mettre le produit scalaire 


Bo = T6). EqFFRUT 
1G seG 


C’est une forme hermitienne sur l’espace des fonctions centrales. 


16.2 Équivalence de représentations et caractères 


Cette section prend des éléments des articles lemme de Schur, caractère d’une représentation, 
fonction centrale et trace de wikipédia. 


Définition 16.13. 
Nous disons que les deux représentations (V, p) et (V”, p') sont équivalentes si il existe une bijec- 
tion linéaire f : V — V' telle que 

fap=paf. (16.57) 


Nous disons alors que f entrelace p et p. 
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ThoyftobH 
Théorème 16.14 (Théorème de Schur). 
Si (V, p) et (V’,p") sont des représentations irréductibles non équivalentes alors la seule application 
linéaire f : V — V' entrelaçant p et p' est la fonction nulle. 
En d’autres termes, soit les représentations sont équivalentes (et il y a un isomorphisme), soit 
il n'y a même pas un homomorphisme. 


Démonstration. Soit f € L(V, V’) telle que fo p = p'o f. Alors ker f est un sous-espace stable sous 
p(G), et Image(f) est un sous-espace de V” stable par p/(G). Par irréductibilité, nous avons que 
ker(f) = {0} ou V. Même chose pour Image(f). Il y a deux possibilités. 


(1) Si ker(f) = {0}, alors Image(f) Æ {0} et alors Image(f) = V’. Du coup f est injective et 
surjective, c'est-à-dire est un isomorphisme. 


(2) Si ker(f) = V, alors f = 0. 


Corolaire 16.15 (Schur pour les représentations sur €). 
Soit (V, p) une représentation irréductible, alors l’ensemble 


Enda(V, p) = {f € End(V) tel que po f = fop} (16.58) 
est l’ensemble des homothéties. 


Démonstration. Soit f € Enda(V, p). Vu que l’espace est sur ©, l’endomorphisme f a une valeur 

propre À. L'opérateur g = f— XI est aussi un opérateur d’entrelacement de p alors que ker(g) Æ {0} 

par définition de valeur propre. Du coup ker(g) = V, ce qui signifie que f est l’isométrie de rapport 

À: f = Àld. [ 
LempUSOÜlo 

Lemme 16.16. 

Si (p,V) et (p',V') sont des représentations équivalentes de caractères x et x’, alors x = X/. 


Démonstration. Si A: V — V’ est un isomorphisme d’espace vectoriel entrelaçant p et p', c’est-à- 
dire si pour tout g, p/(g)A = Ap(g), alors p/(g) = Ap(g) At et 


X(g) = Tr (p/(g)) = Tr (Ap(g) AT) = Tr (p(9)) (16.59) 


parce que la trace est un invariant de similitude (lemme 9.204). 


LemJqalZns 
Lemme 16.17. 
Si x est le caractère de 


la représentation complexe (V, p) du groupe fini G, alors pour tout g € G 
nous avons X(g7!) = x(g). 


Démonstration. Par le corolaire 2.14 au théorème de Lagrange, nous avons gl£l = e et donc en 
tant qu’opérateur, p(g)l6l = 1. Les valeurs propres de p(g) sont donc des racines de l'unité. Si 
nous notons À; ces valeurs propres, alors x(g) = ÿ;; À, et en considérant la matrice dans sa base 
de diagonalisation (lemme de Schur complexe, 12.100), nous voyons que 


x(977) = Tr (o() 7) = > _ (16.60) 


Mais À; étant une racine de l’unité nous avons + = À;, ce qui fait que 
12 


x (977) = D, = x). (16.61) 
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Proposition 16.18. 
Soient deux représentations irréductibles complexes (V, p) et 
et x! leurs caractères respectifs. Nous avons 


(1) &x, x) = 0 sip et p' ne sont pas équivalentes. 


(2) &x, x'> = 1 si les représentations sont équivalentes. 


Démonstration. Nous considérons les bases {e1,...,eh} de 
considérons la matrice F(k, {) 


(Eu)ij = ôkô. Nous posons 


>, 


-à = 


F(k,1) 0 p(g) 
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PropJzbfWi 


(V',p!) du même groupe fini G, et x 


V et {f1,..., fm} de V'. Puis nous 


= Ey € Mnn(C) où pour rappel, Eu est la matrice de composantes 


(16.62) 


En nous permettant de ne pas réécrire les indices k et ! de F'et FG, nous montrons que FG entrelace 


petp': 
Fes FO = Let) e #5) e db (16.632) 
_ _ > p(s)Fpl(s71t) (16.63b) 
L _ > p(tk)Fp (71) (16.63c) 
_ ne f) Lr(E (16.634) 
= h(t) o Fe (16.63e) 


Dans ce calcul nous avons effectué le changement de variables k = (s 


Par ailleurs nous avons 


—1+)=1 qui donne s = tk. 


(DFE D (D) = DDET F(E, Drd/(9")à (16.642) 
= D P(g)irôkr ds? (97 )s5 (16.64b) 
= ont Miÿs (16.64c) 

et par conséquent , . 
FE Dj a 2° (9). A5) 


Si x et x” sont les caractères de p et p/, alors nous avons le produit (16.56) qui donne 


XX) = _ 


D x(9)X/ (9) 


Si les représentations p et p' ne sont pas équivalentes, le fait 
pet p 


(16.66a) 

lemme 16.17 (16.66b) 
Sc) 

par (16.65). (16.66d) 


que FG en soit un opérateur d’entre- 


lacement implique par le théorème de Schur 16.14 que FG = 0 et donc €x, x’} = 0. 
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Si au contraire les représentation sont équivalentes, alors le lemme 16.16 nous dit que x = x’ 
et nous reprenons la définition : 


= a 2x0 X(9) -aDi-i (16.67) 


geG 


parce que les nombres Y(g) sont des racines de l’unité. 


16.2.1 Représentation régulière 
DEFO0oGGPTOoExTx\W; 


Définition 16.19. 
Nous notons À la représentation régulière gauche, agissant sur le K-espace vectoriel des fonc- 
tions G — K par 


(\()F) 0) = F9). (16.68) 
D'autre part nous considérons les fonctions 0,: G — K (ici K est R ou € ou pire) définie par 
1 sig=h 
ôg(h) = (16.69) 
O0 sinon. 


La représentation régulière agit sur les fonctions 6, de la façon suivante : 
À(9)Ôe = Ôgs (16.70) 


parce que (A(g)6s) (h) Te 6,(g 1h) mn Ôgs(h). 

LEMooGYIKooRRUxHq 
Lemme 16.20. 
Le caractère de la représentation régulière gauche est donné par 


xa = |GIGe. Es 


Démonstration. Appliquer l'équation (16.71) fonctionne parce que xx(e) est la dimension de l’es- 
pace des fonctions sur G@, c’est-à-dire |G|. Si par contre g Æ e, alors À(g) est une matrice de 
permutation (dans la base des 02) et a donc tous ses éléments diagonaux nuls. 


Si p est une représentation et si f est une fonction sur le groupe, alors nous considérons 
l’opérateur 


p; = >, f(g)p(9). (16.72) 


geG 
PropEAXKAY 


Proposition 16.21 ([172]). 
Si (p, V) est une représentation irréductible et si f est une fonction centrale sur @, alors l’opérateur 
p est une homothétie de V de rapport 


_— D F(g)X(9) (16.73) 
geG 


où x est le caractère de p. 


Démonstration. Nous commençons par voir que pf entrelace p. En effet, 


ptty lo pf © p(t D f(g)p(t gt) (16.74a) 
= 5 ft D p(h chm.var.h = t gt (16.74b) 
= D JU) ph) (16.740) 

h 


= p; (16.744) 
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où en écrivant f(tht-!) = f(h), nous avons utilisé le fait que f était centrale. Étant donné que p; 
entrelace une représentation irréductible, le lemme de Schur (16.14) nous indique que p/ est une 
homothétie. Soit k le facteur d’homothétie. Alors d’une part Tr(py) = nk. D'autre part, 


Tr(ps) = Tr (D S(g)p(9)) (16.75a) 
g 

= D f(9) Tr (p(9)) (16.75b) 

9 
= D F(g)x (0). (16.75c) 

9 

Du coup effectivement 
k= = D F(g)x(9). (16.76) 
geG 


16.2.2 Caractères et représentations : suite et fin 


Lemme 16.22. 
Un groupe fini n'a (à équivalence près) qu’un nombre fini de représentations irréductibles. 


Démonstration. Les caractères irréductibles forment un système orthonormé (proposition 16.18) 
et donc libre parmi les fonctions centrales. Donc il y a au plus autant de caractères irréductibles 
que la dimension de l’espace des fonctions centrales ; et ce dernier est de dimension finie donnée 
par le nombre de classes de conjugaison de G. 


Nous savons que les caractères de deux représentations équivalentes sont égaux. Etant donné 
qu’il n'existe qu’un nombre fini de représentations irréductibles, il existe un nombre fini de carac- 
tères irréductibles. Nous pouvons donc fixer les notations suivantes. Les caractères irréductibles 
seront notés {@i}i=1...n et nous noterons (9;, W;) une représentation ayant le caractère ç:. 


Théorème 16.23 ([172]). 

Soit (p,V) une représentation de G de caractère x. Alors sa décomposition en représentations 
irréductibles est donnée par 

h 
(V,p) = Œ kW, oi) (16.77) 
i=1 

avec k; = £X,wi). En particulier, à permutation près des facteurs, la décomposition d’une repré- 
sentation en représentations irréductibles est unique. 


Démonstration. La décomposition de x en caractères irréductibles est donnée par x = ÿ,; kig:; en 
prenant le produit de cette égalité avec &; et en tenant compte de l’othonormalité des caractères 
irréductibles, 


en : kipis 5) = kj. (16.78) 


Le théorème suivant est ce qui nous permet de dire que l’étude des caractères et l’étude des 


représentations, c’est la même chose. 
ThoWGkfADd 


Théorème 16.24. 
Soit G un groupe fini. ItemZReOWoHi 


(1) Deux représentations sont équivalentes si et seulement si elles ont même CATAÉ TES COWoH À à 


(2) Si x est le caractère d’une représentation, alors 


7. Nous sommes depuis longtemps dans l’étude des représentations des groupes finis. 
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(2a) XX EN 
(2b) &X, x) = 1 si et seulement si la représentation est irréductible. 


Démonstration. Nous démontrons chaque point séparément. 


(1) Le fait que deux représentations équivalentes aient même caractère est le lemme 16.16. Nous 
montrons l’autre sens. Si (p, V) et (p', V’) sont deux représentations irréductibles de décom- 
positions 


V = OkW (16.79a) 
V'= ŒKW;, (16.79b) 


alors si x = y’, nous avons k; = k! et les représentations sont identiques. 


(2) Soit (p, V) une représentation ayant x comme caractère. En posant k; = {x,4:) nous avons 
la décomposition en représentations irréductibles 


V= kW, (16.80) 


et aussi 


O0 = Dhipi, D hp = D'REN. (16.81) 


Ce nombre est de plus égal à 1 si et seulement si tous les termes de la somme sont nuls sauf 
un qui vaudrait 1. Ce cas donne une représentation irréductible. 


PropYLnxljk 
Proposition 16.25. 
Si (À, R) est la représentation régulière gauche de décomposition en représentations irréductibles 


R= OkWi, (16.82) 
alors 
(1) k; = dimW;, ITEMooLXIJooDxkGJh 
UN 
(2) >;(dim W;)* = |G{|, ItemEXAjTIh 


(3) pour tout ge G, Y,(dimW;)p:(g) = 08. 
(4) Si {(ni,wi)} est la liste des couples dimension, caractère des représentations irréductibles non 


équivalentes, alors pour tout s € G\{e} nous avons D}, nigi(s) = 0 où la somme porte sur 
les représentations irréductibles non équivalentes. 


Démonstration. Nous notons r le caractère de la représentation régulière gauche. Nous avons 


1 
ki = r,qù = = D r(s)gi(s) = qi(e). (16.83) 
|G] seG 
Mais wi(e) = dim(W;) € N, donc nous avons bien k; = dim(W/;). Le caractère de la représentation 
régulière peut alors s’exprimer de deux façons : 
\Glée = D (dim W;)i. (16.84) 


t 


En évaluant cette égalité en e nous trouvons directement 


GI = > (dim W:)?, (16.85) 


U 


8. Cette propriété est appelée « orthogonalité des colonnes » pour une raison qui apparaîtra au moment de 
compléter le tableau (16.111). 
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et en l’évaluant en s £ e, nous trouvons 


0 = Ÿ (dim Wi)i(s). (16.86) 
t 
fasdf 
Le théorème suivant est valable pour les groupes finis (comme toute cette section). 
Thogocemg 
Théorème 16.26 ([172]). 
Les caractères irréductibles X1,...,Xn forment une base orthonormée des fonctions centrales sur 


Cr. 


Démonstration. Nous savons déjà qu'ils forment un système orthonormé. Considérons le sous- 
espace H = Span{yi}i-1..n de l’espace des fonctions centrales sur G. En vertu de la proposi- 
tion 4.133, il nous suffit de prouver que H+ = {0}. Soit donc f, une fonction centrale appartenant 
à HT. Pour tout 4, nous avons (f,w;) = 0 et donc aussi (f,@;) = 0. 

Considérant une représentation irréductible (o, W) de caractère 4, nous savons par la proposi- 
tion 16.21 que l’opérateur 


0$= D, (g)#() (16.87) 


est une homothétie de rapport {f,@)/ dim W = 0. Étant donné que toutes les représentations sont 
des sommes directes de représentations irréductibles, en réalité l'opérateur p F St nul pour toute 
représentation p. En particulier pour la représentation régulière, 


= À7(6) = D, F(g)A(9)(&) = D F(9)67. (16.88) 
g 


geG 


En écrivant cette égalité avec t{ = e et puis en appliquant à 4 € G nous trouvons 


0= D F(g)6(k) = F(). (16.89) 
9 


Donc f =0et f est nulle. 


CorbdcVNC 
Corolaire 16.27. 
Le nombre de représentations irréductibles non équivalentes d’un groupe fini est égal à son nombre 
de classes de conjugaison. 


Démonstration. Le nombre de classes de conjugaison est la dimension de l’espace des fonctions 
centrales qui elle-même est égale au nombre de caractères irréductibles par le théorème 16.26. 
Enfin deux caractères irréductibles sont égaux si et seulement si les représentations sous-jacentes 
sont équivalentes. 


CORooWAGXooByre1l0 
Corolaire 16.28. 
Toutes les représentations irréductibles d’un groupe abélien sont de dimension 1. 


Démonstration. Le corolaire 16.27 nous dit qu’il y a autant de représentations unitaires qu’il n’y 
a de représentations irréductibles (non équivalentes). Mais les classes de conjugaisons sont des 
singletons (lemme 1.165). Nous avons donc exactement |[G| représentations irréductibles lorsque G 
est abélien. 

Mais d’autre part la proposition 16.25(2) donne ÿ;(dim W;)? = |[G| lorsque la somme parcours 
les représentations irréductibles. Il y a [G| termes à la somme, donc tous les termes doivent être 
1. 
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16.3 Représentation produit tensoriel 


Définition 16.29. 
Soient p et D, deux représentations d’un groupe G sur des espaces vectoriels V et W. La représen- 
tation produit tensoriel est la représentation 


p@:G—GL(V@W) 
(p @ D)(g)(v @ w) = p(g)v @ p(g)w. 


L'espace V @W est le produit tensoriel de V et W, défini en 11.157. 


(16.90) 


Pour trouver son caractère, nous considérons une base {e;} de V et une base {e,} de W, et la 
base {e; @ ea} de V@W. Donc 


(p@ D)(g)(ei: © Ex) = p(g)ei ® P(g)ea. (16.91) 


Nous devons savoir quelle est la composante « e; @ ex » de cette dernière expression, et c’est 
évidemment 


BG )bos (16.92) 


ce qui nous amène à dire que 
T(p® 6)(9) = DD P(g)6(g)aa = Tr (p(9)) Tr (6(9)), (16.93) 


c’est-à-dire au final que 


XpD6 = XpX$ Fa El, 


16.4 Exemple sur le groupe symétrique 


Soit G = S3, un des premiers groupes finis non abéliens. On en a une représentation de 
dimension deux en tant que permutation des sommets d’un triangle équilatéral, donnée dans 
l'exemple 16.6 ; nous notons p cette représentation. 

Nous y avons aussi la représentation de signature donnée par 


€: S3 — GL(C) 


ot e(o)ld. se 


Et enfin il y a la représentation triviale. Ce sont les trois représentations irréductibles ; pour rappel 
il y à autant de représentations irréductibles que de classes de conjugaison (corolaire 16.27). 


Classe de conjugaison taille X1 Xe Xp 


Id 1 1 1 2 
(A,B) 3 1 —1 O0 
(A,B,C) A 


Nous calculons par exemple le produit scalaire 


(1: x1(Id)xe(Id) +3 : x1(4, B)xe(A, B) +2 : x1(4,B,C)xe(A, B,C))  (16.96a) 
(16.96b) 


(XL: Xo) = 


OS oi 


D'autre part nous avons aussi 


1 
XX) = = :2-2+38-0+2-1)=1. (16.97) 


1438 CHAPITRE 16. REPRÉSENTATIONS ET CARACTÈRES 


16.5 Table des caractères du groupe symétrique S: 
SecUMIgTmO 
Pour la table des caractères de S4, voir [103]. Et si vous voulez la table des caractères du groupe 
diédral, vu que ce sont de isométries de R”, il faudra voir plus bas en la section 18.17. 


16.5.1 Calculs à partir de rien ou presque 


Nous savons que les classes de conjugaison dans $4 sont caractérisées par la structure des 
décompositions en cycles (proposition 1.284). Elles sont données dans l’exemple 1.287. 

Nous avons donc 5 classes de conjugaison, et il nous faut donc 5 représentations irréductibles 
non équivalentes (corolaire 16.27) dont nous allons chercher les caractères. 

La première est la représentation triviale de dimension 1 ; nous notons Y1 son caractère et nous 
avons la ligne 


| dimension || Id | (12) | (123) | (1234) | (12)(34) | 16.98 
xl 1 11111 | 1 . Su 


Ensuite nous avons la signature qui est un morphisme non trivial e: S, — {—1,1}. Nous avons 
alors la ligne 


| dimension || Id | (12) | (123) | (1234) | (12)(34) | Bac 
xl 1 1111117) 1] 
Une troisième représentation pas trop compliquée à trouver est celle 
Pp: Sa — GL(4,C) 


Pr(o)ei = ec(i): 


(16.100) 


Cela n’est pas une représentation irréductible parce que C* se décompose en deux sous-espaces 
stables : 


D —=Span(l. 1,11) (16.101a) 
H = {re C“ tel que x1 + x2 + æ3 + ta = 0}. (16.101b) 


La représentation induite sur D est la représentation triviale. Puis sur À, elle induit une autre 
représentation que nous allons noter ps. 

Nous allons à présent déduire le caractère de la représentation p, et prouver qu'elle est irré- 
ductible. Il est cependant possible de sauter cette étape en échange d’un certain travail sur les 
isométries du tétraèdre. Voir la proposition 18.195 et ensuite 

Nous avons la décomposition p, = p1 ® p, et donc 


Xp = X1+ Xs- (16.102) 


Nous savons déjà 1. Le caractère x, n’est pas très compliqué parce que x,(o) est une matrice de 
permutations des vecteurs de base. Donc la matrice p,(o) a un 1 sur la diagonale pour les à tels 
que o(i) = à. Nous avons donc 


Xp(d) = 4 Xp(12) = 2 (16.103a) 
xp((12)(34)) = 0 Xp(123) = 1 (16.103b) 
Xp(1234) = 0. (16.103c) 


Le caractère Y, peut être calculé par simple soustraction : 


dimension | 14 | (12) | (123) | (1234) | (12)(34) | EqTLZakt 


Avant d'ajouter cette ligne au tableau des représentations irréductibles nous devons savoir si ps 
en est une. Pour cela, tant que nous avons son caractère nous pouvons utiliser le critère du théo- 
rème 16.24 : 


1 
XsXs) = 5 D, sc). (16.105) 
Sal oES4 
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Nous avons tout de suite |[S4| = 4 + 3 : 2 = 24 et puis 
24%, Xs) = 37 +6 : 1°+8 : 0? +6 : (—-1)? +3 : (—1)? = 24, (16.106) 


donc oui, le caractère est irréductible parce que xs, xs) = 1. Et nous pouvons donc ajouter la 
ligne (16.104) à notre tableau. Par ailleurs, nous notons qu’elle est de dimension 3. 

Pour le reste nous savons qu'il y a autant de représentations irréductibles que de classes de 
conjugaison, de telle sorte qu’il ne manque que deux représentations irréductibles. De plus la 
proposition 16.25 nous dit que si n; est la dimension de la 4° représentation irréductible, alors 


Sal = D né. (16.107) 


Dans notre situation, si nous nommons n1 et n2 les dimensions des deux représentations qui nous 
manquent, nous avons 24 = n? + n3 + (1? + 1? + 32), c'est-à-dire n? + n3 = 13. Il n’y a pas des 
tonnes de sommes de deux carrés qui font 13. Il y a n1 = 2 et n2 = 3, et c’est tout. 

Nous recherchons donc encore une représentation de dimension 2 et une de dimension 3. Pour 
cela nous allons un peu regarder les produits tensoriels qui s'offrent à nous. Pour faire une dimension 
3, il faut faire le produit d’une de dimension 1 par une de dimension 3. Là encore le choix est très 
limité et nous demande d’essayer 

pw = Ps ® pe (16.108) 


qui agit sur l’espace W @ V4 par 
pw(g)(v ® x) = p:(g)v @ pe(g)x. (16.109) 


Pour savoir son caractère nous utilisons la petite formule toute simple (16.94) : nous multiplions 
case par case les tableaux (16.104) et (16.99) : 


| dimension | Id | (12) | (123) | (1234) | (12)(34) | 16.110 
xw| 8 3] =5) 0 | & | € | D 


Avant de réellement ajouter cette ligne au tableau, nous devons nous assurer qu’elle est bien 
irréductible. Nous utilisons le même critère : {xw,xw) = 1, donc c’est bon. 

Pour trouver le dernier caractère, que nous nommerons Y,, il ne faut pas beaucoup d’imagina- 
tion. Il suffit d'utiliser les relations d’orthogonalité du théorème 16.26, en sachant que la dimension 
est 2 et qu’alors y, (Id) = 2, c’est pas trop compliqué : 


dimension || Id | (12) | (123) | (1234) | (12)(34) 
A 1 1 à I 1 1 
Xe 1 | —1 1 —1 1 E E 
Xs 3 3 1 0 —1 —1 CAT | 
XwW 3 3 | —1 0 1 —1 
Xu 2 2 b C d e 


Les relations d’orthogonalité des colonnes de la propriété 16.25 nous permettent de calculer les 
coefficients manquants. En pratique, il suffit de prendre le produit scalaire de chaque ligne avec la 
première et d’égaler avec zéro. Nous trouvons b = 0, c = 1, d = 0, et e = 2. Le tableau final est : 


dimension || Id | (12) | (123) | (1234) | (12)(34) 
” 1 li. À 1 1 1 
Xe iepl à = 1 
16.112 
% 3 311 | 0 = I 68) 
ee 3 SL] Ÿ 1 = 
Xu 2 2) D | À 2 


Notons que nous sommes parvenus à remplir la dernière ligne sans rien savoir de la représen- 
tation qui va avec. Nous allons cependant donner une interprétation géométrique et fixer cette 
représentation comme agissant sur le triangle équilatéral en 16.33. 
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16.5.2 À propos de la représentation p, 


Une des représentations trouvées (la représentation p,) peut être vue comme le groupe Iso(T') 
des isométries affine du tétraèdre * grâce à la proposition 18.195 qui donne un isomorphisme de 
groupe 94 + Iso(T') lorsque Test un tétraèdre régulier de IR. 

Nous verrons donc ça plus en détail dans la section 18.10.19. 


16.5.3 À propos de la représentation p, 


Nous nous penchons à présent sur la représentations p, dont nous ne savons rien à part qu’elle 
est de dimension 2 et son caractère. 


Lemme 16.30. 
Nous avons pu(s) = Id pour tout s € V4. 


Démonstration. Tous les éléments de VA sont conjugués (à part l’identité, mais pour elle le résultat 
est clair), donc il suffit de prouver le résultat pour un élément quelconque. 
L'endomorphisme p,((12)(34)) est un endomorphisme d'ordre 2 sur IR? dont la trace est 2. 


Imposons donc 
a b a b 1 0 
Ê = (< a) = Co 1) (16.113) 


sous la contrainte a + d = 2. La résolution est assez rapide et donne b=c=0,a=d=l1. 

Vous voulez une démonstration plus technologique ? Oui ? Alors commencez par remarquer que 
l'opérateur À = Pa ((12)(34)) vérifie A? = 1, donc le polynôme X? — 1 est un polynôme annulateur 
de À. Il est peut-être minimal ou peut être pas, mais en tout cas le polynôme minimal divise 
celui-là et donc est soit X — 1 soit X + 1 soit X? — 1. Dans les trois cas il est scindé à racines 
simples, et l’endomorphisme À est diagonalisable par le théorème 9.213(3). 

Mais comme 4? = 1, les valeurs propres (ce qui est sur la diagonale) de À ne peuvent être que 
+1. La trace étant 2, les éléments diagonaux ne peuvent être que 1. Et À = Id. 


Le groupe V4 définit en 5.55 est normal dans S4, donc le quotient S4/VA4 est un groupe par le 
lemme 2.10. 


Lemme 16.31. 
L'application 
Du: S4/Va — GL(2,R) 


ble es 


est bien définie et donne une représentation irréductible de S4/Va. 


Démonstration. Montrons que c’est bien défini. Si s € V4 nous devons prouver que pags) = 
Pu(g). Vu que p, est un homomorphisme (c’est une représentation), et que p,(s) = Id nous avons 
directement 


Pu(gS) = Pu(g)Pu(s) = Pu(g). (16.115) 


Nous devons prouver que la représentation ÿ, est irréductible. Si un sous-espace non trivial 
Span(x) était stabilisé par P,, il serait également stabilisé par p4. Mais comme p,, est irréductible, 
elle ne stabilise personne. 


Lemme 16.32. 
Le groupe Sa/Va est un groupe non-abélien, isomorphe à S3. 


Démonstration. Le groupe S4/VA4 a une représentation irréductible de dimension 2, et n’est donc 
pas abélien par le corolaire 16.28. 

Il contient |S4|/|[V4] = 24/4 = 6 éléments (théorème de Lagrange 2.13). Or 6 = 3 x 2, donc 
le groupe S4/V4 est dans le cas non-abélien du théorème 5.25(2). Cette partie parle d’unicité du 


9. Définition 12.147. 
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groupe non-abélien d'ordre 6. Or S3 est un groupe non-abélien d’ordre 6, donc $4/V4 est isomorphe 
à S3. 


Attention : il n’est pas correct de dire que S4/V4 est un sous-groupe de S4 juste parce que c’est 
un quotient de S4; ce n’est en général pas vrai (exemple 2.11). 
NORMooQQCYo01ILyOxc 
16.33. 
Nous sommes maintenant aptes à identifier la représentation p,,. D'abord nous nous rappelons de la 
représentation ps: 54 — Iso(T”) de S4 sur le tétraèdre. Ensuite si À est un sommet dudit tétraèdre 
et que S3 € S4 est la partie qui fixe À alors nous avons une représentation 


Ps: 53 — Iso(T') (16.116) 


qui agit en réalité sur le triangle équilatéral T’ opposé au sommet À. 
Nous avons finalement la chaine d’homomorphismes de groupes 


Sas or) (16.117) 


Cela est donc une représentation S4 — Iso(T”). Elle est de dimension 2 et est irréductible (elle 
contient les rotations d’angle 27/3 qui ne fixent aucune direction). Elle est donc la représentation 
Pu dui est la seule irréductible de dimension 2. 

Nous avons donc montré que la représentation p,, dont nous ne savions rien est la représentation 
de $3 sur un triangle équilatéral obtenue à partir de celle de $4 sur le tétraèdre, en fixant un point. 
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Chapitre 17 


Encore de l’analyse (et c’est pas fini) 


17.1 Densité des polynômes 

CorRSczQD 
Corolaire 17.1. 
Si X © R est compact et de mesure finie!, alors l’ensemble des polynômes est dense dans 
(C(X, R), |.Îl2) - 


Démonstration. Si f est une fonction dans C(X,R) et si € > 0 est donné alors nous pouvons 
considérer un polynôme P tel que |f — Pl < €. Dans ce cas nous avons 


PE = [170 - Par < | édr = (x) (17.1) 


où {(X) est la mesure de X (finie par hypothèse). 


17.2 Primitive et intégrale 


Nous avons déjà parlé de primitive de fonction continue en la proposition 12.434. 
PropHFWNpRb 


Proposition 17.2. 
Soit I un intervalle borné ouvert de R. Une fonction h € C®(1) admet une primitive dans CE(1) 
si et seulement si \,h = 0. 


Démonstration. Si une primitive H de h est à support compact, alors 


Jr H(b) — H(a) =0—0=0. (17.2) 
I 


Pas de problèmes dans ce sens. 

Supposons maintenant que FA — (0. Le fait que À admette une primitive dans C'°(1) est 
évident : toute fonction continue admet une primitive ?. Soit H une telle primitive et À = H—H(b). 
Alors A(b) = 0 et 


Ë(a) = H(a) — H(b) = Jr — 0. (17.3) 


Nous rappelons que le support d’une fonction est la fermeture de l’ensemble des points de non- 
annulation. 

Supposons que le support de À soit inclus dans [m, M] € ]|a,b[. En prenant des nombres m/ et 
M' tels que a < m' < met M < M' < b (nous insistons sur le caractère strict de ces inégalités), la 
fonction h est nulle sur [a, m/] et sur [M', b] ; la fonction À doit donc y être constante. Mais nous 
avons déjà vu que (a) = H(b) = 0. Donc l’ensemble des points sur lesquels À n’est pas nul est 
inclus dans |m’, M'[ et donc est strictement (des deux côtés) inclus dans J. 


1. Dans R cette hypothèse est évidemment superflue par rapport à l'hypothèse de compacité ; mais ça suggère 
des généralisations .….…. 
2. Théorème 12.434. 
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17.2.1 Théorème taubérien de Hardy-Littlewood 


Un théorème taubérien est un théorème qui compare les modes de convergence d’une série. 


Lemme 17.3. 
Si f et g sont des fonctions continues, alors s(x) = max{f(x),g(x)} est également une fonction 
continue. 


Démonstration. Soit xo et prouvons que s est continue en 0. Si f(xo) À g(xo) (supposons f(xo) > 
g(xo) pour fixer les idées), alors nous avons un voisinage de x9 sur lequel f > g et alors s = f sur 
ce voisinage et la continuité provient de celle de f. 

Si au contraire f(x0) = g(xo) = s(x0) alors si (a,) est une suite tendant vers x, nous prenons 
N tel que | f(an) — f(xo)| < € pour tout n > N et M tel que [g(an) — g(xo)| < € pour tout n > M. 
Alors pour tout n > max{N, M} nous avons 


[s(an) — s(xo)| < €, (17.4) 


d’où la continuité de s en x. 


La proposition suivante dit que si une fonction connaît un saut, alors on peut la lisser par une 


fonction continue. 
PropTleYVw 


Proposition 17.4. 

Soit f continue sur [a,xol et sur [x0,b] avec f(xs) < f(xo). En particulier nous supposons que 
f(æo) existe et est finie. Alors pour tout € > 0, il existe une fonction continue s telle que sur [a, b] 
on ait s > f et 


b 
Î (= Pr) di <e (17.5) 
Démonstration. Nous notons À la taille du saut : 
A = f(x0) — (a5). (17.6) 
Quitte à changer a et b, nous pouvons supposer que 
A 
S(E) < F0) + + A7) 
pour æ€ [a,xol et 
2A 
f > f(xo) + F (17.8) 


pour æ € [x0,b]. C’est le théorème des valeurs intermédiaires qui nous permet de faire ce choix. 
Soit m(x) la droite qui joint le point (xo — €, f(xo — c)) au point (to, f(x5)). Nous posons 


f(x) si T < To — € 
s(x) = 4 max{m(x), f(x)} Sito—e<x< T0 (17.9) 
f(x) si T > TO: 


En vertu des différents choix effectués, c’est une fonction continue. En effet 


s(to — €) = max{f(xo — €), f(xo,e)} = f(xo — €) (17.10) 
et 
s(0) = max{m(o), (8 )} = fat) (17.11) 
parce que m(xo) = f(x9 ). En ce qui concerne l'intégrale, si nous posons 
M= sup |f(x) — f(y)|, (17.12) 
æ,ye[a,b] 


nous avons 


Le — f = [> = f<eM. (17.13) 
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LemauxrKN 
Lemme 17.5. 
Pour tout polynôme P, nous avons la formule 
00 1 
lim (1 — 2) he Î P(x)dx. (17.14) 
mn. n=0 0 


Démonstration. D'abord pour P = 1, la formule se réduit à la série géométrique connue (propo- 
sition 11.122). Ensuite nous prouvons la formule pour le polynôme P = XF et la linéarité fera le 
reste pour les autres polynômes. Nous avons 


is Ze"e” =. De) = - x = — _ — (17.15) 
Donc 1 
im (1 — x) 2 De. (17.16) 
Par ailleurs, c’est vite vu que 
[ z*dx = — (17.17) 


ThoPdDxgP 
Théorème 17.6 (Hardy-Littlewood[173]). 
Soit (an) une suite réelle telle que 


(1) % tend vers une constante, 
(2) F(x) = YF gant" a un rayon de convergence > 1, 
(Om Fire, 

Albra Se Léa = 


Démonstration. Quitte à prendre la suite bo = ap — let b, = an, on peut supposer ! = 0. 
Soit [' l’ensemble des fonctions 
7: [0,1]l—R (17.18) 
telles que 
(1) Die an7y(æ”) converge pour 0 < x < 1, 
(2) lims_,1- Do nt") = 0. 
Ce l'est un espace vectoriel. 


(1) Les polynômes sont dans F Soit y(t) = t°. Pour 0 < x < 1 nous avons 


00 00 Le] 
» an7y(x") = >, Ant < » Ant”. (17.19) 
n=0 n=0 n=0 
Donc la condition de convergence est vérifiée. En ce qui concerne la limite, 
00 
lim ÿan2"% = lim F(x‘)=0 (17.20) 
1 T0 1 


parce que par hypothèse, lim,_,,- F(x) = 0. 
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Définition de la fonction qui va donner la réponse Nous considérons la fonction 


_s { si 0 <t < 1/2 a 


1 sil/2<t<1, 
c’est-à-dire g = 1; 11]: Nous montrons que si g € [’, alors le théorème est terminé. Si 0 < x < 1, 
2 : ; 

on à 0 < x” < 1/2 dès que 

In(2) 

In(x) 
avec une note comme quoi In(x) < 0, donc la fraction est positive. Nous désignons par N, la 
partie entière de ce n adapté à x. L'idée est que la fonction g(x”) est la fonction indicatrice 
de0<n< N,,et donc 


(17.22) 


N> 
> ge") = > ds (17.23) 
n>0 n=0 
Mais si æ — 1, alors N, — ©, donc 
N Ne 
. … . — 0 nm 
im y = Em >. Un = Jim D age") (17.24) 
n=0 n=0 neN 


et cela fait zéro si ge T°. 


Approximation de g par des polynômes Nous considérons la fonction 


gt)-t | sitef0,1/2[ 
+ Atel DE 


(17.25) 


La seconde égalité est au sens du prolongement par continuité. La fonction À est une fonction 
non continue qui fait un saut de —2 à 2 en x = 1/2. En vertu de la proposition 17.4 (un peu 
adaptée), nous pouvons considérer deux fonctions continues s1 et 52 telles que 


8 <h< 9 (17.26) 
et 
1 
Î 892 —81< €. (17.27) 
0 


Notons que l'inégalité s1 < s2 doit être stricte sur au moins un petit intervalle autour de 
x = 1/2. Soient P1 et P2, deux polynômes tels que | Pi — sil < € et | P2 — 82lx < € (ici la 
norme supremum est prise sur [0,1]). C’est le théorème de Stone-Weierstrass (12.430) qui 
nous permet de le faire. 


Nous posons aussi * 
Qi=Pi+e (17.28a) 
Q3 = Pr —é (17.28b) 
Nous avons . { 
La-a<fo-n+n-r+r-0o (17.29) 


Pour majorer cela, d’abord Q1 — P; = P> — Q2 = €, ensuite, 
Pi — P= Pi - si +51 — 52 + 82 — Po (17.30) 


1 
dans lequel nous avons Pi — 51 < €, 82 — Pa < e et J,s1 — s2 < €. Au final, nous posons 
4 : 0 ; 
q = Q2 — Qù et nous avons 


\e 
Î q< 5e. (17.31) 
0 


3. À ce niveau, je crois qu’il y a une faute de frappe dans [473]. 
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Enfin nous posons aussi 
R;(x) = x + x(1 — x)Q:. (17.32) 


Ces polynômes vérifient R;(0) = 0, R;(1) = 1 et 


Ri < g< PR (17.33) 
parce que 
QD<Pi<h< P:< Q (17.34) 
et 
HE DOS ÉLUL = AD SCA 260. (17.35) 
————,—— 


g(t) 


4) Preuve que g est dans EF  D’abord si 0 < x < 1, x" < 1 pour un certain N, et alors 
que y D 


g(x\) = 0. Du coup la série 


00 N 
>. dag(r")= » An (17.36) 
n=0 


est une somme finie qui converge donc. 

D'autre part nous prenons M tel que |a,| < . pour tout n. Nous majorons ÿ,,.ù 4ng(x”) en 
utilisant R1. Mais vu que R: est un polynôme, nous pouvons dire que [Y 55 anR1(x")| < € 
en prenant x € [À,1[ et À assez grand. Nous avons : 


» ang(x")| < » Ang(x") — ù an R1(x”)| + > sR(e") (17.37a) 
< 64 À lle RE (17.37b) 
< e+ » lan |(R2 — R1)(œ°) (17.370) 
> - ie x") (Q — QU") SUBEQooATQHog ARyK 
= » _— Es (17.37e) 
<e+ - x) Da" q(a") subeatztn 
Justifications : 


— La ligne (17.37d) vient du fait que R2 — R1 = x(1 — x)(Q2 — Qi). 


— La ligne (17.37f) provient d’une majoration sauvage de 1/n par 1 et de 1 —x" par 1 —x. 


Par le lemme 17.5, nous avons alors 


1 
lim | D ang(x")| < E+ "| q < 6e. (17.38) 
ut 0 
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17.2.2 Théorème de Müntz 


Théorème 17.7 (Théorème de Müntz[174, 475, 476]). 
Soit Co([0,1]), l’espace des fonctions continues sur [0,1] muni de la norme |.|X ou |.|2 et une 
suite (an) strictement croissante de nombres positifs. Nous notons ox la fonction x + x”. 

Alors 


ThoAEYDdHp 


Span{1, Da, } (17.39) 


est dense dans Co([0,1]) si et seulement si 

om 1 

D — = +00. (17.40) 
An 


Nous prouvons le théorème pour la norme |.|2. 


Démonstration. Soit m € R*; nous notons An(m) la distance entre 0 et Span{da,..., Pan}: 
Cette distance peut être évaluée avec le déterminant de Gram (proposition 9.18) 


Clin Danse ss On 
An(m)? = tee Pen) (17.41) 
Pour calculer cela, nous avons besoin des produits scalaires 
; 1 
(Pas Pb) = [ id ES ER R (17.42) 


Pour avoir des notations plus compactes, nous notons ao = m. Donc nous avons à calculer le 
déterminant 


1 
G(bm Das «+ dax) = det (arr) (17.43) 
où à, = 0,...,N. Nous reconnaissons un déterminant de Cauchy (proposition 9.19) en posant, 
dans RER a = à et b; = à; +1. Etant donné que b; — b; = a; — a;, nous avons 


Losi<;en(as . a)? 
N IN 
[ol L=o(ai + à; +1). 


Nous séparons maintenant les termes où 4 ou j sont nuls. En ce qui concerne le dénominateur, il 
faut prendre tous les couples (4, j) avec à et j éventuellement égaux à zéro. Nous décomposant cela 
en trois paquets. Le premier est (0,0); le second est (0,4) (chaque couple arrive en fait deux fois 
parce qu'il y a aussi (4,0)); et le troisième sont les 4, j tous deux différents de zéro : 


bris Dons: 3 Day) nn (17.44) 


(2m +1) ] [Ci + a +1) [ [(ai+m +1)? (17.45) 
ij i 
Notons que dans le produit central, le carré est contenu dans le fait qu’on écrit I; et non ]] 
Nous avons donc 


i<j" 


IL<;(ai — à) [ai - m) 


CE D a 17.46 
(Gm; Dos Pan) (2m +1) [Ca + a; +1) [Tai + m +1)? 
Le calcul de G(has,..., Par) est plus simple” : 
LE N2 
G(Po “#4 Pan) DE Hs; cs) (17.47) 


PCT + a; + dr 


4. C'est ici qu’on se particularise à la norme ||.|2. 
5. Je crois qu’il y à une faute de frappe dans le dénominateur de [474]. 
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En divisant l’un par l’autre il ne reste que les facteurs comprenant m et en prenant la racine carrée, 


FT) 


An(m) 


1 E QG —mMm 
Vos Ll | 
Nous passons maintenant à la preuve proprement dite. Supposons que V = Span{@u,,i € N} 
est dense. Si m est un des a, il peut évidemment être approché par les D4,. Mais vue la densité 
de V, un 4 avec m # à; (pour tout i) alors d, peut également être arbitrairement approché par 
les Da,, c’est-à-dire que 
lim An(m) = 0. (17.49) 


—00 


Nous posons 


Un = In ( Se ) (17.50) 


An +m+l 


et nous prouvons que la série ÿ,,, u, diverge. En effet nous nous souvenons de la formule In(ab) = 
In(a) + In(b), de telle sorte que la N°somme partielle de ÿ;, u, est 


In D ) = In (2m + 1An(m)), (17.51) 


a+m+l an+m+l 


qui tend vers —00 lorsque N — 0. 
Si la suite (a) est majorée et plus généralement si nous n’avons pas a, — ©, alors évidemment 


la série >, ns diverge. Nous supposons donc que limy_,4 An = 0. Nous avons aussi 6 
— 2 l 2m +1 
un =Im (Te mi is es (17.52) 
An +mMm+l An +m+l An 
Une justification est donnée à l'équation (15.351). Ce que nous avons surtout est 
1 
June -(m+D) — (17.53) 
n n An 


Étant donné que la série de gauche diverge, celle de droite diverge”. 
Nous prouvons maintenant le sens opposé : nous supposons que la série ÿ,, 1/a, diverge et 
nous posons 
V = Span{d, tel que n e N}. (17.54) 


Il suffit de prouver que @ € V pour tout m parce qu'un corolaire du théorème de Stone- 
Weierstrass 17.1 montre que Span{®£ tel que k e IN} est dense dans C' pour la norme ||.|2. 


Si An — 0, nous avons : 
2m +1 
TT —_ 


An 


0 (17.55) 


nm 


et alors Ay(m) — 0. Dans ce cas nous avons immédiatement dy € V. 
Si par contre a, ne tend pas vers l'infini, nous repartons de l'expression (17.48), nous posons 
0 < à = sup, à; et nous calculons : 


N 
V2m+1An(m) =] (él (17.56a) 


sjutm+l 
N N 
QG +m 1 

< ——— = 1 — 17.56b 

Hé II( ren) ( ) 
pie en. (17.56c) 
S nn . ï C 

24 a+m+l a+m+l 


Cette dernière expression tend vers 0 lorsque N — co. 


6. Je crois qu'il y a une faute de signe dans la dernière expression de [475]. 
7. Nous utilisons le fait que si un = ÿ}v, en tant que suites et si >. un diverge, alors D. Un diverge. 
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REMooGPYYooCQJuFa 
Remarque 17.8. 
Certaines sources Ÿ citent le théorème de Müntz comme ceci (avec un implicite que a; # 0) : 


Span{1, Da} = C([0,1]) y __ +00. APE PE 


il 


Que penser de la présence explicite du 1 (c’est-à-dire de do) ou non dans l’ensemble ? 

Première chose : la présence éventuelle de & est la raison pour laquelle nous faisons commencer 
la somme à à = 2 et non à = 1. Dans le même ordre d'idée, si Span{®, } est dense, alors en prenant 
n'importe quelle queue de suite, ça reste dense. 

Prouvons donc l'énoncé (17.57). Si Span{1, ,} est dense, alors en posant 1 = 0, B; = @;-1 
notre théorème prouve que . & — +00, cela est exactement que + ee — +00. Dans l’autre 
sens, si > >1 + = +0, alors nous avons aussi » + = +00 et notre théorème dit que Span{a, } 
est dense. À fortiori, Span{1, pa,} est dense. 


Exemple 17.9. 
Nous savons depuis le théorème 15.118 que la somme des inverses des nombres premiers diverge. A 
17.3 Intégrales convergeant uniformément 


17.3.1 Définition et propriété 
DEFooSHWAooWtswtp 


Définition 17.10. 
Soit (Q,u) un espace mesuré. Nous disons que l'intégrale 


[ Ft di (17.58) 
Q 


converge uniformément en x si pour tout € > 0, il existe un compact K+ tel que pour tout 
compact K tel que K; € K nous avons 


. (17.59) 


[ f(x, w)du(w) 
Q\K 


Le point important est que le choix de Ke ne dépend pas de x. 
LemOgQdpJ 


Lemme 17.11. 
Soit 


Firi= [ f(x, w)du(w), (17.60) 


une intégrale uniformément convergente. Pour chaque k € N nous considérons un compact K} tel 
que 


l 
| f(x,w)du(w)| < —. (17.61) 
A\Kk k 
Alors la suite de fonctions Fy définie par 
Fi(x) = | f(x, w)du(w) (17.62) 


converge uniformément vers F'. 


8. Dont le rapport du jury 2014 
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Démonstration. Nous avons 


RG = Fo) = |f rmarauten - [ rmwduta) (17.63) 
= | le fa w)dy (us) (17.63b) 
=. (17.630) 


17.3.2 Critères de convergence uniforme 


Afin de tester l’uniforme convergence d’une intégrale, nous avons le critère de Weierstrass : 
ThoCritWeilntUnifCv 


Théorème 17.12. 
Soit f(x,t): [a, 5] x [a,co[— MR, une fonction dont la restriction à toute demi-droite x = c est 
mesurable. Si |f(x,t)| < g(t) et F7 w(t)dt existe, alors l'intégrale 


Î f(x, dt (17.64) 
0 


est uniformément convergente. 


Le théorème suivant est le critère d’Abel : 
ThoAbelIntUnif 


Théorème 17.13. 
Supposons que f(x,t) = p(x,t)W(x,t) où & et d sont bornées et intégrables en t au sens de Riemann 
sur tout compact [a,b], b > a. Supposons que : 


(1) 
(2) Y(x,t) 20, 


(3) pour tout x € [a, 5], d(x,t) est une fonction décroissante de t, 


(2 (x, dt} < M où M est indépendant de T et de x, 


(4) les fonctions x — Y(x,t) convergent uniformément vers 0 lorsque t — ©. 


Alors l'intégrale 
O0 
J f(x, t)dt (17.65) 


est uniformément convergente. 


Remarque 17.14. 
Etant donné que la fonction sinus est bornée, il est tentant de l’utiliser comme ç dans le critère 
d’Abel (théorème 17.13). Hélas, 


. 1 
[ sin(xt)dt = — x (cos(xT) — cos(x)), (17.66) 


qui n’est pas bornée en x. Poser w(x,t) = sin(xt) ne fonctionne pas pour assurer la convergence 
uniforme sur un intervalle qui contient des x arbitrairement proches de 0. Le critère d’Abel avec 
p(x,t) = sin(xt) ne permet que de conclure à l’uniforme convergence sur tout compact ne contenant 
pas 0. C’est toutefois souvent suffisant pour étudier la continuité ou la dérivabilité en se servant 
coup du compact, voir 17.18. 
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17.4 Fonctions définies par une intégrale 
SecCHÿnBD;j 
Soit (Q,u) un espace mesuré. Nous nous demandons dans quel cas l’intégrale 


F(x) = [ bu (17.67) 


définit une fonction F' continue, dérivable ou autre. 

Dans la suite nous allons considérer des fonctions f à valeurs réelles. Quitte à passer aux 
composantes, nous pouvons considérer des fonctions à valeurs vectorielles. Par contre le fait que x 
soit dans R ou dans IR” n’est pas spécialement une chose facile à traiter. 


17.4.1 Continuité sous l’intégrale 


Nous allons présenter deux théorèmes donnant la continuité de F. 
(1) Si f est majorée par une fonction ne dépendant pas de x, nous avons le théorème 17.15, 


(2) si l'intégrale est uniformément convergente, nous avons le théorème 17.16. 
ThoKnuSNd 


Théorème 17.15. 
Soit (Q,u) est un espace mesuré, soit x0 € R” et f:U x (Q—R où U est ouvert dans R”. Nous 
supposons que 


(1) Pour chaque x € R"?, la fonction w + f(x,w) est dans L'(Q, pu). 


(2) Pour chaque w € Q, la fonction x — f(x,w) est continue en to. LtenNAuYNC 


(3) I existe une fonction G € L\(Q) telle que 
[f(æ,w)| < G(w) (17.68) 


pour tout x E U. 
Alors la fonction 
F':U—R 


(17.69) 
ne [ f(&,w)du(u) 
Q 


est continue en to. 


Démonstration. Soit (x,) une suite convergente vers x0. Nous considérons la suite de fonctions 
În: à — R définies par 
Jn(w) = f(tn,w). (17.70) 


sur qui nous pouvons utiliser le théorème de la convergence dominée (théorème 14.200) pour obtenir 


Jim Fe) = ji, [ fr )du(e) (7:18) 
= | Jim (Zn, w)du(w) (17.71b) 
Q 
L [ en (17.710) 
=). (17.71d) 


Nous avons utilisé la continuité de f(.,w). 


Si nous avons un peu de compatibilité entre la topologie et la mesure, alors nous pouvons 
utiliser l’uniforme convergence d’une intégrale pour obtenir la continuité d’une fonction définie par 
une intégrale. 
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ThotexmgE 
Théorème 17.16. 
Soit (Q, 1) un espace topologique mesuré tel que tout compact est de mesure finie. Soit une fonction 
J:RxO—R telle que 


(1) Pour chaque x € R, la fonction f(x,.) est L'(Q, pu). 
(2) Pour chaque w € Q, la fonction f(.,w) est continue en to. 
(3) L'intégrale 
FGÿ= [ Fute (17.72) 


est uniformément convergente °. 


Alors la fonction F' est continue en xo. 


Démonstration. Nous reprenons les notations du lemme 17.11. Les fonctions 


Fi(x) = | f(x,w)du(w) (17.73) 
K% 


existent parce que les fonctions f(x,.) sont dans L!(Q). Montrons que les fonctions F4 sont conti- 
nues. Soit une suite Ty} — xp nous avons 


lin F(n) = lim [. (17.74) 


Nous pouvons inverser la limite et l’intégrale en utilisant le théorème de la convergence dominée. 
Pour cela, la fonction f(xh,w) étant continue sur le compact K%, elle y est majorée par une 
constante. Le fait que les compacts soient de mesure finie (hypothèse) implique que les constantes 
soient intégrables sur X4. Le théorème de la convergence dominée implique alors que 


Jim (an) = Ï ln, Jen w)du(u) = | f(eou)du(e) = Fi(ro) (17.75) 


n—00 
K% 


Nous avons utilisé le fait que f(.,w) était continue en x. 
Le lemme 17.11 nous indique alors que la convergence F% — Fest uniforme. Les fonctions F4 
étant continues, la fonction Fest continue. 


Pour finir, citons ce résultat concernant les fonctions réelles. 
TholnDerrtCvUnifFContinue 


Théorème 17.17. 
Nous considérons F(x) = F7 f(x,t)dt. Si f est continue sur [a, 8] x [a, a et l'intégrale converge 
uniformément, alors F(x) est continue. 


17.4.2 Le coup du compact 
NORMooZWECooHvRgBw 


17.18. 

Nous avons vu des fonctions définies par toute une série de processus de limite (suites, séries, 
intégrales). Une des questions centrales est de savoir si la fonction limite est continue, dérivable, 
intégrable, etc. étant donné que les fonctions sont continues. 

Pour cela, nous inventons le concept de convergence uniforme. Si la limite (série, intégrale) est 
uniforme, alors la fonction limite sera continue. Il arrive qu’une limite ne soit pas uniforme sur un 
intervalle ouvert ]0,1], et que nous voulions quand même prouver la continuité sur cet intervalle. 
C’est à cela que sert la notion de convergence uniforme sur tout compact. En effet, la notion de 
continuité est une notion locale : savoir ce qu’il se passe dans un petit voisinage autour de x est 
suffisant pour savoir la continuité en x (idem pour sa dérivée). 


9. Définition 17.10. 
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Si nous avons uniforme convergence sur tout compact de [0,1], mais pas uniforme convergence 
sur cet intervalle, la limite sera quand même continue sur 0,1]. En effet, si x €]0,1], il existe un 
ouvert autour de x contenu dans un compact contenu dans ]0,1]. L’uniforme convergence sur ce 
compact suffit à prouver la continuité en x. 

Déduire la continuité sur un ouvert à partir de l’uniforme convergence sur tout compact de 
l’ouvert est appelé faire le coup du compact. 


17.4.3 Dérivabilité sous l’intégrale 


Nous traitons à présent de la dérivabilité de la fonction F définie comme intégrale de f. Dans 
le théorème 17.19 nous traitons de fonctions sur R à valeurs dans C. Pour les fonctions définies 


sur C, voir le théorème 26.73. 
ThoMWpRKYp 


Théorème 17.19 (Dérivation sous le signe intégral, formule de Leibnitz, thème 61[450, 477]). 
Soit (Q,u) un espace mesuré, un intervalle ouvert T € R, et une fonction f: R x Q — C. Nous 
supposons qu'il existe À mesurable de mesure nulle dans Q tels que 


ITEMooAFVMooAeCEco 
(1) Pour tout x € I, la fonction w + f(x,w) soit dans L!(Q). ITEMoOXIZXo0GPYFyT 
a ni 10 
(2) L'application x + f(x,w) est dérivable ” pour tout x € I et pour tout w EQ}ADrrroowk1afs 
(3) I existe une fonction G: Q — R* intégrable sur Q telle que 
Ô EQooUHQY 
AL) < G(w) QocUHQY ou, 
pour tout x € TI et pour tout w € Q\A. 
Alors la fonction 
F:R—C 
17.77 
re [ rude) Ce 
est dérivable sur I et pour tout a € I nous avons 
Ô 
Fa) — [ de (17.78) 
Q 0x 


Démonstration. Soit une suite (x,) dans 1 telle que æ» # a et tn — à. Si la limite 


im (0) = Fan) 


no a — Ln 


(17.79) 


existe et ne dépend pas de la suite choisie, alors la fonction F' est dérivable en a et sa dérivée vaut 
cette limite. Autrement dit, nous nous mettons en devoir d'étudier la limite 


lim [ f{aw) — JGn0) FORT 80) 
Q 


no a — Tn 


montrer qu’elle existe, ne dépend pas de la suite choisie et vaut ” 0x f(a,w)dw. On y va. 


(1) La bonne suite de fonctions D'abord nous posons 


 _ (tn) — f(aw) EqFAYRqE 


Tn — à 


Nous montrons à présent que cette suite vérifie les hypothèses du théorème de la convergence 
dominée 14.200. 


10. La dérivabilité pour une fonction à valeurs dans € n’a rien de mystérieux : c’est la dérivée composante par 
composante. Rien à voir avec la dérivée complexe. 
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— Chacune des fonctions g, est dans L1(Q) parce que, a étant fixé, l'élément x, est dans 
1\{a} ; le dénominateur n’a donc aucun rôle. L'hypothèse (1) montre que w- f(x»,w) 
et wt f(a,w) sont dans Li. La somme est donc dans L! (proposition 14.186). 


— Par l'hypothèse (2), pour chaque w nous avons une fonction dérivable. Nous pouvons 
donc passer à la limite : 
Of 


Jim In(w) = Sa (@w). (17.82) 

— En ce qui concerne la majoration de g,, nous utilisons le théorème des accroissements 

finis 12.195(2). Pour chaque w, ce théorème peut être utilisé sur la fonction x + f(x,w) 
qui est dérivable. Nous avons : 


no En , 0 
Æ = = . ®) < re PE) < G(w). (17.83) 


Nous avons utilisé l'hypothèse (3). 
Les hypothèses de la convergence dominée sont satisfaites. 


(2) Convergence dominée Le théorème de la convergence dominée de Lebesgue (théorème 14.200) 
nous permet alors de calculer la limite (17.80) : 


| | _pof 
Jim (du = [ Jim In(w)dw = [ 3 (a w)du. (17.84) 


Notons que l'existence de la dernière intégrale fait partie du théorème de la convergence 
dominée. 


Nous avons donc prouvé que la limite de gauche existait et ne dépendait pas de la suite 
choisie. Donc Fest dérivable en a et la dérivée vaut cette limite : 


Fa) = [ CL (a cs)dpte) (17.85) 


En ce qui concerne les fonctions dans R?, il y a les propositions 17.27 et 17.28 qui parlent de 
différentiabilité sous l’intégrale. 


ii Avertissement /question au lecteur !! 17.20 
Attention : l’énoncé et la démonstration de la proposition 17.21 sont de moi. Ecrivez-moi pour 

— me dire si ça vous semble correct (ou pas), 

— me donner un lien vers une source qui énonce et démontre ce résultat. 

PROPooJKXJooLxgEGd 

Proposition 17.21 ([1]). 
Soient un espace mesuré (Q,y1) ainsi qu'une fonction f: R? x Q — C. Si w € Q est fité, nous 
notons 


ns: RC 
Î (17.86) 
Tr f(x, w) 
et si x e R" est fité, nous notons 
2: A —C 
Î (17.87) 


wr f(x,w). 


Soient Ô > 0, À de mesure nulle dans et une liste d’indices |! à tels que 
(1) pour tout x € R”, la fonction fx est dans L'(Q), 
(2) la dérivée partielle multiple © f(x) existe pour tout x € B(a,ô) et pour tout w € A°. 


11. Voir -2.1. 
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(3) pour toute queue B de la liste d'indice à, il existe une fonction Gg € L'(Q) telle que 
(OF fu) (x)| < Ga(w) (17.88) 


pour tout x € B(a,ô) et we A°. 


Enfin nous posons 
Fo = É ee dit (17.89) 


Alors pour toute queue de suite B de a, nous avons 
(1) (OF) existe en a, 
(2) nous avons la formule 


(@8F)(x) = ROAOTO PNR Sp) 


Démonstration. Nous allons opérer une récurrence sur a. Plus précisément, si [a] = p, nous allons 
ajouter une dérivation à la fois, et dans l’ordre inverse de a. Donc nous commençons par 64, puis 
par (0-1; 0p), etc. 

Nous commençons par prouver la formule (17.90) dans le cas de 8 = (a,). Et pour alléger les 
notations nous notons a, = 2. Nous posons 


:RxAN—-C 
. (17.91) 
(t,w) — f(a + te;,w). 
Posons H(t) = F(a +te;), c’est-à-dire 
HD = | (a+ tesu)dut) = | ee water. (17.99) 
En utilisant le théorème 17.19 sur la fonction 4 nous trouvons 
of 
æO) = [ #adute) = | AE (audute, (17.93) 
(e) Q OTi 


ce qui est la formule demandée dans le cas & = (4). 

Pour la récurrence, nous supposons que la formule est démontrée pour 8 = (a,_x,...,a»), et 
nous montrons qu’elle fonctionne encore pour © = (i, B). 

Il s’agit simplement de remarquer que la fonction 


g(x,w) = (0° fu)(x) (17.94) 


vérifie encore les conditions du théorème 17.19 !2. 


17.4.4 Absolue continuité 


Définition 17.22. 
Une fonction F: R — R est absolument continue sur [a, b] si il existe une fonction f sur [a, b] 
telle que 


DefAbsoluCont 


re = | | f(bdt (17.95) 


pour tout x € [a, b]. 
ThoDerSousIntegrale 


Théorème 17.23. 
Soient À un ouvert de R et ( un espace mesuré. Soient une fonction f: Ax(Q—R et 


F(x) = [ en (17.96) 


Nous supposons les points suivants. 


12. Je n'ai pas fait cette vérification. Écrivez-moi si vous l'avez faite. 


17.4. FONCTIONS DÉFINIES PAR UNE INTÉGRALE 1457 


(1) La fonction f est mesurable en tant que fonction À x Q — R. Pour chaque x € À, la fonction 
f(x, : ) est intégrable sur (1. 


(2) Pour presque tout w € Q, la fonction f(x,w) est une fonction absolument continue de x. 


(3) La fonction gi est localement intégrable, c’est-à-dire que pour tout [a,b] € À, 


(ra)| du dr < 00: (17.97) 


Alors la fonction F est absolument continue et pour presque tout x € À, la dérivée est donné par 


Le —= of T,wW)aw 
Fuji = [ (a w)du. (17.98) 


La proposition suivante sera utilisée entre autres pour montrer que sous l’hypothèse d’une 


densité continue, la loi exponentielle est sans mémoire, proposition 36.133. 
PropDerrFnAvecBornesFonctions 


Proposition 17.24. 

Soit f(x,t) une fonction continue sur [a,B] x [a,b], telle que gi existe et soit continue sur 
la, B[x[a,b]. Soient (x) et (x), des fonctions continues de [a, 5] dans R et admettant une 
dérivée continue sur |a, B[. Alors la fonction 


FE) J J(E tdi (17.99) 
admet une dérivée continue sur |a, BT et 


PC) or rrrnAVvecDLO 
I CC OC arte 


L'exemple qui suit devrait pouvoir être rendu rigoureux en utilisant des distributions correc- 


tement. 
ExfYXeQg 


Exemple 17.25. 
Si g est une fonction continue, la fonction suivante est une primitive de g : 


bel 00 
Î g(t)dt = | g(t)Ltcr(t)dt. (17.101) 
0 0 
Nous nous proposons de justifier de façon un peu heuristique le fait que ce soit bien une primitive 
de g en considérant la fonction 

f(t,x) = g(t)liex(t). (17.102) 
Nous posons 


L [ da (17.103) 
0 


et nous calculons F” en permutant la dérivée et l'intégrale !*. D'abord, 


t ite [0 
ft, x) = É El (17.104) 
0 sinon. 

La dérivée de f par rapport à x est donnée par la distribution 

Of 

Sa C0: Z0) — g(to)ô(to = Ba}: (17.105) 
Donc 

Fc) = | Stadt = | g(#)ôtt — 20) = gu0) (17.106) 
o 07 0 

comme attendu. VAN 


13. Ceci n’est pas rigoureux : il faudrait avoir un théorème à propos de distributions qui permet de le faire. 
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Cet exemple est rendu rigoureux par la proposition suivante. 
PropJLnPpaw 


Proposition 17.26. 
Si f € L\(R), alors la fonction 


EG = [ f(é)at (17.107) 


est presque partout dérivable et pour les points où elle l’est, nous avons F'(x) = f(x). 


17.4.5 Différentiabilité sous l’intégrale 


Le théorème suivant est restrictif sur l’ensemble d’intégration (qui doit être compact), mais 


accepte des fonctions de plusieurs variables, ce qui est un premier pas vers la différentiabilité. 
PropDerrSSIntegraleDSD 


Proposition 17.27 (Dérivation sous l’intégrale). 
Supposons À € R” ouvert et B € R”? compact. Nous considérons une fonction f: À x B — R. Si 


pour un 1€ {i,...,n}, la dérivée partielle ne existe dans À x B et est continue, alors la fonction 
FE) = Ï f(x,t)dt (17.108) 
B 
admet une dérivée partielle dans la direction x; sur A. Cette dérivée partielle y est continue et 
OF Of 
,t)dt, 17.109 
(0) = | Stan (17.109) 


pour tout a dans l’ouvert A. 


Démonstration. Nous procédons en plusieurs étapes. 


(1) Fest dérivable Nous voulons prouver que SE (a, t) existe. Pour cela nous posons 


AC OR CA ET nn 
€ 


gu(t) = (17.110) 
où € est une suite de nombres tendant vers zéro. La fonction f est dérivable dans la direction 
x; si et seulement si limy_,, g(t) existe et ne dépend pas du choix de la suite. À ce moment, 
la valeur de la dérivée partielle sera cette limite. Dans notre cas, nous savons que f admet 
une dérivée partielle dans la direction x; et donc nous avons 


of 
0x; 


(a,t) = dim g(t). (17.111) 


De la même façon pour F' nous avons 


F 
: = lim | g(t)dt. (17.112) 
B 


0x; 1—00 

Sous-entendu : si la limite de droite ne dépend pas de la suite choisie, alors L existe et vaut 
cette limite. 

Considérant la continuité de f, le seul point à vérifier pour le théorème de la convergence 
dominée de Lebesgue est l’existence d’une fonction intégrable de t majorant g. Pour cela le 
théorème de accroissements finis (théorème 12.195) appliqué à la fonction € f(as,..., a+ 
E,..., An) nous dit que 

Of 


Fldises ss ass Tasset dit) —ar.(a1...,6,...,an,t) (17.113) 
v 
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pour un certain 0 € B(a;,4). Notons que ce 0 dépend de t mais pas de {. Vu que @;f est 
continue par rapport à ses deux variables, si K est un voisinage compact autour de a, il existe 


M > 0 tel que 
‘1 (9) <M Eqarir 
Ti 


pour tout x € K et tout t € B. La valeur de 2 (a, ...,0,...,4@n,t) est donc bien majorée 
par rapport à 0 et par rapport à { en même temps par une constante qui n’a pas de mal à 
être intégrée sur le compact B. 


Le théorème de la convergence dominée (théorème 14.200) s'applique donc bien et nous avons 
lim | g(t)dt = Li lim gi(t = [7 (a,t)d (17.115) 
1—00 B EPA 


Le membre de droite ne dépendant pas de la suite €, choisie, le membre de gauche est bien 
la dérivée de F' par rapport à x; et nous avons 


D (a,t)dt. (17.116) 


Cela prouve la première partie de la proposition. 


(2) La dérivée est continue Soit X un voisinage compact autour de a et U” un ouvert tel 
que a € U' € K. Nous avons encore la majoration (17.114) sur U” et donc le théorème de 
continuité sous l'intégrale 17.15 nous indique que la fonction 


U'-R 


ze Ï À (3, bat 
B OT; 


(17.117) 


est continue en a. 


Une conséquence de la proposition 17.27 est que si elle fonctionne pour tous les 4, alors F 
est différentiable et même de classe C!, et la différentielle de F s'obtient comme intégrale de la 
différentielle de f. 


PropAOZkDsh 
Proposition 17.28. 
Supposons À € R”' ouvert et B € R" compact. Si pour tout i € {i,...,n}, la dérivée partielle _. 
existe dans À x B et est continue, alors F est de classe C* et 
(4F}e = Ï (df)adt (17.118) 
B 


où f(x) = f(x, t). 


Démonstration. En vertu de la proposition 17.27, toutes les dérivées partielles de F sont continues. 
Cela implique que F est de classe C! par le théorème 12.306 et que la différentielle s’écrive en termes 
des dérivées partielles avec la formule usuelle. Nous avons alors 


(dF)a(u) = Y, TE -(a)ux (17.119a) 
k 
fs, 
= Le an (er 0dt (17.119b) 
: LEA | 
ee )uxdt (17.119c) 
= Ï (dfr)a(u)dt. (17.1194) 
B 


Ce qui est la formule annoncée. 
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Un autre théorème tourne autour du pot, et me semble inutile. 
ThoOLAQyRL 


Théorème 17.29. 
Soit (Q, 1) un espace mesuré, une fonction f: R°xXQ —Retae R". Nous considérons la fonction 


- | f(x, w)du(w). (17.120) 
(o 
Pour chaque k = 1,...,n nous supposons avoir 
Q 
BE (= RO = | Die(ax w)du(e) (17.191) 
tk k o ot 


où F},(t) = F(a1,...,t,...,an) et f, est définie de façon similaire. 
Nous supposons de plus que les fonctions ©,,F sont continues. 
Alors F est de classe C? et sa différentielle est donnée par 


dFy = [ (dfs)adu (17.122) 
A 


où fs est définie par f(x) = f(x, w). 


Démonstration. Étant donné que les dérivées partielles de F en a existent et sont continues, le 
théorème 12.306 dit que Fest différentiable et que 


dF(u) = : ——(a)ux. (17.123) 


&F{u) = Ÿ TE (aux (17.124a) 
= 
= [ a (agsa)und(es) (17.124b) 
a 


> 

k 
—= LEE a W)u & C 
- LE RL (au ur du(e) (17.124c) 


- [RCAOP TO) (17.194) 


et donc dFy = fo(dfs)adu(w). 


Notons qu’en passant aux composantes, ce théorème fonctionne tout aussi bien pour des fonc- 


tions à valeurs dans un espace vectoriel normé de dimension finie plutôt que dans R. 
LemWNBooGP1lIwT 


Lemme 17.30 (Hadamard/{4178]). 
Soit une fonction f : R" — R de classe CP avec p > 1. Pour tout a € R'" il existe des fonctions 
Q1,..., On de classe CP telles que 


f(œ) = fa) + D (mi — ai)gi(x). (17.195) 


Démonstration. Puisque f est de classe C?, le théorème fondamental de l’analyse 14.263 s'applique 


et 
1 
f(x) — f(a) = Î Se + t(x — a)) ) [at = [ - a: (a + (x — a)) (æ 5) 070) 


0 
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Plus de détails : la fonction t z| f(a+t(x- a))| possède comme primitive la fonction F(t) = 


f(a+t(x—a)). 


Nous posons 


1 
mt) = [ L (a +t(x — a))dt (17.127) 


L'intégrale existe parce qu'il s’agit d’une fonction continue sur un compact et donc majorée par 
une constante. Pour voir que g; est de classe C?—! nous pouvons calculer cu en permutant dérivée 
et intégrale par la proposition 17.27 : 


09 6 Of : Un OU 
OTk Ge [ OTk (CE (a en à) A [ dE 


Nous pouvons ainsi permuter p — 1 dérivées tout en gardant une fonction continue dans l'intégrale. 
Le théorème 17.15 nous donne alors une fonction continue. Ainsi toutes les fonctions 


(a+t(x— a)). (17.128) 


CE 

7 (17.129) 
ob, OT, 1 
sont continues et g; est de classe CP! par le théorème 12.341. 
En repartant de (17.126) nous avons alors bien ce qui était annoncé : 

nm 
fe) = fa) + D gifx)(xi — &). (17.130) 

i=1 
CorQBXHooZVKeNG 


Corolaire 17.31. 
Soit be D(R) tel que YW)(xo) = 0 pour tout k < n. Alors il existe une fonction Ÿ € Z(R) telle 
que 


() = (x x0)"*" (x) (17.131) 
pour tout x € R. 


Démonstration. En utilisant le lemme de Hadamard 17.30 avec a = 0, n = 1 et f(x0) = 0, nous 
avons une fonction g1 à support compact telle que 


G(x) = do) + (x — o)g1(x). TPS) 


Alors #'(x) = g1(x) + (x — x0)g\ (x), ce qui donne immédiatement g1(x0) = 0 et donc une fonction 
g2 telle que g(x) = (x — xo)g2(x). En injectant dans (17.132) nous avons 


(x) = (x — xo) g(x). (17.133) 


Il suffit de continuer ainsi tant que les dérivées de ® s’annulent. 


17.5 Deux théorèmes de point fixe 


Nous allons voir Picard. Les autres théorème de point fixe que sont Brouwer, Schauder et 
Markov-Kakutani sont plus bas * parce qu’ils utilisent de l'intégration. Voir le thème 64 pour les 
retrouver. 


14. Dans la section 20.5. 


1462 CHAPITRE 17. ENCORE DE L'ANALYSE (ET C’EST PAS FINI) 


17.5.1 Points fixes attractifs et répulsifs 
DEFooTMZUooMoBDGC 


Définition 17.32 ([1]). 
Soit I un intervalle fermé de R et @: 1 — I une application CT. Soit a un point fixe de ©. Nous 
disons que a est attractif si il existe un voisinage V de a tel que pour tout xo € V la suite 
Tn+1 = P(Xn) converge vers a. 

Le point a sera dit répulsif si il existe un voisinage? V de a tel que pour toute suite de la 
forme tn+1 = Q(&n), st un € V, alors |tn+1 — a] > [un — al. 


17.33. 
Beaucoup de sources prennent le lemme 17.34 comme définition de point fixe attractif et répulsif. 
Celle en termes de suites ne demande au moins pas la dérivabilité de f. Elle est donc un tout petit 
peu plus générale. 

LEMooTIRAooQIHLyt 
Lemme 17.34 ([479, 480]). 
Soient un intervalle I de R, et une application w: I — I de classe C*. Soit a un point fixe de o. 

(1) Si |g'(a)| < 1 alors a est attractif et la convergence est au moins exponentielle. 


(2) Si |w'(a)| > 1 alors a est répulsif et la divergence est au moins exponentielle. 


Démonstration. Si |g'(a)| < 1 alors il existe 4 tel que [w’(a)| < k < 1 et par continuité il existe 
un voisinage V de a dans lequel [g/(x)| < k pour tout x € V. En utilisant le théorème des 
accroissements finis {6 nous avons 


Tr — a] = [p(xn) — al < k|zn-1 — a] (17.134) 


et par récurrence 
[tn — al < k"|xo — al. (17.135) 


Pour la seconde partie, nous supposons que |f'(a)| > 1. Il existe un voisinage V sur lequel 
f" > 1. La formule des accroissements finis donne une application a: R — R telle que 


f(a+h) = f(a) +hf'(a) + a(h) (17.136) 


et a(h)/h — 0. Nous restreignons V pour que tout x € V nous ayons [a(x—a)/[x—a|+|f'(a)| < 1. 
Bref. Supposons que x, € V avec x, Æ a. Nous avons alors 


Tn+1 = (tn) (17.137) 
= f(a+(xn — a)) (17.137b) 
= f(a) + (tn — à) f’(a) + a(tn — à). (17.137c) 


Nous avons donc 


[En — al [tn — al 
Avec toutes les hypothèses que nous avons prises, nous avons 
nt = fa) Li (17.139) 


[tn — al 


et donc |tn+1 — f(a)| < |rn — a]. 


Remarque 17.35. 

Dans le cas [g/(a)| = 1, nous ne pouvons rien conclure. Si w(x) = sin(x) nous avons sin(x) < x et 
le point a = 0 est attractif. À contrario, si (x) = sinh(x) nous avons |sinh(r)| > |x| et le point 
a = 0 est répulsif. 


15. Cette partie de la définition est de moi. Je suis loin d'être sûr que c'est une bonne définition. Si vous avez une idée, 
écrivez-moi. Sinon, tenez-vous en à prendre le lemme 17.34 comme définition. 
16. Proposition 12.172. 
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17.5.2 Picard 
Définition 17.36. 


Une application f: (X,dx) — (ŸY,dy) entre deux espaces métriques est une contraction si elle 
est k-Lipschitz pour un certain 0 < k < 1, c’est-à-dire si pour tout x,y € X nous avons 


dy (f(x), f(y)) < kdx(x, y). an 


DEFooRSLCooAsWisu 


Théorème 17.37 (Picard [481, 482] !".). 

Soit X un espace métrique complet et f: X — X une application contractante, de constante de 
Lipschitz k. Alors f admet un unique point fixe, nommé £. Ce dernier est donné par la limite de 
la suite définie par récurrence 


to € À (17.141a) 
ta) (17.141b) 
De plus nous pouvons majorer l’erreur par 
k? k7 E 
ln — 2 < en — nil < ler — vol. bin) 


Soitr >0,ae X tels que la fonction f laisse la boule K = B(a,r) invariante (c’est-à-dire que 
f se restreint à f: K — K). Nous considérons les suites (un) et (Un) définies par 


üuo = € K (17.143a) 
Un+1 = f(Un), Un+1 € B(un, €). (17.143b) 
Alors le point fixe £ de f est dans K et la suite (v,) satisfait l'estimation 
k" € 
lon — El < lui — vol + (17.144) 


La première inégalité (17.142) donne une estimation de l’erreur calculable en cours de processus ; 
la seconde donne une estimation de l'erreur calculable avant de commencer. 


Démonstration. Nous commençons par l’unicité du point fixe. Si a et b sont des points fixes, alors 
f(a) = a et f(b) = b. Par conséquent 


1f(a) — FC) = la — b], (17.145) 


ce qui contredit le fait que f soit une contraction. 

En ce qui concerne l’existence, notons que si la suite des x, converge dans X, alors la limite 
est un point fixe. En effet en prenant la limite des deux côtés de l'équation 4,41 = f(x»), nous 
obtenons £ = f(£), c'est-à-dire que £ est un point fixe de f. Notons que nous avons utilisé ici la 
continuité de f, laquelle est une conséquence du fait qu’elle soit Lipschitz. Nous allons donc porter 
nos efforts à prouver que la suite est de Cauchy (et donc convergente parce que X est complet). 
Nous commençons par prouver que |tn+1 — Zn| < k"|xo — z1|. En effet pour tout n nous avons 


ltn+1 — Zn = | f(tn) — f(tn-1)| < Altn — En-11|. (17.146) 
La relation cherchée s’obtient alors par récurrence. Soient q > p. En utilisant une somme télesco- 


pique, 


e 
lt — æp| < IGi+1 — a] (17.147a) 
l= 


1 

| 

p 
qg—1 

< | x) |x1 — xol (17.147b) 
l=p 


(ce) 
x) |x1 — col. (17.147c) 
l=p 


< 


17. Il me semble qu’à la page 100 de [482], l'hypothèse H1 qui est prouvée ne prouve pas Hn dans le cas n = 1. 
Merci de m'écrire si vous pouvez confirmer ou infirmer. La preuve donnée ici ne contient pas cette « erreur ». 
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Étant donné que k < 1, la parenthèse est la queue d’une série qui converge, et donc tend vers zéro 
lorsque p tend vers l'infini. 
En ce qui concerne les inégalités (17.142), nous refaisons une somme télescopique : 


ltn+p — Zn < ln+p — Entp1] ++ ln — nl (17.148a) 
< kP|tn — £n-1l + KP tn — na] + ee + kltn — tn al = ki +. + kr, xl 
(17.148b) 
k 
En prenant la limite p — 00 nous trouvons 
k k E V 
VE œuf < ln — nil < ler — aol. ét) 


Nous passons maintenant à la seconde partie du théorème en supposant que f se restreigne 
en une fonction f: K — K. D'abord K est encore un espace métrique complet, donc la première 
partie du théorème s’y applique et f y a un unique point fixe. 

Nous allons montrer la relation par récurrence. Tout d’abord pour n = 1 nous avons 


lui — 8] < fui — will + Qui — 6 < e+ 


k 
= Elu = uo|| (17.150) 


où nous avons utilisé l'estimation (17.149), qui reste valable en remplaçant x, par u1 °. Nous 
pouvons maintenant faire la récurrence : 


fün+1 — El < Vonti — Un+1| + fun+1 — É (17.151a) 
NA À (17.151b) 
k” € € gn+i 
< N° = - | | 


Remarque 17.38. 
Ce théorème comporte deux parties d’intérêts différents. La première partie est un théorème de 
point fixe usuel, qui sera utilisé pour prouver l'existence de certaines équations différentielles. 

La seconde partie est intéressante d’un point de vue numérique. En effet, ce qu’elle nous enseigne 
est que si à chaque pas de calcul de la récurrence 4,41 = f(æ,) nous commettons une erreur d’ordre 
de grandeur €, alors le procédé (la suite (v,)) ne converge plus spécialement vers le point fixe, mais 
tend vers le point fixe avec une erreur majorée par e/(1 — k). 


Remarque 17.39. 
Au final l'erreur minimale qu’on peut atteindre est de l’ordre de €. Evidemment si on commet une 


faute de calcul de l’ordre de € à chaque pas, on ne peut pas espérer mieux. 
q ? 
remIOHUJm 


Remarque 17.40. 

Si f elle-même n’est pas contractante, mais si f?P est contractante pour un certain p € N alors la 
conclusion du théorème de Picard reste valide et f a le même unique point fixe que f?. En effet 
nommons + le point fixe de f : fP(x) = x. Nous avons alors 


FE) =) Fe); (17.152) 


ce qui prouve que f(x) est un point fixe de f?. Par unicité nous avons alors f(x) = x, c’est-à-dire 
que x est également un point fixe de f. 


18. Elle n’est cependant pas spécialement valable si on remplace x, par u». 
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ThoagJPZJ 
Théorème 17.41 (Équation de Fredholm). 
Soit K: [a,b] x [a,b] — R et w:[a,b] — R, deux fonctions continues. Alors si À est suffisamment 
petit, l’équation 


b 
(= à | Ken fau + eo (17.153) 
admet une unique solution qui sera de plus continue sur [a, b]. 


Démonstration. Nous considérons l’ensemble F des fonctions continues [a, b] — [a,b] muni de la 
norme uniforme. Le lemme 12.370 implique que F est complet. Nous considérons l’application 
®: F — F donnée par 


b 
B(/)(x) = À J Ka, y)f(u)dy + ex). (17.154) 


Nous montrons que ®? est une application contractante pour un certain p. Pour tout x € [a,b|] 
nous avons 


18( — Se < 1 — (9) (| (17155) 
b 

= if [KG 0 (GG) — tu) do] G7.155b) 

< IAE lb — all — le (17-1550) 


Nous choississons À assez petit pour avoir |[A||K|,1b — a] < 1. Dans ce cas, l'application ® est une 
contraction. Elle possède donc un unique point fixe par le théorème de Picard 17.37. 


17.6 Théorèmes de point fixes et équations différentielles 


17.6.1 Théorème de Cauchy-Lipschitz 


Nous démontrons ici deux théorèmes de Cauchy-Lipschitz. De nombreuses propriétés annexes 
seront démontrées dans le chapitre sur les équations différentielles, section 32.8. 
Le théorème de Cauchy-Arzella 20.31 sera pour plus tard parce qu’il utilise Schauder 20.30. 


ThokUULgU 
Théorème 17.42 (Cauchy-Lipschitz[483, 484 
1 , à re : XtiX 
Nous considérons l'équation différentielle | 
y'(e) = f(é,y(6)) (17.156a) 
y(to) = yo (17.156b) 


avec f:U=1xQ— TR" où I est ouvert dans R et Q ouvert dans R”. Nous supposons que f est 
continue sur U et localement Lipschitz!° par rapport à y. 

Alors il existe un intervalle J € TI sur lequel la solution au problème est unique. De plus toute 
solution du problème est une restriction de cette solution à une partie de J. La solution sur J (dite 
« solution maximale ») est de classe C1. 


Démonstration. Nous divisions la preuve en plusieurs étapes (même pas toutes simples). 


(1) Cylindre de sécurité 


Précisons l’espace fonctionnel F adéquat. Soient V et W les voisinages de to et yo sur lesquels 
jf est localement Lipschitz. Nous considérons les quantités suivantes : 
(la) M = supyxw : 


(1b) r > 0 tel que B(y,r) € V 


(1c) T > 0 tel que B(to,T) Wet T <r/M. 


19. Définition 12.330. Notons que nous ne supposons pas que f soit une contraction. 
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Nous considérons alors l’ensemble 


F = C(B(to, T), B(y0,r)) (17.157) 


que nous munissons de la norme uniforme. Par le lemme 12.370 l’espace (F, ||.|+) est complet. 
(2) Une application ®: F —F 


Si y est une solution de l’équation différentielle considérée, elle vérifie 20 


t 


y(t) = yo + | f(u, y(u))du. FFF TES 


to 
Ceci nous incite à considérer l'opérateur ®: F — F défini par 


t 


P(y)(E) = vo + | f(u, y(u))du. (17.159) 


to 


Pour que l’application ® soit utile nous devons montrer que pour tout ye F, 


— l'application P(y) est bien définie, 


— pour tout {€ B(to,T) nous avons P(y)(t) € B(yo,r), 


— l'application P(y): B(to, T) — B(yo,r) est continue. 
Attention : nous ne prétendons pas que ® elle-même soit continue. C’est parti. 


(2a) P(y) est bien définie 


Il faut montrer que l'intégrale converge. Le calcul de ®(y)(t) ne se fait qu'avec t € 
B(to, T). Vu que u prend ses valeurs dans [to,t] et que y € F, le nombre y(u) est toujours 


dans B(y0,r). Ceci pour dire que dans l’intégrale, la fonction f n’est considérée que sur 


[to, t] x B(yo,r) € V x W. La fonction f est donc uniformément majorable, et l'intégrale 
ne pose pas de problèmes. 


P(y)() € B(yo,r) 


Prouvons que P(y)(t) € B(yo.r). Pour cela, notons que 


(2b 


— 


18(2)(0 — vol < [ Lf (a, y(u))ldu < lt — doll flo. (17.160) 


Étant donné que t € B(to, T) nous avons |t — to] < r/M et donc |®(y)(#) — yol < r. 
(2c 


— 


P(y) est continue 


Nous pourrions invoquer le théorème 17.15, mais nous allons le faire à la main. Soit 50 € 
B(to, T) et prouvons que ®(y) est continue en s0. Pour cela nous prenons s € B(s0,0) 
et nous calculons : 


S 


|P(y)(s) — P(y) (so) < ] Lf(u, y(u))|du < 180 — s||| fl. (17.161) 


50 


C’est le fait que f soit bornée dans le cylindre de sécurité qui fait en sorte que cela 
tende vers zéro lorsque 5 — 59. 


L'équation (17.158) signifie que y est un point fixe de ®. L'espace F étant complet, le 
théorème de point fixe de Picard (théorème 17.37) s'applique. Nous allons montrer qu’il 
existe un p € N tel que ®? soit contractante. Par conséquent ®? aura un unique point fixe 
qui sera également unique point fixe de ®& par la remarque 17.40. 


20. C’est le théorème fondamental du calcul intégral 14.263. 
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(3) Contractante 


— 


Prouvons donc que ®? est contractante pour un certain p. Pour cela nous commençons par 
montrer la formule suivante par récurrence : 


|GP(x) (4) — &(y)(8)| < EL — yo FRA TES) 


pour tout x,y€ F, et pour tout t € B(to, T). Pour p = 0 la formule (17.162) est vérifiée parce 


que x — y est le supremum de |x(t) — y(t)] pour t € B(to, T). Supposons que la formule 


soit vraie pour p et calculons pour p + 1. Pour tout t € B(to, T) nous avons 
(17.163a) 


TEE) 


2P1r)(0 819 € |[ Fu, SC) — Lu, DC) du 


<|| k|D?(x)(u) — BP(y)(u)|du 


to 
t kP|t — + _ 
< | EE — ve) SPA) 
to D: 
kP+1|t … tolP+1 
= : 17.163d 


Justifications : 
— (17.163b) parce que f est Lipschitz. 
— (17.163c) par hypothèse de récurrence. 
La formule (17.162) est maintenant établie. Nous pouvons maintenant montrer que ®? est 


une contraction pour un certain p. Pour tout t € B(to,T) nous avons 


P'TP 


T' 
— | — yo (17.164) 
D: 


k? k 
1BP(x)(E) — BP(y)(E)1 < rail — tol?1z — yo < 


où nous avons utilisé le fait que |t — to[? < T?. En prenant le supremum sur t des deux côtés 
il vient 
kPTP 


— le — Yloo. (17.165) 


1BP(x) — BP(y)lo < D 


Le membre de droite tend vers zéro lorsque p — 0 parce que &PTP/p!l — 0?!, Nous concluons 
donc que ®? est une contraction pour un certain p. 

Conclusion 

L’unique point fixe de ® est alors l’unique solution continue de l’équation différentielle 
(17.156). Par ailleurs l’équation elle-même y = f(t,y) demande implicitement que y soit 
dérivable et donc continue. Nous concluons que l’unique point fixe de ® est l’unique solution 
de l'équation différentielle donnée. Cette dernière est automatiquement C1 parce que si y est 
continue alors ur f(u,y(u)) est continue, c’est-à-dire que y est continue. 

Unicité 

Nous passons maintenant à la partie « prolongement maximum » du théorème. Soient x1 et 
x2 deux solutions maximales du problème (17.156) sur des intervalles 1; et 12 respectivement. 
Les intervalles 7: et 22 contiennent B(to,T) sur lequel x1 = x2 par unicité. 

Nous allons maintenant montrer que pour tout t > to pour lequel +1 ou æ2 est défini, x1(t) 
et x2(t) sont définis et sont égaux. Le raisonnement sur t < to est similaire. 

Supposons que l’ensemble des t > to tels que æ1 = x2 soit ouvert à droite, c’est-à-dire soit 
de la forme [to, b[. Dans ce cas, soit x1, soit x2 (soit les deux) cesse d’exister en b. En effet si 
nous avions les fonctions x; sur [to,b + e[ alors l'équation x; = x2 définirait un fermé dans 
[to, b + e[. Supposons pour fixer les idées que +1 cesse d’exister : le domaine de 1 (parmi les 


21. Parce que les factorielles vont plus vite que les puissances. 
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t > 0) est [to, b[ et sur ce domaine nous avons #1 = 2. Dans ce cas +1 pourrait être prolongé 
en x2 au-delà de b. Si x et x2 s'arrêtent d’exister en même temps en b, alors nous avons bien 
T1 — X2. 

Nous devons donc traiter le cas où +1 = 2 sur [to, b] alors que x1 et 2 existent sur [to,b+el 
pour un certain €. 


Nous pouvons appliquer le théorème d'existence locale au problème 


y = f(6,y) (17.166) 
y(b) = x1(b). (17.166b) 


Il existe un voisinage de b sur lequel la solution est unique. Sur ce voisinage nous devons 
donc avoir æ1 = æ2, ce qui contredit le fait que 1 2 en dehors de [to,b|. 


Donc x: et x2 existent et sont égaux sur, au moins Ji LU D. 


Le théorème de Cauchy-Lipschitz donne existence et unicité d’une solution maximale. Cepen- 
dant cette solution peut ne pas exister partout où les hypothèses sur f sont remplies. En d’autres 
termes, il peut arriver que f soit Lipschitz jusqu’à t1, mais que la solution maximale ne soit définie 
que jusqu’en {2 < t1. Ce cas fait l’objet du théorème d’explosion en temps fini 32.20. 

Sous quelques hypothèses, nous pouvons nous assurer de l’existence d’une solution unique sur 


tout R. 
THOooZ1TVRooPSlMxg 


Théorème 17.43 (Cauchy-Lipschitz global[485, 103]). 
Soit un intervalle I de R, yo € R”, to € TL et une fonction continue f: 1 X IR? — IR’ telle que pour 
tout compact K dans I, il existe k > 0 tel que 


I FCE, ga) — FE, ya)| < lui — vel (17.167) 
pour tout te K°et y, ge Re our bME 
Alors le problème | 
(Et) = f(t,y(t)) (17.168a) 
y(to) = yo (17.168b) 


possède une unique solution y: 1 — R” sur I. 


Démonstration. Soit un intervalle compact K dans J et contenant tp. Nous notons £ le diamètre 
de K. Sur l’espace E = C(K,IR") nous considérons la topologie uniforme : (E,|.|). C’est un 
espace complet par le lemme 12.370 (nous utilisons le fait que R” soit complet, proposition 1.390). 
Nous allons utiliser l'application suivante : 


d' EE 


t EQooJUTBo DERQ 
S(y)(E) = vo + | fs, y(s))ds ENT 10) 


to 


Démontrons quelques faits à propos de &. 


(1) $ est bien définie Nous devons commencer par prouver que cette application est bien 
définie. Si y € E alors f et y sont continues; l’application s + f (s, y(s)) est donc également 
continue. L'intégrale de cette fonction sur le compact [to,t] ne pose alors pas de problèmes. 
En ce qui concerne la continuité de ®(y) sous l'hypothèse que y soit continue, 


1P(y)(E) — S(y)(EI1 < 1 1f(s,y(s))lds < MIE — #1 (17.170) 


où M est une majoration de |s+ f(s,y(s))|co,x. 
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(2) Si y est solution alors &(y) = y 


Supposons que y soit une solution de l’équation différentielle (17.168). Alors, vu que y/(t) = 
fe y(t)) nous avons : 


t t 


y'(s)ds = yo + | (5, y(s))ds = P(y)(t). (17.171) 


to 


y(t) =w+ | 


to 


(3) Si P(y) = y alors y est solution 


Nous avons, pour tout t : 
t 


y(t) = yo + | f(s,y(s))ds. (17.172) 


to 
Le membre de droite est dérivable par rapport à t, et la dérivée est f (£, y(t)). Donc le membre 
de gauche est également dérivable et nous avons bien 


y'(e) = f(é,y(E)). (17.173) 


t 
De plus y(to) = yo + is = Up 
Nous sommes encore avec K compact et E£ = C°(K,R") muni de la norme uniforme. Nous 
allons montrer que ® est une contraction de Æ pour une norme bien choisie. 


(1) Une norme sur ÆE Pour yE€ E nous posons 


_ —k|t-to| 
Iylx = max (e ly(é)1). (17.174) 


Ce maximum est bien défini et fini, parce que dedans, la fonction de t est une fonction continue 
sur le compact K. C’est également une norme parce que si |y| = 0 alors e-#lt-tl|y(#)] = 0 
pour tout t. Etant donné que l’exponentielle ne s’annule pas, |y(t)| = 0 pour tout t. 


(2) Équivalence de norme Nous montrons que les normes ||.|4 et |.|x sont équivalentes ?? : 
_ EQooSQYWooBT 
Ile < lue < Ile C7 17) 


pour tout y € E. Pour la première inégalité, £ > |t — to| pour tout te K, et k > 0, donc 


le ff < el] y). (17.176) 


En prenant le maximum des deux côtés, |y|oe-*t < |y|z. 


En ce qui concerne la seconde inégalité dans (17.175), k[t — to| > 0 et done e-Alt-tol < 1. 
Puisque les normes |.], et |.|L sont équivalentes, l’espace (E,|.|x) est tout autant complet que 
(E, ||). Nous démontrons à présent que ® St une fomtragtion dans (E, ||x). 


; Ê SUBEQS00ËXVYooDk 
Soient y,z € E. Si t > to nous avons | 


1B(y)() — (2) (1 < [ lF(s,y(s)) — F(s,2(8))lds (17.177a) 


< k] Iy(s) — z(s)]ds. (17.177b) 


Il convient maintenant de remarquer que 
ot) = ele ol nf) < Jupe tot. (17.178) 


Nous pouvons avec ça prolonger les inégalités (17.177) par 


t t 
BE - 81 < kly-zhe | las = kly— le | e-t00ds (17.179) 
to to 
où nous avons utilisé notre supposition t > to pour éliminer les valeurs absolues. L'intégrale peut 
être calculée explicitement, mais nous en sommes arrivés à un niveau de fainéantise tellement 
inconcevable que 


22. Définition 11.43 
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00 


H 


SageMath version 7.3, Release Date: 2016-08-04 
Type "notebook()" for the browser -based notebook interface. 
Type "help()" for help. 


sage: var(’a,b,k’) 

7|(a, b, k) 

sage: f(x)=exp(-k*xx) 
sage: f.integrate(x,a,b) 
e"(-axk)/k - e7(-b*xk)/k 


tex/sage/sageSnip014.sage 


Au final, si t > to, 
1S(y)E) — SG) < y — zle (ef T0) — 1). (17.180) 


Si t < to, il faut retourner les bornes de l'intégrale avant d’y faire rentrer la norme parce que 
| (a fl < fe fl, mais ça ne marche pas avec | é fl. Pour t < to tout le calcul donne 


BE - 8) < Iy — ze (e* (9 — 1). (17.181) 


Les deux inéquations sont valables a fortiori en mettant des valeurs absolues dans l’exponentielle, 
de telle sorte que pour tout t € K nous avons 


eo | g(y)(E) — 82) < [y — 2lk (1 — eo). (17.182) 
En prenant le supremum sur t, 
1B(u) — (2x < I — 2lk (1 — 79), (17.183) 


mais 0 < (1—e°kt) < 1, donc & est contractante pour la norme |.|,. Comme (FE, |.|}) est complet, 
l’application $ y a un unique point fixe par le théorème de Picard 17.37. 
Ce point fixe est donc l’unique solution de l’équation différentielle de départ. 


(1) Existence et unicité sur Z Il nous reste à prouver que la solution que nous avons trouvée 
existe sur 1 : jusqu’à présent nous avons démontré l’existence et l’unicité sur n’importe quel 
compact dans 1. 

Soit une suite croissante de compacts X, contenant to (par exemple une suite exhaustive 
comme celle du lemme 7.291). Nous avons en particulier 


Le] 
1= |]. (17.184) 
n=0 


(2) Existence sur Z Soit y, l'unique solution sur X,. Il suffit de poser 


y(t) = yn(t) (17.185) 


pour n tel que t € K,. Cette définition fonctionne parce que si t € Ky N Kyn, il y a forcément 
un des deux qui est inclus dans l’autre et le résultat d’unicité sur le plus grand des deux 
donne yn(t) = Ym(t). 


Unicité sur / 


RS 
Co 
LA 


Soient y et z des solutions sur 1; puisque 1 n’est pas spécialement compact, le travail fait 
plus haut ne permet pas de conclure que y = z. 

Soit te I. Alors te K, pour un certain n et y et z sont des solutions sur K,, qui est compact. 
L’unicité sur K, donne y(t) = z(t). 
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17.44. 
Il y a d’autres moyens de prouver qu’une solution existe globalement sur KR. Si f est globalement 
bornée, le théorème d’explosion en temps fini donne quelques garanties, voir 32.22. 


Le théorème suivant donne une version du théorème de Cauchy-Lipschitz lorsque la fonction f 
dépend d’un paramètre. Ce théorème n'utilise rien de fondamentalement nouveau. Nous le donnons 
seulement pour montrer que l’on peut choisir l’espace F de façon un peu maligne pour élargir le 
résultat. Si vous voulez un théorème de Cauchy-Lipschitz avec paramètre vraiment intéressant, 


allez voir le théorème 32.37. 
THOo0oDTCWooSPKeYu 


Théorème 17.45 (Cauchy-Lipschitz avec paramètre[l, 486]). 

Soit un intervalle ouvert I de R, un connexe ouvert ® de R” et un intervalle ouvert À de R4. Soit 
une fonction f: I x Q x À — R" continue et localement Lipschitz en Q. Soient to € I, y € À et 
À0 € À. Il existe un voisinage compact de (to, yo, o) sur lequel le problème 


YA) = FE, ya(t), À) (17.186a) 
y\(to) = Yo (17.186b) 


possède une unique solution. De plus (t, À) — yx(t) est continue ?*. 


Idée rapide de la preuve. 


ii Avertissement /question au lecteur !! 17.46 
Ceci est une idée de la preuve. Je n'ai pas vérifié toutes les étapes. Soyez prudent. 

D'abord nous avons un voisinage compact V x B(yo,r) x Ao de (to, Yo. Ao) sur lequel f est 
bornée. Ensuite nous récrivons l’équation différentielle sous la forme 


a A) = FE UE À), à) (17.187a) 


y(to, À) = Yo. (17.187b) 


pour une fonction y: V x A — R?. 
Nous posons F = C° (V x Âo, R’) et nous y définissons l’application 


D'F—-F 


P(y)(t, À) = yo + [ fs y(s, À), X)ds. (17.188) 


to 


Il y à plein de vérifications à faire[486], mais je parie que ® est bien définie, et qu’une de ses 
puissances est une contraction de (F, |.|,). L'unique point fixe est une solution de notre problème 
et est dans C", donc (t, À) + y(t, À) = yx(t) est de classe C®, c’est-à-dire continue. 


17.47. 

Ce théorème marque un peu la limite de ce que l’on peut faire avec la méthode des points fixes 
dans le cadre de Cauchy-Lipschitz : nous sommes limités à la continuité de la solution parce que les 
espaces C? ne sont pas complets ?{. Il n’y a donc pas d'espoir d'adapter la méthode pour prouver 
que si f est de classe C? alors (t, À) > yx(t) est de classe C?. On peut, à À fixé, prouver que 
tr yx(t) est de classe C? (utiliser une récurrence), mais pas plus. 

La régularité C! de y par rapport à la condition initiale sera l’objet du théorème 32.33. Ce 
résultat n’est vraiment pas facile et utilise des ingrédients bien autres qu’un point fixe. Ensuite la 
régularité CP par rapport à la condition initiale et par rapport à un paramètre seront presque des 
cadeaux (proposition 32.35 et 32.37). 


23. Ici, la surprise est que ce soit continu par rapport à À. Le fait qu’elle le soit par rapport à t est clair depuis le 
départ, parce que ce n’est finalement rien d’autre que le Cauchy-Lipschitz vieux et connu. 

24. Par exemple, le théorème de Stone-Weierstrass 12.430 nous dit que la limite uniforme de polynômes (de classe 
C®) peut n'être que continue. Voir aussi le thème 36. 


H 
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EXooJXIGooQtotMc 
Exemple 17.48 ([187|). 
Nous savons que le théorème de Picard permet de trouver le point fixe par itération de la contraction 
à partir d’un point quelconque. Tentons donc de résoudre 


y'(t) = y(t) (17.189a) 
y(0) =1 (17.189b) 


dont nous savons depuis l’enfance que la solution est l’exponentielle *. Partons donc de la fonction 
constante yo = 1, et appliquons la contraction (17.169) : 


1 
wi = 1 +| uo(s)ds = 1 +t. (17.190) 
0 
Ensuite 
(A 2 
w=1+fG+ds-1+t4 (17.191) 
0 


Et on voit que les itérations suivantes vont donner l’exponentielle. 

Nous sommes évidemment en droit de se dire que nous avons choisi un bon point de départ. 
Tentons le coup avec une fonction qui n’a rien à voir avec l’exponentielle : up(x) = sin(x). 

Le programme suivant permet de faire de belles investigations numériques en partant d’à peu 
près n'importe quelle fonction : 


#! /usr/bin/sage -python 
# -4x- coding: utf8 -*- 


from sage.all import * 


|x=var (’x°’) 


def Phi(f): 
prim=f.integrate() 
return itprim(x)-prim(O) 


»|f=sin(x) 


for i in range (1,30): 
print(i,f) 
f=Phi(f) 


g=f(x)-exp(x) 
plot(g,(x,-10,10)).show() 


tex/sage/picard_exp.py 


Ce programme fait 30 itérations depuis la fonction sin(x) pour tenter d’approximer exp(x). 
Pour donner une idée, après 7 itérations nous avons la fonction suivante : 


1 1 i 
0 + 7 à + LA + 2x — sin(x) + 1. (17.192) 


Nous voyons que les coefficients sont des factorielles, mais pas toujours celles correspondantes à la 

puissance, et qu’il manque certains termes par rapport au développement de l’exponentielle que 

nous connaissons. Bref, le polynôme qui se met en face de sin(x) s’adapte tout seul pour compenser. 
Et après 30 itérations, ça donne quoi? Voici un graphe de l'erreur entre u3o(x) et exp(30) : 


25. Voir par exemple le théorème 15.75. 
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= 0 


Pour donner une idée, exp(10) + 22000. Donc il y a une faute de 0.01 sur 22000. Pas mal. 
x 


17.7 Théorèmes d’inversion locale et de la fonction implicite 


17.7.1 Mise en situation 


Dans un certain nombre de situation, il n’est pas possible de trouver des solutions explicites aux 
équations qui apparaissent. Néanmoins, l’existence « théorique » d’une telle solution est souvent 
déjà suffisante. C’est l’objet du théorème de la fonction implicite. 

Prenons par exemple la fonction sur IR? donnée par 


F(x,y) = x? + y? — 1. (17.193) 


Nous pouvons bien entendu regarder l’ensemble des points donnés par F{x,y) = 0. C’est le cercle 
dessiné à la figure 17.1. 


P! 


FIGURE 17.1: Un cercle pour montrer l'intérêt de la fonction implicite. Si on donne x, nous ne 
pouvons pas savoir si nous parlons de P ou de P. LabelFigCerclelmplicite 


Nous ne pouvons pas donner le cercle sous la forme y = y(x) à cause du + qui arrive quand 
on prend la racine carrée. Mais si on se donne le point P, nous pouvons dire que autour de P, le 


cercle est la fonction 
Ua) = 1-57, (17.194) 
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Tandis que autour du point P’, le cercle est la fonction 


y(x) = — V1 — »2. (17.195) 


Autour de ces deux points, donc, le cercle est donné par une fonction. Il n’est par contre pas 
possible de donner le cercle autour du point Q sous la forme d’une fonction. 
Ce que nous voulons faire, en général, est de voir si l’ensemble des points tels que 


Fees) = 0 (17.196) 
peut être donné par une fonction y = y(æ1,...,2,). En d’autre termes, est-ce qu’il existe une 
fonction y(x1,...,2,) telle que 

Fist 0e.) = 0 (17.197) 


Plus généralement, soit une fonction 


F:DCR"'xR"—mR" 


(æ,y)e (F(x,y),.…., En(x,y)) (17.198) 


avec æ = (%1,...,%n) €t y = (Y1,...,Ym). Pour chaque x fixé, on s’intéresse aux solutions du 
système de m équations F(x,y) = 0 pour les inconnues y; en particulier, on voudrait pouvoir 
écrire y = (x) vérifiant F(x,w(x)) = 0. 


17.7.2 Théorème d’inversion locale 
LemGZoqknC 


Lemme 17.49 ([348]). 
Soit E un espace de Banach (métrique complet) et © un ouvert de E. Nous considérons une 
À-contraction ÿ: © — E. Alors l'application 


fit z+v(x) (17.199) 


est un homéomorphisme entre © et un ouvert de E. De plus f-! est Lipschitz de constante plus 
petite ou égale à (1 — X)-!. 


Cette proposition utilise le théorème de point fixe de Picard 17.37, et sera utilisée pour démon- 
trer le théorème d’inversion locale 17.50. 


Démonstration. Soient x1,x2 € ©. Nous posons y1 = f(x1) et ya = f(x2). En vertu de l'inégalité 
es ubEqÉBJsBfz 
de la proposition 7.150 nous avons 


|f(x2) _ f(x)| — |œ2 + g(x2) — æ1 — p(x1)| (17.200a) 
> Lez — æ| — |o(x2) — (1) | (17.200b) 
> (1—À)fx2 — x. (17.200c) 


À la dernière ligne les valeurs absolues sont enlevées parce que nous savons que ce qui est à 

l’intérieur est positif. Cela nous dit d’abord que f est injective parce que f(x2) = f(x1) implique 

x2 = 21. Donc f est inversible sur son image. Nous posons À = f(©) et nous devons prouver que 

que f_!: À — O est continue, Lipschitz de constante majorée par (1 — À)! et que À est ouvert. 
Les inéquations (17.200) nous disent que 


|F Gun) - 7) < MAI, (17.201) 
c’est-à-dire que 
ñ 


1e (17.202) 
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ce qui signifie que fl est Lipschitz de constante souhaitée et donc continue. 

Il reste à prouver que f(O) est ouvert. Pour cela nous prenons yo = f(x0) dans f(O) est nous 
prouvons qu’il existe € tel que B(yo,€) soit dans f(O). Il faut donc que pour tout y € B(yo,€), 
l'équation f(x) = y ait une solution. Nous considérons l’application 


Ly: tr y—vy(x). (17.203) 


Ce que nous cherchons est un point fixe de ZL,, parce que si L,(x) = x alors y = x + &(x) = f(x). 
Puisque 
| Le) — L(a)| = Jet) — pta)| < Xe | (17.204) 


l’application Z, est une contraction de constante À. Par ailleurs xo est un point fixe de Z,,, donc 
en vertu de la caractérisation (12.878) des fonctions Lipschitziennes, 


Ly (B(x0,6)) € B(Ly (to); 6) = B(xo, A6). (17.205) 


Comme pour tout y et x nous avons L,(x) = L,(x) + y — yo, 


Ly(B(x0,5)) = Ly (B(to,9)) + (y — yo) € B(x0, À) + (y — yo) € B(x0, X6) + [y — yo. (17.206) 


Si e < (1 — À)6 alors A0 + |y — yo] < 6. Un tel choix de € > 0 est possible parce que À < 1. Pour 
une telle valeur de € nous avons 


Ly(B(x0,0)) € B{xo, 0). (17.207) 


Par conséquent ZL, est une contraction sur l’espace métrique complet B(x0,0), ce qui signifie que 
L,, y possède un point fixe par le théorème de Picard 17.37. 


Nous allons le démontrer dans le cas un peu plus général (mais pas plus cher *) des espaces 


de Banach en tant que conséquence du théorème de point fixe de Picard 17.37. 
ThoXWpzqCn 


Théorème 17.50 (Inversion locale dans un espace de Banach{[488, 348]). 
Soit une fonction f € CP(E, F) avec p > 1 entre deux espaces de Banach. Soit xo € E tel que dfx, 
soit une bijection bicontinue?T. Alors il existe un voisinage ouvert V de x0 et W de f(xo) tels que 


(1) f: V — W soit une bijection, 
(2) f-!: W — V soit de classe CP. 


Démonstration. Nous commençons par simplifier un peu le problème. Pour cela, nous considérons 
la translation T': x + x + x0 et l’application linéaire 


L:R'—R" 


(17.208) 

cr (dfr)) *x 
qui sont tous deux des difféomorphismes (L en est un par hypothèse d’inversibilité). Quitte à 
travailler avec la fonction k = Lo f o T', nous pouvons supposer que x = 0 et que dfx, = 1. Pour 
comprendre cela il faut utiliser deux fois la formule de différentielle de fonction composée de la 
proposition 12.748 : 


dko(u) — dL(foT(0) (dfrdTo(u)) . (17.209) 

Puisque L est linéaire, sa différentielle est elle-même, c’est-à-dire dL(#oT)(0) = (df0) *, et par 
ailleurs d15 = 1, donc 

dko(u) = (fe) (dfzo(u)) = u, (17.210) 


ce qui signifie bien que dko = 1. Pour tout cela nous avons utilisé en plein le fait que dfr, était 
inversible. 


26. Sauf la justification de la régularité de l'application À + A7! 
27. En dimension finie, une application linéaire est toujours continue et d’inverse continu. 
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Nous posons g = f — 1, c’est-à-dire g(x) = f(x) — x, qui a la propriété dgo = 0. Étant donné 
que g est de classe C1, l'application 2° 


dg: E — GL(F) 


17.211 
on ( ) 


est continue. En conséquence, nous avons un voisinage U’ de O0 pour lequel 


sup |dgz| < = - 17918) 
æeU' 


2 


Maintenant le théorème des accroissements finis 11.254 (12.325 pour la dimension finie) nous 


indique que pour tout x,’ € U’ nous avons ?° 
! ! 1 ! 
lg(z)— (x) < sup Idgal : rx < 5x |, (17.213) 
ae[x,x’] 


ce qui prouve que g est une contraction au moins sur l’ouvert U’. Nous allons aussi donner une 
idée de la façon dont f fonctionne : si æ1,x%9 € U” alors 


lx1 — æ2] = |g(x1) — f(x1) — g(x2) + f(æ2)| (17.214a) 
< |g(x1) — g(x2)| + | f(x1) — f(x2)| (17.214b) 
< lei 221 + 10 - fa), (17.214c) 
ce qui montre que 
lx1 — xol < 2] f(æ1) — f(x2)|. (17.215) 


Maintenant que nous savons que g est contractante de constante à et que f = g + 1 nous pouvons 
utiliser la proposition 17.49 pour conclure que f est un homéomorphisme sur un ouvert U (partie 
de U’) de E et f_! a une constante de Lipschitz plus petite ou égale à (1 — 11 —2. 

Nous allons maintenant prouver que f—! est différentiable et que sa différentielle est donnée 
par (df") f(x) = (dfx) 7. 

Soient a.b e U et u = b— a. Étant donné que f est différentiable en a, il existe une fonction 
a € o(|u|) telle que 


F(b) — (a) — dfa(u) = a(u). (17.216) 
En notant y, = f(a) et y, = f(b) et en appliquant (df,) ! à cette dernière équation, 
(dfa) (yo — Ya) — u = (dfa) ‘(a(u)). (17.217) 


Puisque df, est bornée (et son inverse aussi), le membre de droite est encore une fonction 5 ayant 
la propriété lim,_,0 B(u)/|u| = 0; en réordonnant les termes, 


b—a— (dfa)7* (Yo — Ya) + B(u) (17.218) 
et donc 
7 (us) — F7 (a) — (dfa) "(o — Ya) = B(u), (17.219) 
ce qui prouve que f-! est différentiable et que (df-1),, = (dfa) 1. 


La différentielle df—! est donc obtenue par la chaine 


df 


den on ur GP Ci(r) (17.220) 


28. Ici GL(F) est l’ensemble des applications linéaires, inversibles et continues de F dans lui-même. Ce ne sont 
pas spécialement des matrices parce que nous n’avons pas d’hypothèses sur la dimension de F', finie ou non. 

29. Ici nous supposons avoir choisi U’ convexe afin que tous les a € [x,x’| soient bien dans U” et donc soumis à 
Pinéquation (17.212), ce qui est toujours possible, il suffit de prendre une boule. 
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où l'application Inv: GL(F) — GL(F) est l'application X + X71 qui est de classe C® par le 
théorème 11.262. D'autre part, par hypothèse df est une application de classe C*-1 et donc au 
minimum C® parce que k > 1. Enfin, l'application fl: f(U) — U est continue (parce que la 
proposition 17.49 précise que f est un homéomorphisme). Donc toute la chaine est continue et 
df-} est continue. Cela entraine immédiatement que f-! est C1 et donc que toute la chaine est 
Ce 


Par récurrence nous obtenons la chaine 


= fe df nv 
df-t: FU) Ur GL(F) — GL(F) (17.221) 


qui prouve que df_! est C*-l et donc que f-! est CF. La récurrence s’arrête ici parce que df n’est 
pas mieux que C*-1. 


17.7.3 Théorème de la fonction implicite 


Nous énonçons et démontrons le théorème de la fonction implicite dans le cas d’espaces de 


Banach. 
ThoAcaWho 


Théorème 17.51 (Théorème de la fonction implicite dans Banach[350]). 
Soient E, F' et G des espaces de Banach et des ouverts U € E, V € F. Nous considérons une 
fonction f: U x V — G de classe C” telle que*° 


dyftcogo) : F — G (17.222) 


soit un isomorphisme pour un certain (xo, yo) € U x V. 
Alors nous avons des voisinages Us de x0 dans E et Wo de f(xo, yo) dans G et une fonction 
de classe C7 
g: Uo X Wo — V (17.223) 


telle que 
f(x,g(x,w)) = w (17.224) 


pour tout (x,w) € Uo x Wo. 

Cette fonction g est unique au sens suivant : il existe un voisinage Vo de yo tel que si (x, y) € 
UoxVo et w € Wo satisfont à f(x, y) = w alors y = g(x,w). Autrement dit, la fonction g: UoxWo — 
Vo est unique. 


Démonstration. Nous commençons par considérer la fonction 


PUxXV-+-ExG 


(17.225) 
(ay) (x, f(x, v)) 
et sa différentielle 
d 
dP (x vo) (UV) = … | (0 + tu, f(xo + tu, Yo + t))] (17.226a) 
d 
- (5 To + tu] or TL F(æ0 + tu, yo + |) (17.226b) 
= (u, rer ; (17.226c) 
Nous utilisons alors la proposition 11.260 pour conclure que 
dE (x0,v0) (0 0) = (u, (di f)(20,v0) (4) + (d2f Yo yo) (V)); (17.227) 
mais comme par hypothèse (d2f)(x5.u0) : À — G est un isomorphisme, l'application dB): E x 


F — E x Gest également un isomorphisme. Par conséquent le théorème d’inversion locale 17.50 


30. La notation d, est la différentielle partielle de la définition 11.259. 
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nous indique qu’il existe un voisinage © de (x0, yo) et P de P(x0, y) tels que P: © — P soit une 
bijection et 1: P — O soit de classe C”. Comme P est un voisinage de 


D(x0; yo) = (xo, f(xo, yo), (17.228) 


nous pouvons par 7.220 le choisir un peu plus petit de telle sorte à avoir P = Us x Wa où Uno est 
un voisinage de 0 et Wo un voisinage de f(x0, yo). Dans ce cas nous devons obligatoirement aussi 
restreindre © à Uo *X Vo pour un certain voisinage VW de %0. L'application ®-! à obligatoirement 
la forme ‘ 
PB: DxW—-DxVW EqMHT.NrHRg 
(x, w) + (x,g(x, w)) 


pour une certaine fonction g: Uo xX Wo — V. Cette fonction g est la fonction cherchée parce qu’en 
appliquant ® à (17.229), 


(au) = B(x,g{x,w)) = (x, f(x,g(x,w))), (17.230) 
qui nous dit que pour tout x € U, et tout w € W5 nous avons 
f(x, g(x, w)) = w. (17.231) 


Si vous avez bien suivi le sens de l’équation (17.229) alors vous avez compris l’unicité. Sinon, 
considérez (x, y) € Uo x Vo et w € Wa tels que f(x,y) = w. Alors (x, f(x,y)) = (x, w) et 


B(x,y) = (x, w). (17.232) 


Mais vu que D: Uo x Vo — Uo x Wa est une bijection, cette relation définit de façon univoque 
l’élément (x, y) de Uo X Vo, qui ne sera autre que g(x, w). 


Le théorème de la fonction implicite s’énonce de la façon suivante pour des espaces de dimension 


finie. 
ThoRYN_jvZrz 


Théorème 17.52 (Théorème de la fonction implicite en dimension finie). 
Soit une fonction F: R" x R°" — R’” de classe CF et (a, B) € R° x R°” tels que 
(1) F(a,8) = 0, 
o(F,.. En) 
(2) any) # 0, c'est-à-dire que (dy) (a,8) est inversible. 
Alors il . un voisinage ouvert V de à dans IR”, un voisinage ouvert W de B dans R’? et une 
application w: V — W de classe C* telle que pour tout x € V on aït 


F(x,ç(x)) = 0. (17.233) 


De plus si (x,y) € V x W satisfait à F(x,y) = 0, alors y = y(x). 


RemPYA_pKkTEx 
Remarque 17.53. 
Notons que cet énoncé est tourné un peu différemment en ce qui concerne le nombre de variables 
dont dépend la fonction implicite : comparez 
J(æ,g(x, w)) = W (17.234a) 
F(x,ç(x)) = 0. (17.234b) 


Le deuxième est un cas particulier du premier en posant 


F(æ,y) = f(x, y) — f(xo: vo) (17.235) 


et donc en considérant w comme valant la constante f(x0, Yo) ; dans ce cas la fonction g ne dépend 
plus que de la variable x. 
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Exemple 17.54. 

La remarque 17.53 signifie entre autres que le théorème 17.51 est plus fort que 17.52 parce que 
le premier permet de choisir la valeur d’arrivée. Parlons de l’exemple classique du cercle et de la 
fonction f(x,y) = x? + y?. Nous savons que 


fa, 8) = 1. (17.236) 
Alors le théorème 17.51 nous donne une fonction g telle que 
alter =r (17.237) 


tant que x est proche de à, que r est proche de 1 et que g donne des valeurs proches de 6. 
L’énoncé 17.52 nous oblige à travailler avec la fonction F(x,y) = x? + y? — 1, de telle sorte que 


F(a, B) = 0, (17.238) 

et que nous ayons une fonction @ telle que 
F(x,v(x)) = 0. (17.239) 
La fonction @ ne permet donc que de trouver des points sur le cercle de rayon 1. PA 


17.7.4 Exemple 


Le théorème de la fonction implicite a pour objet de donner l'existence de la fonction 4. 
Maintenant nous pouvons dire beaucoup de choses sur les dérivées de 4 en considérant la fonction 


zr F(x,p(x)). (17.240) 


Par définition de w, cette fonction est toujours nulle. En particulier, nous pouvons dériver l’équation 


F(x,g(x)) = 0, (17.241) 
et nous trouvons plein de choses. 
EXo0TLNAooCJHPnq 
Exemple 17.55. 
Prenons par exemple la fonction °! 
FIGE y), 2) = ze —x—7Yy, (17.242) 


Le théorème de la fonction implicite 17.51 nous permet de considérer la fonction z(x,y) vérifiant 
Fo, u,#(59)) = 0, (17.243) 


c’est-à-dire telle que 
(x, yje 9) y = 0. Fer ZInplE en 


pour tout x et y € R. Que pouvons dire de la fonction 2? 
Nous pouvons facilement trouver 2(0,0) parce que 


z(0,0)e*(00) = 6, (17.245) 


donc 2(0,0) = 0. 
Nous pouvons dire des choses sur les dérivées de 2(x, y). Voyons par exemple (@,2)(x,y). Pour 
trouver cette dérivée, nous dérivons la relation (17.244) par rapport à x. Ce que nous trouvons est 


(dL2)e* + ze*(032) — 1 = 0. (17.246) 


31. Définition de l’exponentielle : 15.59. 
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Cette équation peut être résolue par rapport à 0,2 : 


de ee 1 
6x? ez(1+2) 


(17.247) 


Remarquez que cette équation ne donne pas tout à fait la dérivée de z en fonction de x et y, parce 
que z apparaît dans l’expression, alors que z est justement la fonction inconnue. En général, c’est 
la vie, nous ne pouvons pas faire mieux. 
Dans certains cas, on peut aller plus loin. Par exemple, nous pouvons calculer cette dérivée au 
point (x,y) = (0,0) parce que z(0,0) est connu : 
Oz 


2 (0,0) = 1. (17.248) 


Ceci est pratique pour calculer, par exemple, le développement en Taylor de z autour de (0,0). A 


Exemple 17.56. 
Est-ce que l’équation e* + xy = 0 définit au moins localement une fonction y(x) ? Nous considérons 
la fonction 


fan = ( . ) (17.249) 


eŸ + xy 


La différentielle de cette application est 


__d __d tu] __ fu 
df(o,oy(u) = [Gun tu)] EN Le _ Le = a | (17.250) 


L'application f définit donc un difféomorphisme local autour des points (x0,%o) et f(xo, yo). Soit 
(u,0) un point dans le voisinage de f(x0,%o). Alors il existe un unique (x, y) tel que 


J(x, y) = e 1) = () | (17.251) 


Nous avons automatiquement x = u et e” + xy = 0. Notons toutefois que pour que ce procédé 
donne effectivement une fonction implicite y(x) nous devons avoir des points de la forme (u, 0) 
dans le voisinage de f(xo, Yo). A 


17.8 Décomposition polaire (régularité) 

NomDJMUooTRUVKS 
17.57. 
Nous allons montrer que l’application 


f: 577 (n,R) — ST (n,R) 


A Va (17.252) 


est une difféomorphisme. 

Cependant ST+T(n,IR) n’est pas un ouvert de M{n,R) et nous ne savons pas ce qu'est la 
différentielle d’une application non définie sur un ouvert. Nous allons donc en réalité montrer que 
l'application racine carrée existe sur un voisinage de chacun des points de S*T(n,IR). Et comme 
une union quelconque d’ouverts est un ouvert, la fonction f sera bien définie sur un ouvert de 
Mn, R). 

LemLBFÜooDdNcgy 
Lemme 17.58. 
L'application 
f: StT(n,R) — StT(n,R) 


17.253 
As 2 ( ) 


est un CT -difféomorphisme. 


17.8. DÉCOMPOSITION POLAIRE (RÉGULARITÉ) 1481 


Démonstration. Prouvons d’abord que f prend ses valeurs dans S**(n,R). Si 4 € S**(n,R) 
alors par la diagonalisation 9.221 elle s'écrit À = QDQ 1 où D est diagonale avec des nombres 
strictement positifs sur la diagonale. Avec cela, 42 = QD?2Q71 où D? contient encore des nombres 
strictement positifs sur la diagonale. 
L'application f étant essentiellement des polynômes en les entrées de À, elle est de classe C. 
Passons à l’étude de la différentielle. Comme mentionné en 17.57 nous allons en réalité voir f 
sur un ouvert de M(n, R) autour de À € S**(n,IR). Par conséquent si À € S**(n,R), 


df: S**(n,R) — £L(M(n,R),M(n,R)) (17.254a) 
dfa: M(n,R) — M(n, R). (17.254b) 


Le calcul de df1 est facile. Soit u € Mn, R) et faisons le calcul en utilisant la formule du lemme 
(12.268) : 


d 

dfa(u) = ml f(A+ tu)] : (17.255a) 
— d 2 2.2 

= |A + tAu + tuA + Pu Le (17.255b) 

— Au + uA. (17.255c) 


Nous allons utiliser le théorème d’inversion locale 17.50 à la fonction f. Dans la suite, À est une 
matrice de S**(n,R). 


(1) dfA est injective Soit M e Mn, R) dans le noyau de df1. En posant M’ = Q-1MQ nous 
avons M = QM'Q7! et on applique dfa à QM'Q7! : 


dfaA(QM'Q7?) = Q(DM + MD)Q"!. (17.256) 
À 
où D — de, avec À; > 0. La matrice D est inversible. Nous avons M' — 
Àn 
—DM'DT}, et en coordonnées, 
Mi; =) DiMuDy (17.257a) 
kl 
1 
=-ÿ Xi Mi (17.257b) 
kl J 
a (17.257c) 
C'est-à-dire que Mi; = -Ÿ Mi, avec + < 0. Cela implique M' = 0 et par conséquent 


M = 0. 

(2) dfA est surjective Soit N € Min, R) ; nous cherchons M € Min, R) tel que dfa(M) = N. 
Nous posons N' = Q-INQ et M = QM'Q7!, ce qui nous donne à résoudre dfp(M') = N’. 
Passons en coordonnées : 


(DM + M'D);; = D Girki M, + Mixôk; );) = M;; (Xi + ;) (17.258) 
k 


où À; + À; # 0. Il suffit donc de prendre la matrice M” donnée par 


! 1 ! 


D = ——N}, 17.259 


pour que dfA(M") = N'. 
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Le théorème d’inversion locale donne un voisinage V de À dans Mn, R) et un voisinage W de 
A? dans M(n, R) tels que f: V — W soit une bijection et fl: W — V soit de même régularité, 
en l'occurrence C?. 


Remarque 17.59. 
Oui, il y a des matrices non symétriques qui ont une unique racine carrée. 


La proposition suivante, qui dépend du théorème d’inversion locale par le lemme 17.58, donne 


plus de régularité à la décomposition polaire donnée dans le théorème 13.32. 
PropWCXAooDuFMjn 


Proposition 17.60 (Décomposition polaire : cas réel (suite)). 
L'application 
f: O(n,R) x S**(n,R) — GL(n,R) 


ee (17.260) 


est un difféomorphisme de classe C©. 


Démonstration. Si M est donnée dans GL(n,R) alors la décomposition polaire *? M = QS est 
donnée par $ = VMMt et Q = MS7!. Autrement dit, si nous considérons la fonction de décom- 
position polaire 

f: O(n,R) x S**(n,R) — GL(n,R) (17.261) 


alors 
FM) = (M(VMME , VMMt). (17.262) 


Nous avons vu dans le lemme 17.58 que la racine carrée était un C'®°-difféomorphisme. Le reste 
n'étant que des produits de matrices, la régularité est de mise. 


17.9 Théorème de Von Neumann 


Lemme 17.61 ([103]). 
Soit &, un sous-groupe fermé de GL(n,R) et 


La = {m e M{n, R) tel que ee GVte R}. (17.263) 
Alors La est un sous-espace vectoriel de M(n, R). 


Démonstration. Si m € £a, alors À.m € £a par construction. Le point délicat à prouver est le 
fait que si a,b € La, alors a + b € La. Soit a € M{n,R); nous savons qu'il existe une fonction 
Ga: R — M telle que 


el = 1 + ta + aa(t) (17.264) 
et 
t 
lim aE} = (. (17.265) 
t—0 + 
Si a et b sont dans Le, alors elfe’? € G, mais il n’est pas vrai en général que cela soit égal à e(a+b), 


Pour tout k € IN nous avons 


a/k b/k a 1 b 1 a+b 1 
e*e EE) CORTE 1 + E + 6 n (17.266) 


où 5: R — M est encore une fonction vérifiant 3(t)/t — 0. Si k est assez grand, nous avons 


ha +8) un (17.267) 


32. Proposition 13.32. 
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et nous pouvons profiter du lemme 15.150 pour écrire alors 
k a+b 1 
(es/etir) 2 Mn (+48) (17.268) 
Ce qui se trouve dans l’exponentielle est 
a + b 1 a + b 1 
k — = : 17.269 
 +ap +0 (+0) (17.269) 


Les diverses propriétés vues montrent que le tout tend vers a + b lorsque k — 00. Par conséquent 


k 
lim (es/kenr) = et+b, (17.270) 


k—00 


Ce que nous avons prouvé est que pour tout #, et(4+b) est une limite d'éléments dans G et est donc 


dans G parce que ce dernier est fermé. 


Comme £a est un sous-espace vectoriel de M(n, R), nous pouvons considérer un supplémentaire 


M. 
LemHOsSbREC 


Lemme 17.62. 
Il n'existe pas de suite (mx) dans M\{0} convergeant vers zéro et telle que e""* € G pour tout k. 


Démonstration. Supposons que nous ayons mx — 0 dans M\{0} avec er € G. Nous considérons 
les éléments ex = ré] qui sont sur la sphère unité de GL(n,R). Quitte à prendre une sous-suite, 
nous pouvons supposer que cette suite converge, et puisque M est fermé, ce sera vers € € M avec 
le] = 1. Pour tout t € R nous avons 

el — lim e'%, (17.271) 


k—00 
En vertu de la décomposition d’un réel en partie entière et décimale, pour tout k nous avons ÀZ € Z 
et [ur] < À tel que t/|mxl = Àx + 4x. Avec ça, 


t 
eË = Jim exp (—my) = lim eMkeHkmr, (17.272) 
k—00 ME k—co 


Pour tout k nous avons e #4 € G. De plus |[4y| étant borné et mx tendant vers zéro nous avons 
elkMk > T1, Au final 


ef = lim e#e G (17.273) 
k—00 
Cela signifie que € € La, ce qui est impossible parce que nous avions déjà dit que ee M\{0}. 
LemGGTtxdF 
Lemme 17.63. 
L'application 
f: La x M — GL(n,R 
: ( ) (17.274) 
Imree” 


est un difféomorphisme local entre un voisinage de (0,0) dans M{n,R) et un voisinage de 1 dans 
exp (M(n, R)). 
Notons que nous ne disons rien de eM(#R), Nous n’allons pas nous embarquer à discuter si ce 
serait tout GL(n, R) ** ou bien si ça contiendrait ne fut-ce que G!. 


Démonstration. Le fait que f prenne ses valeurs dans GL(n, R) est simplement dû au fait que les 
exponentielles sont toujours inversibles. Nous considérons ensuite la différentielle : si u € £a et 
ve M nous avons 


d d 
df(o,o)(u, v) = ÆCo)] = lee = U + V0. (17.275) 


33. Vu les dimensions y’a tout de même peu de chance. 
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L'application dfo est donc une bijection entre £a x M et M{n,R). Le théorème d’inversion lo- 
cale 17.50 nous assure alors que f est une bijection entre un voisinage de (0,0) dans £a x M et 
son image. Mais comme dfo est une bijection avec M(n, R), l’image en question contient un ouvert 
autour de 1 dans exp (M(n,R)). 


ThoUBriEoe 
Théorème 17.64 (Von Neumann|103, 489, 490]). 
Tout sous-groupe fermé de GL(n,R) est une sous-variété de GL(n, R). 


Démonstration. Soit G un tel groupe; nous devons prouver que c’est localement difféomorphe à 
un ouvert de R”. Et si on est pervers, on ne va pas faire localement difféomorphe à un ouvert de 
R”?, mais à un ouvert d’un espace vectoriel de dimension finie. Nous allons être pervers. 

Étant donné que pour tout ge G! l'application 


He (17.276) 
ke gh 
est de classe C'? et d’inverse C, il suffit de prouver le résultat pour un voisinage de 1. 
Supposons d’abord que £a = {0}. Alors 0 est un point isolé de In(G) ; en effet si ce n’était 
pas le cas nous aurions un élément mx de In(G) dans chaque boule B(0,r4). Nous aurions alors 
mx = In(az) avec ax € G et donc 


er = ag € G. (17.277) 


De plus mx appartient forcément à M parce que £a est réduit à zéro. Cela nous donnerait une 
suite my — 0 dans M dont l’exponentielle reste dans G. Or cela est interdit par le lemme 17.62. 
Donc 0 est un point isolé de In(G). L'application In étant continue **, nous en déduisons que 1 
est isolé dans G. Par le difféomorphisme L,, tous les points de G sont isolés ; ce groupe est donc 
discret et par voie de conséquence, une variété. 

Nous supposons maintenant que La Æ {0}. Nous savons par la proposition 15.149 que 


exp: M(n,R) — Min,R) (17.278) 


est une application C® vérifiant dexp, = Id. Nous pouvons donc utiliser le théorème d’inversion 
locale 17.50 qui nous offre donc l’existence d’un voisinage U de 0 dans Mn, R) tel que W = exp(U) 
soit un ouvert de GL(n, R) et que exp: U — W soit un difféomorphisme de classe C?. 

Montrons que quitte à restreindre U (et donc W qui reste par définition l’image de U par exp), 
nous pouvons avoir Exp (U N La) = W nG. D'abord exp(La) € G par construction. Nous avons 
donc exp (U ON La) ec WAnG. Pour trouver une restriction de U pour laquelle nous avons l'égalité, 
nous supposons que pour tout ouvert © dans U, 


exp: On£a—exp(O)r G (17.279) 


ne soit pas surjective. Cela donnerait un élément de O AC£La dont l’image par exp n’est pas dans G. 
Nous construisons ainsi une suite en considérant une boule B(0, +) inclue à U et x, € B(0, E)nC£La 
vérifiant eŸ* € G. D’après le choix des boules, nous avons évidemment zx — 0. 

L'élément er est dans eM(r.R) et Je difféomorphisme du lemme 17.63% nous donne (1x, My) € 
La x M tel que eke"x = e*x, À ce point nous considérons k suffisamment grand pour que e** soit 
dans la partie de l’image de f sur lequel nous avons le difféomorphisme. Plus prosaïquement, nous 
posons 

(,me) = f (ex) (17.280) 


et nous profitons de la continuité pour permuter la limite avec f-! : 


dim (l, mx) = F7 (Em é%) = f71{(1) = (0,0). (17.281) 


k—00 


34. Par le lemme 15.150. 
35. Il me semble que l’utilisation de ce lemme manque à l'avant-dernière ligne de la preuve chez [103]. 
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En particulier my — 0 alors que e"#* = efke-l € G. La suite mx viole le lemme 17.62. Nous 
pouvons donc restreindre U de telle façon à avoir 


exp(Un£e)=WnG. (17.282) 


Nous avons donc un ouvert de £a (l’ouvert U n £a) qui est difféomorphe avec l’ouvert W n G de 
G. Donc G est une variété et accepte £a comme carte locale. 


Remarque 17.65. 
En termes savants, nous avons surtout montré que si G est un groupe de Lie d’algèbre de Lie g, 
alors l’exponentielle donne un difféomorphisme local entre g et G. 


17.10 Recherche d’extrémums 
DEFooJMMLooYMZehc 


Définition 17.66 ([191]). 
Si f: R? —R est une fonction, le point a € R” est un maximum local de f si il existe 0 > 0 tel 
que pour tout x € B(a,d), f(x) < f(a). 

Je vous laisse deviner la définition d’un minimum local. 

Un extrémum local est un point qui est soit un minimum soit un maximum local. 


17.10.1 Extrema à une variable 


Définition 17.67. 

Soit f: ACR—Retae À. Le point a est un maximum local de f si il existe un voisinage U 
de a tel que f(a) > f(x) pour tout x EU Nn À. Le point a est un maximum global si f(a) > g(x) 
pour tout x € À. 


La proposition basique à utiliser lors de la recherche d’extrémums est la suivante : 
PROPooNVKXooXtKkuz 


Proposition 17.68. 
Soit f:ACR—Retae Int(A). Supposons que f est dérivable en a. Si a est un extrémum 
local, alors f'(a) = 0. 


3enx=0:sa 


La réciproque n’est pas vraie, comme le montre l’exemple de la fonction x + x 
dérivée est nulle et pourtant x = 0 n’est ni un maximum ni un minimum local. 
Cette proposition ne sert donc qu’à sélectionner des candidats extrémum. Afin de savoir si ces 


candidats sont des extrémums, il y a la proposition suivante. 
PROPooCXHPooS1RSEJ 


Proposition 17.69. 
Soit f:ICR— KR, une fonction de classe C* au voisinage d’un point a € Int I. Supposons que 


f'(a) = fa) =... = FE (a) = 0, (17.283) 


et que 
f%) (a) £ 0. (17.284) 


Dans ce cas, 


(1) Sik est pair, alors a est un point d’extrémum local de f, c’est un minimum si f(9) (a) > 0, 
et un maximum si f®)(a) < 0, 


(2) Sik est impair, alors a n’est pas un extrémum local de f. 


Note : jusqu’à présent nous n'avons rien dit des extrémums globaux de f. Il n’y a pas grand 
chose à en dire. Si un point d’extrémum global est situé dans l’intérieur du domaine de f, alors il 
sera extrémum local (a fortiori). Ou alors, le maximum global peut être sur le bord du domaine. 
C’est ce qui arrive à des fonctions strictement croissantes sur un domaine compact. 


36. Définition 17.66. 
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Une seule certitude : si une fonction est continue sur un compact, elle possède une minimum 
et un maximum global par le théorème 10.54. 

Soit une fonction f : 1 — R, et soit a € I. Si f'(a) > 0, alors la tangente au graphe de f au point 
(a, Ÿ (a)) sera une droite croissante (coefficient directeur positif). Cela ne veut pas spécialement 
dire que la fonction elle-même sera croissante, mais en tout cas, cela est un bon indice. 


Exemple 17.70. 

Si f(x) = x?, il est connu que f’(x) = 2x. Nous avons donc que f” est positive si x > 0 et f’ est 
négative si x < 0. Cela correspond bien au fait que x? est décroissante sur |—00,0[ et croissante 
sur [0,00]. A 


Sur la figure 17.2, nous avons dessiné la fonction f(x) = x cos(x) et sa dérivée. Nous voyons que 
partout où la dérivée est négative, la fonction est décroissante tandis que, inversement, partout où 
la dérivée est positive, la fonction est croissante. 


FIGURE 17.2: La fonction f(x) = xcos(x) en bleu et sa dérivéer@paMgfTRA0oTCCpOV 


Les extrémums de la fonction f sont donc placés là où f” change de signe. En effet si f’(x) < 0 
pour æ <aet f'(x) > 0 pour x > a, la fonction est décroissante jusqu’à a et est ensuite croissante. 
Cela signifie que la fonction connait un creux en a. Le point a est donc un minimum de la fonction. 

Attention cependant. Le fait que f’(a) = 0 ne signifie pas automatiquement que f a un maxi- 
mum ou un minimum en a. Nous avons par exemple tracé sur la figure 17.3 les fonctions x° et sa 
dérivée. Il est à noter que, conformément à ce que l’on pense, certes la dérivée s’annule en x = 0, 
mais elle ne change pas de signe. 


17.10.2 Extrema libre 
DEFooYJLZooLkEAYf 


Définition 17.71. 
Un point a à l’intérieur du domaine d’une fonction f: AC R"—R est un point critique de f 
lorsque df(a) = 0. 


Ces points sont analogues aux points où la dérivée d’une fonction sur R s’annule. Les points 
critiques de f sont donc les candidats à être des points d’extrémum. 

Dans le cas d’une fonction de deux variables, la proposition 12.359 nous permet de voir (d° f)4 
comme étant la matrice 


) Pa) HE (a) 
Pf(a)= | &, le (17.285) 
dy dx (a) de (a) 


Dans le cas d’une fonction C?, cette matrice est symétrique. 
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FIGURE 17.3: La dérivée de x° s’annule en x = 0, mais ce n’est ni un minipae LEE AYBOTS SM 


PropUQRooPgJsuz 
Proposition 17.72 ([192]). 
Soit un ouvert Q de R” et a € (. Soit une fonction f: Q — R différentiable en a. Si a est un 
extrémum local de f, alors a est un point critique de f. 


Démonstration. Nous supposons que a est un maximum local (ce sera la même chose si a est un 
minimum). Soit r > 0 tel que f(x) < f(a) pour tout x E B(a,r) (et tel que cette boule reste dans 
Q). Soit u € R” assez petit pour que a+ u € B(a,r) de sorte que la définition suivante ait un sens : 


g:[-1,1]—R 


2 (17.286) 


Cette fonction est différentiable en t = 0 (composée de fonctions différentiables, théorème 11.241) 
et a un maximum local en t = 0. Donc g/(0) = 0 par la proposition 17.68. Donc 


d 
0 = [7 + t)] — dfi(u). (17.287) 
17.10.3 Extremums et Hessienne 
PropoExtreRn 


Proposition 17.73 ([1, 493, 494)). 
Soit un ouvert Q de R” et une fonction f : Q — R deux fois différentiable ain Cf do qqMaQL 


(1) Si a est un point critique de f et si il existe r tel que (d'f,) est semi-définie positive pour 


tout x E B(a,r) alors f possède un minimum local en a. ITEMooCVFVoolLtGql 


(2) Si a est un point critique" de f, et si d°f, est strictement définie positive ®, alors a est un 


minimum local strict de f, ItemPropoExtreRn 


(3) Si a est un minimum local, alors (d? f), est semi-définie positive. 


Démonstration. Nous subdivisons la preuve. 


37. Définition 17.71. 
38. La fonction f est de classe C?, donc les dérivées croisées sont égales et d? f est symétrique. La définition 9.224 
s'applique donc. 
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(1) EL) 
Soit À tel que a+ hE€ B(a,r). Nous allons montrer que f(a) < f(a + h); cela montrera que 
x = a est un minimum local. Pour cela nous utilisons un développement de Taylor * : il 
existe c € Ja, a + h[ tel que 


fa +) = f{a) + déalh) + S De(h,h) > 1 (0) (17.288) 


parce que, par hypothèse, (d2f). est définie positive, et parce que df, = 0. 


(2) (2) 


La forme bilinéaire d°f, est strictement définie positive, donc il existe a > 0 tel que 
& fa(h,h) > alh|? (17.289) 


pour tout h. Nous utilisons encore Taylor : il existe une fonction € telle que limz,_,0 e(h) = 
et 


f(a+h) = f(a) + dfa(h) + (Pal h) + IA|°e(h). (17.290) 


En tenant compte du fait que df, = 0, 
1 
f(a+kh) > f(a) + IR (a — e(h)). (17.291) 


La limite de € nous dit qu’il existe r > 0 tel que |e(h)| < a pour tout À € B(0,r). Pour ces 
valeurs de À nous avons 


f(a+h) > f(a). (17.292) 
Donc a est un minimum local strict de f. 


(3) (3) Si a est un minimum local, nous savons déjà df, = 0 par la proposition 17.72. Nous 
écrivons le développement de Taylor de f à l’ordre 2 de la proposition 12.462 : 


f(a+h) = f(a) + dfa(h) + (dE Pa(h h) + |A°a(lAl). (17.293) 


En prenant h assez petit pour que a + h ne sorte pas de la boule dans laquelle a est un 
minimum, nous avons f(a + h) — f(a) > 0. Donc 


(Pal h) + [A[Fa(Ial) > 0 (17.294) 
Nous divisons cela par |h|? et notons ex = h/|h| : 

S( Pralen.en) + a(lh|) > 0. (17.295) 
À la limite À — 0, le premier terme est constant tandis que le deuxième tend vers zéro. À la 


limite, 


(P fJa(en, en) > 0. (17.296) 


La caractérisation du lemme 9.228(2) nous dit alors que (d?f), est semi-définie positive. 


La partie (3) est tout à fait comparable au fait bien connu que, pour une fonction f: R —R, 
si le point a est minimum local, alors f'(a) = 0 et f”(a) > 0. 

Notons que le point (3) ne parle pas de minimum strict, et donc pas de matrice strictement 
définie positive. 


39. Proposition 12.465. 
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Exemple 17.74 (Proposition 17.73(2) sans point critique). 
L'hypothèse de point critique pour l’utilisation de la stricte définition positive de d?f, est néces- 
saire. Soit en effet la fonction 

f{&)=2? +. (17.297) 


Elle vérifie f”(0) = 2, de telle sorte que sa différentielle seconde en zéro soit strictement définie 
positive. Le point x = 0 n’est cependant même pas un minimum local. Entre autres parce que 
f'0)= 120. A 
La méthode pour chercher les extrémums de f est donc de suivre les points suivants : 

(1) Trouver les candidats extrémums en résolvant V f = (0,0), 
(2) écrire d? f(a) pour chacun des candidats 
(3) calculer les valeurs propres de d? f(a), déterminer si la matrice est définie positive ou négative, 
(4) conclure. 

Une conséquence de la proposition 9.227(3) 4 est que si det M < 0, alors le point a n’est pas 
un extrémum dans le cas où M = d?f(a) par le point (3) de la proposition 17.73. 


Exemple 17.75. 
Soit la fonction f(x,y) = x? + yŸ— 4xy. C’est une fonction différentiable sans problème. D'abord 
sa différentielle est 

df = (47° — Ay; 4 — 4x), (17.298) 


et la matrice des dérivées secondes est 


12%? —4 
_ 2 » 
M = d f(x, y) ( à D) à (17.299) 
Nous avons df = 0 pour les trois points (0,0), (1,1) et (1, —-1). 
Pour le point (0,0) nous avons 
0 —4 
M = Fe . ) | (17.300) 


dont les valeurs propres sont 4 et —4. Elle n’est donc ni définie ni semi-définie positive ou négative. 
La proposition 17.73(2) conclut donc (0,0) n’est pas un extrémum local. 
Au contraire pour les points (1,1) et (—1,—1) nous avons 


15 4 
M = e (17.301) 


dont les valeurs propres sont 16 et 8. La matrice df y est donc définie positive. Ces deux points 
sont donc extrémums locaux. a 


17.10.4 Un peu de recettes de cuisine 


(1) Rechercher les points critiques, càd les (x, y) tels que 


En effet, si (x, yo) est un extrémum local de f, alors  (xo, yo) = 0 = 81 (0, Yo). 


(2) Déterminer la nature des points critiques : « test » des dérivées secondes : 


CE of? œ ° 
On pose An vo) = Ro ve) GE Crouuo) — (Hu) 


È a matrice a) es oujJours symetrique quan: es e classe . 
40. L ice d? t touj ymétri d t de classe C? 


1490 CHAPITRE 17. ENCORE DE L'ANALYSE (ET C’EST PAS FINI) 


Si H(xo, yo) > 0 et PL (x0, vo) > 0 — (10, Yo) est un minimum local de f. 


zo, Yo) > 0 et PE (x0, Yo) <0— (x0, Yo) est un maximum local de f. 
TO, YO 


TO; YO 


<0— f à un point de selle en (0, yo). 


RO RO TRS 
RS RS Cr 


= 0 —, on ne peut rien conclure. 


17.10.5 Extrema liés 


Soit f, une fonction sur R"', et M € IR” une variété de dimension m. Nous voulons savoir 
quelles sont les plus grandes et plus petites valeurs atteintes par f sur M. 

Pour ce faire, nous avons un théorème qui permet de trouver des extrémums locaux de f sur 
la variété. Pour rappel, a € M est une extrémum local de f relativement à l’ensemble M si il 
existe une boule B(a,e) telle que f(a) < f(x) pour tout x € B(a,e) n M. 


ThoRGJossS 
Théorème 17.76 (Extremum lié [473]). 
Soit À, un ouvert de R" et 
(1) une fonction (celle à minimiser) f € C!(A,R), 
(2) des fonctions (les contraintes) G1,...,G,e CY(A,R), 
(3) M = {x € À tel que Gi(x) = OVi}, 
(4) un extrémum local a € M de f relativement à M. 
Supposons que les gradients VGi(a), ...,VG,(a) soient linéairement indépendants. Alors a = 
(t1,...,%n) est une solution de VL(a) = 0 où 
F 
A A DD Gr) (17.302) 


i=1 


Autrement dit, si a est un extrémum lié, alors V f(a) est une combinaisons des VG;(a), ou encore 


il existe des À; tels que 
FPr 800) 


La fonction L est le lagrangien du problème et les variables À; sont les multiplicateurs de 
Lagrange. 


df(a) = > XdGi(a). 


Démonstration. Si r = n alors les vecteurs linéairement indépendantes VG;(a) forment une base 
de R” et donc évidemment les À; existent. Nous supposons donc maintenant que r < n. Nous 
notons (2;);-1.n les coordonnées sur R?. 

La matrice 


Gr (a) get (a) 
: : : (17.304) 
ra) -. (a) 


est de rang r parce que les lignes sont par hypothèses linéairement indépendantes. Nous nommons 
(yi)i=1,..r un choix de r parmi les (2;) tels que 


cer 0G1 
y OYr 
det | : : |A. (17.305) 
0Gr 2Gr 
Oyi OYr 


\ 


Nous identifions R’? à R° x IR’ dans lequel R’ est la partie générée par les (y5);=1,..r. Les co- 
ordonnées sur R° seront nommées (x;);-1.., de telle sorte que les coordonnées sur R” seront 
T1,-..,TssYl,--., Yr. Dans ces coordonnées, nous nommons a = (a, B) avec ae R° et BE R’. 
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Si nous notons G = (G1,...,G,), le théorème de la fonction implicite (théorème 17.51) nous 
dit qu’il existe un voisinage U’ de a € R”, un voisinage V’ de B € R’ et une fonction w: U' — V” 
de classe CT telle que si (x, y) € U! x V’, alors 


G{x,y) = 0 (17.306) 

si et seulement si y = (x). Nous posons maintenant 
dx) = (x, p(x)) (17.307a) 
hs) = f(b(x)). (17.307b) 


Nous avons (a) = a et Y(x) € M pour tout x € U’. La fonction h a donc un extrémum local en 
a et donc les dérivées partielles de À y sont nulles. Cela signifie que 


oh (a) _ > Of be 7 Of Pr 


Ü = ie : 17.308 
OT; fi ot; 0x; k=1 OYk OT; ( 
c'est-à-dire . 
Ch Of, Ok 
+ = 0 17.309 
a (0) + À Au) Ge (0) (17.309) 
pour tout à = 1,...,s. D'autre part pour tout k, la fonction {(x) = G% Ce, p(x)) est constante et 
vaut zéro ; ses dérivées partielles sont donc nulles : 
ol 0G% = 0Gz, | dv 
a) = a) + a a) = 0 17.310 
Gr (0) = Ga (0) + À ge (0) qu (0) (17.310) 
pour touti=1,...,set k=1,...,r. 
Les s premières colonnes de la matrice 
PE yes EE DE, x CE 
0x1 Ôts ©! d © (a 
0G1 ,.. 0G1 0G1 .,.. 0G1 
0Gr ... Gr ÔGr ... 0G 
0x1 Ôts Oy1 OYr 


s'expriment en termes des r dernières. La matrice est donc au maximum de rang r. Notons que la 
première ligne est V f et les r suivantes sont les VG;. Vu que ces lignes sont des vecteurs liés, il 
existe 10,...,14 tels que 
: 
boV f + D mi VG; = 0. (17.312) 
i=1 
Par hypothèse les VG; sont linéairement indépendants, ce qui nous dit que 9 Æ 0. Donc nous 
avons ce qu'il nous faut : 


V/(a)=Y nn VGi(a) (17.313) 


Notons qu’au vu de l'expression (17.303), le fait que les formes {dG;(a)}1<i<r forment une 
partie libre dans (R”)* implique que les À; sont uniques. 


La proposition suivante est la même que 17.76. 


PropfPPUxh 
Proposition 17.77. 
Soit U, un ouvert de R" et des fonctions de classe C? f,g1,..., gr: U — R. Nous considérons 
T={seuU tel que hr) =... 9,(&)=0}. (17.314) 
Soit a un extrémum de flr. Supposons que les formes dg1,...,dg, soient linéairement indépen- 


dantes en a. Alors il existe À1,...,X, dans R tel que 


dfa = > Xi(dgi)a: (17.315) 
i=1 
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En pratique les candidats extrémums locaux sont tous les points où les gradients ne sont pas 
linéairement indépendants, plus tous les points donnés par l’équation VL = 0. Parmi ces candidats, 
il faut trouver lesquels sont maximums ou minima, locaux ou globaux. 

L'existence d’extrémums locaux se prouve généralement en invoquant de la compacité, et en 


invoquant le lemme suivant qui permet de réduire le problème à un compact. 
LemmeMinSCimpliques 


Lemme 17.78. 
Soit S, une partie de R” et C, un ouvert de R”. Si ae Int S est un minimum local relatif à SnC, 
alors il est un minimum local par rapport à S. 


Démonstration. Vu que a est un minimum local relatif à S n C, il existe un €1 > 0 tel que pour 
tout x € B(a,a) n S nC, nous avons f(x) > f(a). 

Mais étant donné que C'est ouvert, et que a € ©, il existe un €2 tel que B(a, 2) € C. En prenant 
€ = min{e1,€}, nous trouvons que f(x) > f(a) pour tout x e B(a,e) nn (SnC) = B(a,e)ns$. 


17.11 Fonctions convexes 
SECooVZD6UUYRAUz 


Définition 17.79 ([495]). 
Une fonction f d’un intervalle 1 de R vers R est dite convexe lorsque, pour tous x1 et x2 de I 
et tout À dans [0,1] nous avons 


Fa + (1 — À) 22) < À f(æ1) + (1 — À) f(x) ne 
Si pour tout XE |0,1[ et pour tout x Æ y dans T nous avons 
lai + (1— X)&2) < À f(œ1) + (1— X) fa) ÉAoOEGBS 00e yqEr 


alors nous disons que la fonction f est strictement convexe sur I. 
Une fonction est concave si son opposée est convexe. 


17.80 ([495]). 

Les différents résultats pour les fonctions convexes s'adaptent généralement sans mal aux fonctions 
strictement convexes. Une nuance cependant : de même que les fonctions dérivables convexes sont 
celles qui ont une dérivée croissante, les fonctions dérivables strictement convexes sont celles qui ont 
une dérivée strictement croissante (proposition 17.86). En revanche, il ne faudrait pas croire que 
la dérivée seconde d’une fonction dérivable strictement convexe est nécessairement une fonction à 
valeurs strictement positives (voir théorème 17.87) : la dérivée d’une fonction strictement croissante 
peut s’annuler occasionnellement, ou plus exactement peut s’annuler sur un ensemble de points 
d'intérieur vide. Penser à x + x* pour un exemple de fonction strictement convexe dont la dérivée 
seconde s’annule. 


17.81. 
Demander un À € [0,1] est équivalent à demande des «a, B > 0 tels que à + 8 = 1. En effet, si 
a + B = 1, alors il suffit de se dire que a est le À et que 6 = 1 — a. 


LEMooXUDSooBUMnaZ 
Lemme 17.82. 
soit une fonction strictement convexe f. Soient a, B > 0 tels que a + 5 = 1. Nous avons 
EQooDKKUo 
f(au + Bu) = af{u) + BJ() eut) 


si et seulement si u = v. 


Démonstration. Tant que u Æ£ v, la définition (17.317) est une inégalité stricte. Donc si (17.318) 
est valide, alors u = v. 
Dans le sens inverse, si u = v, alors au + Bu = u, et af(u) + Bf(v) = f(u). 
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17.11.1 Inégalité des pentes 


Dans l’étude des fonctions convexes nous allons souvent utiliser la fonction taux d’accroisse- 
ment qui est, pour « dans le domaine de convexité de f définie par 


Ta: 1\{a}j —R - 
LÉ) = flo) Le) 


z—a 
PropMDMG jG0 
Proposition 17.83 (Inégalité des pentes[196]). 


Soit f une fonction convexe sur un intervalle 1 € IR. Alors pour tout a < b < c dans 1 nous 


avons # 


b) — — — f(b 
fD-1@ fo -10@ | 0-10 . 
b—a c—a c—b 
En d’autres termes, 
ASC Tic), (17.321) 
c’est-à-dire que T est croissante en ses deux arguments. 
Démonstration. D'abord les inégalités a < b < c impliquent 0 < b— a < c— a et donc 
b—a 
À = < 1. (17.322) 
c—a 


L’astuce est de remarquer que (1 — À)a + Àc = b. Donc À a toutes les bonnes propriétés pour être 
utilisé dans la définition de la convexité : 


F(( — Xa+ Xc) < Àf(c) +(1—À)f(a), (17.323) 
c’est-à-dire 
F(b) — fa) < A(F(c) — f(a)) (17.324) 
ou encore, en remplaçant À par sa valeur : 
b—a c—a 
Cela fait déjà une des inégalités à savoir. 
D'autre part en partant de —a > —b < c nous posons 
De (17.326) 
C—a 
Nous avons à nouveau b = (1 — À)c + Àa et nous pouvons obtenir la seconde inégalité 
_ — f(b 
fo) = f@)  O F0) —. 


Le. 
Cc—a c—b 


Géométriquement, l'inégalité des pentes se comprend facilement : le coefficient angulaire de la 
corde du graphe augmente. Donc si x < y < z, le coefficient moyen entre x et y est plus petit que 
celui entre x et z qui est plus petit que celui entre y et z. 

Donc si le coefficient angulaire moyen entre a et b + u vaut celui entre a et b, ce coefficient 
ne peut qu'être constant entra a et b : sinon il serait plus grand entre b et b + u et la moyenne 
sur à — b + u serait plus grande que sa moyenne sur a — b. Mais avoir un coefficient angulaire 
constant signifie être une droite. 

En résumé, si une fonction est convexe et non strictement convexe, alors son graphe est une 
droite. C’est en gros cela que la proposition 17.91 clarifiera. 


41. Les inégalités sont strictes si la fonction f est strictement convexe. 
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17.11.2 Convexité et régularité 
LemKLTSsHIQ 


Lemme 17.84 ([195]). 
Une fonction convexe sur un ouvert de R 


(1) y admet des dérivées à gauche et à droite en chaque point, 
(2) y est continue. 


Démonstration. Si À est l’ouvert sur lequel la fonction f est convexe, pour chaque point x de À, il 
existe une boule B(x,r) € À. Pour 0 < r’ < r nous avons aussi B(0,r’) € A. Bref, nous pouvons 


supposer que f est définie et convexe sur un intervalle 1 = [a,b|. 

Soit à € 1. Nous allons prouver que f est continue en «. Nous considérons 7, le taux d’accrois- 
sement défini par (17.319); c’est une fonction croissante comme précisé dans l'inégalité des trois 
pentes 17.83 et de plus 7,(x) est bornée supérieurement par 7,(b) pour x < a et inférieurement 
par Ta(a) pour æ > @. Les limites existent donc et sont finies par la proposition 12.59. Autrement 
dit les limites 


im, # ) — fo) = im, le) inf Fatt) (17.328a) 
lim f(æ) — f(a) = lim 7(x) = supra(t). (17.328b) 
x a LE — Ta t<a 


existent et sont finies, c’est-à-dire que la fonction f admet une dérivée à gauche et à droite. 
Pour tout x nous avons les inégalités 


< Ta(b). (17.329) 


En posant k = max{ra(a),Ta(b)} nous avons 


Lf(æ) — f(a)| < k|x — al. (17.330) 


La fonction est donc Lipschitzienne et par conséquent continue par la proposition 12.329. 


Remarque 17.85. 
Les dérivées à gauche et à droite ne sont à priori pas égales. Penser par exemple à une fonction 
affine par morceaux dont les pentes augmentent à chaque morceau. 


17.11.3 Dérivées d’une fonction convexe 


PropYKwIDPX 

Proposition 17.86 ([197, 498, 1]). 
Une fonction dérivable sur un intervalle TI de R LTEMooUTSAoo JvhZNm 
(1) est convexe si et seulement si sa dérivée est croissante sur I. ITEMooLLSTooFwkxtV 


(2) est strictement convere si et seulement si sa dérivée est strictement croissante sur I 
Démonstration. Pour la preuve de (1) et (2), nous allons démontrer les énoncés « non stricts » et 
indiquer ce qu'il faut changer pour obtenir les énoncés « stricts ». 


(1) Sens direct Nous supposons que f est convexe. Soient a < b dans I et x € |a,b[. D’après 
l'inégalité des pentes 17.83, 


fa) 10) L 10-10 L 10 -/() EqATDLop eq 
a ba  b=x ‘ 
En faisant la limite x — a nous avons 
Fa) < 00) (17.332) 
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et la limite x — b donne 


< f'(b). (17.333) 
b—a 


Ici les inégalités sont à priori non-strictes, même si f est strictement convexe : même avec 
des inégalités strictes dans (17.331), le passage à la limite rend l'inégalité non stricte. Quoi 


qu’il en soit nous avons 
f'(a) < F'(b). + Ha) 


(2) Sens direct : strict Nous savons déjà que f” est croissante. Si (17.334) était une égalité, 
alors f’ serait constante sur |a,b[ parce qu’en prenant c entre a et b nous aurions f'(a) < 
f'(e) < f'(b) avec f'(a) = f'(b). Donc f'(a) = f’(c). Avoir f’ constante sur un intervalle est 
contraire à la stricte convexité. 


(3) Sens réciproque 


Nous supposons que f’ est croissante et nous considérons a < b dans 1 ainsi que À € [0,1]. 
Nous posons x = Àa+(1—À)b, et nous savons que a & x < b. Le théorème des accroissements 
finis 12.195 donne «1 € Ja, x| et c2 € ]x,b[ tels que 


f'() = f@) Ju (17.335) 
et b 
f'(c2) = ee (17.336) 


Et en plus €; < c2. Vu que f’ est croissante nous avons f/(c1) < f'(c2) et donc 


f() — f(a) L FO) — f) EqSAOCopHA RL 


= 
T—a b—x 


En remplaçant x par sa valeur en termes de à, a et b nous avons x — a = (1 — À)(b — a) et 
b—x=— À(b— a), et l'inégalité (17.337) nous donne 


f(æ) < Af(a) + (1 — À)f(b). (17.338) 


(4) Sens réciproque : strict Si f” est strictement croissante, nous avons f’(c1) < f'(c2) et 
les inégalité suivantes sont strictes, ce qui donne 


f(æ) < Xf(a) + (1— X)f(b). (17.339) 


[ 
ThoGXjKeYb 
Théorème 17.87 ([197)). 


: : 2 
Soit une fonction f de classe C*. ITEMOoIUTQooTkRMoyBP 


: 7 _— 
(1) Est convexe si et seulement si f” est positive. ITEMooXUOMooYIo0tv 


(2) Si f” est strictement positive, elle est strictement convexe. 


Démonstration. En deux parties. 

(1) Pour (1) La fonction est C?, donc f” est positive si et seulement si f” est croissante (pro- 
position 12.188) alors que la proposition 17.86 nous jure que f sera convexe si et seulement 
si f' est croissante. 

(2) Pour (2) Si f” est strictement positive, f” sera strictement croissante et donc f strictement 
convexe (proposition 17.86). 


REMooVRPQooïlybxmp 
Remarque 17.88. 
Une fonction peut être strictement convexe sans que sa dérivée seconde ne soit toujours strictement 
positive. En exemple : x > x* est strictement convexe alors que sa dérivée seconde s’annule en 
ZÉTO. 
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ExPDRooZCtkOz 
Exemple 17.89. 
Quelques exemples utilisant le théorème 17.87 


(1) La fonction x +> x? est convexe parce que sa dérivée seconde est la constante (positive) 2. 


1 + de 
2) La fonction x > + est convexe sur R°\{0} (sa dérivée seconde est 2x RE 


(2) 
(3) La fonction exponentielle est strictement convexe par le théorème 17.87. 
(4) 


4) La fonction In est concave parce que la dérivée seconde de — In est . qui est strictement 


positif. 
A 


Nous en démontrons une en détail; elle sera utile en analyse fonctionnelle, lors de l’étude des 


espaces LP, Voir par exemple le théorème de la projection 27.146. 
LEMooSXTXooZ0mtKq 


Lemme 17.90. 
Soient p > 1 et la fonction 
f:10,œ0[ —R 


(17.340) 
xt x 
est strictement convete. 


Démonstration. La proposition 14.271 nous permet de dire que la fonction f est de classe C'© et 
que la dérivée seconde est donnée par 


f(x) = p(p — 1)xP 2. (17.341) 


Cela est strictement positif pour tous les x considérés, le théorème 17.87 conclut. 


17.11.4 Graphe d’une fonction convexe 


L'idée principale du graphe d’une fonction convexe est qu’il est toujours au dessus du graphe 
de ses tangentes (lorsqu'elles existent). Lorsqu’elles n’existent pas, le lemme 17.84 donne des coef- 


ficients directeurs de droites qui vont rester en dessous du graphe de la fonction. 
PROPoo0C0Eo0EGÿbmsS 


Proposition 17.91 ([199)). 
Une fonction convexe est strictement convexe si et seulement si il n'existe aucun intervalle de 
longueur non nulle sur lequel elle coïncide avec une fonction affine. 


Démonstration. Si sur l'intervalle (non réduit à un point) [x, y], la fonction convexe f coïncide 
avec une fonction affine, alors f(t) = at + b et pour À € |0,1[ nous avons 


JA + (1— X)y) = ax + a(1 — y +b = A f(x) + (1— À) f(y) (17.342) 


où nous avons remplacé b par Ab + (1 — À)b. Par conséquent la fonction n’est pas strictement 
convexe. 

Nous supposons maintenant que la fonction convexe f n’est pas strictement convexe sur l’in- 
tervalle TI. Il existe x £ yE I et À € ]0,1[ tels que 


Fax + (1 y) = Xf(x) + (1—à)f(y). (17.343) 


Nous posons z = Ar +(1—\)yet u € |x,z2| pour écrire des inégalités des pentes entre x < u < 
— f@)-f(a) 
> b 
b—a  ? 


z < y. Plus précisément si nous notons a — b la pente de a à b, c’est-à-dire a 
alors les inégalités des pentes pour x < u < z puis u < z < y donnent 


T—IZ<U—I<Z—7Y. ÉgooBMEF O0 potzQ 
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Voyons maintenant qu’en réalité z — y = x — z. En effet en replaçant 


FC) — Af(x 
J(y) = @ @) (17.345) 
1— À 
et N 
z 
_ 17.346 
RE ( ) 
dans l’expression z — y = f WI &) nous obtenons 
y — Z Zz—T 
Les inégalités (17.344) sont donc des égalités : 
SG) 14) _ 1-10) _ f@) SG) ——. 
Zz—T ET y —Z 
Nous avons donc montré que le nombre a = #@)-F@) ne dépend pas de uw. Nous avons alors 
f(z) — f{u) = a(z — u) (17.349) 
ou encore : 
Ju) = f(z) — a(z — u), (17.350) 
ce qui signifie que sur |x,2[, la fonction f est affine. 
PROPooQPOSooDZILUAJ 


Proposition 17.92. 
Une fonction dérivable sur un intervalle T de R est convexe si et seulement si son graphe est au 
dessus de chacune de ses tangentes. 


Démonstration. En deux parties. 


(1) Sens direct Soient x,y € I. Nous voulons : 


Fu) > f(x) + F(æ)(y — x). (17.351) 


Étant donné que nous aurons besoin, dans le quotient différentiel de quelque chose comme 
f(x +t) — f(x) nous écrivons la définition (17.316) de la convexité en inversant les rôles de 
x et y et en manipulant un peu : 


Jty + (1—t)z) <tf(y) +(1-t)f(x) (17.352a) 
Je +t(y-x)) <tf(y) + (1—t)f(x) (17.352b) 
J(æ+t(y—x)) — f(x) < tf(y) — tf(x) (17.352c) 
Nous divisons par t : 
Je +1 = HO fu) — f(x). (17.353) 
Le passage à la limite { — 0 donne 
(y— x) f(x) < F(y) — f(x), (17.354) 


ce qu'il fallait. 


(2) Sens inverse Pour tout x, y € Î nous supposons avoir 


fu) > f(æ) + P'(æ)(y — x). FRoOERKTOORA TRES 


Si nous supposons + £ y et si nous posons z = Àx + (1 — À)y nous voulons prouver que 


FG) < Af(x) + (1 — à) f(u). (17.356) 
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Pour cela nous écrivons l’inégalité (17.355) avec les couples (x, z) et (y, z) : 


f(x) > f() + F'()'(x — 2) (17.357a) 
fo) > FC) + FO 2) (17.357b) 


En multipliant la première par À et la seconde par (1 — À) et en sommant, 


Af(æ) + (1— 2) f(y) > Af(2) + AP (2) — 2) + (1 — À) f(2) + (1 2) F2) (y — 2) 


> 
> 


(17.358a) 
= f(2) + FO — 2) +(1—X)(y— 2) (17.358b) 
= f(2). (17.358c) 

PropNIBooSbXIKO 


Proposition 17.93 ([1]). 
Soit f: IR — R une fonction convexe et a € R. Il existe une constante c4 € R telle que pour tout 


x nous ayons 
f(æ) — f(a) > calx — a). De UE) 


Autrement dit, le graphe de la fonction f est toujours au dessus de la droite d’équation 
y = f(a) + «(x — a). (17.360) 


Démonstration. Les dérivées à gauche et à droite de f données par le lemme 17.84 sont les candidats 
tout désignés pour être coefficient directeur de la droite que l’on cherche. Nous allons prouver qu’en 
posant 
cn) (17.361) 
t>a 
la droite y = f(a) + c(x — a) répond à la question *. 
Nous devons prouver que le nombre A4 = f(x) — (f(a) + ca(x — a)) est positif pour tout x. 


(1) Six >a 


Nous divisons par x — a et nous devons prouver que —— est positif : 
A _ 
e., _ FO). (17.362a) 
T— a z—a 
= Ta(x) — inf ra(t) (17.362b) 
t>a 
> 0 (17.362c) 
parce que t — 7,(t) est croissante et que x > a. 
(2) Six <a 
Nous divisons par x — a et nous devons prouver que _— est négatif : 
A = 
0. (17.363a) 
x—a@ x—a 
= Ta(x) — inf ra(t) (17.363b) 
t>a 
£< 0 (17.363c) 
parce que t — 7,(t) est croissante et que x < a. 
PropPEJCgCH 


Proposition 17.94 ([1]). 
Si g est une fonction convexe, il existe deux suites réelles (an) et (bn) telles que 


g(x) = sup(ant + bn). (17.364) 

neN 
42. En prenant l’autre, c!, = sup,_, Ta(t), ça fonctionne aussi. En pensant à une fonction affine par morceaux, on 
remarque qu’en choisissant un nombre entre les deux, nous avons plus facilement une inégalité stricte dans (17.359). 
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Démonstration. Pour u € R nous considérons a(u) et b(u) tels que la droite y(x) = a(u)x + b(u) 
vérifie y(u) = g(u) et y(x) < g(x) pour tout x. Cela est possible par la proposition 17.93. Il s’agit 
d’une droite coupant le graphe de g en x = u et restant en dessous. Nous considérons alors (uh) 
une suite quelconque dense dans R (disons les rationnels pour fixer les idées) et nous posons 


on = QU) (17.365a) 
bn = b(un). (17.365b) 


Si ge À alors ax + bn < g(x) pour tout n et g(q) est le supremum qui est atteint pour le n tel 
que Un = q. Si maintenant x n’est pas dans Q il faut travailler plus. 

Nous prenons (A), une sous-suite de (qn) convergeant vers æ et N suffisamment grand pour 
que pour tout n > N on ait [4, —x| < e et |[g(Qn) — g(x)| < €; cela est possible grâce à la continuité 


de g (lemme 17.84). Ensuite les sous-suites (à,) et (b,) sont celles qui correspondent : 
Nous considérons la majoration 


länt + bn — g(x)| < |änt + bn — (ändn + bn)l + lânn + On — 9(Qn)| + 19(4n) — g(x)|  (17.367a) 
a a nt 
=0 <E€ 
< [än||T — Anl + € (17.367b) 
= E(|än| + 1). (17.367c) 
Il nous reste à montrer que |à,| est borné par un nombre ne dépendant pas de n (pour les n > N). 


Comme la droite de coefficient directeur &, et passant par le point (a g(Gn)) reste en dessous 
du graphe de g, nous avons pour tout n et tout ye R l'inégalité 


g(y) > än(y — dn) + 9(Qn) € An B(y — r,e) + B(g(x),e). (17.368) 


Si än n’est pas borné vers le haut, nous prenons y tel que B(y — x,e) soit minoré par un nombre 
k strictement positif et nous obtenons 


g(y) > kän +1 (17.369) 


avec k et l indépendants de n. Cela donne g(y) = «. Si au contraire &, n’est pas borné vers le bas, 
nous prenons y tel que B(y — x,e) est majoré par un nombre k strictement négatif. Nous obtenons 
encore g(y) = 00. 

Nous concluons que |à,| est bornée. 


LemXOUoosigHs 
Lemme 17.95 ([103]). 
L'application 
D: S*'(n,R) —-R 


Asa (17.370) 


est log-convave, c’est-à-dire que l’application In o@ est concave . De façon équivalente, si A, B € 
ST+ et si à + B = 1, alors 


det(aA + BB) > det(A)® det(B)£. EaSPRORtF 2 


Ici S*+ est l’ensemble des matrices symétriques strictement définies positives, définition 9.224. 


Démonstration. En plusieurs étapes. 


43. La définition 15.81 du logarithme ne fonctionne que pour les réels strictement positifs. C’est le cas du déter- 
minant d’une matrice réelle symétrique strictement définie positive. 
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(1) Pseudo-réduction Le théorème de pseudo-réduction simultanée, corolaire 11.37, appliqué 
aux matrices À et B nous donne une matrice inversible Q telle que 


B = QtDQ (17.372) 
A = Q'Q (17.372b) 
avec 
A 
D= Me ; (17.373) 
An 

À > 0. Nous avons alors 
det(A)® det(B}° = det(Q)? det(Q}?" det(D)}° = det(Q}? det(D}” (17.374) 

(parce que a + B = 1) et 
det(oA + BB) = det(aQ'Q + BQ'DQ) (17.375a) 
= det (Q'(al + BD)Q) (17.375b) 
= det(Q)}? det(al + BD). (17.375c) 


(2) Ré-expression L'’inégalité (17.371) qu'il nous faut prouver se réduit donc à 


det(al + BD) > det(D}”. (17.376) 
Vue la forme de D nous avons 
det(al + 8D) = [ [(a+ 8x) (17.377) 
i=1 
et ñ 
det(D} = ([[a)°. (17.378) 
i=1 
Il faut donc prouver que 
Le + 6) > (TI. ExFLonfrgi 
i=1 i=1 


Cette dernière égalité de produit sera prouvée en passant au logarithme. 
(3) Logarithme Puisque le logarithme est concave par l'exemple 17.89, nous avons pour chaque 
i que 
In(a + BÀ) > aln(1) + Bln(x) = Bln(x). (17.380) 
En sommant cela sur à et en utilisant les propriétés de croissance et de multiplicativité du 
logarithme nous obtenons successivement 


S In( n(a + B;) A2R0 i) (17.381a) 

i=1 
Im ([ [ta + 8x) > In (( [Ia L (17.381b) 
IT a + BX) > (Ta x)”, (17.381c) 


ce qui est bien (17.379). 


Rappel de notations : RŸ = [0,1[. Voir la remarque 1.412. 


17.11. FONCTIONS CONVEXES 1501 


LEMooNUDOooV£VPkvw 
Lemme 17.96 ([1]). 
Soit une fonction strictement convexe g: R* — R*. Soit une fonction f: R*xR* — R* vérifiant 


(1) (0,0) = 0, 

(2) f(tx,ty) = tf(x,y) pour tout t (tant que ça ne déborde pas du domaine) 
(3) FL: y) = g(y) pour tout y 

(4) F(0,y) = f(y,0). 


Alors f est convexe. 


Démonstration. Nous devons prouver que pour toute paire de points À, B sur le graphe de f, le 
segment |A, B] est au-dessus du graphe de f. Ledit graphe étant d’ailleurs constitué de droites 
joignant (0,0,0) et les points du graphe de g (situé en x = 1). 

Nous notons C le graphe de f. 


(1) Une corde alignée à O Soient deux point À et B alignés à l’origine O. Un point quel- 
conque de |A, B] (et même de toute la droite) s’écrit 


(Az, tAys tf (Az; Ay)) = (tAz tAys f (tAz;tAy)), (17.382) 


et donc est sur le graphe de f. 

(2) Autre corde Nous prouvons que |A, B] nC = {A,B}. 
Si Aet B sont dans le plan x = 1 alors c’est d'accord parce que le graphe de f dans le plan 
est le même que celui de la fonction strictement convexe g. 
Si Aet B ne sont pas alignés à © et si ils ne sont pas dans le plan x = 1 alors le plan AOB 
coupe le plan x = 1 en une droite. 
Nous supposons l'existence d’un point C'e JA, B[nC. 
Nous considérons la droite (OA) qui est contenue dans ce plan et dans € (au moins la partie 
positive) et nous notons À’ son intersection avec le plan x = 1. Même chose pour B et C qui 
donnent B’ et C”. 
Cela nous donne des points 4’, B' et C” qui sont alignés dans le graphe de f en x = 1. Or 
le graphe de f en x = 1 est le graphe de la fonction g qui est strictement convexe et qui ne 
contient donc pas de points alignés. 
Nous en concluons que si À, B € C alors |A, BI est soit complètement strictement au-dessus 
de € soit complètement strictement en-dessous de C. 


Nous prouvons à présent que toutes les cordes sont au-dessus de C. Pour cela, soient À,B € 
10,01 x 10, [, deux points non alignés à O = (0,0). Nous considérons les points 4”, B’ qui sont les 
intersections entre les droites (AO) et (BO) et la droite x = 1 ainsi que le chemin © qui parcourt 
le segment |A, 4] et le chemin + qui parcourt le segment [B, B'] : 


(17.383) 


Pour tout u, la seule droite passant par © et par o(u) passe également par À, et pas par B. En 
conséquence de quoi, pour tout uy,u2 € [0,1], la droite (o(u1)y(u2)) ne passe pas par (0,0). 

Nous considérons à présent non seulement la corde joignant (A, f(A)) à (B, f(B)) et la corde 
joignant (A! , J(A’ )) à (B' CE )) mais également toutes les cordes intermédiaires (si vous aimez 
les grands mots, vous pouvez parler d’homotopie) : 


c(u,t) = t(o(u), f(o{u)) à =) (ru), fu) (17.384) 


Pour chaque u € [0,1], cela représente une corde entre deux points non alignés à (0,0,0) et donc 
une corde qui est soit strictement au-dessus de C soit strictement en-dessous (à par les points 
correspondant à t = 0 et { = 1 qui, eux, sont sur C). 
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Soit to € [0,1[. La courbe c(u,to) avec u € [0,1] ne touche jamais C. Or le point c(1,t0) est 
au-dessus de C, donc le point c(0, to) est également au-dessus de C. 

Nous en concluons que toutes les cordes entre (A, f(A)) et (B, f(B)) est située au-dessus de C 
et non en-dessous de C. 


17.11.55 Convexité et hessienne 
DEFooKCFPooLwKAsS 


Définition 17.97. 
Soit une partie convexe U de R" et une fonction f: U — KR. 


(1) La fonction f est convexe si pour tout x, y EU avec x Æ y et pour tout 0 € ]0,1[ nous avons 
f(x + (1 —8)y) < 0f(x) + (1 —0)f(y). (17.385) 


(2) Elle est strictement convexe si nous avons l'inégalité stricte. 
PROPooYNNHooSHLvHp 


Proposition 17.98 ([194)). 
Soit ( ouvert dans IR” et U convexe dans (, et une fonction différentiable F'HEMRvIvoorayups 


(1) La fonction f est convexe sur U si et seulement si pour tout x,y EU, 


J(y) > f(x) + dfx(y — x). (17.386) 

ITEMooCWEWooFtNnK1 

(2) La fonction f est strictement convexe sur U si et seulement si pour tout x, y € U avec x £ y, 
JQ) > f(x) + dfa(y — x). (17.387) 


Démonstration. Nous avons quatre petites choses à démontrer. 


(1) (1) sens direct Soit une fonction convexe f. Nous avons : 


f((Q — 6)x + dy) < (1 — 8) f(x) + 0f(y), (17.388) 
donc 
f(e+0(y— x)) — f(x) < 4(F(y) — f(x) (17.389) 
Puisque 9 > 0 nous pouvons diviser par 0 sans changer le sens de l’inégalité : 
f(x + 0(y = zx)) — f(x) + EQOoAXXF OL 


Nous prenons la limite 0 — 0*. Cette limite est égale à a limite simple 4 — 0 et vaut (parce 
que f est différentiable) : 


=. aw)SJU)=rC@) (17.391) 


et aussi 
dfa(y — x) < f(y) — f(x) (17.392) 
par le lemme 12.268. 


(2) (1) sens inverse Pour tout a £ b dans U nous avons 
f@) > f(a) + dfa(b— a). ont 


Pour x £ y dans U et pour 8 € ]0,1[ nous écrivons (17.393) pour les couples (0x +(1—0)y, y) 
et (8x + (1— 8)y,x). Ça donne : 


fu) > (6x + (1 — 8)y) + dfox+(1-0y (0 (y — x), (17.394) 


et 

fa) > S (62 + (1— 099) + dfax-ov(@ — De — y). (17.305) 
La différentielle est linéaire ; en multipliant la première par (1 — 4) et la seconde par 0 et en 
la somme, les termes en df se simplifient et nous trouvons 


Of(x) + (1-—08)f(y) > f(0x + (1 — 8)y). (17.396) 
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(3) (2) sens direct Nous avons encore l'équation (17.390), avec une inégalité stricte. Par 
contre, ça ne va pas être suffisant parce que le passage à la limite ne conserve pas les inégalités 
strictes. Nous devons donc être plus malins. 


Soient 0 < 9 < w < 1. Nous avons (1 — 0)x + 0y € [x, (1 — w)x + wy|, donc nous pouvons 
écrire (1 — 8)x + dy sous la forme (1 — s)x + s((1 — w)x +wy). Il se fait que c’est bon pour 
s = 0/w (et aussi que nous avons 0/w < 1). Donc nous avons 


J((L — 8)x + 0y) = r(a De + 2 (a w)x + wy)) (17.397a) 
< (1— Dirt) + D H(Q — W)x + wy). (17.397b) 


Cela nous permet d'écrire 


f(( — 6)x + 0y) — f(x) ; f(( — W)t + wy) 
0 w 


< f(y) — f(x). (17.398) 


Le seconde inégalité est le pendant de (17.390). Maintenant en passant à la limite pour 0 
nous conservons une inégalité stricte par rapport à f(y) — f(x) : 


dfa(y —) < f(y) — f(x). (17.399) 


Avant de lire la proposition suivante, il faut relire la proposition 12.359 et ce qui s’y rapporte. 
Lire aussi la remarque 17.88 qui indique qu’il n’y a pas de réciproque dans l’énoncé (2). 
REMooYCRKooEQNIKkC 
Remarque 17.99. 
Notons que la condition (17.400) n’est pas équivalente à demander (df),;(h,h) > O0 pour tout h. 
En effet nous ne demandons la positivité que dans les directions atteignables comme différence de 
deux éléments de U. La partie U n’est pas spécialement ouverte ; elle pourrait n’être qu’une droite 
dans R°. Dans ce cas, demander que f (qui est C? sur l’ouvert () soit convexe sur U ne demande 
que la positivité de (d? f), appliqué à des vecteurs situés sur la droite U. 
PROPooBMIRooFkKQSAb 
Proposition 17.100 ([194]). 


Soit une fonction f : Q — R deux fois différentiable sur l’ouvert ( de R” et UrERUSGEN Tor Son 


(1) La fonction f est convexe sur U si et seulement si 


(P ha(y — 2,y — x) > 0 oo Con aU0) 


pour tout x,y EU. ITEMooHAGQooYZyhQk 


(2) Si pour tout x Æ y dans U nous avons 
(PU ,n2) >0 (17.401) 
alors la fonction f est strictement convexe sur U. 


Démonstration. 1 y a trois parties à démontrer. 


(1) (1) sens direct 
Soit une fonction convexe f sur U. Soient aussi x&,y € U et h = y — x. Nous utilisons ma 
version préférée de Taylor “* : celle de la proposition 12.462 : 


f(æ+th) = f(x) + tdfs(h) + at, fe)(, À) + 2]R[2a(th) (17.402) 


44. Si vous présentez ceci au jury d’un concours, vous devriez être capable de raconter ce que signifie df, et 
pourquoi nous l’utilisons comme une 2-forme. 
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avec lim,s_,0 a(s) = 0. Le fait que f soit convexe donne 
O< f(x +th) — f(x) — tdf;(h), (17.403) 


et donc 


2 
0< SE Pa GR, h) + PIA[2a(th). (17.404) 
En multipliant par 2 et en divisant par t?, 
0 < (&f);(h,h) + 2|h|?a(th). (17.405) 


En prenant t — 0 nous avons bien (d? f)4(y — x,y — x) > 0. 


(2) (1) sens inverse 


Soient x, y € U. Nous écrivons Taylor en version de la proposition 12.463 : 


(y) = fa) + dfely = 2) + HS D(y- 2,y — 2) (17.406) 


pour un certain z € [x,y|[. En vertu de ce qui a été dit dans la remarque 17.99 nous ne 
pouvons pas évoquer l'hypothèse (17.400) pour conclure que (d f),(y—x,y—x)>0.Ilya 
deux manières de nous sortir du problème : 


— Trouver s € U tel que y —x = 5 — 2. 
— Trovuer un z E U tel que z — x soit un multiple de y — x. 


La première approche ne fonctionne pas parce que s = y—x+2 n’est pas garanti d’être dans 
U ; par exemple avec x = 1, z = 2, y = 3 et U = [0,3]. Dans ce cas s = 44 U. 


Pour suivre la seconde approche, nous posons z = 0x + (1 — 4)y, donc z2—x = (1—0)(y—x). 
Dans ce cas la bilinéarité de (d? f), donne “ 


LG = SG) + deu) + PE mz 2) (17407) 
À 
Z0 


Nous en déduisons que f est convexe par la proposition 17.98(1). 


(3) C2) 


Le raisonnement que nous venons de faire pour le sens inverse de (1) tient encore, et nous 


JC) = f(x) + dfx(y — x) + ; ü x (Pf);(z—x,2z- x) (17.408) 
>0 


d’où nous déduisons la stricte convexité de f par la proposition 17.98(2). 


CORooMBQMooWBATIH 
Corolaire 17.101. 


Soit un ouvert ( de R” et une fonction deux fois différentiable f sur Q. ITEMooUAFTooXfCvil 


(1) La fonction f est convexe si et seulement si pour tout x, la matrice hessienne d° f; est semi- 


définie positive. ITEMooDGISooP1RLOd 


(2) Si pour tout x de (, la matrice hessienne d°f, est strictement définie positive, alors f est 
strictement convexe. 


45. Si vous avez bien suivi, la bilinéarité est contenue dans la proposition 12.359. 
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Démonstration. Nous pouvons voir ce résultat comme une conséquence directe de la proposi- 
tion 17.100 en posant U = (. Nous allons cependant en donner une démonstration directe. 
Soit a € ( et posons la fonction 


g 0 —R 
tt f(x) — f(a) — (df)a(x — a). 


Nous allons calculer des différentielles de f, et une chose importante à comprendre est que la 

différentielle de la fonction x + df,(x — a) ne fait pas intervenir la différentielle seconde de f ; c’est 

la différentielle de a — df,(x) qui demanderait la différentielle seconde de f. Ici le point a étant 

donné, df, est une application linéaire sans histoires. En particulier, df,(x — a) = dfa(x) — dfa(a). 
La fonction g vérifie : 


(1) g(a) = 0, 
(2) dgx = dfx — dfa, parce que la différentielle de x + df,(x) est x + df,(x) en vertu du 
lemme 11.238. 


(3) dga = 0. Le point a est un point critique de g. 


(17.409) 


(4) gx = dd f, parce que la différentielle de x + df, est nulle. 
Ceci étant dit, nous pouvons commencer avec la preuve. 


(1) (1) sens direct 


Nous supposons que f est convexe. Alors g(x) > 0 pour tout x par la caractérisation 17.98(1). 
Cela signifie que x = 0 est un minimum global de g. Par conséquent la proposition 17.73(3) 
nous dit que la Hessienne d° f, est semi-définie positive. 


(2) (1) sens inverse 


Nous sommes dans le cas de la proposition 17.73(1). Le point x = a est un minimum local de 
9, ce qui signifie que g(x) > 0 pour tout x de (. Encore une fois la caractérisation 17.98(1) 
nous permet de conclure. 


(3) (2) 
La fonction g vérifie les conditions de 17.73(2), donc x = 0 est un minimum local strict de g. 
La caractérisation 17.98(2) nous fait conclure que f est strictement convexe. 


17.102. 
Nous rappelons que, avec p > 1, la fonction 
: (0,00! — R 
FT (17.410) 
ze x? 
est strictement croissante. La proposition 12.413 est formelle sur ce point. 
Lemme 17.108. 
Soient un réel a, et p > 1. L’équation 
EP = ax (17.411) 


possède au plus deux solutions réelles. 


Démonstration. En deux parties suivant le signe de a. 
(1) Sia=0 Alors l'équation est |[x[? = 0, et l’unique solution est x = 0 
(2) Sia>0 Six < 0 alors ax <0 et |[x[P — ax > |x[? > 0. Cela prouve que notre équation n’a 
pas de solutions x < 0 lorsque a > 0. 
Cherchons donc des solutions avec x > 0. D'abord |x| = x et ensuite, en posant p = 1 +0 
(ô > 0), nous avons la factorisation 


P_ ax = x(x° — a) = 0. (17.412) 


T 
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Poser x = 0 est clairement une solution. Si x Æ 0, nous avons le raisonnement suivant. Les 
réels formant un corps, c'est un anneau intègre qui vérifie alors la règle du produit nul“. 
Cela pour dire que si x £ 0, alors 

a = a. (17.413) 


La proposition 12.420 nous dit que cela a une unique solution dans les réels positifs. 


(3) Sia<0 Ce cas se traite de façons similaire “?. 


PROPooLIGIooPrHY1b 
Proposition 17.104. 
Soit 1 < p < 0. La fonction 
J:R'"—-R 


z ||? 


(17.414) 


est strictement convete. 


Démonstration. La preuve va se diviser en deux parties. D’abord nous allons utiliser la matrice 
Hessienne pour démontrer le résultat sur l’ouvert R”\{0}, et ensuite nous allons un peu bricoler 


pour ajouter 0 au domaine de stricte convexité *. 


(1) La Hessienne Nous notons 


fs) = ler = (D 2}, (17.415) 


et nous dérivons : 


(a) = g2n (Dai) 0 = prify-a(e) FtooN zone) 


Cela n’est déjà pas bien défini en x = 0 lorsque p < 2, mais qu'importe? Nous dérivons 
encore en utilisant entre autres la formule (17.416) elle-même avec p — p — 2: 


is 


(a) = pôle? + pp — 2e. (17.17) 
ji 


Nous avons donc la matrice Hessienne 
H;;(x) = pie (PT? + p(p — 2)xix;|æ|P (17.418) 


Pour prouver que cette matrice est strictement définie positive, nous avons le choix entre la 


proposition 9.227(1) ou le lemme 9.228(1). Nous utilisons le second. Nous avons “° : 
y: H(x)y = Due H (x) (17.419a) 
kl 
= poule +p(p 2) axe (17.419b) 
1 kl 
= plu ele + pp — 2)? (x + y)? (17.419c) 
= plc (lyllel? + — 2)(x + y)°) — oo 
Eu 00 [e] 
> le (Il el? — ( + #)°) AR euE PH Vo) 
00 ©, ü 
> 0. LT ATP) 


Justifications : 


— Pour 17.419e. Puisque p > 1 nous avons p — 2 > —1. Là, l’inégalité est stricte et c’est 
important. 


46. Voir le lemme 1.194 et la définition 1.193. 

47. Vérifiez par vous-même et écrivez-moi si il y a un problème (personnellement, je n'ai pas vérifié.). 
48. Si quelqu'un sait comment éviter ce bricolage en deux parties, je suis preneur. 

49. Si vous ne savez pas où placer les indices, voyez la proposition 9.180. 
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— Pour 17.419f. C’est l’inégalité de Cauchy-Schwarz du théorème 11.1. 


Voilà. La matrice Hessienne est strictement définie positive par le lemme 9.228(1) sur R’\{0}. 
Le corolaire 17.101(1) nous indique que pour tout x,y € R”\{0} et pour tout 0 € ]0,1|, 


f(6x + (1 6)y) < 6f(x)+ (1-0) EF) 


pourvu que 0x + (1 — 8)y # 0 pour tout 6. 
(2) La suite 


Nous devons prouver que l’inéquation (17.420) tient également lorsque 0x + (1 — 0)y = 0 
pour une certaine valeur 0 = 66 € ]0,1[. 


(3) Les cordes passant par zéro 


Pour ce faire, nous allons montrer que le segment de droite joignant (a, f,(a)) à (b, f,(b)) 
est toujours au-dessus de la courbe Ce, Fe le) )e Nous commençons par b = 0. Vu que p > 1 et 
que 0 € ]0,1[ nous avons 


18a|? = 18F al? < 8jal? = 8/(a). (17.421) 


(4) Les cordes passant au-dessus de zéro 


Dans le cas b Æ 0 nous considérons 


l1: [a,b] — R 


ee (17.422) 


tel que (x,l1(x)) soit (le segment) la droite joignant (a, af?) à (b, |b|?). 

Nous considérons aussi, pour æ € [0, a] la fonction l: telle que (x, l2(x)) soit la droite joignant 
(0,0) à (a, |al?). Nous avons déjà vu que pour x € ]0, a[ nous avons l(x) > |x|?. 

Nous avons {1(a) = l2(a) = |al?. Donc l2(x) — l1(x) ne change pas de signe sur [0,a]. Mais 
comme {1(0) > 0 = {2(0) nous avons 


pour tout x € [0,a|. 

Au final, (x) > h(x) > f(x). 

Pour la partie [b,0] nous faisons de même en considérant l3 de telle sorte que (æ, l3(x)) soit 
le segment joignant (0,0) à (b, |b|?). 


17.11.6 Quelques inégalités 
17.11.6.1 Inégalité de Jensen 

PropXIBooLxTkhU 
Proposition 17.105 (Inégalité de Jensen). 
Soit f: IR — R une fonction convexe et des réels x1,..., æ,. Soient des nombres positifs À1,..., An 
formant une combinaison convexe °°. Alors 


F(D Mr) < Dix S(xi). (17.424) 


Démonstration. Nous procédons par récurrence sur n, en sachant que n = 2 est la définition de la 
convexité de f. Vu que 


n n—1 
DER = Antn + (1— An) Ÿ AR. (17.495) 
k=1 k=1 L— An 


50. Définition 8.31. 
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nous avons 


n n—1 
À&TE 
FD exe) < An fn) + (1— An)f( D = x) (17.426) 
k=1 k=1 
La chose à remarquer est que les nombres ; Me avec k allant de 1 à n — 1 forment eux-mêmes 
une combinaison convexe. L'hypothèse de récurrence peut donc s'appliquer au second terme du 


membre de droite : 


À& 
1— Àn 


n n—1 n—1l 
FD ur) < Anf(æn) + (1— An) }, f{@x) = Anf(an) + D Anf(x). (17.427) 
k=1 k=1 k=1 


17.11.6.2 Inégalité arithmético-géométrique 


La proposition suivante dit que la moyenne arithmétique de nombres strictement positifs est 
supérieure ou égale à la moyenne géométrique. 


PropWDPooBtHIAR 
Proposition 17.106 (Inégalité arithmético-géométrique[500]). 
Soient x1,..., Zn des nombres strictement positifs. Nous posons 
1 
Ma = A (1 +: +ZXn) (17.428) 
et 
Mg = ŸYE1...Tn (17.429) 


Alors My < Ma Et My = Ma si et seulement si x; = x; pour tout i,j. 


Démonstration. Par hypothèse les nombres m, et m, sont tous deux strictement positifs, de telle 
sorte qu'il est équivalent de prouver In(m,) < In(m,) ou encore 


(17.430) 


= (m() +... +In(tn)) <In (aie) | 


n 


Cela n’est rien d’autre que l'inégalité de Jensen de la proposition 17.105 appliquée à la fonction In 


et aux coefficients À; — L. 


17.11.6.3 Inégalité de Kantorovitch 
PropMNUooFbYkug 


Proposition 17.107 (Inégalité de Kantorovitch[501]). 
Soit À une matrice symétrique strictement définie positive dont les plus grandes et plus petites 
valeurs propres sont Âmin Et ÀAmar- Alors pour tout x € R" nous avons 


1 Aria Arc . 
(Az,zX A Lx, x) < 2 É ee ) If. (17.431) 


Démonstration. Sans perte de généralité nous pouvons supposer que |x| = 1. Nous diagonalisons °! 


la matrice À par la matrice orthogonale P € O(n,R) : A= PDP let A! = PDP 1 où D est 
une matrice diagonale formée des valeurs propres de À. 


Nous posons & = Y/AminAmazx et nous regardons la matrice 
LA + aA7t (17.432) 
dont les valeurs propres sont : 
j. «à 
à Lee (17.433) 


51. Théorème spectral 9.221. 
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parce que les vecteurs propres de À et de A1 sont les mêmes (ce sont les valeurs de la diagonale 
de D). Nous allons quelque peu étudier la fonction 


O(x) = : Fe (17.434) 


Elle est convexe en tant que somme de deux fonctions convexes. Elle a son minimum en x = a et 
ce minimum vaut /(a) = 2. De plus 


O(Amaz) = O(min) = \ _ + Te (17.435) 


max Àmin 


Une fonction convexe passant deux fois par la même valeur doit forcément être plus petite que 
cette valeur entre les deux *? : pour tout x € [Anin, Amaxl: 


Arnin max 
x) < e +2 (17.436) 


Nous sommes maintenant en mesure de nous lancer dans l’inégalité de Kantorovitch. 


(Ar, zX A 1x, 2) < = (2 D + KA tr 2) Se va) 


2 
| (e Done (17.437b) 
- | É +aA )r||æl subEqU Too CHESMEt à 
< IÉ + a Al | subEquKT oo S ET 


Justifications : 


—  17.437a par l'inégalité arithmético-géométrique, proposition 17.106. Nous avons aussi inséré 
ai dans le produit sous la racine. 


—  17.437c par l’inégalité de Cauchy-Schwarz, théorème 11.1. 
—  17.437d par la définition de la norme opérateur de la proposition 11.51 


La norme opérateur est la plus grande des valeurs propres. Mais les valeurs propres de A/a+aATt 
sont de la forme 4(;), et tous les À; sont entre Ain €t Amar: Donc la plus grande valeur propre 
de A/a + «At est 0(x) pour un certain x € [Amin, Amar]. Par conséquent 


1 A min mar 
1/(Ax, zX A 1x, x) < le + a A1] < \ + (17.438) 


max Ana 


17.11.7 Norme /? 


Si vous êtes seulement intéressés par le cas p = 1,2 ou le cas p = ©, allez voir la proposition 


11.41. 
PROPooUDFTooQyhAtq 


Proposition 17.108. 


Pour tout réel p > 1, la formule 
nm 


I ze = (> air) : Fe r48 


i=1 


/ D ES 
définit une norme ** sur R". 


52. Je ne suis pas certain que cette phrase soit claire, non ? 
53. Définition 7.149. 
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Démonstration. Le seul point un peu délicat parmi les propriétés à vérifier de la définition 7.149 
est l’inégalité triangulaire. Grâce au lemme 7.151, nous allons seulement montrer que la partie 
B = {x e R” tel que |x}, < 1} est convexe. 

Soient x,y € B ainsi que À € [0,1]. La fonction 


a: [0,00[ — [0,1 


hrs (17.440) 
est convexe par le lemme 17.90. Nous avons donc le calcul suivant : 
nm 
Lx + (1— )ylf = D Ai + (1 — Mu (17.441a) 


i=1 


< Y (Ari + (1 Xyl)” FPMO PE TEE 


SD MP+(-appge REPAS 


<YAaP+T Ge PE GAS 


= À|x|5 + (1 — à)lyle (17.441e) 
a ( . x) FO PP | 
= 1. (17.441) 


Justifications. 
— Pour (17.441b). L’inégalité [a + b| & [a] + |b|. 
— Pour (17.441c). La fonction a est convexe. 
— Pour (17.441d). Nous avons À € [0,1] et p > 1 et donc XP < À par 12.414. 
— Pour (17.441). Parce que x € B implique |x|, < 1 qui implique |x|? < 1. 


17.11.8 Hôlder 
Notre étude de la fonction puissance permet de démontrer quelques inégalités de Hôlder. Voir 


le thème 25. 
THOooPPDPooJxTYIy 


Théorème 17.109 ([502]). 


Si 1 < p < ©, alors pour tout x € R° nous avons °* 


lo < |rp < n° /alo. (17.442) 


Démonstration. Vu que la fonction {+ |[t[P est croissante pour les { positifs *”, pour chaque À nous 


avons 
1/p 
il < (Eiar) = |x||p- (17.443) 
k 


Cela montre que 
Ils = max{iril} < |x|,. (17.444) 


D'autre part, pour chaque à nous avons |x;| < |x|+x, donc 


1 
lle < (nl)? = n1/P]æloo. (17.445) 


54. Définition de la norme |.|, sur R”, proposition 17.108. 
55. Parce que p > 1 et la proposition 12.413. 
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Le corolaire suivant donne une façon de majorer une norme {? par une norme {7 moyennant 
un facteur. Notons cependant que l'inégalité de Hôlder de la proposition 17.114 est plus précise. 


Ce corolaire est suffisant pour prouver l’équivalence des normes #. 
CORooËZGHooACHOiB 


Corolaire 17.110. 
Soient p > 1 et g < ©. Pour tout x € R" nous avons 


leo < na. (17.446) 


Démonstration. Il suffit d'utiliser les deux inégalités du théorème 17.109. D'abord la seconde avec 
p, et ensuite la première avec q. 


Si vous cherchez l'inégalité de Hôlder dans L?, c’est la proposition 27.33. Les normes € sont 
définies dans 17.108. 


LEMooLGGDooGLGFHj 
Lemme 17.111 ([503]). 
Soient x,y > 0 ainsi que à, 5 > 0 tels que à + B = 1. Alors 
zy < axe + Byl/B. (17.447) 
Nous avons 
ay = ax! + Byl/8 (17.448) 


si et seulement si x = yl/8, 


Démonstration. Nous utilisons le logarithme °° et ses propriétés (surtout la proposition 15.84). 
D'abord 
(ay) L Çn(e)+n(y) 2 QE +8 ME 


Ty=Ee (17.449) 


Comme l’exponentielle est strictement convexe (exemple 17.89(3)) et vu que a+ 8 = 1, nous avons 


n(x) n(u) i 
Ty = a BR < aente)/a + BehGV8 2 oœte + pus. FRooAa toner 


Cela prouve déjà l’inégalité demandée. 
Nous passons au cas d'égalité. Puisque a et B ne sont pas nuls, l’inégalité (17.450) est une 
égalité si et seulement si ?’ 


— ; 17.451 
nr. (7451) 
Cela signifie In(x1/) = In(yl/5), qui implique x1/* = yl/8 parce que le logarithme est une bijection. 
CORooTCBZooAcZxaC 
Corolaire 17.112. 
Si p,q > 0 vérifient : - : = 1 et si p > 1 alors nous avons 
1 1 E WKTS 
zy < 2? + y Li ePFASES 
P q 


pour tout x,y > 0, avec une égalité si et seulement si x? = y1. 


Démonstration. Il suffit de poser a = 1/p et 5 = 1/q et appliquer le lemme 17.111. 


THOooYHMJooB1Xfpl 
Théorème 17.113 (Inégalité de Hôlder[503]). 
Soient p,q > 0 tels que : + è = 1. Pour tout x,y € R" nous avons ® 
nm 
eu = D il < Ixlolgla (17.453) 
i=1 


56. Définition 15.81 
57. Par le lemme 17.82. 
58. Définition de la norme |.|,, proposition 17.108. 
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Il y a égalité si et seulement si xiy; est de signe constant ”° et les vecteurs Y; |xifPe; et Y;, [yil2e; 
sont proportionnels. 


Démonstration. En plusieurs parties. 


(1) Le cas des vecteurs nuls Si x ou y est nul, les inégalités sont évidentes. Donc nous sup- 
posons que non. 


(2) Première inégalité En ce qui concerne la première inégalité, 


1 1 
_ D 77 = D Itillyil < > ET + sw) (17.454) 
îi i 


i 


où nous avons utilisé le corolaire 17.112 dans chaque terme de la somme en tenant compte 
du fait que |x;| et |y;| sont positifs. 


RS 
Co 
nr 


Seconde inégalité Pour la seconde inégalité, nous commençons avec |x|, = [ya = 1. 
Utilisant encore le corolaire 17.112 pour chaque terme, nous avons 


1 1 1 1 
Dirt < = Der + D ul = = += = 1 = frlolyle. (17.455) 
: pÆ q£ pq 
1 1 


Si maintenant x et y sont arbitraires non nuls dans R”, nous posons 2! = x/|x|, et y — 


y/yla ; nous savons déjà que 
> \x/y!| < < FQOORRECOR pop 


En remplaçant x! par xi/|x|, et y! par w/|yla, l'inégalité (17.456) devient 


Z Eelstuls Elu (17.457) 
felolote 
ce qui signifie 

D lei < lrlblyle: (17.458) 


i 


TR 
Æ 
nr 


Cas d’égalité, dans un sens Nous notons 


D = {(x,y) ER" x IR" tel que D [riyil = |tl»|vla}. (17.459) 
i 
(4a) Multiplications D'abord si (x,y) € D, alors (ux, y) € D pour tout u, À € R. En 
effet, 
on ui (Ay)il = IAA level = = la ANlolyla = url Aa: (17.460) 
(4b) Avec normes égales à 1 Soit (x,y) € D tels que |x|, = ]yl, — 1. Nous avons en 
particulier, 


1= D œil < D |æil? + D PAË EfooDFINoR OS Tren 
î i i 


grâce à l’inégalité (17.452) appliquée à chaque terme. Vu que |x], = 1, nous avons 
D xl? = 1, de telle sorte que le membre de droite de (17.461) se réduise à L + L =} 
Nous pouvons donc écrire 


1= Dieu < le + > lt = 1. (17.462) 


i à 


59. Je n'utilie pas cette hypothèse de signe constant. || doit y avoir une subtilité qui m'a échappée. Soyez prudente en 
lisant et écrivez-moi si vous trouvez une erreur. 
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(4c) 


L’inégalité est donc une égalité : 


l 1 
> lriyil = ” Cr + cl) (17.463) 


À à 


Mais chaque terme à gauche est en inégalité avec le terme correspondant à droite : 
1 1 EQooAGFKo YrW 
pigil < el? + Elu CFA) 


Pour que le tout soit une égalité, il faut que chaque inégalité (17.464) soit une égalité. 
Pour chaque i, nous avons 


1 1 
cigil = =IxifP + uit. (17.465) 
p q 


La condition d'égalité du corolaire 17.112 nous dit alors que |x;/? = [y;|. 


Avec normes arbitraires Soit donc (x,y) € D. Nous savons qu’en posant 2’ = x/|x|, 
et y = y/|yl, nous avons (x’,y/) € D et donc 


Ga) | () - (17.466) 


pl, je 17.467 
til = LEE (17.467) 


ce qui est bien ce que nous voulions : le vecteur ÿ,;|x;[Pe; est proportionnel au vecteur 


D [gilles 


Cela donne tout de suite 


(5) Cas d’égalité dans l’autre sens[1] Nous supposons que les vecteurs »; [xilPe; et ÿ,; |yille: 


sont proportionnels. Nous nommons c? le facteur de proportionnalité, c’est-à-dire que nous 
posons 


Rif = dlyilt. (17.468) 
Dans ce cas, pour chaque, delté agmhres cul £t Ix;| sont dans le cas d’égalité du corolaire 
17.112. Nous avons alors | 
1 
> | = : D clxillysl (17.469) 
i i 
1 1 1 
_ Cr Fr (c)") (17.469b) 
Gi NV q 
1 1 1 
e Cr + a) (17.469c) 
ee \p q 
1 
. > fr. (17.469d) 
i 


Et c’est maintenant que nous subdivisons. 


(Sa) 


Si xl, = [ylg = 1 Dans ce cas, l'égalité (17.469) se réduisent à 


1 
D lriyl = - (17.470) 


= 
Mais l’hypothèse sur les normes donne 

l— > ET dE > auf _ ay RAF = (17.471) 
Donc c = 1 et nous avons bien 


1 
D læiyil = = =1=lelyle. (17.472) 
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(5b) Pour des normes arbitraires Soit (x,y) € R” x R’ tels que |x;[? = c|y;|2. Nous 
posons comme d'habitude + = x/|x|, et y = y/|y|,. En utilisant le cas « de norme 1 » 


nous avons 
1= D lag = 
À 


Donc D; lxiyi| = xl |ylg comme nous le voulions. 


> [Gvl: (17.473) 


RTE î 


La majoration de la proposition suivante sera utile pour les inégalités de Clarkson du lemme 
27.142. Pour d’autres inégalités (plus simples) autour des normes |.|,, voir le thème 25. 


PROPooQZTNooGACM1Q 
Proposition 17.114 ([503]). 
SixeR”" et si 0 < q < p, alors 
lle < 575 el. (17474) 
En particulier, si 0 < q < p, alors 
Ixlla < (ællp- (17.475) 


Démonstration. Nous posons P = p/q et Q = P/(P — 1). Les nombres P et Q sont des exposants 
conjugués, parce que 
LL _d,.n- 
pets — (17.476) 
PQ p  p 


Nous posons y = (1,...,1)€ R” ainsi que 


U = > les (17.477) 


et nous écrivons l'inégalité de Hôlder de la proposition 17.113 sur les vecteurs v et y : 


D lui < ol »lylo: (17.478) 


En déballant, 


1/P 
Diil? < ù til?) À tre (17.479a) 
ee 


g/p 
- ù mir) n/@ (17.479b) 
= ni %P|x|2. (17.479c) 


Cela donne 
Ie]£ < nas. (17.480) 


En prenant la puissance 1/q des deux côtés, 


lu < n° rele < fl (17.481) 


parce que n > 1 et p/q < 1. 
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17.12 Algorithme du gradient à pas optimal 


Une idée pour trouver un minimum à une fonction est de prendre un point p au hasard, calculer 
le gradient V f(p) et suivre la direction —V f(p) tant que ça descend. Une fois qu’on est « dans le 
creux », recalculer le gradient et continuer ainsi. 

Nous allons détailler cet algorithme dans un cas très particulier d’une matrice À symétrique et 
strictement définie positive. 


— Dans la proposition 17.116 nous montrons que résoudre le système linéaire ÀAx = —b est 
équivalent à minimiser une certaine fonction. 
— La proposition 17.117 donnera une méthode itérative pour trouver ce minimum. 
DefQXPooYSygGP 
Définition 17.115. 
Si X est un espace vectoriel normé et f: X — RU {+} nous disons que f est coercive sur le 
domaine non borné P de X si pour tout M ER, l’ensemble 


{x € P tel que f(x) < M} (17.482) 


est borné. 


En langage imagé la coercivité de f s'exprime par la limite 


L f(æ) = +00. (17.483) 
zeP 


Nous rappelons que S**(n,1R) est l’ensemble des matrices symétriques strictement définies 


positives définies en 9.225. 
PROPooYRLDooTwz£WU 


Proposition 17.116. 
Soit AE StT(n,R) etbe R". Nous considérons l'application 


J:R'—-R 
1 (17.484) 
x JA HN On), 

Alors : 

(1) Il existe un unique x € R" tel que AT = —-b. 

(2) Il existe un unique x* ER”? minimisant f. 

(3) Ils sont égaux : x = x*. 
Démonstration. Une matrice symétrique strictement définie positive est inversible, entre autres 
parce qu’elle se diagonalise par des matrices orthogonales (qui sont inversibles) et que la matrice 
diagonalisée est de déterminant non nul : tous les éléments diagonaux sont strictement positifs. 


Voir le théorème spectral symétrique 9.221. 
D'où l’unicité du x résolvant le système Ax = —b pour n'importe quel b. 


(1) f est strictement convexe 


La fonction f s'écrit 


1 
US D ARTITR + D brtr. (17.485) 


Elle est de classe C? sans problèmes, et il est vite vu que __. = À;;, c’est-à-dire que À est 
i0Tj 

la matrice hessienne de f. Cette matrice étant strictement définie positive par hypothèse, la 

fonction f est strictement convexe par le corolaire 17.101(2). 
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(2) f est coercive Montrons à présent que f est coercive. Nous avons : 


1 

(1 = [Az 2) + <b,)| (17.486a) 
1 
1 

> 5 \min | |° — |lb|lx| (17.486c) 


Pour la dernière ligne nous avons nommé Àmin la plus grande valeur propre de À et utilisé 
Cauchy-Schwarz pour le second terme. Nous avons donc bien |f(x)| — 0 lorsque |x] — co 
et la fonction f est coercive. 


Soit M une valeur atteinte par f. L'ensemble 
{x € R” tel que f(x) < M} (17.487) 


est fermé (parce que f est continue) et borné parce que f est coercive. Cela est donc compact °° 
et f atteint un minimum qui sera forcément dedans. Cela est pour l’existence d’un minimum. 

Pour l’unicité du minimum nous invoquons la convexité : si Z1 et —2 sont deux points réalisant 
le minimum de f, alors 


FE) < Er) + 54) = 1) (17.488) 


ce qui contredit la minimalité de f(x). 

Nous devons maintenant prouver que x vérifie l'équation Az = —b. Vu que x est minimum 
local de f qui est une fonction de classe C?, le théorème des minimums locaux 17.72 nous indique 
que x est solution de V f(x) = 0. Calculons un peu cela avec la formule 


dfo(u) = _ f@+t)] = (Ar u)+ÇAu, x) + (bu) — (Az, uy+(b,u) = (Ax+b,u). (17.489) 


Donc demander df;(u) = 0 pour tout u demande Ax + b = 0. 


PropS00ooGoMOxG 
Proposition 17.117 (Gradient à pas optimal). 
Soit AE S**(n,R) (A est une matrice symétrique strictement définie positive) et b € R". Nous 
considérons l'application 


f:R'R 
1 (17.490) 
Tr 5 (At; x) + €b, x). 
Soit xo € R”. Nous définissons la suite (xx) par 
Thi1 = Tk + trdk (17.491) 
où 
— di = —(Vf)(xx) 
— tx est la valeur minimisant la fonction t -— f(xx + tdx) sur R. 
Alors pour tout k > 0 nous avons 
_ C2 (A) — 1 ë 
— | <K | ——— 17.492 
ime-sl<r (22) (17.492) 


où co(À) = nas est le rapport ente la plus grande et la plus petite valeur propre®! de la matrice 


A et x est l’unique élément de R? à minimiser f. 


60. Théorème 10.24 
61. Cela est certainement très lié au conditionnement de la matrice À, voir la proposition 34.110. 
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Démonstration. Décomposition en plusieurs points. 


(1) Existence de x Le fait que x existe et soit unique est la proposition 17.116. 
(2) Si (Vf)(xx) =0 D'abord si Vf(xz) = 0, c’est que xx11 = #4 et l'algorithme est terminé : la 


= 


— 


— 


suite est stationnaire. Pour dire que c’est gagné, nous devons prouver que xx = x. Pour cela 
nous écrivons (à partir de maintenant « x » est la k*composante de x qui est une variable, 
et non le xx de la suite) 


1 
J(æ) = 9 . ARITITR + . bRTk (17.493) 
ki k 
et nous calculons (a) en tenant compte du fait que ce = 04. Le résultat est que (2; f)(a) = 
(Az + b); et donc que 
(Vf)(a) = Aa + b. (17.494) 

Vu que À est inversible (symétrique définie positive), il existe un unique a € R” qui vérifie 
cette relation. Par la proposition 17.116, cet élément est le minimum x. 
Cela pour dire que si a € R” vérifie (V f)(a) = 0 alors a = x. Nous supposons donc à partir 
de maintenant que V f(x) Æ 0 pour tout k. 


t, est bien défini 


Pour te R nous avons 


far -+tdx) = mx)+ 5 CAde JA pe SE CAdh, d)=tlde|2+ PS0 268) 
== dy, 


qui est un polynôme du second degré en t. Le coefficient de t? est I(Ady, dx) > 0 parce que 
dx; # 0 et À est strictement définie positive. Par conséquent la fonction t + f(xx + tdx) 
admet bien un unique minimum. Nous pouvons même calculer {4 parce que l’on connaît par 
cœur le sommet d’une parabole : 


(Axe + b, dx) Id |? EqVWJopMnDSER 
= = 17.406) 
À (Ade, de)  (Ady, de) û 
parce que dy = —Vf(xz) = —(Azxyz + b). 
La valeur de dz.: 
Par définition, dy31 = —V f(xx+1) = —(Atx+1 + b). Mais 41 = xx + txdr, donc 


des1 = — Arr — tr Adg — b = dy — tx Adx (17.497) 


parce que — xx — b = dy. 
Par ailleurs, {dx+1,dx> = 0 parce que 


dx? 


d , dx) = (dy, d — Cd, Adx) = |dx|? 
Cdr+1, dr) = dr, dr) — txCdr, Adr) = |dx| (Ad, di) 


(dr, Ad) = 0 (17.498) 


où nous avons utilisé la valeur (17.496) de tx. 
Calcul de f(x%+1) 
Nous repartons de (17.495) où nous substituons la valeur (17.496) de #4 : 


1 |d|* Ide|* 
2€ Adg, dx) Ad, dx) 


Idx||° 


1 
Fate) = f(tx) + ad 


= f(xx) (17.499) 


Encore du calcul ... 


Vu que le produit (Ady,d;) arrive tout le temps, nous allons étudier (A dy, de). Le truc 
malin est d'essayer d'exprimer ça en termes de x et f = f(x). Pour cela nous calculons f(x) : 


f = f(&) = f(—-A 1) = 5 AT TbY. (17.500) 
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Ayant cela en tête nous pouvons calculer : 


CA dy, dy) = (AT (Az + b), Atx + bd (17.501a) 
= (xp, Axg) + (A TD, Axe) + b, xx) + (A D, b) (17.501b) 
—2f 
= (ep, Are) + Xp, D) — 27 subeq Trop aTes) 
= 2(f(xx) — f) (17.501d) 


où nous avons utilisé le fait que {x, Ay) = {Ax, y) parce que À est symétrique. 


Erreur sur la valeur du minimum 


Nous voulons à présent estimer la différence f(xx+1) — f. Pour cela nous mettons en facteur 


f(x) — f dans f(tp+1— f); et d’ailleurs c’est pour cela que nous avons calculé A dy, de) : 
parce que ça fait intervenir f(xx) — f. 


F 1 Id _; 


J(tk+1) — Ÿ = (ax) 2 (Ade, de) (17.502a) 
_ F 1 |de| 
= (f(x) — f) É 2 ds Un = 5 (17.502b) 


= (@9 2 (1 ee D 


(Adr, dx) A Tdr, dx) 
Nous traitons le dénominateur à l’aide de l’inégalité de Kantorovitch 17.107. Nous avons 


dx] . ue ___ 4&(4) 


_ (17.503) 
(Adk, dx (Al de, dx) (c2(A) + 1È 
(VD +) lé 
Mettre cela dans (17.502c) est un calcul d’addition de fractions : 
> mn c2(A) — 1 . 
Lf< ; | 
a) 7< (fn) - D (2) (17.504) 


Par récurrence nous avons alors 
2k | 
fem) = F< (fn) - D (EDS) eaANkogNP EG) 


Notons qu’il n’y a pas de valeurs absolues parce que f étant le minimum de f, les deux côtés 
de l’inégalité sont automatiquement positifs. 


Erreur sur la position du minimum 
Nous voulons à présent étudier la norme de x} — x. Pour cela nous l’écrivons directement 
avec la définition de f en nous souvenant que b = — Az : 
- I 1 
FC) — f = Arr, tk) — (AE, zk) + SAT, T) (17.506a) 
1 1 1 1 
: 3 (AT Tk) — JA: Tk) — 5 (AT, tk) + 3 (AË, 2} (17.506b) 
1 
=; ((A(ax — à),rn) + (AE E — m4) (17.506c) 
1 - - 
=; (AG à), (ax — 1))) (17.506d) 


où à la dernière ligne nous avons fait (AT,x — xx) = (x, A(x — x4)) en vertu de la symétrie 
de À. 

Les produits de la forme {Ay, y} sont majorés par Amin|y|? parce que Amin est la plus petite 
valeur propre de À. Dans notre cas, 


fax) — F> Smet — Ef? EqV#RopUMX LE 
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(9) Conclusion 


En combinant les inéquations (17.507) et (17.505) nous trouvons 


: : A)\—1\%# 

Amine — fl? < f(xx) — f < (f(xo) — f) É Fa +) | (17.508) 
c’est-à-dire … 

le — x] < Les (17.509) 


Notons que lorsque c2(A) est proche de 1 la méthode converge rapidement. Par contre si c2(A) 
est proche de zéro, la méthode converge lentement. 


17.13 Formes quadratiques, signature, et lemme de Morse 
NORMooHSWKooL€tUbR1l 
17.118. 
Soit (E,|.]r#) un espace vectoriel réel normé de dimension finie n. L'ensemble des formes quadra- 
tiques réelles ®? sur Æ est vu comme l’ensemble des matrices symétriques $, (R) ; il sera noté Q(E) 
et le sous-ensemble des formes quadratiques non dégénérées est S,(R) n GL(n,R) qui sera noté 
Q(E). Nous rappelons que la correspondance est donnée de la façon suivante. 
Si À € Sh(R), la forme quadratique associée est q4 donnée par le produit scalaire qa(x) = 
x Ax. 
Pour information, le lemme de Morse est le lemme 20.194. 
NORMooQZFLooYnILtn 


17.119. 
Nous noterons encore QT(E) les formes quadratiques positives sur E et QŸT(E) les formes qua- 
dratiques strictement définies positives sur E. 


Sur Q(E) nous mettons la norme 


N(q)= sup [q(x)|, (17.510) 


qui du point de vue de S,(R) est 


N(A)= sup [x'Ax|. FDer T1 


lele=1 


Notons que à droite, c’est la valeur absolue usuelle sur R. 
Nous savons par le théorème de Sylvester (théorème 9.245) que dans Min, R), toute matrice 
symétrique de signature (p,q) est semblable à la matrice 


—1, 
lp4 = fl, | (17.512) 
On-p-a 


Donc deux matrices de S, sont semblables si et seulement si elles ont la même signature (même si 
elles ne sont pas de rang maximum, cela soit dit au passage). Si nous notons SP(R) l’ensemble 
des matrices réelles symétriques de signature (p, q), alors 


S24(R) = {P'AP tel que P e GL(n,R)} (17.513) 


où À est une quelconque ce ces matrices. 


62. Définition 9.123. 


1520 CHAPITRE 17. ENCORE DE L'ANALYSE (ET C’EST PAS FINI) 


Nous voudrions en savoir plus sur ces ensembles. En particulier nous aimerions savoir si la 
signature est une notion « stable » au sens où ces ensembles seraient ouverts dans $,. Pour cela 
nous considérons l’action de GL(n, R) sur $, définie par 


a: GL(n,R) x S,(R) — ae (17.514) 
(P,A)- P'AP 
faite exprès pour que les orbites de cette action soient les ensembles S2:(R). 
La proposition suivante montre que lorsque p + q = n, c’est-à-dire lorsqu'on parle de matrices 
de rang maximum, les ensembles SP1(R) sont ouverts, c’est-à-dire que la signature d’une forme 
quadratique est une propriété « stable » par petite variations des éléments de matrice. Notons tout 
de suite que si le rang n’est pas maximum, le théorème de Sylvester dit qu’elle est semblable à une 
matrice diagonale avec des zéros sur la diagonale ; en modifiant un peu ces zéros, on peut modifier 
évidemment la signature. 
PropNPbnsMd 
Proposition 17.120 ([103]). 
Soit (E,|.|r) un espace vectoriel normé de dimension finie. Alors 


(1) les formes quadratiques non dégénérées forment un ouvert dans l’ensemble des formes qua- 


dratiques, 
(2) les ensembles SPI(R) avec p + q = n sont ouverts dans S\(R), ItenCOhRTiViii 
(3) les composantes connexes de Q(E) sont les SP(R) avec p + q = n, HrencobRTiVÉT 


(4) les SPI(R) non dégénérés sont connexes par arc. 


Démonstration. Cette preuve est donnée du point de vue des matrices. La différence entre le 
point (3) et (4) est que dans le premier nous prouvons la connexité de SP1(R) à partir de la 
connexité de GL*{(n,R), tandis que dans le second nous prouvons la connexité par arc de SP4(R) 
à partir de la connexité par are de GL*{(n,1R). Bien entendu le second implique le premier. 


(1) Il s’agit simplement de remarquer que Q(E) = S,(R), que Q(E) = S,(R) n GL(n, R) et que 
le déterminant est une fonction continue sur M(n, R). 


(2) Soit Ao € SPI(R). Le théorème de Sylvester 9.245 nous donne une matrice inversible P 
telle que P'A6P = 1,4. Nous allons montrer qu’il existe un voisinage Z{ de 1,4 contenu 
dans SP1(R). À partir de là, l’ensemble (P-1)44{P-1 sera un voisinage de A9 contenu dans 
SRT(R). 

Nous considérons les espaces vectoriels 


F = Span{e1,...,ep} (17.515a) 
G = Span{e,+1,...,€n} (17.515b) 


La norme euclidienne |.|, sur F est équivalente à la norme |.|£ par le théorème 11.46. Donc 
il existe une constante k1 > 0 telle que pour tout x € F, 


EqMViCiJ 
leo > Her 17811) 


De la même façon sur G, il existe une constante k2 > 0 telle que 
E 
ele > kelells. ÉTSTA) 


Si nous posons k£ = min{k?, k}, alors nous avons 


VreF, |xl 


2 > [à > klelà (17.518a) 
VreG, |al2 ue 


> k} 
> k|x|2. (17.518b) 
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= 


Soit une matrice À € S,(R) telle que N(A—1,,4) < k, c'est-à-dire que À est dans un voisinage 
de 1,4 pour la norme sur S,(R) donné par (17.511). Si x est non nul dans E, nous avons 


lat(A— Lu)al € Na — AT < ke. (17.519) 
En déballant la valeur absolue, cela signifie que 
—klelà < a (4 — Lhg)e < Hal? (17.520) 
Sixe F, alors la première inéquation et (17.516) donnent 
x'Ax > Ix|£ — kfx|£ > 0 (17.521) 
Si x € G, alors la seconde inéquation et (17.517) donnent 
r'Ax < k|x|$ — Ix|2 < 0. (17.522) 


Nous avons donc montré que x + x! Ax est positive sur F et négative sur G, ce qui prouve 
que À est bien de signature (p,q) et appartient donc à SP"(R). Autrement dit nous avons 


B(L4:k) © SPI(R). (17.523) 


Cette partie de la preuve provient essentiellement de [504], et fonctionne pour tous les SP(R), 
même pour ceux qui ne sont pas de rang maximum. 


Soit À € SPI(R). Nous savons que GL(n, R) contient exactement deux composantes connexes 
(proposition 13.20). Vu que l’application 


a: GL(n,R) — Sy 


17.524 
Pr P'AP 


est continue, l’image d’un connexe de GL(n,R) par a est connexe (lemme 7.209). En par- 
ticulier, a(GL*(n,IR)) sont deux connexes et nous savons que SP4(R) a au plus ces deux 
composantes connexes. 


Notre but est maintenant de trouver une intersection entre les parties a(GL*(n,R)) et 
a(GL”(n, R)) 68, Soit par le théorème de Sylvester, soit par le théorème de diagonalisation 
des matrices symétriques réelles 9.221, il existe une matrice P € GL(n, R) diagonalisant A. 
En suivant la remarque 9.222, et en notant Q la matrice obtenue à partir de P en changeant 
le signe de sa première ligne, nous avons 


a(Q) = QAQ = PAP = a(P). (17.525) 


Or si P € GL*{(n,R), alors Q € GL-(n,R) et inversement. Donc nous avons trouvé une 
intersection entre a(GL*(n,R)) et a(GL-(n,R)). 


Soient À et B dans SP1,(R) n GL(n,R). Par le théorème de Sylvester, il existe P et Q dans 
GL(n,R) telles que À = P‘1,,4P et B = Qt1,4Q. Par la remarque 9.222 nous pouvons 
choisir P et Q dans GL*(n,R). Ce dernier groupe étant connexe par arc, il existe un chemin 


7: [0,1] — GL*(n,R) (17.526) 
tel que (0) = P et (1) = Q. Alors le chemin 
se (8) Lpa(s) (17.527) 


est un chemin continu dans SP4(R) joignant À à B. 


63. À ce point, il me semble que [504] fait erreur parce que la matrice —1,, est de déterminant 1 lorsque n est pair. 
L'argument donné ici provient de [103] 
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Nous savons déjà de la proposition 17.120 que les ensembles SP1(R) (pas spécialement de rang 
maximum) sont ouverts dans S,(R). Le lemme suivant nous donne une précision à ce sujet, dans 
le cas des matrices de rang maximum, en disant que la matrice qui donne la similitude entre A5 


et À est localement un C!-difféomorphisme de À. 
LemWLCvLXe 


Lemme 17.121. 
Soit Ao € QAR") = Sy n GL(n,R), une matrice symétrique inversible. Alors il existe un voisinage 
V de Ao dans S, et une application w: V — GL(n,R) qui 

(1) est de classe C!, 

(2) est telle que pour tout À € V, w(A)*Aop(A) = A. 


Démonstration. Nous considérons l’application 


: Mn, R) — $S 

NOR (17.528) 

M + M'AoM. 

Étant donné que les composantes de (M) sont des polynômes en les entrées de M, cette application 

est de classe CT - et même plus. Soit maintenant H € M(n, R) et calculons dy1(H) par la formule 
(12.674) : 


d 
de1(H) = Æ[e(1 +tH)| 17.52 
e1(H)= [ea +]. (17.520) 
d t 
= [a + #H0) Ao(1 + tH)| (17.529b) 
— [A0 + tAoH + tH' A5 + PH'AoH| : (17.529c) 
= AoH + H'As. (17.529d) 
Donc 
dp1(H) = (AoH) + (AoAH). (17.530) 
Par conséquent 
ker(dy1) = {H € Mn, R) tel que AH est antisymétrique}, (17.531) 
et si nous posons 
F = {H E Mn, R) tel que AoH est symétrique} (17.532) 
nous avons 
Mi{n,R) = F@ ker(dp1) (17.533) 


parce que toute matrice peur être décomposée de façon unique en partir symétrique et antisymé- 


trique. De plus l’application 
:.F—S E D 
ee LPEUR 
H + AoH 
est une bijection linéaire. D'abord A5H = 0 implique H = 0 parce que À, est inversible, et ensuite 
si À e S,, alors X = A5A6 IX, ce qui prouve que X est l’image par f de À 1X et donc que f est 
surjective. 


Maintenant nous considérons la restriction d = 4,,, bd: F — S,. Remarquons que 1 € F parce 
que Ào € Sn. L'application d\1 est une bijection. En effet d’abord 


d(plr)1 = (dP1)1p) (17.535) 


ce qui prouve que 
ker(d#1) = ker(dp1) n F = {0}, (17.536) 
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ce qui prouve que d#1 est injective. Pour montrer que di est surjective, il suffit de mentionner le 
fait que dim F = dim S$,, du fait que l’application (17.534) est une bijection linéaire. 

Nous pouvons utiliser le théorème d’inversion locale (théorème 17.50) et conclure qu’il existe 
un voisinage ouvert U de 1 dans F tel que # soit un difféomorphisme C1 entre U et V = Y{U). 
Vu que GL(n, R) est ouvert dans M{n, R), nous pouvons prendre U n GL(n, R) et donc supposer 
que U € GL(n, R). 

Pour tout À € V, il existe une unique M € U telle que Ÿ(M) = A, c’est-à-dire telle que 
A = M'AoM. Cette matrice M est #-!(A) et est une matrice inversible. Bref, nous posons 


D: V — GL(n,R) 


de (17.537) 


et ce @ est de classe Cl sur V parce que c’est ce que dit le théorème d’inversion locale. Cette 
application répond à la question parce que V est un voisinage de w(1) = 49 et pour tout À € V 
nous avons 


(4) 409(4) = #7" (4)"A40p " (4) = A: (17.538) 


17.14  Ellipsoïde de John-Loewner 


C’est le moment de relire les conventions de notations données en 17.118 et 17.119 ainsi que la 
définition 9.123 d’une forme quadratique. 

Soit qg une forme quadratique sur R”' ainsi que B une base orthonormée de IR” dans laquelle la 
matrice de q est diagonale. Dans cette base, la forme q est donnée par la proposition 9.249 : 


g(x) = » ri (17.539) 


où les À; sont les valeurs propres de q. 


Plus généralement nous notons matg(q) la matrice de q dans la base B de R”. 
PropOXWooYrDKpw 


Proposition 17.122. 


Soit B une base orthonormée de R”" et l'application °* 


D: Q(R")—R 


qr det (matg(q)). (17.540) 


Alors : 
(1) La valeur de D ne dépend pas du choix de la base orthonormée B. 
(2) La fonction D est donnée par la formule D(q) = [T; À; où les À; sont les valeurs propres de 
q. 
(3) La fonction D est continue. 


Démonstration. Soit q une forme quadratique sur IR”. Nous considérons B une base de diagonali- 
sation de q : 


gx) = D (17.541) 


où les x; sont les composantes de x dans la base B. Par définition, la matrice matg(q) est la matrice 
diagonale contenant les valeurs propres de q. 

Nous considérons aussi B1, une autre base orthonormées de R?. Nous notons $ = matg, (q); 
étant symétrique, cette matrice se diagonalise par une matrice orthogonale : il existe P € Of(n,R) 
telle que 

S = Pmatg(q)P'; (17.542) 


64. L'ensemble Q(E) est l’ensemble des formes quadratiques sur E. 
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donc det(S) = det(PP!) det (diag(M,...,An)) = À1...An. Ceci prouve en même temps que D ne 
dépend pas du choix de la base et que sa valeur est le produit des valeurs propres. 

Passons à la continuité. L'application déterminant det: S,(R?) — R est continue car poly- 
nôme en les composantes. D'autre part l'application matg: Q(R”") — S,(R) est continue par 
la proposition 9.140. L'application D étant la composée de deux applications continues, elle est 
continue. 


LEMooLSTOooZiEOUdx 
Lemme 17.123 (Volume d’un ellipsoïde[103, 1]). 
Soit une forme quadratique strictement définie positive q sur R". Nous considérons l’ellipsoide 


E={xeR" tel que q(x) < r°} (17.543) 


pour un certain Tr > 0. 
Alors le volume de € est donné par 


V, = (17.544) 


où Vo est une constante ® et D est l’application de la proposition 17.122. 


Démonstration. Vu que la matrice de q est symétrique, elle est diagonalisable par une matrice 
orthogonale (théorème 9.221). Autrement dit, il existe une base orthonormée B = {e1,...,e,} de 
IR” telle que 


q(x) = ÿ ait} FA Ro RER 
i=1 


où æ; = (e;, x) et les a; sont tous strictement positifs. 
À priori nous devrions calculer 


| dé (17.546) 
Ë 


mais nous effectuons le changement de variable 6 associé à la matrice qui diagonalise q et nous 
devons simplement calculer 
Vs = dx (17.547) 
X; aix? <r? 
parce que le jacobien de ce changement de variable est 1 (déterminant d’une matrice orthogonale). 
Tout cela pour dire que nous nommons €, l’ellipsoïde associée à la forme quadratique q et V, 
son volume que nous allons maintenant calculer (7 : 


V, = dx (17.548) 


x2<r2 
Dati <r 


Cette intégrale est écrite de façon plus simple en utilisant le C!-difféomorphisme 


D: E3 — B(0,1) 
1 (17.549) 
Tr = (eva, iss 2nVün). 
Le fait que & prenne bien ses valeurs dans B(0,1) est un simple calcul : si x € €,, alors 
ee eee 1 17.550 
Diet) ES De : -29(x) < 4. (17.550) 


65. C’est le volume de la boule unité dans R” et ce n’est pas tout à fait évident à calculer [505]. 

66. Théorème 14.290. 

67. Le volume ne change pas si nous écrivons l'inégalité stricte au lieu de large dans le domaine d'intégration ; 
nous le faisons pour avoir un domaine ouvert. 
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Cela nous permet d’utiliser le théorème de changement de variables 14.290 : 


r? 
V, = Î dx = ] dx. 17.551 
q : aix?<r? 4/41 .:.:An B(0,1) ( ) 


La dernière intégrale est le volume de la boule unité dans IR” et nous la notons Vo. La proposi- 
tion 17.122 nous permet d'écrire V, sous la forme 


V, = (17.552) 


17.124. 
Le théorème suivant dit en substance que si K est compact, alors il existe un unique ellipsoïde de 
volume minimal centré en l’origine et contenant Æ. Il faut se rendre compte que l’ellipsoïde n’est 
pas celui que l’on croirait intuitivement parce que la contrainte centrée en l’origine est forte. Si 
K = B((4, 0), 1} alors l’ellipsoïde donnée n’est pas du tout X lui-même comme on pourrait s’y 
attendre. Ce serait probablement quelque chose comme la boule centrée en (0,0) et de rayon 5 À. 
Ce que l’on voudrait est un ellipsoïde qui soit centré où il faut pour que le volume soit minimal. 
Nous verrons que c’est possible en la proposition 17.126, mais qu’alors l’unicité est moins évidente 
(voir la remarque dans [506]). Si vous voulez en entendre parler, vous pouvez lire [507, 508]. 
PropJYVooRMaPok 
Proposition 17.125 (Ellipsoïde de John-Loewner|103]). 
Soit K compact dans R” et d'intérieur non vide. Il existe une unique ellipsoïde®° (pleine) centrée 
en l’origine de volume minimal contenant K. 


Démonstration. Nous subdivisons la preuve en plusieurs parties. 


(1) Volume de l’ellipsoïde Soit € un ellipsoïde centré en l’origine. La proposition 9.311 et 
son corolaire 9.312 nous indiquent que 


€ = {xe R”" tel que q(x) < 1} (17.553) 


pour une certaine forme quadratique strictement définie positive q. Le lemme 17.123 nous 
donne alors le volume de € par 


V, = (17.554) 


où est une constante. 


(2) Existence de l’ellipsoïde 


Nous voulons trouver un ellipsoïde contenant X de volume minimal, c’est-à-dire une forme 
quadratique q € Q**T(R") telle que 


— D(q) soit maximal 
— q(x) < 1 pour tout x € K. 


Nous considérons l’ensemble des candidats semi-définis positifs. 
A = {qe Q* tel que q(x) < 1Vr e K}. (17.555) 


Nous allons montrer que À est convexe, compact et non vide dans Q(R”) ; il aura ainsi 
un maximum de la fonction continue D définie sur Q(R”). Nous montrerons ensuite que le 
maximum est dans Q**. L'unicité sera prouvée à part. 


68. Je ne sais pas très bien si il y a moyen de faire mieux. Ce serait sans doute un bon exercice; faites-moi savoir si 
vous avez la réponse. 
69. Définition 9.309. 
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Non vide L'ensemble K est compact et donc borné par M > 0. La forme quadratique 
q:æt [x|?/M? est dans À parce que si x € K alors 
eo = El <5 (17.556) 
ax) = 2 <1 . 


Convexe Soient q,q € A et À € [0,1]. Nous avons encore Àq + (1 — X)g € Q* parce 
que 
Xq(x) + (1 — À)g' (x) > 0 (17.557) 


dès que q(x) > 0 et qg'(x) > 0. D'autre part si x € K nous avons 
Xg(x) + (1— À)g' (x) < À + (1 — À) = 1. (17.558) 


Donc Àg + (1 — À)q € À. 
Fermé 


Pour rappel, la topologie de Q(R”) est celle de la norme (9.283). Nous considérons une 
suite (qn) dans À convergeant vers q € Q(R”) et nous allons prouver que q € À, de sorte 
que la caractérisation séquentielle de la fermeture (proposition 7.242) conclue que À est 
fermé. En nommant e, le vecteur unitaire dans la direction x nous avons 


a(x)] = [lela(ez)| < xl? N (a), (17.559) 
de sorte que notre histoire de suite convergente donne pour tout x : 
an(æ) — q(æ)| < Ir Nan — 9) — 0. (17.560) 


Vu que gn(x) > 0 pour tout n, nous devons aussi avoir q(x) > 0 et donc q € Q* (semi- 
définie positive). De la même manière si x € K alors qn(x) < 1 pour tout n et donc 
q(x) < 1. Par conséquent q € À et A est fermé. 


Borné 


La partie K de R” est borné et d'intérieur non vide, donc il existe a € K et r > 0 tel 
que B(a,r) € K. Si par ailleurs q € À et x € B(0,r) nous avons a + x € K et donc 
q(a + x) < 1. De plus q(—a) = q(a) < 1, donc 


Va(x) = \/q(x +a— a) < 1/q(x + a) + V/q(-a) < 2 (17.561) 


par l'inégalité de Minkowski 11.10. Cela prouve que si x € B(0,r) alors qg(x) < 4. Si par 
contre æ € B(0,1) alors rx € B(0,r) et 


1 4 
D<'atE) = aq(ræ) Dr (17.562) 


ce qui prouve que N(q) < 5 et que À est borné. 


L'ensemble À est compact parce que fermé et borné, théorème de Borel-Lebesgue 10.24. 
L'application continue D: Q(R”) — R de la proposition 17.122 admet donc un maximum 
sur le compact À. Soit go ce maximum. 


Ix|? 


Nous montrons que go € Q*+(R4). Nous savons que l'application f: x 7 est dans À et 
que D(f) > 0. Vu que qo est maximale pour D, nous avons 


D(q) > D(f) > 0. (17.563) 


Donc qo € Q**. 
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(3) Unicité 
Si il existe une autre ellipsoïde de même volume que celle associée à la forme quadratique go, 
nous avons une forme quadratique q € Q** telle que q(x) < 1 pour tout x € K. C'est-à-dire 
que nous avons qo, q € À tels que D(qo) = D(q). 


Nous considérons la base canonique B4 de R” et nous posons $ = matg,(q), So = matg.(qo). 
Étant donné que À est convexe, (qo + g)/2 € À et nous allons prouver que cet élément de À 
contredit la maximalité de go. En effet 


p{ti) = at (SX) (17.564) 


Nous allons utiliser le lemme 17.95 qui dit que le déterminant est log-concave sous la forme 
de l'équation (17.371) avec a = 8 = à : 


D (° e à = det (£ ? à) > 4/det{5)4/det(S0) = det(So) = D(g0). 7 7.805) 


2 2 


Nous avons utilisé le fait que D(qo) = D(q) qui signifie que det(S5) = det(S). L’inéquation 
(17.565) contredit la maximalité de D(qo) et donne donc l’unicité. 


Dans la proposition suivante nous oublions l’unicité, mais nous démontrons qu'il existe un 
ellipsoïde de volume minimal parmi les ellipsoïdes centrées où l’on veut et non seulement en zéro. 
La source de cette proposition est [1], et comme toujours avec cette source, vous devez regarder à 


la fois l'énoncé et la preuve avec un oeil encore plus prudent que d'habitude. 
PROPooVIDPooUGrRJh 


Proposition 17.126 (|[1]). 
Soit un compact d'intérieur non vide K dans R”. Il existe un ellipsoide de volume minimal conte- 
nant K. 


Démonstration. Au lieu de considérer le compact K et de chercher où centrer l’ellipsoïde afin 
qu’elle puisse contenir K en un volume minimal, nous allons chercher comment translater K pour 
qu'un ellipsoïde centré en zéro puisse contenir l’image translétée de À en un volume minimal. 

Pour a € R”, nous notons €, la plus petite ellipsoïde centrée en 0 contenant K + a (translation 
de K par le vecteur a). Elle est bien définie par la proposition 17.125. Notre jeu est maintenant 
d'étudier la fonction "0 

f:R°—-Rt 
a vol(£a). 


Nous allons montrer que f est continue et qu’elle peut être restreinte à un compact sans risque de 


(17.566) 


rater un minimum. 


(1) À propos de forme quadratique Nous notons q la forme quadratique de l’ellipsoïde € 
et À sa matrice symétrique associée. Si x € K + h nous avons, pour un certain k € K : 


q(x) = q(k+h) (17.567a) 
=(k+h,A(k+h)) (17.567b) 
= €k, Ak) + <k, Ahx) + h, Ak) + h, Ah). (17.567c) 

En tenant compte du fait que À = A! nous avons aussi (k, Ah) = {h, Akÿ et donc 
qg(x) = 2k, Ah) + q(h). (17.568) 

En ce qui concerne la norme, pour tout x € K + h nous avons donc la majoration 
g(x)| < 1 +2]k |] AR] + q(h) (17.569) 
<1+2|K|| Ah] + q(h) (17.569b) 


70. Notons que cette fonction est bien définie, même sans la partie unicité de 17.125 parce que même si €, n’était 
pas bien définie, son volume, lui, est bien défini. 
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où nous avons noté |K| = sup4-K |k|. Vu que q(x) est en fait toujours positif nous pouvons 
oublier la valeur absolue à gauche et conclure que K + h est contenu dans l’ellipsoïde 


F1 = {x e R” tel que g(x) <1+2|K|| Ah] + q(h)}. (17.570) 


Volumes 


Nous avons donc vol(£») < vol(F). En reprenant la formule du lemme 17.123 pour le volume 
de l’ellipsoïde nous avons la majoration 


vol(£») < vol(£o)(1 + 2|K|| Ah] + q(h))". (17.571) 
Autrement dit, en ce qui concerne notre fonction f : 
n EQooLVZCooJ 
f() < f(0)(L + 21K1| An] + a(h))". RAGE Er 


Nous pouvons faire le même raisonnement en partant de K+h et en voyant comment modifier 
le rayon de €} pour que € y rentre. Autrement dit, nous refaisons le raisonnement en posant 
K' = K+het en étudiant K’—h. Si q1 est la forme quadratique de €} et si A1 est sa matrice 
symétrique, 


n 


vol(£o) < vol(£)(1 + 21K + Al|A1h| + q(h)) (17.573) 


En termes de f : 


f(0) < f(R)(1 + 21K + Al] Aihl + œ(h))" FRE er) 


Encadrement 


Les majoration (17.572) et (17.574) nous permettent de créer un encadrement pour f(h). En 
effet, en écrivant (17.574) et en continuant la majoration en remplaçant f(h) par (17.572), 
nous obtenons 


(0) < f(R)(1 + 21K + R|| Ah + q(h))" 


. . (7.575) 
< f(0)(1+2/K1IARI + g(h)) (1 +21K + RI|A1h] + a(R)) 


Vu que nous avons dans l’idée de prendre des h petits (en norme) et que les parenthèses 
tendent vers 1 lorsque h est petit, nous pouvons supposer qu’elles sont non nulles et allègre- 
ment les passer au dénominateur. Nous divisons donc tout par le coefficient de f(h) : 


f(0) - 
(+ 2IK + AAA] + ah) < FU) < f(0)( + 21KIIAR] + a(h)) (17.576) 


Nous utilisons la règle de l’étau /! pour conclure que 


lim vol(£z) = vol(£o). Er SP) 


Continuité Si a € R” nous pouvons appliquer la limite (17.577) pour l’ellipsoïde €, au lieu 
de €, c’est-à-dire en partant du compact K + a au lieu de K. Cela donne 


lim Vol(Eir) = vol(é) (17.578) 


Donc f est continue sur R”. 


Compact 

Nous avons en hypothèse que K est d’intérieur non vide. Il existe donc a € K et r > 0 tel 
que B(a,r) € K. Soit l’hyperplan affine A passant par a et perpendiculaire à a. Nous notons 
S = HA B(a,r). Nous avons évidemment $ € K et donc S € €. Vu que l’ellipsoïde € est 
convexe et contient K, tout le cône de base $ et de hauteur a est dans €. 


71. Théorème 12.224. 
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Sans rentrer dans le détails du calcul du volume de ce cône, son volume tend vers l'infini si 
a tend vers l'infini !? 


Nous avons donc une majoration 
vol(£») > volume du cône de base S et de hauteur a + h. (17.579) 


Dès que ce volume est plus grand que vol(£o), il est impossible que vol(£x) < vol(£o). Soit 
R > 0 tel que pour tout |h] > R, le volume du cône soit plus grand que vol(£). Le minimum 
de f est certainement dans B(0, R) parce que au moins 


vol(£o) € f(B(0, R)). (17.580) 


(6) Minimum 
Nous considérons la fonction 
f: B(0,R) —-R* 
hr vol(£}). 


Elle est continue sur un compact, et le théorème de Weierstrass 7.138 nous dit alors qu’elle 
atteint son minimum. Il n’y à cependant pas unicité de la valeurs de À pour laquelle f(h) est 
minimum. 

(7) Envoi 
Soit s € R” tel que f(s) soit minimal. Cela signifie que parmi tous les ellipsoïdes centrés en 
zéro et contenant des ensembles de la forme K + h, le plus petit est celui qui contient K +5. 
Soit €, cet ellipsoïde. 


(17.581) 


Je prétend que €, — s est le plus petit ellipsoïde contenant K, tout centres confondus. En 
effet, si F est un ellipsoïde centré en a et contenant À, alors F — a est un ellipsoïde centré 
en zéro et contenant K — a. Nous avons alors 


vol(F — a) > vol(£,) = vol(£, — 5). (17.582) 


L’invariance de la mesure par translation est le théorème 14.245. 


17.15 Prolongement de fonctions 

LEMooTUQIooEyTLBa 
Lemme 17.127 (|[1]). 
Soient un espace topologique X et un ouvert V € X. Nous considérons une fonction @ e C9(V, C). 
Alors l'extension 


nn site V (17.583) 


est continue sur X. 
LemdCOMQM 


Lemme 17.128. 
Soit E, un espace vectoriel normé complet et (A,) une suite emboîtée de fermés non vides dont le 
diamètre tend vers zéro. Alors l'intersection (,,:ù An contient exactement un point. 


Démonstration. Si l'intersection contenait deux points distincts a et b, alors nous aurions pour 
tout n la majoration diam(A4,) > |\a — b| qui ne dépend pas de n. Cela contredirait la limite. 

Soit une suite (x,) avec xx € À; pour tout k € N. C’est une suite de Cauchy. En effet si € > 0, 
considérons N tel que diam(An) < €. Dans ce cas dès que n,m > N nous avons æ7»,%m € An et 
donc |ty — ïm| < €. La suite x, converge donc vers un élément dans £. 


72. Topologie du complété en un point, j'imagine que vous voyez de quoi il en retourne. Sinon c’est la définition 
7.98, et il faut sans doute adapter le lemme 12.85 au cas de R" pour tout faire dans les règles. 
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Nous devons montrer que x € A pour tout k. La queue de suite (7»),>4 est une suite de 
Cauchy dans A% qui converge donc vers un élément de A4 (ici nous utilisons le fait que Ag est 
fermé). Par unicité de la limite, cette dernière doit être x. Par conséquent x € (x An: 

ThoCaMpKO 


Théorème 17.129 ([509]). 
Soient X et Ÿ des espaces vectoriels normés. Pour une application linéaire f : X — Y, les asser- 
tions suivantes sont équivalentes : 

(1) f est continue sur X, 

(2) f est continue en un point de X, 


(3) f est bornée. 
PropTTiRgAq 
Proposition 17.130 ([510]). 
Soit un espace normé X, un espace de Banach F' et une partie dense À de X. Si l’application 
linéaire 


f: (A, |x) = F (17.584) 


est continue ?, alors il existe une unique application linéaire continue f: X — F prolongeant f. 
De plus |f| = |f|. 


Démonstration. Soient x € X et (A; )h>0 la suite d’ensembles définie par 
An = {y € À tel que |x — y] < 27}. (17.585) 


Étant donné que À est dense, ces ensembles sont tous non vides. De plus diam A, — 0 parce que 
si y,y € An alors 
by y1 < y — 2 + le — y] < 2 (17.586) 


Vu que f est bornée, la suite d’ensembles f(4,) est une suite emboitée d’ensembles non vides de 
F. De plus leur diamètre tend vers zéro. En effet si z,z2/ € f(A,), nous posons z = f(y), z! = f(y/) 
et nous avons 


le 21 <1f@) — fe) +) — FN < NA — xl + le — #1), (17.587) 


ce qui montre que diam f(A,) < | f|2-"+1. Notons que nous avons utilisé la linéarité de f. Par le 
lemme 17.128, l'intersection (,,.ù f(An) contient exactement un point. Nous posons 


S(x) = ([) F(4). (17.588) 


neN 


Nous allons montrer que l’application x + S(x) ainsi définie est l’application que nous cherchons. 
Nous commençons par montrer que pour toute suite y, — x avec yy € À nous avons 


E 
f(x) — S(x). eue) 
Pour cela nous considérons no € N et ko tel que y, € A+ Avec cela nous avons 
lf(ux) — S(x)| < diam(An) < | fI27"0*T. (17.590) 


Pour montrer que S est linéaire, nous considérons deux suites dans À : y, — x et y, — x’ ainsi 
que la somme yy + yYk — x + x’. Nous écrivons la relation (17.589) pour ces trois suites : 


J(ur) — S(x) (17.591a) 
(ur) — S(x') (17.591b) 
Fur + %e) — S(x +). (17.591c) 


73. Nous avons bien mis sur À la topologie induite de X. Notons que ce n’est pas toujours celle qui est la plus 
naturelle sur À. 


17.15. PROLONGEMENT DE FONCTIONS 1531 


Cependant, étant donné que f est linéaire, pour tout k nous avons f(uyx + y,) = f(yx) + f(yL) et 
par conséquent 
FQur + y) — S(x) + S(x’). (17.592) 


Par unicité de la limite, S(x + x’) = S(x) + S(x'). Le même genre de raisonnement montre que 
S(Ax) = ÀS(x). L'application S est donc linéaire. 
En ce qui concerna la continuité, nous avons 


1SGx)] = lin fur) < 1m gl = 1, (17.593) 


donc |S| < |f|, c’est-à-dire que S est borné et donc continue parce que linéaire (théorème 17.129). 

Nous montrons maintenant que S prolonge f. Si x € À, alors nous avons (,,ù (An) = f(x), 
et donc S(x) = f(x). Cela montre du même coup que | f] < |S| et que par conséquent |f| = |S|. 

Passons à la partie sur l’unicité. Soient donc $ et T' deux prolongements continus de f sur 
X. Soient x € X et z, — x une suite dans À. Par continuité nous avons T(x,) — T(x) et 
S(tn) — S(x). Étant donné que par ailleurs pour tout n nous avons S(x,) = T(x,), l’unicité de 
la limite montre que T(x) = S(x). 


17.15.1 Encore du prolongement 


Dans la même veine que la proposition 17.130 nous avons ce résultat. 
ThoPVFQMi 


Théorème 17.131 ([511]). 

Soient E et F, deux espaces métriques complets ainsi que À dense dans E. Si u: A — F est 
uniformément continue, alors elle se prolonge de façon unique en une fonction continue ü: E — F. 
De plus ce prolongement est uniformément continu. 


Démonstration. Soit x € E\A et une suite (x,) contenue dans À et convergente vers x. Nous 
voulons définir 
dr) = Jim ufr) (17.594) 


mais pour ce faire nous devons prouver que la suite (u(xn)) converge dans F' et que la limite ne 
dépend pas de la suite choisie parmi les suites de À qui convergent (dans Æ) vers x. 
Commençons par montrer que (u(æ)) est de Cauchy dans F. Pour cela nous prenons € > 0 et 
n > 0 telle que dg(a,b) < n implique dp(u(a),u(b)) < € (uniforme continuité de u). Après, il suffit 
de choisir N tel que pour tout n,m > N nous ayons d(zm,%n) < n (parce que x, est de Cauchy). 
Avec tout ça nous avons 
dr(u(tm),u(tn)) < €, (17.595) 


ce qui signifie que (u(zn)) est de Cauchy et donc convergente dans F. 

Nous voulons montrer maintenant que si (x,) et (y) sont deux suites dans À convergentes vers 
x alors limy_,0 U(Æn) = liMyn_0 U(Yn). Pour cela nous considérons la suite 2 = (71,y1,%2,y2,...). 
Nous avons évidemment z, — x, et donc u(z,) converge dans F par ce qui a été dit plus haut. 
Mais u(x») et U(yn) en sont deux sous-suites convergentes. Donc leurs limites sont égales. 

Il reste à montrer que ce à est continue et uniformément continue. Pour cela nous utilisons le 
module de continuité et le lemme 11.274. Étant donné que à prolonge w nous avons 


tee Fa 5e) 


Soient h > 0 et € > 0; soient aussi x, y € E tels que d(x, y) < h. Nous prenons des suites (an) — x 
et (b,) — y tout en choisissant n assez grand pour avoir dg(an, bn) < h. Nous avons 


dr(ü(x),à(y)) < dr(ü(x), u(an)) + d(u(an), u(bn)) + dr(u(br), à(y)). (17.597) 


Si n est assez grand, par construction de &, le premier et le dernier terme sont plus petits que 
€. Par définition du module de continuité nous avons d’autre part dr(u(an),u(bn)) < wu(h). Du 
coup 

dr(ü(x), ü(y)) < wu(h) + 2e. (17.598) 
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Si nous prenons le supremum sur les x et y vérifiant dg(x,y) < h, à gauche nous obtenons w;(h) 
tandis que le membre de droite ne dépend pas de x ety. Donc pour tout €, nous avons 


wa(h) <wy(h) + 2e. (17.599) 

En comparaison avec (17.596), nous trouvons 
Wa(n) < Wu (h). (17.600) 
Les fonctions u et à ayant le même module de continuité, le lemme 11.274 nous enseigne que l’une 


est uniformément continue si et seulement si l’autre l’est. Vu que u est uniformément continue par 
hypothèse, le prolongement & est uniformément continu. 


DEFooMHQMooEvLccV 
Définition 17.132. 
Un plongement de l’espace topologique X dans Y est une application f: X — Y telle que f: X — 
f(X) soit un homéomorphisme. 


ThoPH1lyoB 
Théorème 17.133 (Extensiton des isométries). 
Soit M un espace métrique complet et une application isométrique 
f:A— M (17.601) 


où À est une partie dense d’un espace métrique M (pas spécialement complet). Alors f accepte 
une unique extension isométrique 


f.M—M (17.602) 


Supposons de plus que M soit complet "*. Alors : M — M est une bijection si et seulement 
si f(A) est dense dans M. 


Démonstration. Nous commençons par prouver l’unicité. Soient f1 et f2 deux extensions de f et 
x € M. Si (ar) est une suite dans À convergeant vers x (possible parce que À est dense dans M), 
alors nous avons 


fi(an) = f2(an) (17.603) 


et donc f1(x) = f2(x) par continuité (une application isométrique est continue (proposition 7.236)). 
Nous démontrons à présent l'existence. 


(1) Construction de f Soient x € M et (a) une suite dans À qui converge vers x. Nous 


définissons 
f(x) = Jim (an). FA EPEUP) 


Note : nous pouvons prouver que cette définition ne dépend pas du choix de la suite (a) 
convergeant vers x, mais ce serait superflu parce que nous avons déjà prouvé l’unicité de f. 
Par contre nous devons expliquer pourquoi la limite du membre de droite de (17.604) existe 
dans M. D'abord la suite (an) est de Cauchy parce qu’elle est convergente (attention : M 
n'étant pas complet le fait d’être de Cauchy n'implique pas la convergence). Donc, étant 
donné que f est une isométrie, la suite ( Î (an)) est de Cauchy dans M. Or ce dernier étant 


complet, la suite des images converge. 


Montrons que cette application a : M — M répond à la question. 


(2) f est isométrique 


74. Il me semble que cette hypothèse manque dans [512]. 


17.16. COMPLÉTION D'UN ESPACE MÉTRIQUE 1533 


Soient a,be M et des suites dans À convergeant vers eux : an — à, b, — b. Nous avons, par 
continuité de l’application distance, 


d((a), f()) = lim d(f(ax), FE) (17.605a) 
= lim lim d(f(ax), f(b)) (17.605b) 
= lim lim d(f(ax), f(b)) (17.605c) 
= lim lim d(ar, bi) (17.605d) 
= d(a,b). (17.605e) 


Cela prouve que f est une isométrie. 


Pour la suite nous supposons que M est complet. Notons tout de suite que f est injective 
parce qu’elle est isométrique. 


(3) Bijection implique dense 


Nous supposons que F : M — M est une bijection. Notons que f: À — M a son image dans 
M. Donc f(4) c M. 

Étant donné que f a pour image des limites de suites dans f (A), l’image de f est contenue 
dans f(A), c’est-à-dire f(M) & f(A). Donc si f est surjective, c’est que M € f(A). Au final 
nous avons l'égalité f (A) = M. Cela prouve que si f est bijective, alors f(A) est dense dans 
M. 


(4) Dense implique bijective 


Nous supposons que f(A) = M et nous devons prouver que f est surjective. Soient x € M 
et f(an) une suite dans f(A) qui converge vers x; une telle suite existe parce que f(A) est 
dense dans M. Cette suite est de Cauchy dans M parce que dans un espace métrique, une 
suite convergente est de Cauchy. La suite (a,) est elle-même également de Cauchy parce que 


d(an, ds) T d(f(an). Ta) ): (17.606) 


Étant donné que (a,) est de Cauchy dans M, elle converge vers un élément que nous nommons 
a € M. Par continuité de f nous avons alors 


f(a) = Jim Ja) 2% (17.607) 


Cela prouve que x est bien dans l’image de f et donc que f est surjective. 


17.16 Complétion d’un espace métrique 

LEMooGJONooVwUgyv 
Lemme 17.134 ([513]). 
Soient des espaces métriques (X, d) et (Y,p). Soit une application isométrique fin RS Ko oAED£TU 


(1) Si(xn) est de Cauchy dans X, alors (f(æn)) est de Cauchy dans Y. ITEMooBCWMooQP£TAZ 


(2) Si (an) et (bn) sont deux suite des Cauchy dans X ayant la même limite, alors (f(an)) et 
(f(bn)) ont même limite. 


Démonstration. Soit e > 0. Soit Ne tel que si p,q > N., nous avons d(x,, 74) < €. Pour ce même 
N., vu que f est isométrique, 


p(f(xp), f(xa)) = d(tp;%q) < €. (17.608) 


Cela prouve (1). Nous passons à (2). 
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SUPPOSONS An À, % et bn En x, et nous considérons 7, et y les limites f(ah) ” Ya et 


(bn) 7, y. Nous avons 


P(Ya: Yo) < P(Ya: F(an)) + P(F(an), F(bn)) +P(F(bn), Yo) (17.609a) 
=d(an,bn) 
< P(ÿas f(an)) + dan, &) + d(x, bn) + P(F (En), yo). (17.609b) 


À droite, les quatre termes tendent vers zéro lorsque n — co. Donc P(Ya; Yo) = 0, et donc Ya = 
Yb- 


LEMooNFI0ooZUMhuA 
Lemme 17.135 ([513]). 
Soient des espaces métriques (X,d) et (Y,p) ainsi que D dense dans X. Nous supposons que Y 
est dense et nous considérons une application isométrique f: D — Y. 
Alors il existe une unique isométrie F: X — Y qui étend f. 


Démonstration. En plusieurs points. 


(1) Construction de F Nous commençons par l'existence. Soit x € X. Étant donné que D est 


dense dans X, il existe une suite (x,) dans D telle que th 2, zx. Nous déduisons du lemme 
17.134 que ( Î (tn)) est de Cauchy dans Ÿ, et même que la limite ne dépend pas de la suite 
(Zn) convergeant vers x. Bref, nous pouvons définir 


F'X—-Y 


ze lim f(x) 


n—00 


(17.610) 


où (x) est n’importe quelle suite dans D qui converge vers x. Si x € D, alors il suffit de 
prendre la suite constante x, = x pour obtenir que F(x) = f(x). 


(2) F est une isométrie 


Soient xæ,y € X ainsi que deux suites de Cauchy x, À, » et Un Le y. Soit € > 0. Si n est 
assez grand, 


d(x, y) d(t, Zn) Li das Ya) + d(y; Un) 

2e + p(f(tn), f(Yn)) f est isom. 
2e + p(f(tn), F(x)) + p(F (x), F(y)) + p(F (y), (un) 

3 


€ + p(F(x), F(y)). 


Donc nous avons l'inégalité 


WMA 


d(x, y) < p(F( (y)). (17.612) 


) < 
En partant maintenant de p(F( F(y)) et en effectuant les mêmes majorations, nous trou- 
vons l'inégalité dans l’autre sens : E(F(a),F (y)) < < d(x, y), de telle sorte que 
d(x,y) = p(F(x), F(y)), (17.613) 


ce qui signifie que Fest une isométrie. 


(3) Unicité Soient deux isométries F: X — Y et F': X — Y telles que F = F’ sur D. Nous 
devons prouver que F(x) = F'(x) pour tout x € X. 


Soient donc x € X ainsi qu’une suite (x,) dans D telle que x} À, x. Nous avons alors 
p(F(x), F'(x)) < p(F(x), F(œn)) + p(F (an), F'(@n)) +0(F'(&n), F(x)) (17.614a) 
7 
=0 


= d(t,Zn) + d(tn, t). (17.614b) 


Donc pour tout n nous avons p(F(x), F'(x)) < d(x,xn) + d(æn, x). En faisant n — oo nous 
trouvons p(F(x), F'(x)) < 0 et donc p(F(x), F'(x)) = 0. 
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DEFooXHQFooNBlavy 
Définition 17.136 ([513]). 
Soit un espace métrique (X, d). Une complétion de (X,d) est un triple (X, d, j) où 
(1) L'espace (À, d) est un espace métrique complet, 
(2) L'application j: X — X est une isométrie, 
(3) La partie j(X) est dense dans À. 
THOooRLYBooCVBjoP 
Théorème 17.137 (Unicité de la complétion{513]). 
Soient (X,d) un espace métrique ainsi que deux complétions ® (X1, di, j1), (Xo, do, jo). Alors les 
espaces (X1,d1) et (X2,d2) sont isométriques. 


Démonstration. Nous considérons l’application f = ÿ2 0 1, FA J1i(X) — X2. Cette application est 
isométrique (parce que 71 et 72 le sont), l’espace X2 est complet et 71(X) est dense dans X1. Le 
lemme 17.135 nous permet de considérer une isométrie F': X1 — X2. Nous devons prouver que F 
est bijective. 

L'application Fest injective parce qu’elle est isométrique. En ce qui concerne la surjectivité, soit 
y € X2. Étant donné que j2(X) est dense dans X», il existe une suite (y,) dans X2 telle que y» Lee y. 
Pour chaque n nous choisissons x, € X tel que j2(xn) = yn. Nous posons 2n = J1(%n) € X1. 

Vu que (yr) est de Cauchy et que j1 est isométrique, la suite (z,) est de Cauchy. Étant donné que 
X est complet, la suite (z,) à une limite dans X1. Nous pouvons donc poser z = limy_,0 2n € X1. 

Nous prouvons à présent que F(z) = y. L'application F: X1 — X2 est isométrique et donc 
continue ; elle commute donc avec la limite et 


im d2(F(zn), 9) = da(F(2),9). (17.615) 
Mais j1(x) € j1(X), et nous savons que F = f sur j1(X). Donc 

Fin) = G@a))=Hr). (17.616) 
Donc nous avons le calcul 


17.617a 


= lim do (F(j1(&n)), y) 17.617b 
= lim do(j 

n—00 
= Jim do(Yn, Y) 17.617d 


( ) 
( ) 
j2(&n), y) (17.617c) 
( ) 
( ) 


17.617e 


Cela prouve que F(z) = y et donc que F est surjective. 


Une conséquence du théorème de prolongement est le théorème suivant qui permet de compléter 

un espace métrique. 
ThoKHTQJXZ 

Théorème 17.138 (Complétion d’un espace métrique[514, 512, 513]). 
Plus précisément, soit (M, d) un espace métrique. Il existe un espace métrique complet M muni 
d’un plongement  isométrique w: M — M tel que (M) soit dense dans M. 

Ce complété de M est unique au sens suivant. Si M1 et M2 sont deux espaces métriques complets 
munis de plongements isométriques f;: M — M; dont les images sont denses, alors il existe une 
bijection isométrique D: M1 — Mb telle que Do f1 = f2. 


Démonstration. L'unicité est déjà le théorème 17.137. Nous faisons l’existence. 


75. Définition 17.136. 
76. Définition 17.132. 
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Existence 


Soit Cu l’ensemble des suites de Cauchy de M. Nous définissons 


J:CuxCu—R 


uvre lim dt) 


(17.618) 


Notre première tâche est de nous assurer que cela est bien défini, c’est-à-dire que la limite 
existe toujours. En effet, si u et v sont des suites de Cauchy dans M, nous avons 


dun, Un) — um; Vm)| < Id(Un, Un) + dun, Um)| + dun; Um) — dun; Vm)| (17.619a) 
< (Un, Um) + d(Un, Um) lem. 7.108 

(17.619b) 

< 2e (17.619c) 


dès que m et n sont assez grand. Cela prouve que la suite n + d(u,,v,) est de Cauchy dans 
R. Par complétude de R, elle converge ‘?. 

Nous considérons la relation d'équivalence w + vw si et seulement si f(u,v) = 0. Nous posons 
M=0C mM/ = et nous y mettons la distance 


d([u], [o]) = f(u, v) EPHIBI 


et nous devons encore vérifier que cela est bien défini. Prenons w/ + u et v’ + v. Alors nous 
avons 


d(ur,,vn) < d(u; Un) + d(üun, Un) + d(Un, vn), (17.621) 
et donc 
diu,v') = Jim d(u/,, v'n) < Jim d(un,vn) = d(u, v). (17.622) 


Le même argument en inversant les primes et les non primes montre l’inégalité inverse. Donc 
d{u,v) = d(u’,v!') dans Cw, et donc la distance (17.620) est bien définie sur M. 


Afin de s’assurer que M répond bien à la question du théorème, il faut encore démontrer les 
points suivants : 


— M se plonge isométriquement dans M. 
— l’image de M par le plongement est dense dans M. 
— M est complet. 


Nous allons maintenant considérer l’application 


op: M — M 


: (17.623) 
x + la classe de la suite constante x. 


(la) Plongement isométrique Nous allons montrer que cela est une isométrie bijective 


et que g(M) est dense dans M. Le fait que y soit bijective entre M et w(M) est évident. 
C’est une isométrie parce que 
d(o(x),v(y)) = lim d(p(t}n: (y}n) = dx, y). (17.624) 
(1b) Densité 
Soit [u] € M. Tous les termes u, sont des éléments de M. Nous considérons la suite 


dans (M) donnée par 
An = Q(un) (17.625) 


77. Ici nous utilisons la complétude de R. Cette dernière doit donc être démontrée indépendamment, ce qui est 
fait dans le théorème 7.272. De plus nous ne pouvons pas définir IR comme étant le complété de Q en utilisant ce 
théorème. 


17.16. COMPLÉTION D'UN ESPACE MÉTRIQUE 1537 


Chaque a, est un élément ® de M. Montrons que (a,) converge dans M vers u. Nous 


avons 
d(an, u) = Jim d((an)k; uk) (17.626a) 
—00 
= lim d(us,ux) (17.626b) 
k—00 
= dus 6) (17.626c) 


en notant la limite de la suite (u,). Ici nous avons utilisé le fait que la fonction distance 
était continue pour l’inverser avec la limite, par le théorème 12.222. Nous avons alors 


Jim d(an, [u]) = Jim dise) = 0: (17.627) 


(1c) Complétude Nous passons maintenant à la preuve du fait que M est complet. Soit 
(Yn) une suite de Cauchy dans M. Soit € > 0; nous définissons X{(n) par 


d((un)k: (Yn}r) < € (17.628) 


dès que k,1 > K{(n). Cette définition fonctionne parce que pour chaque n, y, est une 
suite de Cauchy dans M. Nous posons 


et nous allons montrer que (x,) est de Cauchy dans M -donc est un élément de M- et 
que y — (tn) dans M. 
Nous commençons par montrer que (x,) est de Cauchy dans M. Nous avons 


d(tn, Tm) = d((Yn)K(n): (Ym) K(m)) (17.630a) 
< d((yn)K(ny: Qn}t) + d((un)t (Um}t) + d((Ym)t5 (Ym)K(m))  (17.630b) 


Nous choisissons n, m tels que d(yn, Ym) < €, Ce qui nous permet de choisir { de telle façon 
à avoir d((Yn)k; (Ym)r) < € pour tout k > 1. De plus, quitte à encore augmenter {!, nous 
supposons que { > K(m) et ! > K(m). Avec ces choix nous voyons que d(tn, Zn) < 3e, 
ce qui signifie que la suite (x,) est de Cauchy dans M. 


En ce qui concerne la convergence y, — (x), on a 


d{Yn, (x)) = Jim d((Yn)k (Uk) Kk() (17.631a) 


< lim d((Yn)k: (Un}t) + im d((Yn)i; (yk}) + Jim d((yr)r; (ur) x) 


PEES 


Nous devons trouver un n tel que si k est suffisamment grand, le tout est majoré par €. 
Voici nos choix : 


— n tel que d(Yn, Ym) < € dès que m > n, 

— k>n, 

— k > K{n), 

— L>k, 

— 1> K(k), 

— | suffisamment grand pour que d((yn)r; (yk)) < €. 

Avec tous ces choix, les trois termes de (17.631b) sont plus petits que €. 
Ceci prouve que M est complet. 


Unicité Cette partie de la preuve est encore à écrire. Si vous savez comment faire, écrivez-moi. 


78. À partir de maintenant nous n’écrivons plus explicitement la classe d'équivalence. 
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17.16.1 Principe des zéros isolés 
ThoukDPBX 


Théorème 17.139 (Principe des zéros isolés [515]). 
Soit un ouvert OA & C. Soient une fonction analytique ® f: Q + C etae (, un zéro non isolé de 
J. Alors f est nulle sur un voisinage de a. 


8 


Démonstration. Nous écrivons f sous la forme d’une série entière *° autour de a : 


f(z) = >, Cn(z — a)” A) 
n=0 


valable sur une boule B(a,r). Soit c, le premier coefficient non nul (si il n’existe pas c’est que f 
est nulle sur tout B(a,r) et alors le théorème est prouvé). Nous avons alors 


(2) = cmfz — a)" (1 + N° de(z — a)*) (17.633) 
k=1 


avec dx = Cxim/Cm. Le rayon de convergence de la série 5, dy(z — a)* est le même que celui de 
dgrmtk 
Cm 


(17.632) parce que la suite reste bornée (critère d’Abel, lemme 15.18). Si nous posons 


g(z) = 1+ » d(2= a)", (17.634) 
k=1 


alors g est une fonction continue et g(a) = 1. De plus 
F(2) = cm(z — a)" g(2). (17.635) 


Soit une suite (z,) de zéros de f qui converge vers a. Étant donné que g est continue, nous 
devrions avoir limg_,% g(2x) = g(a) = 1, mais si f(24) = 0 avec 24 # a, alors g(z4) = 0. Cela est 
un paradoxe qui nous permet de conclure que si la suite z, existe bien, alors f est identiquement 
nulle sur un voisinage, c’est-à-dire que tous les €, sont nuls. 


CORooFBXXo0ZyfUQi 
Corolaire 17.140. 
Soit f une fonction analytique sur un ouvert connexe Q € C. Si f s’annule sur un ouvert (non 
vide) de Q, alors f s’annule sur tout 1. 


Démonstration. soit 
N={2e0 tel que f = 0 sur un ouvert autour de 2}. (17.636) 


Le fait que N soit ouvert est évident à partir de sa définition. Nous allons montrer que N est 
également fermé dans Q, et donc conclure que N = {. Soit (2,) une suite dans N convergente vers 
z € (. Étant donné que f(z,) = 0 et que f est continue, nous avons 

f(2) = Jim f(en) = 0, (17.637) 
ce qui fait de z un zéro non isolé de f. Par conséquent le principe des zéros isolés (théorème 17.139) 
nous enseigne que f s’annule dans un voisinage autour de z, c’est-à-dire que z € N. L'ensemble N 
est donc fermé. 


ThoAVBCewB 
Théorème 17.141 (Principe du prolongement analytique{[1]). 
Soit Q un ouvert connexe de C. Si deux fonctions analytiques coïncident sur un sous-ensemble D 
de ( contenant un point d’accumulation dans Q, alors elles sont égales sur (1. 


79. Définition 12.448. 
80. Définition de fonction analytique 12.448. 
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Démonstration. Soient deux fonctions analytique f,g: (® — € égales sur D. Nous considérons la 
fonction k = f—g. Il existe dans D une suite (z,) qui converge vers a € Q et telle que f(2») = g(2n), 
c'est-à-dire h(z,) = 0 pour tout n. 

Vu que À est continue nous avons aussi h(a) = 0. Le point a est donc un zéro non isolé de À. 
Le théorème 17.139 conclut que À = 0 sur Q. 


17.17 Un petit extra 


Ceci provient de notes de TP de l’université libre de Bruxelles autour des années 2000-2001/516]. 


LEMooXRMAooRADhOM 

Lemme 17.142 (|1]). 

Soit une fonction f : R — KR telle que Trente 
(1) f() = 1, ItemExtraii 
(2) f(x + y) = f(x) + f(y) pour tout réels x et y. 

Alors f(q) = q pour tout q € Q. 

Démonstration. Vu que f(x) + f(y) = f(x + y), nous avons, pour p € N: 

5, 1 2,1 
Di) Ja (17.638) 
ii P 1? 


Donc f(1/p) = 1/p. Nous en déduisons tout de suite que p(p/q) = pf(1/q) = p/q. 


Si nous ajoutons l’hypothèse de continuité, nous avons un résultat plus fort. 
LEMooYKCUooUilvPJ 


Lemme 17.143 ([1]). 
Soit une fonction f : R — KR telle que 


(JUIL 
(2) f(x + y) = f(x) + f(y) pour tout réels x et y. 
(3) f est continue. 


Alors f est la fonction identité : f(x) = x pour tout x ER. 


Démonstration. Nous savons déjà du lemme 17.142 que f(q) = q pour tout q € Q. Soient re R, 


. : R Le tie 
ainsi qu’une suite qg, dans À telle que g; — x. Par continuité, nous avons 


f(x) = lim f(ax) = lim f(ax) = lim qe = x (17.639) 


parce que f(qx) = gx pour tout k. 


Une question naturelle qu’on peut alors se poser est la suivante : 
Est-il possible de définir une fonction réelle non continue ayant les propriétés (1) et (2) ? 


Nous savons qu’une application linéaire sur un espace vectoriel de dimension finie est conti- 
nue, mais qu'en dimension infinie, une application linéaire non continue est possible °?. 

Donc une manière de trouver une réponse positive à la question posée plus haut, serait de voir 
IR” comme espace vectoriel de dimension infinie. 

Nous nous souvenons que, grâce au lemme de Zorn‘*, tout espace vectoriel admet une base °*. 


En particulier, l’ensemble des réels vu comme espace vectoriel sur À admet une base, i.e. (e;);er 


81. Proposition 7.171. 

82. Exemples 11.63 et 11.64. 
83. Lemme 1.23. 

84. Proposition 4.23. 
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des éléments de R tels que tout réel s'écrit comme combinaison linéaire à coefficients rationnels de 
ces €;, 1.e. 
VreR,1(;)ier des éléments de Q tels que r = >, Xe. (17.640) 
iel 
C’est avec ça en main que nous allons faire le travail. 
Proposition 17.144. 


Soient e1 = 1 ainsi qu'un irrationnel e2. Soit une Q-base complétée (e;);jer avec®® de R. 
Nous définissons h: IR — R par 


h(e1) = e1 (17.641a) 
h(e2) = e3 (17.641b) 
h(ez) = e2 (17.641c) 
h(ei) = e; Vie I\{1, 2,3}, (17.641d) 


et par Q-linéarité : 
RS. Xie:) — > À (17.642) 

pour tout (\; € Qjier. 
La fonction h vérifie ITEMooUXXMooJFSuuN 
(1) R(1) =1 


(2) h est Q-linéaire, c’est-à-dire que 


ITEMooAVNMooEsodLR 
(2a) h(x + y) = h(x) + h(y) pour tout x,ye R ITEMooDEJMooXtvrgi 
(2b) R(Ax) = XAh(x) pour tout À € Q. ITEMOOMHNZooBHQyuD 


(3) h n’est pas continue (pour la topologie usuelle sur R). 


Démonstration. En plusieurs points 
(1) Pour (1) C'est la condition h(e;) = e1 en nous souvenant que e1 = 1. 


(2) Pour (2a) Nous décomposons x et y dans la base {e;}ier. Il existe J, et J,, finis dans 7 


Bin = a ne ee i ? 
tels que ®° x — Pre Ja Lili Y = de J Viei- Vu que toutes les sommes sont finies, nous n’avons 
aucun problème à écrire 


ETY— > (ri + yi)e: (17.643) 
EU Jy 
et donc 
h(z + y) = » h(xi + y) = À ha) + » h(y:) = h(x) + h(y). (17.644) 


(3) Pour (2b) Même type de vérifications que pour (2a). 


(4) Pour (3) Si À était continue, elle serait l’identité par le lemme 17.143. Or elle n’est pas 
l'identité parce que h(e2) = ez. 


Donc nous avons trouvé une application Q-linéaire h: IR — IR qui n’est pas continue. 


85. Théorème de la base incomplète 4.24. Attention : nous ne prétendons pas que 7 est dénombrable. Par contre, 
par définition d’une base, les sommes sont toujours finies. Tout réel peut s’écrire comme une combinaison linéaire 
finie des e; avec des coefficients rationnels. 

86. Les vrais chasseurs de précisions diront que x; est défini pour à € 1, mais uniquement non nul sur J,. 


Chapitre 18 


Trigonométrie, isométries 


18.1 Trigonométrie 


18.1.1 Définitions, périodicité et quelques valeurs remarquables 


PROPooZXPVooBj0ONka 
Proposition-Définition 18.1 (Définition du cosinus et du sinus). 
La série 
cos(x) = œ : 
(2n)! 
n=0 
définit une fonction cos: R — R de classe C©. Nous l’appelons cosinus. 
La série : 
. (—1)T onu EQooCMRFooCTt 
sin(x) = He 188 | 
(a) » (2n +1)! € ) 
n=0 
définit une fonction sin: R — R de classe C?. Nous l’appelons sinus. 
Démonstration. La série entière définissant cos(x) a pour coefficients 
0 si n est impair 
An — À (-1)7/2 . : (18.3) 
y sinest pair. 


Nous pouvons la majorer par la série entière donnée par les coefficients 


oi (18.4) 


; 1/n! si n est impair 
" si n est pair. 


n! 


Quelle que soit la parité de k nous avons toujours 


b 
be] 1 (18.5) 
be 


k+1 


de telle sorte que la formule d’'Hadamard (15.68) nous donne À = « pour la série DE bg. A 
fortiori ! le rayon de convergence pour la série du cosinus est infini. 

L’assertion concernant le sinus se démontre de même. 

En ce qui concerne le fait que les fonctions sin et cos sont de classe C® sur R, il faut invoquer 
le corolaire 15.46. 


LEMooZMJTooJPnyfv 
ou 18 SBERdoTTtooxzApEH 
Nous avons 
cos(0) = 1 (18.6a) 
sin(0) = 0. (18.6b) 


1. Remarque 15.16. 
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 _ SUBEQSooFOGNooQrBxYc 
ainsi que | 
cos(—x) = cos(x) (18.6ca) 
sin(—x) = —sin(x) (18.6cb) 
(18.6cc) 
Démonstration. Par substitution directe dans les séries. 
LEMooBBCAooHLWmno 
Lemme 18.3. 
En ce qui concerne la dérivation, nous avons 
sin” = cos (18.4a) 
cos’ = — sin. (18.4b) 


Démonstration. Il s’agit de se permettre de dériver terme à terme (proposition 15.44) les séries 
qui définissent le sinus et le cosinus. 


LEMooAEFPooGSgOKkF 
Lemme 18.4. 
Les fonctions sinus et cosinus vérifient 
EQooNYCZoo 
cos?(x) + sin?(x) = 1 nee de PS) 
pour tout x € R. 
Démonstration. Posons f(x) = sin?(x) + cos?(r) et dérivons : 
f'(x) = 2sin(x) cos(x) + 2cos(r)(—)sin(x) = 0. (18.6) 


La fonction f est donc constante par le corolaire 12.199. Nous avons donc pour tout x : 
f(æ) = f(0) = sin?(0) + cos?(0) = 1. (18.7) 


Le dernier calcul s'obtient en substituant directement x par zéro dans les séries : sin(0) = 0 et 
cos(0) = 1. 


18.1.2 Fonction puissance (pour les complexes) 


La fonction puissance a déjà fait l’objet de nombreuses définitions et extensions. Voir le thème 
51. Nous allons maintenant définir a° pour a > 0 et ze C. 
Soit z = x +iy € C. L’exponentielle exp(x + yi) est déjà définie en 15.59; il suffit donc 


maintenant de définir les notations e7 et a° pour z € C. 
DEFooRBTDooNLcWG; 


Définition 18.5. 
Pour le nombre ee R et le nombre imaginaire pur iy (yE R), nous définissons 


e% = exp(iy) (18.8) 


où exp est la série usuelle de la définition 15.59. Pour un nombre complexe général x + yi nous 
définissons | | 
ET Ce. (18.9) 


Et enfin, si a > 0 et si ze C nous définissons 
a? = em), (18.10) 
la fonction logarithme ici étant celle In: ]0,00[ — R définie par la proposition 15.81. 


SizeCetsine Z, la définition de z° ne pose pas de problème, c’est la définition 1.200. 
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DefJilXoM 
18.6. 
Soit z = x+iy € C. L’exponentielle exp(x +yi) est déjà définie en 15.59 ; elle est la fonction donnée 
par 


exp: C—C 
RL (18.11) 
2 
n=0 


PROPooXEYFooIEaPvU 
Proposition 18.7. 
Le rayon de convergence? de la série exponentielle est infini. 


Démonstration. L’exponentielle est la série de puissance dont les coefficients sont donnés par la 
suite (ax) = 1/k!. Nous utilisons la formule de Hadamard de la proposition 15.25 : 


n! E 1 
1m = 1m —= 
no (n+1)! n-k 


0. (18.12) 


Donc À = © par la partie de Hadamard qui dit que si on tombe sur 1/R = 0, alors c’est R = 0. 


PROPooWSDKooJREQGk 
Proposition 18.8. 
Pour tout ze © nous avons 
exp(z) = €*. (18.13) 
PropdDjisy 
Proposition 18.9 ([517]). 
Quelques propriétés de l’exponentielle. 
(1) Le fonction exp est continue. ITEMooRLHCoo ITuYKV 
(2) Nous avons la formule e**® = ee” pour tout z,w € C. 
1 — = 
(3) (e7)7 = er ITEMooIFYFooUniukS 


(4) (exp(z))" = exp(nz). 


Démonstration. La proposition 18.7 nous enseigne que le rayon de convergence est infini. La fonc- 
tion ainsi définie est alors continue par la proposition 12.379. 

Les séries exp(z) et exp(w) ayant un rayon de convergence infini, nous pouvons utiliser le 
produit de Cauchy (théorème 15.32) : 


00 CE 
___—— z'w 
és r | > ii | (18.14a) 
n=0 \i+j=n 
2 nm Lopn—i 
) . — (18.14b) 
a Cou De i) 
D 4 À AN : 
= >, = > (r}eur (18.14c) 
n=0 i=0 
= 
=) —(+uw) (18.144) 
n! 
n=0 
= exp(z + w). (18.14e) 
Nous avons utilisé la formule du binôme (proposition 3.43). 
Les autres propriétés énoncées sont des corolaires : 
ee ? = € = 1. (18.15) 


2. Définition 15.12. 
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D'autres propriétés de l’exponentielle sur C, entre autres l’holomorphie, sont données dans le 


théorème 26.105. 
LEMooTDGKooWdpUTD 


Lemme 18.10 ([1]). 
Soient a>0,z2EeCetneZ. Alors 
(a en (18.16) 


Démonstration. Il s’agit d’un calcul utilisant les propositions 18.9(4) et 18.8 : 


Cru (18.17a) 
= exp (zIn(a))" (18.17b) 
= exp (nzIn(a)) (18.17c) 
= e"zn(a) (18.17d) 
= a. (18.17e) 


18.1.3 Formules de trigonométrie 


Le lemme suivant est un premier pas pour le paramétrage du cercle dont nous parlerons dans 
la proposition 18.61(1). 
LEMooHOYZooKQTsXW 
Lemme 18.11. 
Pour tout x € R nous avons : 
(1) ; EQooRVPJoo 
e = cos(x) +isin(x) RÉRES) 


(2) lei] = 1. 


Démonstration. La définition de l’exponentielle sur € est la définition 15.59. Cette définition 
fonctionne parce que € est une algèbre normée, et que © est un C-module vérifiant l’inégalité 
|zz'| < |2]l2/| (en l'occurrence, une égalité). 

Nous remarquons que 4° vaut 1, à, —1, —i. Donc un terme sur deux est imaginaire pur et parmi 
ceux-là, un sur deux est positif. À bien y regarder, les termes imaginaires purs forment la série du 
sinus et ceux réels la série du cosinus. 

Si vous aimez les formules, 


AE) Guy" | S'(—1)" L > 1 = cos(y) + sin(y). (18.19) 


Nous avons utilisé le fait que 527 = (—1}" et i2%+1 = j(—17, 
NORMooX0OVSooEwjecU 
18.12 (Formule d’Euler). 


En posant x = x dans (18.18) nous trouvons la soi-disant géniale formule d’Euler : 
er = 1. (18.20) 


Cette formule fait intervenir les nombres 7, e, —1 et 1. 

En fait non. 

Le nombre e n'intervient pas dans la formule d’Euler. Vous vous souvenez de la définition 
(18.5) ? En fait e* est juste un abus de notation pour exp(z). 

Lorsque x est réel, nous avons la formule exp(x) = e* qui est un théorème tout à fait non 
trivial liant la fonction exponentielle et la fonction puissance. Il n’y a pas de tel résultat pour z 
complexe. Dans le cas de z complexe, la formule exp(z) = e* est juste une définition de la fonction 
puissance dans les complexes. 

Bref, le nombre e n'intervient pas dans la formule d’Euler. 
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CORooWZFIooDTCoRo 
Corolaire 18.13. 
Le complexe conjugué? de e* est ee. 
Démonstration. Vu le lemme 18.11, le complexe conjugué de z = e* est z = cos(x) — isin(r). En 
utilisant (18.6c) nous avons également 


3 = cos(x) — isin(x) = cos(—r) + isin(—x) = e Ÿ#, (18.21) 


LEMooJAWBooJGfZIL 
Lemme 18.14. 


Je, SUBEQSooFSSMooHcYwRc 
Nous avons les formules d’addition d’angles* | à 


b) FRo0"YEMORARONES 
b) FAOOECAUOQRE SE, 
cos(a — b) = cos(a) cos(b) + sin(a) sin(b) FOOENAROOREQ ES 

a — b) = sin(a) cos(b) — cos(a) sin(b). (18.22d) 


cos(a + b) = cos(a) cos(b) — sin(a) sin( 
sin(a + b) = cos(a) sin(b) + sin(a) cos( 
(a) cos( ( 


sin( 
pour tout a, b réels. 


Démonstration. Nous utilisons la formule d’addition dans l’exponentielle, proposition (15.284) et 
la formule (18.18) avant de séparer les parties réelles et imaginaires : 


etat) L eiaeib 2 cos(a) cos(b) — sin(a) sin(b) + i(cos(a) sin(b) + sin(a) cos(b)). (18.23) 


Cela est également égal à 
cos(a + b) +isin(a + b). (18.24) 


En identifiant les parties réelle et imaginaires, nous obtenons les formules (18.22a) et (18.22c) 
annoncées. 

Pour la formule (18.22c), il suffit de se souvenir que sin(—b) = — sin(b) et cos(—b) = cos(b) (ces 
deux égalités sont immédiatement visibles sur les développements en série : l’un a uniquement des 
puissances paires et l’autre impaires) et d'écrire (18.22a) avec —b au lieu de b. 


CORooQZDQooWjMXTF 
Corolaire 18.15. 
Les formules suivantes pour les duplications d’angles s'ensuivent : 
cos(2a) = cos?(a) — sin?(a) (18.25a) 
SUBEQooLRJD 
sin(2a) = 2cos(a)sin(a). ne ASE 
Démonstration. Poser b = a dans les relations du lemme 18.14. 
LEMooPQWWooMdPWUT 


Lemme 18.16. 
Un sous-groupe de (R, +) est soit dense dans R soit de la forme pZ pour un certain réel p Æ 0. 


Démonstration. Soit À, un sous-groupe de (R, +) qui ne soit pas dense. Soit un intervalle ]a, b|[ 
qui n’intersecte pas À (si vous voulez frimer, vous noterez ici que nous utilisons le fait que les 
intervalles ouverts forment une base de la topologie de R). Si d = |b— a], l’ensemble À ne contient 
pas deux éléments séparés par strictement moins de d. Soit p, le plus petit élément strictement 
positif de À; nous avons p > d (parce que 0 € À de toutes façons). 

Puisque À est un groupe, nous avons pZ € À. 

Pour l'inclusion inverse, si x € A est hors de pZ, il existe un y € pZ avec [x — y| < p. Et donc 
le nombre |x — y| est dans À tout en étant plus petit que p. Contradiction. 


3. Définition 1.469. 
4. Rien ne nous empêche de donner ce nom à ces formules, mais seriez-vous capable de définir précisément le mot 
« angle » ? 
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PROPooFRVCooKSgYUM 
Proposition-Définition 18.17 (Périodicité, le nombre 7{518]). 
Plusieurs choses à propos de la périodicité de la fonction cos. 
(1) La fonction cos est périodique ®. ITEMooVPMooBqidZG 


(2) Un nombre T > 0 est une période si et seulement si cos(T) = 1 et sin(T) = 0. 


Nous définissons le nombre x > 0 comme étant la moitié de la période de la fonction cos : 
27 = min{T > 0 tel que cos(x + T) = cos(x), Vr e R}. (18.26) 


Démonstration. Plusieurs étapes. 


(1) La fonction cosinus n’est pas toujours positive Supposons d’abord que cos(x) > 0 
pour tout æ € IR. Dans ce cas, la fonction sin est strictement croissante. Mais les deux 
fonctions sont bornées par 1 du fait de la formule cos?(x) +sin?(x) = 1. La fonction sin étant 
croissante et bornée, elle est convergente vers un réel par la proposition 12.59 : 


Jim sin(x) = (18.27) 


pour un certain { > 0. Avec ça nous avons aussi (pour cause de dérivée) lim,;_,+ sin’(xæ) = 0, 
c’est-à-dire limy_, cos(x) = 0. Mais vu que cos?(x) + sin?(x) = 1, nous en déduisons que 
limy- sin(x) = 1. Mézalor lim,_,, cos’(x) = —1, ce qui veut dire que la fonction cos n’est 
pas bornée. Cela est impossible. Nous en déduisons que cos(x) n’est pas toujours positive. 

(2) Il existe T > 0 tel que cos(T) = 1 et sin(T) = 0 Par ce que nous venons de faire, il existe 
r > 0 tel que cos(r) = 0. Pour cette valeur, nous avons aussi obligatoirement sin(r) = +1. 
Nous avons aussi, en utilisant les formules (18.22), 


cos(2r) = cos?(r) — sin?(r) = —1 (18.28a) 
sin(2r) = 2cos(r)sin(r) = 0. (18.28b) 
et par conséquent 
cos(4r) = cos?(2r) — sin?(2r) = 1 (18.29a) 
sin(4r) = 2cos(2r)sin(2r) = 0. (18.29b) 


Donc T' = 4r fonctionne. 

(3) Si T est une période Nous entrons dans le vif de la preuve. Soit un T > 0 tel que cos(x + 
T) = cos(x) pour tout x € R. Avec la formule d’addition d'angle dans le cosinus nous 
cherchons un T' tel que 


cos(x + T) = cos(x) cos(T') — sin(x) sin(T) = cos(x) (18.30) 


et donc tel que | | EQooELSA0o ee 
cos(æ)(cos(T) — 1) = sin(x) sin(T). US 10) 


Nous dérivons cette équation : 


— sin(æ)( cos(T') — 1) = cos(r)sin(T). ÉROOCECFOo pete 


Nous multiplions chacune des deux équations (18.31) et (18.32) par sin(x) et cos(x) pour 
obtenir les quatre relations suivantes : 


. — 1) —-sin(x) cos(x) sin(T) = 0 FPE UERRE SE) 

— sin(æ) cos(æ)( cos(T) — 1) — cos?(x)sin(T') = 0 dde dE SE) 

sin(x) cos(x)( cos(T) — 1) — sin?(x) sin(T) = 0 Ce GE 

— sin*(x)( cos(T) — 1) — sin(x) cos(x) sin(T) = 0 ARNO REP EN SSE 
Le 


En faisant (18.33a) moins (18.33d) nous trouvons cos(T') = 1. Et en sommant (18.33b) avec 
(18.33c) nous avons — sin(T) = 0. 


5. Définition 12.185. 
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(4) Si T > 0 est tel que sin(T) = 0 et cos(T) = 1 Alors les formules d’addition d'angle du 
lemme 18.14 donnent tout de suite 


cos(x + T) = cos(x). (18.34) 


À ce niveau nous croyons avoir prouvé que cos était périodique et que la période est donnée 
par 
min{T > 0 tel que sin(T) = 0,cos(T) = 1}. (18.35) 


Or rien n’est moins sûr parce qu'il pourrait arriver que ce minimum n'existe pas, c’est-à-dire que 
linfimum soit zéro. Autrement dit, il peut arriver que l’ensemble des périodes soit dense. Plus 
précisément, soit P € R l’ensemble des périodes de cos. C’est un sous-groupe de (MR, +) et le 
lemme 18.16 nous dit que P est soit dense dans KR, soit de la forme pZ pour un p > 0. 
Si P est dense, soient { € R et une suite ({;) dans P telle que {» — t. Pour tout x et tout n 
nous avons 
COS(T + fn) = cos(x), (18.36) 


Comme la fonction cosinus est continue, nous pouvons passer à la limite et écrire cos(x+t) = cos(x). 
Cela étant valable pour tout x et pour tout t, la fonction cosinus est constante. Or nous savons 
que ce n’est pas le cas, donc P n’est pas dense. Donc cosinus est périodique. 


PROPooKNLAooLwQHea 
Proposition 18.18. 
La fonction sin est périodique de période 27 et 
27 = min{T > 0 tel que sin(T) = 0, cos(T) = 1}. (18.37) 
Démonstration. La proposition 18.17 dit que cos est périodique. Puisque sin = — cos’ par le lemme 


18.3, la fonction sin est également périodique par le lemme 12.187. Si Test une période de cos, 
alors Test une période de sin. 

Mais sin’ — cos, de telle sorte que les périodes de sin sont périodes de cos. Bref, T est une 
période de sin si et seulement si Test une période de cos. 


18.19. 
Notons que tout ceci ne nous donne pas la plus petite indication d’ordre de grandeur de la valeur 


de 7. Cela peut encore être 0.1 autant que 500. 
PROPooMWMDooJYIlis 


Proposition 18.20 ([518, 1]). 
Des propriétés à la chaine à propos des sinus, cosinus et de leurs périodes. :reMooRJZHoocXcKmM 


(1) Nous avons 


27 = min{x > 0 tel que cos(x) = 1,sin(x) = 0}. (18.38) 
ITEMooTNHMooUt0jNC 
2) Les fonctions sin et cos sont périodiques de période 27. 
ITEMooSPZBoo!IQLUXh 
(3) Nous avons cos(r) = —1 et sin(r) = 0. 
(4) Pour tout a € R nous avons 
cos(a + T) = — cos(a) (18.39a) 
sin(a +7) = —sin(a). (18.39b) 
ITEMooHDQNooYHVCkg 
(5) Nous avons 
rm = min{x > 0 tel que cos(x) = —1,sin(x) = 0}. (18.40) 
ITEMooWFNUooYAybDB 
(6) M PHÉEASGCBTIP OS venn 
cos(r/2) = 0 (18.41a) 
sin(r/2) = 1. (18.41b) 
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EQSooRJZGooCFVqbz 
(7) Nous avons les formules | : # 


cos(x + 7/2) = —sin(x) 
sin(x + 7/2) = cos(x) 
pour tout x € R. 


(8) Nous avons 
5 = min{x > 0 tel que sin(x) = 1,cos(x) = 0}. 


(9) Nous avons les valeurs 


(10) Nous avons 
: = min{x > 0 tel que cos(x) = 0}. 


(11) Pour tout x € ]0, 5[, nous avons cos(x) > 0 et sin(x) > 0. 


Démonstration. C’est parti. 


ITEMooIRALooBMGOXP 


(18.42a) 
(18.42b) 


ITEMooMQQPooGwOdbt 


(18.43) 


(18.44a) 


(18.44b) 
ITEMooQKPKooEPeHER 


(18.45) 
ITEMooMEXUooGfSInJ 


(1) Le fond de la proposition 18.17 est que toutes les périodes T > 0 vérifient cos(T) = 1 et 


sin(T) = 0. La définition de 2r est que c’est la plus petite période. 


(2) En utilisant le fait que l’une est la dérivée de l’autre, si T est une période de cos nous avons 


sin(x + T) = —cos'(r +T) 
lim cos(x + T'+e) — cos(x +T) 
e—0 € 
: lim cos(x + €) — cos(x) 
e— € 


= — cos’(x) 


= sin(x). 


(18.46a) 
(18.46b) 


(18.46c) 


(18.464) 
(18.46e) 


Nous déduisons que toute période de cos est une période de sin. De la même façon, nous 


pouvons prouver l’autre sens : toute période de sin est une période de cos. 


(3) D'un côté nous avons 
cos(2r) = cos?(x) — sin?(r) = 1 


(18.47) 


parce que cos(27) = cos(0) = 1. Puisque cos(r) et sin(r) sont bornés par —1 et 1, nous 


devons avoir sin(r) = 0 et cos(r) = +1. 


Mais d’un autre côté, le nombre 27 est le plus petit T vérifiant cos(T) = 1, sin(T) = 0. Donc, 


avoir cos(T) = 1 n’est pas possible. Nous concluons 


cos(r) = —1 


sin(r) = 0. 


(18.48a) 
(18.48b) 


(4) Il s’agit d'utiliser les formules d’addition d’angles du lemme 18.14 pour calculer cos(a + 7) 


et sin(a + x) en tenant compte du fait que cos(r) = —1 et sin(r) = 0. 
(5) Soit a € ]0,7| tel que cos(a) = —1 et sin(a) = 0. Alors nous avons 
cos(a + T) = —cos(r) = 1 
sin(a + x) = —sin(r) = 0, 


(18.49a) 
(18.49b) 


ce qui donnerait a + x € [x,27| dont le cosinus est 1 et le sinus est zéro. Mais nous savons 


déjà que 27 est le minimum pour cette propriété. 
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(6) 
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Nous avons 
—1 = cos(r) = cos?(r/2) — sin?(r/2), (18.50) 


donc cos(r/2) = 0 et sin?(r/2) = 1, ce qui donne sin(r/2) = +1. 

Nous devons départager le +. Pour cela nous savons que sin/(0) = cos(0) = 1 et que sin(0) = 
0, donc il existe € > 0 tel que pour tout x € ]0, €] nous avons 0 < cos(x) < 1 et 0 < sin(x) < 1 
(nous avons aussi utilisé le lien entre dérivation et croissance de la proposition 12.188). Nous 
choisissons € plus petit que 7/2. 


Supposons que sin(r/2) = —1. Le théorème des valeurs intermédiaires 10.89 dit qu’il existe 
xo € Je, x/2] tel que sin(xo) = 0. Pour cette valeur de x9 nous devons aussi avoir cos(x0) = +1. 
Mais puisque 27 est minimum pour avoir cos = 1 et sin = 0, nous devons avoir cos(x9) = —1. 


Âlors nous avons aussi 


cos(xo + 7) = cos(xo) cos(r) — sin(xo) sin(r) = — cos(xo) = 1 (18.51a) 
sin(to + x) = cos(xo)sin(T) + sin(xo) cos(r) = sin(xo) = 0. (18.51b) 


Encore une fois par minimalité de 2T, cela ne va pas. Conclusion : sin(r/2) = 1. 


Il s’agit encore d'utiliser les formules d’addition d’angle en tenant compte des valeurs remar- 
quables cos(r/2) = 0 et sin(r/2) = 1. 


Supposons x0 € |0,x/2[ tel que sin(xo) = 1 et cos(xo) = 0. En utilisant les formules (18.42) 
nous avons 

cos(xo + 7/2) = —1 (18.52a) 

sin(xo + 7/2) = 0, (18.52b) 


avec xp + 7/2 < x. Cela contredirait la minimalité de 7. 


Il s’agit d'utiliser les formules (18.42) : 


3 
cos() = cos(r + 7/2) = —sin(r) = 0 (18.53a) 
3 
sin(T) = sin(r + 7/2) = cos(r) = —-1. (18.53b) 
Si cos(xo) = 0 alors sin(xo) = —1 (parce que sin(xo) = 1 est déjà exclu). Alors cos(x0+7/2) = 


1 et sin(xo + x/2) = 0, ce qui est également impossible. 

La fonction cosinus est continue (proposition 18.1) et cos(0) = 1. Le théorème des valeurs 
intermédiaires implique que si cos(x) < 0, alors il existe t{ € ]0, x] avec cos(x) = 0. Cela n’est 
pas possible pour x < 7/2, par le point (8). 

Le cosinus est positif sur l'intervalle considéré et sin’(x) = cos(x). Donc sin(0) = 0 et la 
dérivée est positive. La proposition 12.188 conclut que sin est strictement croissante et donc, 
strictement positive. 


LEMooFESYooBoïiuol 

Lemme 18.21 (Positivité[1]). 

À propos de positivité de la fonction cosinus. ITEMoo IXSDooJyCQyb 
(1) cos(0) — ITEMooWJEVooGZykbO 
(2) cos(x) > 0 pour x € [0,x/21. ITEMooANEPooLGmYtc 
(3) cos(x/2) = ITEMooRDWJooZXWy£v 
(4) cos(x) < 0 pour x e ]r/2,37/2| ITEMooFKPAooBN1vPU 
(5) cos(3/2) — 0. ITEMooIDZGooBTDvDF 
(6) cos(x) > 0 pour x € |3x/2,27|. 
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Démonstration. En plusieurs points. 
(1) Pour (1) C'est déjà fait dans le lemme 18.2. 
(2) Pour (2) C'est la proposition 18.20(11). 
(3) Pour (3) C’est la proposition 18.20(6). 
(4) 


4) Pas d’annulation entre 7/2 et x Nous montrons à présent que cos ne s’annule pas entre 


7/2 et x. Supposons que cos(T + s) = 0 avec s € ]0,7/2[. Comme cos(x)? + sin(x)? = 1 
(lemme 18.4), nous avons 


cos(r +s)=0 (18.54a) 
sin(> +s)=é (18.54b) 


avec € = +1. Utilisant trois fois la proposition 18.20(7) nous trouvons 
3T . 
cos(x + rs = sin(x) (18.55a) 
3 
sin(x + ) = — cos(x) (18.55b) 


pour tout +. Nous appliquons cela à x = 7% + s, en nous souvenant que cos(x + 27) = cos(x) 
et sin(x + 27) = sin(x) (par 18.20(2)) : 


3 
cos(s) — cos(s +s+ 7) = sin(> +s)=e (18.56) 
et . 
sin(s) = sin(— +s+ 7) cos(> +s) = 0. (18.57) 
Sie= 1, nous avons une contradiction avec 18.20(1). Si e = —1, nous avons une contradiction 


avec 18.20(5). 
Donc cos(x) # 0 pour ze 15,7]. 
cos(x) < 0 sur ]x/2,7] Nous savons que cos(T) = —1 (18.20(3)). Étant donné que la fonc- 


tion cos est continue et qu’elle ne s’annule pas sur |r/2,7|, nous en déduisons qu’elle y est 
partout strictement négative. 


7 
[SLI 
nr 


Pour (4), (5), (6) Ilest directement visible sur le développement de définition que cos(—x) = 
cos(x). Et comme cos(x + 27) = cos(x), nous avons 


ns 
(e» 
nr 


Cos(T + s) = cos(—7 — s) = cos(r — 5). (18.58) 


Donc toutes les valeurs (et tous les signes) de cos(x) sur [r, 27] peuvent être déduits de ceux 


sur [0,x|. 
LEMooPARBooTXbbiB 
Lemme 18.22. 
Soient x,y € R. 
(1) Nous avons cos(x) = cos(y) si et seulement si 
y € {x + 2kT}kez L {—x + 2kr}rez. (18.59) 


(2) Nous avons sin(x) = sin(y) si et seulement si 


y € {x + 2km}gez L {—x + (2k + 1)r}rez. (18.60) 
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PROPooZULQooBKWrcv 
- prono SUBEQSo0IHUGooAUchjn 
Les nombres x,y € R vérifient | : 
cos(x) = cos(y) (18.61a) 
sin(x) = sin(y) (18.61b) 


si et seulement si il existe k € Z tel que y = x + 2kr. 


Démonstration. En deux parties. 


(1) = Siy= x+72kr, le résultat est correct parce que la proposition 18.20(2) dit que sin et 
cos sont périodiques de période 27. 

(2) = Supposons que x > y. Nous calculons sin(x — y) et cos(x — y) en utilisant les formules 
du lemme 18.14 et en tenant compte de (18.61). Cela donne cos(x — y) = 1 et sin(x — y) = 0. 
La proposition 18.17(2) dit alors que x — y est une période de la fonction cos. 


Or la période de cos est 27 (proposition 18.20(2)). Donc toutes les périodes de cos sont les 
2k7 avec k € IN (lemme 12.186). 


CORooTFMAooHDRrqi 
Corolaire 18.24. 
Des nombres x, y € R vérifient e"* = e"* si et seulement si il existe k € Z tel que y = x + 2kn. 


Démonstration. Le lemme 18.11 donne e® = cos(x) + isin(r). Donc l'équation e = e“ revient 
au système (18.61) dont les solutions sont bien y = x + 2kr. 


LEMooBIPFooQNiTqz 
Lemme 18.25 ([1]). 
À propos de croissance et décroissance des fonctions trigonométriques. 
(1) Sur ]0,7{, la fonction cos est décroissante. 
(2) Sur |-—-T,0[, la fonction cos est croissante. 
Démonstration. Nous savons que cos’ = — sin par le lemme 18.3. La liaison entre dérivée et crois- 


sance est la proposition 12.188. Les signes de la fonction cosinus sont dans le lemme 18.21. Les 
signes de la fonction sinus peuvent être déduits de la proposition 18.20(7). 
Vous avez tout en main. 


Tout cela nous permet de calculer quelques valeurs remarquables de cosinus et sinus aïnsi que 
d'écrire le tableau de variations de sinus et cosinus. 


LEMooIGNPooPEctJy 
Lemme 18.26. 
Nous avons les valeurs remarquables 
2 
sin(T) = cos() _ . (18.62) 
Démonstration. La relation (18.25b) donne 
0 = cos(n/2) = cos?(x/4) — sin?(r/4). (18.63) 


Donc cos?(r/4) = sin?(r/4). Mais puisque sin(r/4) et cos(r/4) sont positifs, ils sont égaux. 
Nous avons aussi sin?(r/4) + cos?(r/4) = 1. Donc le nombre x = cos(r/4) = sin(r/4) vérifie 


l'équation 2x? = 1, dont l’unique solution positive est x = 7 = 
LEMooRMHAooDEAPMw 

Lemme 18.27. 

Nous avons la valeur remarquable 


cos(—) = = (18.64) 
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Démonstration. Il faut utiliser la formule (18.22a) avec cos(r) = cos(27/3 + x/3) en sachant 
que cos(r) = —1. Ensuite cos(27/3) = cos(r/3 + x/3). En décomposant ainsi, nous exprimons 
—1 = cos(r) en termes de cos(r/3) et de sin(r/3). En substituant sin?(7/3) = 1 — cos?(r/3) nous 
trouvons que le nombre cos(r/3) vérifie l'équation 


4x — 3x +1=0. (18.65) 


Croyez-le ou non, les solutions de cette équation sont x = —1 et x = 1/2. Allez. Faisons comme si 
nous le savions pas. En tout cas, ces deux nombres sont des solutions, et nous avons la factorisation © 


Ag — 3x + 1 = (2x — 1)*(x + 1). (18.66) 


Donc 1/2 est de multiplicité 2 et —1 de multiplicité 1. Le théorème 3.127 nous dit qu’il n’y a alors 
pas d’autres racines que ces deux-là”. 

Nous en déduisons que la valeur de cos(r/3) est soit 1/2 soit —1. La proposition 18.20(5) nous 
dit qu'il est impossible que cos(r/3) soit égal à —1 parce que 7/3 < 7. Donc cos(r/3) = 1/2 comme 
annoncé. 


Remarque 18.28. 
Vous avez déjà sans doute vu la démonstration de cos(30°) = 1/2 à partir de la figure 18.4. Il n’est 
pas possible de l’utiliser parce que cela n’est en réalité pas loin d’être la définition de l’angle entre 
deux droites. 
Si vous voulez savoir la définition de l’angle entre deux droites, il faut passer par la défini- 
tion 18.152, laquelle se base sur le lemme 18.136 qui, elle-même, se base sur la proposition 18.58. 
Bref, à notre niveau, nous sommes encore loin de pouvoir faire des raisonnements trigonomé- 


triques sur base de géométrie dans les triangles. 
PROPooJFAGooYjRJcb 


Proposition 18.29. 
Pour tout x € [0,x/4[ nous avons cos(x) > sin(x). 


Démonstration. Nous posons f(x) = cos(x) —sin(x). Elle vérifie f(0) = 1. En utilisant les dérivées 
du lemme 18.3, nous trouvons 


J'(æ) = —(sin(x) + cos(x)). (18.67) 


Mais sur |0,7/2[ nous avons cos(x) > 0 et sin(x) > 0 (proposition 18.20(11)). Donc f est stric- 
tement décroissante. Elle ne peut donc passer qu’une seule fois par zéro. Le lemme 18.26 nous 
indique que f(r/4) = 0. Donc f(x) > 0 sur [0,x/A. 


PROPooIBYEooC1Qttq 
Proposition 18.30. 
Quelques valeurs trigonométriques. 
(1) Pour le sinus : (2c) cos(r/4) = 42/2 
(1a) sin(0) = 0 (2d) cos(x/3) = 1/2 
(1b) sin(x/6) = 1/2 (2e) cos(x/2) = 0 
(ic) sin(x/4) = V2/2 (3) Pour la tangente : 


(id) sin(x/3) = V3/2 (3a) tan(0) = 0 
(1e) sin(r/2) = 1 (3b) tan(r/6) = V3/3 


( 
(2) Pour le cosinus : (8c) tan(r/4) = 1 
(2a) cos(0) = 1 (3d) tan(r/3) = V3 
(2b) cos(x/6) = V3/2 (3e) tan(r/2) est non défini. 


Démonstration. Plusieurs ont déjà été faites. Les autres ne seront pas démontrées dans l’ordre 
énoncé. 


6. Factorisation d’un polynôme en sachant des racines, proposition 3.120. 
7. Nous attirons votre attention sur le fait que cela n’est en aucun cas une trivialité. 
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TS 
en 

— 
tn 


in(0) =0 Substitution dans la définition (18.2). 
= 42/2 C'est le lemme 18.26. 


1/V2 Nous utilisons la formule sin?(x) + cos?(x) — 1 avec x = r/3. Vu que 
1/2 (lemme 18.27), cela donne sin?(r/3) = 3/4. Nous en déduisons que sin(r/3) 


Il 


La proposition 18.20(5) nous dit que sin est positive sur [0,7]. Donc c’est bien la possibilité 
43/2 qui est la bonne. 


(4) sin(x/6) = 1/2 et cos(x/6) = 3/2 Nous partons de l'équation (18.25b) pour écrire 


sin(r/3) = 2cos(r/6)sin(r/6). (18.68) 


Nous avons déjà vu que sin(r/3) = 43/2. En posant x = sin(r/6) nous avons également 
cos(r/6) = V1 — x? parce que nous savons que la fonction cosinus est positive sur [0, 7/2] 
(proposition 18.20(11)). Nous avons donc l’équation 


3 
” = 2x1 — x. (18.69) 
Nous passons au carré et posons y = x?. Après quelque manipulations, 
16y? — 16y + 3 = 0. (18.70) 


Cela donne deux possibilités pour y : : et 1. Puisque x > 0, nous pouvons simplement passer 
à la racine carrée : x = 3/2 ou x = 1/2. 

Notez que si nous avion posé x = cos(r/6) au lieu de x = sin(r/6), nous aurions obtenu le 
même résultat. Donc sin(r/6) et cos(r/6) peuvent tous deux avoir les valeurs 3/2 ou 1/2. 
Cela fait 4 possibilités. 


Étant donné que sin?(x/6) + cos?(r/6) = 1, les deux possibilités avec sin(n/6) = cos(r/6) 
sont exclues. 

La proposition 18.29 nous dit aussi que cos(r/6) > sin(r/6). Donc cos(r/6) = 43/2 et 
sin(r/6) = 1/2. 

(5) sin(r/2) = 1 C’est dans (18.41). 

(6) cos(0) = 1 Substitution dans la définition. 

(7) cos(r/6) = V3/2 Déjà fait avec le sinus de +/6. 

(8) cos(rn/4) = 12/2 Lemme 18.26. 

(9) cos(r/3) = 1/2 Lemme 18.27. 

(10) cos(r/2) = 0 Dans (18.41). 

Toutes les valeurs pour la tangente s’obtiennent maintenant par la définition, en calculant tan(x) = 


sin(x) 
cos(x) * 


5) 


Voici un tableau qui rappelle les valeurs à retenir pour les fonctions sinus, cosinus et tangente. 


x |sin(x) | cos(x) | tan(x) 
0 0 1 0 
ñ/6| 1/2 | V3/2 | V3/3 PGooIMQFoo 
ral 22 | V22 | 1 (SA) 
r/3 | V3/2 | 1/2 V3 
r/2| 1 0 | ND. 


où & N.D. » signifie « non défini ». 
Rappelons le graphe de la fonction sinus : 
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celui de la fonction cosinus : 


developcosenpisur3 
Exemple 18.31. 
Développer la fonction cos autour de x = %. Utiliser la valeur remarquable du lemme 18.27. Nous 
développons autour de h = 0 la fonction cos(? + h) : 
1. V4, T 


h h2. 18.72 
> 3 4 ( 


T T T h> T 
cos e + h) < cos ee) + hcos(.) LE cos” (=) = 


Il est aussi possible d'écrire cela en notant x = x + h, c’est-à-dire en remplaçant À par x — 3 : 


3 1 
cos(æ) + VS (7 +) " . (18.73) 
PA 
18.32. 
Voici un petit dessin pour donner une idée. 
À 
\ 3 il i 
(1) En noir le graphe de cos(x). 
(2) En rouge, le développement de cos(x) à l’ordre 4 autour de x = 0. 
(3) En bleu, le développement de cos(x) à l’ordre 4 autour de x = 37/4. 
18.2 Trucs et astuces de calcul d’intégrales 
SECooKSOFooEVKDLh 


Afin d’alléger le texte de calculs parfois un peu longs, nous regroupons ici les intégrales à une 
variable. 
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18.2.1 Quelques intégrales « usuelles » 


Itemintegrali 
(1) L'intégrale 
x? 1 
= |rbts)de 7 (n(x) — 2) (18.74) 
se fait par partie en posant 
unix), du rdx 
2 (18.75) 
du = : dr, v—= _ 
2 
et ensuite : : 
T T ZX 1 
I =In(x) 5 [5 ; (n(x) a): (18.76) 
(2) L'intégrale 
2 
1 frntar = x? In(x) — _. (18.77) 


En utilisant le fait que In(u?) = 21n(u), nous retombons sur une intégrale du type (1) : 
9 x 
I = x" In(x) — ra (18.78) 


(3) L'intégrale 


2 


1 
I = frna + x?)dx = a fe +151) JarrucIntxlrseapun 


se traite en posant v = 1 + x? de telle sorte à avoir dx = L et donc 


1 l 
=. ns? 20 lee . (18.80) 
(4) L'intégrale 
1 
1 [E0 sin(0) In (: + a) d0 (18.81) 
demande le changement de variable u = cos(0), d0 = — Nous tombons sur l'intégrale 
1 2 
1 fun( — ) = fun +) + fut), (18.82) 
qui sont deux intégrales déjà faites. Nous trouvons 
1 in2(0) —1 1 
F= >: Im (Ee : :) sin?(0) — In (sin?(9) — 2) + ; In (sin?(0) — 1) (18.83) 
(5) L'intégrale 
r$ r? 1 
dr = In(r? +1). 18.84 
fi no ri on 


commence par faire la division euclidienne de r° par r? + 1; ce que nous trouvons est r° — 
(r2 + 1)r — r. Il reste à intégrer 


[rer fre Es (18.85) 
DT JT Dr ‘ 


La fonction dans la seconde intégrale est == = 270 où f(r) = 1+7r2, et donc | 
Jin(1 +r?). Au final, 


” 
1+r 


1 
or In(r? + 1). (18.86) 
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(6) L'intégrale 


I = J cost) sin(0)d0 = _” FATEUG IN ERECE 


se traite par le changement de variable w = sin(@), du = cos(0)d, et donc 


u? sin? 
J cos sin(0)d0 = [udu nu ac (18.88) 


(7) L'intégrale 


1 
[v 1+ dx = LV1+a2+ 5 arcsinh(x) FaTrucs Intsqr tue 


2 


s'obtient en effectuant le changement de variable w = sinh(é). 


(8) L'intégrale 


J oos#(x) das . : _— sArne eco re nes 


s’obtient à coups de formules de trigonométrie. D'abord, la formule (18.25b) permet de récrire 
la fonction à intégrer sous la forme 


f(x) = —sin?(x). (18.91) 


Ensuite nous utilisons le fait que sin?({) — (1 — cos(2t))/2 pour transformer la formule à 
intégrer en 
_ 1 —cos(4r) 


f(æ) = - (18.92) 
Cela s’intègre facilement en posant u = 4x, et le résultat est 
x sin(4x) 
dx = — — : 18.93 
[rar = 5 (18.93) 
(9) La fonction 
sinc(x) = se (18.94) 
x 


est le sinus cardinal de x. Nous allons montrer que 


[ |sinc(x)|dx = 00 | Far TES) 


D'abord nous avons 


nT : t nT : t 
| OP | ÉOlS (18.96) 
( ( 
mais par périodicité, 
nT T 
| |sin(t)|dt = Î sin(t)dt = 2. (18.97) 
0 
Par conséquent 


[ : | sinc(t)|dt > = >, =. (18.98) 


ce qui diverge lorsque n — 0. 
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(10) Les intégrales, pour € > 0, 


O0 
Î ct de € SARoNeN Tan Es 


0 k2+e2 


et 


00 


kx) 
sin(kx)e dx = : D ALU) 


0 k2+e 


se calculent deux fois par partie. Nous posons 


(0e) 
I -| cos(kx)e “dx (18.101a) 
J = Î sin(kr)e “dx. (18.101b) 
0 


L'intégrale J s'effectue par partie en posant u = cos(kx) et v = e*. Un peu de calcul 
montre que 


l 
Re, (18.102) 
€ € 


Par ailleurs l'intégrale J se fait également par partie pour obtenir 


k 
Le (18.103) 
€ 
En résolvant pour 1 et J les deux équations déduites, nous trouvons 


€ 


k 


18.2.2 Reformer un carré au dénominateur 
subsecCarreDenoPar 


Lorsqu'on à un second degré au dénominateur, le bon plan est de reformer un carré parfait. 
Par exemple : 
2? +9x+2=(x+1) +1. (18.105) 


Ensuite, le changement de variable t = x + 1 est pratique parce que cela donne t? + 1 au dénomi- 
nateur. 


Cherchons 


1x 1x 1—(t—1) 
. En Re Î +1 (106) 


où nous avons fait le changement de variable t = x + 1, dt = dx. L'intégrale se coupe maintenant 


en deux parties : 
—t 2 
Fee : 18.107 
J 2+1 ù J 2+1 ( 


La seconde est dans les formulaires et vaut 


2arctan(t) = 2arctan(x + 1), (18.108) 


tandis que la première est presque de la forme f’/f : 


AT OT > 
li dE Sn +1) =; Im(u +2u +2). (18.109) 


18.2.3 Décomposition en fractions simples 


La décomposition en fractions simples décrite en 19.1.3 permet d'intégrer des fractions ration- 
nelles. Elle peut parfois être évitée par la méthode de Rothstein-Trager que nous expliquerons dans 
20.15.83. 
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18.3 Très modeste approximation de 7 


Nous sommes en droit de vouloir une valeur approchée de 7. 
LEMooJWSGooExmtDA 


Lemme 18.35. 


Nous avons l’encadrement 
2V2 < 7 <1. (18.110) 


Démonstration. Grace au lemme 18.26 nous savons que la fonction sin passe de 0 à 42/2 sur un 
intervalle de taille r/4 avec une dérivée majorée par 1. Par conséquent 


2 
5 > 2 (18.111) 
et donc 
r > 2V2 = 2.82 (18.112) 


De plus la fonction sin passe de 0 à 42/2 sur un intervalle de taille x/4 avec une dérivée minorée 


par 2/2, donc 
r _ V2/2 


4 pp: (18.113) 


ce qui donne 
Tr <A. (18.114) 


Pour avoir une meilleur approximation de 7, nous pouvons remarquer que 7 € |2.82,4{, et 
que cet intervalle est suffisamment petit pour ne pas recouvrir l'intervalle correspondant pour 27. 
L'équation cos(x) = —1 possède donc une unique solution dans cet intervalle (et cette solution est 
x). Nous pouvons donc faire une dichotomie pour trouver la valeur de 7, pourvu que nous ayons 


une façon d'évaluer des valeurs de cos(x) de façon pas trop ridicule. 
LEMooIECUooQ0OGYyN 


Lemme 18.34. 
Pour toute valeur de x ER on a |sin(x)| < |x|. 


Démonstration. Nous commençons par les valeurs + > 0. Considérons la fonction 
f(x) = x —-sin(x). (18.115) 


La dérivée de f vaut 
f'(æx) = 1 — cos(x) > 0, (18.116) 
De plus f(0) = 0. Vu que f est croissante, nous avons f(x) > 0 pour tout x > 0. 


(1) Pour 0<zx<r Nous avons [x] = x et |sin(x)| = sin(x), et ce que nous venons de dire à 
propos de f suffit pour conclure. 


(2) Pour x >7 En utilisant l’approximation de r du lemme 18.33, nous avons x > 22 > 2 


et donc” 
[xl — |sin(x)| > 2-1=1>0. (18.117) 
(3) Pour x <0 Si x < 0, ce que nous venons de faire nous assure que sin(—x) < —x. Par 
ailleurs, nous savons déjà par (18.6c) que sin(—x) = — sin(x). Nous avons donc 
[sin(x)| = sin(—-x) < —x = ||. (18.118) 


8. Sérieusement, êtes vous capables de trouver une approximation de 42 en ne vous basant que sur des choses 
vues jusqu'ici ? 
9. Ouais; l’approximation 7 > 2 nous suffit. On est large. 
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18.3.1 Les fonctions tangente et arc tangente 


Définition 18.35. 
La fonction tangente est : 


tan(x) = | (18.119) 


où sin et cos sont de la définition 18.1. 


La fonction tangente n’est pas définie sur les points de la forme x = 7% + kr, k € Z. Une 
interprétation géométrique, qui justifie le nom, est donnée sur la figure 18.1. 


FIGURE 18.1: Interprétation géométrique de la fonction tangente. La tangente de l’angle 0 est 
positive (et un peu plus grande que 1) tandis que celle de la tangente da Laueie SrRtruégrtifono 


LEMooYAMFooXCLXfr 
Lemme 18.36. 
La dérivée de la fonction tangente vaut 


tan/(x) = tan?(x) +1, (18.120) 


Démonstration. Il suffit de suivre les règles de calcul comme la dérivation du quotient 12.174(5). 


Proposition 18.37. 
La fonction 


(18.121) 


est une bijection. 


Démonstration. Le cosinus ne s’annulant pas sur l’intervalle donné, la fonction est bien définie. 
Nous avons 


lim tan(x) = +00 (18.122) 
æ—7/2— 

parce que la limite du sinus est 1 est celle du cosinus est zéro par les valeurs positives. Le même 
raisonnement donne la limite en —/2 qui vaut —00. Le théorème des valeurs intermédiaires !° dit 

que la fonction tangente est alors surjective sur IR. 
Par ailleurs le lemme 18.36 nous donne la dérivée de la tangente sous la forme tan’(x) — 
tan?(x) + 1, ce qui nous donne une dérivée partout strictement positive, et donc une fonction 
strictement croissante et donc injective. 
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3 
RICO 
3 

3 
NICOt 


FIGURE 18.2: Le graphe de la fonction tangente.  LabelFigPVJooJDyNAg 


Le graphe de la fonction tangente est sur la figure 18.2. 
En ce qui concerne la bijection réciproque nous avons le théorème suivant. 


THOooUSVGooUAnCvC 
Théorème 18.38. 
La fonction inverse de la tangente, 
TT 
arctan: R — | | 
22 (18.123) 
æt arctan(x) 
nommée arc tangente est 
(1) impaire et strictement croissante sur R. ITEMooMNELooOVHITb 
(2) dérivable sur R de dérivée 
1 EQooGCHG W 
arctan’(x) : + FR TDA | 


| 1+æ 


Démonstration. Il est immédiatement visible sur son développement de définition (18.2) que la 
fonction sinus est impaire. Une vérification similaire montre que la fonction cosinus est paire. La 
fonction tangente est alors impaire et sa réciproque l’est tout autant. 

La fonction arc tangente est également dérivable (donc continue) par la proposition 12.180 parce 
que la fonction tangente l’est. Notons qu'ici nous nous sommes restreint à ]—7/2,7/2[. Sinon, le 
résultat est faux. 

La formule proposée pour la dérivée provient également de la proposition 12.180 et de la dérivée 
de la tangente du lemme 18.36. 


LEMooHRDCooGtnyeQ 
Lemme 18.39. 
Nous avons les limites 
(1) limy_,0 arctan(x) = 7, 
(2) limy-_ arctan(x) = —5. 
LEMooHJEKooARZMi1l 
Lemme 18.40. 


L'application arctan: IR — ]-+/2,7/2[ est un homéomorphisme !. 


10. Théorème 10.89. 
11. Bijection continue, inversion continu définition 7.37. 
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Exemple 18.41. 
Un homéomorphisme 6: IR — |—1,1[ est donné par exemple par la fonction @(t) = 2 arctan(t) 
dont le graphique est donné ci-dessous : 


A 
LEMooJKIUooEMMOrs 
Lemme 18.42. 
Nous avons la valeur remarquable 
T 
arctan(1/V3) = G- (18.125) 
Le nombre arctan(x) se calcule en cherchant l’angle 9 € [—5,5] dont la tangente vaut xo. 
Nous obtenons le tableau de valeurs suivant : 
LEMooPQNCooDKkEUyw 
Lemme 18.43. 
Quelques valeurs remarquables de l’arc tangente : 
z 0[L ) 1|4V3 
V3 V (18.126) 
arctan(z) |0| ? [7] à 


En ce qui concerne la représentation graphique de la fonction x + arctan(x), elle s’obtient « en 
retournant » la partie entre —5 et 3 du graphique de la fonction tangente : 


18.3.2 La fonction arc sinus 


Nous voulons étudier la fonction 
sin: R — [-1,1] 


xt sin(x) 


(18.127) 


et sa réciproque éventuelle. 

La fonction sinus est continue sur IR mais n’est pas bijective : elle prend une infinité de fois 
chaque valeur de J = [—-1,1]. Pour définir une bijection réciproque de la fonction sinus en utilisant 
le théorème 12.54, nous devons donc choisir un intervalle à partir duquel la fonction sinus est 
monotone. Nous choisissons l'intervalle 


TT 
T=[-—,—|. 18.128 
Bu (18.128) 
La fonction 
sin: [——,—|—[-1,1 
(18.129) 
xt sin(x) 


est une bijection croissante et continue. Nous avons donc le résultat suivant. 
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Théorème 18.44 (Définition et propriétés de arc sinus). 
Nous nommons arc sinus la bijection inverse de la fonction sin: 1 — J. La fonction 


IE (18.130) 


xt arcsin(x) 


T A 


arcsin: [—1,1] — | 


ainsi définie est 
(1) continue et strictement croissante ; 


(2) impaire : pour tout x € [—1,1] nous avons arcsin(—x) = — arcsin(x). 


Démonstration. Nous prouvons le fait que arcsin est impaire. Un élément de l’ensemble de défi- 
nition de arcsin est de la forme y = sin(x) avec x € [—7/2, 7/2]. La relation (12.108) s'écrit dans 


notre cas 
EqVUWooUwVxV 
x = arcsin (sin(x)). ALES) 


Nous écrivons d’une part cette équation avec —x au lieu de x : 
—x = arcsin (sin(—x)) = arcsin ( — sin(x)) = arcsin(—y); FaRL TOYS 
et d’autre part nous multiplions (18.131) par —1 : 
—x = — arcsin (sin(x)) = — arcsin(y). FaTGTopDeR Ep, 
En égalisant les valeurs (18.132) et (18.133) nous trouvons 


arcsin(—y) = — arcsin(y), (18.134) 


ce qui signifie que arcsin est une fonction impaire. 


Notons que cette preuve repose sur le fait que tout élément de l’ensemble de définition de la 
fonction arc sinus peut être écrit sous la forme sin(x) pour un certain x. 

Si xo € [—-1,1] est donné, calculer arcsin(x9) revient à trouver un angle 05 dans [—7, 5] pour 
lequel sin(do) = xo. Un tel angle sera forcément unique. 


Remarque 18.45. 

La définition de arc sinus découle du choix de l’intervalle J, qui est une convention. Il aurait été 
possible de faire un choix différent : pourriez-vous trouver la réciproque de la fonction sinus sur 
l'intervalle [r/2,37/2]? Le mieux est de l’écrire comme une translatée de arc sinus, en utilisant le 
fait que sinus est une fonction périodique. 


Lemme 18.46. 
Nous avons arcsin(1) = 3. 


Démonstration. Pour calculer arcsin(1), il faut chercher un angle entre —75 et 5 ayant 1 pour 


sinus : résoudre sin(0) = 1. La solution est 0 = T et nous avons donc arcsin(1) = 
2 


LE 
2 
7 
D: 


À l’aide des valeurs remarquables de la fonction sinus nous obtenons le tableau suivant de 
valeurs remarquables pour l’arc sinus. 


z 0 
arcsin(æ) | 0 


Le 
LM 


O3 NI 
Dal 


Les autres valeurs remarquables peuvent être déduites du fait que l’arc sinus est une fonction 
impaire. 

En ce qui concerne la dérivabilité de la fonction arc sinus, en application de la proposition 12.180 
elle est dérivable en tout y = sin(x) tel que sin/(x) # O0, c’est-à-dire tel que cos(x) Æ 0. Or cos(x) = 0 
pour æ = +7, ce qui correspond à y = sin(+5) = +1. La fonction arc sinus est donc dérivable sur 
]-1,1[. Nous avons donc la propriété suivante pour la dérivabilité. 
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Proposition 18.47. 
La fonction arc sinus est continue sur [—1,1] et dérivable sur ]—1,1[. Pour tout y € |-1,1{, la 
dérivée est donnée par la formule (12.467), qui dans ce cas s'écrit 


1 1 
arcsin’(y) = = | (18.135) 


cos (arcsin(y)) 1 — 


La dernière égalité viens du fait que si x = arcsin(y) alors y = sin(x) et cos(x) = 4/1 — sin?(x) = 
1/1 — y2. 

Pour comprendre la dernière égalité, remarquer que dans le dessin suivant, 0 = arcsin(y), donc 
y = sin(0), et x = cos(6). 


Notons enfin que le graphe de la fonction arc sinus est donné à la figure 18.3. 


FIGURE 18.3: Le graphe de la fonction x + arcsin(x) Labe1FigFGRooDhFkch 


18.3.3 La fonction arc cosinus 


Nous voulons étudier la fonction 
cos: R — [-1,1] (18.136) 


et son éventuelle réciproque. Encore une fois il n’est pas possible d’en prendre la réciproque globale 
parce que ce n’est pas une bijection ; ne fut-ce que parce qu’elle est périodique (proposition 18.17). 
Nous choisissons de considérer l'intervalle [0, x] sur lequel la fonction cosinus est continue et stric- 
tement monotone décroissante. 

Nous avons alors le résultat suivant : 
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PROPooZ0ZHooSMoYQD 
Proposition-Définition 18.48. 
Pour définir la fonction arc cosinus. ITEMooMJWZooNHgQox 
(1) La fonction 
cos: [0,7] — [—-1,1] (18.137) 
est une bijection continue strictement décroissante. 
(2) Sa bijection réciproque est la fonction 


arccos: [—1,1] — [0,7] (18.138) 


nommée arc cosinus. 
(3) La fonction arc cosinus est continue, strictement décroissante. 
(4) Elle est dérivable et pour tout y € |—-1,1[, sa dérivée est donnée par 
1 —1 
arccos’(y) = _ (18.139) 


— sin (arccos(y))  4/1— 2 


Démonstration. La fonction cosinus est continue et même de classe C'? par la proposition 18.1. Elle 
est strictement décroissante parce que sa dérivée (— sin) y est strictement négative (strictement, à 


l’intérieur du domaine). 
Le fait que arc cosinus soit une bijection continue strictement monotone est dans le théorème 
de la bijection 12.54. La dérivabilité et la formule sont de la proposition 12.180. 


Pour yo € [—-1,1], trouver la valeur de arccos(yo) revient à résoudre l’équation cos(x0) = Yo. 
Cela nous permet de construire une tableau de valeurs : 


V3 V2 1 1[V2 | V3 
F 1 His 2e L 2) 2 72 1 
arccos(x) | 7 L Sn | sn |2n|$|2T|sr 


Remarque 18.49. 
Certes la fonction cosinus est paire (vue sur R), mais la fonction arc cosinus ne l’est pas car elle 
est une bijection entre [—1,1] et [0,T|]. 


Exemple 18.50. 
Cherchons arccos(+). Il faut trouver un angle 4 € [0,] tel que cos(9) = À. La solution est 0 = 7. 
Donc arccos(i) = 
Il n’est cependant pas immédiat d’en déduire la valeur de arccos(—+). En effet 9 = arccos(—À) 
27% 


si et seulement si cos(0) = —} avec 0 € [0, x]. La solution est 0 = . A 


En ce qui concerne la représentation graphique, il suffit de tracer la fonction cosinus entre 0 et 
ñ puis de prendre le symétrique par rapport à la droite y = x. 
À 


3 _ 
2 


[A 


18.3. TRÈS MODESTE APPROXIMATION DE 7 1565 


18.3.4 Une meilleure approximation de 7 


Nous avions laissé le nombre x avec l’approximation assez minable de 2V2 < x < 4 en le 
lemme 18.33. Nous pouvons maintenant faire nettement mieux. 


Le lemme 18.42 donne 
arctan(1/V3) = r/6 (18.140) 


et l’idée est de donner un développement de arctan autour de zéro, de l’évaluer en 1/43 et d’égaliser 
le résultat à 7/6. Tout cela donne lieu à des calculs peut-être fastidieux, mais comme un gars l’a 
fait dès l’an 1424[519] pour trouver 16 décimales correctes, nous faisons comme si c'était facile. 
Pour trouver le développement en série de Taylor (théorème 12.455) de arc tangente autour de 
= 0, il faut partir de la formule (18.124) et sans doute pas mal calculer et faire une récurrence !?. 
Le résultat est : 


arctan(x) = 5 A (18.141) 
 2k+1 
valable pour x € ]—1,1[. Avec cela nous avons 
1 (1) 1 "x 
arctan = x = —, 18.142 
C7) 2 Br D V3 6 
et donc 
—— > au (18.143) 
1/3 ar (2k + 1)3k° | 


Pour donner une idée du fait que ça fonctionne pas mal, voici le calcul pour quelques termes : 


SageMath version 7.3, Release Date: 2016-08-04 
Type "notebook()" for the browser -based notebook interface. 
Type "help()" for help. 


sage: n(taylor(arctan(x),x,0,5) (1/sqrt(3)))x*x6 


3.15618147156995 

sage: n(taylor(arctan(x),x,0,10) (1/sqrt(3)))x*x6 
3.142604746566308 

sage: n(taylor(arctan(x),x,0,20) (1/sqrt(3))*x6-pi) 
-2.14265171338823e-6 


| sage: n(taylor(arctan(x),x,0,58) (1/sqrt(3))x6-pi) 
318.88178419700125e-16 


tex/sage/sageSnip012.sage 


Calculer 5 termes donne déjà 3.15. Et on est à 106 de la bonne réponse avec 20 termes. Et avec 
58 termes, on n’est à 10716. 


ii Avertissement /question à la lectrice !! 18.51 
Pour bien faire, il faudrait étudier le reste et donner un encadrement. 


18.3.5 Angle entre deux vecteurs 
DEFooSVDZooPWHwFQ 


Proposition-Définition 18.52. 
Soient des vecteurs X,Y € R?. Il existe un unique 0 € [0, x] tel que 


X -Y eqDefAngleVec 
ARR Vs 
cos) x HS 


Ce réel est appelé angle entre X et Y. 


12. Je n'ai pas fait le calcul, merci de me faire savoir si il y a une astuce. 
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Démonstration. Si a et b sont des réels, l’inégalité |[a| < b peut se développer en une double inégalité 
—b<a<b. (18.145) 

L’inégalité de Cauchy-Schwarz (11.2) devient alors 
—IANYI< À Y < XII: (18.146) 


Si X £O0et Ÿ Æ 0, nous en déduisons 


X:Y 
—1< + (18.147) 
IX1IY1 
Il existe donc par la proposition 18.48 un angle 4 € [0, x] tel que 
X-Y 
cos() = (18.148) 
IX IT 
18.53. 
Certains n’hésitent pas à écrire la formule 
P 
X - Y = |X|IYIcos(8). ec) 


comme une définition du produit scalaire. C’est ce qui arrive lorsqu'on définit les fonctions trigo- 
nométriques à partir de relations dans les triangles rectangles. 


Nous pouvons prouver simplement que sin(30°) = À et cos(30°) = V3 en s'inspirant de la 
figure 18.4. 


A 


C 


FIGURE 18.4: Un triangle équilatéral de côté 1. LabelFigGVDJooYzMxLW 


18.3.6 Aire du parallélogramme 


C'ENRREEe 
Y 


a 


FIGURE 18.5: Calculer l’aire d’un parallélogramme. Labe1FigBNHLooLDxdPA 
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RemaAireParalProdVect 
Remarque 18.54. 
Le nombre |a||b| sin(@) est l’aire du parallélogramme l* formé par les vecteurs a et b, comme cela 


se voit sur la figure 18.5. Un vrai calcul avec une intégrale sera effectué dans la proposition 20.25. 
PropNormeProdVectoabsint 


Proposition 18.55. 
Nous avons 
la x b] = [a]|b] sin() (18.150) 


où 0€ [0,x] est l'angle formé par a et b. 


Démonstration. En utilisant la décomposition du produit vectoriel *, nous avons 
2 2 2 
a2 à a à ai à 
la x b|? _ 2 3 F 1 3 L 2 
b2 ba bi b3 bi bo 


= (a2b3 — ba)? + (a1b3 — a3b1)” + (a1b2 — a2b1)” 

= (af + a5 + a$)(bf + 05 + bé) — (a1b1 + a2bo + abs)? 
= |al*|bl? — (a + 6° 

= al Ib? — al? ol? cos (8) 

= la|2b2(1 — cos?(8)) 


= al? ||? sin?(6). 


(18.151) 


D'où le résultat. Nous avons utilisé la formule de la définition (18.52) donnant l’angle en fonction 
du produit scalaire. 


NORMooWWOKooWzScnZ 

18.56. 
Si les vecteurs a, b et c ne sont pas coplanaires, alors la valeur absolue du produit mixte (voir 
équation (11.94)) a + (b x c) donne le volume du parallélépipède construit sur les vecteurs a, b et 

ee 

En effet si 4 est l’angle entre b x cet a, alors la hauteur du parallélépipède vaut |a| cos(w) parce 
que la direction verticale est donnée par b x c, et la hauteur est alors la « composante verticale » 
de a. Par conséquent, étant donné que |b x c| est l’aire de la base, le volume du parallélépipède 

vaut 1? 
V = |b x c|la] cos(o). (18.152) 


Or cette formule est le produit scalaire de a par b x c; ce dernier étant donné par le déterminant 
de la matrice formée des composantes de à, b et c grâce à la formule (11.94). 


La valeur absolue du déterminant 
ai à2 
b1 b 


FRS 185 


bi 
bo 


marque 18.54, l’aire de ce parallélogramme est donnée par la norme du produit vectoriel 


est l’aire du parallélogramme déterminé par les vecteurs (a) et ( ) En effet, d’après la re- 
2 


a b: Ex y Cz a. 
a |X | bb |—=lay a 0 . ez, (18.154) 
0 0 b b2 0 To 


donc la norme |a x b| est bien donnée par la valeur absolue du déterminant (18.153). 


13. Définition de ce qu’est une aire : 20.20. Preuve dans le cas d’un parallélogramme : 20.25. 

14. Directement de la définition 11.25. 

15. Le calcul de ce volume mériterait une certaine réflexion, surtout à partir du moment où nous avons décidé de 
définir les fonctions trigonométriques à partir de leur développement (définition 18.1). 
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18.4 Paramétrisation du cercle 


Nous allons parler de paramértisation du cercle. L'ensemble S! sera vu tantôt comme le cercle 
dans R?, tantôt comme le cercle dans C. Nous n’allons pas pousser le vice jusqu’à écrire explici- 
tement les isomorphismes lorsque nous passons d’une représentation à l’autre. Parmi les identifi- 
cations que nous allons faire sans ménagement, il y a l'identification entre les applications 


: [0,27[ — R°? 
Del (18.155) 
tr (cos(t),sin(t)) 
et ü 
: (0,27) — 
Perl : (18.156) 
tee". 


C’est évidemment la formule ef = cos(t) + isin(t) (lemme 18.11) qui permet de transformer 7 en 
et inversement. De plus R? et C sont isomorphes en tant qu’espaces vectoriels normés (et aussi 
donc topologiques). 

Nous allons prouver suffisamment de résultats à propos de ces deux applications pour pouvoir 
dire qu’elles paramétrisent le cercle et écrire des égalités du type 


[ = [re D. (18.157) 


18.5 Cercle trigonométriques 
PROPooWZFGooMVLtFz 
Proposition 18.57 ([520]). 
Soient des fonctions f,g: I — R de classe C* sur l’ouvert I de R telles que f? + g° = 1. Soient 
to € Let 00 tel que f(to) = cos(do) et g(to) = sin(6o). 
Alors il existe une unique fonction continue 0: I — R telle que 


(to) = 80 (18.158a) 
f = cos 0û (18.158b) 
g = sin 06. (18.158c) 


Démonstration. Nous commençons par l’existence, en passant par les nombres complexes. Soit 
h: 1 — C définie par h = f +ig. Nous avons hh = 1 et nous définissons 


O(E) = 00 — à ps) (s)ds. (18.159) 


Cette intégrale existe pour tout t parce que les fonctions f et g étant continues, elles sont bornées 
sur le compact [to,t]. De plus 0 est une fonction continue parce que c’est une primitive (proposi- 
tion 14.262) (6. 

La dérivée de @ est la fonction s > —ih/(s)h(s). 

Utilisant la formule du lemme 18.11 sur la forme trigonométrique des nombres complexes, nous 
calculons : 


d 

dt 
Par conséquent il existe ce © tel que he = c. Mais A(to) = f(to) + ig(to) = cos(fo) +isin(60) = 
eo, du coup 


rev]. = €" #(h'— h0") = e (pl —ih(—iNh) = 0. (18.160) 


h(to)e Go) = c (18.161) 


donne immédiatement c = 1, ou encore et) = h(+), c’est-à-dire que 


f +ig = coso 0 +isino 6, (18.162) 


16. En réalité nous appliquons le théorème 11.1 à chacune des parties réelles et imaginaires de la fonction s + 
h'(s)h(s). 
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ce qu’il fallait pour l’existence. 
Pour l’unicité nous supposons avoir une autre fonction, a qui satisfait aux exigences. Pour tout 
te T nous avons 
eo)  eiat), (18.163) 


Il existe donc une fonction n: 1 — NN telle que @(t) = a(t) + 2n(t)r. Par continuité de 0 et à, la 
fonction n doit être constante, mais vu que 6(to) = a(to) nous avons n = 1. 


18.5.1 Bijection continue 
PROPooKSGXo00qGyZ; 


Proposition 18.58. 
L'application 
7: [0,27[ — S' CR? 


tr (cos(t),sin(t)) (ESS 


est une bijection continue. 


Démonstration. En plusieurs points. 
(1) Image Le fait que l’image de soit dans S1 découle immédiatement du fait que sin? + cos? = 


1. 
(2) Continuité La continuité découle de la continuité des composantes. 


(3) Injectif Soient x < x2 tels que sin(x1) = sin(x2) et cos(x1) = cos(x2). Supposons pour 
fixer les idées que sin(x1) > 0 et cos(x1) > 0 : si ce n’est pas le cas, il faut traiter séparément 
les 4 possibilités de combinaisons de signes. 

Nous avons obligatoirement x1,x2 € [0, 5[. Vu que nous avons supposé que sin(x1) = sin(x2), 
le théorème de Rolle 12.192 nous permet de considérer un élément c € |x1, x2[ tel que sin’(c) = 
0, c’est-à-dire cos(c) = 0. Cela contredirait la proposition 18.20(10) à moins que x1 = 72. 

(4) Surjectif 
Soient x,y tels que x? + y? = 1. Supposons pour varier les plaisirs |” que x < 0 et y > 0. 
Puisque la fonction cos va de 0 à —1 lorsque x va de 7/2 à x, le théorème des valeurs 
intermédiaires donne t € [x/2, x] tel que cos(t) = x. 

En reportant cette valeur de x dans l'égalité x? + y? = 1, nous trouvons y? = 1 — cos?(t) = 
sin?(t), et donc sin(t) = +y. Mais pour t € [x/2,7] nous avons sin(t) > 0. Par conséquent 
sin(t) = y parce que nous avons également supposé y > (0. 


CORooAKMKooURqcr0O 
Corolaire 18.59. 
Soient R > 0 ainsi que le cercle S = {x € R? tel que |x|| = R} de rayon R. L'application 


: [0,27 — S 
wi : (18.165) 
tr (Rcos(t), Rsin(t)) 
est une bijection continue. 
EXooJFDPooBZADKs 
Exemple 18.60. 
L'application 
w: ]0,27[ — 51 
cos(x) (18.166) 
sin(x) 


est continue par la proposition 18.58. Comme |0,27| est connexe (proposition 10.52) le lemme 
7.209 implique que le cercle privé d’un point est connexe. PA 


17. Mais les autres cas sont à faire, pour être complet. 
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La proposition suivante ne va pas jusqu’à dire qu'il y a un C©°-difféomorphisme entre [0,27| 
et S!. La raison est que n'avons pas défini la notion de différentielle pour des applications définies 
sur des fermés. 

Si vous voulez un C'®° difféomorphisme, il y a deux possibilités. Soit vous acceptez d'élargir 
un peu le domaine et vous allez voir les coordonnées polaires du théorème 18.227, soit vous allez 


étudier la géométrie différentielle, et vous considérez $! comme une variété. 
PROPooXELTooYKjDav 


Proposition 18.61 ([1, 160]). 
Dans cette proposition, S\ désigne l’ensemble des nombres complexes de norme 1. Trois affirma- 
tions. ITEMooUHRHooRXvxrL 


(1) L'application 


f: [0,27[ — S1 
| —— (18.167) 
est une bijection continue. ITEMooPWUWooHsQBDg 
(2) La réciproque de 
f: [0,27[ — S1 
! ne (18.168) 
n’est pas continue en 1. ITEMooCVAQooLsYspl 
(3) L'application 
f:10,27| — © 
. _. (18.169) 
est de classe CT. 
Démonstration. En plein de points. 
(1) Pour (1) 
Nous savons que 
RC 
: (18.170) 


(x,y)e x +iy 
est une bijection isométrique. C’est pour cela que nous allons nous permettre de noter $1 le 
cercle unité dans IR? aussi bien que l’ensemble des nombres complexes de norme 1. 
Sur R? nous avons l'application 


rm er 
2 (ete) (18.171) 


sin(t) 


qui est une bijection continue (c’est la proposition 18.58). Et enfin le lemme 18.11 nous donne 
e® = cos(x) + isin(x). 

Avec tout ça, l'application @-lo f: [0,2r[ — S! est une bijection continue. Et comme w l’est 
également, f est une bijection continue. 

(2) Pour (2) Nous vérifions que la définition 7.32(1) n’est pas satisfaite pour f-!. Nous consi- 
dérons le voisinage W = [0,e[ de 0 dans [0,27|[ avec € < 1/2. Nous allons montrer que tout 
voisinage V de 1 dans S1 contient des points zx tels que f—!(2;) # W. Tout voisinage de 1 
dans S! contient une partie de la forme B(1,r) n S$1. Posons 24 = exp (i(27 — 1/k)). Nous 


avons 
|1— exp (i(27 — 1/k))[? = |1— cos(2r — 1/k) —isin(2r —1/k)|  lem 18.11 (18.172a) 
= |1 — cos(2r — 1/k)[? + |sin(2r — 1/k)|? (18.172b) 
— 0. (18.172c) 


Donc pour tout r, nous avons 4 € B(1,r) n S! dès que k est assez grand. Or f-!(2) = 
27 — 1/k # [0,e[ dès que k est assez grand. 


18.5. CERCLE TRIGONOMÉTRIQUES 1571 


(3) Pour (3) Nous avons f(x) = cos(x) + isin(x). Les fonctions sin et cos étant de classe C? 
par la proposition 18.1, la fonction f l’est aussi. 


La proposition suivante donne les coordonnées polaires sur €. La régularité est l’objet du 
théorème 18.227 (à part le fait que ce dernier parle de R? et non de C). 


PROPooRFMKooURhAQJ 
Proposition 18.62 (Décomposition polaire des nombres complexes). 
Pour tout nombre complexe z £ 0, il existe un unique 0 € [0,27[ tel que 
z = |zle. (18.173) 


Démonstration. Soit z € C. Nous considérons z/ = z/|z2| qui est de norme 1. Donc il existe un 
unique 0 € [0,2r| tel que z/ = e° (proposition 18.61(1)). 
Pour ce Ÿ nous avons z = |z[e?. 


Bien entendu, le 0 est unique dans [0,27{, mais il n’est pas du tout unique dans R. 
LEMooUQKNooGZ1JHf 


Lemme 18.63 ([1]). 
Pour tout a,bE ©, il existe t € [0,2x[ tel que 


la + db]? = |a|? + |b[? + 2]al|b] cos(t). (18.174) 
Plus précisément, si les formes trigonométriques ® de a et b sont a = |ale** et b = |bleŸ, alors 
la + b[? = [al? + |b]? + 2]al|b| cos(a — B). (18.175) 
Démonstration. Nous avons le calcul suivant : 


la + bf? = (a + b)(a + b) 
= |a|? + ab + ba + |b|? 
= |al? + 1b[2 + laflb(eie— 9) + eitB—e)) 
= |a?| + |bl? + 2]a|[b| cos(a — B). 


CORooONAVooKPhQuI 
Corolaire 18.64. 
La partie B = {ze C tel que |z| > R} est connexe et connere par arcs !°. 


Démonstration. Nous prouvons que B est connexe par arcs; la connexité découlera du lemme 
10.63. Nous considérons les points 21 = rie"1 et 22 = r2e°2 dans B. Une telle décomposition est 
toujours possible par la proposition 18.62. 

Supposons 01 < 02 et r1 < r2; sinon il faut faire différents cas. Nous relions les points 21 et 22 
par le chemin continue constitué des deux chemins suivants mis bout à bout. D'abord 


: [81,0] — B 
Es : à (18.177) 
> TT ; 
et ensuite 
o: [11,72] — B 
[ra : (18.178) 


18. Proposition 18.62. 
19. Définition 10.61. 
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18.5.2 Inverse 
SUBSECooWFNMooOUuZBRN 


Nous pouvons écrire un inverse de la fonction 4 grâce à la fonction arc tangente introduite au 
théorème 18.38. La fonction que nous écrivons à présent est la fonction arg,- définie par (26.127). 
Elle n’est pas exactement la fonction argument définie par (26.88). 

Nous avons : 

w l:S1-,[0,2r[ 
arctan(y/x) sit >0,y > 0 
F si (x,y) = (0,1) FAoeSATEES es 
z+iyr 4m—arctan(—-y/x) six <0,y>0 
ñ + arctan(y/x) si & < 0,y < 0 
27 — arctan(—y/x) six > 0,y <0 


Chacune des branches est continue parce que la fonction arc tangente l’est. Trois des raccords sont 
également continus grâce aux limites du lemme 18.39. 


—1 


L'application =! n’est cependant pas continue au point (1,0) 2°. C’est l’objet du lemme sui- 


vant. 
LEMooEQVRooMAffCuw 


Lemme 18.65. 
L'application @7!: S1 — [0,27[ n’est pas continue en (1,0). Mais elle est continue ailleurs. Au- 
trement dit, 


gl: 81 {(1,0)} — ]0,2x|[ (18.180) 
est continue. 


Démonstration. En effet, 4! serait continue si l’image de tout ouvert de [0,2x| par & était ouverte 


dans S1 (topologie induite de C). Prenons un petit ouvert [0,e[ (si vous êtes étonnés, c’est que 
vous n’avez pas bien la topologie induite en tête). Son image contient le point (1,0), mais aucun 
point (x,y) avec y < 0. 

Montrons que tout voisinage de (1,0) dans € contient des points x + iy de Sl avec y < 0. Un 
point de S! est de la forme cos(t) + isin(t). Nous avons : 


| cos(t) + isin(t) — 1|? = (cos(t) — 1)” + sin?(t) = 2(1 — cos(t)). (18.181) 


Soit Ô > 0, et montrons que B((1,0),6) n S! contient des points d’ordonnées négatives. D'abord 
il existe € > O0 tel que pour t = 27 — €, 


2(1 — cos(t)) < 6. (18.182) 
Ensuite pour de tels {, nous avons sin(t) < 0. Donc les points de S! correspondant à 27 — € sont 


dans St n B((1,0),6). 
Bref, l’image de [0,e[ n’est pas un ouvert de S1. 


18.5.3 Cercle trigonométrique 


Définition 18.66 ([521]). 
Le cercle trigonométrique est le cercle dans IR? de rayon 1 centré en (0,0) représenté à la figure 18.6. 
Nous n'hésiterons pas à parler de cercle trigonométrique dans C. 


Nous verrons plus tard (proposition 21.13) que la longueur de l’arc de cercle intercepté par un 
angle 0 est égal à 0. Les radians sont donc l’unité d’angle la plus adaptée au calcul de longueurs 
sur le cercle. 


20. Puisque nous avons considéré 5! € €, nous aurions dû noter « 1 » ce point. Mais vous vous imaginez le clash 
de notation avec le 1 € [0,2x[ € R? 
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FIGURE 18.6: Le cercle trigonométrique. LabelFigCercleTrigono 


LEMooX1SFooRMWUEC 
Lemme 18.67. 
Soit R > 0. Soient le cercle S = {x € R? tel que |x| = R} de rayon R ainsi que to € R. L'applica- 
tion 
Yto: [éo, to + 27] — S 


18.183 
x (Rcos(x), Rsin(x)) 
est une bijection continue. 
Démonstration. Le corolaire 18.59 nous dit que 
7: [0,27[ — S (18.184) 
ze (Rcos(r), Rsin(x)) | 
est une bijection continue. 
D'autre part, l’application 
f: [to to + 27] — [0,27[ (18.185) 


Tr tz—-t 


est une bijection continue. 
Comme 7, = 7° f, nous déduisons que 7, est une bijection continue. 


18.68. 
La proposition 21.13 dira que la longueur d’arc de cercle de rayon R interceptée par un angle 0 
vaut RO. 


18.5.4 Du point de vue de la tribu, mesure et co. 


Nous avons considéré sur $S1 la topologie induite de C. Nous allons y mettre la tribu induite 
de celle de Lebesgue de €. Mais nous n’allons pas y mettre la mesure induite de €; sinon tout 


serait toujours de mesure nulle. 
PROPooQFYHooEajmbW 


Proposition 18.69 ([1]). 
L'application & est borélienne d’inverse borélien, c'est-à-dire 


Bor(S?) = p(Bor([0,2r[)). (18.186) 


Démonstration. L'inclusion Bor(S) € (Bor([0,2r{[)) est la plus simple : si À € Bor(S?), alors 

g7!(A) € Bor([0,2x[) parce que w: [0,27[ — ST est continue et donc borélienne (théorème 14.53). 
Pour l’autre inclusion, il faudra procéder par étapes. 

(1) Ouvert ne contenant pas zéro Si À est un ouvert de [0,27[ ne contenant pas 0, il est 


un ouvert de R ou de [0,27[. Le lemme 18.65 nous indique que son image par 4 est ouverte 
dans $l. En particulier, w(A) € Bor(S1). 
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(2) 


La preuve est terminée. 
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Ouvert de la forme [0,€[ Nous supposons que € est petit. Disons pour fixer les idées, plus 
petit que x/2. Nous avons : 


p([0, ef) = (10, ef) v ({0}). (18.187) 
Le premier élément de l’union est un ouvert, et le second, un unique point. L'union est un 
borélien. 


Ouvert général Si un ouvert de [0,2x| ne contient pas 0, son image est ouverte. Nous 
nous penchons sur le cas d’un ouvert contenant (0. 


Si un ouvert de [0,27| contient 0, alors il contient un ouvert de la forme [0,€[, parce qu’un 
ouvert contient une boule autour de chacun de ses points (théorème 7.8 couplé au fait que 
nous sommes dans la topologie induite de R). 


Si À est un ouvert contenant zéro, alors 
A = [0,e[ v (4\[0, D. (18.188) 


Nous avons déjà vu que l’image du premier élément de l’union est un borélien. Etant donné 
que A\[0, 5] est un ouvert ne contenant pas zéro, son image est un ouvert. Donc l’image de 
À est un borélien. 


Pause Nous avons déjà vu que l’image par Y de tout ouvert de [0,27 était un borélien de 
St. Nous devons en déduire que l’image de tout borélien de [0,2r[ est un borélien de S1. 
C’est ce que nous faisons maintenant 


1 


Boréliens Nous utilisons le lemme de transport 14.45 avec l'application w” et l’ensemble 


des ouverts : 
p(o(C)) = o(v(C)) (18.189) 


où C est la tribu des ouverts dans [0,27[. L'ensemble o(C) est par définition l’ensemble 
Bor([0, 2r|). D'autre part nous avons vu que l’image d’un ouvert est un borélien : @(C) & 
Bor(S!). Nous avons donc 


p(Bor([0,2r[)) = o(p(C)) € a(Bor(S*)) € Bor(S!). (18.190) 


PROPooHMSCooRIjc]Jq 


Proposition 18.70 (Boréliens sur S1[1]). 
Soit la structure usuelle d'espace mesurable (C, Bor(C)). Nous considérons 


Alors 


(1) 


(2) 


la tribu Bor(C)s1 induite de la tribu des boréliens de © vers S!, 
la tribu Bor(S*) des boréliens de S! construite à partir de la topologie induite de © vers S\. 
la bijection w: [0,2r[ — S1, 


la mesure de Lebesgue sur [0,27|[ (induite de celle sur R) et sur C, que nous noterons toutes 
deux À. 


ITEMooSUNEooRhAdep 
Nous avons les expressions 
Bor(C)s1 = {A € Bor(C) tel que Ac S1} (18.191a) 
BE YZ 
= {An Sl tel que A € Bor(C)} FPMO AO E) 
ITEMooGYPNooRaZbNW 


Nous avons 


Bor(S1) = Bor(C)si = e(Ber([o, 27) ). (18.192) 
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ITEMooFUXKooFQdoaw 
(3) En définissant pu: Bor(S!) — R par 


= X(g71(A)) EnookHZRop gr EH dg 


27 j 
le triplet LE Bor(S?), ui) est un espace mesuré. ITEMooBQLRooOsqesg 
(4) L'espace mesuré (ST, Bor(s").u) est fini et 
HS =: (18.194) 


Démonstration. Point par point. 
(1) Pour (1) C’est la proposition 14.9. 


(2) Pour (2) La première égalité est le lemme 14.51. Le fait que Bor(S!) = #(Bor(10,2rl)) 
est déjà la proposition 18.69. 

(3) Pour (3) Nous devons d’abord nous assurer que la formule ait un sens. Cela est chose 
aisée; si À € Bor(S), le point (2) nous indique que ÿ”!(A4) € Bor([0,2r[). Ensuite, nous 
devons vérifier les deux conditions de la définition 14.18 pour avoir un espace mesuré. 


En premier lieu, ; : 
rap 5, : 
HD) = A6 (D) = AS) = 0. (18.195) 


Et en second lieu, si les À; € Bor(S!) sont disjoints, les -1(4;) sont également disjoints 
parce que w-! est une bijection. Donc 


A] 45) = AU" (45) (18.196a) 
. _ A(p71(4)) (18.196b) 
5 =) (18.196c) 
= Ÿ (Ai). (18.196d) 


D'accord. 


(4) Pour (4) En ce qui concerne la mesure de $! pour y nous avons simplement 


X([0,2r) 


u(S1) = | (18.197) 


Maintenant que (S!, Bor(S!), 1) est un espace mesuré, nous pouvons compléter la tribu Bor(S1) 
pour la mesure y. 


Définition 18.71. 
La tribu de Lebesgue sur S! est la mesure complétée pour 


(S', Bor(S?), y) (18.198) 


où u est la mesure définie par la proposition 18.70. Nous notons Leb(S1) la tribu et encore 1 la 


Mesure. 
PROPooDLBCooUfQZ0Oa 


Proposition 18.72 (Lebesgue sur S1[1]). 
Soit la structure d'espace mesuré complet (ST, Leb(S*), 4). Nous considérons 
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— la tribu Leb(C)s1 induite de la tribu des boréliens de € vers S!, 
— la bijection w: [0,2r[ — S!, 


Alors ITEMooQMHDooHEThPf 
(1) La tribu Leb(C)s est la tribu de toutes les parties de S!. ITEMooNTRNooKSeyCa 
(2) La tribu Leb(S!) est donnée par 

Leb(S!) = p(Leb(R)p2rr) = p(Leb([0,2r[)) (18.199) 


où Leb([0,27[) est la tribu sur [0,2x[ obtenue par complétion de la tribu des boréliens de la 
topologie induite. ITEMooXDBTooYnauyi 


(3) Nous avons l'inclusion stricte 
Leb(S!) & Leb(C)s1. (18.200) 


Démonstration. Point par point. 


(1) Pour (1) Si AC S!, alors À est une partie de S1 qui est mesurable et de mesure nulle 
pour C. Donc À est À-négligeable et par conséquent mesurable. 
(2) Pour (2) Il s’agit de prouver que 
Bor(Si) = (Bor([0,2r|)). (18.201) 
Ce n’est rien d’autre que la proposition 14.80. La seconde partie de l’égalité est la proposition 
14.75 
Pour (3) Comme indiqué au point (1), la tribu £Leb(C)s1 est la tribu de toutes les parties 


RS 
Co 
—_— 


de S!; l'inclusion est donc évidente. Le point pas tout à fait évident à prouver est l'existence 
de parties de S1 à n’être pas dans £eb(S1). 
Soit V non mesurable dans [0,27| (prenez quelque chose comme l’ensemble de Vitali de 
l’exemple 14.153). Puisque, par le point (2), 

Leb(S7) = p(Leb(R)pr); (18.202) 


la partie w—!(V) ne peut pas être dans £eb(S1). 


Si vous en voulez plus à propos de S! et la façon dont on passe la structure depuis [0,2r[, vous 
pouvez lire la proposition 27.86 qui donne la structure de 


L?(57, £eb(S?), y) (18.203) 
qui sera, sans surprise, la même que celle de 


L?([0,2r[, £eb([0,2x[), À). (18.204) 


18.6 Exemples trigonométriques 


Nous mettons ici quelques exemples concernant les fonctions trigonométriques, qui n’ont pas 
pu être mis dans les chapitres les plus adaptés, parce que ces derniers sont plus haut dans la table 


des matières. 
EXooSPFDooSluUGV 


Exemple 18.73. 
Prouvons que la fonction?! f(x) = xsin(x) tend vers zéro lorsque x tend vers 0. D’abord, nous 
coinçons la fonction entre deux fonctions connues : 


0 < |xsin(x)| = [x||sin(x)| < |x|. (18.205) 


Donc |xsin(x)| est coincé entre g(x) = 0 et h(x) = |x|. Ces deux fonctions tendent vers 0 lorsque 
x — 0, et donc f(x) tend vers zéro. A 


21. La définition de la fonction sinus est 18.1. 
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18.6.1 Quelques équations trigonométriques 


La proposition suivante se voit très facilement sur le cercle trigonométrique, mais il faut le 


démontrer. 
PROPooTUUUooVrAGQo 


Proposition 18.74 ([1]). 
Si 00 € [0,27[ vérifie cos(d5) = xo, alors l’ensemble des solutions de l'équation cos(4) = x0 (d’in- 
connue Ô) est 

{00,27 —= 60}. (18.206) 


Cet ensemble est un singleton si et seulement si xp = +1. 


Démonstration. Commençons par prouver que 00 et 27 — 00 sont des solutions. Le nombre 60 est 
solution par hypothèse. En ce qui concerne 27 — 66, il est possible d'utiliser la formule d’addition 
d'angle (18.22c) : 
EQooUCADUooT 
cos(27 — 06) = cos(27) cos(do) + sin(2rx) sin(6o). De 507 


La proposition 18.20(1) nous indique que cos(27) = 1 et sin(27) = 0. Donc l'égalité (18.207) se 
réduit à cos(27 — 06) = cos(6o). 
Le lemme 18.4 dit que si cos(4) = xo, alors 


HU +4/1- 08 (18.208) 
eo) : ( 2) ' (18.209) 


en) L (_ 1 a) (18.210) 


Comme 0 + (cos(0), sin(6)) est une bijection avec Sl (proposition 18.58), chacune de ces deux 
possibilités possède une unique solution. L'ensemble des solutions de cos(4) = x9 possède donc au 
maximum deux éléments. 

L'ensemble des solutions possède exactement une solution lorsque les points (xo, A/1 — t6) et 
(xo, —\/1- à) sont identiques. C’est le cas, si et seulement si 4/1— 24 = 0, c’est-à-dire, si et 
seulement si 0 = +1. 


Nous avons donc soit 


soit 


18.6.2 Développements en série 
PROPooNPYXo0TuwAHP 


Proposition 18.75 (Taylor pour cosinus). 
Pour tout ne N, il existe une fonction a: R — R telle que lims_,o a(t) = 0 et 


n 
cos(x . 


En ce qui concerne le sinus, pour tout n nous avons une fonction a: R — R telle que lims_,0 a(t) = 
0 et 


2n FRooGROF OS AN 


2 FLo(x)x 


n ÿ# a2k+1 
sin(x 2" = Di + otia(x). se ° 315$) 


Démonstration. 1 s’agit d'utiliser la proposition 15.51, en faisant attention à l’ordre. Le fait est 
que dans (18.211), nous avons écrit le polynôme de degré 2n + 1 (et non seulement 2n), en sachant 
que le terme d'ordre 2n + 1 est nul. 
C’est pour cela que nous avons pu écrire a(x)x 
Même raisonnement pour le développement du sinus. 


2n+1 au lieu de a(x)r?" qui aurait été attendu. 


Remarque 18.76. 
Quelques remarques concernant l’ordre du polynôme. 
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(1) Notons que nous aurions aussi pu écrire le reste sous la forme a(r)x?", mais ça aurait été 
avec une autre fonction « : celle correspondant au développement à l’ordre 2n au lieu de 


2n + 1. 
(2) Les développements de sinus et de cosinus ont un terme sur deux qui est nul. C’est pour cela 
qu'en ayant un polynôme de degré 2p, nous avons le développement d’ordre 2p + 1. 


(3) Nous aurions pu utiliser les dérivées données dans la proposition 18.3 et les valeurs spéciales 
(18.6). 


Corolaire 18.77. 
Il existe une fonction a: R — R telle que lims_,o a(t)/t = 0 et 


sin(x) = x + a(x). FADOPÉGE OR EE 


Nous avons la limite : 
ti 0 à (18.214) 
z—0 ZX 


Démonstration. Il s’agit de prendre la formule (18.212) avec n = 0. Cela donne tout de suite 
(18.213). Pour la limite, on divise par #, ce qui donne (pour tout x # Ü) 


sn(e) > ”. (18.215) 


Et justement la fonction a a la propriété que lim,_,0 a(x)/x = 0. 


Exemple 18.78. 


Cherchons le développement limité à l’ordre 5 de tan(x) = _. . Nous utilisons les développements 
de la proposition 18.75 : 
. 5 ; 
Î = 18.21 
sin(x) = x G + 10° (x) (18.216a) 
D 
ete + + a a(x). (18.216b) 


Nous calculons alors la division des deux polynômes, en classant les puissances dans l’ordre croissant 
(c'est le sens inverse de ce qui est fait pour la divisions euclidienne !) : 


— it + 02 l= 2? + 2" 
—( x O— de + Le ) x + has + x 
In — Lx 
( Lx Las T TA ) 
ZT — Li? 
( 2 75 lat + dr ) 
2607 — 707 


Nous avons continué la division jusqu’à obtenir un reste de degré plus grand que 5. Le développe- 
ment à l’ordre 5 de la fonction tangente autour de zéro est alors (proposition 12.479) 


1 2 
tan(x) = x + 3e + _. + x'a(x). (18.217) 
Notons que, puisque le reste ne nous intéressait pas vraiment, nous aurions pu ne pas calculer les 
coefficients des termes en x” et x$. La dernière soustraction était également inutile. A 


18.7 Isométries de l’espace euclidien 


Nous considérons l’espace affine euclidien À = €, (R) modelé sur R” avec sa métrique usuelle. 
Un premier grand résultat sera le théorème 9.155 qui dira que les isométries de cet espace sont des 
applications linéaires. 
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18.7.1 Structure du groupe Isom(R”) 


Si vous ne voulez pas savoir ce qu'est un produit semi-direct de groupes, vous pouvez lire 
seulement le point (1) du théorème suivant, et passer directement à la remarque 18.80. 


THOooQJSRooMrqQct 
Théorème 18.79. 
Un peu de structure sur Isom(R”). ITEMooLLUIo0oTGsknv 
(1) L'application 
: T(n) x On) — Isom(R" 
4: T{n) x O(n) — Isom(R")  . 
(v, A) 5 ToAÂ 
est une bijection. Ici, T(n) est le groupe des translations de R”. 
(2) Un couple (v, À) € T(n) x SO(n) agit sur x € R" par 
(v, A)x = Ax +v (18.219) 
au sens où Yu, A)x = Az + v. ITEMooEWSIooNKzRxB 
(3) En tant que groupes, 
Isom(R”) = T(n) x, O(n) (18.220) 


où p représente l’action adjointe de O(n) sur T(n) et x, dénote le produit semi-direct de la 
définition 2.47. ITEMooSKUPooBDvNWX 


: Die n . . 22 
(4) Une isométrie de R" est une application affine. ITEMooQLNPooSyHaps 


(5) La partie linéaire d’une isométrie f est 97 \(f)2. 


Démonstration. Point par point. 


(1) Prouvons que l’application proposée est injective et surjective. Notons aussi que ce point ne 
parle pas de structure de groupe, mais seulement d’une bijection en tant qu’ensembles. 


(la) Injection Si Y(v,A) = yY(w, A) alors en appliquant sur æ = 0 nous avons tout de 
suite v = w. Et ensuite À = A’ est immédiat. 


(1b) Surjection Une isométrie g € Isom(R”) est une application g: R°? — R” telle que 
dtr, ny) — d(g(x), g(y)). Dans le cas de R” cela se traduit par 


lx — y| = Jg(x) — g(y)|, (18.221) 


Comme x + |x|? est une forme quadratique, elle tombe sous le coup du théorème 9.155, 
ce qui nous permet de dire que g est affine. Or par définition une application est affine 
lorsqu'elle est la composée d’une translation et d'une application linéaire. 

Donc g = 7, o À pour une certaine application linéaire isométrique A: IR? — IR?7. 
L'application À est donc dans O(n) par la proposition 9.43(3). 


(2) C’est seulement le fait que (7, o A)r = Ty(Ax) = A(x) + v. 


(3) Nous allons étudier l’application 
d: T(n) x, O(n) — Isom(R”). (18.222) 


(3a) Le produit semi-direct est bien défini Il faut montrer que 


p: O(n) — Aut (T(n)) 


A Ad(à) (18.223) 


est correcte. 


22. Définition 8.12. 
23. Définition 8.13. 
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D'abord pour À € O(n), nous avons bien pA(r,) € T(n) parce qu’en appliquant à x € R”, 
(ARA D) (x) = Ar (A x) = A(A x + v) = x + A(v) = TA(&)(T)- (18.224) 


Donc pA(T») = TA(v)- 
De plus, pa € Aut (T(n)) parce que 


PA(TL © Tw) = PAT) © PA(Tw), (18.225) 


comme on peut aisément vérifier que les deux membres sont égaux à TA{y+u)- 


(3b) Ÿ est une bijection Cela est déjà vérifié. 


(3c) Ÿ est un morphisme Nous avons d’une part 


Y((v, g)(w, h)) = D(vp4(w), gh) = T0go07y0g togoh=T70g07y0h. (18.226) 


Et d'autre part, 
dv, g) o d(w,h) = mog0Tw0h, (18.227) 


ce qui est la même chose. 


(4) Si f est une isométrie de R”, et si Y(f) = (v, À), nous avons 
f(a+x) = r(A(a) + A(x)) = A(a) + A(x) + v = f(a) + A(x). (18.228) 


Donc f est affine et l’application qui serait notée uyy dans (8.27) est um = À pour tout M. 
(5) Si f(x) = Y(v, A)x = Ax + v, nous avons 


f(a+x) = Y(v, A)(a + x) = f(a) + A(x), (18.229) 


et donc À est bien la partie linéaire de f. 


REMooLUEZoo!lwvTqu 
Remarque 18.80. 
Notons au passage la loi de groupe sur les couples qui est donnée, pour tout v,v e R”, A,A'E€e 
SO(n), par | 
(v, A) : (v’, A") = (Av! + v, AA’) FAP 530)) 


comme le montre le calcul suivant : 


(uv, À) : (v', Az = (v, A)(A'x + v’) (18.231a) 
= AA'x + Av'+v (18.231b) 
= (Av + v, AA')x. (18.231c) 

PROPooDHYWooXxEXv1 


Proposition 18.81 ([522]). 
Soient n > 1 et R un élément de O(n) de déterminant —1 tels que R? = Id. En posant C2 = {Id, R} 
nous avons 


Ofn) = SO(n) x, Co (18.232) 


Démonstration. Notons qu'un élément À comme décrit dans l'énoncé existe. Par exemple il y a 
Papplication (x1,...,%n) > (—%1,%2,...,%n). 
Cela étant dit, nous allons montrer que 


D: SO(n) x C2 — On) 


7 (18.233) 


est un isomorphisme. 
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(1) Injectif Soient À, B € SO(n) et h,k € C2 tels que Y(A,h) = Y(B,k), c'est-à-dire tels que 
Ah = Bk. Puisque det(A) = det(B) = 1, nous avons det(h) = det(k). Mais comme C2 
contient un élément de déterminant 1 et un élément de déterminant —1, nous avons h = k. 


De là À = B. 


(2) Surjectif Soit X € O(n). Si det(X) = 1 alors X € SO(n) et X = Y(X, 1). Si par contre 
det(X) = —1, alors XR € SO(n) parce que det(XR) = 1, et nous avons 


Y(XR,R) = XR? = X. (18.234) 
(3) Morphisme Nous avons 
#((A, h)(B, r)) = p(Apn(B),hk) = A(hBh°!)hk = AhBk, (18.235) 
tandis que 
Y(A, hYY(B,k) = ARBRK, (18.236) 


qui est la même chose. 


18.8 Isométries dans R’ 


Définition 18.82. 


Un hyperplan de R" est un sous-espace affine de dimension n — 1. 
LEMooPXIO0o00S1MIIY 


Lemme-Définition 18.83. 
Si un hyperplan H de IR” est donné, et si x € IR”, il existe un unique point y € R” tel que 


(2) Le segment [x, y] coupe H en son milieu. 


La réflexion on est l'application ox: R°? — IR" qui à x fait correspondre ce y. 


Démonstration. Il faut vérifier que les conditions données définissent effectivement un unique point 
de R”. Soit A le sous-espace vectoriel parallèle à H et une base orthonormée {e1,...,en_1} de Ho. 
Nous complétons cette partie en une base orthonormée de IR’ avec un vecteur e,. Si H = Ho +, 
quitte à décomposer v en une partie parallèle et une partie perpendiculaire à H, nous avons 


H = Ho + Xen (18.237) 


pour un certain À. 

Une droite passant par + et perpendiculaire à H est de la forme t+ x +ten. Six =), me 
alors l’unique point de cette droite à être dans H est le point tel que then + ten = Àen, c’est-à-dire 
t= —x,. L’unique point y sur cette droite à être tel que [x,y] coupe H en son milieu est celui 
qui correspond à t = 2(À1 — x). 


Lemme 18.84. 
Soit un hyperplan vectoriel Ho de R". Nous considérons une base {e1,...,en} de R” telle que 
{e1,...,€n-1} soit une base de Ho et en L Ho. 


Soit l’hyperplan affine H = Ho + Xe. 
La réflexion de plan H est donnée par 


o:R'—R" EQcoRTULO RE PEUEN 


ze x —2(ïn — À)en. 
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Démonstration. En posant y = x — 2(x, — À), nous avons 


zx — y = 2{%n — À)en L HA, (18.239) 
et 
x+y 2x —2(x» — Àjen = 
D — 5 = t— (xn — À)en = > tie; + Àen € Ho + Àen = H. (18.240) 
i=1 
Les deux conditions de la définition 18.83 sont donc vérifiées. 
LEMooWYVRooQmWqvM 
Lemme 18.85. 
Si Ho est un plan vectoriel, si {e1,...,e»_1} est une base de Ho, si en L Ho et si H = Ho + Xe», 
alors 
OH = OHo + 2ÀEn. (18.241) 


Démonstration. En posant À = 0 dans la formule (18.238), nous avons oy,(x) = x — 2znen. Nous 
avons donc 
ox(x) = x +2(À — zn)en = T — 2Tnen + 2Aen = OH(X) + 2hen. (18.242) 


Le lemme suivant est une généralisation du fait que tous les points de la médiatrice d’un 
segment sont à égale distance des deux extrémités du segment (très utile lorsqu'on étudie les 
triangles isocèles). 


LEMooDPLYooJKZxiM 
Lemme 18.86 ([522]). 
Soient deux points distincts x0, yo € R" l’ensemble H € IR" donné par 
H = {xe R" tel que d(x, to) = d(x, yo)}. (18.243) 
Alors 
(1) H est hyperplan. 
(2) H L y — to 
(3) H contient le milieu du segment [xo, %|. 
Démonstration. Nous savons que 
d(x, to)? = {x — x0,x — 0) = [x]? + |xol? — 2x, ro), (18.244) 
ou encore 
Ixol? — |yol* = 2x, xo — yo). (18.245) 
En posant v = yo — xo et en considérant la forme linéaire 
:R'—-R 
Ê (18.246) 
Tr (,v), 


Nous avons x € H si et seulement si 8(x) = 1(|yo|?—|xo|?) = À. En d’autres termes, H = 87 1(\). 
Par la proposition 8.27 la partie H est un sous-espace affine. C’est même un translaté de ker(B), 
et comme ker(5) est l’espace vectoriel des vecteurs perpendiculaires à v, nous avons dim(H) = 
dim (ker(8)) = n —1. 

Le fait que H contienne le milieu du segment [x0, yo] est par définition. 


Pour le lemme suivant, et pour que la récurrence se passe bien nous disons que l’ensemble vide 


est un espace vectoriel de dimension —1. 
LEMooJCDRooGAmlwp 


Lemme 18.87 (Cartan-Dieudonné{[523, 524]). 
Soit un espace euclidien E de dimension n. 


18.8. ISOMÉTRIES DANS R\ 1583 


ITEMooFYEDoo1JZB;jP 


(1) Si f est une isométrie de E satisfaisant 


dim(Fix(f)) =n—Kk (18.247) 


alors f peut être écrit comme composition de k réfiexions hyperplanes. ITEMooJTZVooWvyfDD 


(2) Une isométrie de E peut être écrite sous la forme de rk(f — Id) réflexionteMgg te AS EEE 


(3) Toute isométrie de E peut être écrite comme composition de n + 1 réflexions. 


Démonstration. Les deux parties importantes à démontrer sont les points (1) et la partie « pas 
moins » de (2). Le reste proviendra de reformulations. 


(1) Pour (1) Nous faisons une récurrence sur k > 0. 


es 


Pour l’initialisation, si k — 0 alors dim (Fix( Î )) = n, c’est-à-dire que f fixe tout IR”, autant 
dire que f est l’identité, une composition de zéro réflexions. 
Pour la récurrence, nous supposons que le lemme est démontré jusqu’à k > 0. Soit donc 
f € Isom(R”) tel que 

dim (Fix(f)) =n—(k+1). (18.248) 
Puisque k > 0, la dimension de Fix(f) est strictement plus petite que n, donc il existe un 
xo € R” tel que f(xo) À to. Nous posons 


H={xeE tel que d(x,xo) = d(x, f(xo))}. (18.249) 


Par le lemme 18.86, ce H est l’hyperplan orthogonal à v = f(x0)— 0 et passant par le milieu 
du segment [xo, f(xo)]. 
Nous posons g = ox 0 f. Comme g(xo) = ox(f(xo)) = vo, ce xo est un point fixe de g. Le 
fait que ox ( Î (xo)) = x0 est vraiment la définition de l’hyperplan AH. 
Nous avons donc 

zo € Fix(g)\ Fix(f). (18.250) 


Mais nous prouvons de plus que Fix(f) € Fix(g). En effet si y € Fix(f) alors y € H parce 
que 


d{y, 0) = d(f{y), f(xo)) = d(y, f(xo)). (18.251) 
Puisque y € H nous avons y € Fix(g) parce que 
g(y) = ox(f(y)) = on(y) = y. (18.252) 


Tout cela pour dire que l’ensemble Fix(g) est strictement plus grand que Fix(f). Et comme 
ce sont des espaces affines, nous pouvons parler de dimension : 


dim (Fix(g)) > dim (Fix(f)). (18.253) 


Par hypothèse de récurrence, l’application g peut être écrite comme composition de k ré- 
flexions. Donc l’application 

Îf=0H0g (18.254) 
est une composition de # + 1 réflexions. 
Pour (2), existence 


Ce point est une reformulation du point (1). Le fait est que Fix(f) = ker(f — Id) parce que 
x € Fix(f) si et seulement si f(x) = x si et seulement si (f — Id)x = 0. Nous utilisons le 
théorème du rang 4.46 à l’endomorphisme f — Id : 


dim (Fix(f)) = dim (ker(f — Id)) = dim(Æ) — rk(f — Id). (18.255) 


En remplaçant par les valeurs : 


n—k=n-—rk(f — Id). (18.256) 


Or le point (1) donnait f comme composée de n — k réflexions. Donc f est composée de 
rk(f — Id) réflexions. 
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(3) Pour (2), « pas moins » 


Supposons que f = 010...00, où 6; est la réflexion de l’hyperplan H;. Nous devons prouver 
que r > rk(f — Id). Nous avons 


a H; € ker(f — Id). (18.257) 
i=1 


D'autre part, la proposition 9.304 nous donne dim, H; > n —r. Donc 


n—r< dim ( a H;) < dim (ker(f —Id)) = n —rk(f — Id). (18.258) 
i=1 


Donc n —r <n—rk(f — Id) ou encore 
r > rk(f — Id). (18.259) 


(4) Pour (3) Le rang de f—Id vaut au maximum n. Donc f peut être écrite comme composition 
de n + 1 réflexions par le point (2). 


PROPooUSKEooUbNVfs 
Proposition 18.88. 
Un élément de SO(3) qui fixe deux vecteurs linéairement indépendants est l'identité. 


Démonstration. Soit un élément À e SO(3) et deux vecteurs linéairement indépendants v1, v2 € R° 
tels que Av = v1 et Av2 = vo. Puisque v, et v2 sont linéairement indépendants, le théorème de 
la base incomplète 4.13 nous permet de considérer v3 € IR° tel que {v1, v2, v3} soit une base. Dans 
cette base, la matrice de À est de la forme 


1 O0 a 
A= {0 1 b (18.260) 
0 0 ©c 


Le déterminant de cette matrice est c. Or det(A) = 1 parce qu’elle est dans SO(3). Donc c = 1. 

Le fait que À soit orthogonale implique que la troisième colonne doit être un vecteur de norme 1. 

Donc a = b = 0. 
Donc À = Id. 


CORooJCURooSRZSFb 
Corolaire 18.89. 
Tout élément de SO(3) peut être écrit comme composée de deux réflexions. 


Démonstration. Un élément de SO(3) est une isométrie de IR? parce que si À € SO(3) alors ?* 
(Az, Ay) = <A* Az, y) = x, y). (18.261) 


Donc si le rang de À est k, alors À est la composée de 3 — k réflexions par le lemme 18.87. 

Si À = Id, c’est bon parce que l’identité est la composée de deux réflexions égales. Nous 
supposons que À n’est pas l’identité. 

Comme discuté dans l'exemple 12.92, l'opérateur À possède trois valeurs propres dans C dont 
une réelle, et deux complexes conjuguées. Nous les notons À € R et à, € C. Le déterminant de 
À, qui vaut 1, est le produit de ces trois valeurs propres, c’est-à-dire A|a|?. En particulier À > 0. 

Si v est un vecteur propre correspondant à la valeur propre À, nous avons |u| = | Av| = |A|]}v| 
parce que À est une isométrie. Donc À = +1. 

Au final, À = 1. Cela signifie que À laisse au moins un vecteur invariant. Vu que À n’est pas 
l'identité, la proposition 18.88 nous indique qu’il n’y a pas d’autres vecteurs de R° à être fixé par 
A. Donc dim ( Fix(A)) = 1 et le lemme 18.87(1) s'écrit avec n = 3, k = 2 et implique que À est la 
composée de deux réflexions. 


24. Opérateur orthogonal, définition 9.40. 
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LEMooMCVKooKzmlAg 
Lemme 18.90. 
Soit un hyperplan H et un vecteur v de R". Nous avons 
TAGHSTR 0, (#h (18.262) 
Démonstration. Pour ce faire, nous considérons une base adaptée. Les vecteurs {e1,...,en-1} 


forment une base orthonormée de H4 et e, complète en une base orthonormée de R”. Soit Ho 
l’'hyperplan parallèle à H et passant par l’origine ; nous avons, pour un certain À€R, 


H = Ho + Xe (18.263) 
D'un autre côté, le vecteur v peut être décomposé en v = v1 + v2 où v1 L H et vw || H. Alors 
A) = H+v=H+uv = Hj + Xe, + v. (18.264) 


Nous pouvons maintenant utiliser le lemme 18.85 pour exprimer la transformation ©, (x) : 


Or (H)(X) = CHo(T) + 2XEn + 202 D 
Mais d’autre part, 
(moonorT, )(x) = v+on(x — v) = v + ox(x — v) + 2Xen. (18.266) 
Vue la décomposition de v = v1 + v2 nous avons oy,(v) = —v1 + v2 et donc 


EQooGOHE P 
(noonoTs !)(x) = v + ont) + v1 — v2 + 2Xen = ox + 201 + 2Xen. PRET) 


Les expressions (18.265) et (18.267) coïncident, d’où l'égalité recherchée. 


PROPooLYCUooRQgGtF 
Proposition 18.91. 
Soit un hyperplan H de R” passant par l’origine. Il existe une base orthonormée {e1,...,en} de 
R’ telle que {e1,...,en_1} soit une base orthonormée de H et en L H. 


18.8.1 Préserver l’orientation 


Le fait qu’une isométrie puisse être décomposé en réflexions est le lemme 18.87. 
DEFooUZFHooXVVLBL 


Proposition-Définition 18.92 (Isométrie positive et négative[522]). 
Nous utilisons la bijection : T(n) x On) — Isom(R”) décrite par le théorème 18.79, et nous 
définissons 

e: Isom(R”) — {+1} 


fr det (T1 F}2). 


Cette application € est un morphisme de groupes. 


(18.268) 


Nous disons que f € Isom(R") est positive ou préserve l’orientation si e(f) = 1, et nous 
notons 


Isom* (R?) = € (1). (18.269) 
LEMooVRELooESIWQ1 
Lemme 18.93. 
La partie Isom*(IR") des isométries positives est un sous-groupe de Isom(R”). 
LEMooJABDooUKHwWv 


Lemme 18.94 ([522)). 
Si H est un hyperplan et si ox est la réflexion de cet hyperplan, alors (ox) = —1. 


1586 CHAPITRE 18. TRIGONOMÉTRIE, ISOMÉTRIES 


Démonstration. Nous commençons par supposer que À passe par l’origine, de telle sorte que 6x 
soit linéaire, et que e(ox) = det(ox). 

Nous choisissons une base orthonormée de R’* comme dans la proposition 18.91 : {ei,...,en_1} 
est une base de À et e, L H. Nous avons alors 


ei sii=1,...,n—l 
ox(ei) -| à oi | (18.270) 
—En Sii=n. 
Calculons ce déterminant à l’ancienne, en utilisant les définitions 9.12 et 9.8. Nous posons 5 = 1 
pour à = 1,...,n — 1 et u, = —1, de telle sorte à avoir ox(e;) = ye;. Nous posons aussi B = 
(e1,...,€n). Ensuite c’est parti pour le calcul : 


detg (f(B)) = D «(s)] [ko (f(e:)) (18.271a) 
i=1 


SES n 


D e(s)[ [Kescsmiei) (18.271b) 
i=1 


SESn 
= V'e(s)[ [aies es). (18.271c) 
SES n i=1 


Vu que la base est orthogonale, PAT Er Ôi et il ne reste, dans la somme sur $,, que le terme 
s = Id dont la signature est e(Id) = 1. Donc 


dets (f(B)) = [Tw: = —1. (18.272) 


Et si H ne passe pas par l’origine ? Soit v € R” tel que 7,(H) passe par l’origine (prendre pour 
v l'opposé de n’importe que élément de H). Le lemme 18.90 nous indique que 


On) = TOCHOT . (18.273) 
Comme € est un morphisme, 
(or, ()) = not, |) = e(n)e(on)e(rs !) = (ox). (18.274) 
Nous avons utilisé le fait que e(g-!) = e(g)-!. Tout ça pour dire que 


(on) = e(o7,(H)) = —1 (18.275) 


parce que 7,(H) passe par l’origine. 


THOo00QEWRooYeOIfZ 
Théorème 18.95 ([522]). 
Une isométrie de (R",d) préserve l'orientation? 
nombre pair de réflexions hyperplanes. 


5 si et seulement si elle est composition d’un 


Démonstration. Le lemme 18.87 nous indique qu’une isométrie f de IR” peut être décomposée en 
réflexions hyperplanes. Le lemme 18.94 nous dit que chacune de ces réflexions est négative. Donc 
si f = 010...0 07, alors 


e(f) = e(o1)...e(or) = (—1)". (18.276) 


25. Définition 18.92. 
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18.9 Groupes finis d’isométries 


DEFooCUYLooAlbtzv 
Définition 18.96. 
Si X est une partie finie de R”, le barycentre de X est le point 
1 
3 (18.277) 
| | xeX 
où |X| est le cardinal de X. 
Cela est à mettre en relation avec la définition dans le cadre affine 8.30. 
LEMooSEZYooYceLIb 


Lemme 18.97 ([522]). 
Les applications affines de R" préservent le barycentre des parties finies. 


Démonstration. Soit une partie finie X de R” et une application affine f € AF(R?). Nous devons 
prouver que 
J(Bx) = By(x). (18.278) 


Nous savons que toute application affine est une composée de translation et d’une application 
linéaire : f = 7,0 g avec ve R’ et ge End(n,R). Nous vérifions le résultat séparément pour 7, et 
pour g. 

D'une part, 


1 
B;, = V—= 
_ AG, 24 En 


1 
(x + 0) = Br + x Su=Br+v=T(Bx). (18.279) 
xeX 


Nous avons utilisé le fait que X et 7,(X) possèdent le même nombre d'éléments, ainsi que le fait 
d’avoir une somme de |X| termes tous égaux à w. 


D'autre part, 
1 1 
Bin = md g)=g( N x) = g(Bx) (18.280) 
AE [X] 


où nous avons utilisé la linéarité de g dans tous ses retranchements. 


PROPooLAEBooWdcBoe 
Proposition 18.98. 
Points fixes d’un sous-groupe. 


(1) Soit H un sous-groupe fini des isométries de (R”, d). Alors il existe v € R” tel que f(v) = v 
pour tout f € H. 


(2) Si H est un sous-groupe de Isom(R”, d) n’acceptant pas de point fixe, alors il est infini. 


Démonstration. Le groupe H agit sur R”, et si x € IR” nous pouvons considérer son orbite 
Hz = { f(x) tel que f € H}, (18.281) 


qui est une partie finie de IR”. Considérons son barycentre vu = Byx. Soit f € H. Alors 


F(v) = f(Bux) (18.282a) 
= f(Hx) Mobbes 12 2858) 
he ROPEROONENAGEOSS 
= V, (18.282d) 


Justifications : 


— Pour (18.282b), c'est le lemme 18.97. 


26. Définition 18.96. 
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— Pour (18.282c), c’est le fait que, f € H étant donné, l’application g + fg est une bijection 
de H, donc 


f(Hx) = {(fg)(x) tel que h € H} = {g(x) tel que g € H} = Hx. (18.283) 


Bref, v est fixé par H. 


La seconde affirmation n’est rien d’autre que la contraposée de la première. 
PROPooEUFIooDUIYzi 


Proposition 18.99. 
À propos de groupes finis d’isométries. 


(1) Tout sous-groupe fini de Isom(R”) est isomorphe à un sous-groupe fini de O(n). 

(2) Tout sous-groupe fini de Isom*(IR”) est isomorphe à un sous-groupe fini de SO(n). 
Démonstration. Soit H un sous-groupe fini de Isom(R”) et v € R” un élément fixé par H (comme 
garanti par la proposition 18.98). Nous posons 

: H — Isom(R”) 


18.284 
fr Ts | o f O Ty. 


(1) d est un morphisme Les opération du type & = Adr,) sont toujours des morphismes. 


(2) d consiste à extraire la partie linéaire Si f = Ty ° g alors 


ÉCF)(x) = (Tv © Ty © 9 9 Ty)(&) (18.285a) 
= Tw-v(g(x) + g(v)) (18.285b) 
= g(x) + g(v) —v+w (18.285c) 


Mais g(v) + w = f(v) et nous savons que f(v) = v. Donc il ne reste que d(f)(x) = g(x). 


(3) d est injective Si f = mr 0 g vérifie (f) = Id, il faut en particulier que g = Id. Mais H 
est fini et ne peut donc pas contenir de translations non triviales. Donc w = 0 et f = Id. 


Donc @ est une injection à valeur dans les transformations linéaires de Isom(R”). Autrement dit, 
o est un isomorphisme entre H et son image, laquelle image est dans Ofn). 

En ce qui concerne la seconde partie, si f e Isom”*(R”), alors @(f), qui est la partie linéaire de f 
(théorème 18.79(5)), est dans O(n) avec un déterminant égal à 1. Autrement dit, @(f) € SO(n). 


L’extraction de la partie linéaire est injective ? Certe c’est prouvé, mais on peut se demander ce 
qu’il se passe si H contient deux éléments qui ont la même partie linéaire. Cela n’est pas possible 
parce si f1 = Ty, © 9 et f2 = Ty, © g sont dans À alors fifs — Tu—w est également dans A. Vu 
que H est fini, cela n’est possible que si wi = wo, c’est-à-dire si f1 = f2. 


18.9.1 Points fixés par une affinité 
LEMooGUEGo00TUXRSQ 


Lemme 18.100 ([524]). 
Si n > 3, alors toute droite est intersection de deux plans non isotropes°?. 
Démonstration. Soit une droite d dans Æ, ainsi que x € d. Soit x est isotrope, soit il ne l’est pas. 


(1) Si x est isotrope 


Étant donné que f est non dégénérée, il existe y € E tel que f(x,y) # 0. Le plan P 
Span{x, y} est alors non isotrope. En effet, considérons z € PnP+. Nous avons alors f(z, x) 
f(,x) = 0. Vu que z € P nous pouvons l'écrire sous la forme z = ax + By. La première 
condition sur z donne : 


0 = f(ar+ By,x) = Bf(y,x) (18.286) 


27. Sous-espace isotrope, définition 9.141. 
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parce que f(x,x) = 0. Étant donné que f(x,y) # 0 nous en déduisons que B = 0. La seconde 
condition donne alors f(ax,y) = 0, ce qui donne a = (0. 

Le plan P étant non isotrope, le plan P+ est également non isotrope par le lemme 9.143. 
Nous fixons maintenant ze P{. 

L'élément z n’est pas dans P parce que P n P+ = {0}. L'élément y + z n’est pas dans P non 
plus parce que P est vectoriel, y € P et zé P. 

Nous considérons donc le plan Q = Span{x, y + z}. 

Ce plan est non isotrope. En effet, soit u e Q n Q+. Nous avons u = ax + By + 2), et cela 
doit vérifier f(u,x) = f(y,y + z) = 0. Nous avons d’abord 


0 = f(u,x) = a f(x,x) +8 f(x,v) +Bf(x,2). (18.287) 
=0 #0 =0 


Nous en déduisons que 6 = 0. Il reste u = ax, et nous imposons la seconde condition : 


Vu que f(x,y) 0 et f(x,z) = 0 nous déduisons à = 0 et donc u = 0. 
Au final, les plans P et Q sont non isotropes et P n Q = d. 


(2) Si x n’est pas isotrope Nous supposons maintenant que x n’est pas isotrope. Le lemme 


9.134 sur les dimensions, appliqué à l’espace de dimension 1 engendré par x donne dim(x+)+ 
1 = dim(Æ£). Vu que dim(Æ) > 3, nous déduisons que dim(xt) > 2. 

Nous considérons une base f-orthogonale de x! (proposition 9.237). Les vecteurs de cette 
base ne sont pas isotropes. Soient y et z les vecteurs de cette base. Il nous reste à prouver 
que les plans P = Span{x, y} et Q = Span{x, z} font l'affaire. 

Vu que x n’est pas isotrope, les vecteurs y et z ne sont pas dans d; ce sont donc de vrais plans 
de dimension 2, et leur intersection est d. Montrons que P n’est pas isotrope, en considérant 
vu = ax + Bye P n P+. Vu que ve Pt, il vérifie les deux conditions f(v,x) = f(v,y) = 0. 
La première condition donne 


0= a f(x,x)+8 f(x) = af(x,x) (18.289) 
#0 =0 


parce que y € xt. Il nous reste v = By. Appliquons la seconde condition : 


0 = f(v,y) = af(y,y). (18.290) 


Le scalaire f(y,y) € K n’est pas nul parce que nous avons choisi une base orthogonale. Au 
final vu = 0, et P est non isotrope. Exactement le même raisonnement montre que Q n'est 
pas isotrope non plus. 


PROPooVEEU00JQmmkN 
Proposition 18.101 ([522]). 
Si une isométrie de R” fixe un ensemble F de points, alors elle fixe l’espace affine engendrée par 
F. 


Démonstration. Soit f € Isom(R”) fixant F. Par le théorème 9.155, c’est une application affine et 
l’ensemble Fix(f) des points fixés par f est un sous-espace affine de R”, grâce à la proposition 8.61. 
Donc Fix(f) est un espace affine contenant F. Puisque l’espace affine engendré par F est 


l'intersection de tous les espaces affines contenant F, il est en particulier contenu dans Fix(f). 
CORooZHZZooDeTzsW 


Corolaire 18.102. 
Si f et g sont des isométries de IR" qui coincident sur F', alors elles coïncident sur l’espace affine 
engendré par F. 


Démonstration. Nous considérons À = g=!0o f qui est une isométrie de R” fixant F. Elle fixe donc, 
par la proposition 18.101, l’espace affine engendré par F. Or tout point fixé par À est un point sur 
lequel g et f coïncident. 
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18.10 Classification des isométries dans R? 


18.10.1 Projection orthogonale 


Une version pour les espaces de Hilbert sera le théorème 25.7 
DEFooHXJTooNPyDFQ 


Proposition-Définition 18.103. 
Soient un espace euclidien de dimension finie (E, : ), un sous-espace vectoriel Ho aïnsi que a, d € 
E. Nous considérons le sous-espace affine H = Ho + d. 

Il existe un unique y € H tel que 


la — y] = inf{la — x] tel que x e H}. (18.291) 


Ce y est la projection orthogonale de a sur H et est notée projr(a). 
LEMooXZMFooOPTjNx 


Lemme 18.104. 
Soient un espace vectoriel euclidien (E, * ) ainsi que a € E. Nous considérons un sous-espace 
affine H de E. Sihe H, alors 

a h= projy(a) * h. (18.292) 


18.10.2 Réflexions 


Soit un espace vectoriel £ de dimension 2 muni d’un produit scalaire . Cela pourrait très bien 


être R?, mais nous allons nous efforcer de l’appeler E pour rester un peu général. 
DEFooLJKDooUaamen 


Lemme-Définition 18.105 (Caractérisation des réflexions). 
Soit une droite L de R°. Il existe une unique application f : R? — R? telle que 


(1) f(x) = x pour tout x € L. 
(2) f échange les côtés de L. 
(3) f laisse invariants les droites perpendiculaires à L et les cercles dont le centre est sur L. 


Cette application est la réflexion d’axe L. 


Démonstration. Soit x hors de £ et p la droite perpendiculaire à { et passant par x. Nous avons 
f(x) € p. En nommant P l'intersection entre £ et p, nous considérons le cercle S(P, | Px|) qui est 
un cercle dont le centre est sur £. Il contient x et donc f(x) € S(P, | Px|). 

Donc f(x) € pn S(P,|Pxl|). L’intersection entre un cercle et une droite contient de façon 
générique deux points. L’un est x, mais f(x) = x n’est pas possible parce que x est hors de Let f 
doit inverser les côtés de £/. Donc f(x) est l’autre. 

Cela prouve l’unicité. En ce qui concerne l’existence, il suffit de noter que la réflexion 64 satisfait 
les contraintes. 


LEMooZSDRooUkNYer 
Lemme 18.106. 
Soit une droite L et AE E. Alors 
EQooVUQD 
oe(A) = 2 proj(A) — À nd PSS) 
où proj, est l’opération de projection orthogonale sur la droite L. 
Démonstration. Nous posons f(X) = 2proj,(X) — X et nous allons montrer que f = o4 en 


vérifiant les conditions de la définition 18.105. Nous nous gardons bien de faire un raisonnement 
du type « nous allons montrer que f et oy coïncident sur deux points, et sont donc égales par le 
corolaire 18.102 » parce que nous ne savons pas encore que © est une application affine, ni même 
que c’est une isométrie. 

Si X € L alors proj,(X) = X et nous avons f(X) = 2X — X = X. Donc £ est conservée. 


28. Définition 9.164. 
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En ce qui concerne les deux côtés de £, il existe une application linéaire s: £ — R et une 
constante c € R telles qu’en posant {(X) = s(X) + c, la droite £ soit le lieux des points X tels que 
{(X) = 0. Un côté de la droite est { < 0 et l’autre côté est £ > 0. Nous avons : 


£(f(A)) = £(2projy(A) — À) (18.294a 
= s(2projy(A) — À) +c (18.294b 
= 2s(proj/(A)) — s(A) + c 18.294c 


= s(proj/(4)) — s(4) 
= —c—s(A) 
= (4) 


où nous avons utilisé le fait que, proj,(A) étant sur 4, s(proj,(A)) + c = 0. Nous avons donc 
(f(A)) — —{(A), ce qui indique que À et f(A) sont de part et d’autre de L. 

Si d est une droite perpendiculaire à £ et si À € d alors f(A) = 2proj/(A) — À = (proj,(A) — 
À) + AE d parce que proj,(A) € d du fait que d soit précisément perpendiculaire à £. Nous avons 
aussi utilisé le fait que si À, B,C € d alors (B — A) +C'E d; pensez que B — À est un vecteur 
directeur et que C est un point de d. 

Enfin soit K € £ et un cercle S(K,r) centré en K. Soit À € S{K,r) ; nous devons vérifier que 
f(A) = S(K,r). Le segment |A, f(A)] est par définition perpendiculaire à £. Soit M, le milieu, qui 
est sur la droite £. Les triangles AMK et f(A)MK sont rectangles en M, et |AM| = |Mf(A)|. 


Le théorème de Pythagore donne | AK| = |f(A)K|. Donc le cercle centré en X est alors préservé 
par f. 
Nous en déduisons que f = &y. 
LEMooNYIWooXanBXh 
Lemme 18.107. 
Soit une droite L dans R? ainsi que a € R°. Nous avons 
projs (oe(a)) = proj,(a). (18.295) 
PROPooFSVEooWmJsnv 
Proposition 18.108 ([525]). 
Une réflexion est une isométrie de (E,d) où d(A, B) = |A — B|. 
Démonstration. Soient À,B € E; il faut vérifier que |A — B| = |oy(A) — oy(B)|. Pour cela nous 
écrivons 
B-A=B-proj,/(B)+proj,(B) — proj/(A)+proj,(A) — À. (18.296) 
27 ———— 
=a —=b =C 
Vu que b L a et b L c (lemme 18.104) nous avons 
|B-— AÏ° =<B —A,B — A)= |af? + 2Xa, oc) + [bf? + cf. (18.297) 


Nous pouvons jouer le même jeu avec o/(B) — oy(A) en tenant compte du lemme 18.107 et que 


oe(A) — projs(A) = 2proj/(4) — À — proj(A) = —(A — proj,(4)). (18.298) 
Là nous avons utilisé le lemme 18.106. Ce que nous trouvons est que 
oe(B) — oy(A) = -a+b—c, (18.299) 
et donc encore une fois 
loe(B) — (A)? = al? + 2Xa, e) + 1bf? + cl? (18.300) 


Remarque 18.109. 

Il faut bien comprendre que si l’axe de la réflexion ne passe pas par 0 (le zéro de l’espace vectoriel 
normé (Æ, |.|)), la réflexion n’est pas une isométrie de (E, |.|) au sens où nous n’avons pas |loy(x)| = 
FI 
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18.10.3 Segment, plan médiateur et équidistance 
LEMooSZZWooPDHnG1 


Lemme 18.110. 
Un point M est sur la médiatrice du segment |A, B] si et seulement si |M — A] = |M — B|. 


Démonstration. Nous posons 1 = (A + B)/2. D'une part l'expression que M est sur la médiatrice 
est que 
(M-1)-(4A-B)=0. (18.301) 


D'autre part, l’expresson d’être équidistant de À est de B est 


LM — AÏ? - |M - Bf? =0. (18.302) 


La preuve consiste à montrer que 


2(M — I) - (B— À) = ||M — Af°? - |M - B|°. (18.303) 


Pour cela, il suffit d’injecter 1 = (A + B)/2 et d'effectuer les produits. 
Nous avons par exemple 


2M-—I)-(B—-A)=(2M-A-B):(B-AÀ) (18.304a) 
=2M - B-2M:-A-A-B+|A|-|B|+4A.8B (18.304b) 

=2M - (B-— A)+|A|?-|B/°. (18.304c) 

LEMooVBVUooOTFFXT 


Lemme 18.111. 
Soient À et B deux points de R°. Alors le plan médiateur du segment [A, B] est le lieu des points 
de R° qui sont équidistants de À et B. 


Démonstration. Nous nommons © ce plan. 
Soit X un point équidistant de À et B. Alors dans le plan (A, B, X), le triangle ABX est isocèle 
en X, et la hauteur issue de X coupe perpendiculairement |A, B] en son milieu. Cela prouve que 
X est dans le plan médiateur du segment [A, B] (lemme 18.110). 
Réciproquement, supposons que X soit dans le plan médiateur de [ A, B]. Soit M le point du 
segment |A, B] équidistant de À et B. Nous avons (X, M) L (A, B). Donc le triangle À, B, X est 
isocèle en X et donc X est équidistant de À et B. 


LEMooTCIEooXdyuHu 
Lemme 18.112. 
Si A’ est l’image de À par o4 alors L est la médiatrice du segment |A, A]. 
Démonstration. Soit M € £. Nous avons 
LA M? = | proj,(A) — AJ? + |proj,(4) - MI? (18.305) 


parce que À — projy(A) L M — proj/(A). Par ailleurs, vu que oy(A) = 2proj,(A) — À et que 
proj,(A) — proj/(4'), 
Iproje(A) — A] = Iprojs(4!) — 4]. (18.306) 


Nous avons donc 
lce(A) — MI? = |A - M, (18.307) 


ce qui prouve que M est sur la médiatrice de | 4’, A] par le lemme 18.110. 


18.113. 

Si l'est une droite dans IR?, nous avons la réflexion o7 € Isom(IR?) d’axe {. Cela est une isométrie 
et donc une application affine par le théorème 9.155. Le lemme suivant détermine comment la 
réflexion ©, se décompose en une translation et une application linéaire. 
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LEMooVOJLooCFgdNG 
Lemme 18.114. 
Soit une droite £. Alors 
Te = T2w © OL (18.308) 


où Lo est la droite parallèle à L passant par l’origine, et w est le vecteur perpendiculaire à £ tel que 
Lo = L + w. 


Démonstration. Il faut trouver trois points non alignés sur lesquels les deux applications coïncident ; 
cela suffira par le corolaire 18.102. 
Pour tous les points de Lo, l'égalité fonctionne parce que si x € Lo, 


og(x) = x + 2w, (18.309) 

tandis que 
04€) + 2w = x + 2w (18.310) 

du fait que o4,(x) = x. 
Si x € L, alors 

o(x) = x (18.311) 

tandis que 
Ca(E) + 2w = x — 2w + 2w = &. (18.312) 


Donc les applications affines 04 et x + oy,(x) + 2w coïncident sur £ et {. Elles coïncident donc 
partout. 


LEMooRVKEooS1IrIR 
Lemme 18.115 ([522]). 
Une isométrie de (R?, d) firant tous les points d’une droite est soit l'identité soit la réflexion de 
cette droite. 


Démonstration. Soit | une droite fixée par f, et soient x,y € l et z  L (avec x Æ y). Le fait que x 
et y soient des points fixes de f implique 


d(x, f(2)) = d(x, 2) (18.313a) 
d(y, f(z)) = d(y, 2) (18.313b) 


ce qui signifie que f(+) est sur l'intersection des deux cercles” S{x,d(x,2)) et S(y,d(y,z)), et 
comme ce sont deux cercles centrés sur la droite {, les intersections sont liées par 07. Autrement 
dit, les intersections sont z et o7(z). 

Si f(z) = z alors f fixe trois points non alignés et fixe donc R?, c'est-à-dire f = Id. 

Si par contre f(z) = oy(z) alors les isométries f et oy coïncident sur trois points et coïncident 
donc partout par le corolaire 18.102 : f = o4. 


18.10.4 Translations et réflexions 
LEMooMKTXo0oYKZcdQ 


Lemme 18.116. 
Si À E R?°, si £ est une droite de R?, alors nous avons 


PTOra(e) — TA © PTO oran (18.314) 


Démonstration. Soit x € R?. Soit v unitaire dans la direction * de £. La condition q = proj/(x) 
est le système 

{ qe (18.315a) 

(g— x): v=0. (18.315b) 


29. L’intersection existe parce que d(x, z) + d{y, z) > d(x, y). 
30. Cela signifie qu’il existe a € IR? tel que £ = a + Ru. 
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Nous voulons prouver que TA(q) = Proj,i(e (ra(x)), c’est-à-dire que 


TA(q) € TA(L) (18.316a) 
(ra(g) — ra(x)) : 0 = 0. (18.316b) 


Nous avons utilisé le fait que v est un vecteur unitaire dans la direction de TA(£) aussi bien que de 
b. 
Puisque q € L, il est bien entendu que r4(q) € TA(£). D'autre part, T4(q) — TA(x) = q — x, donc 


(ra(g) — ra(x)) : v= (gx): v=0. (18.317) 


LEMooSMMMooAqsHWb 
Lemme 18.117. 
Si L est une droite de R?, si A e R?, alors 


Tra(®) = TAOETA (18.318) 
Démonstration. Il s’agit d’un calcul mettant en scène les lemmes 18.106 et 18.116 : 


(oracTa)(æ) = 2proj,,to (TA(x)) (18.319a) 
= 2rA(projs(x)) — TA(x) (18.319b) 
= 2projy(x) +2A —x—A (18.319c) 
= 2proj,y(x) —- x + A (18.319d) 
= TA(ou(x)). (18.319) 


18.10.5 Rotations 


Définition 18.118 (Rotation en dimension 2). 
Une rotation d’un espace euclidien de dimension 2 est une composée de deux réflexions d’axes 
non parallèles. L'identité est une rotation. 


DEFooFUBYooHGXphm 


18.119. 
Quelques remarques à propos de cette définition. 


(1) Attention : nous ne parlons pas encore de rotations « vectorielles » : ici le centre de la rotation 
(que nous n’avons pas encore défini) peut ne pas être (0. 


(2) Dans la même veine : plus tard, lorsque nous saurons que les rotations sont des isométries 
de (E,d) où d(X,Y) = }X — Y}, nous allons en réalité beaucoup plus souvent parler de 
rotations centrées en l’origine qu’en un point quelconque. C’est pourquoi à partir de 18.130 
nous dirons le plus souvent « rotation » pour « rotation centrée en 0 ». D’où les énoncés 
comme « les rotations sont les matrice orthogonales » (corolaire 18.138), qui stricto sensu de 
la définition 18.118, sont faux. 


(3) Une rotation est composée de deux réflexions d’axes non parallèles. Il est cependant trop 
tôt pour décréter que l'intersection de ces axes est le centre de la rotation. Rien ne dit en 
effet pour l’instant que deux décompositions différentes de la même rotation, avec des axes 
différents donnent le même point d’intersection. 


(4) Pourquoi ajouter l'identité ? Pour avoir un groupe. Dans le cas vectoriel, il est suffisant de 
demander d’être une composée de deux réflexions, parce que toutes les réflexions vectorielles 
ont des axes qui s’intersectent en 0. Le cas des axes parallèles est seulement le cas des axes 
confondus et revient à l’identité. 

Si nous voulons avoir un groupe même pour les rotations centrées ailleurs qu’en zéro, nous 
devons ajouter « à la main » l’identité. 
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Toutes ces remarques se résument par : « tout devient compliqué du fait que nous voulons 
considérer également les rotations centrées ailleurs qu’en zéro ». En se contentant du cas vectoriel, 


de nombreuses choses sont plus simples. 
CORooNKKIooPGOUJI 


Corolaire 18.120. 
Si À £ B dans E alors il existe une unique réflexion envoyant A sur B. 


Démonstration. En ce qui concerne l'existence, la réflexion dont l’axe est la médiatrice de |A, B] 
fait l’affaire. En ce qui concerne l’unicité, le lemme 18.112 nous dit que si À est envoyé sur B, l’axe 
est forcément la médiatrice de [A, B]. 


LEMooIJELooLWqgBfE 
Lemme-Définition 18.121 ([526|). 
Soit une rotation r = 01 0 o2 différente de l'identité. 


(1) Elle admet un unique point fire. 
(2) Ce point fixe est l'intersection des axes {1 n L2. 


Le centre d’une rotation (autre que l'identité) est cet unique point fixe. 


Démonstration. Nous nommons O = {1 n {2. Soit AE FE, et supposons que r(A) = À. Nous avons 
0107 = o2 et donc 
o1(À) = (o10r)(A) = o2(À). (18.320) 


On pose B = o1(A). Alors o1 et o2 envoient tous deux À sur B. 
Si À = B alors À est fixé par o1 et donc appartient à /1. Même chose pour À qui est fixé par 
02, et donc À € #2. Cela donne À = B = O, et alors, le point fixé par r est O. 
Si À £ B alors il existe une unique réflexion envoyant À sur B (corolaire 18.120). L'unicité 
signifie que 01 = 02. Dans ce cas, r = 01 0 02 = Id. 


NORMooDPBOooKKkRuTn 
18.122. 
La rotation o1 0 o2 laisse évidemment fixé le point {1 n Lo. Si o10 02 = 04, 00% alors rien n’oblige les 
axes de o1 et o2 d’être identiques à ceux de o, et o4. Mais l'intersection {1 n £2 doit être la même 
que l'intersection £, n { parce que c’est l’unique point fixé par la composée. Cela nous permet de 


poser la définition suivante. 
LEMooTZNWooTVOklu 


Lemme 18.123. 
Les rotations sont des isométries pour la distance : | X — Y| = }r(X) —r(Y)|. 


Démonstration. Si r = 01002, en utilisant le fait que o1 et o2 sont des isométries de (E, d) (18.108) 
nous avons : 


d(X,Y) = d(o2(X),02(Y)) = d(o102(X),0102(Y)) = d(r(X),r(Y)). (18.321) 
Ce lemme nous dit qu’une rotation de centre © vérifie |OX| = |Or(X)| pour tout X. 
PROPooNXJKooEDOczh 


Proposition 18.124 ([1, 526]). 
Soient À, B,0 € E tels que | AO] = |BO] Z 0. Alors il existe une unique rotation r centrée en O 
telle que r(A) = B. 


Démonstration. Existence et unicité séparément. 


(1) Existence Si À = B, l'identité fait l'affaire. Sinon, |A — O] = |B — O| implique que 
la médiatrice de [ A, B] contient O. Soit o, la réflexion selon cette médiatrice. La rotation 
Om © O(AO) Convient. 
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(2) Unicité Soit r une rotation de centre O et telle que r(A) = B. Si À = B alors r = Id 
parce qu’une rotation autre que l'identité ne fixe que son centre par le lemme 18.121. Nous 
supposons que À # B. 


Nous posons g = Om © r. Alors g(A) = 6m(B) = À parce que om(B) = À et r(A) = B. Cela 
signifie que g est une isométrie qui fixe À. 


(2a) 


(2b) 


Si À et O ne sont pas alignés Attention : ici O est un point de Æ, pas le zéro de 
l’espace vectoriel E. Lorsqu'on dit que À et © ne sont pas alignés, nous parlons bien 
d’alignement avec le zéro de E. 


Nous avons g(A) = A et g(O) = O. Donc g coïncide avec a(410) en deux points non 
alignés, c’est-à-dire en deux points pour lesquels l’espace engendré est tout E. Nous en 
déduisons que g = (40). 

Si À et O sont alignés Soit maintenant un point C tel que A—-O1C-Oet 


OC] = |OAÏ = 1081. (18.322) 


Puisque g est une isométrie pour la distance sur E, pas pour la norme, nous ne pouvons 
pas écrire g(C — O) L g(A — O) à partir de C — O L À — O. Nous décomposons 
g(X) = s(X) + G où s est linéaire sur Æ. Il est vite vu que s est une isométrie de 
(E, 1.1) : 
IX —Y] = Ig(X) — 91 = 1s(X) + G— (T7) — GI = 1s(X) — s(Y)] = Is(X — Y)] 
(18.323) 


pour tout X,Y € Æ. Nous avons de plus g(A) = A et g(O) = O, ce qui donne O = 
s(0) + Get À = s(A) + G. En égalisant les valeurs de G nous avons 


Dao) = 4:00). FASO OR EU) 
Comme s est une isométrie (une vraie) nous avons 
s(A — O) L s(C — O), (18.325) 


mais s(A — O) = s(A) — s(0) = A — O par (18.324). Donc 


AOC 0). (18.326) 


Nous en concluons que s(C — O) = +(C'—O). Parce que les vecteurs +(C — O) sont les 
deux seuls de norme | AO| = |C'O| à être perpendiculaire à À — ©. Rappel : la définition 
de C’, et le fait que nous soyons en dimension 2. 


Est-il possible d’avoir s(C — O) = C'— O7? Cela donnerait 
g(A—-0)=s(4A)-s(0)+G=s(A)-0+0-s(0)+G=A-O+G  (18.327a) 
gC-0)=C-0+G\, (18.327b) 


ce qui signifierait que g et Ta coïncideraient sur les points À — O et C — O, et donc 
seraient égaux par le corolaire 18.102. Cela est cependant impossible parce que g fixe au 
moins les points À et © alors que la translation ne fixe aucun point. Nous en déduisons 
s(C—0)=-(C-0). 


Nous avons aussi, parce que (AO) est une droite passant par l’origine que 
a(40A—-0)=A—-O (18.328) 
et parce que C — O est perpendiculaire à cette droite : 
g(4Oy(C — O0) = —-(C —- O). (18.329) 


Nous avons donc quand même que g et 6(40) coïncident sur deux points non alignés : 


A-O0æ&C-0. 
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Dans tous le cas, g = 0(40). Nous avons donc 
T(OA) = OmOT, (18.330) 


et donc r est fixé à 
T = Om © C(OA)- (18.331) 


18.125. 

Anticipons un peu et faisons semblant de déjà connaitre les matrices et les fonctions trigonomé- 
triques. La proposition 18.124 nous dit qu’il existe une seule rotation amenant À sur B. Vous 
pourriez objecter que le point (1,0) peut être amené sur (0, —1) soit par la rotation d’angle 31/2, 
soit par celle d'angle —7/2. Il n’en est rien parce que ces deux rotations sont les mêmes ! Pensez-y. 
En tant qu’application IR? — IR?, la rotation Rary2 est égale à R_,,2. 


Une rotation donnée peut être écrite de beaucoup de façons comme composée de deux réflexions. 


En fait d'autant de façons qu'il y a de réflexions. 
PROPooKAZEooLTHWKe 


Proposition 18.126 ([526]). 
Soit une rotation r de E centrée en O. Pour toute réflexion o4 telle que le centre de r soit sur L, 
il existe une réflexion 01 telle que r = 010 64. Il existe aussi une réflexion o2 telle que r = 0p0 o2. 


Démonstration. Si r = Id c’est bon avec o1 = 02 = ©y. Sinon nous considérons À £# O sur £, et 
B = r(A). Nous savons que B Æ À parce que O est le seul point de E fixé par r (proposition 18.121). 
Il existe une réflexion (unique) o1 faisant o1(A) = B, et c’est la réflexion dont l’axe est la médiatrice 
de [A, B]. Le point © est sur cette médiatrice parce que les rotations sont des isométries de (E, d) 
(lemme 18.123). 
La rotation o1 0 o4 vérifie 
(o1 © oe)(A) = o1(A) = B. (18.332) 


Or |OA| = |OB|, donc il y a unicité de la rotation centrée en © portant À sur B (proposi- 
tion 18.124) ; nous avons donc r = 01 0 ©. 

En ce qui concerne r = 04 0 0», il faut appliquer ce que nous venons de faire à la rotation rl : 
il existe 02 tel que r 1 = 02 0 oy, ce qui donne 


eo (18.333) 


18.10.6 Rotation d’un angle donné 
DEFooADTDooKIZbrw 


Lemme-Définition 18.127. 
Soit 0 E R. Nous considérons l'application linéaire Ro(0): IR? — IR? dont la matrice dans la base 


canonique est! 
0m RQ (18.334) 
sin(@)  cos(6) 
ITEMooIEKJooZfsAui 
(1) Nous avons 


Ro(8) = 0605 0800) 


où s est la réflexion d’axe horizontal et L est la droite 
. cos(0/2) 
£=R 0) | (18.336) 
ITEMooBEYOooMHRRYK 
(2) L'application Ro(0) est une rotation autour de (0,0). 


31. Pour la définition des fonctions trigonométriques, définition 18.1. 
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ITEMooEQPAooQcsYf; 
(3) Si AEeR?, alors l'application 


RA(6) = rA° Ro(6)o T3! LD TRS) 


est une rotation autour de À nommée rotation d’angle 6. 


Démonstration. Nous allons prouver l'égalité (18.335) en calculant les deux membres sur les vec- 


1 
teurs () et () qui forment une base. 


(1) Pour p= (1,0) D'abord la chose facile * : s(1,0) = (1,0). 
Pour calculer o/(1,0), nous utilisons le lemme 18.106; nous commençons par chercher la 
projection orthogonale q de p = (1,0) sur £. Nous posons 


en oi EQOOUF Ho RucR 


sin(0/2) 


et nous cherchons À satisfaisant q * (q — p) = 0. Un peu de calculs passant par (18.5) nous 
donne 


q: (g—p) = A(A— cos(8/2)). (18.339) 


Les deux solutions sont À = 0 et À = cos(4/2). Mais la solution À = 0 revient à dire que la 
droite £ est verticale, c’est-à-dire cos(9/2) = 0. Donc la solution est toujours donnée par 


À = cos(4/2). (18.340) 


Nous introduisons cette valeur dans (18.338) pour fixer q, et nous utilisons la formule du 


lemme 18.106 : 
ne _ { 2cos2(8/2)—1 \  fcos(6) 
d (1) Lc: é cos(/2)sin(0/2)) — Vsin(0) / (18.341) 
Nous avons utilisé les formules trigonométriques de duplication d’angle (corolaire 18.15). 


(2) Pour p= (0,1) Cette fois s(p) = (0,—1) et l'équation pour déterminer À est 


D. __fAcos(8/2)\ Xcos(0/2) 
Ve se L sin(8/2) — 1)" 1e 
Nous trouvons À(\+ sin(0/2)) = 0. Le cas À = 0 signifie que la droite £ est horizontale et 
donc que sin(0/2) = 0. Donc la solution est dans tous les cas 


À = —sin(0/2). (18.343) 


o Le —Iq—p=— F0 | (18.344) 


Le calcul de cv 0 s étant effectué sur une base, il est facile de reconstituer la matrice 


cos(0) —sin() 
Le. cos(@) L GE, 


Nous trouvons 


Cette matrice étant celle, par définition, de Ro(@), nous avons montré que Ro(@) était bien une 
rotation. Nous avons prouvé les points (1) et (2). 


32. Ici comme partout dans le Frido nous ne faisons aucune différence entre (a, b) et () ; ce sont seulement deux 


façons différentes d'écrire le même élément de IR?. Nous ne faisons pas semblant de croire que l’un ou l’autre serait 
un « covecteur » suivant que l’on tourne notre page dans un sens ou un autre. 


18.10. CLASSIFICATION DES ISOMÉTRIES DANS R? 1599 


Nous passons maintenant au point (3). Il est facile de voir que À est un point fixe de RA(6) 
parce que T4 (A) = (0,0). 

Nommons !’ la droite horizontale R(1,0). Nous avons, par le point précédent Ro(4) = 090 op. 
En introduisant astucieusement Fa" dans l’expression définissant R1(Ô), nous avons 


A 1 1 
RA(O) = TAOYONTA = TAO(TA TAONTA = Ora(DOra(#')- (18.346) 
OTAG)  Ora(e!) 


Nous avons utilisé le lemme 18.117. 
Nous voyons que R1(0) est une composée de deux réflexions se coupant en À. C’est donc une 
rotation centrée en À. 


18.10.7 Rotations vectorielles 


L'expression « rotation vectorielle » signifie rotation centrée en zéro. Elles sont « vectorielles » 


parce qu’elles sont linéaires comme nous le voyons à présent. 
PROPooTFNSooFjiWHG 


Proposition 18.128. 


Quelques résultats à propos de rotations. ITEMooONJOooRgycsQ 


(1) Toutes les rotations de R? centrées en (0,0) sont de la forme Ro(6) porn aber 
(2) Les rotations de R? centrées en (0,0) sont des applications linéaires. ITEMooSIHZooBE Jhdu 


(3) Sir est une rotation dans R?, il existe Ae R? et0eR 
r =TAo Ro(8)o ri. (18.347) 
Démonstration. Soit r une rotation centrée en (0,0). Par la proposition 18.126, il existe une droite 


{ passant par (0,0) telle que r = 00 s où s est la réflexion d’axe horizontal : s(x,y) = (x, —y). 
Soit un vecteur unitaire v € £. Puisque v € S!, la proposition 18.58 nous donne t € [0,27 tel 


que 
v = (En) (18.348) 


£=R ee. , (18.349) 


En posant 0 = 24 nous avons 


sin(0/2) 


et donc r = Ro(Ë) qui est l'application linéaire définie en 18.127. Ceci prouve les points (1) et (2). 
Et enfin nous voyons le point (3). Soit À l’unique point fixe de la rotation r. Cette dernière 
s'écrit alors r = 04, © cv, où L et {2 sont des droites telles que {1 n {2 = {A}. 
En utilisant le lemme 18.117, nous avons o0y, = TA 0 Orni(e) © F3”. En substituant, et en nous 


rendant compte que T3 TA = Id, nous avons 
T= ou on — TAroT | (18.350) 


où ro est la rotation Gyi(e) © Trot (£2). Cette dernière est une rotation autour de (0,0) parce que 


ra (4)nrx}(£2) = {0}. Elle est donc, par le point (1), de la forme Ro(@), pour une certaine valeur 
de 6. 


PROPooWMESooNJMdxf 
Proposition 18.129 ([526]). 
Les rotations basées en (0,0) forment un groupe abélien. 


Démonstration. L'identité est une rotation par définition. En ce qui concerne l'inverse, si r = 60102 
alors r—! = 0201. Nous commençons maintenant les choses pas tout à fait évidentes. 


33. Définition 18.127. 
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(1) Composition Soient des rotations r,r” centrées en (0,0). Soit également, une réflexion a 
dont l’axe contient (0,0). Alors la proposition 18.126 nous donne l'existence de 01 et 02 tels 
que r = 010 et r/ = &o2. Avec ça, la composition donne 


TT! = 010009 = 0102, (18.351) 


qui est encore une rotation. 


(2) Commutativité Soient deux rotations r et r” ainsi que des décompositions r = 010, 
r! = oo. Nous avons 


rr/ = 6102 (18.352a) 
TT = 002010. (18.352b) 


Vu que t = 020 est une rotation, nous pouvons encore appliquer la proposition 18.126 pour 
avoir { = 0201 = 603. Ainsi, 


TT = 00030 = 030. (18.354) 
Mais aussi rr/ = 0102 = t ! = o30. Nous avons donc bien rr/ = r’r, et le groupe est 
commutatif. 
NORMooOUDJooRfbDEX 
18.130. 


Jusqu'à présent nous avons parlé de rotations « affines ». Parmi elles, les rotations centrées en 
0 (zéro, l’origine de Æ comme espace vectoriel) sont de particulière importance. Ce sont des ap- 
plications linéaires, et même des isométries. Dans la suite, nous allons souvent dire simplement 
« rotation » pour dire « rotation centrée en 0 ». 

Nous allons maintenant prendre un point de vue plus vectoriel, et allons noter les points de E 
avec des lettres comme x, y, u, v et non plus, avec des majuscules, comme lorsqu'on avait un point 
de vue affine. En même temps, nous allons noter les applications E — E par des lettres comme À 


et ne plus écrire les parenthèses. Bref, nous écrivons Au au lieu de r(A). 
LEMooSYZYooWDFScw 


Lemme 18.131. 
En dimension 2, les réflexions vectorielles (c’est-à-dire dont l’axe passe par 0) ont un déterminant 
qui vaut —1. 


Démonstration. Soit une réflexion d’axe £. Prenons une base orthonormale de ÆE constituée de e: 
sur £ et de e2 L £. Alors oy(e1) = e et oy(e2) = —e2. La formule du déterminant donne 


det(os) = ef(o(e1))es (ou(e2)) — eS(or(e1))eï (oele2)) = 1 x (—1) — 0 x 0 = —1. (18.354) 


Nous utilisons de façon cruciale le fait que le calcul du déterminant ne dépende pas de la base 
choisie, lemme 9.12. 


PROPooTUJWooAjtEnQ 
Proposition 18.132. 
Les rotations ** sont 
(1) des applications linéaires orthogonales au sens de la définition 9.40, 
(2) des applications de déterminant 1, 
Démonstration. Le fait qu’elles soient linéaires est la proposition 18.128. 
Nous avons, pour tout u € E l'égalité de la norme |u| et | Au| par le lemme 18.123 appliqué à 
Y = 0. En termes de produits scalaires nous avons alors {Au, Au) = {u,u), et donc 


(A* Au, uÿ = |u|?. (18.355) 


34. Centrées en 0, nous ne le répéterons pas! 
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En particulier si {e;};=1..n est une base orthonormée de E nous avons 
(A*Aei); = e|? = 1, (18.356) 


ce qui donne | A* Ae;| > 1, avec égalité si et seulement si A*Ae; = e;. Ici nous avons utilisé le fait 
que €x,e;) = x, et le fait que pour tout à nous ayons |x| > [x;|, avec égalité seulement si x est un 
multiple de e;. 

Par ailleurs l'inégalité de Cauchy-Schwarz 11.1 nous donne 


(u|? = (A Au, u)| < |A*Aul|ul (18.357) 
et donc 
full < | A*Aul. (18.358) 
Encore une fois, en appliquant cela à u = e; nous trouvons 1 < | A*Ae;|. Puisque nous avions 
déjà l'inégalité dans l’autre sens, | A*4e;| = 1. Et le cas d’égalité est uniquement possible avec 
A*Ae; = €. 


Donc pour tout à de la base, nous avons A* 4e; = e;. Nous avons donc A* A = Id et l’application 
A est orthogonale. 

En ce qui concerne le déterminant, les réflexions sont de déterminant —1 par le lemme 18.131, 
donc À = 01 0 o2 est de déterminant 1. Nous avons utilisé le fait que le déterminant était un 
morphisme : proposition 9.13(1). 


Remarque 18.133. 
Nous ne savons pas encore que les rotations forment tout le groupe SO(2) des endomorphismes 


orthogonaux de déterminant 1. Il faudra attendre le corolaire 18.138 pour le savoir. 
LEMooMIJXooCjiQqP 


Lemme 18.134. 
L'application — Id est une rotation de R?. 


Démonstration. Soit une base orthonormée {e1,e2} de E et la rotation r = 0102 où 0; est la 
réflexion le long de l’axe L; = {te;}tem. Faut-il vous prouver que r = — Id ? La réflexion o2 retourne 
la composante y d’un vecteur écrit dans la base {e1,e2} sans toucher à la composante x. La réflexion 
o1 fait le contraire. 


18.10.8 Matrice des transformations orthogonales 


Nous donnons maintenant une forme générale (trigonométrique) pour les matrices de SO(2). 
Nous ne pouvons cependant pas invoquer les lemmes 18.135 ou 18.136 pour prétendre avoir une 
matrice des rotations, parce que nous n’avons pas encore prouvé que les rotations étaient des 


transformations orthogonales. Ce sera pour la proposition 18.139. 
LEMooAJMAooXPSKtS 


Lemme 18.135. 
Si AE O(2) alors il existe un unique (0,e) € [0,27] x {+1} tel que 


__ fcos(#) —esin(4) 
de Eo ecos() ) (18.359) 


; : : b : ; : 
Démonstration. Soit une matrice À = (° A et imposons qu’elle soit dans O(2). Le fait que À 


soit orthogonale impose 


ir a+ ab+cd 1 0 
( 1 (e ee EE (18.360) 


Nous avons alors le système 
d+c=1 (18.361a) 
b+d—1 (18.361b) 
ab + cd = 0 (18.361c) 
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La proposition 18.58 nous permet de déduire qu’il existe un unique 0 € [0,27 tel que a = cos(6), 
c = sin(#), ainsi que plusieurs a € R tel que b = cos(a), d = sin(a). 

Note : si nous voulons à € [0,27|, alors il y a unicité. Ici nous ne nous attachons pas à cette 
contrainte ; nous savons qu’il en existe plusieurs, et nous allons en fixer un en fonction de 4. Le a 
ainsi fixé ne sera peut-être pas dans [0,27|{, mais ce ne sera pas grave. 

Les angles 0 et & sont alors liés par la contrainte 


cos() cos(a) + sin(4) sin(a) = 0. (18.362) 


Utilisant l'identité (18.22c) cela signifie que cos( — a) = 0. Donc 


ae{0+ 5 + km}rez. (18.363) 

Si k est pair, ça donne 
cos(a) = — sin(0) (18.364a) 
sin(a) = cos() (18.364b) 


et alors 


__. É er à EQOoNAMKOBKAGT£d 


sin(#) cos() 
Si au contraire k est impair, alors 


cos(a) = sin(0) (18.366a) 
sin(a) = — cos(4), (18.366b) 


et 


cos(0)  sin(4) EQooJMYFo 
A ee. | ‘ Sr] 
Nous avons démontré qu'une matrice de O(2) était forcément d’une des deux formes (18.365) 
ou (18.367). Il est maintenant facile de vérifier que ces deux matrices sont effectivement dans 
O(2). (ui 
LEMooHRESooQTrpMz 
Lemme 18.136. 
Si g € SO(2), il existe un unique 0 € [0,2r{ tel que la matrice de g dans la base canonique soit 


Gates) ) Ge) 


Démonstration. Puisque SO(2) est la partie de O(2) constituée des matrices de déterminant 1, 
nous pouvons reprendre la forme donnée par le lemme 18.135 et fixer € par la contrainte sur le 
déterminant. Nous avons, en utilisant la relation du lemme 18.4, 


cos(#) —esin() _ 
det En (18.369) 


Étant donné que det(g) = 1, nous voyons que € = 1. 
CORo0GGVUooLQYGET 


Corolaire 18.137 ([1]). 
Nous avons une bijection 


d: SO(2) — [0,2x| 


cos(9) —sin(8)\ (18.370) 
ee. . L 


et un isomorphisme de groupe 
w: SO(2) — U(1) = {e}geR 


“ . > ei (18.371) 
sin(0) cos() ‘ 
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Démonstration. La première assertion est une paraphrase du lemme 18.136. Pour la seconde, il 
faut vérifier que c’est bien un morphisme et une bijection. 

Pour le morphisme, ce sont les formules d’addition d'angle du lemme 18.14 qui jouent. En ce 
qui concerne la bijection... 


(1) Surjection Comme e"+2#iT = eÏ9, tout élément de U(1) est exponentielle de 40 pour un 


0€ [0,27|. 

(2) Injection Remarquez que nous avons, pour 0 € [0,2x|, p(#"1(8)) = et, 
Soient À, B € SO(2) tels que w(A) = w(B). Soient 4,0, € [0,2r[ tels que À = #-1(8,) et 
B = # !(@%). L'hypothèse w(A) = w(B) donne 


ea = ein, (18.372) 


et donc 4, = 64 par la proposition 18.61(1). 


Nous en déduisons que À = B, et donc que vw est injective. 


18.10.9 Rotations, SO(2) et matrice de rotation 
CORooVYUJooDbkIFY 


Corolaire 18.138 ([1]). 
Le groupe des rotations centrées en (0,0) est le groupe SO(2). 


Démonstration. Nous devons prouver deux choses : 
— Toutes les rotations sont des éléments de SO(2). 


— Tous les éléments de SO(2) sont des rotations. 


La proposition 18.128 nous indique que toute rotation de IR? centrée en (0,0) est de la forme 
Ro(0), c’est-à-dire, a une matrice de la forme 


ee à EQooSJNBooNPTRZS 


sin(#)  cos(6) 


Donc toute rotation est dans SO(2). 
D'autre part, le lemme 18.136 indique que tout élément de SO(2) à, dans la base canonique, 
une matrice de la forme (18.373). Le lemme 18.127 nous indique alors que c’est une rotation. 
PROPoo0TIVooZpvLnb 


Proposition 18.139. 
Si r est une rotation de R? centrée en (0,0), il existe un unique 0 € [0,2r[ tel que r — Ro(0). 


Démonstration. Soit une rotation r autour de (0,0). Le corolaire 18.138 nous dit qu’il existe 4€ R 
tel que 


: __fcos(#) —sin(8) 
r= R5(8) = ee cos(#) ) : (18.374) 


Nous avons identifié l’application linéaire à sa matrice. L'élément (cos(@),sin(0)) est dans S!, et il 
existe donc, par la proposition 18.58, un unique t € [0,27{ tel que cos(t) = sin(0) et sin(t) = sin(0). 


Pour ce t nous avons alors 
: __ fcos(t) —sin(t) 
r = Ro(0) = Ée cost) (18.375) 


PROPoo1ISUCooRYJcwo 
Proposition 18.140. 
Nous avons la formule suivante pour la composition : 


Ro(a) o Ro(B) = Ro(a + B). (18.376) 
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Démonstration. Par définition de Ro(), dans la base canonique de IR?, la composition se calcule 
avec le produit suivant, en utilisant les formules du lemme 18.14 : 


cos(a) —sin(a)\ /cos(5) —sin(f) 
ts cos(a) ) . cos(B) ) cn) 
: ee cos(B) — sin(a)sin(B) —cos(a) sin(B) — sin(a) nn) 
sin(a) cos(B) + cos(a)sin(B) —sin(æ)sin(B) + cos(a) cos(B) 
(18.377b) 


_ fcos(a + 8) : (a + B) 
_ Le +8)  cos(a+/B) (18.377c) 


Donc dans la base canonique, la matrice de Ro(a) Ro(B) est celle de Ro(a + B). 


18.10.10 Rotation et application affine 


Nous considérons à nouveau la définition 8.12 d’une application affine ainsi que sa décompo- 
sition en application linéaire et translation donnée par le lemme 8.13. Nous voyons maintenant 
comment ces propriétés se déclinent dans le cas d’une rotation non centrée en l’origine. 


Exemple 18.141. 
Soit À € R? ainsi qu’une rotation f autour de À, c’est-à-dire une composition de deux symétries 
dont les axes se coupent en À *. Nous allons extraire de f la partie linéaire définie en 8.13. 

Il existe des axes /1 et {2 tels que {1 n L2 = {A} et tels que 


f=s2082. (18.378) 
En utilisant le lemme 18.117, 
jeta (a) ° A OtAO Se) OA = tAO S,-1(,) © S-1(6) © TA (18.379) 


Comme A € {;, nous avons O = (0,0) € #4!(4;). Donc les axes {4!(/1) et t1'(42) se coupent en O 
et nous pouvons écrire 
f=taoRotz (18.380) 


où À est une rotation centrée en © ; donc une application linéaire par la proposition 18.128. 
Nous avons 
f(x) = (ao Rotz')(x) (18.381a) 
= (tao R)(x — À) (18.381b) 
= tA(R(x) — R(A)) (18.381c) 
= R(x) + tr(4)+A (18.381d) 
= (£r(4)+A4 © R)(x). (18.381e) 


Donc 


f _ tR(A)+A o R. (18.382) 


Il est maintenant aisé de montrer que R est la partie linéaire de f. Pour tout M, x e R? nous avons 


FM + x) = R(M + x) + R(A) + À (18.383a) 
= R(M) + R(x) + R(A) + À (18.383b) 
= R(x) + f(M). (18.383c) 

Donc nous confirmons la formule 
FM + x) = R(x) + f(M) (18.384) 
et R est la partie linéaire de f, voir la définition 8.13. A 


35. Voir la définition 18.118. 
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LEMooUKEVooAEWv1M 
Lemme 18.142 ([1]). 
Tout sous-groupe fini de SO(2) est cyclique *. 


Démonstration. Soit un sous-groupe fini G de SO (2). Nous considérons les applications D: SO(2) — 
[0,27[ et w: SO(2) — U(1) données par le corolaire 18.137. 

Vu que Y(e) = 0, la partie d(G\{e}) est une partie finie de [0,27|[ qui ne contient pas 0. Nous 
en considérons le minimum 46 # 0. Gardez en tête que ce minimum n’est pas nul : 45 # 0. 

Nous allons prouver que #-1(46) génère le groupe G. Pour cela nous devons montrer que pour 
tout ge G, il existe un entier # tel que g = #!(60)". 

Soient g1 € SO(2) et 01 = d(g1). Si il existe k € NN tel que 01 = ko, alors le résultat est prouvé. 
Supposons donc que #1 = À66 avec À non entier. Nous allons en déduire une contradiction. 

Soit k la partie entière de À (définition 1.459). Vu que w est un morphisme de groupes, en 
utilisant la formule de la proposition 18.9(2) nous avons : 


pt (eiei-ko)) 2 (5-1 (ei ik00) (18.385) 
. op l(ef1)p"1 (eo) (18.385b) 
: p le) 1(et80)k (18.385c) 
e G. (18.385d) 


Nous avons donc 0 = 01 — kôo € (QG). Mais en utilisant le lemme 1.460, 


0 — 05 = 01 — (k + 1)6o < 01 — X66 = 0. (18.386) 


Cela signifie que 0 < 60, et contredit la minimalité de 6. 


18.10.11 Angle orienté 


Avant d'aborder la classification des isométries, nous devons parler de l’angle entre deux droites. 
Si 1 et {2 sont deux droites, alors il est bien clair que deux angles peuvent prétendre être « l’angle 
entre {1 et {2 ». De plus chacun de ces deux angles sont doubles parce que si & peut prétendre être 
l’angle entre {1 et £2, alors —a peut également y prétendre. 


Remarque 18.143. 
Nous ne parlons pas de l’angle entre {1 et {> mais bien de l’angle de £; à L. L'ordre des droites 
est important. 


18.144. 
Pour la suite, Ro(a) est la rotation d’angle à autour du point © tandis que R(«) est la rotation 


d'angle a autour de l’origine. 
PROPooDWIMooQPkobi 


Proposition 18.145 ([527|). 
Si u et v sont des vecteurs unitaires®" de R? alors il existe une unique rotation ® f telle que 


f(u) = v. 
Démonstration. C’est la proposition 18.124 appliquée à O = (0,0). 


Remarque 18.146. 
Notons l’unicité. Nous ne faisons pas de différence entre R9 et Ro:9, et les autres Rg:2xr. En 
particulier si une rotation T' est donnée, dire « T = Rg » ne définit pas un nombre 0 de façon 
univoque. Par contre ça définit une classe modulo 27, c’est-à-dire un élément 0 € R/2r. 

Nous avons déjà défini le groupe SO(2) en la définition 9.44 et nous avons déterminé ses matrices 
dans R? en le lemme 18.136. 


36. Définition 1.319. 
37. De norme 1. 
38. Définition 18.118. 
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La proposition 18.145 donne une application 
T: 81 x 51 S0(2). (18.387) 


Et nous avons une relation d'équivalence sur S! x S! donnée par (u,v) + (u/,v') si et seulement si 
il existe g € SO(2) telle que g(u) = u’ et g(v) = v’. 

DEFooVBKIooWlHvod 
Définition 18.147 (Angle orienté[527]). 
Les classes de S! x S! pour cette relation d'équivalence sont les angles orientés de vecteurs. 


Nous notons [u,v] la classe de (u,v). 
PROPoolWJQooGQJBWR 


Proposition 18.148. 
Nous avons T{u,v) = T(u/',v') si et seulement si (u,v) + (u',v’). 


Démonstration. En utilisant la commutativité du groupe SO(2) nous avons équivalence entre les 
affirmations suivantes : 

— (uv) = (u’,v') 

— T(u,u) = T(v,v') 

— T{u,u’) o T(u’,u) = T{(u,v')o T(u’,u) 

— Tu,v) = T(u’,v!). 


Proposition 18.149. 
Nous avons une bijection 


St x sl 
a (18.388) 


[u,v] — T(u,v). 


S': 


Démonstration. En plusieurs points. 
(1) S est bien définie En effet si [u,v] = [z,t] alors T(u,v) = T(z,t). 
(2) Injectif Si S[u,v] = S[z,t] alors T(u,v) = T(z2,t), qui implique (u,v) — (z,t) par la 
proposition 18.148. 
(3) Surjectif Nous avons R9 = T(u, Rou). 


Définition 18.150 (Somme d’angles orientés[527]). 
Si [u,v] et [z,t] sont des angles orientés, nous définissons la somme par 


Lu, v] + [2,4] = S-1 (STu, v] o S{2,41). (18.389) 
LEMooWISVooYsStJp 


Lemme 18.151. 
Quelques propriétés des angles plats liées à la somme. 


1 1 - 
(1) (S° x S°)/ — est un groupe commutatif. LTEMooBKTFooWbEvIU 


(2) Relations de Chasles : 
Lu, u] + [u,w] = [u,w]. (18.390) 


(3) —[u, v] = [u, ul. 
Démonstration. Pour la relation de Chasles, ça se base sur la propriété correspondante sur T: 
[u, v] + [u,w] = S71 (T(u, v) o T(v,w)) (18.391a) 


= 571 (T(u, w)) (18.391b) 
= [u,w|. (18.391c) 


18.10. CLASSIFICATION DES ISOMÉTRIES DANS R? 1607 


Pour l'inverse, la vérification est que 


[u,u] + [u,u] = [u,u] = 0. (18.392) 


DEFOooFLGNooCZUKHY 
Définition 18.152. 
La mesure de l'angle orienté [u,v] est [0]2r si Tlu,v] = Ro. 


Notons dans cette définition qu’écrire T[u,v] = R9 dans SO(2) ne définit pas 4, mais seulement 
sa classe modulo 27. C’est pour cela que la mesure de l’angle orienté n’est également définie que 
modulo 27. 

Pour la suite nous allons nous intéresser à des vecteurs qui ont, dans l’idée, un point de départ 
et un point d'arrivée. Si À, B € IR? nous notons 


AB = (18.393) 
|B— A] 
C’est le vecteur unitaire dans la direction « de À vers B ». 
THOooQDNKooT1Vmm; 
Théorème 18.153 (Théorème de l’angle inscrit[528]). 
Soit un cercle T de centre O et trois points distincts À, B, M ET. Alors 
AM À, MB) e (OÀ,OB)2r (18.394) 


où l’indice 27 indique la classe modulo 27. 


Démonstration. Le triangle MOA est isocèle en ©, donc les angles à la base sont égaux. Et de 
plus la somme des angles est dans [r1]2,. Bon, entre nous, nous savons que la somme des angles 
est exactement 7, mais comme nous n'avons pas défini les angles autrement que modulo 7, nous 
ne pouvons pas dire mieux. Donc 


2(AB, AO) + (OB,OÀ) € [rlor. (18.395) 


Il faut être sûr de l’orientation de tout cela. Le nombre (AB, AÔ) est l’angle qui sert à amener A 
sur AO. Vu que nous l’avons choisi dans le sens trigonométrique, il faut bien prendre les autres 
dans le sens trigonométrique, et utiliser (OÀ,OB) et non (OB,OÀ). 


O 


A B 


De la même manière sur le triangle MOB nous écrivons 


AMP, MÔ) + (OM,OB) e [x]. (18.396) 


Nous faisons la différence entre les deux équations en remarquant que la différence de deux repré- 
sentants de [r]2, est un représentant de [0]>, et en nous souvenant que (MB, MO) = (MO, MB) 
et les relations de Chasles du lemme 18.151(2) nous avons : 


AM À, MB) + (OB,OÀ) € [0]or. (18.397) 
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18.154. 
Comment exprimer le fait qu’un angle orienté soit égal à 0 modulo 7 alors que les angles orientés 
sont des classes modulo 27 ? Nous ne pouvons certainement pas écrire 


(u,v) = [6]x (18.398) 


parce que (u, v) est un élément de S1 x S1 alors que [0], est un ensemble de nombres. Nous pouvons 
écrire 
lu, wl € [él (18.399) 
C’est cohérent parce que nous avons des deux côtés des ensembles de nombres. Les opérations 
permises sont l'égalité ou l'inclusion. L'égalité entre les deux ensembles n’est pas possible parce 
que la différence minimale ente deux éléments dans [u,v] est 27 alors que celle dans [0], est 7. 
Si u et v forment un angle droit, nous avons 


Lu, v] = 6 + 2kT}rez. (18.400) 


Et cela est bien un sous-ensemble de [r/2],. 
Pour exprimer que deux angles orientés diffèrent de 7 nous devrions écrire : 


[u,v]e [a,blx (18.401) 


où le membre de droite signifie la classe modulo 7 d’un représentant de [a, b]. 
Nous allons cependant nous permettre d’écrire 


Lu, v] = [a, b]x (18.402) 
voire carrément 
(u,v) = (0,b).. (18.403) 


Cette dernière égalité devant être comprise comme voulant dire que l’angle pour passer de u à v 


est, soit le même que celui pour aller de a à b, soit ce dernier, plus . 
THOooUDUGooTJKDpO 


Théorème 18.155 ([528]). 
Soient 4 points distincts du plan À, B,C, D. Ils sont alignés ou cocycliques *” si et seulement si 


(CÀ,CB) = (DÀ, DBr. (18.404) 
Nous allons seulement démontrer l’implication directe. 
Démonstration. Si les quatre points sont alignés nous avons [CÀ,CB] = [0] et [DÀ, DB] = 


[0]2r- En particulier nous avons 
[CÀ, CB] = [DÀ, DÈ] (18.405) 


et a fortiori l'égalité modulo 7 au lieu de 27. 
Nous nous relâchons en termes de notations. Si les quatre points sont cocycliques, nous pouvons 
utiliser le théorème de l’angle inscrit 18.153 dans les triangles ABC et ADB : 


2(CÀ,CB) = (OÀ,OB)2» (18.406a) 
2(DÀ, DB) = (OÀ,OB)2r; (18.406b) 

ce qui donne 2(CÀ,CB) = 2(DÀ, DB)» et donc 
(CÀ,CB) = (DÀ, DBr. (18.407) 


Comme annoncé, nous ne faisons pas la preuve dans l’autre sens; elle peut être trouvée 
dans [528]. 


39. C'est-à-dire sur un même cercle. 


18.10. CLASSIFICATION DES ISOMÉTRIES DANS R? 1609 


EXoo0UXAAooZMdDfP 
Exemple 18.156. 
À propos de groupe engendré et de générateur *°. Soit G le groupe des rotations d’angle “! kT/5 
(avec k entier). Ce groupe est constitué des « dixièmes de tour », puisque Er = 2Er. 
La rotation d’angle 27/5 n’est pas génératrice parce qu’elle n’engendre que des « cinquièmes 
de tour » : 47/5, 67/5, 8x/5 et l'identité. 


Par contre, la rotation d’angle 7/5 est génératrice. AN 


18.10.12 Angles et nombres complexes 
SUBSECooKNUVooUBKalWm 


Les nombres complexes peuvent être repérés par une norme et un angle, ce qui en fait un terrain 
propice à l’utilisation des angles orientés. Nous en ferons d’ailleurs usage dans € = CU {oo} pour 
parler d’alignement, de cocyclicité et de birapport dans la proposition 23.87. 

Soient deux éléments 21,22 € €. Nous les écrivons sous la forme 2, = rie: et z2 = roc! 
remarquons que cela ne définit 4; qu’à 27 près. Nous avons 


@ . 
; 


Le1, 22] = [02 — d1]2x. (18.408) 


Soient maintenant à,b,c,d € C. Nous écrivons ab le vecteur unitaire dans le sens « de a vers 
b », c’est-à-dire un multiple positif bien choisi du nombre b — a. Nous notons 0,4 l'argument du 
nombre complexe b — a, et nous avons encore 


[ab, cd] = [up — da]. (18.409) 
Avec toutes ces notations, ce qui est pas mal, c’est que les produits et quotients de nombres 


complexes se comportent très bien par rapport aux angles : l'argument de a/b est 0, — @, et en 
particulier l’argument de 


a — b 
18.410 
=. ( ) 
est dans la classe de l’angle orienté 
[ba, dc]. (18.411) 
DEFooUPUUooKAPFrh 


Définition 18.157 (Angle avec 3 points). 
Soient trois points A,O,B € R?. Voici comment nous définissons l’angle AOB ; de façon infor- 
melle, c’est l’angle de la rotation qui permet d’aller de À vers B. 


— Nous nous mettons en l’origine : A = A—O et B'=B—O. 

— Nous normalisons : A” = A'/|4'| et B" = B'/|B'|. 

— Soit f, l’unique rotation telle que f(A”) = B" (proposition 18.145). 

— Soit 0 l’unique élément de [0,27{ tel que la matrice de f dans la base canonique soit 


(nt co Fe) 


par la proposition 18.139. 
— L'angle AOB est ce nombre 0. 


Nous noterons également l’angle AOB par angle(A,O, B). 


Nous voyons que l’angle est toujours un nombre entre 0 et 27. Par abus de notation, nous 
admettrons de temps en temps, de parler d'angle en dehors de cet intervalle. 


40. Définition 1.318 et 1.319 
41. Voir la définition 18.152. 
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DEFooMAKWooGRutOk 
Définition 18.158 (Angle dans C). 
Si a,b,ce ©, nous définissons l'angle angle(a, b, c) = angle (s(a), s(b),s(c)) où 
sÜ +R 
(18.413) 
T+iyr (x,y), 


et le membre de droite étant défini par 18.157. 


Avec cette définition, la multiplication dans € par un élément de $! revient à une rotation. 
C’est le lemme suivant. 


LEMooUFOHooWdglvO 
Lemme 18.159 ([1|). 
Soit : 
Re (18.414) 
T+iyr (x,y). 
Nous avons 
s(eËz) = Ro(é)s(2) (18.415) 


pour tout £ER etzeC. 


0 


Démonstration. Nous écrivons z = re” comme l’autorise la proposition 18.62. En d’autres termes, 


z = rcos(0) + irsin(4) et donc 


s(2) = (r cos(8),r sin(6)). (18.416) 
D'autre part, la proposition 18.9 donne e'£z = re'(+#), et donc 
Da r cos(0 + Ë) 
s(e"z) . +8] (18.417) 
La conclusion est un calcul : 
: __ fcos(£) —sin(£)\ /cos(8) 
rR(£)(cos(0),sin(0)) = r ie te sin(®) prop. 18.139 (18.418a) 
__ fcos(£) cos(8) — sin(£) sin(4) 
nil Le. cos(@) + cos(£) sin(8) (RER) 
__ fcos(£ + 0) 
=ÿ + à. lemme 18.14 (18.418c) 
= s(eËz). (18.418d) 
LEMooXMYDooRrNb1P 
Lemme 18.160. 
Pour tout v e S*, l'application 
s: [0,27[ — S! 
(18.419) 
0 R(6)v 
est une bijection. 
LEMooMFXWooGymSoF 


Lemme 18.161 ([1]). 
Si les points 0, R(O1)v et R(62)v sont alignés, avec 01 < 02 dans [0,27[, alors 02 € {01,01 + 7}. 


Démonstration. Supposons dans un premier temps que |v| = 1. Étant donné que R(62)v est sur 
la droite contenant 0 et R(61)v, il existe À € R tel que 
R(62)v = ÀAR(6:)v. (18.420) 


Vu que R() est une isométrie, nous avons À = +1. Si À = 1, alors nous avons R(01)v = R(62)v et 
donc 01 = 0 par le lemme 18.160. 

Si À = —1, alors en remarquant que R(T)v = —v, nous avons R(61 + ru = R(61)R(r)v = 
—R(6;)v. Donc le lemme 18.160 nous dit que 0; + 7 = 62. 
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DEFOooEGKOooRPGUAs 
Lemme-Définition 18.162 (Angle entre deux droites|[1]). 
Soient deux droites Li et L> de R? sécantes au point À e R°. 
Il existe un unique 606 € [0,r[ tel que*? RA(00)x € L2 pour tout x € L1. 
Cet angle 0 est l’angle de Li à Lo. 


Démonstration. Nous considérons le vecteur v tel que {1 = {A+tv}4em, ainsi qu’un point arbitraire 
xzo = À + Av sur 1. Nous allons montrer qu’il existe un unique 0, € [0,7 tel que RA(0\)x0 € L2. 
Ensuite nous allons montrer que 0\, = 0x, pour tout À1, A2 dans R. 

Nous considérons une application affine 


FR R 


a (18.421) 


avec u: R? — R linéaire et à € R telle que £2 = ker(f) (proposition 12.153). Nous supposons que 
f(xo) > 0 pour fixer les idées. 
Nous utilisons la formule (18.337) pour R1 ; pour tout 0 nous avons 


RA(O)(A + Xv) = (ra o R(6) o T4! )(A + Av) = TA (R(8)(X)v) = À + AR(8)v. (18.422) 
Nous avons d’une part 
f(co) = (A + Av) = u(A + Av) + a = u(A) + à + Au(v) = f(A) + Au(v) = Au(v) (18.423) 


parce que f(A) = 0 du fait que À € 42. 
De même, en tenant compte que R(x)v = —v nous avons 


RA(r)xo = u(—Av + À) + à = —Au(v). (18.424) 
Donc f(RA(r)ro) = — f(xo). 


Nous avons prouvé qu’en posant 
5: [0,x] — R? 


+ Ra(O)(A + Av), dE 


nous avons 8(0) = À + Av, s(r) = À — Av et que (fo s)(0) > 0 et (f o s)(x) < 0. Nous pouvons 
donc appliquer le théorème des valeurs intermédiaires 10.89 à la fonction continue f o s. Il existe 
00 € 10, r| tel que (f o s)(80) = 0. 

Pour une telle valeur de 4p, nous avons s(60) € ker(f) et donc RA(60)t0 € 42. 

(1) Unicité Nous prouvons que si RA(4:)x0 et RA(6@2)x0 sont sur L2, alors 01 = 02. Supposons 
que ce les points À, RA(6:1)x0o et RA(@2)x0 sont alignés sur 2. Alors les points 0, R(4;1)v et 
R(62)v sont alignés, et donc le lemme 18.161 nous assure que d = 01 + 7 ou que 01 = 62. La 
possibilité 02 = 01 + 7 est exclue parce que 61 et 02 sont dans [0,7[. Donc 41 = 62. 

Nous avons vu qu’il existe une unique angle, que nous notons 0 tel que R4(0\)(A + Àv) € 42. 


(2) Petite note au passage La droite { est l’ensemble 


La = {A + tR(O\)v}teR. (18.426) 


(3) Ce 0, fonctionne sur tout {1 Tout élément de {1 peut être écrit sous la forme x9 + pv. 
Nous prouvons à présent que si &1 = to + pv, alors RA(6)x1 € L2. Nous avons 


RA (\)v = = RA(8))(xo + uv) 
= RA(8x)(A + (À + nv) 
= R(8,)((X + uv) + A 
= (A+ u)R(6;)v + À. 


Donc cela est dans 4. 


42. Pour rappel, RA(@) est défini en 18.127. 
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PROPooKVSHooRODGWE 
Proposition 18.163 ([1]). 
Les angles sont invariants sous les translations. 
Plus précisément, si À, B,S,ve R?, alors 
T, (AT, (SYT, (B) = ASB (18.498) 


où Ty(X) = X + v. 


Démonstration. Nous notons X, = X +v. Nous avons 4! = A,—$S, = (A+v)—(S+v) = A—S = 
A”. Donc les vecteurs 4” et B"” à partir desquels est calculé ASB sont les mêmes que les vecteurs 
AY et B7 qui servent à calculer 7,(A)T,(S)T,(B). 


PROPooYWKJooRjybUJ 
Proposition 18.164 (|[1]). 
Les angles sont invariants par rotations, c’est-à-dire que si À, B,S e R? et si Ro est une rotation, 
alors 


ASB = Ro(A)Ro(S)Ro(B). (18.429) 


Démonstration. Pour être plus concis, nous écrivons 4, for Rg(A) et de même pour B et S. Afin 
de calculer l’angle R9(A)Ro(S)Ro(B), nous définissons 


À = A9 _ So (18.430a) 
Ge p (18.430b) 
pbs, (18.430c) 
et 
A9 — So 
en 18.431a 
0 T5 = 5] 
B9 — So 
Bi = TT. 18.431b 
0 = By 66] ee 


Par définition, l'angle est le a tel que R,(A4ÿ) = Bÿ. Nous devons prouver que le même a vérifie 
Ra(A”) _ B". 
Le fait que R9 soit une isométrie nous donne déjà 


| R6(A) — Ro(B)] = |A — B|. (18.432) 
Ensuite, la relation de définition de a s’écrit 


RaRo(A) — RaRo(S) _ Ro(B) — Rg(S) 


18.433 
| Ao = Soi [Bs = Sel no 
Vu que À, et R3 commutent, nous avons 
Ra(A) — RA(B) B—-S 
Ra — Ro s (18.434) 
|A — S] 1B — 5] 
et comme À est inversible, cela donne R,(4”) = B”. 
LEMooJLHGooQIpKIE 


Lemme 18.165 ([1]). 
Soit AE R? et une droite Li. Soit L> une droite passant par A et intersectant L en O. Alors 


o4 (À) = Ro(—-2a)A (18.435) 


où «a est l’angle de Li à Lo. 
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Démonstration. Nous allons utiliser des coordonnées autour de ©. Il existe un vecteur v tel que 
A=O+v (18.436) 


Par définition de l'angle a *, la droite {2 s'obtient par rotation d’angle a depuis la droite {1. Donc 
le point 


B = Ro(-a)A (18.437) 
est sur L1. 
Nous allons prouver que le point 
D = Ro(—-2a)A (18.438) 
est D = 04, A. 
Nous commençons par montrer que la droite (DA) est perpendiculaire à £1, c’est-à-dire que 
(D—A)-(B-0)=0. (18.439) 
En utilisant le fait que 
Ro(a)}(O+X)=O+R(a)X, (18.440) 


nous avons 


D — A = Ro(—2a)(O + v) — (O + v) = O + R(—2a)v — O — vu = R(—2a)v -v (18.441) 


et de la même façon, 
B-0O=R(-a)rv. (18.442) 


Notons que tous les © se sont simplifiés et qu’il ne reste que des rotations usuelles. En utilisant le 
fait que R(a) est une isométrie, nous pouvons alors calculer 


(D—-A)-(B—-0)=<R(—-2a)v— v,R(—-a)v) (18.443a) 
= {R(—-a)v — R(ajv, v). (18.443b) 


En utilisant la matrice de rotation du lemme 18.136 nous trouvons 


(R(-a) — R(a))v = és. (18.444) 
et donc 
{(R(-a) — R(a)}v, v} = 0. (18.445) 


Le point D est bien sûr la droite perpendiculaire à {1 et passant par À. Mais vu que D est 
obtenu à partir de À par une rotation, le point D est également sur le cercle de rayon |OA| et 
centré en ©. Ce cercle possède exactement deux intersections avec cette droite. Le premier est À 
et le second est y, (A). Comme D n’est pas À, nous avons D = oy(A). 


18.10.13 Polygone convexe 
DEFooBCSKooABKKtR 


Définition 18.166 ([529]). 
Un polygone est une union de segments dans R? de la forme 


Lan, ai] LL Jfa, aix]. (18.446) 


C- 


Il 
En 


U 


La définition suivante dit ce qu’est un polygone convexe. À mon avis, le théorème de Jordan 
27.200 doit permettre de donner une définition plus précise en disant que c’est la partie compacte 
qui est convexe. 


43. Définition 18.162. 
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DEFooBCDPooXTpbFq 
Définition 18.167. 


Nous disons qu’un polygone est convexe si il est la frontière d’une partie convexe de R?. 
PROPooFYRMooTqVDEm 


Proposition 18.168 ([530]). 


Un polygone est convexe si et seulement si il est contenu dans le demi-plan de chacun de ses 
côtés. 
PROPooUPPTooZBFvPg 
Proposition 18.169. 
Les racines de l’unité dans ©, c’est-à-dire la partie 
CAMES ER ne (18.447) 


forment un polygone régulier convexe *. 

Démonstration. Nous posons ay = e2#7/7 et £ = e2it/n, de telle sorte que ag:1 = £ax. Le polygone 
que nous considérons est celui formé par les segments [a;,a;+1] avec à = 0,...,n — 1. Nous savons 
que 4n = @); donc nous pouvons parler seulement de segments de la forme [a;,a;;1] sans nous 
soucier du cas particulier [a»-1, aol]. 


(1) Longueurs La longueur d’une arrête est donnée par 


lag — ax+1l = Var — Earl = laxlfl — 6] = [1 — él (18.448) 


parce que |ax| = 1. 


(2) Angles Nous avons un calcul utilisant pas mal de propriétés : 


angle(a, 41,412) = angle(élao, lai, éla2) (18.449a) 
= angle (s(£/ao), s(élar), s(£'a2)) def. 18.158 

(18.449b) 

= angle (Ro(£')s(ao), Ro(Ë!)s(a1), Ro(£')s(a2)) lem. 18.159 (18.449c) 
— angle (s(ao), s(a1), s(a2)) prop. 18.164 

(18.449d) 

— angle(ao,a1,@2). (18.449e) 


(3) Convexe Voici un squelette de preuve “. 


— Utiliser la caractérisation 18.168. 

— Tous les sommets sont sur le cercle unité. 

— Considérer d, la droite passant par deux point successifs e"°1 et e“?2. 
— Cette droite définit deux demi-plans. 


— La proposition 12.161 devrait permettre de prouver que la partie du cercle entre 4; et 
® est dans un demi-plan, et le reste dans l’autre demi-plan. 


— Il n’y à pas d’autres racines de l’unité entre 41 et @. Donc elles sont toutes dans le 
même demi-plan. 


— Les demi-plans étant convexes (lemme 12.155), les arrêtes sont dans le demi-plan. 


44. Définition 18.167. 

45. Polygone, définition 18.166, polygone convexe, définition 18.167. En ce qui concerne les angles, formellement 
c’est la définition 18.158. 

46. Je ne n'ai pas vérifié. Écrivez-moi si vous voyez un problème. 
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18.10.14 Groupe diédral 


18.10.14.1 Définition et générateurs : vue géométrique 
DEFoolWZGooAinSOh 


Définition 18.170. 
Le groupe diédral D, (n > 3) est le groupe des isométries de (C, d) laissant invariant l’ensemble 


{Le ET = 0,...,n—1} (18.450) 


des racines de l’unité. 


18.171. 

La proposition 18.169 nous permet de dire que le groupe diédral est le groupe des isométries de R? 
laissant invariant un polygone régulier à n côtés. C’est un peu pour cela que nous n’avons défini 
D, que pour n > 3; et un peu aussi pour une raison technique qui arrivera quand on parlera des 


générateurs abstraits. Voir 18.180 et ce qui suit. 
LEMooCUVPooMZKnzo 


Lemme 18.172. 
Nous avons 
D;=02R|. (18.451) 


Démonstration. Si f € D,, alors f (e2ikr/ 7) doit être l’un des e2k'7/n et puisque f conserve les 


longueurs dans €, nous devons avoir 
1 = d(0,e%k7/n) 2 q(f(0), 26 7/n), (18.452) 


Donc f(0) est à l’intersection de tous les cercles de rayon 1 centrés en les e2ikr/n ce qui montre 
que f(0) = 0 (dès que n > 3). Par conséquent notre étude du groupe diédral ne doit prendre en 


compte que les isométries vectorielles de IR?. En d’autres termes 


Dh c O(2,R). (18.453) 


PROPooELOIooVJtuZN 
Proposition 18.173 ([531]). 
Le groupe D, contient un sous-groupe cyclique d’ordre 2 et un sous-groupe cyclique d'ordre n. 


Démonstration. Nous notons s la conjugaison complexe “”. C’est un élément d'ordre 2 qui est dans 


D, parce que 
. ( CPP) = Q2n-kjir/n. Ets 


De la même façon, la rotations d’angle 27/n, que l’on note r, agit sur les racines de l’unité et 
engendre le groupe d’ordre n des rotations d’angle 2kT/n. 


Proposition 18.174 ([531]). 
Si s est la conjugaison complexe et r la rotation d’angle 2r/n, alors (sr)? = Id. 


Démonstration. Si 2" = 1, alors 


(srsr)z = (srs) (enr) = (sr) (er 2m) = 82) = 2. (18.455) 


PropLDIPoZz 
Proposition 18.175 ([531]). 
Nous notons s la conjugaison complexe et r la rotation d'angle 27r/n. 


(1) Le groupe diédral D, est engendré par s et r. ITEMoo0UEBHooULRmZk 


(2) Tous les éléments de D, s’écrivent sous la forme r"" ou sor”. 


47. C’est une réflexion ; la réflexion d’axe R dans C. 
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Démonstration. Nous considérons les points A9 = 1 et Ay = e2iT/" avec k e {1,...,n — 1}. Par 
convention, An = 4o. L'action des éléments s et r sur ces points est 


r(Ax) = A4 (18.456a) 


Cette dernière est l'équation (18.454). 

Soit fe D. Étant donné que c’est une isométrie de R? avec un point fixe (le point 0), f est 
soit une rotation, soit une réflexion. 

Supposons pour commencer qu’un des 4,4 soit fixé par f. Dans ce cas f a deux points fixes : 
O et A4 et est donc soit la réflexion d’axe (O0 A4), soit l'identité (lemme 18.115). L'identité étant 
engendrée par s et r, nous supposons que f est la réflexion d’axe (044). Dans ce cas, nous avons 
f=sor"-?k, En effet pour chaque { nous avons 


(so r72#)(A;) = s(Ain-28) = An-ttn+2x = A2. (18.457) 


Nous voyons que s or"? fixe O et Az, et donc la droite (0 A;). Elle est donc soit la réflexion 
d’axe (O0 Ay) soit l'identité. Mais elle n’est pas l'identité parce que elle ne fixe pas tous les 4}. 
Nous passons à présent au cas où f ne fixe aucun des Ax. 


(1) Supposons que f soit une rotation. Si f(Ax) = A», alors l’angle de la rotation est 
2(m — k)r 
n 


(18.458) 


et donc f = r""À, qui est de la forme demandée. 


(2) Supposons à présent que f soit une réflexion d’axe A. Cette fois, À ne passe par aucun 
des points À}, par contre À passe par 0. Nous commençons par montrer que À doit être la 
médiatrice d’un des côtés [4,, 4,41] du polygone. Comme A passe par © et n’est aucune 
des droites (043), cette droite passe par l’intérieur d’un des triangles O04,,,1 et intersecte 
donc le côté correspondant. 

Notre tâche est de montrer que À coupe [4,,4,+1] en son milieu. Dans ce cas, À sera 
automatiquement perpendiculaire parce que le triangle O0 A,,4,+1 est isocèle en O. Nommons 
! la longueur des côtés du polygone P = AnT[A,, 4,41], x = d(A,, P) et ô = d(A,, À). Vu que 
f est la symétrie d’axe À, nous avons aussi d(f(A,), A) = à et d(A;, f(A»)) = 26. D'autre 
part, par la définition de la distance, Ô < x. Si x < i, alors Ô < j et donc d(Ap, f(Ap)) < L. 
Or cela est impossible parce que le polygone ne possède aucun sommet à distance plus courte 
que / de À, 

De la même manière si x > , nous raisonnons avec À,41 pour obtenir une contradiction. 
Nous en concluons que la seule possibilité est x — , et donc f(4,) = 4,41. Montrons alors 
que f =sor"-?P"1, I] faut montrer que c’est une réflexion qui envoie À, sur A»+1. D'abord 
c’est une réflexion parce que 


det(sr" 221) = det(s) det(r"2?"1 = 2j (18.459) 
parce que det(s) = —1 alors que det(r*) = 1 parce que r est une rotation dans SO(2). Ensuite 
nous avons 

59 no 4) = S(Ap+n-2p-1) = S(An-p-1) = An_(n-p-1) = Ap+1. (18.460) 
Donc so r"-2P-1 est bien une réflexion qui envoie À, sur À,+1. 
CorWYITsW\W 
Corolaire 18.176. 
La liste des éléments de D, est 
D = {ir ls,sr,..., sr 1} (18.461) 


et |D,| =2r#; 


18.10. CLASSIFICATION DES ISOMÉTRIES DANS R? 1617 


Démonstration. Nous savons par la proposition 18.175 que tous les élément de D,, s’écrivent sous 
la forme r* ou sr*. Puisque r est d'ordre n, il ne faut considérer que k € {1,...,n—1}. Les éléments 


1,r,..., rl sont tous différents, et sont (pour des raisons de déterminant) tous différents des sr*. 
Les isométries sr 


FE sont toutes différentes entre elles pour essentiellement la même raison : 
a) =a(A 5) = 4; à (18.462) 
donc si k Z£ k!, sr*(A,) 4 srl (A,). La liste des éléments de D, est donc 


Dh = {ir s,sr,..., sr 1} (18.463) 


et donc |D,| = 2n. 


EXooHNYYooUDsKnm 
Exemple 18.177. 
Nous considérons le carré ABC D dans R? et nous cherchons les isométries de R? qui laissent le 
carré invariant. Nous nommons les points comme sur la figure 18.7. La symétrie d’axe vertical est 
nommée s et la rotation de 90 degrés est notée r. 


s 
A B 


D C 


FIGURE 18.7: Le carré dont nous étudions le groupe diédralLabe1FiglsomCarre 


Il est facile de vérifier que toutes les symétries axiales peuvent être écrites sous la forme r°s. 
De plus le groupe engendré par s agit sur le groupe engendré par r parce que 


(srs 1)(4,B,C, D) = sr(B, A, D,C) = s(4,D,C,B) = (B,C, D, A), (18.464) 
c'est-à-dire srs-l = rl, Nous sommes alors dans le cadre du corolaire 2.49 et nous pouvons écrire 
que 

Di =gr(r)i x srCs le (18.465) 
FAN 


18.10.14.2 Table de multiplication 


La proposition 18.175 nous indique que tous les éléments de D,, s’écrivent sous la forme 5° or”? 
avec € € {0,1}. Nous allons maintenant écrire la table de multiplication pour de telles transforma- 


tions de C. 
LEMooBNJFooAbhsUa 


Lemme 18.178. 
Si R est une rotation autour de O0 (dans ©), et si s est la conjugaison complexe, alors 


Rs =sR ! (18.466) 


Démonstration. Il s’agit seulement d’un calcul en écrivant R comme la multiplication par e“*. Nous 
avons 


(Rshz= 25e 2)=86R 2 (18.467) 


PROPooPYDLooLgiUjk 
Proposition 18.179. 
Si €1,62 € {0,1} et si k,lE Z nous avons 


(sArk)(s2rl) = site CDSE (18.468) 
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Démonstration. Si e> = 1 alors nous utilisons le lemme 18.178 pour trouver 
(sArh)(s2rt) = SA (rte )rl = 51527 hr, (18.469) 


La proposition est déjà prouvée dans ce cas. 
Passons à € — 0. Dans ce cas nous avons 


(s1rË) (527!) = sprl (18.470) 


et c’est bon. 


18.10.14.3 Générateurs : vue abstraite 
NORMooCCUEo0oRRENed 


18.180. 
Nous allons montrer que D,, peut être décrit de façon abstraite en ne parlant que de ses générateurs. 
Nous considérons un groupe G engendré par des éléments a et b tels que 


(1) a est d'ordre 2, 
(2) b est d'ordre n avec n > 3, 
(3) abab = e. 


Nous allons prouver que ce groupe doit avoir la même liste d'éléments que celle du corolaire 18.176. 


Proposition 18.181 ([531]). 
Le groupe G n’est pas abélien. 


Démonstration. Nous savons que abab = e, donc abab7! = b-?, mais b? # e parce que b est 
d'ordre n > 2. Donc abab=! Ze. En manipulant un peu : 


e  abab! = (ab)(ba !) 1 = (ab)(ba) * (18.471) 
parce que a! = a. Donc ab # ba. 
LemKKXdqdL 
Lemme 18.182 ([531]). 
Pour tout k entre 1 et n — 1 nous avons 
Ad(a)bŸ = aba-! = abfa = bÀ. (18.472) 


Démonstration. Nous faisons la démonstration par récurrence. D’abord pour k = 1, nous devons 
avoir aba = b-!, ce qui est correct parce que par construction de G nous avons abab = e. Ensuite 
nous supposons que le lemme tient pour k et nous regardons ce qu’il se passe avec k + 1 : 


ab la = abba = abfa  aba = b7 "pt = pR+D), (18.473) 
ro — 
b-k b-1 
PROPooVQARooWuKHMZ 


Proposition 18.183. 
L'élément a n’est pas une puissance de b. 


Démonstration. Supposons le contraire : a = b*. Dans ce cas nous aurions 


e = (ab)(ab) = bÉTIRÈ HI 2 DK +2 2 PRE 2 2h? = P?, (18.474) 
ce qui signifierait que b est d'ordre 2, ce qui est exclu par construction. 
PROPooEPVGooQjHRJp 
Proposition 18.184 ([531]). 
La liste des éléments de G est donnée par 
G={1,6,...,0% La,ab,.….,ab® 1} = {ab*} 01 (18.475) 


=0,...,n— 


Les éléments de ces listes sont distincts. 
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Démonstration. Étant donné que a n’est pas une puissance de b, les éléments 1, a, b,..., b"-1 sont 


distincts. De plus si k et m = k + p sont deux éléments distincts de {1,...,n — 1}, nous avons 
abF # ab" parce que si ab° = ab**P, alors a = ab? avec p < n, ce qui est impossible. Pour la même 
raison, abŸ £ e, et ab # b. 

Au final les éléments 1,a,b,...,b 
qu'il n’y en a pas d’autres. 

Par définition le groupe G est engendré par a et b, donc tout élément x € G s'écrit x = 
ab"... a"rbir pour un certain r et avec pour tout à, k; € {1,...,n — 1} (sauf k, qui peut être 
égal à zéro) et m; = 1, sauf m1 qui peut être égal à zéro. Donc 


mL ab... ,ab"-1 sont tous différents. Nous devons encore voir 


2 = abMab2a.…..bfr-1abfr (18.476) 


où m et k. peuvent éventuellement être zéro. En utilisant le lemme 18.182 sous la forme bia — 
ab Ki, quitte à changer les valeurs des exposants, nous pouvons passer tous les a à gauche et tous 
les b à droite pour finir sous la forme x = ab". 

Donc non, il n’existe pas d’autres éléments dans G que ceux déjà listés. 


LemooNFRIooPWuikH 
Lemme 18.185 (|[1]). 
Tout élément de G s'écrit de façon unique sous la forme afb* ou b'af avec € € {0,1} etke 
(0... 1% 


Démonstration. Nous commençons par la forme a‘b*. L'existence est la proposition 18.184. Pour 
l’unicité nous supposons ab = a°bl et nous décomposons en 4 cas distincts. 


(1) e=0,0—=0 Alors b* = bl. Mais b étant d'ordre n et k, 1 étant égaux au maximum à n — 1, 
cette égalité implique k = {. 


pk 


(2) e=0,o=1 Alors & = ab!l, ce qui donne a = , ce qui est interdit par la proposi- 


tion 18.183. 
(3) e=1, o =0 Même problème que ci-dessus. 
(4) e=1,0=1 Encore une fois b* = b! implique k = 1. 
En ce qui concerne la forme bFa°, l'existence est à montrer. Soit l'élément g = a‘b" ; cherchons à le 
mettre sous la forme bla°. Si e = 0 c’est évident. Sinon € = 1 et nous avons par le lemme 18.182 


abf = bat = bEba = ba. (18.477) 


En ce qui concerne l’unicité, nous distinguons 4 cas pour b*af = bla°. Comme précédemment ils 


se traitement exactement comme précédemment. 


TH0Oo00Y1ITHooTNTBuG 
Théorème 18.186. 
Les groupes G et D, sont isomorphes. 
Démonstration. Nous utilisons l’application 
v:G—D 
 - (18.478) 
ab s°r 


C’est évidemment bien défini et bijectif, mais c’est également un morphisme parce que si nous 
calculons Ÿ sur un produit, nous devons comparer 


Ÿ (a* 1 pr a F2 p2 ) É 18470) 
avec 
(ab )(añ2bre) = Ship shape, FE RU) 


Vu que D, et G ont les mêmes propriétés qui permettent de permuter a et b ou s et r, l'expression 
à l'intérieur du 4 dans (18.479) se simplifie en a*b"? avec les même k# et m que l'expression à droite 
dans (18.480) et se simplifie en s*r”. 
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Corolaire 18.187. 
Toutes les propriétés démontrées pour G& sont vraies pour D. En particulier, avec quelques redites : 


(1) Le groupe D, peut être défini comme étant le groupe engendré par un élément s d’ordre 2 et 
un élément r d'ordre n — 1 assujettis à la relation srsr = e. 

(2) Le groupe D, n’est pas abélien. 

(3) Pour tout ke {1,...,n — 1} nous avons srfs = r À, 

(4) L'élément s ne peut pas être obtenu comme une puissance de r. 


(5) La liste des éléments de D, est 
Da = {ir ls,sr,..., sr 1 (18.481) 
(6) Le groupe diédral D, est d’ordre 2n. 


Proposition 18.188. 
En posant Cn = ie 5 et C2 = {a‘}e=01, nous pouvons exprimer D, comme le produit 
semi-direct 

Ne €, (18.482) 
où p désigne l’action adjointe. 


Démonstration. L’isomorphisme est : 


Ÿ: Cn X C2 — D 

. _ (18.483) 

(b°,a°) + ba. 

(1) Action adjointe L'application psc = Ada‘) est toujours un morphisme. Comme af est, 

soit e, soit a, nous allons nous restreindre à a et oublier l’exposant €. Il faut montrer que 
Ada) € Aut(C,). En utilisant le lemme 18.182, 


Ad(a)b® = abFa-! = pb E = pr, (18.484) 


L'application Ad(a): Ch — C, est donc bijective et homomorphique. Ergo isomorphisme. 

(2) Injectif Si Y(b",a°) = 4(b!,a°), alors par unicité du lemme 18.185 nous avons # = 1 et 
E = 0. 

(3) Surjectif Par la partie « existence » du lemme 18.185. 

(4) Morphisme Lorqu’on prend deux sous-groupes d’un même groupe (ici le groupe des iso- 
métries de IR?), et que l’on tente de faire un produit semi-direct en utilisant l’action adjointe, 
nous avons toujours un morphisme. Dans notre cas, le calcul est : 


BF, a°)(bf, a7)) = par (b')at7 = bfafb'a fat = baba = (bf, a°)p(b", a°). 
(18.485) 


18.10.14.4 Classes de conjugaison 
subsubsecZQnBcgo 
Pour les classes de conjugaison du groupe diédral nous suivons [532]. 
D'abord pour des raisons de déterminants “, les classes des éléments de la forme r" et de la 
forme sr ne se mélangent pas. Nous notons C{(x) la classe de conjugaison de x, et y : x = yry |. 


Les relations que nous allons utiliser sont 


srfs = r À (18.486a) 
rs= sr = sr 1, (18.486b) 


48. Vous notez qu'ici nous utilisons un argument qui utilise la définition de D, comme isométries de IR?. Si nous 
avions voulu à tout prix nous limiter à la définition « abstraite » en termes de générateurs, il aurait fallu trouver 
autre chose. 
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La classe de conjugaison qui ne rate jamais est bien entendu C(1) = 1. Nous commençons les 
vraies festivités avec C(r"*). D'abord rÀ : r"* = 7", ensuite 


(sr) 2 sky gl 2 gps 1 2 pm, (18.487) 


E Fxgi 

Cr) = {rm rm, PS ARS) 

À ce niveau il faut faire deux remarques. D’abord si m > ?, alors C(r””) est la classe de C7" 
avec n — m < ? 


5. Donc les classes que nous avons trouvées sont uniquement à lister avec m < 5. 
Ensuite si m = % alors r°* = r et la classe est un singleton. Cela n'arrive que si n est pair. 


Donc 


Nous passons ensuite à C(s). Nous avons 


res = rfsr À = ssrËsr À = sr Fr 8 = sp 28, (18.489) 
et 
(sr*) CS Ne 7 (18.490) 
r—k 
donc 
CS) Le rle qd (18.491) 


Ici aussi l'écriture n’est pas optimale : peut-être que pour certains Æ il y a des doublons. Nous 
reportons l'écriture exacte à la discussion plus bas qui distinguera n pair de n impair. Notons juste 
que si n est pair, l’élément sr n’est pas dans la classe C(s). 

Nous en faisons donc à présent le calcul en gardant en tête le fait qu’il n’a de sens que si n est 
pair. D’abord 


s: (sr) = ssrs = rs = sr" 1. (18.492) 
Ensuite 
(srË) + (sr) = srfsrr Ês = 728 = 72h 1 (18.493) 
Avec k = %, cela rend s : (sr), donc pas besoin de le recopier. Nous avons 
Cr) = sr pp (18.494) 
18.10.14.5 Le compte pour n pair 
SubsubsecROVmHuM 
Si n est pair, nous avons les classes 
C(1) = {1} 1 élément  (18.495a) 
Or) er = pi A pour Ü < m < 5 5 — 1 fois 2 éléments  (18.495b) 
C(r"?2) = {7/2} 1 élément  (18.495c) 
C(s) = {sr Ÿ}0..21 5 éléments  (18.495d) 
C(sr) = eee 0,...,%—1 5 éléments. (18.495e) 


Au total nous avons bien listé 2n éléments comme il se doit, dans 5 + 3 classes différentes. 


18.10.14.6 Le compte pour n impair 


GJIZDEP 

Si n est impair, nous avons les classes 
C(1) = {1} 1 élément (18.496a) 
Cr = Pier pour deme LR — fois 2 éléments (18.496b) 
C(s) = (rets à n éléments  (18.496c) 


Au total nous avons bien listé 2n éléments comme il se doit, dans nt classes différentes. 
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18.10.15 Applications : du dénombrement 


18.10.15.1 Le jeu de la roulette 
pTaJLY 


Soit une roulette à n secteurs que nous voulons colorier en q couleurs[533]. Nous voulons savoir 
le nombre de possibilités à rotations près. Soit d’abord ÆE l’ensemble des coloriages possibles sans 
contrainte ; il y a naturellement g” possibilités. Sur l’ensemble E, le groupe cyclique G des rotations 
d'angle 27/n agit. Deux coloriages étant identiques si ils sont reliés par une rotation, la réponse à 
notre problème est donnée par le nombre d’orbites de l’action de G sur E qui sera donnée par la 
formule du théorème de Burnside 2.40. 

Nous devons calculer Card (Fix(g)) pour tout g € G. Soit g, un élément d’ordre d dans G. Si 
g agit sur la roulette, chaque secteur a une orbite contenant d éléments. Autrement dit, g divise 
la roulette en n/d secteurs. Un élément de E appartenant à Fix(g) doit colorier ces n/d secteurs 
de façon uniforme: il y a g"/{ possibilités. 

Il reste à déterminer le nombre d’éléments d’ordre d dans G. Un élément de Gest donné par un 
nombre complexe de la forme e*T/*, Les éléments d’ordre d sont les racines primitives  d-ièmes 
de l’unité. Nous savons que -par définition il y a w(d) telles racines primitives de l'unité. Bref il 
y à w(d) éléments d’ordre d dans G!. 

La formule de Burnside nous donne maintenant le nombre d’orbites : 


1 0) 
nr De(da /d. (18.497) 
din 


Cela est le nombre de coloriage possibles de la roulette à n secteurs avec q couleurs. 


18.10.15.2 L'affaire du collier ; 
si0Q1G 


Nous avons maintenant des perles de q couleurs différentes et nous voulons en faire un collier à 
n perles. Cette fois non seulement les rotations donnent des colliers équivalents, mais en outre les 
symétries axiales (il est possible de retourner un collier, mais pas une roulette). Le groupe agissant 
sur E est maintenant le groupe diédral °° D, conservant un polygone à n sommets. 

Nous devons séparer le cas n impair, du cas n pair. 

Si n est impair, alors les axes de symétries passent par un sommet et par le milieu du côté 
opposé. Le groupe D, contient n symétries axiales. Nous avons donc maintenant 


|G| = 2n. (18.498) 
Nous écrivons la formule de Burnside 


Card(Q) = _ Ÿ° Card (Fix(g)). (18.499) 
geG 


Si g est une rotation, le travail est déjà fait. Si g est une symétrie, nous avons le choix de la couleur 
du sommet par lequel passe l’axe et le choix de la couleur des (n — 1)/2 paires de sommets. Cela 
fait 


gai D2 + (18.500) 
possibilités. Nous avons donc 
1 n 
Card(Q) = — D g"/#o(à) + ng 7 ; (18.501) 
2n dm 


Si n est pair, les choses se compliquent un tout petit peu. En plus de symétries axiales passant 
par les milieux de deux côtés opposés, il y a les axes passant par deux sommets opposés. Pour 


49. Une racine non primitive 8ième de l’unité est par exemple i. Certes à = 1, mais 4* = 1 aussi. Le nombre à est 
d'ordre 4. 
50. Définition 18.170. 


18.10. CLASSIFICATION DES ISOMÉTRIES DANS R? 1623 


colorier un collier en tenant compte d’une telle symétrie, nous pouvons choisir la couleur des deux 
perles par lesquelles passe l’axe ainsi que la couleur des (n —2)/2 paires de perles. Cela fait en tout 


da? =q?. (18.502) 


Le groupe G contient n/2 tels axes. 
Notons que cette fois G ne contient plus que n/2 symétries passant par un sommet et un côté. 
L'ordre de G est donc encore 2n. La formule de Burnside donne 


Card(Q) = . D p(d)g"/4 + e n' 31 a) à (18.503) 
din 


18.10.16 Classification 


Théorème 18.189 ([522]). 
Toute isométrie du plan (IR?, d) est une composition d’au plus 3 réflexions. 


THO00ORORQooTDWFdv 


Démonstration. Encore une fois nous décomposons la preuve en fonction du nombre de points 
fixes. 


(1) Si f n’a pas de point fixe Soit x e R?. Nous considérons le segment [x, f(æ)] et nous 
nommons | sa médiatrice. Par construction, f(x) = o(x). Nous posons g = o,0 f, et nous 
avons 


oÛE) =: (18.504) 
Donc nous avons f = 070 g avec x € Fix(g). 


(2) Si f a un unique point fixe Soit x cet unique point fixe. Soit y £ x et { la médiatrice de 
[y, f(y)]. En posant g = 00 f nous avons 


g(y) = y (18.505) 


et g(x) = x parce que 
d(x, f(y)) = d(f(x), f(y)) = d(æ, y), (18.506) 


ce qui donne que x est à égale distance de y et de f(y), c'est-à-dire que x € Let par conséquent 
gx) = (oo f)(x) = oi(x) = x. 


Donc g fixe x et y. Par conséquent, g fixe toute la droite (xy). 


(3) Si f fixe une droite Soit ! une droite fixée par f. Alors f est soit o soit l'identité par le 
lemme 18.115. 


(4) Conclusion 


Nous avons montré que si Fix(f) a pour dimension m, alors il existe une droite pour la- 
quelle f = o0 g avec dim (Fix(g)) > m. Donc il faut au maximum trois pas pour avoir 
dim (Fix(g)) = 2 c’est-à-dire pour avoir g = Id. 


DEFooJEOYooNwYtuQ 
Définition 18.190. 
Une réflexion glissée est une transformation du plan de la forme 7, © og où le vecteur v est 


parallèle à la droite L. 
THOooVRNOooAgaVRN 


Théorème 18.191 ([522]). 
Les isométries du plan (R?, d) sont exactement 


(1) l’identité (composée de 0 réflexions), 
(2) les réflexions, 
(3) les translations (composées de 2 réflexions d’axes parallèles), 


(4) les rotations (composées de 2 réflexions d’axes non parallèles), 
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(5) les réflexions glissées (composées de 3 réflexions) 


Démonstration. Nous savons déjà que f € Isom(IR?) est une composée de 0, 1, 2 ou 3 réflexions. 


Gi 
(2 
( 


) 
) 
) 


— 


Zéro réflexion Alors c’est l'identité. Ce n’est pas très profond. 


Une réflexion Alors f est une réflexion. Toujours pas très profond. 


3) Deux réflexions Soit f = ov, © oy,. Maintenant ça s’approfondit un bon coup. 


Nous supposons d’abord que {1 || {. Dans ce cas nous allons prouver que f = 7 où v est 
le vecteur perpendiculaire à {: tel que £; + v = &. Nous allons utiliser le lemme 18.114 pour 
montrer que 64, 0 4, = Ty. Nous avons 


Li = Lo + w (18.507a) 
Lb=to+w+v (18.507b) 


où w est un vecteur perpendiculaire à £1 et { est la droite passant par l’origine et parallèle 
à L1 et £2. Avec cela, 


(ou, © ce, )(x) = ou, (ou, (x) + 2w) (18.508a) 
= où (08 (x) + 2w) + 2(v + w) (18.508b) 
= x + 04 (2w) +2v + 2w (18.508c) 

2 
= x + 20. (18.508d) 


Donc si f est composée de deux réflexions d’axes parallèles, alors f est une translation. 
Toujours dans le cas où f est composée de deux réflexions, nous supposons que f = ay, © oy, 
avec £1 et {> non parallèles. Nous notons © le point d’intersection, et nous allons voir que 
f = Ro(2a), où a est l’angle de £1 à {> donné par le lemme 18.162. 
Soit x € L1. Alors 

f(x) = o, (x), (18.509) 


et le lemme 18.165 nous donne un moyen de calculer o,(x) parce que £ est une droite 
passant par x et coupant {2 au point ©. Le lemme dit que o4,(x) = Ro(2a). Remarque : 
c’est bien 2a et non —2a parce qu'il s’agit de l’angle de £2 à {1 ; il y a inversion des numéros 
entre ici et l'énoncé du lemme. 

Nous avons donc bien f(x) = Ro(2a)x pour x € 41. 

Si y € L2 alors 


(y) = oc (Ro(-2a)y) (18.510) 


Nous posons z = ov, (y) = Ro(—-2a)y. Soit la droite {3 passant par O et z. Puisque Ro(2a)z = 
y € Lo, l'angle de {3 à £2 est 2a. Par conséquent 


oz) = Ro(-—2 x (—-2a))z = Ro(da)z = Ro(da)Ro(—2a)y = Ro(2a)y. (18.511) 


Donc les transformations f et Ro(2a) coïncident pour tous les points des droites {1 et 42, 
qui ne sont pas parallèles. Cela prouve que f = Ro(2a). 

Trois réflexions Nous écrivons f = 04, © 64, © 0,. Nous allons transformer cela progressi- 
vement en une symétrie glissée en passant par plusieurs étapes : ITEMooHVYCooPhFMiv 


(4a) f = 0m, ITEMooUKGLooF1Ccjt 


(4b) f = 004, ITEMooWUCWooZS jofe 


(4c) f = Ty © 0 avec v || £. 
À chacune de ces étapes, v et £ vont changer. La dernière est une réflexion glissée. 


Nous commençons par supposer 2 || {3. Dans ce cas, 07, o 04, est une translation, comme 
nous l'avons déjà vu. Alors f = 7, o oy, et nous sommes déjà dans le cas (4b). 
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Nous supposons que {2 n’est pas parallèle à £3. Dans ce cas, si O = & n La nous avons 
Ces © Or» = Ro(2a) (18.512) 
où a est l’angle de {2 à {3. En réalité tant que l’angle de £, à £, est à nous avons 
OL, ° Op, = Ok © Ot> = Ro(2a). (18.513) 


Nous choisissons {, parallèle à 1, de telle sorte que Op, © O4, Soit une translation. Alors nous 
avons 


f — Ofz 0 Clg O Of — Ce, O Te, O Of, = Of © Ty. (18.514) 


où v est le vecteur de la translation en question. 


Nous avons donc prouvé que toute composition de trois réflexions peut être écrite soit sous 
la forme (4a) soit sous la forme (4b). 


Nous prouvons à présent que toute transformation de la forme (4a) peut être écrite sous la 
forme (4b). Plus précisément nous allons prouver que si { est une droite, v un vecteur et 4 
la droite parallèle à £ passant par l’origine, alors 


CO To = Togg(u) © (18.515) 


D'abord nous savons que o4(x) = o4,(x) + 2w où w est le vecteur tel que £ = {5 + w. Ensuite 
c’est un simple calcul utilisant le fait que o4, est linéaire : 


(or 9 (x) = ox + v) = ont) + on(v) + 2w, (18.516) 


et 
(Toute) ° 2) (x) = cv) + oe(x) = où(v) + (Er) + 2w:. (18.517) 


L'égalité est prouvée. 
Nous montrons maintenant que toute transformation de la forme (4b) peut être mise sous la 
forme (4c). Soit donc f = 7, o og où vw et { ne sont pas spécialement parallèles. 
Pour cela nous décomposons v = v1 + v2 avec v1 L £ et v2 || L et nous posons #’ = £ + Lui. 
Nous montrons que 

— To 004 = Top © OP 

— vo || P!. 
Pour le deuxième point, v2 || £ et bien entendu £/ || £. Donc w2 || #. 


Soit Lo la droite parallèle à £/ et L’ et passant par l’origine. Soit aussi le vecteur w tel que 
£ = {5 + w. Alors nous avons 


OL = Ot + 2W (18.518a) 
Op = Of + 2W + V1 (18.518b) 
Nous avons 
(Tu © oe)(x) = v + on(x) + 2w (18.519) 
et 
(Tu © Gp)(x) = v2 + 04 (x) + 2w + un (18.520a) 
= 0g(T) + v + 2w (18.520b) 


où dans la dernière ligne, nous avons regroupé v1 + v2 = vw. Et voilà. 
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18.10.17 Classification des isométries de R 


Définition 18.192. 
Soit xeR; nous notons o4 la réflexion par rapport à x, c’est-à-dire 


Ox(y) = 27 — y. (18.521) 


Théorème 18.193 ([522]). 
Toute isométrie de R est composée d’au plus 2 réflexions. Plus précisément toute isométrie de R 
est dans une des trois catégories suivantes : 


— l'identité (0 réflexion), 

— les réflexions, 

— les translations (2 réflexions) 
Démonstration. Nous divisons la preuve en fonction du nombre de points fixés par l’isométrie 
f € Isom(R). 


(1) f fixe deux points distincts Alors elle fixe l’espace affine engendré par ces deux points 
par la proposition 18.101. Donc f fixe tout R, et est l’identité. 


(2) f fixe un unique point Soit x l'unique point fixé par f et considérons y £ x. Puisque 
x = f(x) et que f est une isométrie, 


dx, f{y)) = d(f(x), f(y)) = d(x,y). (18.522) 


Donc f(y) est à égale distance de x que de y. Autrement dit, f(y) est, soit y, soit o:(y). 
Mais comme x est unique point fixe, f(y) = o:(y). Ce raisonnement étant valable pour tout 
Y Æ X, NOUS AVONS f = Oy. 


(3) f n’a pas de point fixe Soient x ER et y — 2tf@), Nous posons g = 0,0 f. Alors x est 


un point fixe de g parce que 
g(x) = oy (f(x)) = 2y — f(x) = +. (18.523) 


Donc, soit g est l'identité, soit g est une réflexion (par les points précédents). La possibilité 
g = Id est exclue parce que cela donnerait f = a, alors que f n’a pas de point fixe. Donc g 
est une réflexion ; et comme x est un point fixe de g nous avons g = 64. Au final 


J = 0y90%. (18.524) 
Montrons que cela implique que f est une translation : 


0yOx(2) = oy(2x — 2) = 2y — 2x + 2 = 2 + 2{y — x). (18.525) 


Donc 0, 0 ox est la translation de vecteur 2(y — x). 


18.10.18 Isométries du tétraèdre régulier 
PROPooHTBIo0TJQNZt 


Proposition 18.194. 

Soient un tétraèdre régulier”! T ainsi qu’une application f : R? — R° qui vérifie 
(1) f est affine *? 
(2) f est bijective (sur R>) 
(3) ST) ST. 

Alors 


51. Définition 12.147 
52. Définition 9.157. 
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ITEMooGAVPooVPESod 
(1) Il existe une bijection a: {1,2,3,4,5,6} — {1,2,3,4,5,6} telle que (di) FehoérrnooTimtyt 


(2) Pour la même bijection a: {1,2,3,4,5,6} — {1,2,3,4,5,6} nous avons Ft) 


(3) I existe une bijection B: {1,2,3,4} — {1,2,3,4} telle que f(si) = sg(i. 
3 


ooCÉNPdOZIEOLK 


Autrement dit, f agit comme une permutation® sur l’ensemble des sommets de T. 


Démonstration. Puisque d; est une droite et que f est affine, l’ensemble f(d;) est une droite de R° 
(proposition 12.137). 
(1) Pour (1) Puisque f(T) CT, la partie f(a;) contient une infinité de points alignés dans T 
(parce que a; contient une infinité de points et f est une bijection de IRŸ). 
Comme le tétraèdre n’a que 6 arrêtes, il y a forcément une des arrêtes qui contient au moins 
deux points de f(a;). Soit aç;) une arrête qui contient deux points de f(a;). En particulier 
da( contient deux points de f(a;), et donc de f(d;). Donc f(d;) = dés. 
(2) Pour (2) L'ensemble f(a;) est contenu dans d, (y N T = ai) (lemme 12.149). Nommons 
51 et 52 les deux sommets de T' sur a;. Soit k € {1,2}. Comme les sommets sont sur plusieurs 
arrêtes, il existe j Æ à tel que 54 = a; n a;. Nous avons alors 


f(8x) € f(ai) N (a) € Gati) © Bat Fo ER 


Mais nous avons déjà vu que les seules intersections des segments sont les sommets (lemme 
12.151). Donc f(s£) est un sommet de T. 

Nous avons prouvé que f(a;) contient deux sommets sur a,(;y donc il contient tout aa). 
Cela prouve que f(a;) = f(aa(i)). 

(3) Pour (3) Nous avons déjà mentionné, juste en-dessous de (18.526) que l’image d’un sommet 
doit être un sommet. Nous avons donc une application B: {1,2,3,4} — {1,2,3,4} telle que 
F(si) = sgx). Puisque f est injective, B est injective. Par principe des tiroirs, cette application 
doit également être surjective. 


PROPooVNLKooUjQzC;j 
Proposition 18.195 (Isométries affines du tétraèdre régulier). 
Soient T un tétraèdre régulier et Isom(T) son groupe d’isométries affines (définition 8.6/). Alors 


Isom(T) = S4 (18.527) 


où S4 est le groupe des permutations de quatre objets. 


Démonstration. Si f:IR° — R* est une bijection affine (ce qui est le cas d’une isométrie affine), 
alors la proposition 18.194(3) donne une bijection B: {1,2,3,4} — {1,2,3,4} des sommets de T. Si 
nous numérotons les sommets +1,..., 24, nous obtenons un morphisme de groupe w: Isom(T') — S4 
qui envoie g sur la permutation qui envoie 1 sur le numéro du sommet g(x1), 2 sur le numéro du 
sommet g(x2), etc. 


(1) Le morphisme 4 est injectif Supposons 4(g1) = y(g2). Alors g;, ! o g2 est une isométrie 
de (R°,d) qui fixe les quatre sommets. Une application affine IR? — IR fixant 4 point est 
l'identité par le lemme 8.54. Donc g; log» = Id, ce qui prouve que gi = g. Vous noterez que 
nous utilisons l’unicité de l’inverse dans un groupe. 


(2) v est surjectif 


Nous savons que S4 est engendré par les transpositions (proposition 1.288). Or les transpo- 
sitions sont dans l’image de 4. En effet, notons les sommets de notre tétraèdre par À, B, C 
et D et considérons la transposition À + B. Elle est l’image par & de la réflexion selon le 
plan ©, médiateur du segment |A, B]. Pour nous assurer de cela, nous devons nous assurer 
que Cet D appartiennent à ©. C’est le contenu du lemme 18.111. 


(3) Conclusion L’application @ est un morphisme bijectif, c’est-à-dire un isomorphisme. 


53. Une permutation est une bijection, définition 1.267. 
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18.10.19 Représentation de S, via les isométries du tétraèdre 
SUBSECooVEASooDUbsBh 


18.196. 

Lorsque le tétraèdre a son barycentre en l’origine de R*, l’isomorphisme w: Isom(T') — $4 donne 
une représentation de dimension 3 de S4. Nous avons calculé les caractères de S4 en la section 16.5 
sans avoir besoin de savoir que l’une des représentations de dimension 3 est celle que nous venons 
de trouver via le groupe des isométries du tétraèdre. Nous allons cependant également y calculer 
les caractères de la représentation Y, pour le sport. 


Une des représentations trouvées (la représentation p,) peut être vue comme le groupe Isom(T') 
des isométries affine du tétraèdre grâce à la proposition 18.195 qui donne un isomorphisme de 
groupe 94 + Iso(T') lorsque Test un tétraèdre régulier de IR. 

Si le barycentre de Test situé à l’origine de R°, alors les éléments de Isom(T') sont des appli- 
cations linéaires parce que 


— les affinités laissent invariantes les barycentres (proposition 8.43), 
— les affinités qui laissent l’origine invariante sont linéaires (corolaire 8.60). 


Nous allons à présent calculer la trace de cette représentation, en utilisant le fait que nous la 
connaissions explicitement. Nous savons que les caractères sont constants sur les classes de conju- 
gaison ; nous allons donc écrire une matrice par classe de conjugaison (qui sont données dans 
l'exemple 1.285). 

Pour tout cela nous allons considérer un tétraèdre dont l’isobarycentre est en (0,0,0) et une 
base de R° formée de trois sommets €, e2 et e3. Puisque l’isobarycentre des quatre sommets est 
en (0,0,0), le quatrième sommet est forcément le point de coordonnées e4(—1,—1,—1), de telle 
sorte que €1 + e2 + €3 + €e4 = 0. 


Les transpositions Quelle isométrie de IR? permute deux sommets du tétraèdre sans bouger les 
autres ? Pour permuter les sommets ei et e2 en laissant e3 et e4, c’est le symétrie par rapport 
au plan médiateur de [e:,e2]. Ce plan passe par les sommets e3 et e4, parce que le tétraèdre 
étant régulier, les points e3 et e4 sont équidistants de e: et e2. Le lemme 18.111 dit qu’alors, 
ces points font partie du plan médiateur. 


Dans notre base, la matrice de la transposition précédemment nommée (12) est 
0 1 0 
1 O0 0, (18.528) 
0: 0, 1 


dont la trace est 1. Donc x,(12) = 1. 


Les bitranspositions La bitransposition (12)(34) est le produit des transpositions selon les plans 
médiateurs de [e1,e2] et [e3,e4]. Ces deux plans sont perpendiculaires, et l’intersection est 
la droite qui passe par les milieux. Cette droite est perpendiculaire aux deux segments en 
même temps. La matrice est : 


D Le 
1 D (18.529) 
Ü D: À 


parce que €1 > €2, €2 > €1 et e3 > e4. Pour rappel, la matrice est formée des images des 
vecteurs de base. Cela donne 
Xs((12)(34)) = —1. (18.530) 


Les 3-cycles La symétrie qui permute cycliquement les points e1, e2 et e3 est la rotation d'angle °* 
27/3 dans le plan formé par les extrémités de ces trois vecteurs. Heureusement, la trace est 
invariante par changement de base ; donc nous pouvons calculer la trace d’une rotation d’angle 


54. Angle d’une rotation, définition 18.127. 
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27/3 dans n'importe quelle base. Par exemple : 


0 0 
Xs((12)(34)) = Tr | 0 cos(27/3)  sin(2r/3) | = 1 + 2cos(27/3) = 0. (18.531) 
O —sin(27/3) cos(27/3) 


Notons que, sans cette interprétation géométrique, nous y arrivons aussi facilement : dans 
notre base le 3-cycle est e1 — e2  e3 + e1, donc la matrice est : 


0 O0 1 
1 0 0|, (18.532) 
0 1 0 


dont la trace est manifestement nulle : x,((123)) = 0. 


Le 4-cycle Il réalise e1 + e2 + e3 > e4 + e1, dont la matrice est 


09 7 EQooOUNDUooY 
1 0 —1|, PS3 


O 1 —1 


et la trace est Xs((1,2,3,4)) = —1. 


Nous avons retrouvé les caractères de la représentation p,, et nous pouvons vérifier qu’elle est 
irréductible. 


18.11 Transformations de Lorentz 


Nous considérons dans cette section un nombre réel c > 0 ainsi que l’espace R? muni du produit 
pseudo-scalaire * donné par la matrice 


n= Le É) : (18.534) 


Et pour faire plus vrai, nous notons (x0,æ1) les coordonnées sur IR?. Ainsi 


z y = LoYo — M1Y1- (18.535) 
Nous insistons sur le fait que cela n’est pas un produit scalaire. 
LEMooPZPZooVAdPV; 
Lemme 18.197 ([1]). 
Soit c > 0. L'application 
p:]-ccl—-R 
nes — UE (18.536) 
v2 
1 


est une bijection. 


Démonstration. Nous commençons par mentionner le fait que 4 est continue du fait que le déno- 
minateur ne s’annule pas. Une petite étude de fonction montre que 


lim 4(v) = +0, (18.537) 
et 
lim q(v) = —, (18.538) 


55. Définition 9.165. 
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et 


< 0. (18.539) 


Tout cela fait que y est bijective (entre autres par le théorème des valeurs intermédiaires 10.89 et 
le théorème dérivée et croissance 12.188). 


LEMooUZFKooSïjery 
Lemme 18.198. 
La forme bilinéaire 
b:R°xR°—R 
(18.540) 
Ty T'Y 
est non dégénérée %. 
Démonstration. Soit (ro, x1) € IR? tel que 
b((xo, 1), (yo, y1)) = 0 (18.541) 
pour tout (yo, y1) € R?. Nous avons 
Cxoÿo — riyi = 0. (18.542) 


En écrivant cela avec (yo, y1) = (1,0) puis (0,1) nous obtenons immédiatement que (x0,71) = 
(0,0). 


THOo0oYHDWooWxVovH 
Théorème 18.199. 
Soit une bijection®T f: R? — R? telle que 


f{e) * Fu) = y (18.543) 


pour tout x,y € R?. Alors : 
(1) f est linéaire. 
(2) Il existe un unique choix de (£,01,02) € R x {+1} x {+1} tel que la matrice de f ait la forme 


_ foicosh(£) 2 sinh(é) 
L ( csinh(£) o2cosh(é) ) ‘ (18.544) 


(3) Il existe un unique v € |—c, c[ tel que la matrice de f ait la forme 


1 32 c2 1-22 
= . ni Pl (18.545) 
2 2 
SE 


Démonstration. Puisque notre produit pseudo-scalaire est non dégénéré (lemme 18.198), le fait 
que f soit linéaire est la proposition 9.155. Nous posons 


À= ( d (18.546) 


et, conformément à la proposition 9.159, nous imposons AtnA = n. Après un petit produit matriciel 
nous obtenons : — a. : 
caf —7y caf —7yù cc 0 
— . 18.54 
Éar D) é —1 (080 
56. Définition 9.127. 


57. À mon avis, il y a moyen d'affaiblir cette hypothèse. Écrivez-moi si vous avez une idée. 
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Voilà quatre équations à résoudre pour les quatre inconnues «, B,7y, 6. Déjà les équations des termes 
anti-diagonaux sont les mêmes. Nous recopions le reste : 


FE 2 - GP TÉRAROXEUR ON TERENR (18.548a) 
UBE DWQRooBeDaP 
Cap — yô = | Ada pen EE (18.548b) 
28? — j PPAERNONSRORERReS (18.548c) 
C’est le moment d'utiliser la proposition 15.126. La relation (18.548a) donne 
2 
= (2) À (18.549) 
C 
SUBEQS USIooRZRYSW 
ce qui implique l'existence d’un unique  £& € R et o1 € {+1} tels que Es 
7 = csinh(é:) (18.550a) 
a = 01 cosh(£1). (18.550b) 
UBE. LFH XV K 
La relation (18.548c) implique quant à elle l’existence de & € R et 02 € {+1} tels que P D 
ÿ = o2cosh(é2) (18.551a) 
1 
B = -sinh(é2). (18.551b) 
C 


Nous substituons maintenant toutes les valeurs (18.550) et (18.551) dans (18.548b). Cela donne 
EQooHTM 
o1 cosh(£1) sinh(é2) = o2sinh(£1) cosh(é2). LE 18.889) 


Nous mettons cette relation au carré et nous substituons cosh(£1)? = 1 + sinh?(£). Ce que nous 
trouvons est 


sinh(£1)? = sinh(£)”?, (18.553) 


qui implique que £ = +é2. Nous posons donc £2 = 0361 pour un certain o3 € {+1}. Cela nous 
permet d’alléger la notation et d'écrire £ au lieu de &1. 

Nous remettons la valeur £ = £j = o3£2 dans l’équation (18.552) en tenant compte du fait que 
sinh est impaire et cosh est paire : 


0103 cosh(£) sinh(£) = o2sinh(£) cosh(£). (18.554) 


Et cela nous enseigne que 63 = 0102. 
Jusqu'à présent nous avons prouvé qu'il existe un unique £ € R et 01,02 € {+1} tels que 


_ foicosh(é) 7? sinh(é) EQooYZIVooCT 
Po ( csinh(£)  o2cosh(é) ) ES) 


Nous utilisons à présent la bijection du lemme 18.197. Il existe un unique v € |—c, c| tel que 
sinh(£) = (vw). En utilisant cosh(£)? = 1 + w(v)?, nous trouvons 


cosh(Ë)? = ——. (18.556) 


Mais comme le cosinus hyperbolique est toujours strictement positif, nous pouvons prendre la 
racine carrée des deux côtés : 


COSh(É) = ———. (18.557) 


v 
l— 


En substituant dans (18.555), nous trouvons le résultat annoncé. 


58. Par 15.126. 
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18.11.1 Sous-groupe fini d’isométries du plan 


THOooKDMUooUxQqbB 

Théorème 18.200 ([534]). 
Soit un groupe fini G d’isométries de (R?, d) contenant n éléments. ITEMooYEONooCOMpeb 
(1) Il existe un point C € IR? firé par tous les éléments de G!. ITEMooGELWooFFAqkc 


(2) Si G ne contient pas de réflexion, alors il est cyclique ®* et engendré par la rotation d'angle 


27r/n autour de C. ITEMooDHKEooF pCfmX 


(3) Si G contient au moins une réflexion, et si C est un point fixe de G, HooCQZTOOITPPLtyf 


(3a) toutes les réflexions ont un axe qui passe par C, ITEMooKPQRooLquS iQ 


(3b) n est pair, ITEMooCHSWooHpDGHf 


(3c) Si o est une réflexion dans G, alors nous avons G = gr (o, Rc(4t/n)) où Rc(8) est la 


*ÿ 2 
rotation d'angle 0 autour de ©, ITEMOoROUYooRghvltv 


(3d) G est isomorphe au groupe diédral D,,,2. 
Démonstration. Soit un groupe fini G constitué d’isométries de (IR?, d). Nous prouvons le théorème 
point par point. 
(1) Pour (1) C’est la proposition 18.98. 


(2) Questions de réflexions Le théorème 18.189 nous dit que les éléments de G sont des 
compositions d’au maximum 3 réflexions. 


(3) Exclure trois réflexions Il n’est pas possible que G contienne un élément composé de 
trois réflexions. En effet, les composées de trois réflexions, par le théorème 18.191 sont des 
réflexions glissées (0, c'est-à-dire des transformations de la forme g = 7, © ay où v est un 
vecteur parallèle à la droite £. Si x € £, alors 


g(x) = Rx) = x +v, (18.558) 


de telle sorte que g" (x) = x + kv, qui signifie que tous les g} sont différents. Le groupe G' ne 
peut pas être fini si il contient une réflexion glissée. 


(4) GT et GT Pour la même raison que celle qui exclut les réflexions glissées, G ne peut pas 
contenir de translation. Le théorème 18.191 nous donne la liste des possibilités. Après exclu- 
sion des translations et des réflexions glissées, il reste : 


— l'identité, 
— les rotations, 
— les réflexions. 


Nous notons G* la partie de G contenant l'identité et les rotations et G7 celle contenant les 
réflexions. Notons que G* n’est pas vide parce qu’il contient au moins l'identité, tandis que 
G peut être vide, mais n’est certainement pas un groupe. 


(5) Même nombre d’éléments Nous prouvons à présent que si G7 est non vide, alors il a le 
même nombre d'éléments que G*. Un élément de GT est une réflexion. Soit o € G7. Nous 


prouvons que 
p: GG EQooHRWopECEPE 
fr oof | 
est une bijection. 


1 


(5a) Surjective Soit se G. Posons f = o-!0s. Puisque o_! et s sont des réflexions, f 


est une rotation. Donc f € GT et p(f) = 5. 


59. Définition 1.319. 
60. Définition 18.190. 
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(5b) Injective La condition w(f) = w(g) dit que oo f = og. En composant par o-! nous 


obtenons f = g. 


(6) G* = gr(Rc(2r/p)) Nous nommons p le nombre d'éléments de G*. Si GT est vide, p = n, 


= 


— 


et sinon p = n/2. Dans les deux cas, GT est un groupe de rotations à p éléments. 
Le groupe G* contient seulement des rotations ; or le centre d’une rotation est l’unique point 
fixe. Donc tous les éléments de G* sont des rotations autour de C. 


Le corolaire 2.14 au théorème de Lagrange nous indique que tous les éléments de G* vérifient 
g? = Id. Seules les rotations d’angle 2kr/p autour de C satisfont la condition gP = Id. Or il 
n’y a que p telles rotations. Donc elles sont toutes dans GT. Nous en déduisons que 


 , ERooUiT Na 


Pour (2) Dans le cas où G ne contient pas de réflexion, G est vide et G contient n 
éléments. La relation (18.560) devient 


G=GŸT = gr (Rc(2r/n)). (18.561) 


Pour (3) Nous supposons maintenant que G contienne au moins une réflexion. De la sorte 

GES. 

(8a) Pour (3a) Les seuls points fixes d’une réflexion sont ceux de l’axe. Donc C' doit être 
sur tous les axes des réflexions contenues dans GT. 
Notons au passage que deux réflexions d’axes qui se coupent forment une rotation. Donc 
GT ne forme pas un groupe, mais même pas en rêve, quoi. 

(8b) Pour (3b) Vu que l'union G = G* LU GT est disjointe et que G*Ÿ et G7 ont le même 
nombre d'éléments par la bijection 18.559, si G7 est non vide, G possède un nombre 
pair d’éléments. 


(8c) Pour (3c) Si « e Gest une réflexion, nous savons que n est pair, que G* possède 
p = n/2 éléments et que 


GT = {Ro(2kr/p)} = {Ro(4kT/n)}re1,.n/2. (18.562) 


L'élément o € G étant fixé, la bijection (18.559) nous indique que tous les éléments de 
G7 sont de la forme a o f avec f e G*. Donc 


GT € gr(o, Ro(4x/n)). (18.563) 
Nous avons aussi 
G* € gr(o, Rc(4r/n)). (18.564) 


Et comme o et Rc(4t/n) sont dans G nous avons gr (o, Rc (4x/n)) c G. Tout cela pour 
dire que 
G=gr(o,Rc(4r/n)). (18.565) 


(8d) Ro = oR_! Nous restons dans le cas où G7 n’est pas vide. Nous considérons À, la 
rotation d’angle 0 autour de ©. Si Ro est la rotation d’angle 0 autour de (0,0), nous 
avons 

R=TcoRooTs!, (18.566) 


et si oo est la symétrie d’axe parallèle à l’axe de o, mais passant par (0,0) nous avons : 
OC =TTO0OTS.. (18.567) 


Si v est le vecteur directeur de la réflexion ©9, nous considérons enfin a, la rotation qui 
réalise a(v) = (1,0). Nous avons alors 


0)=@ losoa (18.568) 
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où s est la symétrie autour de l’axe horizontal. En n'ayant pas peur d'identifier IR? à 
C, l'application s est la conjugaison complexe. Avec tout ça nous avons 


Ro = TC RoTS TC O0TE | : rcRoa” ‘sars | = rca lRosars! (18.569) 


où nous avons utilisé le fait que les rotations autour de (0,0) forment un groupe abélien 
pour commuter al avec Ro. Nous utilisons à présent le lemme 18.178 pour commuter 


R avec s : 
Ro = roa "sRj ar" (18.570a) 
= Togo RTE" (18.570b) 
C0 
= roots TC To (18.570c) 
= oR !. (18.570d) 


Nous avons utilisé le fait que ch ee l = R-! comme on peut s’en convaincre en 
calculant le produit. 


(8e) Table de multiplication 


Nous considérons une réflexion o e G!. Les éléments de G* sont des rotations autour de 
C' et ceux de G7 de la forme © R où R est une rotation autour de C. Pour connaître la 
table de multiplication de G&, nous devons écrire 


(oR*)(o2R!) = o°R" (18.571) 
où €1, 62 € {0,1}, R est la rotation d'angle 4r/n autour de Cet e et m sont des constantes 


à exprimer en fonction de €1, €2, k et L. 


Tous les éléments de G pouvant être écrits soit sous la forme À”, soit sous la forme 
oR"", nous avons les possibilités suivantes : 


Bey) RNRI = RTK 

8e.v) (RT)(oR!) = oR TRI = oRI" 
8e.v) (oR")R! = oR"+ 

8e.v) (oR")(oR!) = ooRt" = RE, 
(8f) Pour (3d) Récoltons quelque acquis. 


( 
( 
( 
( 


—— Nous venons de prouver que Ro = oR7!. 


— Tout élément de G peut s’écrire soit sous la forme À”, soit sous la forme o R”?, 
selon que l’élément est dans GT ou GT. 


— Tout élément du groupe diédral D, s'écrit soit sous la forme r””, soit sous la forme 
sr” (proposition 18.175(2)). 


L'application 6: G — D, suivante est donc une bijection : 
FA US EE (18.572a) 
Han) =sr" (18.572b) 
Il nous reste à prouver que c’est un morphisme. Cela se fait en utilisant la table de 


multiplication du groupe diédral donnée dans la proposition 18.179 et celle du groupe 
G que nous venons d'écrire. 


Définition 18.201 (Groupe de symétrie d’une partie de R?[522]). 
Si Ÿ est une partie de R", nous définissons le groupe des symétries de Y par 


Sym(Y) = {f € Isom(R”) tel que f(Y) = Y'}. (18.573) 
Nous définissons aussi le groupe des symétries propres de Y par 
Sym*(Y)={felsom'(R") tel que f(Y) = Y} (18.574) 


où Isom*(IR") est le groupe des isométries positives de R”, définition 18.92. 
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THOooAYZVooPmCiWI 
Théorème 18.202 ([522]). 
Soit Y € R?. 


(1) Si le groupe Sym*(Y) est fini d'ordre n, alors c’est un groupe cyclique d’ordre n. 


(2) Si Sym*(Y) est fini, alors Sym(Y) est soit cyclique®! d'ordre n, soit isomorphe au groupe 
diédral®? d'ordre 2n. 


Démonstration. Nous savons déjà par la proposition 18.99 que Sym*(Y) est isomorphe à un sous- 
groupe H* d'ordre n de SO(2). Vérifions que ce groupe est cyclique. Si n = 1, c’est évident. Si 
n > 2 alors nous savons que H* est constitué de rotations d’angles dans [0,2x[ et vu que c’est un 
ensemble fini, il possède une rotation d’angle minimal (à part zéro). Notons @ cet angle. 

Nous montrons que H* est engendré par la rotation d’angle @o. Soit une rotation d’angle a. 
Étant donné que ap < & nous pouvons effectuer la division euclidienne %? de & par ao et obtenir 


a = kao + B (18.575) 


avec 8 < ao. Mézalors R(B) = R(a)R(ao) * est également un élément du groupe. Cela contredit 
la minimalité dès que 6 Æ 0. Avoir 5 = 0 revient à dire que « est un multiple de @o, ce qui signifie 
que le groupe H* est cyclique engendré par a. 

Notons au passage que nous avons automatiquement @p = îr parce qu'il faut R(ao)" = Id. 
Nous avons prouvé que Sym*(Y) est cyclique d’ordre n. 

Nous étudions maintenant le groupe Sym(Y). Par la proposition 18.99 nous avons un morphisme 
injectif 

D: Sym(Y) — O(2), (18.576) 

et en posant H = @(Sym(Y)) nous avons un isomorphisme de groupes @: Sym(Y) — H. Nous 
savons aussi que ce @ se restreint en 


D: Sym'(Y) — Htc SO(2) (18.577) 


où H* — p(Symt(Y)) — H nSO(2). Le groupe H+ est cyclique et est engendré par la rotation 
R(27/n). 

Supposons un instant que H & SO(2). Alors nous avons H = H* et @ est un isomorphisme 
entre Sym(Y) et le groupe cyclique engendré par R(27/n). 

Nous supposons à présent que Æ n’est pas un sous-ensemble de SO(2). Quelles sont les isomé- 
tries de IR? qui ne sont pas de déterminant 1? Il faut regarder dans le théorème 18.191 quelles 
sont les isométries contenant un nombre impair de réflexions. Ce sont les réflexions et les réflexions 
glissées. Or il ne peut pas y avoir de réflexion glissée dans un groupe fini, parce que si f est une 
réflexion glissée, tous les f* sont différents. 

Nous en déduisons que si H n’est pas inclus dans SO(2), il contient une réflexion que nous 
nommons ©. Nous allons en déduire que H + HŸ x ag C2 où C2 = {Id,o}. Si he H nous pouvons 
écrire 

h = (ho°)o° (18.578) 
pour n'importe quelle valeur de €, et en particulier pour € = +1. 

Si h e SO(2) alors nous écrivons h = ho!° et si h # SO(2) nous écrivons h = (ho)o. Vu que 
ho € SO(2), cette dernière écriture est encore de la forme SO(2) x C2. Quoi qu'il en soit, tout 
élément de H s'écrit comme un produit 


Cette décomposition est unique parce que si h1C1 = h2c2 alors h; Th = Cr !, et comme h; The 
HT nous avons CC! e H* et donc €; = c2. Partant, nous avons aussi h1 = h2. Pour avoir 


61. Définition 1.319. 
62. Définition 18.170. 
63. Théorème 1.215. 
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le produit semi-direct, il faut encore montrer que Ad(C2)H*T € HT. Le seul cas à vérifier est 
Ad(o)H* € H*. Comme les éléments de HŸ sont caractérisés par le fait d’avoir un déterminant 
positif, nous avons 


Ad(o)R(a) = oR(a)o le H*. (18.580) 


Remarque 18.203. 

Tout ceci est cohérent avec le théorème de Burnside 9.307 parce que le sous-groupe fini de SO(n) 
engendré par la rotation R(27/n) est un groupe d’exposant fini, à savoir que si h est dans ce 
groupe, h" = Id. 


18.11.2 Relations trigonométriques dans un triangle rectangle 


Nous donnons maintenant quelques relations trigonométriques classiques dans un triangle rec- 
tangle. Le théorème de Pythagore est déjà le théorème 11.22; nous nous concentrons ici sur les 


angles. 
PROPooCDZVooKOQzct 


Proposition 18.204. 
Soient À, B,S e R? des points distincts et non alignés formant un triangle rectangle en À : 


(A—S) :(B—A)=0. (18.581) 
En posant 0 = ASB nous avons 
|A — 51 
COs(0) = ———— 18.582) 
8-5 


et 


sin(#) = se FAoOERE TS TER 


Démonstration. Nous posons © = A — Set D = B — S. Comme C Æ 0, il existe une rotation R4 
telle que 


(00 (18.584) 
(RaC)y = 0. (18.584b) 


Nous posons X = RC et Y = RAD. 
Le triangle formé de O, X et Y est « posé » sur l’axe des abscisses et est rectangle en X, 
c’est-à-dire 
X :(Y-X)=0. (18.585) 


De ce fait, le point Y satisfait à Y; = X4. Et enfin, grâce aux propositions 18.163 et 18.164 nous 
avons ASB = XOY. 
Nous écrivons les relations qui définissent l'angle XOY. Pour cela nous posons X’ = X/|X| 


et Y’=Y/|Y| et nous avons a 
cos(0) = X!Y} (18.586a) 
sin(6) = X!Y/. (18.586b) 


Vu que X = (X3,0), nous avons X/ = 1. De plus 
IV = Ra(D)| = ID] = 18 — S1. (18.587) 
En substituant les valeurs dans (18.586), 


Ya Xx ICT _ AS] 


cos(@) = Y} 


1 = _ | (18.588) 
Il IB—-S1 1B—-S| 1B-S$1 


Voilà déjà une chose de prouvée. 
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Pour la seconde, nous avons sin(Ÿ) = Y}. Selon le signe de Y, nous avons Y, = +|Y — X| et 


donc . — _ 
den = PAIE PE = PA 


" y] al _ M _IB-S| 


(18.589) 


Le signe sur la formule du sinus revient au fait que la définition de l’angle AOB est de considérer 
la rotation qui fait aller À vers B. Donc suivant la position relative de À, O et B, il se peut que 
l’angle mesuré soit l’angle extérieur au triangle. 

La proposition suivante est parfois prise comme définition de l’angle. 


Proposition 18.205. 
Soient trois points non alignés À, S, B e R°. Nous avons 


ans _ (4-5) (B=S) EQooOWULopV 
cos (ASB) A = SI =] TN BE) 


Démonstration. Nous posons C = A—S, D=B-—S$S, X = C/|C| et Y = D/|D|. Avec cela, la 
définition 18.157 donne l’équation 


Gr ui) x)" (n) . 


que nous écrivons comme le système 


8 


Xx cos(0) — X,sin(8) = Y, (18.592a) 
X, cos(8) + X;sin(0) = Y,. (18.592b) 


Nous considérons maintenant cela comme un système pour (cos(0),sin(0)) : 


Xx —Xy\ fcos(8) Le 
; = | 18.593 
a X% ) cn hs ( ) 
Le déterminant de la dernière matrice est X, + + = |X|? = 1 parce que X est unitaire. Cette 
matrice est donc inversible et son inverse est vite calculée. Nous avons 


. L ee ro) ta (18.594) 


Cela donne ce que nous voulions : 


CD (4-5) (8-5 
ICIIDI  1A-SIIB -S1 


cos(0) = X : Y = (18.595) 


Remarque 18.206. 
Prendre la formule (18.590) 


sise) 
1A— S|IB — S| 


cos (ASB) = (18.596) 


comme définition de l’angle ASB est cependant trompeur parce que ça ne permet de définir les 
angles que sur une partie de [0,27|[ sur laquelle le cosinus est injectif. Pour réellement définir tous 
les angles, il faut alors un peu bricoler. 

Sans vouloir être méchant, je crois que ceux qui procèdent de cette manière sont ceux qui 
donnent un cours sur le produit scalaire sans avoir l'intention de lier la définition d’une rotation 
comme composée de réflexions aux matrices de SO(2) et aux fonctions trigonométriques. 
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18.11.3 Pavages du plan 
DEFooHPKFooSIDhCM 


Définition 18.207. 
Une application affine f : R° — R" est un déplacement lorsqu'elle est une isométrie de (R”, d) 
qui préserve l'orientation °*. 

DEFooJPHKooRgCBJs 
Définition 18.208 ([416]). 
Un pavage de R? est une paire (G,K) où G est un groupe de déplacements de R? et K un 


compact de R? d'intérieur non vide telle que 
! ÉF 2 
D G'K=R, ITEMoo01JZooZMKLUm 
(2) Si g1,g2 € G satisfont ga * Int(K) n g2 * Int(K) £ G, alors g : K = g2 : K. 


Nous disons qu’un groupe G de déplacements de R? est un groupe de pavage de R? si il existe 
un compact K tel que la paire (G, K) soit un pavage. 


En termes de notations, 


GK = {Ja(K&) = [] Us). (18.597) 


LEMooWZSWooZYkICn 
Lemme 18.209 ([1]). 
Soient une bijection affine ©: R? — IR? ainsi qu’une droite d et un point A. Nous notons S la 
partie de R? située du côté de d contenant A. 
Alors @(S) est la partie de R? située du côté de g(d) contenant g(A). 


Démonstration. La droite d est donnée par une application affine f: R? — R et la définition 

d = {x e R? tel que f(x) = 0}. (18.598) 
Nous supposons que f(A) > 0; sinon, nous pouvons utiliser — f au lieu de f. Donc 

S = {re R° tel que f(x) > 0}. (18.599) 
La partie w(S) est alors donnée par 

p(S) = {v(x) tel que f(x) > 0}. (18.600) 
Comme % est une bijection, cela s'écrit aussi bien 

p(S) = {y e R° tel que f(@7{y)) Dh (18.601) 


De même 


p(d) = {se R° tel que f(p7!(s)) = 0}. (18.602) 


Donc les deux côtés de la droite w(d) sont donnés par le signe de f o w”!. Nous avons 


(fop )(p(4)) = f(4) > 0. (18.603) 
Donc (A) € w(S). 
LEMooZOXVooTJiLTF 
Lemme 18.210. 
Le groupe 
G = r(Te:; Tes) (18.604) 


est un groupe de pavage du plan. 


64. Définition 9.32. 
65. Définition 18.207. 
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Démonstration. Il suffit de prendre le carré K = [0,1] x [0,1]. En appliquant les translations, nous 
recouvrons tout le plan, sans intersection des intérieurs des carrés. Notons toutefois qu’il y a un 
recouvrement des bords. 


LEMooTMRGooChBzZg 
Lemme 18.211 ([1, 535]). 
Le groupe 
GC = ST: tes RoÛr)) (18.605) 


est un groupe de pavage du plan. 


Démonstration. Le compact à considérer est X = [0, i] x [0,1]. Le compact X et son image par 
Ro(t) sont représentés sur la figure 18.8. 

En agissant sur K avec les translations verticales et horizontales, nous recouvrons des bandes 
verticales de largeur 1/2. En agissant de même sur Ro(m)(K), nous recouvrons les autres bandes 
verticales. 

Donc G : K recouvre bien R?. Il serait cependant un peu présomptueux de croire en avoir fini. 
Il faut vérifier la condition (2) de la définition 18.208 d’un pavage. 

Supposons que g * Int(K) n g : Int(K) 4 @. Cela signifie qu’il existe k1,k2 € Int(K) tels 
que g1(k1) = g2(k2), ou encore que 


(92 "g1)k1 = k2 € Int(K). FAooTTTE os 


Quelle est la forme d’un élément général de G? Le lemme 1.316 nous indique qu’un élément 
général de G est un produit fini de 7e,, Te, et Ro(t). Mais nous savons que si « est linéaire, 


AO Tu = Ta(u) © À (18.607) 


Dans notre cas, dans un produit général, nous pouvons déplacer tous les facteurs Ro(x) à droite en 
changeant des Te, en TRo(r)e, = Te. Les translations par contre commutent sans faire d'histoires. 
Donc un élément général de G est de la forme 


g= Tate Ro)" (18.608) 


Nous pouvons évidemment restreindre m à {0,1}. Supposons k € Int(K) et g(k) € Int(K). Nous 
avons 0 < kx < 0.5. Si m = 1, alors g(k)x € ]—-1/2,0[ et aucun rÀ g(k); ne pourra plus être entre 


0 et 1/2. Donc m = 0. À partir de là, pour avoir g(k) € Int(K) nous devons avoir également 
k=1=0. Donc g = Id. 
Deux éléments g1 et g2 vérifiant la condition (18.606) doivent donc vérifier g, ln = Id, et donc 


Le 


FIGURE 18.8: Le compact X et son image par Ro(r) pour le legyafri8#ribooefYkmCbP 


g1 = g2. Par conséquent g1 : K = g : K. 


LEMooJPNDooHDCLnY 
Lemme 18.212 ([1, 535]). 
Le groupe 
ST (Te: ; Te» Ro(T/2)) (18.609) 


est un groupe de pavage. 
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Démonstration. Le pavé à considérer est 


ke F- 0] x [0, = (18.610) 


En lui appliquant trois fois la rotation Ro(r/2), nous reconstituons le carré [—?, 5] x [2,2]. 
Ensuite, avec les translations, nous pavons tout le plan. 

Pour la seconde condition, nous procédons comme dans la démonstration du lemme 18.211. 
D'abord Ro(m/2)e1 = e2 et Ro(m/2)e2 = —e1. Donc dans un produit général de 7.,, Te, et Ro(n/2) 
(et de leurs inverses), toutes les rotations peuvent être mises à droite ; nous avons donc un élément 


général de G sous la forme 
9 = Ta © Ro(x/2)* (18.611) 
avec a € Ze + Ze et ke {0,1,2,3}. 

Vu que les translations se font par nombres entiers tandis que les différences de coordonnées 
entre les Ro(n/2)* K sont demi-entiers, si k € Int(K), alors aucun 7, ne permet d’avoir (r, o 
Ro(x/2))k € Int(K). 

Bref, si (g> ln)ke K, alors encore une fois 92 ln = Id. 


Et c’est maintenant que les choses compliquées commencent. 
LEMooMWWEooEbZXtb 


Lemme 18.215. 
Le groupe 


gr (re : T( 


A Ro(r/3)) (18.612) 


mL 
2:2 


est un groupe de pavage. 


Démonstration. Ici le compact X est le triangle de sommets À = (0,0), B = (à, ) et C = (1,0). 
Plus précisément il s’agit de l’intersection des trois parties suivantes : 


— le côté de la droite (AB) où est C, 
— le côté de la droite (AC) où est B, 
— le côté de la droite (BC) où est À. 
Il est bon d'écrire ces trois conditions sous forme d’inéquations. 
— La droite AB est donnée par l'équation f4g(x,y) = 0 pour fag(x,y) = x — V3y. Puisque 
fag(C) = 1, la première inéquation pour K est 


x — V3y > 0. (18.613) 


— Pour la droite (BC') nous avons fgc(x,y) = —x — V3y +1 et fc(A) = 1. Donc la seconde 
inéquation pour K est 
—x—V3y+1>0 (18.614) 


— La droite AC' est donnée par l'application fac(x, y) = y. Vu que fac(B) = 43/6, nous avons 
la troisième inéquation pour KÆ : 
y>0. (18.615) 


/ 2 Dh ie à UBEQSooECKFooUdneUA 
En résumé, la définition de K est le système P : 


x — V3y > 0 (18.616a) 
—x—V3y+12>0 (18.616b) 
y > 0. (18.616c) 


La figure 18.9(a) nous montre ce triangle et l’action des puissances de Ro(m/3) sur lui. Pour 
votre gouverne, la matrice de cette rotation est 


mr) = (32 16) Eco Eh 
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La figure 18.9(c) vous montre une partie de ce pavage dans toute sa splendeur. 

Puisque les translations sont u1 = ej et u2 = (G, ve. il est suffisant de montrer que notre 
pavage pave réellement le parallélogramme construit sur ces deux vecteurs. Nous vous avons très 
obligeamment dessiné ce parallélogramme pavé sur la figure 18.9(b). 

Pour montrer que les triangles dessinés pavent effectivement le parallélogramme, nous allons 
procéder à une exhaustion de cas. Soit (x,y) dans le parallélogramme. 

Nous commençons par couper le parallélogramme en deux parties suivant la diagonale allant de 
ui à u2. Dans la vie mon p'ti gars, il y a deux types de points : ceux qui vérifient x + NE —1<0 
et les autres. 

(1) Six+y/V3—1<0 Ceci est le côté de (0,0). Nous subdivisons suivant la petite barre 
verticale (suivez le dessin), c’est-à-dire suivant les deux cas : x > l et z < L. 
(la) Si x < à Enfin nous coupons avec la droite diagonale partant de (0,0), c’est-à-dire 


selon que x — V3y < 0 ou x — V3y > 0. 


(lai) Si x — V3y <O Les points dont nous parlons sont les (x, y) € IR? vérifiant FRERE 
T + =1<1 (18.618a) 
V3 
T< : (18.618b) 
x — V3y < 0. (18.618c) 
En suivant le dessin, vous remarquerez que l’élément de G à considérer est 
9 = Ta 9 T_1 48) © Ro(r/3)*. (18.619) 
Nora FRRoGOIBEGOGEETEE 
g(A) = e 2 (18.620a) 
g(B) = - ) (18.620b) 
g(C) = (0,0). (18.620c) 
Ce ss les équations (18.618) décrivent est l'intersection des trois parties suivan- 
teas ”” : 


— le côté de la droite (g(A)g(B)) contenant g(C), 

— le côté de la droite (g(A)g(C)) contenant g(B), 

— le côté de la droite (g(B)g(C')) contenant g(4), 

Le lemme 18.209 nous permet d'exprimer ces trois parties en termes de K : 

— l’image par g du côté de la droite (AB) contient C, 

— l’image par g du côté de la droite (AC) contient B, 

— l’image par g du côté de la droite (BC) contient À, 

Comme g est une bijection, l’intersection des images par g est l’image par g de 
l'intersection. Bref, les équations (18.620) décrivent l’image par g de K. 

Cette partie est donc pavée par (G, K). 


(lai) Si x — V3y > 0 hop, même calculs avec des petites variations. Nous laissons la 
lectrice s’en occuper. 


(1b) Six >} hop. 


(2) Siz+y/V3-12>0 hop. 


66. Personnellement, je n'ai pas vérifié, mais ça m'étonnerait que ce soit faux. Vérifiez et écrivez-moi. 
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Les cas listés se traitent surement de la même façon. Nous tenons pour prouvé que (G, K) est bien 
surjectif sur IR?. 

Nous devons encore montrer la condition (2) de la définition 18.208. Commençons par détermi- 
ner la forme générale d’un élément de G sous la forme 7, o ro où ro est une application linéaire. Le 
lemme 1.316 nous indique qu’un élément général de G = 8(Ter: T(1,98) Ro(r/3)) est un produit 


arbitraire (mais fini) de r.,, Ta 3) et de Ro(rx/3) et de leurs inverses. 
2? 2 


Comme toujours nous avons @& 0 Ty = Ta(v) © À. Donc nous pouvons passer toutes les rotations 
Ro(x/3) et Ro(r/3)! à droite du produit, quitte à produire des translations des formes suivantes : 


Ro(x/3)"ei (18.621a) 

Ro(r/3) (5. Ÿ) (18.621b) 

Ro(x/3) "ei (18.621c) 

Ro(r/3) (3, (18.621d) 
SUBEQoOoEMVIooNaaMqk 


En utilisant la matrice (18.617) nous trouvons assez vite que | 
1/2 

Ro(r/3)e: — (75) (18.622a) 
2, _ {—1/2 

Ro(r/3) ET — (ae (18.622b) 

Ro(r/3)#e1 = —e1. (18.622c) 


Les applications suivantes de Ro(m/3) ne donnent rien de nouveau, si ce n’est le signe. Les puissances 
de Ro(x/3) appliquées à (3, 43) sont déjà parmi celles listées en (18.622). Quant aux inverses, 
Ro(r/3)-! = Ro(x/3)° ; donc rien de nouveau non plus. 

Un élément général de G est donc dans 


To © Ro(r/3)* (18.623) 


ei + Z fe) +Z CF) (18.624) 
2 2 


avec v dans 


Remarquons que 


(= (4) vs 


Donc un élément général de G est 


à ce, 9) o Ro(r/3)". (18.626) 
25 
Nous pouvons maintenant prouver notre point. Pour cela nous allons successivement considérer 
les 5 rotations de K présentées dans la sous-figure 18.9(a). Pour chacune nous allons montrer 
qu'aucune translation ne permet d'obtenir une intersection avec K. 
Nous allons en faire un seul en détail. 


(1) Pour ZL = Ro(x/3)K° hop. les détails sont laissés à notre aimable lecteur qui ne pourra pas 
ne pas compléter tous les cas. 


(2) Pour L = Ro(r/3)°K° Nous allons prouver que si (x, y) € Int(L), alors 


Te © T(_2 Va (æ, y) (18.627) 
. 
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ne peut pas être dans Int(KX). Pour la simplicité des notations nous notons r = Ro(r/3)?; 
nous avons 


__f—1/2 -43/2 
r = (a A) (18.628) 
Nous considérons g = Ce 9T(_1v8,07. Un calcul nous donne l’image de (x,y) par g : 
23 2 
1 V3 sl V3 1 
had 27 241 — 22 y+tk-;l 
E,Y) = TS OT _ ; 18.629 
PH) Ta 97 a CE: - à) | Bo jy + A on 


Nous considérons (x, y) € Int(K) tel que g(x, y) € Int(K), et nous allons trouver une contra- 
diction. Le fait que (x, y) € Int(K) signifie que (x, y) satisfait les inéquations (18.616) mais 
avec des inégalités strictes. Le fait que g(x, y) € Int(X) nous donne trois inéquations de plus. 
Assez rapide calcul : 


faB(g(x,y)) = —-2x+k-—2, (18.630a) 
fec(g(x,y)) = -x — V3y-k—1+1, (18.630b) 
fac(g(x, y)) = V3, SU + ee (18.630c) 


Au final, notre point (x,y) doit satisfaire le système suivant : 


_ V3y . Gi} FERRONIRRSeSTENEN (18.631a) 
- V3y ide (PF ERSPENIRSSRURE (18.631b) 
_ pPUBÉQoOYCUNOOHJHVHE (18.6310) 
de NP (18.631d) 
V3 7 " ” _ pPUBEQoOSNVNoOVr TU y (18.631f) 


Les inéquations 18.631c et 18.631a donnent déjà x > 0. De même avec 18.631b nous trouvons 
x < 1. Voilà déjà x € |0,1/[ qui est directement visible sur le dessin du triangle K. 


Puisque x > 0, l’inéquation (18.631d) donne 
k—21>-25+k-—21> 0. (18.632) 


Donc k — 21 > 0. 
Comme x < 1 et y > 0, l’inéquation (18.631f) donne 


va, V3, va À + Va 
2 | 2 2 297 9 


0. (18.633) 


Donc #( +1) > 0. Comme / est entier, cela donne { > 0. 
Enfin, de (18.631e) nous tirons 


—k+1>-x-V3y-k-1+1>0, (18.634) 


Ce qui donne k < 1 et donc k < 0. 


En résumé nous avons trouvé trois inéquations pour k et l : 


k< 0 (18.635a) 
1>0 (18.635b) 
k—2 > 0. (18.635c) 


Ce système est impossible. 
Il n’existe donc pas de translation qui, appliquée à Int(L), donne une intersection avec Int(K). 
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(3) Pour L = Ro(r/3)°K hop. 
(4) Pour L = Ro(r/3)*K hop. 
(5) Pour L = Ro(r/3)°K hop. 


Voilà. J'espère que toutes les idées sont en place, et que les parties manquantes sont seulement des 
vérifications qui se font mécaniquement, de la même manière 7. 


11 
—1 1 
—1+ FRPELFIEPNECONGNT czZnssLäHeéeHFign 
(a) Le compact X et ses ro- (b) Une maille du réseau des 
tations. translations de G. 


PERL EPNAEGeS 


(c) Une partie du pavage complet. 


FIGURE 18.9: Illustrations pour le pavage du lemme 184e.FigPuMCooGWYCczZn 


LEMooGSQSooGSfkaL 
Lemme 18.214. 
Le groupe 


gr (1,71 2, Ro(r/3)) (18.636) 


_1 3 
2772 


est un groupe de pavage. 


D’après [535], la démonstration du lemme 18.214 demande d'utiliser le losange de sommets 


(0,0), (1,0), (4, 3) et (1,—V3)68. 


LEMooEKWZooYbcGBp 
Lemme 18.215 ([1]). 
Soient u1,u2 € R? non colinéaires, ainsi que à, B € [0,1]. Nous considérons v = au + Bus. 
Nous supposons pour fixer les idées, que |u| > Ju2l. Alors 


min{|u], fui +u2 — v|} < ul. (18.637) 


67. Je n'ai pas vérifié. Faites-le et écrivez-moi pour me dire ce qu'il en est. 
68. Je n'ai pas vérifié, mais à mon avis une preuve doit prendre les mêmes idées que celles du lemme 18.213. 
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Autrement dit, tout point intérieur d’un parallélogramme est plus proche d’un angle que la longueur 
du plus long côté. 


Démonstration. Les points au1 + Bu2 (a,B € [0,1]) se divisent en deux parties : ceux avec 0 < 
a + 5 < 1 et ceux avec 1 <a +B< 2. 
Si à + 5 < 1 alors 


lou: + Bu < law] + Blue = alu + Blue < (a+ BJluil < Juil: (18.638) 


L’inégalité est stricte parce que u1 et u2 ne sont pas colinéaires. 
Si au contraire & + 8 > 1 nous avons 


fus +u2 — au — Bu < |(1 — au] + (1 — Bull < (2 — a — B)lul < fui. (18.639) 


LEMooWKTGooQ1lfuxm 
Lemme 18.216. 
Soient un ensemble E, et deux bijections r,s: E — E ayant chacune un unique point fixe. Si elles 
commutent, alors leurs points fixes sont égaux. 


Démonstration. Nous nommons a le point fixe de r et b celui de s. Pour tout x € E nous avons 
(rs)(x) = (sr)(x). En particulier pour x = s-l(a). D'une part 


so) sr) 10. (18.640) 
Et d’autre part, 
(sr)(a) = (srs-!)(a) (18.641) 


Si nous imposons (srs-l)(a) = a, nous avons, en appliquant s-! des deux côtés : (rs-l)(a) = 
5 l(a). Cela prouve que 5! (a) est un point fixe de r. Donc s—l(a) = a. 
Nous en déduisons que a est un point fixe de s et donc que a = b. 


LEMooDGSJooCiBhzz 
Lemme 18.217. 
Soit un sous-groupe T de (R?,+) tel que |v| > à pour tout v Z 0 dans T. 
Alors si u1 et u2 sont les plus petits éléments en norme de T, nous avons 
T = Zui + Zu. (18.642) 


Démonstration. Nous décomposons en plusieurs parties. 


(1) R'vnT=Nu Soit ve T. L'ensemble {1 € R* tel que Àv € T} à un minimum parce 
que tous les éléments de T' sont en norme plus grands que Ô > 0. Soit À, ce minimum et 


Um = ÀAmU. 
Nous prétendons à présent que R'vnT = Nv,. Nous ne faisons d’ailleurs pas que prétendre ; 
nous prouvons. En effet, soit Av € T. Nous devons prouver que À = {À;, pour un certain { € N. 
Soit ke N tel que k<A<k+I. 
Nous avons 

(k + 1)Am — À < (k + 1) Am — kÂm = Âm. (18.643) 
Vu que T est un groupe pour l’addition, et que À.uv € T'et Àv € T, cela implique que 
((k+1)Am — Àjue T. Mais 


[CC + 1) Am — A)v| < Am. (18.644) 
Vue la propriété de minimalité de À}, nous avons forcément 
(k+1)An — À = À. (18.645) 
Cela prouve que À = km. 
Jusqu'ici nous avons prouvé que 
R'onT= Num (18.646) 


pour un certain multiple v, de v. 
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(2) lu] < |v| pour tout v 


Nous montrons à présent qu'il existe u1 € T tel que fu1| < |v| pour tout ve T. Si tel n'était 
pas le cas, il existerait une suite vx € T telle que |wx:1| < |v,]. Toute cette suite serait 
contenue dans la couronne (compacte) de rayons 6 et |u1|. Quitte à prendre une sous-suite, 
nous pouvons supposer que (v;) converge 69, Cette suite serait de Cauchy et pour tout € (en 
particulier € < 6), il existerait p,q tels que |u, — v,| < €. Puisque T est un groupe pour 
l'addition, nous aurions v, — v, € T avec |v, — v| < € < 6. 


(3) Première pause 


Si T'est engendré seulement par w1, nous avons fini. Autrement dit, si tout Test dans un 
sous-espace de dimension 1 de IR?, nous avons terminé. 


Dans la suite, nous supposons donc que T' n’est pas contenu dans un sous-espace de dimension 
1. 


(4) T = Zu + Zu2 Soient ui et u2 les deux plus petits éléments de T en norme (peut-être 
ex-aequo). Ces deux éléments ne sont pas colinéaires, sinon leur différence serait plus petite. 
Ils forment donc une base de R?. 


Soit ve T. Comme {u1,u2} est une base de R?, il existe à, 8 € R tels que 
v = au + Bus. (18.647) 


Notre but est à présent de prouver que «&, B € Z. 


Si ce n’était pas le cas, une simple translation nous mènerait dans les circonstances du lemme 
18.215. Nous aurions alors que, soit vw], soit [ui + u2 — v| serait strictement plus petit que le 
plus grand entre |u1| et |u2|. Cela contredirait le fait que |u1| et |u2| étaient les deux plus 
petits. 


PROPooPQYXo0o1DZ1Hy 
Proposition 18.218 (|[1]). 
Si G est un groupe de pavage de R? et si f: R°? — R? est une isométrie affine, alors le groupe 


G'= foGof = {fogof ! tel que ge G} (18.648) 


est un groupe de pavage. 


Démonstration. Soit un compact K tel que (G, K) soit un pavage. Nous notons K’7 = f(K). Nous 
devons prouver deux choses : 


— foGof-lest un groupe de déplacements : 
— (G’, K7) est un pavage. 
Ceci mène à prouver trois éléments. 


(1) G’ est constitué de déplacements Les éléments de G sont des isométries, ainsi que f et 
f7!. Donc les éléments de G’ sont des isométries. 


Soit g € G. Comme g est affine, il existe une décomposition g = Ty © go où go est linéaire. 
De même f = 7, 0 fo. Les règles du produit et de l’inverse de la proposition 8.62(2)(3) nous 
indiquent que la partie linéaire de fgf-! est fogo Jo . 


En ce qui concerne le déterminant de f090f0 L c’est la proposition 9.13 qui nous indique que 


det(fogo fs *) = det(fo) det(go) det(f5 ") = det(fo) det(go) det( fo)? = det(go) = 1. 
(18.649) 


69. Proposition 7.275. 
70. Définition 18.208. 
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(2) G': K!'=R? Comme f est affine, X’ est encore compact "! Nous avons : 


(feacef” = |) U( ogof !)(f(k)) (18.650a) 
geG keK 
= U U (fo g)(k) (18.650b) 
geG keK 
= (J F(Ù 2%) (18.650c) 
geG keK 
= U (fo g)(K) (18.650d) 
geG 
= (U 3&) (18.650e) 
geG 
= Gr. K) (18.650f) 
= R?. (18.650g) 


Pour la dernière égalité, nous avons utilisé le fait que f est bijective et que G : K = R?. 


(3) L’autre condition Deux éléments de G’ s’écrivent fg1f! et fg2f-!. Nous les supposons 


tels que 
(af): Int(K) n(fgf") : Int(K’) # S. (18.651) 
Nous avons : 
(gift) + Imt(K°) n (ff) + t(K’) = f(g : Int(K F2 RERO Mur EgAy 
= f(g: Int( : inde LnSVRERg nn) 
2) 
£ D. (18.652c) 


Justifications : 
—— Égalité (18.652a) parce qu’un peu de topologie nous enseigne que 7! (Int(K”)) = 
Int (f 1 (K")) = Int(K) parce que f est affine. 
— Égalité (18.652b) parce que, f étant bijective, f(A) n f(B) = f(AnB); 


THOooUPHQooYfeHAy 
Théorème 18.219 ([416, 535]). 
Nous notons 7, la translation de vecteur v, r49 la rotation de centre À et d’angle 0 ainsi que 
T3 —= Te;- 
Un groupe G est un groupe de pavage de IR? si et seulement si il existe une bijection affine 
f: R? — R° telle que fo Go f-! est un groupe de la liste suivante : 


(1) gr (r1,7) 


(2) gr (m1, 72, Ro(x)) 

(3) gr (n, “a # , Ro(2x/3)) 
(4) gr (m1, 72, Ro(x/2)) 

(5) gr a y Ro(r/3)). 


1 
2? 
Démonstration. Les lemmes 18.210, 18.211, 18.212, 18.213, et 18.214 montrent que les groupes 
listés sont des groupes de pavage. La proposition 18.218 nous montre alors que si H = fGf-! est 
dans la liste, alors G est un groupe de pavage. Il nous reste à montrer que si G est un groupe de 
pavage, alors il existe une application affine a telle que aGa-! est un groupe de la liste. 

Soit (G,K) un pavage de R?. Nous notons T' l’ensemble des translations dans G, plus précisé- 
ment, 
T ={ve R° tel que 7, € G}. (18.653) 


71. Il suffit de prouver que f(K) est fermé et borné par le théorème de Borel-Lebesgue 10.24. 
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Une borne pour T Nous prouvons qu’il existe Ô > 0 tel que |v| > 6 pour tout v ÆD0ET. 
En effet, soit m € Int(K) ainsi que r tel que B(m,r) € Int(K). Alors si v € T est tel que 
[uv] < r nous avons 7,(m) € Int(K), ce qui donnerait 


me (Int(K)) nInt(K) (18.654) 


par hypothèse, cette intersection est non vide seulement si v = 0. 
Donc il existe 6 tel que |v| > 6 pour tout ve T. 


Utilisation du lemme 


La partie Test donc dans la position du lemme 18.217 et nous avons 
T' = Zu; + Zu (18.655) 


pour les vecteurs u1 et u2 les plus petits en norme de 7. 


En réalité, il se peut que T' soit plus petit que ça, parce que G peut par exemple ne contenir 
aucune translation. Nous avons trois possibilités : 


a {0}, 
— T = Zu pour un certain u Z 0 dans R?, 
— T = Zu + Zu2 pour certains w1,u2 € IR?\{0}. 


Translation Si r,se G, alors l'élément rsr-ls-l est une translation. En effet, puisque les 
éléments de G sont des déplacements, ce sont des applications affines et donc il existe des 
applications linéaires À,, 4, et des translations 7,,7, telles que r = 4,07, et s = A,07,. La 
proposition 8.62 nous donne les inverses. Nous avons 


rsr ls 1=(4,07,)(A,or,)(Alor_ av )(A;toT_Av.). (18.656) 


La partie linéaire de cela est 
Ae 4.6 Abe AE (18.657) 


C’est donc une composée de rotations centrées en (0,0). Mais ces rotations forment un groupe 
abélien (proposition 18.129). Donc nous pouvons écrire 
40 A0 A;toA-1= 4,0 4-104,0A-1=Id. (18.658) 


1 


Tout ceci pour dire que dès que r,s e G, l'élément rsr—!s-l est une translation. 


Les parties linéaires[1] Nous savons de l’exemple 8.18 que les éléments de G s’écrivent 


sous la forme f = rm oaæoùveR?et a: IR? — R? est linéaire. 

De plus, f étant une isométrie de (IR?,d), l'application a est une isométrie de (IR?, ||.|). 
Puisque a est une isométrie, det(a) = +1. Mais les déplacements conservent l’orientation ; 
donc a doit conserver l'orientation, et la proposition 9.31 nous dit que det(a) > 0. Donc 


det(a) = 1. (18.659) 


Le théorème 18.95 dit que a est la composition d’un nombre pair de réflexions. Mais comme 
il y en à au plus trois (théorème 18.189), l'application a est composée de zéro ou deux 
réflexions. 


Donc les parties linéaires des éléments de G sont des rotations. 


Les autres 

Les parties linéaires des éléments de G sont des rotations. Mais les éléments de G eux- 
mêmes ne sont pas tellement mystérieux. Puisque ce sont des isométries de (R?, d), elles sont 
composées de 0, 1, 2 ou 3 réflexions. 

Mais ce sont des déplacements, donc ils préservent l’orientation et le théorème 18.95 dit qu’ils 
sont des composées de zéro ou deux réflexions (nombre pair). Ce sont donc des rotations. 


18.11. TRANSFORMATIONS DE LORENTZ 1649 


(6) Hein? Les éléments linéaires de G sont des rotations. Et les autres aussi? Les linéaires 
sont des rotations autour de (0,0): les autres sont des rotations autour de points autres que 
(0, 0). 
C’est pourquoi dans la suite, nous préciserons « rotation linéaire » pour une rotation autour 
de (0,0) et nous dirons « rotation » pour une rotation en général. Dans le contexte affine, il 
faut toujours faire attention à ça : une rotation peut très bien n'être pas linéaire *?. 

(7) Les rotations linéaires stabilisent T Nous prouvons maintenant que les rotations li- 
néaires de G stabilisent 7’, c’est-à-dire que si v € Tet si a est une rotation linéaire de G, 
alors a(v) € T. La transformation ar,a ! est dans G. Mais pour tout x € IR? nous avons 


(arya”1)(x) = a(a” (x) + v) = x + a(v) = Tati) (6). en 1880) 


= Ta(v) et a(v) ET. 


Donc ara! 


(8) Exclusion de T = {0} Le fait que T = {0} ne signifie pas que tous les éléments de G sont 
des rotations ; il peut encore y avoir des composées de rotations et de translations AoT. Cela 
étant dit, si T = {0}, il n’en reste pas moins que rsr ls! est une translation, c’est-à-dire 


est égal à Id. Mais rsr—!s-1 = e implique rs = sr. 


Donc Gest abélien. Les éléments de G sont donc des rotations qui commutent deux à deux. 
Puisqu'une rotation a son centre comme unique point fixe, le lemme 18.216 nous dit que tous 
les éléments de G sont des rotations de même centre. 

Soit c le centre commun de tous les éléments de G. Vu que X est compact dans R?, il existe 
r > 0 tel que K € B(c,r). Puisque G stabilise toutes les boules centrées en c, nous avons 


C-KeB(cr). (18.661) 


Donc nous n’avons pas un recouvrement de IR?. Le cas T = {0} est exclu. 


(9) Exclusion de T = Zu Nous supposons à présent que T = Zu pour un certain u € IR?. 


(9a) ro = +Id Nous savons que tous les éléments de G sont des rotations ; soit un élément 
r de G. La proposition 18.128(3) nous indique qu’il existe un point a € R? ainsi qu’une 
rotation linéaire ro telle que r = 7; trora. Nous allons prouver que ro est + Id. D'abord, 


rTur = Ta. LroTaTuTa ne = Te Liu our (18.662) 


Ensuite, nous appliquons cela à x e R? : 


(rs troTurg Ta)(t RU R nuit T5 x + a)) (18.663a) 
= (ri ro)(r5 (x + a) +u) (18.663b) 
= Tr; '(x+a+ro(u)) (18.663c) 
= x + ro(u). (18.663d) 


Donc roror | = T(u), Ce qui prouve que ro(u) € T. Comme |ro(u)| = [ul nous avons 
forcément ro(u) = +u. 
Si ro(u) = u, alors ro = Id (parce que ro est une rotation fixant plus qu’un seul point). 
Dans ce cas, r = Id. 
Si au contraire ro(u) = —u, alors ro = —Id. 

(9b) Forme générale Donc si r est un élément non trivial de G nous avons r = 777 0 
(— Id) o 7, et alors 


(r'o(-Id)or)(x) = 75 (—-Id)(x + a) = 7" (-x — a) = —-x — 2a. (18.664) 


Donc pour tout r € G, il existe a e R? tel que 
r(æ) = =x — %a. FAR EEE) 


Pour information, le centre de cette rotation est —a (c’est le seul point fixe). 


72. Lorsque, ailleurs dans le Frido, nous disons « rotation », souvent nous pensons « rotation linéaire ». Gardez 
cependant à l’esprit qu’une rotation peut très bien être centrée ailleurs qu’en l’origine, et soyez toujours capable de 
préciser le cas échéant. 
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(9c) Les centres sont alignés Soit r une rotation de centre —a et s de centre —b. Alors 


(rs)(æx) = r(—x — 2b) = x + 2b — 2a = x + 2(b — a). (18.666) 


Donc rs = T2(p_a)- 
Cela prouve que 2(b — a) € Zu. 
(9d) Une bande Soit la droite D = Ru. Nous considérons la bande 


B, = {x e R° tel que d(x, D) < r}. (18.667) 


(9e) Une inclusion Nous prouvons à présent que pour tout r, nous avons 


G-B,.cB,. (18.668) 


Nous savons qu’un élément général de G est une rotation centrée en un point de D), et 
que l’action d’une telle rotation est donnée par (18.665). Nous avons 


d(r(æ), D) = d(x + 2a, D) FRooNGQE near 
tte ns. EQooNFJN cË 
 dUre (e + 22), (D) ie . ED 
= d(x, D). PPS 66 DC) 


Justifications : 
— Pour (18.669a), nous avons D = —D et d(x,y) = d(—x, —-y). 
— Pour (18.669b), invariance par translation de la distance dans IR?. 


— Pour (18.669c), les éléments de D sont les multiples de a; donc cette droite est 
invariante par cette translation. 
Bref, d(x, D) = d(r(x), D). Donc, pour tout r > 0 * et pour tout ge G, si x € B,, alors 
g(x) € B,. 
(9f) Exclusion 

Comme K est compact et que la fonction x + d(x, D) est continue, il existe r > 0 tel 
que À & B,. Avec ça, G: K&G:B,c B,. Donc G : K ne recouvre pas tout R? et 
G n’est pas un groupe de pavage. 


Et nous voilà avec seulement T = Zu + Zu: en lice. 


(1) Pause : quelques parties de G à ne pas confondre Il convient de ne pas se perdre 
entre différentes parties de G. Je vous laisse méditer quelques temps sur la liste suivante : 


la) Gest le groupe que nous cherchons à déterminer ; 
T'est le groupe des translations de G : 


le groupe des rotations linéaires dans G': 


_ : . , ITEMooFWWMooNZLUG 
l’ensemble des 7 + oroTA où r est une rotation de G centrée en À. Ÿ 


ITEMooIEJZooNaSKpc 


( 

(1b) 
(c) 
(14) 
(le) 


En particulier les deux derniers points ne sont pas les mêmes. 


L est l’ensemble des parties linéaires des éléments de G.| 


Dans le cas (1d), il s’agit de dire que r est une rotation centrée en À e R? et écrire r = 
TA © ro 0 T4! (proposition 18.128(3)) et considérer ro. Dans ce cas, ro est une rotation, mais 
elle n’est pas ce que nous appelons la « partie linéaire » de r. Il n’y a pas de garantie que 
cela forme un groupe. 

Si r est une rotation dans @, dans le cas (le) il s’agit de décomposer r = 7, o a (lemme 
8.13) et considérer a. Dans ce cas, a est linéaire, mais il n’y a pas de garantie que @ soit une 
rotation. 


73. Remarquez la notation malheureuse pour r qui est maintenant une distance alors que trois mots plus tôt, 
c'était un élément de G. 
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(2) 


(3) 
(4) 


(5) 


(7) 


(8) 


L est un groupe En trois conditions. 
— $i à,B € L, il existe v,w € IR? tels que mn oae Get r,0B € G. La loi de produit 8.62(2) 
dit que y 0 & 0 Ty © B = Ta(wy+v © AB. Donc ab est la partie linéaire d’un élément de G. 
1 


— De la même façon, en utilisant l'inverse 8.62(3), (7, o a)! = 7_4-1(,) ° a! Donc a 
est la partie linéaire d’un élément de G. 
— Et enfin Id = % o Id. Donc l'identité est dans L. 
OK : L est un groupe. 
Précision L'ensemble L est un groupe, certes. Mais rien ne dit que L soit un sous-groupe 
de G. 


L préserve le réseau Soit à € L. Il existe v e R? tel que g = moae G. Soit ue T. Nous 
allons montrer que a(u) € T. Vu que g et 7, sont dans G, l'élément g7,g ! est également 
dans G. Nous l’appliquons à x € R°? : 


1 


(rar tr; (x) = (rora !)(x — v) (18.670a) 
- (na)(a”l(x —v)+u) (18.670b) 
= Ty(x — v + a(u)) (18.670c) 
= x + a(u) (18.670d) 
= To(u)(T)- (18.670e) 


Donc grug |! = Tati € G: 


Question de trace Soit a € L; dans la base {u,u2} la matrice de a est 


(° à) (18.671) 


avec a, b, c, de Z. La trace de cette matrice est a + de Z. Dans la base canonique de IR? par 
contre, la proposition 18.139 nous dit qu’il existe 0 € [0,27 tel que la matrice de a soit 


Gn@ 40) É90e) 


La trace est 2cos(0). La trace est invariante par changement de base, donc 2cos(0) = 
a + de Z. Les possibilités pour cos(4) sont donc —1, —1/2, 0, 1/2 et 1. 


Les angles possibles Nous savons que cos(5) = 0 et cos(r/3) = 1/2 (proposition 18.20(6) 
et lemme 18.27). La proposition 18.74 nous dit alors que, dans notre cas, les valeurs possibles 


pour 0 dans [0,27] sont 

2 4 

{0, 3 7. ne AGORA os a 
3 2 3 3 235 

Donc les rotations possibles dans L sont les rotations de ces angles. 


Nous devons trouver quels sont les groupes qui peuvent être formés seulement avec ces 
éléments. 


Quelques combinaisons impossibles 


Puisque L est un groupe, il y a des combinaisons impossibles. Par exemple si Ro(t/3) et 
Ro(x/2) sont dans L, alors la composée * Ro(r/2)Ro(r/3) = Ro(5x/6) est également dans 
L. Mais comme 57/6 n’est pas dans la liste (18.673), Ro(5x/6) n’est pas dans L. 

En raisonnant de la sorte, nous voyons que si Ro(r/2) € L, alors L = gr (Ro(x/2)). 

La liste Plus généralement, les possibilités pour L sont 


— {ld} 


74. Proposition 9.201. 
75. Proposition 18.140 pour l’addition des angles. 
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(Ro(r/2)) 
— gr (Ro(r/3)) 

— gr (Ro(r)) 

— gr (Ro(2r/3)) 
Une justification plus courte pour cette liste est d’invoquer le théorème 18.200(2) qui dit 
que L étant un sous-groupe fini des isométries de (R?, d), il est cyclique et donc monogène. 
Notons pour cela que gr (Ro(4x/3)) = gr (Ro(2x/3)) parce que Ro(4r/3) = Ro(2r/3) !. De 
la même manière Ro(3r/2) = Ro(r/2) ! et Ro(5r/3) = Ro(r/3) !. 


Le cas un peu générique 


Nous supposons que L = gr (Ro(8)) pour un certain 0. Nous allons voir qu’à part dans les 
cas 0 = 0 et 0 = 7, il est possible de trouver une application affine a telle que le groupe 
aGa-l soit alors dans la liste. 

Nous considérons un élément de G de la forme 7, © Ro(6). Pour être bien clair, il n’est 
absolument pas garanti que vo soit dans T. Nous allons chercher un élément wo € R? tel 
que le groupe de pavage 6 G’ — LE CE LES contienne Ro(0). Le groupe G’ contient l'élément 
D = Ho l0) on : nous l’appliquons à x € R? : 


g(x) = Ro(8)x — Ro(8)wo + Wo + vo. (18.674) 
Nous avons g(x) = Ro(6)x lorsque 
wo = (Ro(8) — 1) "vo. (18.675) 


Voilà pourquoi le cas 0 = 0 sera traité à part : dans le cas 0 = 0, AREA Ro(@) — 1 n’est 
pas inversible. Dans les autres cas, nous avons un groupe G’ = Ty (E rre qui contient Ro(). 


Puisqu’un élément général de G est de la forme 7, o Ro(0)", un nan général de G’ est de 
la forme 


Two © Tv © Ro(0)* O res — wo+v—Ro(0)Fw O Ro(0)*. (18.676) 


Donc tous les éléments de G’ sont encore de la forme 
Ty © Ro(8). (18.677) 


Mais dans G’ nous avons une information capitale : Ro(0)* lui-même est dans G’. Donc si 
Ty © Ro(8)* e G', alors 7, € G”. 

Vu que G’ est encore un groupe de pavage, tout ce qui a été dit précédemment tient, et le 
groupe des translations dans G’ est un réseau T” = Zui + Zu2 où u1 et u2 peuvent être 
choisis arbitrairement parmi les deux plus petits vecteurs non colinéaires de T. 

Tous les éléments de G’ sont de la forme 7, o Ro(0)" avec v € T'. Donc 


de tan m0). FoouUa PRET 


Nous savons que Ro(0) fixe T”. Or l’élément Ro()u1 à la même norme que u ; donc nous 
pouvons choisir u2 = Ro(@)u1 pour peu que Ro(Ô)u1 soit non colinéaire à u1. Et c’est ici que 
nous laissons le cas 0 = x de côté. 


Nous écrivons donc sans vergogne que 
G' = gr (Tu TRo(e)us» RO(8)). (18.679) 


Nous allons maintenant nous occuper de u1. Pour cela nous considérons une rotation suivie 
d’une homothétie a telle que a(u1) = e1. Une telle opération a d’une part, commute avec 
Ro(0) et d'autre part, réalise à o 7, o al = Ta(vy. Donc le groupe G” = aG'a-! est, par le 
lemme 1.317, 

G" = gr (sus ro) (18.680) 


76. Proposition 18.218. 
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Cela s'écrit aussi bien 
GC = gr (re, TRo(o)e:» Ro(0))- (18.681) 


Et voilà, ce groupe G” est un de ceux de la liste. 


(10) Le cas L = {Id} Dans ce cas, tous les éléments de G sont de la forme 7, avec v € T. Nous 


considérons l'application linéaire a: IR? — IR? telle que a(u1) = ex et a(u2) = e2. Nous avons 
(ao ra, 0 & 1)(x) = (aru,)a (x) = a(a (x) +w) = x + a(w) = r(x). (18.682) 


Donc ao Ty, 0 al = 7;. De la même façon, si a € Z nous avons ATau;@ | = Tae,. Et avec tout 
ça, si UE T, alors v = au; + bu2 et nous avons 


_1 _1 _1 _1 
id DE Don OLD aan (18.683) 


Nous avons donc 

aGa! = gr(r,r2). (18.684) 
Cela est un des groupes de la liste. 
Notez qu’à la place de ces calculs, nous pouvions aussi invoquer la proposition 1.317. 


(11) Le cas L={-—Id} Dans le cas 0 = 7, nous pouvons aller jusqu’à (18.678) et écrire 


G' = 87 (Tu: Tus Ro(T)): (18.685) 


Puisque Rofm) = —Id commute avec toutes les applications linéaires et que u1 et u2 ne 
sont pas colinéaires, nous pouvons considérer une application linéaire a: IR? — R? telle que 
a(u1) = e1, a(u2) = e2. Nous avons alors 


G"=aG'a !=gr (Tes Teos — Id), (18.686) 


qui est encore dans la liste. 


18.12 Un peu de structure de Ofn) 


18.12.1 Valeurs propres dans Ofn) 
PROPooVEJGooWngtMm 


Proposition 18.220 ([536]). _ 
Soit une matrice À € O(n). Sie C est une valeur propre de À, alors À est également une valeur 
propre de À, et de plus |X] = 1. 


Démonstration. Dire que À € € est une valeur propre de À signifie qu’il existe x € C” (non nul) 
tel que Ar = Àx. Comme les éléments de la matrice À sont réels, 


Aï = Az = Ax = Àx = Àt. (18.687) 


Donc À est une valeur propre de À pour le vecteur propre %. 
Soit À une valeur propre de À de vecteur propre x. Alors nous avons d’une part 


(Az, Ax) = (AÏA%, x) = (x, %), (18.688) 


et d’autre part : 
CAx, Az = (XE, Xxÿ = AZ, æ). (18.689) 


Puisque x # 0 nous avons aussi (#,x) # 0. Par conséquent |X[? = 1 et |A] = 1. 


LEMooNEDQooNRmASH 
Lemme 18.221 ([536|). 
Soient un espace vectoriel euclidien E de dimension finie et une isométrie f de E. Soit F un 
sous-espace de E stable par f. Alors F+ est stable par f. 
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Démonstration. La restriction fr: F — F est encore une isométrie ; elle est donc inversible : pour 
tout ye F, il existe x € F tel que y = f(x). Soit ae FT; nous montrons que f(a) € F+. Soit donc 
y e F'et calculons : 


(y, f(a)) = (f(x), f(a)) = x, a) = 0 (18.690) 


parce que xeFetae F+. 
PROPooUMORooWzsrDB 


Proposition 18.222 ([536]). 
Soit une isométrie f: R? — R°. 


(1) L'application linéaire f possède au moins une valeur propre réelle qui vaut +1. 


(2) Il existe une base orthonormée de IR° dans laquelle la matrice de f est de la forme 


À 0 0 
O cos(#) —esin(6) (18.691) 
O sin(4) ecos(ô) 


avec €, À = +1 et 86e [0,27|. 


Démonstration. Le polynôme caractéristique de f, donné par det(f — À Id), est à coefficients réels 
et de degré 3. Il possède donc au moins une solution réelle, par le corolaire 12.91. Soit donc une 
valeur propre réelle À de x; par le lemme 18.220 nous avons À = +1. Soit u1 le vecteur propre 
correspondant. Nous notons F l’espace engendré par w1. 

Nous avons f(F) = F et donc f(F+) = F4 par le lemme 18.221. Soit une base orthonormée 
{u2,u3} de F+ et la matrice B de la restriction à Fr +, Comme l'application f, est une isométrie 
de Ft, la matrice B est, par le lemme 18.135, de la forme 


__ fcos(#) —esin(0) 
Co ee € cos(@) ) (18.692) 


pour un certain 0 € [0,27{ et € = +1. 
Dans la base {u1,u2,u3} de R*, la matrice de f est alors 


( : (18.693) 


comme annoncé. 


Pour classifier les isométries de IR, nous pouvons nous baser sur les possibilités de la matrice 
donnée dans le lemme 18.222. Il y a essentiellement quatre possibilités suivant les valeurs de À = +1 
et e = +1. 


(1) Sie=ÀA=1 Alors la matrice est 
1 0 0 
A= [0 cos(0) —sin() (18.694) 
O sin(#)  cos(6) 
et l’isométrie correspondante est la rotation d’angle —0 autour de la droite de uw1. 
(2) Sie=À=-—1 Alors la matrice est 
—1 0 0 


A= | 0 cos(0) sin(6) (18.695) 
O  sin(#) —cos() 


Cette application est plus subtile, parce que même dans le plan Span(u2, u3), ce n’est pas une 
rotation. Nous allons montrer qu’il s’agit d’une réflexion autour de la droite d’angle 0/2 dans 
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le plan Span(u2,u3). Nous nommons D cette droite. Dans la base (ui, u2,u3), cette droite 
est donnée par ‘7 
tr t(0,cos(0/2),sin(0/2)). (18.696) 


L'image de u1 par cette réflexion est —u1, c’est clair. 


Étudions en détail l’image de us. Nous devons démontrer que la droite D coupe le segment 
lus, A(u3)] perpendiculairement en son milieu. 


Nous considérons la base (u2,u3) du plan Span(u,u3). En utilisant les coordonnées dans 


cette base, nous avons u3 = () et A(u3) = a) Le milieu du segment [u3, A(u3)] 
est le point 
in(0) 1— 
M = e ) F0) (18.697) 


Les formules de duplication d’angle du corolaire 18.15 nous permettent d’écrire sin(0) et 
cos(@) en fonction de sin(4/2) et cos(9/2), et donc d’exprimer le point M de la façon suivante : 


M = (cos(8/2) sin(8/2), = Se AUe, : D) (18.698a) 
— (cos(9/2) sin(9/2),sin*(9/2)) (18.698b) 
— sin(4/2)(cos(9/2),sin(4/2)). (18.698c) 


Ce point fait donc partie de la droite D. La droite D coupe le segment [u3, A(u3)] en son 
milieu. 
En ce qui concerne l’orthogonalité, nous calculons le produit scalaire 


(A(us) — us) : eo. — sin(4) cos(9/2) — (1 + cos(8)) sin(8/2) = 0 (18.699) 


où nous avons encore utilisé les duplications d’angles et le fait que 1 = cos?(0/2) + sin?(0/2) 
(lemme 18.4). 


Sie——let À=1 Alors la matrice est 
1 0 0 
A= |0 cos(f) sin(0) |. (18.700) 


O sin(#) —cos() 


C’est la symétrie orthogonale par le plan engendré par u1 et u = cos(0/2)u2 + sin(0/2)u3. 


Le vecteur u1 est bien évidemment préservé par À. En ce qui concerne le vecteur v, 


0 0 0 
Av) = cos(9/2) | cos(@) | + sin(0/2) | —sin(0) | = | cos(9/2) | = v. (18.701) 
sin (0) cos(0) sin(0/2) 


Nous avons sauté quelques étapes de calcul mettant en scène les formules de duplication 
d'angle À : exprimer cos(@) = cos?(0/2) — sin?(0/2) et sin(9) = 2 cos(0/2) sin(9/2). 

Pour achever, nous devons trouver un vecteur w perpendiculaire au plan, et montrer qu’il 
est envoyé par À sur —w. Un vecteur w = œu1 + yu2 + zu3 est perpendiculaire au plan si les 
deux égalités suivantes sont satisfaites : 


(cos(0/2)u2 + sin(0/2)u3) : (œu1 + yua + zu) = 0 (18.702a) 
ui * (tu + yu2 + zu3) = 0. (18.702b) 


77. Les plus acharnées liront 4.6 pour comprendre la différence entre {u1,u2,u3} et (u1,u2,u3). 
78. Corolaire 18.15. 
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Nous avons immédiatement x = 0 et ensuite la relation 


E XQMDooT 
y cos(0/2) + zsin(9/2) = 0. Po A0) 
Nous devons prouver que A(w) = —w = —yu2 — zu, c’est-à-dire que 
0 0 0 0 
y | cos(0) [+z{ sin(8) [= |-y|+1{| 0 |. (18.704) 
sin(6) — cos() 0 —Z 


La première ligne est immédiate. Nous faisons la seconde, et nous laissons à la lectrice la 
troisième "”. En utilisant les formules de duplication d’angle, 


y cos(8) + zsin(@) = y( cos?(0/2) — sin” (0/2)) + 22 cos(0/2) sin(0/2) 

= y(2cos°(8/2) — sin°(9/2) — cos?(0/2)) + 2z cos(0/2) sin(0/2) 
—y + 2cos(8/2)(y cos(8/2) + zsin(4/2)) 
— —Ÿ 


18.705a) 
18.705b) 
18.705c) 
18.705d) 


où pour la dernière ligne, nous avons utilisé la relation (18.703). 
(4) Sie=1et À=—1 Alors la matrice est 


—1 0 0 
A= | 0  cos(g) —sin(0) |. (18.706) 
O sin(#)  cos(6) 


Cela est la composition entre la symétrie de plan Span(u,u3) et la rotation d’angle 0 dans 
ce plan. 


18.12.2 Sous-groupes finis de SO(3) 
LEMooWIMMooXOCfSt 


Lemme 18.223 ([1]). 
Points fixes pour SO(3). 
(1) Tout élément de SO(3) possède une droite de points fixes. 


(2) Tout élément non trivial de SO(3) possède une seule droite de points fixes. 


Démonstration. Le polynôme caractéristique d’un élément de SO(3) est de degré trois et possède 
donc (en comptant les multiplicités), trois racines dont une réelle par le corolaire 12.91. Comme 
nous sommes en dimension impaire, le coefficient du terme de degré 3 est —1 et le polynôme 
caractéristique de g € SO(3) s’écrit 


= AN ANS) (18.707) 


avec s = +1 que nous allons tout de suite fixer. Nous savons que det(g) = X,(0) mais aussi que 
det(g) = 1. Donc _ 
1 = det(g) = x9(0) = A1 = s. (18.708) 


Tout cela pour dire que tout élément de SO(3) possède une valeur propre égale à 1, et donc une 
droite de points fixes. 

Pour continuer, supposons que g possède deux droites distinctes de points fixes. En particulier 
g fixe un plan. Une base orthonormée de R? peut être choisie en prenant deux vecteurs e1, e2 dans 
ce plan et un vecteur e3 perpendiculaire au plan. 

Puisque g est une isométrie, la base reste orthonormée sous l’action de g. Donc g a pour matrice 


1 0 0 
0 1 O |. (18.709) 
0 O0 +1 


Pour que le déterminant soit 1, il faut que la matrice soit l'identité. 


79. Je n'ai pas vérifié, alors faites attention. 
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PROPooBHPNooHP1gwH 
Proposition 18.224 (|1, 537, 112, 538, 473]). 
Les sous-groupes finis de SO(3) sont : 
(1) les groupes cycliques Z/nZ, (4) le groupe alterné A5 
(2) les groupes diédraux Dh, 
(3) le groupe alterné A4, (5) le groupe symétrique Sa. 


Démonstration. Soit G, un sous-groupe fini de SO(3). Par la proposition 9.43, les éléments de G 
sont des isométries de R, et le lemme 18.223 dit que tout élément de G possède une droite de 
points fixes. 

Un point de la sphère unité fixé par g € G est un pôle de g. Nous nommons Q l’ensemble des 
pôles des éléments non triviaux de G. 


(1) 


(2) 


Une action Le groupe G agit sur (. En effet si x € Q, alors x est fixé par un élément g. 
Montrons que h(x) est également fixé par un élément de G. Pas dur : (hgh-!)h(x) = h(x): 
donc h(x) est un pôle de hgh=!. 


Les fixateurs sont cycliques Nous montrons à présent que pour tout x € Q, le sous- 


groupe Fix(æ) est cyclique. Soit donc x € Q, le plan orthogonal o = Span(x)! et he Fix(r). 
Nous avons h(o) = o. En effet si y € © nous avons 


Ü= y: 2 hu): Ale) = Alu) * (18.710) 
donc h(y) est perpendiculaire à x. L’inclusion inverse se démontre de même : si y € © alors 
y = h(Rh=!(y)) alors que À (y) € a. 

La restriction de À à o est une isométrie de o. Prenant une isométrie f : o — IR?, l'application 
p: Fix(x) — SO(2) 


— (18.711) 


est un morphisme injectif de groupes. En effet nous avons d’une part 

(RH) = fohoho fl = fhf ER = p(R}e(R), (18.712) 
d’où le morphisme. Et d’autre part, si w(h) = ç(h/) alors foho f-! = foh/o f-!, qui donne 
immédiatement h = h/. 


Nous en déduisons que Fix(x) est isomorphe à un sous-groupe de SO(2) (l’image de w). Le 
lemme 18.142 en fait un groupe cyclique. 


Taille des fixateurs Soient (; les orbites. Si x, y € (; alors nous montrons que | Fix(x)| = 


|[Fix(y)| avec la bijection 
: Fix(x) — Fix(y 

F (a) x ) (18.713) 

hr ghg 
où g est choisie de façon à avoir y = g(x) (possible parce que x et y sont dans la même 
orbite). Cela est surjectif parce que si k € Fix(x) alors 4 = 4(gkg-!) et l’on vérifie que 
gkg ! € Fix(y). L'application w est également injective parce que si ghg ! = gh'g ! alors 
h= ph"; 
Un peu de notations Puisque tous les fixateurs des éléments d’une orbite ont la même 
taille (finie), nous pouvons noter 


ti =|ER(;)] (18.714) 


pour x; € ;. Nous notons également r le nombre d’orbites de G. 
La formule de Burnside du théorème 2.40, avec les notations d'ici, donne 


1 
"= D IFix(g)l. (18.715) 
geG 
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Une belle formule Soit l’ensemble 


A = {(g,x) tel que ge G\{e},x € Fix(g)} (18.716) 


où par Fix(g) nous entendons les pôles de G fixés par g. 


Il y a |G|—1 possibilités pour la composante g, mais chaque élément g Æ£ e possède exactement 
deux pôles, donc l’ensemble À contient exactement 2(|[G| — 1) éléments. 


Nous pouvons calculer le nombre d'éléments dans À d’une autre façon : pour chaque x € Q 
nous avons | Fix(x)| — 1 éléments de G\{e} qui fixent x. Donc 


JAI = D (Fix(x)| —1). (18.717) 
zen 


Mais | Fix(x)| est constant sur les orbites. Nous coupons donc la somme sur { en plusieurs 
sommes sur les orbites (,; : 


JA] = D D (IFix(z)] —1) = D IMil(ne — 1). (18.718) 
i=1 reQ,; i 


En égalisant les deux façons de calculer |A|, nous déduisons la formule 


2(1G|—1) = Y'IQl(re — 1). So à 40 LC) 


U 


Nous utilisons ensuite la relation orbite-stabilisateur, proposition 2.33 : | Fix(x;)[[Q;| = |G|; 
la formule (18.719) devient 
1G] 1 
2(1G|-1) = Ÿ'1G| ire = r|G| FIGE (18.720) 
i i c à 


ou encore, en simplifiant par |G| : 


rit) mg 


Nous pouvons aussi repartir de (18.719) et sommer de façon plus simple ÿ';1Q;| = |[Q] pour 


obtenir 
2(1G| — 1) = rlG] - [9] ÉAooTRUT ONE Rent 


où ( est l’ensemble des pôles de G\{e}. 


Quelles sont les possibilités ? Les nombres |[G{|, r et n; sont des entiers. Nous allons voir 
qu’il n’y a pas des centaines de possibilités pour satisfaire la relation (18.721). D'abord, pour 
toute valeur de |[G| (strictement plus grande que 1), 


2 
ie 22 (18.723) 
1G] 
Ensuite, si g fixe x alors g-! fixe également x, de sorte que n; = | Fix(x;)| > 2 pour tout i. 


Donc tous les termes dans la somme à droite de (18.721) sont dans [,1[. Nous avons donc 
au minimum deux termes, et au maximum trois. Autrement dit : r = 2 ou r = 3. 

Sir=2 Le plus simple est de repartir de (18.722). En posant r = 2 nous trouvons tout de 
suite |Q] = 2. Il y a donc exactement deux pôles pour l’action de G sur la sphère unité. 
Tous les éléments de G laissent donc le même axe invariant et G est un sous-groupe des 
isométries du plan qui lui est perpendiculaire. Autrement dit, G est un sous-groupe fini de 
SO(2) et donc cyclique par le lemme 18.142. 


Nous étudions à présent le cas r = 3. Vu que ça va être un peu long, nous sautons un niveau 
d’indentation. 
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Les possibilités pour r =3 Nous devons voir les solutions entières (n1,n2,n3,|G|) de 


a (18.724) 
|G| n1 n2 n3 


2 


Il faut en particulier que 


—+—+— > I, (18.725) 
ni n2 n3 


ce qui signifie qu’au moins un des n,; doit être 1 ou 2, mais qu'il n’est pas possible que tous 
les n; soient plus grands ou égaux à 3. Puisque n; = | Fix(x;)| > 2, nous en déduisons qu’au 
moins un des n; doit valoir 2. Nous posons donc n1 = 2. 

De plus, nous savons que les n; doivent diviser [G|. Donc |G| est pair. 


Si no = 2 Nous sommes dans le cas r = 3, n1 = 2, n2 = 2. Nous avons 
— = — (18.726) 


mais aussi n3 = |[G|/[Q3| d’où nous déduisons que [Q3| = 2. Nous avons donc une orbite à 
deux éléments. Soit Q3 = {x,y} avec x £ y. 

Le groupe Fix(x) est un groupe à |[G|/2 éléments. Il est donc normal par le lemme 3.28. Si 
g € G'est tel que g(x) = y alors nous avons Fix(y) = gFix(x)g !, mais comme Fix(x) est 
normal nous avons Fix(x) = Fix(y). Donc tous les éléments de Fix(x) fixent x et y. Le groupe 
Fix(x) est donc un sous-groupe de SO(2) et est cyclique, comme vu plus haut. 

Mais de plus nous avons forcément y = —x parce qu’un élément de G qui fixe un point fixe 
également l'opposé. Vu que O3 = {x,—x}, il existe s € G tel que s(x) = —x. Évidemment, s 
n’est pas dans Fix(x) et les points fixes de s ne sont pas parmi æ et —x. Donc l'élément s? a 
au moins 4 points fixes : les deux de s ainsi que x et —x. Il a donc au moins deux droites de 
points fixes, et est donc l'identité : s? = e. 

De plus, vu que s(y) doit être égal soit à x soit à y, et que s(x) = y, l’injectivité de s donne 
s(y) = x. 

Soit a, un générateur de Fix(x). Nous allons montrer que G = gr(s, sa). Nous avons déjà 


(sa)(e) = 56) = y (18.727a) 
z. (18.727b) 


Donc sa inverse x et y. Mais sa a ses propres deux points fixes (qui ne sont ni x ni y). 
L'élément (sa)? a donc quatre points fixes sur la sphère unité : x, y et les deux de sa. Nous 
en déduisons que (sa)? = e. 

Nous nous souvenons que a est un générateur Fix(x). Mais a = 5 : sa, donc a" = (ssa)f. 
Nous en déduisons que gr(s, sa) contient au moins Fix(x). 

D'autre part si À et h’ sont des éléments distincts dans Fix(x), alors sh et sh! sont des 
éléments distincts de gr(s, sa) qui ne sont pas dans Fix(x). Autrement dit, la partie 


A = {sh tel que h € Fix(x)} (18.728) 


est une partie de même cardinal que Fix(x) tout en n’ayant aucune intersection avec Fix(x) 
(note : l’identité n’est pas dans À). Mais | Fix(x)| = |[G|/2, donc AUFix(x) = G. Et justement 
AUGE gr(s,sa). Nous en déduisons que gr(s, sa) = G. 
Le théorème 18.186 nous assure que le groupe G est alors le groupe diédral parce que les 
éléments s et sa vérifient les relations données en 18.180. 


Si r — 3, les autres cas possibles Nous repartons de (18.721) en posant r = 3. Nous 
obtenons ceci : 


L + = he, (18.729) 
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Nous avons déjà vu que n1 = 2 était obligatoire, et que tous les cas où deux des n; sont 
égaux à 2 sont déjà couverts. Donc n2 et n3 valent 3 ou plus. 
Nous trions les n; dans l’ordre croissant. Si n2 = 4 ou plus, alors n3 vaut 4 ou plus. Mais 


Te (18.730) 
2 4 4 |G|' | 


Donc n3 = 3 est obligatoire. Nous avons alors l'inégalité suivante qui restreint n3 : 


13,1 


(18.731) 


Donc n3 est 3, 4 ou 5. 
Les derniers cas à couvrir sont : 

— (nm,n2,n3) = (2,3,3). Dans ce cas, È = 1+ ré donc |G| = 12. 

— (n1,n2,n3) = (2,3,4). Dans ce cas, [G| = 24. 

— (m,n2,n3) = (2,3,5). Dans ce cas, [G| = 60. 
Le cas (2,3,3) 
Nous utilisons les relations n;1Q;| = |G| pour connaître la taille des orbites. Nous avons : 
(4a) 2]Q:1] = 12, donc [A] = 6, 
(4b) 3[Q2] = 12, donc |} = 4, 
(4c) 3103] = 12, donc [O3] = 4. 
Nous avons G + (2 = (o. D'une part parce que, par définition d’une orbite, G + A2 € M, 
et d’autre part parce que si x € Q, alors gl (x) € Q et g(g\(x)) = x; donc ® est bien 
dans l’image de (2 par G. Nous avons donc un morphisme s: G — Sa, que nous allons 
immédiatement voir comme 


TR 
Æ 
Le à 


s: GS, (18.732) 


où 54 est le groupe des permutations de {1,2,3,4}. 
Voyons que s est injective. Si s(g) = s(h), alors s(gh-!) = Id. Autrement dit, l'élément sh! 
de Gest l'identité sur (2 qui contient 4 éléments. Fixant 4 points (au moins), l'élément sh”! 
est l’identité. Par conséquent 

s:G— s(G) € Sa (18.733) 


est un isomorphisme entre G et un sous-groupe de S4. Mais |G| = 12 et |S4] = 24, donc G 
est d’indice deux dans S4 et est donc le groupe alterné A4 par la proposition 5.44(3). 


un 
CT 
a 


Le cas (2,3,4) Nous avons |G = 24| et les orbites ont pour taille : 
— 2]Q:1| = 24, donc |Q:]| = 12, 
— 3]Q2| = 24, donc [Oo] = 8, 
— 4]Q3| = 24, donc [O3] = 6. 


(5a) (2 vient par paires Soit x € ( tel que | Fix(x)| = 3. Alors x € (2 parce que x est 
forcément dans un des (; et tout élément x; de Q; vérifie | Fix(x;)| = n;. Mais comme 
les éléments de SO(3) sont des applications linéaires, ceux qui fixent x fixent également 
—x. Cela pour dire que si x € Mo, alors —x € 2. Nous avons donc quatre éléments 
distincts a1, a, az et a4 tels que 


Qo = { La, +a2, +a3, + aa}. (18.734) 


(5b) Action sur les couples Nous prétendons que G agit sur l’ensemble des couples {+a;}. 
C’est encore la linéarité qui joue : l'élément g(a;) est forcément un des +az (éventuel- 
lement k = i). Si g(a;) = ax, alors g(—a;) = —ax. Autrement dit, pour tout 1, il existe 
un k tel que g({ai,—a;}) = {ax, -ax}. Cette association à > k est bijective (sinon g ne 
serait pas bijective), et fournit donc un morphisme de groupes 


SG +54. (18.735) 
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Nous passons au cas (2,3,5), et comme ça va être long et douloureux 


(5c) s est injective Nous prouvons à présent que s(g) = Id si et seulement si g = e. 
Dans un sens c’est évident : g(e) = Id. Dans l’autre sens, nous devons prouver que si 
g(&) € +a; pour tout à alors g=e. 


Si g(a;) = à; pour tout 1, alors g stabilise 4 points et l'affaire est pliée. Nous supposons 
qu’au moins un des a; n’est pas stabilisé par g. Pour fixer les idées nous disons que c’est 
ai. Nous avons donc g(aj) = —a1. (oui : g(a1) = —a et non +ay pour un autre k parce 
que nous sommes sous l’hypothèse que g stabilise les couples) 

L'élément g° fixe tout M; donc g? = e. Nommons +b les points fixes de g. Si be M 
alors | Fix(b)| = 3, c’est-à-dire que les éléments de G qui fixent b sont dans un groupe 
d'ordre 3, et le corolaire 2.14 nous indique que ces éléments ne peuvent être que d’ordre 


1 ou 3, pas deux. Nous en déduisons que b n’est pas dans (2 et donc que g(a;) = —a; 
pour tout 1. 
Jusqu'à présent nous avons prouvé que si g € ker(s) est non trivial, alors g(a;) = —a; 
pour tout 1. 


Soit maintenant h € G. Comme ( est une orbite, A(a;) € 2 et nous notons A(a;) = eax 
avec € = +1 et éventuellement k = à ou éventuellement pas. Nous avons : 


(RT gh)(ai) = e(h"g)(ax) = —eh (ar) = —E ai = —ai. (18.736) 


—1 


Donc get h-!gh ont même restriction à (2. En particulier h-!ghg”! est l'identité sur 


( et est donc l'identité. 

Pour tout À nous avons g = h-lgh. Les points fixes de h-lgh sont +h-1(b), mais aussi 
+b. Nous avons donc égalité d'ensemble {h(b),—h(b)} = {b, —-b} pour tout h € G (notez 
le changement de notation h — h-1). Cela signifie que {b, —-b} est une orbite de G. 
Maizon’a pas d’orbites de cardinal deux; contradition. Nous en déduisons que e est 
l’unique élément de ker(s). 


(5d) Conclusion La partie s(G) est un sous-groupe de S4 isomorphe à G. Mais au niveau 
des cardinaux, [G| = 24 en même temps que |S4| = 24. Donc G = s(G) = S4. 


#0, nous sautons un niveau 


d’indentation. 
Au niveau du cardinal de G, 


Lo le à 
2 "3 5 TEE 


(18.737) 


donc |G| = 60. Et pour les orbites, |Q:| = 30, |Q2] = 20, [Q3] = 12. 
La proposition 5.54 nous indique que le seul groupe simple d’ordre 60 est le groupe A5. Nous 
allons donc nous atteler à prouver que G est simple. Vous êtes prêts ? 


(1) 


Fixateurs et ordres Tous les éléments de G sont dans un fixateur de type Fix(x), et 
comme l’ordre d’un élément divise l’ordre du groupe (corolaire 2.14), tous les éléments de G 
ont un ordre 2, 3 ou 5. Nous sommes dans un cas très particulier parce que 


— Les trois nombres 2, 3 et 5 sont des nombres premiers distincts. Donc « diviser n; » 
signifie pratiquement « être égal à n; », surtout lorsqu'on parle de l’ordre d’un élément, 
qui ne peut pas être 1. 


— Il existe une seule orbite de chaque taille. 
Nous notons G{(n;) l’ensemble des éléments de G d’ordre n;. Les parties G(n;) ne contiennent 
pas l'identité. 
g € G(ni) implique Fix(g) € (; Sige G(n;) et x € Fix(g) alors x € (;. En effet x € F'ix(g) 
signifie g(x) = x et donc aussi g € Fix(x). Donc l’ordre de g divise |[Fix(x)|, alors que l’ordre 


de g est n; et que les possibilités pour | Fix(x)| sont exactement les n;, lesquels sont premiers 
entre eux. Donc | Fix(x)| = nm, et x e Q,. 


80. Mais pas autant que le théorème 32.33, cependant. 
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(3) |Fix(x)| = n; implique x € Q; Comme plus haut, g € Fix(x) implique que l’ordre de g 
divise n; et est donc égal à n;. Autrement dit, g € G(n;). De plus g € Fix(x) implique 
x € Fix(g). Par le cas juste au-dessus nous déduisons x € Q;. 


(4) a et —a dans la même orbite 


Nous avons évidemment Fix(a) = Fix(—a) parce que les éléments de G sont des applications 


linéaires. Si | Fix(a)| = n; alors a € (; et aussi | Fix(—a)| = | Fix(a)| = n; et encore —a € Q,. 
(5) Nombre de Fix(x;) Soient a,b € (;. Nous avons |Fix(a)| = |Fix(b)| = n; et Fix(a) = 
Fix(b) si et seulement si b = —a parce qu’un élément qui fixe a et b fixe automatiquement a, 


b, —a, et —b. Aucun élément non trivial ne peut fixer quatre points distincts. Autrement dit, 


Fix(a) n Fix(b) = 


LS si a = +b (18.738) 


{e} sinon. 
Chaque élément x; € (; a son fixateur (il y en aurait [Q;| = 60/n;), mais ces fixateurs sont 


égaux deux à deux, donc il y a seulement 22 groupes distincts de la forme | Fix(x;)| avec 
Ti € Q;. 


ns 
(e» 
LA 


Récapitulatif En reprenant ce que nous venons de dire avec à = 1,2,3 nous trouvons : 
(6a) n1 = 2, avec [Q:;] = 30 et 15 groupes du type Fix(x1) avec x1 parcourant Q:. 
(6b) n2 = 3, avec [O2] = 20 et 10 groupes du type Fix(x2) avec x2 parcourant Q. 
(6c) n3 = 5, avec [O3] = 12 et 6 groupes du type Fix(x3) avec x3 parcourant Q3. 
Un élément non trivial de G se trouve forcément dans un et un seul de ces sous-groupes. Plus 
précisément, si g € G{n;) alors g est dans un des Fix(x;) avec x; € Q,. 
Comptons pour être sûr de ne pas s'être trompé. Chacune des lignes décrit 30 éléments de G ; 
par exemple, la seconde ligne donne 10 groupes de taille | Fix(x2)| = n2 = 3. Mais tous ces 
groupes ont pour intersection exactement {e}. Donc le comptage des éléments se fait comme 
suit : 

3 x 30—15—-10—-6+1. (18.739) 
Le dernier +1 est parce que nous aurions décompté l'identité une fois de trop. Bref, on a 
bien 60 éléments comme il se doit. 


Un ensemble à calculer deux fois Soient les ensembles 42, 43 et A5 définis par 


TS 
—] 
nr 


À; = {(g,a) € G(n:) x (; tel que g(a) = a} (18.740) 


où G(n;) est la partie de G des éléments d'ordre n;. 
Nous avons 
LAl= D Fix(g) n Qi. (18.741) 
gEG(ni) 
Mais les éléments de G{n;) sont d’ordre n;, et par ce que nous avons dit plus haut, tous les 
éléments de Fix(g) sont dans (;. Donc Fix(g) n Q; = Fix(g). Nous avons alors 


jAil= D, |Fix(g)| = 21G(ni)| (18.742) 
gEG(ni) 
parce que | Fix(g)| = 2 pour tout g. 
En comptant |A;| dans l’autre sens, nous avons 
EQooBHII 
JA = Ÿ° |Fix(x) n G(ni)| RCA 
xeQ,; 
Vu que x € (;, les éléments de Fix(x) sont d'ordre n;°! (sauf e), et comme G{n;) est justement 
l’ensemble des éléments d’ordre n; dans G nous avons Fix(x) n G{n;) = Fix(x)\{e}. Cela 


81. Encore et toujours parce que les éléments de Fix(x) ont un ordre qui divise | Fix(x)| = n; et que n; est premier, 
et que nous avons exclu l'identité. 


18.12. UN PEU DE STRUCTURE DE O(N) 1663 


— 


= 


pour dire que 


A = Y (LFix(æ) -1) (18.744a) 
ze; 
= VFix(x)— Ÿ°1 (18.744b) 
ze; 2e Q; 
= > ni — [| [Fix(x)| = n; peq x € Q; (18.744c) 
xeN; 
= [Qjns — |A] = ]G1- [A]. (18.744d) 


En égalisant cela à la valeur 2|G(n;)| déjà trouvée, nous déduisons les valeurs des |G(n;)| : 


CELUI 


COR 


(18.745) 


Nous avons alors 
(7a) |G(2)| = 15 
(7b) |[G(3)| = 20 
(7c) |G(5)| = 24 


Les Sylow de G Les p-Sylow sont définis en 5.6, et le super théorème qui répond à toutes 
les questions est le théorème 5.11. Dans notre cas, les diviseurs premiers de |G| = 60 sont 2, 
3 et 5. Il faut faire attention au 2 parce que sa plus haute puissance dans la décomposition 
de 60 est 4 et non 2. Nous avons : 


(8a) Un 2-Sylow est un sous-groupe d’ordre 4. 

(8b) Un 3-Sylow est un sous-groupe d'ordre 3. 

(8c) Un 5-Sylow est un sous-groupe d'ordre 5. 

Entre autres : 

(8a) Les 10 sous-groupes Fix(x2) avec x2 € O2 sont des 3-Sylow de G. 
(8b) Les 6 sous-groupes Fix(x3) avec x3 € (3 sont des 5-Sylow de G!. 


(8c) Les 15 sous-groupes Fix(æ1) avec +1 € (1 sont d'ordre 2 et ne sont donc pas des 2-Sylow 
de G. 


Tous les 3-Sylow et les 5-Sylow Nous avons déjà trouvé 10 3-Sylow et 6 5-Sylow. Nous 
montrons à présent qu’il n’y en à pas d’autres. Le théorème de Sylow 5.11(4) nous indique 
que le nombre n3 de 3-Sylow est : 


— diviseur de 60, 
— dans [1]3 
— au moins 10. 


Les diviseurs de 60 sont : 
1,5,3,15,2,10, 6, 30, 4, 20, 12, 60. (18.746) 


Le seul qui vérifie toutes les conditions est 10. Donc G possède seulement 10 3-Sylow et ils 
sont tous de la forme Fix(x2) avec x2 € Qo. 


Même raisonnement pour les 5-Sylow : il faut 
— diviseur de 60, 
— dans [1}5 
— au moins 6. 


La seule possibilité est 6. 
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(10) 


(11 


er, 


TS 
en 
ND 

— 


(13) 


Nous restons avec les possibilités | H 


(1) 
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Sous-groupe normal Soit A, un sous-groupe normal de G. Notre but étant de prouver 
que G est simple, nous voulons prouver que H est soit {e} soit G. Nous supposons que H est 
non trivial, et nous allons prouver que H = G. 


Le théorème de Lagrange 2.13(1) nous dit que |H| divise |G|. Le nombre |H| ne peut donc 
avoir que 2, 3 et 5 comme facteurs premiers. Avec une mention spéciale pour le 2 : |[H| 
pourrait être divisible aussi par 4. 


Diviseurs de |X| 


Soit un sous-groupe normal H de G. Puisque c’est un sous-groupe, son ordre divise celui de 
G (encore et toujours le théorème de Lagrange 2.13), et donc les facteurs premiers de [H| ne 
peuvent être que 2, 3 et 5. 

Si |H| est divisible en 3 Alors A contient au moins un 3-Sylow. Mais nous avons vu que 
les 3-Sylow de H sont les 3-Sylow de G. Donc H contient tous les 3-Sylow de G, parce que 
les 3-Sylow sont conjugués et H est normal. 


Soit E l’ensemble des sous-groupes de H. Puisqu'il est normal, H agit sur Æ par conjugai- 
son, et les 3-Sylow forment une orbite. Si à est un 3-Sylow, la formule des classes (proposi- 
tion 2.33(2)) nous donne 

[H| = |Fix(a)|[O,|. (18.747) 


Mais l'orbite ©, de a est l’ensemble des 3-Sylow, de sorte que |O,] = 10. Donc |H| est 
divisible en 10. 

Mais il y a pire : H contient au moins les 10 sous-groupes Fix(x2) pour æ2 € Q2. Ce sont 10 
groupes de | Fix(x2)| = 3 éléments. En décomptant e qui est dans l'intersection, cela fait 


10 x | Fix(x2)| — 10 +1 = 21 (18.748) 


éléments. Donc Æ contient au moins 21 éléments. Le nombre |H| est donc : 
— diviseur de 60 
— multiple de 10 
— au moins 21. 

Donc c’est 30 ou 60. 


Si |H| est divisible en 5 Le même raisonnement tient et |H| est 30 ou 60. 


égal à 2, 4, 30 ou 60. 


Si|H|=4 

Alors H contient au moins un 2-Sylow. Un 2-Sylow de H est un sous-groupe contenant 4 
éléments qui sont d’ordre 2”. Le seul m possible dans G est m = 1. Vu qu’un 2-Sylow de 
H contient 4 éléments, nous sommes dans le cas où H est un 2-Sylow. Il est donc le seul 
2-Sylow de H parce que H est normal, et que tous les 2-Sylow sont conjugués. 

Mais tous les sous-groupes d’ordre 2 sont contenus dans un 2-Sylow. En particulier tous les 
15 groupes Fix(x1) sont dans l’unique 2-Sylow HA qui est soi-disant d'ordre 4. IL y a là une 
belle impossibilité. 

Donc, le cas | H| = 4 est hors-concours. 

Si|H|=2 Alors H = {e,g} avec g° =e.Sihe G, l'élément hgh-! ne peut être que e ou g 
(parce que H est normal). Le premier cas est g = e, et le second donne gh = hg. Donc g est 
dans le centre de G : il commute avec tous les éléments de G. 

Comme g € G(2), nous savons que les éléments a € Fix(g) sont forcément dans (1 parce que 
les points dont les fixateurs sont formés d'éléments d’ordre 2 sont dans Q:. Soit h € G. Nous 
avons g = hgh=! et donc aussi 


(hgh=!) (h(a)) = hg(a) = h(a), (18.749) 


donc A(a) et —h(a) sont des points fixes de hgh”!. Ce sont donc également des points fixes 
de g. Nous en déduisons que g a pour points fixes les points a, —a, h(a) et —h(a). Puisque 
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g n’est pas e, ces quatre points ne peuvent pas être distincts. Comme (a) ne peut pas être 
—h(a), nous avons forcément h(a) = +a. 
Donc l'orbite de a ne contiendrait que 2 éléments. Pas possible. 

(3) Si|H|=30 À part |H| = 60, le dernier cas à traiter est |H| — 30. Nous rappelons obli- 
geamment que 
(3a) |G(2)| = 15 
(3b) |[G(3)| = 20 
(3c) |[G(5)| = 24. 
Si H possède 30 éléments, le théorème de Sylow dit que H contient au moins un 3-Sylow et 
un 5-Sylow, et donc tous. Puisque pour 3 et 5, les Sylow de H et de G sont les mêmes et bien 


identifiés, nous allons nous baser dessus. Le sous-groupe H contient tous les 3 et 5-Sylow, 
donc le comptage des éléments est : 


10 x | Fix(x2)| + 6 x | Fix(x3)| — 15 = 45. (18.750) 


Nous aurions aussi pu ajouter +4 — 1 pour compter au moins un 2-Sylow. 
Donc dès que H compte 30 éléments, il en compte au moins 45. Autrement dit le cas |H| = 30 
est impossible. 


ii Avertissement /question à la lectrice !! 18.225 

La démonstration des groupes finis de SO(3) est longue. Je me demande si il n’y a pas moyen de 
faire plus court. Par exemple [537] utilise le théorème de Cauchy 3.26 que je n'utilise pas. D'autre 
part, toutes les références me semblent utiliser plus ou moins implicitement le fait que si le sous- 
groupe normal H contient un élément de G(ni), alors il les contiennent tous. J'avoue ne pas trop 
comprendre pourquoi. 


18.13 Systèmes de coordonnées 
SECooWTPRooZbOSz0 
La trigonométrie nous offre de nouveaux systèmes de coordonnées qui peuvent se révéler pra- 
tiques dans certains cas : les coordonnées polaires sur R?, ainsi que les coordonnées cylindriques 
et sphériques sur R°. 


18.13.1 Coordonnées polaires 


18.13.1.1 Ce que ça signifie intuitivement 


On a vu qu’un point M dans R? peut être représenté par ses abscisses x et ses ordonnées y. 
Nous pouvons également déterminer le même point M en donnant un angle et une distance comme 
illustré sur la figure 18.10. 


FIGURE 18.10: Un point en coordonnées polaires est donné par sa distance à l’origine et par l’angle 
qu’il fait avec l'horizontale. LabelFigJWINooSfKCeA 


Le même point M peut être décrit indifféremment avec les coordonnées (x,y) ou bien avec 
(r, 8). 
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Remarque 18.226. 
L’angle 0 d’un point n'étant à priori défini qu’à un multiple de 27 près, nous convenons de toujours 
choisir un angle 0 < 0 < 27. Par ailleurs l’angle 0 n’est pas défini si (x, y) = (0,0). 

La coordonnée r est toujours positive. 


Nous avons dans l’idée de définir r et 0 par les formules No 
x = r cos() (18.751a) 
y = rsin(). (18.751b) 


18.13.1.2 Coordonnées polaires : le théorème 
THO00BETSooXSQhdx 


Théorème 18.227 (Coordonnées polaires|[1]). 
Soit l’application 


(r,8) + Lei | (18.752) 


r sin(6) 
ITEMooNGOKooFCXmwy 
(1) L'application T est surjective. ITEMooMCT000JiBvug 
(2) L'application 

T': ]0,00[ x [0,27[ — R?\{(0,0)} (18.753) 
est bijective. ITEMooZFRGooQPDUtX 

(3) En considérant la demi-droite D = {(x,0)}:>0, l’application 
T': ]0,co[ x ]0,27[ — RD (18.754) 


est un CT°-difféomorphisme*®?. 


Démonstration. Une bonne partie de ce théorème est une conséquence de 18.58. La vraie nouveauté 
de ce théorème sera la régularité. Nous démontrons point par point. 


(1) Pour (1). Soit a = (x,y) € IR?. Nous avons a/|al € S!. Par la proposition 18.58, il existe 
0Ee [0,27] tel que 


De — (cos(8), sin(8)). (18.755) 
Alors a = |a|(cos(4),sin(8)) = T(|a|,8). Voilà. L'application T est surjective. 
(2) Pour (2). En ce qui concerne la surjectivité, 


T(0,[0,2x[) = {(0,0)}. (18.756) 


Donc le point (1) donne le surjectif lorsque nous enlevons d’un côté les points avec r = 0 et 
de l’autre le point (0,0). 

Pour l’injectivité, nous supposons T(r1,01) = T(r2,02). Puisque |T(r,0)] = r, nous avons 
tout de suite r1 = r2. Nous restons donc avec l'égalité 


one _— 


La proposition 18.58 dit alors que 01 = 62. 


82. L'application est de classe C'? et son inverse est également de classe C'?. Le plus souvent, vous voulez seulement 
utiliser ce théorème dans le but de faire un changement de variables dans une intégrale; vous n’avez donc besoin que 
d'un C!-difféomorphisme. 
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(3) Pour (3). L'application T est injective en tant que restriction d’une application injective. 
Pour le surjectif, soit a € R?\D. Comme a # D, nous avons |a| Z 0 et il est légitime de dire, 
comme plus haut, qu'il existe 0 € [0,27[ tel que 


a 4 | (18.758) 


Ce 4 n’est pas zéro parce que 0 = 0 donne le point (1,0) qui est sur D. 

En ce qui concerne l’inverse, nous n’allons pas nous lancer dans une étude subtile de la 
fonction (18.179); nous avons déjà démontré la continuité dans le lemme 18.65, et monter 
dans les dérivées nous semble un peu compliqué. Au lieu de cela, nous allons procéder en 
deux étapes : 


— Prouver que T est de classe C? pour tout p en invoquant seulement des théorèmes à 
proposition de différentielle, 


—— En déduire que T! est également C? pour tout p en invoquant le théorème d’inversion 
locale 17.50. 


Les applications (r,0) + r, (r,0) + sin(4) et (r,0) > cos(4) sont de classe CT grâce 
au lemme 12.261. Le lemme 12.282 sur la différentiabilité du produit montre alors que les 
fonctions T1 et T2 données par 


Ti(r,0) = r cos(0) (18.759a) 
Tir, 0) = r sin(0) (18.759b) 


sont différentiables **. Mieux, la proposition 12.285 montre que ces fonctions Ti et T2 sont de 
classe C? pour tout p, c’est-à-dire qu’elles sont de classe C®°. Cela montre que les coordonnées 
polaires sont de classe C®, et il faut encore parler de l'inverse. 

En ce qui concerne la différentielle, 


(18.760) 


Mode ( cos(0) — ru mn) 


usin(8) + ru cos() 


Donc la matrice de la différentielle est 


__fcos(#) —rsin() 
dT(.,0) = de . (18.761) 


dont le déterminant est r (lemme 18.4 utilisé). Donc la différentielle en (r,0) est une ap- 
plication linéaire inversible parce que r # 0 aux points que nous considérons. L'application 
dT(,,6) est bicontinue parce que nous sommes en dimension finie. Tout cela pour dire que le 
théorème d’inversion local 17.50 s'applique, et T1 est C? dès que T est C?. 

Puisque T est de classe C? pour tout p, l'inverse T! est également C? pour tout p, c’est-à- 
dire que T—! est de classe C?. 


Définition 18.228. 
Ce que nous appelons les coordonnées polaires est l’application 


T': [0,co[ x [0,2r[ — R? 


(r,6) e (18.762) 


du théorème 18.227(3). Selon les circonstances, nous considérons l’une ou l’autre des restrictions 
pour avoir une bijection ou un difféomorphisme. 


83. Si vous voulez seulement avoir un C'-difféomorphisme, calculez explicitement la différentielle et montrez que 
c’est continu. Vous n’avez pas à utiliser la proposition 12.285 ni rien des produits tensoriels. 
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EXooSDHDooJzDioW 
Exemple 18.229. 
Soit à calculer ; ; 
jh EUR (18.763) 
(æ,y)—(0,0) T —7y 
Nous introduisons la fonction 
f:'R\{r=y —R 
(x,y) 
z—y 


Une idée souvent fructueuse pour traiter ce genre de limite est de passer aux coordonnées polaires. 
Attention, si on veut faire les choses très explicitement, c’est un peu lourd en notations. Il s’agit 
de poser 


g: (10,00 x [0,27{)\{R x (EUR »x ou) R 
2 (18.765) 


r(cos(@) — sin(0)) 


(r,0) 


Bon. À strictement parler, nous aurions pu dire que g est définie pour r = 0, mais vu que nous 
voulons seulement calculer la limite pour r — 0, on n’a pas besoin de la valeur en zéro. De plus 
les coordonnées polaires ne sont pas bijectives en l’origine. Donc bon ...on s’en passe. 

Quel est le lien entre f et g? Du point de vue du calcul, le lien est qu’on a remplacé x par 
r cos(#) et y par rsin(0). Le vrai lien est l'égalité 


J=fsT (18.766) 


où Test l’application de coordonnées polaires dont les principales propriétés sont données dans le 
théorème 18.227(2). 

Soit un voisinage B((0,0),R) de (0,0) dans R?. Le but est de montrer que les valeurs f(B) 
se regroupent autour d’une valeur £ lorsque À — 0. Soyons plus précis et nommons £ le candidat 
limite. Soit € > 0; nous devons trouver R > 0 tel que f(B((0. 0), #)) c B(L,e). 


Pour R > 0, nous avons 


B((0,0),R) = T([0,R[ x [0,2rl), (18.767) 
donc 
f(B) = g([0, R[ x [0,27). (18.768) 
Soit r < R. Nous avons 
RAA 0) = 66. (18.769) 


Donc f(B) contient des valeurs arbitrairement grandes, quelle que soit la valeur de À. Il n’y a 
donc pas de limite possible. 

Si vous voulez un argument un peu plus imagé, en voici un °? basé sur une combinaison entre 
la méthode des coordonnées polaires et la méthode des chemins. 

Certes pour chaque 0 nous avons lim,_,0 g(r,0) = 0, mais il ne faut pas en déduire trop vite 
que la limite lim(zy)(0,0) 9(, y) vaut zéro parce que prendre la limite r — 0 avec Ÿ fixé revient à 
prendre la limite le long de la droite d’angle 0. 

Il n’est pas possible de majorer g(r, 0) par une fonction ne dépendant pas de 4 parce que cette 
fonction tend vers l'infini lorsque 0 — 7/4. Est-ce que cela veut dire que la limite n'existe pas ? 
Cela veut en tout cas dire que la méthode des coordonnées polaires ne parvient pas à résoudre 
l'exercice. Pour conclure, il faudra encore un peu travailler. 


84. Qui satisfera tous vos professeurs, pourvu que vous ayez compris que ce qui se cache est une histoire de valeurs 
de f prises sur un voisinage de (0, 0). 
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Nous pouvons essayer de calculer le long d’un chemin plus général (r(t),4(t)). Choisissons 
r(t) = t puis cherchons 4(t) de telle sorte à avoir 


cos O(t) — sin 4(t) = t?. F0) 


Le mieux serait de résoudre cette équation pour trouver 4(t). Mais en réalité il n’est pas nécessaire 
de résoudre : montrer qu’il existe une solution suffit. Nous pouvons supposer que t? < 1. Pour 
0 = x/4 nous avons cos(0) — sin(0) = 0 et pour 0 = 0 nous avons cos(@) — sin(9) = 1. Le théorème 
des valeurs intermédiaires nous enseigne alors qu’il existe une valeur de 0 qui résout l’équation 
(18.770). 

Pour être rigoureux, nous devons aussi montrer que la fonction @(t) est continue. Pour cela 
il faudrait utiliser le théorème de la fonction implicite 17.52. Nous verrons dans l’exemple 18.245 
comment s’en sortir sans théorème de la fonction implicite, au prix de plus de calculs. A 


Les coordonnées polaires sont données par le difféomorphisme 


g: 10, oc x ]0,27[ —+ R?\D 
(r,0) (r cos(8), rsin(8)) (18.771) 


où D est la demi-droite y = 0, x > 0. Le fait que les coordonnées polaires ne soient pas un 
difféomorphisme sur tout IR? n’est pas un problème pour l'intégration parce que le manque de 
difféomorphisme est de mesure nulle dans R?. Le jacobien est donné par 


: OT Cr) cos(0) —rsin(0)\ 
Jg = det É à = det te too) À — Fe (18.772) 


La fonction qui donne les coordonnées polaires est 


co ( eo (18.773) 


Son Jacobien vaut 


©x(r,0)  Ox(r,0) : 
: ôr à __[cos(0) —rsin(8)| 
J(r, 0) = det (ae sn) E sin(6) r cos(0) (18.774) 
PROPooFLUAooDsyMX0O 
Proposition 18.230. 
Soit la fonction 
T': 10, +00[ x R — R?\{(0,0)} (8.775) 


(r,0) + (r cos(8),r sin(8)). 
(1) Elle est surjective. 
(2) Pour tout a € R, l'application T est bijective sur la bande ]0,+00[ x [a —x,a + x. 


(3) Si a = 0, la fonction inverse est donnée par 


TT (x, y) = (V7? + y2,arctan(y/x)). (18.776) 


Soit P = (x,y) un élément dans IR?, on dit que r = 4/x? + y? est le rayon de P et que 
0 = arctan(y/x) est son argument principal. L'origine ne peut pas être décrite en coordonnées 
polaires parce que si son rayon est manifestement zéro, on ne peut pas lui associer une valeur 
univoque de l’angle 0. 


Exemple 18.231. 
L'équation du cercle de rayon a et centre (0,0) en coordonnées polaires est r = a. A 


Exemple 18.232. 
Une équation possible pour la demi-droite x = y, x > 0, est 0 = x/4. A 
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18.13.1.3 Polaires : calcul de limites 
EX00BERUooPhPsSU 


Exemple 18.233. 
Calculer les limites suivantes : 
: (xy)? 
(D) Em(e,y)-(00) Gran 
(2) lim, y)—(0,0) 7247 
’ æsin(y) 
(3) lim(xy) (0,0) ee 
Tentez de les faire par vous-même avant de regarder la solution qui suit. 
(1) Si (x,y) € B(0,6)\{(0,0)}, alors le théorème 18.227 dit qu'il existe 0 < r < Ô et 0 € [0,27| 
tels que x = r cos(Ô) et y = rsin(0). Avec ça nous avons 
r4 cos?(0) sin?(0) 


r2( cos(0) + sin(6))” + r2(cos(8) — sin(6))* 


Jey)= (18.777) 


Vu que r Z 0 nous pouvons simplifier par r?. Ce qui reste au dénominateur est une fonction 
de Ô continue sur le compact [0,27]. Je ne peux pas vous dire quel est le minimum, mais il 
est facile de voir que ce n’est pas zéro. Bref, 


f(æ,y) = r°f(6) (18.778) 


et | f(x, y)| < ar? où a est une constante que vous pouvez vous amuser à calculer. En po- 
sant 0 < 4/e/a nous avons |f(x,y)| < € pour tout (x,y) € B(0,6), ce qui signifie que 
LM (y) (0,0) Fay) 0 
(2) Regardons la technique des coordonnées polaires. Nous remplaçons x par r cos(@) et y par 
r sin(Ô) : 
FR) = Fe) r? cos() sin (8). (18.779) 


r? 


Cette fonction tend vers zéro quand r — 0. Nous avons donc 


lim z,y) = 0. 18.780 
a y) ( ) 


Pour cet exercice nous pouvons aussi utiliser la règle de l’étau en écrivant d’abord 
CTI 
x? + y?| 
Mais on a [x] < 4/22 + 2, [y] < 4/22 + 2 et |x? + y?| = (4/22 + y}, donc 
1 Lea)" 
0 < |f(x,y)| < V Er = (4/22 +2) > 0. (18.782) 
2° +Yy 


En passant aux polaires, nous avons 


0 < |f(x,y)| < (18.781) 


RS 
Co 
nr 


r cos Ü sin (r sin 6) 


fr, ()) E 


= cos(#) sin (r sin 4). (18.783) 


r 


La limite de cette dernière fonction lorsque r — 0 vaut zéro. 
Une autre façon de procéder consiste à multiplier et diviser par y de telle façon à faire 
apparaitre sin(y)/y dont nous connaissons la limite : 


sin(y) xy 
J(x,y) = : 18.784 
COR er (18.784) 
La limite du premier facteur est 1, tandis que le second peut être traité de façon classique 
en prenant la valeur absolue et en majorant |[x| par 4/x? + y?. 


A 
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18.13.1.4 Transformation inverse : théorie 


Voyons la question inverse : comment retrouver r et Ÿ si on connait x et y? Tout d’abord, 


r = V2? + y (18.785) 


parce que la coordonnée r est la distance entre l’origine et (x, y). Comment trouver l’angle ? Nous 
supposons (x,y) # (0,0). Si x = 0, alors le point est sur l’axe vertical et nous avons 


nu si y >0 


| (18.786) 
37/2 siy<O0 


Notez que si y < 0, conformément à notre convention 0 > 0, nous avons noté ir ét NON 7. 


Supposons maintenant le cas général avec x # 0. Les équations (18.751) montrent que 
_ Ÿ 
tan(0) = —. (18.787) 
x 


Nous avons donc 
0 = tan! (2) | (18.788) 
x 


La fonction inverse de la fonction tangente est celle définie plus haut. 


18.13.1.5 Transformation inverse : pratique 


Le code suivant utilise Sage. 


#! /usr/bin/sage -python 


2\# <%— coding! uti8 -*- 


from sage.all import * 


def PointToPolaire(x,y): 


x=SR(x) 
y=SR(y) 
r = sqrt(x*x*x2+yxx2) 
LÉ x. —=— 0: 
if y > 0 
alpha = pi/2 
if y < 0 
alpha = 3*xpi/2 
if y == : 
raise ValueËError ,"Pas d’angle pour le point (0,0) !1" 
else : 
alpha = atan(y/x) 
if (x < 0) and (y == 0) 
alpha = pi 


if (x < 0) and (y > 0) 
alpha = alpha + pi 

if (x < 0) and (y < O0 ) 
alpha = alpha + pi 

alpha=alpha.simplify_trig() 

return (r,alpha) 


print PointToPolaire(1,1) 
print PointToPolaire(-2,1) 
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sprint PointToPolaire (6*sqrt (3) /2,3) 


tex/frido/calculAngle.py 
Son exécution retourne : 


(sqrt(2), 1/4xpi) 
(sqrt(5), pi - arctan(1/2)) 
(6, 1/6xpi) 


Notez que ce sont des valeurs exactes. Ce ne sont pas des approximations, Sage travaille de façon 
symbolique. 


18.13.1.6 Coordonnées polaires : dérivées partielles 


Le changement de coordonnées pour les coordonnées polaires est la fonction 


T æ r cos Ô 
1()-0-Cs). . 
Considérons une fonction g sur IR?, et définissons la fonction ÿ par 
g(r, 0) = g(r cos 6, r sin O). (18.790) 


La formule (12.768) permet de trouver les dérivées partielles de g par rapport à r et 0 en termes 
de celles par rapport à x et y de g. 
Pour faire le lien avec les notations du point précédent, nous avons 


(18.791) 


Nous avons donc 


o(r cos 6) 
EN de (18.792) 
ERA, 9 


(r cos 6, r sin 6) 


2 

Of: 
. 0) (r,0 
êg 
0x 
+ 


co (r cos 6, r sin 4 


= COS 0% cos 0, r sin 0) + sin 822 (r cos 0, r sin Ô). 


0x ©y 


Prenons par exemple g(x,y) = Étant donné que 


RATÉ 


°g —2x 
= (18.793) 


nous avons 


—_2 cos 0 
7, (18.794) 


à r cos 0, r sin 0) = 


pa 


r3 


En utilisant la formule, 


“9 Ga =) (=) + sin(8) (=) = (18.795) 
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Nous pouvons vérifier directement que cela est correct. En effet 


g(r,0) = gr cos 6, r sin 0) = -2 (18.796) 
dont la dérivée par rapport à r vaut —2/r. 
En ce qui concerne la dérivée par rapport à 0, nous avons 
o 0] O(r sin(8 
c = cos 0, r sin Ü) )) + (cos Ô,r sin po) 
—2 —2 si 
(<= COS =) ( sésNs ( 7 <) PT) (18.797) 
= (. 
En résumé et avec quelques abus de notation : 
°g = D + sin(6) 22 
Ôr Ox ©y 
(18.798) 
RE —T in(8) 22 nue à (6) 22 
lie MU 40 


18.13.2 Coordonnées cylindriques 


Les coordonnées cylindriques sont un perfectionnement des coordonnées polaires. Il s’agit 
simplement de donner le point (x,y,z) en faisant la conversion (x,y) + (r,4) et en gardant le z. 
Les formules de passage sont 


= r cos(4) (18.799a) 
y = rsin(0) (18.799b) 
gr. (18.799c) 


Soit T' la fonction de ]0, +00[xXIR2 dans R°\{(0,0,0)} définie par 


T: ]0,+[xRxIR — MR°\{(0,0,0)} 


(r, 0,2) > (r COS Ô,rsin RAR (18.800) 


Cette fonction est surjective. Elle est bijective sur chaque bande de la forme [0,+00[x{a — 7, a + 
r|xR, a dans R. Il n’y a presque rien de nouveau par rapport aux coordonnées polaires. Les 
coordonnées cylindriques sont intéressantes si on décrit un objet invariant par rapport aux rotations 
autour de l’axe des z. 


Exemple 18.234. 
Il faut savoir ce que décrivent les équations les plus simples en coordonnées cylindriques, 


— r < a, pour a constant dans [0, +0, est le cylindre de hauteur infinie qui a pour axe l’axe 
des z et pour base le disque de rayon a centré à l’origine, 


— r = à est la surface du cylindre, 
— 0 = best un demi-plan ouvert et sa fermeture contient l’axe des 2, 
— z=cest un plan parallèle au plan x-y. 
A 


Exemple 18.235. 
Un demi-cône qui a son sommet en l’origine et pour axe l’axe des z est décrit par z = dr. Si d est 
positif il s’agit de la moitié supérieure du cône, si d < 0 de la moitié inférieure. PA 


Exemple 18.236. 
De même, la sphère de rayon a et centrée à l’origine est l’assemblage des calottes z = Va? — r? et 
3 = — Va? r2. PA 
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En ce qui concerne les coordonnées cylindriques, le Jacobien est donné par 


7 % Le cosô —rsing 0 
J(r,0,2)=1% % T|=}sin0 rcos0 O0 -r. 18.801 
Ë & de 
Nous avons donc dx dy dz = r dr d0 dz. 
x = r cos (18.802a) 
y = rsin0 (18.802b) 
£= 3 (18.802c) 


avec r € |0,w[, 0e [0,27 et z € R. Le jacobien vaut r. 


18.13.3 Coordonnées sphériques 
Soit T la fonction de ]0, +00[xXIR2 dans R°\{(0, 0, 0)} définie par 


T: ]0,+&[xRxR — R°\{(0,0,0)} 


(p,0, @) ne (p cos Üsin ®, psin Osin ®, pcos ), (18.803) 


Cette fonction est surjective. Elle est bijective sur chaque bande de la forme ]0,+00[x{a — 7, a + 
n[x[b— x/2,b + x/2[, a et b dans R. Si a = 0 et b = —/2 la fonction inverse T! est donnée par 


T1: R°\{(0,0,0)} — 10,+c0[x[-7,7[x[0,7[ 


. a . : (18.804) 
(x, y, 2) (ve + y? + 22, arctan #, arccos (5) : 


Soit P un point dans RŸ. L’angle est l’angle entre le demi-axe positif des z et le vecteur OP, p 
est la norme de OP et 0 est l'argument en coordonnées polaires de la projection de OP sur le plan 


x-Yy. 
Remarque 18.237. 
Dans la littérature, les angles 0 et & sont parfois inversés (voire, changent de nom, par exemple 


# au lieu de @). Il faut donc être très prudent lorsqu'on veut utiliser dans un cours des formules 
données dans un autre cours. 


Exemple 18.238. 

Il faut connaitre le sens des équations plus simples, 
— p< a, pour a constant dans [0,+o{, est la boule fermée de rayon a centrée à l’origine, 
— p= a est la sphère de rayon a centrée à l’origine, 
— 0 = best un demi-plan ouvert et sa fermeture contient l’axe des z, 


— = cest un demi-cône qui à son sommet à l’origine et pour axe l’axe des z. Si c est positif 
il s’agit de la moitié supérieure du cône, si d < 0 de la moitié inférieure. 

A 

Les coordonnées sphériques sont ce qu’on eppclle les, & méridiens » et « longitudes » en 


; . ; ub=gsCoordSphe 
géographie. Les formules de transformation sont L 


x = psin(0) cos(s) (18.805a) 
= psin(4) sin(s) (18.805b) 
z = pcos(6) (18.805c) 


avec 0 < 0 < 7 et 0 < ÿ < 27. 
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Remarque 18.239. 

Attention : d’un livre à l’autre les conventions sur les noms des angles changent. N’essayez donc 
pas d'étudier par cœur des formules concernant les coordonnées sphériques trouvées autre part. 
Par exemple sur le premier dessin de wikipédia, l’angle & est noté 0 et l’angle 0 est noté ®. Mais 
vous noterez que sur cette même page, les conventions de noms de ces angles changent plusieurs 
fois. 


Les coordonnées sphériques sont données par 


x = rcosÜsin 
y = rsin Üsin ” D 15.800) 
Z = TCOS@ 
avec r €]0, |, 0 e]0,2r[ et $ €]0, r[. Le jacobien associé est Jg(r, 0, ©) = —r? sin. N'oubliez pas 
que lorsqu'on effectue un changement de variables dans une intégrale, la valeur absolue du jacobien 
apparaît. 
Cependant notre convention de coordonnées sphériques fait venir sin(®) avec 9 € [0,7|; vu 
que le signe de sin(@) y est toujours positif, cette histoire de valeur absolue est sans grandes 
conséquences. Ce n’est pas le cas de toutes les conventions possibles. 


18.13.3.1 Coordonnées sphériques : inverse 


Trouvons le changement inverse, c’est-à-dire trouvons p, 0 et & en termes de x, y et z. D'abord 


nous avons 
p = V7? + y? + 22. (18.807) 


Ensuite nous savons que 
cos(9) = ? (18.808) 
P 


détermine de façon unique ® un angle 0 € [0,r]. Dès que p et 0 sont connus, nous pouvons poser 
r = psin 0 et alors nous nous trouvons avec les équations 


x = rcos() (18.809a) 
y = rsin(o), (18.809b) 


qui sont similaires à celles déjà étudiées dans le cas des coordonnées polaires. 


18.14 Calcul de limites 


Beaucoup de techniques de calcul de limites fonctionnent bien avec les fonctions trigonomé- 
triques, entre autres grâce à l’utilisation des coordonnées polaires de la proposition 18.230. Nous 
en voyons quelques exemples à présent. 


ExQWHooGddTLE 
Exemple 18.240 (Limite et prolongement par continuité). 
La fonction 
Gé A (18.810) 
z 
n’est pas définie en x = 0. 
Nous avons vu dans l’équation (18.6) que cos(0) = 1, donc la limite 
— 1 
a (18.811) 


x—0 Ua 


est la limite définissant la dérivée de cosinus en 0 (ici, le x joue le rôle de €). Le lemme 18.3 nous 
donne la dérivée du cosinus comme étant le sinus. Nous avons donc : 
.. cos(x) —1 
Jim SG) = 1 


lim = = sin(0) = O, (18.812) 


85. Le problème p = 0 ne se pose pas; pourquoi ? 
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et nous définissons le prolongement par continuité : 


: cos(x)—1 : 0 
f(x) = de (18.813) 


0 sinon. 


Encore une fois, le graphe de la fonction f ne présente aucune particularité autour de x = 0. 


À 


—67T —4T —27 27 AT GT 
1 
2 

A 
EXoo0INLRooPZRWEA 

Exemple 18.241 (Un calcul heuristique de limite). 

Soit à calculer la limite suivante : 
—2cos(x)+2 : 

lim © 0 (18.814) 


x—0 e2cos(x)+2 ° 


La stratégie que nous allons suivre pour calculer cette limite est de développer certaines parties 
de l’expression en série de Taylor, afin de simplifier l'expression. La première chose à faire est de 
remplacer e*(®) par 1 + y(x) lorsque y(x) — 0. La limite devient 


(— 2cos(x) +3) sin(x) 


(18.815) 
æ—0 —2 cos(x) + 2 


Nous allons maintenant remplacer cos(x) par 1 au numérateur et par 1 — x?/2 au dénominateur. 
Pourquoi ? Parce que le cosinus du dénominateur est dans une racine, donc nous nous attendons à 
ce que le terme de degré deux du cosinus donne un degré un en dehors de la racine, alors que du 
degré un est exactement ce que nous avons au numérateur : le développement du sinus commence 
par x. 

Nous calculons donc 


fn SE) pee, 
ur L EU à (18.816) 
_9 ( = &) +2 


Tout ceci n’est évidemment pas très rigoureux, mais en principe vous avez tous les éléments en 
main pour justifier les étapes. A 


18.14.1 Méthode des coordonnées polaires 
SUBSECooWCGMooPrXSpt 


La proposition suivante exprime la définition de la limite en d’autres termes, et va être pratique 


dans le calcul de certaines limites. 
PropMethodePolaire 


Proposition 18.242. 
Soit f: DER”? — R?, a un point d’accumulation de D et le R”. Nous définissons 


E, = {f(x) tel que x € B(a,r) n D}, (18.817) 


et 
s, = sup{|u — €] tel queve E,}. (18.818) 


Alors nous avons lims-,, f(x) = L si et seulement si lim,_,0 s, = 0. 
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Dans cette proposition, £, représente l’ensemble des valeurs atteintes par f dans un rayon r 
autour de a. Le nombre 5, sélectionne, parmi toutes ces valeurs, celle qui est la plus éloignée de £ 
et donne la distance. En d’autres termes, s, est la distance maximale entre f(x) et £ lorsque x est 
à une distance au maximum r de a. 

Lorsque nous avons affaire à une fonction f : R? — R, cette proposition nous permet de calculer 


facilement les limites en passant aux coordonnées polaires. 
ExempleMethodeTrigigi 


Exemple 18.248. 
Reprenons la fonction de l’exemple 12.221 : 


Ty 
x 7 — 18.819 


Son domaine est IR?\{(0,0)}. Nous voulons calculer lim{; y)-(0,0) (®; ÿ). Écrivons la définition de 
E, : 
E, = {f(x,y) tel que (x, y) € B((0,0),r)}. (18.820) 


Les points de la boule sont, en coordonnées polaires, les points de la forme (p,0) avec p < r. La 
chose intéressante est que f(p,0) est relativement simple (plus simple que la fonction départ). En 
effet en remplaçant tous les x par pcos(@) et tous les y par psin(0), et en utilisant le fait que 
cos?(0) + sin?(9) = 1, nous trouvons 


2 ‘ : : 
f(0,6) p ee sin(0) cos(6) Un de ou dE 


Cela signifie que 
E, = {cos(0) sin(4) tel que 0 € [0,27|}. (18.822) 


Prenons £ quelconque. Le nombre s, est le supremum des 
£ — cos(4) sin(9)| (18.823) 


lorsque 0 parcours [0,27]. Nous ne sommes pas obligés calculer la valeur exacte de s,.. Ce qui 
compte ici est que s, ne vaut certainement pas zéro, et ne dépend pas de r. Donc il est impossible 
d’avoir lim,-_,0 s. = 0, et la fonction donnée n’a pas de limite en (0,0). A 


Nous pouvons retenir cette règle pour calculer les limites lorsque (x, y) — (0,0) de fonctions 
f:R—R: 


(1) passer en coordonnées polaires, c’est-à-dire remplacer x par pcos(0) et y par psin(0); 


(2) nous obtenons une fonction g de p et 8. Si la limite lim,_,0 g(r, 0) n’existe pas ou dépend de 
Ô, alors la fonction n’a pas de limite. Si on peut majorer g par une fonction ne dépendant 
pas de 4, et que cette fonction a une limite lorsque r — 0, alors cette limite est la limite de 
la fonction. 


La vraie difficulté de la technique des coordonnées polaires est de trouver le supremum de F,, 
ou tout au moins de montrer qu’il est borné par une fonction qui a une limite qui ne dépend pas de 
0. Une des situations classiques dans laquelle c’est facile est lorsque la fonction se présente comme 


une fonction de r multiplié par une fonction de 6. 
Exemplexyxsqysq 


Exemple 18.244. 
Soit à calculer la limite 


a? — 
lim  xy| ——— |). (18.824) 
@æy)—(0,0) ” x? +7? 
Le passage aux coordonnées polaires donne 


fr, 0) = r° sin 4 cos (cos? 4 — sin? 8). (18.825) 
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Déterminer le supremum de cela est relativement difficile. Mais nous savons que de toutes façons, 
la quantité sin 9 cos 0 (cos? 0 — sin? 0) est bornée par 1. Donc 


lf(r, 8) < r°. (18.826) 


Maintenant la règle de l’étau montre que lim{; (0,0) f(, y) est zéro. 
La situation vraiment gênante serait celle avec une fonction de 0 qui risque de s’annuler dans 
un dénominateur. PA 


L'exemple 18.229 donnera un cas où la méthode fonctionne plus difficilement. Entre autres 


parce qu’il utilisera en même temps la méthode des chemins et celle des coordonnées polaires. 
ExmeASDLAf 


Exemple 18.245. 
Considérons fonction . : 
2° +Yy 
JC Y) = —— 
T'Y 
Une mauvaise idée pour prouver que la limite n’existe pas pour (x,y) — (0,0) est de considérer 
le chemin (t,t). En effet, la fonction n’existe pas sur ce chemin. Or la méthode des chemins parle 
uniquement de chemins contenus dans le domaine de la fonction. 
Nous prouvons que la limite n’existe pas en trouvant des chemins le long desquels les limites 
sont différentes. Si nous essayons le chemin (f, kt) avec k constant, nous trouvons 


t(1 + &?) 
1—k 
La limite t — 0 est hélas toujours 0. Nous ne pouvons donc pas conclure. 
Nous allons maintenant utiliser la même technique que celle utilisée en coordonnées polaires. 
Vous noterez que dans ce cas, travailler en cartésiennes donne lieu à des calculs plus longs. L’astuce 
consiste à prendre k non constant et à chercher par exemple k(t) de façon à avoir 


(18.827) 


J( kt) = (18.828) 


1+k(t)? 1 
ER (18.829) 


Avec une telle fonction k, la fonction t + f(t,tk(t)) serait la constante 1. L'équation à résoudre 
pour k est 
tk?+k+(t—1)=0, (18.830) 
et les solutions sont 
1H 41461) 


k(t) e (18.831) 


Nous proposons donc les chemins 


x A 
() _ ee (18.832) 
D 


Nous devons vérifier deux points. D'abord que ce chemin est bien défini, et ensuite que tk(t) tend 

bien vers zéro lorsque t — 0 (sinon (t, k(t)t)) n’est pas un chemin passant par (0,0). Lorsque t est 

petit, ce qui se trouve sous la racine est proche de 1 et ne pose pas de problèmes. Ensuite, 
—1+1 


lim k(é) = (18.833) 


En choisissant le signe +, nous trouvons un chemin qui nous convient. 
Ce que nous avons prouvé est que 


: (: 1/1 : AE — 3) _. _— 


pour tout t. Le long de ce chemin, la limite de f est donc 1. Cette limite est différente des limites 
obtenues le long de chemins avec k constant. La limite lim{,,_,(0,0) f(x, y) n'existe donc pas. A 
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seno 
Exemple 18.246. 
Considérons la fonction (figure 18.11) 
Va+wsin-ris si(x, 0,0 
GT PR A UE Cr (18.835) 
0 si (æ,y) = (0,0), 


et cherchons la limite (x, y) — (0,0). Le passage en coordonnées polaires 6 donne 
1 EqF 
f(p,0) = psin . L. on Re RE | 


Pour calculer la limite de cela lorsque p — 0, nous remarquons que 


l 
O<|psin-|<p (18.837) 
Pp 
parce que sin(l) < 1 quel que soit p. Or évidemment lim,_,0p = 0, donc la limite de la fonction 
(18.836) est zéro et ne dépend pas de 0. Nous en concluons que lim{,y)_(0,0) f(x, y) = 0. A 
1 sn 


FIGURE 18.11: La fonction de l'exemple 18.246.  LabelFigsenotopologo 


18.14.2 Méthode du développement asymptotique 
SUBSECooRAKKooAnpvkE 


Nous savons que nous pouvons développer certaines fonctions en série grâce au développement 
de Taylor (théorème 12.455). Lorsque nous avons une limite à calculer, nous pouvons remplacer 
certaines parties de la fonction à traiter par la formule (12.1279a). Cela est très utile pour comparer 
des fonctions trigonométrique à des polynômes. 


LEMooZYNEooYkwsWD 
Lemme 18.247. 
Nous avons la limite 
ne (18.838) 
æ—0 TC 
Démonstration. Une manière de prouver cela est d’écrire 
sin(x) = x + h(x) (18.839) 
avec h € o(x), c’est-à-dire limz_,0 A(x)/x = 0. Alors nous avons 
Fu M ie Le (18.840) 
æ—0 T æ—0 x z—0 x z—0 ZT 


L'utilisation de la proposition 12.491 permet d'utiliser cette technique dans le cadre de limites 
à plusieurs variables. Reprenons le lemme 18.247 un tout petit peu modifié : 


86. Proposition 18.230. 
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LEMooSFALooVRBdNb 
Lemme 18.248. 
Pour tout x > 0 nous avons sin(x) < x. 


Démonstration. Nous posons f(x) = x — sin(x). Cette fonction vérifie f(0) = 0 et 
f'(æ) = 1— cos(x). (18.841) 


Vu que |cos(x)| < 1, nous avons toujours f/(x) > 0 et même f’(x) > 0 pour x € [0,6]. Donc f est 
au moins strictement croissante sur |0,6] et ensuite strictement croissante presque partout. 


Exemple 18.249. 
Soit à calculer Em(z (0,0) F(t, y) où 


sin(xy) 
= : 18.842 
f(x, y) _ ( ) 
La première chose à faire est de voir f comme la composée de fonctions f = f1 0 f2 avec 
fi:R—-R 
; sin(t) (18.843) 
t 
et : 
: R° —R 
f2 (18.844) 
(z,y) > æy. 
Étant donné que Lim (x,y)(0,0) F2(7, y) = 0, nous avons lim{,,4)_,(0,0) f(x, y) = limso f1(t) = 1. A 
EX00ETZYooYsKPDJ 
Exemple 18.250. 
Les dérivées partielles de la fonction f(x, y) = xy° + sin y au point (0,T) sont 
© … (tr +sinr)— (sin 
Cxf(0,) — (0x) = lim ( 7 ) =, 
t#0 
Ô O(r + t)* + sin(t —0:7 
Oyf (0,7) = À (0, x) = lim A MER TL cos r = 1, 
0y 0 t 
tZ0 
A 
18.15 Quelques intégrales avec de la trigonométrie 
SECoo0U0PPooZLbaEH 


Le théorème 14.290 manque un peu d'exemples. Nous allons en voir quelques-uns maintenant. 


18.15.1 Changement de variables 


Le domaine E = {(x,y) € IR? tel que x?+y? < 1} s’écrit plus facilement £ = {(r,0) tel que r < 
1} en coordonnées polaires. Le passage aux coordonnées polaires permet de transformer une in- 
tégration sur un domaine rond à une intégration sur le domaine rectangulaire ]0,27| x ]0,1[. La 
question est évidemment de savoir si nous pouvons écrire 


27 pl 
Lr-| [F6 0050, rein #)dra8 (18.845) 
E 0 0 


Hélas, non. La vie n’est pas aussi simple; il faut tenir compte du fait que le changement de base 
dilate ou contracte certaines surfaces. 
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Soit w: Di c R? — D: € R° une fonction bijective de classe C1! dont l'inverse est également 
de classe CT. On désigne par x et y ses composantes, c’est-à-dire que 


glu, v) = ée : (18.846) 


avec (u,v) € Di. 


ThoChamDeVarIntDDf 
Théorème 18.251. 
Soit une fonction continue f: D2 — R. Alors 
I f(x, y)dxdy = ] F(a(u,v),y(u,v))|J(u,v)|dudv (18.847) 
p(Di) Di 
où J, est le Jacobien de & c’est-à-dire 
0x 0x 
J,(u,v) = det (Ë 1) (18.848) 
Ou Ov 


Ne pas oublier de prendre la valeur absolue lorsqu'on utilise le Jacobien dans un changement 
de variables. 


18.15.2 Coordonnées polaires 


Exemple 18.252. 
Calculons la surface du disque D de rayon À. Nous devons calculer 


Ï drdy. (18.849) 
D 


Pour passer au polaires, nous savons que le disque est décrit par 


D = {(r,0) tel que 0 <r < R,0 < 0 < 27}. (18.850) 
Nous avons donc 
2r rR R 
Ï dxdy = Ï r drd0 = | Î r drd0 = 2r | r dr = TR?. (18.851) 
D D 0 Jo 0 
A 
ExpmfDtAtV 


Exemple 18.253. 
Montrons comment intégrer la fonction f(x,y) = 4/1 — x? — y? sur le domaine délimité par la 
droite y = x et le cercle x? + y? = y, représenté sur la figure 18.12. Pour trouver le centre et le 
rayon du cercle x? + y? = y, nous commençons par écrire x? + y? —y = 0, et ensuite nous reformons 
le carré : y? — y = (y 1)? 1. 


FIGURE 18.12: Passage en polaire pour intégrer sur un morceau dé1@xdfrAYooUrfMAA 
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Le passage en polaire transforme les équations du bord du domaine en 


cos(®) = sin(ÿ 
. = . LEP 


L’angle 0 parcours donc ]0, r/4[, et le rayon, pour chacun de ces 0 parcours ]0, sin(4)[. La fonction 
à intégrer se note maintenant f(r,0) = 41 — r2. Donc l’intégrale à calculer est 


7/4 sin(0) 
Î | Vi w) REP SER RENE) 
0 0 


Remarquez la présence d’un r supplémentaire pour le jacobien. 
Notez que les coordonnées du point P sont (1,1). A 


En pratique, lors du passage en coordonnées polaires, le « dxdy » devient « r drd@ ». 


Exemple 18.254. 
On veut évaluer l'intégrale de la fonction f(x,y) = x? + y? sur la région V suivante : 


V={(x,y)eR?|r?+%ÿ <1,x>0,y> 0}. 


On peut faire le calcul directement, 


1 rVi-x? 1 (1 : x2)3/2 
Ï fwyav = | Î + dyd = | 2'V1-— 22 + dx 
v o Jo 0 3 


mais c’est un peu ennuyeux. On peut simplifier beaucoup les calculs avec un changement de 
variables vers les coordonnées polaires. Dans ce cas, on sait bien que le difféomorphisme à utiliser 
est O(r, 0) = (rcos6,rsin 0). Le jacobien J, est 


(18.854) 


cos 0 sin 0 
Jé(r,0) - | —rsin0 rcos0 | nn: 


qui est toujours positif. D’une part, la fonction f peut s’écrire sous la forme f((r,0)) = r? et 
d’autre part, @-1(V) =10,1]x]0,x/2[. Par conséquent, la formule du changement de variables nous 


donne à ja 
T T 1 
Ï f@wav = | Î dr do = | d0= ZT; 
V o Jo o 4 8 


18.15.3 Coordonnées cylindriques 


Exemple 18.255. 
On veut calculer le volume de la région À définie par l’intersection entre la boule unité et le cylindre 
qui a pour base un disque de rayon 1/2 centré en (0, 1/2) 


A = {(æ,y,2) € R|a? + y + 2t < 1} 0 {(e,y, 2) € R°|a? + (y — 1/2) < 1/4}. 
On peut décrire À en coordonnées cylindriques 


A = {(7,8, 2) €10,+o[x[-7T,r[xR | 


(18.855) 
— r/2<0<7r,0<7r<sin6, -Vi=r<z<Vvi-r} 
Le jacobien de ce changement de variables, J'y, est 
cos 0 sin®g 0 
Jey(r,0,z) =| -rsin® rcosû 0|=7r, (18.856) 


0 0 1 
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qui est toujours positif. Le volume de À est donc 


r/2 psin0 pV1-r2 27 
J XA(X, y, 2) dV = Î Î rdz dr dû = — + 
R3 —r/2 Jo Ir? () 


I 00 


Exemple 18.256 (Volume d’un solide de révolution). 
Soit g : [a,b] — R} une fonction continue et positive. On dit que le solide À décrit par 


A = {(æ,y,2) eR°|ze [ab], 4/2? + y? < g(2)} 


est un solide de révolution. Afin de calculer son volume, on peut décrire À en coordonnées cylin- 
driques, 
A = {(r,8,2) €]0,+oo[x[-7,7[xR|a < 2 < b, 0 < 7? < g”(2)}. 


Le jacobien de ce changement de variables est J.y — r, comme dans l’exemple précédent. Le 
volume de À est donc 


b pr  pg(z) b 
J at) dv = | Î Î rdrdbdz = | ñg°(2) dz. 
Rè a J—r JO a 
Cette formule peut être utilisée pour tout solide de révolution. A 


18.15.3.1 Coordonnées sphériques 


Le calcul est un peu plus long : 


P 0 p 
Q a Ô 
J(,8,6)=1% % % 
02 02 902 
0p 00 de 
sinfcosw pcos@coso —psinô6 sing (18.857) 
= [sinO@sing pcosôésing —psin 0 cosy 
cos 0 — p sin 0 0 
= p° sin 0. 
Donc 
dx dy dz = p? sin(0) dp dO de. (18.858) 


Exemple 18.257. 
On veut calculer le volume du cornet de glace À 


À = {(æ,y,2) EeR°|(x,y) € S?, V/x2 + y? < 2 < 1/1 — 2 =}. 
On peut décrire À en coordonnées sphériques. 

A = {(p,0,0) €]0,+oo[x[-x,7[x[0,n[|0 <  < x/4, 0 < p< 1}. 
Le jacobien de ce changement de variables J,,r est 


cos Ô sin @ sin Ô sin @ COS ® 
Jsph(p, 0,9) = | —-psin@sing pcos sin p 0 = hp? sin®, (18.859) 
pcosô cos  psinf@cosp —psin 


Le volume de À est donc 


XAUT,Y,2 — sin hp ee Je 
Rs" ro Jo : É 3 V2 
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18.15.4 Un autre système utile 


Un changement de variables que l’on voit assez souvent est 


U=T+7y (18.860a) 
U=T—Y. (18.860b) 
Afin de calculer son jacobien, il faut d’abord exprimer x et y en fonctions de u et v : 
z=(u+u)/2 (18.861a) 
y = (u—v)/2. (18.861b) 


La matrice jacobienne est 


0x 0x 1 1 
(Ë i) = ( :) (18.862) 
Ou Ov 2 2 


Le déterminant vaut — À. Nous avons donc 


1 
dxdy = 3 dudv. (18.863) 


Nous insistons sur le fait que c’est À et non —À qui intervient parce que que la formule du chan- 
2 2 
gement de variable demande d'introduire la valeur absolue du jacobien. 


Exemple 18.258. 
Calculer l'intégrale de la fonction f(x,y) = x? — y? sur le domaine représenté sur la figure 18.13. 


FIGURE 18.13: Un domaine qui s’écrit étonnament bien avec un bon changargsetrdenreknnes 


Les droites qui délimitent le domaine d’intégration sont 


y=-x+2 

Poe (18.864) 

Yy=X 

y = —X 

Le domaine est donc donné par les équations 

y+z<2 (18.865a) 
y—x> —2 (18.865b) 
y—x<O0 (18.865c) 
y+x>0. (18.865d) 


En utilisant le changement de variables u = x + y, v = x — y nous trouvons le domaine 0 < u < 2, 
0 < v < 2. En ce qui concerne la fonction, f(x, y) = (x + y)(x — y) et par conséquent 


f(u,v) = uv. (18.866) 
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L'intégrale à calculer est simplement 


2 pr2 2 v? 2 2 
Î [ uv dudv = Î u du || = 2 | u du = 4. (18.867) 
o Jo 0 2 lo 0 


18.16 Aire d’une surface de révolution 


ii Avertissement /question à la lectrice !! 18.259 

Vu que nous n'avons pas encore de définition d’une aire dans R?, ce qui suit n’est en réalité pas 
) 

très rigoureux. 


Soit y une courbe dans le plan xy, paramétrée par 


Yu) = [y 


(u) 
(u) (18.868) 
0 


avec ü € [a,b]. Nous supposons que la courbe est toujours positive, c’est-à-dire y(u) > 0 pour tout 
u. 

Nous voulons considérer la surface obtenue en effectuant une rotation de cette ligne autour de 
l'axe X. Chaque point de la courbe va parcourir un cercle de rayon y(u) dans le plan Y X et centré 
en (x(u),0,0). La surface est donc donnée par 


plu, 0) = | y(u) cos 0 (18.869) 
y(u) sin 0 


avec (u,0) € [a,b] x [0,27]. Notez que la courbe de départ correspond à 0 = 0. 
Les vecteurs tangents à la surface pour ce paramétrage sont 


Ôp 0 Op : 
Je = — — y'(u) cos 0 To me —y(u) sin Ô |. (18.870) 
ou ; | 00 
y'(u) sin 0 y(u) cos 0 


Le produit vectoriel de ces deux vecteurs vaut 
e éÿ ez 


HA 
T, X To = x" y'cosO y'sin0 


O0 —ysin0 ycosô (18.871) 


= y(u)y(u) ex — z'(u)y(u) cos 8e, + x’(u)y(u) sin 8e. 
En ce qui concerne la norme : 


dS = [Tu X Tol = 4/(y'y)? + (x'y)? = Iy(u)|V/y'(u)? + z'(u)?. (18.872) 


Étant donné que nous avons supposé que y(u) > 0, nous pouvons supprimer les valeurs absolues, 
et l’aire de la surface de révolution devient : 


27 b 
Aire(S) = [ de | y(u)/x'(u)? + y'(u)?du 
b 
= 2r | y(u)1/x'(u)? + y'(u)?du. 


(18.873) 
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| (R,h) 


FIGURE 18.14: En faisant tourner cette droite autour de l’axe X, nous phéenpnsyHDy6ÔREXLLn 


EXooZCLXooVmXQgY 
Exemple 18.260. 
Calculons la surface du cône de révolution de rayon (à la base) R et de hauteur h. La courbe de 
départ est le segment droite qui part de (0,0) et qui termine en (R,h) de la figure 18.14. 
Ce segment peut être paramétré par 


Ru 
v(u) = [hu (18.874) 


avec ü € [0,1]. Cela donne æ(u) = Ru, y(u) = hu et par conséquent 


1 
Aire = 2r | hu R2 +R? = rh \ R2 + h?. (18.875) 
0 


Ce résultat peut aussi être exprimé en fonction de l’angle, grâce à la formule (18.583). En sachant 
que h = Vh? + R?sin(a), nous trouvons 


Aire = r(R°? + h?)sin(a). (18.876) 
A 


Exemple 18.261. 
Calculons la surface latérale du tore obtenu par révolution du cercle de la figure 18.15. 


À 


IR 


| ETS 


FIGURE 18.15: Si nous tournons ce cercle autour de l’axe X, nous obtenons un tore de rayon 
« externe » a et de rayon « interne » À. LabelFigROAOooPgUZIt 


Le chemin qui détermine le cercle de départ est 


R cos(u) 
y(u) = [a+ Rsin(u) |, (18.877) 
0 
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c'est-à-dire z(u) = Rcos(u), y(u) = a + Rsin(u) avec u € [0,27]. Nous avons donc l’aire 


27 


Aire = 2r | (a + Rsin(u))R du 
0 
= 2rR(2ra + R[- cos(u)]5") (18.878) 
= 4r°aR. 
A 
18.17 Table de caractères du groupe diédral 
SecWMzheKf 


Cette section vient de [103]; nous avons comme but d’établir la table des caractères des repré- 
sentations complexes du groupe diédral D;. 


18.17.1 Représentations de dimension un 


Nous nous occupons des représentations de D,, sur C. Les applications linéaires € — € sont 
seulement les multiplications par des nombres complexes. Nous cherchons donc Ÿ: D, — C*. 
Nous savons que D, est généré °? par s et r. Vu que s? = 1, nous avons 


Y(s)? = p(s*?) = #(1) = 1, (18.879) 
donc #(s) € {—1,1}. Nous savons aussi que srsr = 1, donc 
p(s)*p(r)? = 1, (18.880) 


ce qui donne ÿ(r) e {—1,1}. 
Nous avons donc quatre représentations de dimension un données par 


dir) =1 |) =-1 
p(s) =1 po pie 
)=-1] pe? PT 


Attention au fait que nous devons aussi avoir la relation Y(r)" = #(r") = 1. Donc Ÿ(r) doit être 
une racine n° de l’unité. Nous allons donc devoir avoir un compte différent selon la parité de n. 
Nous en reparlerons à la fin, au moment de faire les comptes. En ce qui concerne les caractères 
correspondants, 


Tr srF 
a 1 1 
x =D] ED 
XTT 1 —1 
SN ieUsE 


Étant donné qu’ils sont tous différents, ce sont des représentations deux à deux non équivalentes, 
lemme 16.16. 


18.17.2 Représentations de dimension deux 


Nous cherchons maintenant les représentations p: D — End(C?). Ici nous supposons connue la 
liste des éléments de D, donnée par le corolaire 18.176. Soit w = e27/" et h e Z ; nous considérons 
la représentation pth) de D, définie par 


uk 0 

p) (rE) = ( ; _ (18.881a) 
0 —hk 

pi) (srt) = (a 1h (18.881b) 


87. Voir proposition 18.175 et tout ce qui suit. 
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Cela donne bien p{*) sur tous les éléments de D, par la proposition 18.175. Nous pouvons res- 
treindre le domaine de } en remarquant d’abord que ph) _ gtrtn), et ensuite que les représentations 


h) 


: ; O I : 
pi) et pe sont équivalentes. Un opérateur d’entrelacement est donné par T = é i et il est 


facile de vérifier que Tp(M)(x) = ph" (x)T avec x = r* puis avec x = sr*. 


Donc p) = ph) = pfn-h) et nous pouvons restreindre notre étude à 0 < À < Le 
Nous allons séparer les cas n = 0, h = n/2 et les autres. En effet si nous notons par commodité 
a = wh, alors un vecteur Cr y) est.vecteur propre de ph) (s) et de pl) (r) si et seulement si il vérifie 
à ” é ubÉqsGXZoxLq 
les systèmes d'équations | 


ax = Àx (18.882a) 

1 

av = Ày (18.882b) 
_. PHOEASEPARERT 

1 

a = HT (18.883a) 

at = [y (18.883b) 


avec À et uw des nombres non nuls. Une représentation sera réductible si et seulement si ces deux 
systèmes acceptent une solution non nulle commune. Il est vite vu que si x Æ 0 et y Æ 0, alors 
a? = 1, ce qui signifie À = 0 ou À = n/2. Sinon, il n’y a pas de solutions, et la représentation 
associée est irréductible. 


(1) hk = 0. Nous avons 
pO)(r#) = É 1) pU)(sr*) = Ë . ; (18.884) 
donc le caractère de cette représentation est X((r*) = 2 et y{0)(sr*) = 0. Donc nous avons 
He nf + (18.885) 


Il y à maintenant (au moins) quatre façons de voir que la représentation p(®) est réductible. 


Première méthode Trouver un opérateur d’entrelacement. Pour cela nous calculons les 


matrices : 
se = pere (PR = 1) (18.886) 
Sert) = (++ D p-*}(srt) = (Fr en = L Là (18.886b) 


(18.886c) 


Nous cherchons une matrice T telle que TS(r*) = pO)(rË)T et TS(sr*) = pU)(sr*)T. 
Étant donné que S(r“) = 1 = pl0)(rK), la première contrainte n’en est pas une. Nous 
1 1 
LT —1 


T ( ei = É (18.887) 


Donc ce T'entrelace p**@p7+ avec p{0) qui sont donc deux représentations équivalentes. 
Donc p{0) est réductible et ça ne nous intéresse pas de la lister. 


pouvons vérifier qu'avec T = ( , nous avons bien 
+ 


Seconde méthode Invoquer le théorème 16.24(1) et dire que les représentations sont équi- 
valentes parce que les caractères sont égaux. 


18.17. TABLE DE CARACTÈRES DU GROUPE DIÉDRAL 1689 


Le caractère de la représentation pl) est y) (7#) = hk Lo hk 2 9 cos ( 


Troisième méthode Utiliser le théorème 16.24(2) et calculer {y(0), x(0)) : 


1 

0), x 0) _ 5. > Lx (9)? (18.888a) 
#l géDy 

: (A + 0 + 4(n — 1)) (18.888b) 

_) (18.888c) 


Ici le 4 est pour le 1, le zéro est pour les termes sr* et 4(n — 1) est pour les n — 1 termes 
rË. Vu que le résultat n’est pas 1, la représentation po) n’est pas irréductible. 


Quatrième méthode Regarder les solutions des systèmes (18.882) et (18.883) dont nous 
avons parlé plus haut. 

La première méthode a l’avantage d’être simple et ne demander aucune théorie particulière à 
part les définitions. La seconde méthode est la plus rapide, mais demande un théorème très 
puissant. La troisième utilise également un théorème assez avancé, mais a l’avantage sur les 
deux autres méthodes de ne pas avoir besoin de savoir à priori un candidat décomposition 
de p(0) ; cette méthode est applicable même sans faire la remarque que x{9) = y++ + y+. 
Quoi qu'il en soit, nous ne listons pas x{0) dans notre table de caractères. 


h = n/2. Vu que w? = ei = _], nous avons 
k k 
pk _ (1) 0 (nr _ [ ©  (-1 


et donc 


x2 (rh) = 2(—1)* (18.890a) 
x 2 (574) = 0. (18.890b) 


Il est vite vu que x(2) = ÿ+- + y-+. Ergo la représentation ptv/ 2) n’est pas irréductible. 

0 < h < 5. Dans ce cas nous avons wh Æ w7h, et en regardant les systèmes d'équations 
donnés plus haut, nous voyons que ph)(s) et pl) (r) n’ont pas de vecteurs propres communs. 
Donc ces représentations sont irréductibles. 

Nous devons cependant encore vérifier si elles sont deux à deux non équivalentes. Supposons 
que pour À £ h/ nous ayons une matrice T e GL(2, ©) telle que To (r)T-1 = pW)(r), Cela 
impliquerait en particulier que les matrices p(*)(r) et p()(r) aient même valeurs propres. 
Nous aurions donc {w/,wh} = {wh",w=""}. Mais cela est impossible avec 0 < À < h! < 2. 
Donc toutes ces représentations sont distinctes. 


2) 


Nous ajoutons donc la ligne suivante à notre liste : 


Tr sr 
x) 2 cos (A) 0 


18.17.3 Le compte pour n pair 


Nous avons 4 représentations de dimension 1 puis % — 1 représentations de dimension 2. En 


tout nous avons 


5 +5 (18.891) 


représentations irréductibles modulo équivalence. Cela fait le compte en vertu des classes de conju- 
gaisons listées en 18.10.14.5. Pour rappel, le nombre de représentations non équivalentes est égal 
au nombre de classes de conjugaison par le corolaire 16.27. Notons que c’est cela qui justifie le fait 
que nous ne devons pas chercher d’autres représentations. Nous sommes sûrs de les avoir toutes 
trouvées. 


1690 CHAPITRE 18. TRIGONOMÉTRIE, ISOMÉTRIES 


18.17.4 Le compte pour n impair 


Nous avions fait mention plus haut du fait que si d est une représentation de dimension 1, le 
nombre #(r) devait être une racine n° de l’unité. Donc en dimension 1 nous avons seulement les 
représentations p*+ et p7*. Pour celles de dimension 2, nous en avons DT, En tout nous avons 


d 
onc _—. 


2 
représentations irréductibles modulo équivalence. Cela fait le compte en vertu des classes de conju- 
gaisons listées en 18.10.14.6. 


(18.892) 


Chapitre 19 


Corps finis, racines de l’unité 


19.1 Le groupe des racines de l’unité dans les nombres complexes 


SsecGJOLooWdMYV1 
19.1.1 Le groupe 
DEFooDUWPooZaAByH 
Définition 19.1. 
Une racine n° de l’unité dans un anneau est une racine du polynôme X" — 1. 
LEMooSXFBooYJmRTK 
Lemme-Définition 19.2. 
Soit 
Un = {e2TK/" tel que k = 0,...,n—1} Hoi | 


(1) L'ensemble U, est un groupe pour la multiplication. 


(2) L'ensemble U, est l’ensemble des racines n° de l’unité dans C. 


Démonstration. Il est vite vérifié que tous les éléments de l/, sont des racines de l’unité parce que 
Cou — e2iTk _ 1, (19.2) 


entre autres à cause du lemme 18.11. 
Cela nous donne déjà n racines pour X" — 1 dans C. Le théorème 6.110 nous indique qu’il ne 
peut pas y en avoir plus. [1 


19.3. 
En ce qui concerne les notations, dans U,, le « U » signifie « unité ». Cela n’a à peu près rien à 
voir avec le « U » du groupe SU(n) ; dans ce dernier, le « U » est pour « unitaire ». 


Un des intérêts du groupe des racines est qu’il permet de factoriser À” — 1, comme nous le 


verrons via les polynômes cyclotomiques dans le lemme 19.18. 
LEMooBKTNooTmtUNQ 


Lemme 19.4 ([539)). 


Un nombre complexe algébrique dont tous les conjugués sont de module 1 est une racine de l’unité!. 
LemWHQGooXyeJiw 


Lemme 19.5. 


L'ensemble U, est un groupe cyclique? d’ordre n généré par £ = e2i7/n. 


Démonstration. Il y a trois propriétés à vérifier pour que ce soit un groupe. 
(1) Neutre Le nombre 1 est une racine de l’unité. 


(2) Inverse Si w e U, alors w" = 1 et donc ww"-1 = 1, ce qui signifie que w"-! est un inverse 
de w. Il reste à voir que w”-l e U,. En effet (en _— (eye = 10-1271, 


(3) Associativité Cas particulier de l’associativité dans C. 


1. Définition 19.1. 
2. Définition 1.319. 
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Le fait que ce soit un groupe cyclique contenant n éléments fait partie de la définition. 


Le lemme suivant donne les autres générateurs. 
LemcFTNMa 


Lemme 19.6. 
Le nombre £% est un générateur de U, si et seulement si pgcd(a, n) = 1. 


Démonstration. Si pgcd(a,n) = 1 alors le théorème de Bézout 1.229 nous fournit des entiers u et 
v tels que ua + vn = 1. Alors nous avons 


ET (19.3) 


ce qui signifie que & est dans le groupe engendré par €, et par conséquent tout U, est engendré. 

Pour l’implication inverse, nous utilisons le théorème de Bézout dans le sens inverse. Soit € 
un générateur de U,. Alors il existe u tel que (£®)" = £, donc € 1 = 1, c’est-à-dire qu’il existe v 
tel que au — 1 = vn. Cette dernière égalité implique que pgcd(a,n) = 1. 


Exemple 19.7. 

Une conséquence tout à fait extraordinaire de ce lemme est que le nombre 7 est générateur de 
Z/12Z (parce que pgcd(7, 12) = 1). Or en solfège, une quinte fait 7 demi-tons, et une gamme en 
fait 12. Le cycle des quintes est donc générateur de la gamme chromatique[540]. Ce fait est connu 


des musiciens * depuis des siècles. A 
PROPoo10QEo0oGMcCJm 


Proposition 19.8 (Intersection par deux). 
Les ensembles U, et Ug ont une intersection réduite à {1} si et seulement si à et B sont premiers 
entre eux. 


Démonstration. Nous rappelons qu’une racine a° de l’unité peut s’écrire sous la forme e2:7T#/a 


0O<k< a. 


avec 


(1) Sens direct Par contraposée, nous supposons que a et B ne sont pas premiers entre eux, et 
nous notons d leur pgcd. Nous nommons « = dæ et 5 = dB. Pour trouver une intersection 
entre U, et Ug nous devons trouver une valeur de 0 < k < a telle que 


(e2irk/a)8 2 Q2inkBla L (19.4) 


c’est-à-dire une valeur de k telle que kB/a soit un entier. Mais kB/a = kB//a! et par consé- 
quent prendre k = «/ fonctionne. Surtout que par hypothèse d > 1 et donc k = @' < a. 


(2) Sens réciproque Supposons maintenant que a et B soient premiers entre eux. Soit z € 
Ur} n Ug. Le fait que z soit une racine a° de l’unité implique qu'il existe un k < a tel que 
z = e2irk/a, Mais si z est également une racine B° de l'unité, alors 2° = 1, c’est-à-dire que 
kB/a doit être un entier, soit { cet entier. Nous avons 


kB = la. (19.5) 


Si k > 0, comme le nombre a divise kB, cela conduirait via le lemme de Gauss 3.12 à dire 
que «a divise k. Mais à ne peut pas diviser £ parce que nous avions supposé que k était 
strictement plus petit que a. Donc k = 0 et z = 1. 


PropFDDHooEyYxBC 
Proposition 19.9 (Intersection : le cas général{[1]). 
Soient des entiers positifs a1,...,a,. Nous avons 


a Un, = {1} (19.6) 
é=1l 


si et seulement si pgcd(ai,...,a») = 1 (c’est-à-dire que les a; sont premiers dans leur ensemble). 


3. Même ceux qui ignorent le théorème de Bézout. 
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Démonstration. Nous décomposons les a; en facteurs premiers de la façon suivante : a; = 
() 


C2 L ‘ 
Jlren?x' où les px sont les nombres premiers. 


(1) Caractérisation par une décomposition en facteurs premiers Les éléments z diffé- 
rents de 1 dans l/,, s’écrivent sous la forme 


3 = eirk/oi (19.7) 


avec 0 < k < a1. 

Pour tout à # 1, le fait que z e U,, n U,, se traduit par le fait que (us a = 1, c’est- 
à-dire que a;k/a1 est entier, donc que a divise ka;. Par conséquent il existera un élément 
différent de 1 dans l'intersection des U,, si et seulement si il existe un entier k strictement 
compris entre 0 et «1 pour lequel «1 divise tous les ka;. 

Un entier 0 < & < «1 convient si et seulement si pour tout {, la puissance de », dans la 
décomposition de k est au moins égale à 


a — af (19.8) 


pour tout Î. 


(2) Sens direct L'hypothèse pgcd(a1,...,a») # 1 implique qu’il existe un ! pour lequel tous 
Q 


; sont non nuls. Nous construisons le £ voulu en prenant pour tout p; la même puissance 
(1) 


: : l 
que celle dans a, sauf pour p, pour lequel nous prenons la puissance @;° — min;{a! )}. Le 
minimum en question est strictement positif, ce qui donne un k strictement inférieur à 1. 


D 0. 
Donc pour tout !, la puissance de p; dans la décomposition de k est au moins af). Cela 


implique que k > a, ce qui est impossible. 


les « 


(3) Sens réciproque Si pgcd(a,...,a») = 1 alors pour tout {, il existe un à tel que a 


19.1.2 Fonction indicatrice d’Euler 


Voir le thème 11. 
DefLYGTooFPOYGZ 


Définition 19.10. 
Les générateurs de U, sont les racines primitives” de l’unité dans C. Nous nommons À,, leur 
ensemble : 

An = {e Th /M je] que 1 <k <n et pgcd(k,n) = 1}. (19.9) 


Nous avons par exemple 
— Pour n = 1, pgcd(k,1) = 1et1<k<1 
— Pour n = 2, pgcd(k,2) = 1 et 1 < k < 2 uniquement pour k = 1. 
— Pour n = 3, pacd(k,3) = 1 et 1 < k < 3 


uniquement pour k = 1. 


uniquement pour k = 1, 4 = 2. 


A = {1} (19.10a) 
A2 = {eïT} (19.10b) 
Ay= et eur (19.10c) 


Notons que 1 € Ày seulement avec d = 1. 


4. Théorème 3.15. 
5. parce qu’en prenant les puissances successives de l’une d’entre elles, nous retrouvons toutes les racines de 
l’unité, voir aussi la définition 19.54. 
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PROPooWILSooFHWLnt 
Proposition 19.11. 
En posant 
Un = {e TE /" jel que k = 0,...,n—1}, (19.11) 
et" 
Ag = {e 7/4 jel que 1 < k < d et pgcd(k, d) = 1}, (19.12) 


nous avons 
Un = | JAa Fa 
din 


et l’union est disjointe. 


Démonstration. En plein de petites parties. 
(1) Union disjointe Soient di, d2 tels que x € Ag, NA a,. Il existe k, / tels que e2irk/di = R2inl/de, 


Le corolaire 18.24 dit alors qu'il existe s € IN tel que 


k 1, ,_1+sd 
d  d d 


(19.14) 


Vu que k/d2 est une fraction irréductible, nous avons d2 < di par la proposition 3.34. Nous 
faisons de même en permutant les rôles de d et do : il existe t € IN tel que 
L _k+dit 
di: y * 


(19.15) 


de telle sorte que d1 < d2. Nous en déduisons que d1 = d2. Donc l’union à droite dans (19.13) 
est disjointe. 


(2) Première inclusion Soit x e Un. Il existe 0 < k < n — 1 tel que x = e274/", Si x = 1, 
alors x € À; nous supposons que ce n’est pas le cas, c’est-à-dire que k £ 0. Nous écrivons 
la fraction k/n sous forme irréductible : 

k _k 


=. (19.16) 


avec d = pgcd(k,n), et pgcd(k’,d) = 1. Donc x € Ay. 

(3) Seconde inclusion Nous supposons que x € A4 pour un certain diviseur d de n. Il existe 
donc 1 < k < d tel que pgcd(k, d) = 1 et x = e2iTK/d, Si d = 1 alors x = 1 et x e U,. Nous 
excluons ce cas. Vu que d | n, nous considérons s € N tel que n = sd. Nous avons alors 


k _ks ks 


PE, 19.17 
d sd n 

Multiplions par s les inéquations 1 < k < d : 

s<ks<sd=n. (19.18) 


Le cas ks = n est exclu parce que cela demanderait kn — ksd = nd, et donc k = d, ce que 
nous avons exclu parce que 4 = d est uniquement possible pour d = 1 à cause de la condition 
pacd(k, d) = 1. 


PROPooFKCHooWdFicM 
Proposition 19.12. 
Nous avons 


g(n) = Card(A;) FaEuler Gers) 


w est l’indicatrice d’Euler®. 


6. Voir la définition 19.2. 

7. Définition 19.10. On pourrait croire que la condition pgcd(k, d) = 1 exclu k = d. On aurait alors envie d’écrire 
1<k < d. Mais pour d = 1, ça fait une différence parce que tel qu’écrit A1 = {1}. 

8. Définition 5.29. 
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Démonstration. Nous prouvons que l’application 


f: {ke N* tel que 1 < k< n,pgcd(k,n) = 1} — {e2T#/ tel que 1 < k < n,pgcd(k,n) = 1} 


7 e2iTk/n 


(19.20) 
est une bijection. 

Le fait que ce soit surjectif est immédiat. Pour l’injectivité, nous considérons 1 < k& < n et 
1<1<n tels que f(k) = f(t). Nous avons donc e2iT#/n = L2irl/n, Le corolaire 18.24 nous dit alors 
qu'il existe s € Z tel que 

27k/n = 27l/n + 27s. (19.21) 


En simplifiant par 27 et en multipliant par n, nous trouvons k = [ + sn. Étant donné que k et | 
sont tout deux entre 1 et n, nous avons obligatoirement s = 0 et donc k — 1. 
Donc f est bijective et Card(A,,) = w(n). 


19.1.3 Décomposition en éléments simples 


SUBBEM008BYXooDDHHal 
Lemme 19.13 ([541, 1]). 
Soient des nombres complexes distincts a1,...,an. Alors pour tout 2 € {ai}i=1..n, 
N N 
1 x 
[I =) — (19.22) 
ET Un 


où 


= || = _ (19.23) 
i — dj 


- ne @ 
JF 


Démonstration. Nous posons P(z) = TC — ax), et nous calculons : 


N N 
À. = 
À _ 5 Mae 0) (19.24a) 
3 — à 
i=1 Lo i=1 ee 1(7 — @%) 
> x] [(e- (19.24b) 
2=1 kÆi 
Il s’agit maintenant de prouver que la somme de gauche vaut toujours 1. Nous posons 
N 
— à 
S(z) = [lisi(z = ax) (19.25) 


2 AC En ax) 
Calculons S(a) : 


LAC — a k) 
=», | (19.26) 


Pour les termes À £ !, le numérateur est nul, car il contient le facteur a — a; = 0. Donc la somme 
se réduit au seul terme à — | : 


= 1. (19.27) 


Le polynôme S — 1 est donc un polynôme de degré N — 1 qui possède N racines distinctes. Le 
théorème 6.110 implique que S — 1 = 0 et donc que $ = 1 comme nous le voulions. 


Il est possible de décomposer une fraction rationnelle en fractions dites « simples ». Si |z| < 1 
nous avons par exemple la décomposition 


_- Je EqDuYBoo NEA 


wEUr 
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où U, est le groupe des racines r° de l’unité défini en (19.1). Les nombres À,, peuvent alors être 
déterminés en effectuant la somme. Le dénominateur commun sera 1 — 27 tandis que les À,, sont 
déterminés en égalant le numérateur à 1. 


Exemple 19.14. 
Pour décomposer la fraction + nous savons que les racines du dénominateur sont +1. Donc nous 


écrivons 
= — + = (19.29) 
1—a2 1x l1+x ‘ 


Nous trouvons les valeurs de À et B en effectuant la somme : 


A+ RBdes) AFB+A-8B)r 


1 => (19.30) 
Les coefficients À et B doivent donc vérifier À + B = 1 et À — B = 0. Au final, 
à + - (19.31) 
1-22 2{(1—-x) 2(1+x) | 
A 
19.2 Chiffrement RSA 
SecEVaFYi 


Ce passage sur RSA provient en bonne partie de la page de Wikipédia[542]. 

Alice veut envoyer un message à Bob. L'idée est que Bob va donner à Alice une clef publique 
qui va permettre de chiffrer le message, tandis que Bob va garder pour lui une clef privée qui 
permet de déchiffrer. 


19.2.1 Mise en place par Bob 


Bob se crée une paire de clef publique, clef privée de la façon suivante. 
(1) Bob choisit deux nombres premiers distincts p, q. 
(2) Il calcule n = pq. 
(3) Par le corolaire 5.42, l’indicatrice d’Euler g(n) = (p—1)(q—1) est facile à calculer pour Bob. 
(4) Bob choisit e € N premier avec o(n), puis d tel que ed e [1],(). 
Maintenant la paire est : clef publique (n, e) et clef privée (n, d) °. 
Bob envoie la paire (n,e) à Alice. 


Remarque 19.15. 

Ici nous ne supposons pas que la communication soit sure. Une tierce personne peut intercepter 
le message. D'ailleurs en principe, les gens publient leur clef publique sur leurs sites, voire sur des 
sites dédiés. Le problème de l'identification reste à résoudre à l’ancienne. 


19.2.2 Chiffrement 


Nous chiffrons en utilisant la clef publique (n,e). D'abord Alice se débrouille pour transformer 
son message en un nombre plus petit que n. Soit M ce message. Alice code M en 


C=M® mod n. (19.32) 


Tout le truc est que nous allons voir que l’application x + x° est une bijection de F,, et que 
l'inverse est facile à calculer par Bob, et difficile pour les autres. Alice envoie C à Bob. Encore une 
fois, nous ne supposons pas que cette communication soit privée. Le nombre C' peut être intercepté. 


9. Le fait que e soit public et d soit privé est une convention. e comme encryption et d comme decryption. 
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19.2.3 Déchiffrement 


Nous allons montrer que M = C4 mod n, et donc que Bob, connaissant (n, d), peut déchiffrer. 
D'abord 
cd = (M°ÿf = m4, (19.33) 


mais nous savons qu'il existe # tel que 
ed = 1+ kç(n) = 1+k(p—1)(q — 1). (19.34) 
L'étape astucieuse est de remarquer que 


MikE-D (1) € [M], n [M]. FESSES) 


Pour montrer cela nous utilisons le petit théorème de Fermat 6.15(4). 
— Si M est premier avec p, alors MP-lef1],. 
— Si M n’est pas premier avec p, alors M est multiple de p et on sait que MP! E [0], = [M]. 


Dans les deux cas nous avons (19.35). Le nombre M 1+ko(n) _ 74 est donc à la fois multiple de p et 
de gq. 


Le lemme chinois 6.28 nous dit immédiatement !° qu’alors 
ASTRA) NT (19.36) 
est un multiple de pq = n, c’est-à-dire que 
C= M%e[Mls. (19.37) 


Si on ne croit pas au lemme chinois, on peut utiliser le lemme de Gauss. Posons 
MIT) LM = ap = bg. (19.38) 


Dans ce cas p divise bg, mais q est premier avec p, donc le lemme de Gauss 3.71 nous enseigne !! 
que p divise b. 


19.2.4 Une imprudence à ne pas commettre 


Nous avons pris deux cas selon que M soit ou non premier avec p. Une question qui se pose est 
la suivante : est-ce que c’est une bonne idée d’envoyer un message qui ne soit pas premier avec p ? 
Si nous savons que M n’est pas premier avec p, alors nous avons M° = [fpf et n = pq qui sont 
publics. Donc un calcul de PGCD permettrait de trouver p. 
; PagelktBooMDeQxY 
Il faut cependant savoir que | 


— La probabilité que ça arrive est infime : comme M est entre 0 et n = pq, les multiples de p 
possibles sont p, 2p, : - - pq. Il y a donc une chance sur p que cela arrive. Typiquement avec des 
p de l’ordre de 10/20, on peut utiliser RSA chaque milliseconde sur chaque atome de l'univers 
depuis le début des temps que ça ne se serait presque certainement pas encore produit. 


— De toutes façons, Alice ne sait pas vérifier si son message est premier avec p, parce qu’elle 
ne connaît pas p. 


—— En conclusion, la partie de la preuve qui montre que M1+?{1) e [M N[M]Q dans le cas M non 
premier avec p est, à toutes fins pratiques, inutile parce que ce cas de figure ne se présentera 
jamais dans toutes l’histoire de l’univers, même pas avec une civilisation intelligente autour 
de chaque étoile. 

ProbGAYFooZATuYy 
ii Avertissement /question au lecteur !! 19.16 


Est-ce que ces trois points sont corrects ? 


10. C’est ici qu’il est important que p ne soit pas égal à q. Si p = q, alors le lemme chinois ne fonctionne pas. 
11. Ici aussi, si p — q, ça ne marche pas. 
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19.2.5 Problèmes calculatoires 


Pour implémenter RSA, il faut pouvoir faire (au moins) trois choses : 
(1) Trouver de grands nombres premiers. 
(2) Trouver des couples de Bézout. 
(3) Calculer M° lorsque e est très grand. 


En ce qui concerne le problème de trouver des nombres premiers, c’est compliqué, mais il faut 
savoir qu’il y en a plein. À 120 chiffres, il y a environ autant de nombres premiers que d’atomes 
dans 102 fois l’univers connu. Cela rend impossible toute tentative de factoriser un grand nombre 
en essayant toutes les possibilités. Même pas en science-fiction. 

Trouver des nombres u et v tels que Au + Bu = pgcd(A, B) est un problème expliqué en 3.2.1. 

En ce qui concerne le calcul de M° lorsque e est grand, il n’est évidemment pas pensable de faire 
M : M - ...M avec e facteurs. Un truc pour calculer en moins d'étapes est l’exponentiation 
rapide. Si e = 2k est pair, nous calculons 


M° = (MF); (19.39) 
si e = 2k + 1 alors nous calculons 
M° = M(M*y. (19.40) 
Le calcul prend alors seulement environ log,(e) étapes. Pour donner une idée, 
log2(10120) + 400. (19.41) 


Très raisonnable, mais un ordinateur reste indispensable. 


19.2.6 La solidité de RSA 


La solidité de la méthode repose sur deux conjectures (non démontrées ! !) : 
— Pour déchiffrer il faut connaitre p et q. 
— La difficulté de trouver p et q en partant de n = pq est exponentielle en n. 


Dans la méthode de déchiffrage proposée ici, p et q sont utilisés pour calculer d qui est solution de 
ed = [1]s(n). La seule formule connue pour calculer w(n) est @(n) = (p — 1)(q — 1). Si on trouve 
plus simple, alors RSA peut être craqué. 


19.2.7 Note non mathématique pour doucher l’enthousiasme 


Il est souvent dit[543] que différents systèmes de chiffrement peuvent aider à avoir des discus- 
sions « discrètes » dans les régimes totalitaires. La technologie au service de la démocratie, voilà 
qui enthousiasme la jeunesse !?. La réalité est qu’il est souvent possible de craquer un système de 
chiffrement arbitrairement complexe, même sans connaitre le petit théorème de Fermat ... 


À CRYPTO NERD'S WHAT \WOULD 
IMPGINATION : ACTUALLY HAPPEN: 
HIS LAPTOPS ENCRYPTEO. HIS LAPTOP'S ENCRYPTED. 
LETS BUILD À MILLION-DOLLAR, DRUG HIM AND HIT HIM WITH 
CLUSTER To CRACK IT. THIS $5 WRENCH UANL 

\ NO GooD!_ [T's HE TEUS US THE PASSWORD. 


HOME -BIT RSA! \ GOT 1T. 


gP6TI OUR ] 50 
Ÿ 


EVIL PLAN 
15 FOILED! 

12. Cela dit, le navigateur Tor[544], qui est un pur produit de RSA, permet effectivement d’accéder en France aux 

sites bloqués pour apologie du terrorisme (mars 2015). 
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...tout dépend du contexte. 


19.3 Polynômes cyclotomiques 


19.3.1 Définitions et propriétés 
DefXGHooRAX1pp 


Définition 19.17. 
Le polynôme cyclotomique d'indice n est le polynôme 


bn(X) = [[ (x -2) FES 


ZEAn 
où An est l’ensemble des racines primitives de l’unité de la définition 19.10 : 
An = {e Th /" je] que 1 <k <n et pgcd(k,n) = 1}, (19.43) 
voir la définition 19.10. 


Le polynôme #, est un polynôme unitaire de degré (n) où w est l’indicatrice d’Euler !*. Nous 
avons par exemple 


A; = {1} (19.44a) 
Ait (19.44b) 
Age fers es] (19.44c) 


et les premiers polynômes cyclotomiques sont donnés par 


p(X) = X —-1 (19.45a) 
pa(X) = X +1 (19.45b) 
Ds(X) = X? + X + 1. (19.45c) 
Pour le dernier nous avons utilisé le fait que e977/3 = 1 et e2i7/3 + edir/3 2 21, 
LemKYGBooAwpOHD 


Lemme 19.18. 
Le polynôme X" — 1 se factorise des diverses manières suivantes : 


X-1= [[(X-2=[[ [[(X-2 = [[éatx) (19.46) 


zEUn din zEAa din 
où U, est défini en 19.2. 


Démonstration. En ce qui concerne la première égalité, tous les éléments de U, sont des racines 
simples de X” — 1. Donc le théorème 3.127 dit qu’il existe un nombre k (polynôme de degré zéro) 
tel que X° —1 = k[[.4y, (X — 2). Vu le coefficient du terme de plus haut degré, ce k ne peut être 
que Î. 

Pour la suite nous utilisons l’union disjointe Un = Üan Ad de la proposition 19.11 et la 
définition (19.42) des polynômes cyclotomiques. 


Remarque 19.19. 
Notons juste pour le plaisir que dans le produit [He A4» il y à bien n termes parce que 
Card(Aa) = p(d) et y p(d) = n (définition 19.10 et proposition 5.37). 


Proposition 19.20. 
Les polynômes cyclotomiques sont à coefficients entiers : dn € Z[X]. 


13. Définie par l'équation 19.19. 
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Démonstration. Nous devons démontrer que les coefficients de 9, sont dans Z alors qu'ils sont à 
priori dans C. Nous démontrons cela par récurrence. D'abord D1(X) = X — 1, d'accord. Ensuite 


XMH 212 [] Ga(X) = buu(X) [[ dax) (19.47) 
din+1 d|\n+1 
d£n 


EZIX] par récurrence 


Le lemme 6.49 conclut que n+1 € ZIÏX]. Nous avons considéré Z comme sous anneau du corps 


C. 


PropUImYnL 
Proposition 19.21. 
Soient 1 < m < n, deux entiers, et 
X7 —1 
T(X) = E ZX). 19.48 
A) = LE € 20 (19.48) 
Alors : ItemhpDPKE 


(1) sim |n alors T Ee Z[X|, 
(2) sim |n et sim <n alors @, divise T dans Z[X]. 


Démonstration. Nous prouvons point par point. 


(1) Si m divise n alors les diviseurs de n sont l’union des diviseurs de m et des diviseurs de n 
qui ne divisent pas m. Soit 


Q = {diviseurs de n ne divisant pas m}. (19.49) 


Nous avons alors 


X7 1 =] [éa(X) = [ [ ba) : IT bat = (47 0 + [#2 (19.50) 


din dim geQ geQ 
Nous avons donc Fr 
TX) = = —— = | ] &(X) € ZIX]. (19.51) 
XM I 
geQ 
(2) Nous venons de montrer que 
T=]]éeZIx]. (19.52) 
geQ 
Étant donné que m < n nous avons n € Q et donc 
Dose |] 6x (19.53) 
qgeQ\{n} 


Par conséquent ®, divise T dans Z[X]. 


CorTVUooErJiAC 
Corolaire 19.22. 
Si p est premier alors le polynôme cyclotomique D, a une bonne tête : 


bp(X)=1+X+...+ XP (19.54) 


Démonstration. Nous utilisons la formule du lemme 19.18 en remarquant que seuls p et 1 divisent 
? : 
XP —1= ] ]éa(X) = (XX) = (X — Dh(X). (19.55) 
d|p 


Nous pouvons simplifier par X — 1 en utilisant la formule du lemme 3.133(2) : 


1+X ++ XP LE g,(X) (19.56) 
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PropoleOVh 
Proposition 19.23 (Irréductibilité des polynômes cyclotomiques[545]). 
Les polynômes cyclotomiques sont irréductibles sur Q. 


Démonstration. Pour rappel, nous savons déjà que pour tout n € N, 6, € ZÏX|. Puisque les racines 
de ,, sont les racines primitives de l’unité, nous devons montrer que toutes les racines primitives de 
l’unité ont même polynôme minimal (qui sera alors ®,) ; en effet comme ces polynômes divisent 0, 
s’ils sont distincts, la proposition 6.107 s’applique et le produit des polynômes minimaux diviserait 
Pn. Dans le cas inverse, D, est polynôme minimal des racines primitives de l’unité et est donc 
irréductible. Soit donc £, une telle racine primitive. Une autre racine primitive est de la forme é! 
où { est un nombre premier tel que pged({,n) = 1. 

Soient f et g, les polynômes minimaux dans Z[X] de £ et £!. Nous allons montrer que f = g 
et donc que f = g = ®,. Supposons par l’absurde que f Æ g. Dans ce cas ils seraient des facteurs 
irréductibles distincts de ®, et il existerait un polynôme À tel que 9, = fgh. À priori, h € Q[X] 
parce que nous sommes justement en train de prouver que ®, est irréductible dans Q[X]. Quoi 
qu’il en soit, le lemme de Gauss 6.51 nous montre que h € Z[X] parce que ®,, f et g ont des 
coefficients entiers. Nous avons 


F(E) = g(€') = 0. (19.57) 


Considérons le polynôme #(X) = g(X!). Ce polynôme # est dans Z[X] et 4 est annulateur de 
€, donc f divise 4 en tant que polynôme minimal de &. Il y a un polynôme unitaire à coefficients 
entiers (lemme de Gauss forever) k tel que 


D=fk (19.58) 


Nous considérons maintenant les projections sur F/[X] : étant donné que , — fgh, nous savons 
que fg divise 6,. En même temps, f divise 4. En utilisant le morphisme de Frobenius (c’est ici 
que la projection sur F} joue), nous avons aussi 


DIX) = g(X1) = 5(X). (19.59) 


Par conséquent dire que f divise + revient à dire que f(X) divise g(X)!. En particulier tout facteur 
irréductible de f divise g. Un facteur irréductible de f serait donc à la fois dans f et dans g et 
donc deux fois (au moins) dans @, parce que fg divise 9,. Dans un corps de décomposition de ce 
facteur, d, aurait une racine double, alors que ce n’est pas le cas. Contradiction. Nous concluons 


que f = g. 


Le corolaire suivant va être utilisé pour déterminer les polygones constructibles à la règle et au 


compas, théorème de Gauss-Wantzel 19.87. 
CorKRTooTJtyvP 


Corolaire 19.24. 
Soit p un nombre premier et à un entier non nul. Nous posons q = p°*. Alors le polynôme minimal 
de e27/4 sur Q est le polynôme cyclotomique Pa- 


Démonstration. Le polynôme ©, est irréductible par la proposition 19.23, il est unitaire par défini- 
tion et contient le monôme X — e2i7/4, donc il est annulateur. Annulateur, irréductible et unitaire, 
la proposition 6.81(2) en fait le polynôme minimal de e?!7/1, 


ThojCJpFW 
Théorème 19.25. 
Soit P € ZÏX] un polynôme unitaire irréductible non constant tel que toutes les racines dans © 
soient de module < 1. Alors, soit P = X, soit P est un polynôme cyclotomique. 


Démonstration. Le polynôme P = X vérifie les conditions. Pour la suite, nous supposons que 
P ZX. 

Nous notons P = Y,a;X°. Étant donné que P est irréductible et différent de X, nous avons 
ao À 0 (sinon x = 0 serait une racine). Nous allons montrer que les racines de P sont toutes des 
racines N-ièmes de l’unité (avec le même N pour toutes). 
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Soient {&};-1....4 les racines de P; on a 
d 
P=][(X-&) (19.60) 


avec [Le & = ao. Par hypothèse, |é;| < 1 et donc 0 < |ap] < 1. Puisque P € Z[X] nous avons 
donc ap = 1 et [é;| = 1, pour tout 1. 
Nous introduisons les polynômes 


d 
ga(X) = [ [(X - (6), (19.61) 


i=1 
et en particulier g; = P, et nous développons 


9g(X) = X° + Ci gX + + Cnq (19.62) 


Get) À Gmé (19.63) 


1<i1<...<ir Ld 
Nous introduisons aussi les polynômes 
His) À, Gus (19.64) 
1<i1<...<ir <d 


qui sont des polynômes symétriques. Ils vérifient deux propriétés. La première est que 


Org = Fr,g(é1:-. ,ên); (19.65) 
et la seconde est que les polynômes F, 1 sont les polynômes symétriques élémentaires à un coefficient 
près. Le théorème 6.179 nous donne alors des polynômes Gx,4 € Z[X1,..., XA] tels que 

Faye a) = Gale ne ess Al). (19.66) 


Nous savons que 
d 
ide DS ( ) (19.67) 
1<i1<...<iy <d 


Donc g, fait partie de l’ensemble fini des polynômes dans Z{q] dont tous les coefficients sont bornés 


en valeur absolue par 
d 
: 19. 
Quax” o (19.68) 


Il existe un certain nombre d’ensembles {£;} qui sont racines de polynômes vérifiant les conditions 
du théorème. À chacun de ces ensembles est associé une suite de polynômes g4 et donc des coeffi- 
cients Cx,4- Ce que nous avons vu est que l’ensemble de tous les coefficients C4 possibles (pour 
un choix donné des {é;}) est fini, en particulier, comme Ci, = Ÿ;;€{, pour chaque k, l’ensemble 


{£] tel que q € N}. (19.69) 


Par le principe des tiroirs, il existe 1 et q tels que &} = £P. Ici, qi et g2 dépendent de k et nous 
notons Ny = qi — g2; nous avons donc ENr = 1. 
En posant N = ppem(N:,...,Ny), nous avons 


M =1 (19.70) 


pour tout k. 

Mais P est irréductible dans Z[X]; si il a +1 comme racines, alors c’est que P = X + 1 ou 
P = X —1et ce sont des polynômes cyclotomiques. Si P n’a pas +1 parmi ses racines, alors P n’a 
pas de racines dans Q parce que +1 sont les seules racines de XV — 1 dans Q. 

Par conséquent P est un facteur irréductible de XV — 1 dans Q[X]. Mais étant donné que 


XV —1= [[ ax), (19.71) 
diN 


les polynômes cyclotomiques sont les seuls facteurs irréductibles de XV —1. Donc P est un polynôme 
cyclotomique. 
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19.3.2 Nombres premiers 


LemiAqLEn 
Lemme 19.26 ([546]). 
Soit n > 1. Îl existe un nombre premier p et un entier a tels que 
(1) p divise n(a), 
(2) p ne divise aucun de a(a) avec d|n etdÆn. 
De tels p et a vérifient automatiquement 
(1) p divise a" —1, 
(2) p ne divise aucun des aŸ— 1 pour d |n, d£n. 
Démonstration. Nous posons 
B(X) = | [ &a(X), (19.72) 
din 
d£n 


et nous commençons par montrer que ®, est premier avec B. Nous avons X° — 1 = B@,, donc B 
et ®, n’ont pas de racine commune (même pas dans C) parce que ce serait une racine double de 
X"—1. Notons que par définition 19.42, les polynômes cyclotomiques sont scindés (dans €), donc 
en particulier les polynômes ©, et B sont scindés, et donc premiers entre eux, dans € et a fortiori 
dans Q. Par Bézout (corolaire 3.70), il existe U, V € Q[XT] tels que 


Udn + VB=1. (19.73) 


Si nous prenons a € Z tel que U’ = aU et V’ = aV soient tous deux dans Z[X|, alors nous avons 
- 
Doi VR ea, ERA 


égalité dans Z[X]. Quitte à prendre un multiple assez grand de a, nous pouvons choisir a de telle 
sorte que [#,(a)| > 2. Nous prenons alors un nombre premier p divisant 6, (a). 

Montrons que le a et le p ainsi construits satisfont aux exigences. 

Puisque X° — 1 = Bés, si p divise D, (a), il divise automatiquement a” — 1 et donc [a”|, = 1, 
ce qui signifie entre autres que a et p sont premiers entre eux. Évaluons l'équation (19.74) en a : 


U'(a)pn(a) + V'(a)B(a) = a. (19.75) 


Le nombre p ne divisant pas a, mais divisant (a), il ne peut pas diviser B(a) *. Étant donné 
que p ne divise pas B(a), il ne divise aucun des (a) avec d|net dÆ£n. 

Nous passons maintenant à la seconde partie de la preuve. Nous supposons avoir a et p tels 
que p soit un nombre premier divisant d,(a) et tels que p ne divise aucun des dq(a) avec d | n, 
d £ n. Le fait de diviser #,(a) entraine le fait de diviser a” — 1 parce que ®, est un des facteurs 
de X” — 1. Soit maintenant d £ n divisant n; nous avons 


X4-1=] [6e D NO) 


d'|d 


et cela est une partie du produit 


Ï [ #2. (19.77) 


din 
d£n 


Puisque p ne divise aucun des @4(a) de ce dernier produit, a fortiori, il ne divise pas le produit 19.76, 
et donc pas a — 1. 


LemrZnmpG 
Lemme 19.27. 
Sin > 1, alors il existe un nombre premier dans [1],, c’est-à-dire un nombre premier de la forme 
1 + kn avec ke N\{0}. 


14. C’est pour pouvoir dire ça que l’on a choisi V' € Z[X] de telle sorte que V'(a) soit dans Z 
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Démonstration. Soient n > 1 et p,a les nombres donnés par le lemme 19.26. Puisque p divise 
n(a), p divise a" — 1 et donc [a], à un ordre qui divise n dans (Z/pZ)\{0} parce que [a], = [1],. 
Prenons d £ n divisant n. Nous savons que 


af—1=]] (a). (19.78) 


d'|d 
Par construction de a et p, nous avons 


[84 (a)]p # 0 (19.79) 


Comme Z/pZ est intègre, le produit est également non nul, c’est-à-dire 


[TT (al, # 0, (19.80) 


et donc [a], Æ 1. Nous avons donc montré que si d  n divise n, alors nous avons en même temps 


[a]} =1 (19.81) 
et 
A (19.82) 


Cela prouve que [a], est d’ordre exactement n. Oui, mais l’ordre de [a], doit diviser l’ordre du 
groupe Z/pZ qui est p — 1, donc n divise p — 1 et nous écrivons p = kn + 1 avec k entier. 
ThoxwTjcl 


Théorème 19.28 (Forme faible du théorème de Dirichlet [112]). 
Pour tout n > 1, dl existe une infinité de nombres premiers dans [1]à. 


Démonstration. Le lemme 19.27 nous donne déjà l'existence de nombres premiers dans [1],. Il faut 
maintenant voir qu’il y en a une infinité. Nous supposons qu’il y en ait seulement un nombre fini : 
P1::-.:Pr, et nous notons 

N = np1...Dr. (19.83) 


Nous utilisons maintenant le lemme 19.27 avec ce N, c’est-à-dire qu’on a un nombre premier de la 
forme 
p=l+kN =1+knp1...pr. (19.84) 


C’est un nombre premier plus grand que tous les p;, et de la forme 1 + An. Cela contredit l’exhaus- 
tivité de la liste p1,...,pr. 


19.4 Corps finis 


SecCorpsFinizkAcbsS 
Si vous cherchez des choses à propos de RSA, c’est à la section 19.2. 


19.4.1 Théorème de Wedderburn 


Théorème 19.29 (Théorème de Wedderburn[163]). 
Tout corps fini est commutatif. 


ThoMncIWA 


Démonstration. Soit K un corps fini et Z, le centre de K. Ce dernier est un corps fini et un 
sous-corps de K. Si q = Card(Z) alors par le lemme 6.58 nous avons 


Card(K) = g" (19.85) 


pour un certain n. 
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Nous supposons maintenant que IK est non commutatif. Dans ce cas Z Æ K et nous avons 
n > 2. Nous considérons aussi 


Zx = {ae K tel que ar = xa}. (19.86) 
Le centre Z est un sous-corps de Z,, donc il existe d(x) tel que 
Card(Zz) = qd). (19.87) 
De la même manière, Z, est un sous-corps de K, donc il existe m(x) tel que 
Card(K) = Card(Zr)"(®). (19.88) 
En mettant bout à bout, nous avons 
qg® = Card(Z,)7®) = gén), (19.89) 


et par conséquent n = d(æ)m(x). Le point important à retenir est que d(x) divise n pour tout 
ze K. 
Nous considérons maintenant l’action adjointe du groupe K\{0} sur lui-même : 


o(k)z = kxk 1. (19.90) 
Nous notons ©, l'orbite de x € K\{0} pour cette action, et Fix(x) son stabilisateur. Nous avons 
Zy = Fix(y) L {0} (19.91) 


parce que Z, et Fix(y) ont les mêmes définitions, sauf que Fix(y) est dans K\{0} alors que Z, est 
dans K. Nous avons donc 


Card (Fix(y)) = Card(Z,) — 1 = qi) 1. (19.92) 
Nous avons équivalence des affirmations suivantes : 
— Card(Oz) = 1 
— O, = {x} 
— Fix(x) = K\{0} 
— xe Z\{0}. 
Soient z0,...,24-1 les éléments de Z avec z0 = 0. Ce sont les éléments qui auront une orbite réduite 


à un point. Les orbites qui coupent Z\{0} sont 


ER Ne B (19.93) 


et il y en a g—1. Soient O,,,...,0,,, les autres orbites. Nous utilisons l'équation des classes (2.78) : 


T K* 
Card(K*) = Card(Z*) + Ÿ _— (19.94) 
i=1 


ard(Fix(yi))" 


mais Card(Z*) = q—1, Card(K*) = g" — 1 et Card ( Fix(y;)) = qi) — 1, donc 
L gi E 
q = G-D+ Der 9.08) 


Nous considérons la fraction rationnelle 


F(X) = (X" 1) . _ EqArgein 
i=1 
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Étant donné que d(yi) divise n, nous avons, contrairement aux apparences, F € Z[X|, par la 
proposition 19.21(1). 

Nous pouvons exploiter un peu mieux la proposition 19.21 en remarquant que d(y;) < n parce 
que sinon Card(Z,,) = Card(K), ce qui signifierait que y; € Z, ce qui nous avions exclu. Par 
conséquent le polynôme cyclotomique @, divise 


X7 —1 


Se (19.97) 


dans Z[X]. Le polynôme cyclotomique ®,, divise également X” — 1 et par conséquent ®, divise F. 
Il existe donc Q € ZÏX] tel que F = Q@pn. En particulier en évaluant en q : 


F(g) = Q(g)bn(g) = g— 1. ET OS 


En effet nous avons F(q) = q — 1 par construction : comparer (19.95) avec (19.96). Évidemment 
q Æ 1 parce que si q = 1 alors Card(K) = 1 et le théorème est trivial. Par ailleurs Q(q) est un entier 
(parce que Q € ZÏX] et ge N) et Q(q) Æ 0, parce qu’à droite de (19.98) nous avons q — 1 # 0. 
Nous avons donc |[Q(q)| > 1 et donc 


[Pn(g)| < q — 1. (19.99) 

Par définition du polynôme cyclotomique nous avons 
\n(g)l = [[ la - 21. (19.100) 

ZEAn 


Étant donné que ce produit doit être inférieur à g— 1, au moins un des termes doit l’être : il existe 
2 € À, tel que [20 — q| < q — 1. Étant donné que n > 2 nous avons 20 # 1. 

Mais d’autre part, comme indiqué sur la figure 19.1, la distance entre z0 et q doit être strictement 
plus grande que q— 1 parce que qg— 1 est le minimum de la distance entre le cercle trigonométrique 
et q, et n’est atteint qu’en z = 1. 


20 


CIN. 


FIGURE 19.1: Nous devons avoir |20 — q| > q — 1. LabelFigtrigoWedd 


Nous avons ainsi obtenu une contradiction, et nous concluons que le corps K est commutatif. 


19.4.2 Existence, unicité 


Nous avons déjà défini le corps fini F, lorsque p est un nombre premier dans la section 6.1.3. 
Le théorème suivant sert à définir F,» lorsque p est premier. 
ThoOUzgSfy 
Théorème 19.30. 
Soit p un nombre premier, soit n € N\{0} et q = p". Alors il existe un unique corps K de cardinal 
g. Ce corps est le corps de décomposition du polynôme X1 — X sur F,. 


Démonstration. Montrons l’unicité. Soit K un corps fini de cardinal q = p”. Le groupe multiplicatif 
K* est de cardinal q — 1, et par le corolaire 2.14 tous les éléments de K* vérifient gl = e, c’est- 
à-dire que dans K[X|, les éléments de K* sont des racines du polynôme 


Ai (19.101) 
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Par conséquent K est un corps de décomposition pour le polynôme Q(X) = X1—X = X(X9-1-1) 
parce que Q(X) = 0 dans K. Il est unique par la proposition 6.144. 

Montrons maintenant que le corps de décomposition de P = X1— X sur F, est un corps de 
cardinal q. Pour ce faire nous considérons K ce corps de décomposition, et E, l’ensemble des racines 
de P dans K. Nous allons montrer que E = K et que E est un corps contenant q éléments. 

Montrons que IE est un corps. Pour «, $ € E nous avons 


(ap) = «181 = ap (19.102) 


parce que aŸ = «. Le produit «6 est donc encore dans E. Pour la somme, 


n—1 


(a+ 8) = (a+ 8)" = ((a+8)) = (a+ 8) 


n—1 


=.-=o@" +8 =a+8. (19.103) 


En ce qui concerne l’inverse, 
(a) = (a) = a. (19.104) 


Donc E est un corps. Évidemment E est un corps de décomposition de P au sens où E est une 
extension de F, sur lequel P est scindé (parce qu'il est scindé sur K et E est le sous-corps de K 
contenant les racines de P) et tel que E = F,({a}) où les a; sont les racines de P. Notons que 
F,CE parce que dans F, on a 21 = x. 

Par unicité, nous avons K = IE. Nous devons montrer que P possède exactement q racines 


+ 


distinctes, afin d’avoir Card(E) = q. Pour cela remarquons que 


P{X)= 9x1 1-1 (19.105) 


dans F,. En effet P e F, et q = 0 dans F,. Par conséquent P”’ ne s’annule pas et P n’a pas de 
racine double. Toutes les racines étant simples, il y en a exactement q. 


Le théorème 19.30 ne permet pas de construire le corps à g = p” éléments. Nous allons main- 
tenant voir un certain nombre de résultats donnant des façons de le construire. Ces résultats 
proviennent de [547, 548, 549] et de wikipedia 

Propnfebjl 
Proposition 19.31 ([549)). 
Soit K un corps fini. Alors le groupe multiplicatif K\{0} est cyclique. 


Démonstration. Soit K un corps ayant q éléments. Le groupe K\{0} en à q — 1; ergo l’ordre des 
éléments de K\{0} sont des diviseurs de q — 1; c’est le corolaire 2.14. Soit d un diviseur de q —1 
et 


H4\{0} = {x d'ordre d dans K\{0}} (19.106a) 
Ha = {racines de X% — 1 dans K}. (19.106b) 


Ici le polynôme X4 — 1 est vu dans K[X]. Notons que nous avons automatiquement H7 € Ha, 
mais l'inclusion inverse n’est pas assurée parce que les éléments d’ordre d/2 par exemple sont aussi 
dans A4. Supposons HŸ ZÆ @ et considérons a € HŸ. Alors l’application 


: Z/dZ — Ha 


ne a” 


(19.107) 


est un isomorphisme d’anneaux. En effet étant donné que a € HŸ € H4, l’ensemble Hy contient le 
groupe cyclique engendré par a. Ce dernier contient, par construction, d éléments. Mais Card(H}) < 
d parce que Hy est l’ensemble des racines d’un polynôme de degré d. Par conséquent Card(H) = d 
et l’ensemble H, est bien engendré par a et ® est bien un isomorphisme. Par conséquent tous les 
éléments de HŸ sont des générateurs de Ha. 

Inversement soit x un générateur de H}. L'ordre de H} étant d, l’ordre de x doit être un diviseur 
de d. Supposons donc que x soit d'ordre d/k. Dans ce cas nous devrions avoir Card(H3) = d/k, ce 
qui contredit l’isomorphisme @. 
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En conclusion, HŸ est l’ensemble des générateurs du groupe H. Le nombre de générateurs de 
Z/dZ, étant (d) par la proposition 5.40, et Ha étant isomorphe à Z/dZ nous avons 


Card(HŸ) = yp(d). (19.108) 


Par conséquent si HŸ n’est pas vide, son cardinal est @(d). Nous avons 


q — 1 = Card(K*) (19.109a) 
= Card( [] Hÿ) (19.109b) 
d|q—-1 
_ > Card(H}) (19.109c) 
d|q—1 
< D p(d)=aq-1 (19.109) 
d|q—-1 


où nous avons utilisé la proposition 5.37. Par conséquent pour tout d divisant q — 1 nous avons 
Card(H#) = w(d) et il y a au moins un élément d'ordre q — 1 dans K. Cet élément engendre K* 
parce que K* contient exactement q — 1 éléments. Par conséquent K* est cyclique. 


CorpRÜndR 
Corolaire 19.32. 
Si p est un nombre premier, alors 


(Z/pZÿ* = Z/(p — 1Z. (19.110) 
L'isomorphisme est un isomorphisme de groupes (abéliens). À gauche multiplicatif et à droite 


additif. 


Démonstration. La proposition 19.31 nous enseigne que le groupe multiplicatif d’un corps fini est 
cyclique et donc isomorphe à un certain Z/nZ. Donc (Z/pZ)* est un groupe cyclique d’ordre p, et 
donc isomorphe à Z/nZ avec n = p— 1. 


Lorsque K est un corps les éléments du groupe K* sont les éléments primitifs de K. 
propQRcUlq 


Proposition 19.33. 

Soit K un corps contenant q éléments. Alors 
(1) x = x pour tout x eK, 
(2) X1-X = TLer(X — 0). 


Démonstration. Le groupe K\{0} ayant q — 1 éléments, ses éléments vérifient a9-! = 1 par le 
corolaire 2.14 et par conséquent a? = aa! = à. 
Soit ae K. Étant donné que a — a = 0, le polynôme (X — a) divise X4— X dans K[X]. Par 
conséquent 
[IX -0) (19.111) 
acK 
divise également X%— X. Les polynômes X4-— X et [ [,-:K(X — a) étant deux polynômes unitaires 
de même degré, le fait que l’un divise l’autre montre qu'ils sont égaux. 


Une conséquence de x? = x est qu’il ne faut pas considérer le théorème 6.110 trop rapidement en 
disant « s’il s’annule partout, alors c’est le polynôme nul ». En effet dans un corps fini, « partout » 


n’est pas forcément très grand. 
exVQBooBMPLkD 


Exemple 19.34. 
Si F3 = Z/3Z est le !* corps à 3 éléments, alors le polynôme P(X) = X° — X s’évalue à zéro pour 
tout x € F3 (proposition 19.33.) mais il n’est pas le polynôme nul. A 


15. Le singulier est justifié par le théorème 19.30, mais ça n’a pas d'importance ici. 
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19.4.3 Symboles de Legendre et carrés 


Source : [550]. 
Nous disons que a € F, est un carré si il existe be F, tel que a = b?. 


Définition 19.35. 
SoitneN et p > 2 un nombre premier. Le symbole de Legendre est défini par 


si p divise n 


n 
(2) = 41 sin est un carré dans F, (19.112) 
—]1 sinon. 
Note : —1 peut être un carré, et pas que dans C. Par exemple dans F5 nous avons 4 = —1 et 
donc —1 est un carré. 
PropcGsJjk 


Proposition 19.36. 
Soit un nombre premier p > 2. Le corps FŸ contient autant de carrés que de non carrés. De plus 
pour tout n e N nous avons 


() = n6-1/2 mod p. FeRÇAESS) 


P 
Démonstration. Nous considérons l’application 


V: FF 


ze r?. 


(19.114) 


C’est un morphisme de groupes multiplicatifs et kerd = {—1,1)}. Étant donné que p > 2, nous 
avons alors 


Card(ker d) = 2 (19.115) 


parce que 1 # —1. Évidemment l’ensemble des carrés dans F est l’image de +. Le premier théorème 
d’isomorphisme 2.6(3) nous permet alors de conclure que 


Card(F;) 


Card(Image(4#)) = 5 


(19.116) 
Ceci prouve la première assertion. 

Par le petit théorème de Fermat (théorème 6.15), nous avons x?! = 1 pour tout x € F;. Les 
(p — 1) éléments de F% sont donc tous racines d’un des deux polynômes 


x(@-D/2 2 +1. (19.117) 


Mais chacun des deux ne peut avoir, au maximum, que (p — 1)/2 solutions. Ils ont donc chacun 
exactement (p — 1)/2 racines. 

Nous pouvons maintenant prouver la formule (19.113). D’abord si n = 0, elle est évidente. Si 
nest un carré dans F,, nous posons n = x? et nous avons 


Pom RE nee (2) ; (19.118) 
D 


Si n n’est pas un carré, c’est que n n’est pas une racine de X(P-1/2 = 1, Le nombre n est alors 
une racine de X®P-1)/2 2 1, Nous avons alors 


ne = 1 = (2) (19.119) 
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CoruJosNz 


Corolaire 19.37. 
Si a,beN et si p > 2 est un nombre premier, alors 


Dao) aan 


Démonstration. Par la formule (19.113), 


(=) » (ab)P-1)/2 = aP-1)/2p(-0/2 (2) (°) . (19.121) 
p pP p 


Soit un nombre premier qg > 2 et À, un anneau de caractéristique p. Si à € À vérifie 


1+a+...+a11=0, (19.122) 


nous définissons la somme de Gauss par 


r= (£) a = > (2) æ. (19.123) 


xeF3 


Notons que la somme de Gauss dépend de g et du a choisis. 
PropciRUov 


Proposition 19.38. 
Les sommes de Gauss vérifient les propriétés suivantes. 


Hire () g. Nous allons noter e(q) = (2). 


(2) Si À est de caractéristique p > 3 et si p Æ q alors 


P = (2) . ‘40 85 


q 
(3) Si À est de caractéristique p et si q est premier avec p, alors T est inversible dans À. 


Démonstration. D'abord nous notons que 
@l—1=(a-1)(1+a+...+at 1) =0 (19.125) 


par définition de a. Nous calculons 


e(g)r?=e(g) (2) (2) a+v (19.126a) 


_ 5 (=) a. sat 
5 3 (Ce ps 
_ . . Anse 


Justifications : 
— Pour obtenir (19.126b) nous avons utilisé le corolaire 19.37. 


— (19.126c) est un changement de variable z = x + y dans la somme sur #. 
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— Pour (19.126d) nous avons posé 
= (ex) (19.127) 


Nous avons 


so = (Æ). (19.128) 


vEFq 

Dans cette somme, tous les termes sont égaux à 1, sauf celui avec y = 0 qui vaut zéro. Nous avons 

donc 56 = q — 1. Voyons maintenant s, avec y Æ 0. L'application 
F; — F;\(1} 


(19.129) 
ke l—-z2y 


1 


1 


étant une bijection nous pouvons effectuer le changement de variables t = y "z— 1 pour la somme 


sur y en notant y! l'inverse de y dans F7, nous trouvons alors 


5 (9) =; en) (19.130a) 


veF 4 1 veF 7 


»; (= :) (19.130b) 


= (:) (19.130c) 
FA \T 


L > (2) () (19.130) 


= —] (19.130) 


parce qu’il y à autant de carrés que de non carrés dans F? (proposition 19.36). En résumé nous 
avons 


e(g)r? - ÿ 5,07 (19.131) 
z€F; 
où 
—1 siz=0 
= É AH (19.132) 
—1 sinon. 
Cela donne 
e(q)r? = (qg—1)—(a+...+ a”) = ÿ (19.133) 
—————— 


=] 


où nous avons utilisé l'hypothèse sur a. Donc e(g)r? = q, et étant donné que e(q) = +1 nous 


concluons 


Tr? = e(q)q. (19.134) 


Nous prouvons maintenant la seconde partie. Comme À est de caractéristique p, en utilisant 
le fait que le morphisme de Frobenius est un morphisme, 


F D 
T TL 
DENT AE) (2) a? 19.135 
Di 2eF, I | 


Étant donné que ( ) — +1 et que p est impair, nous avons 


2-0 rs 


z 
q 
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OC ar 


xeF» 


Du COUP nous avons 


Mais p étant inversible dans F,, l’application x > px est une bijection et nous pouvons sommer 


sur px au lieu de x : 
() 2) (£) Æ=7r (19.138) 
q xeF» À 


P = (£) ” (19.139) 


q 


Nous trouvons alors que 


Étant donné la formule du r? que nous venons de démontrer, nous avons 7? = +q. Les nombres 
p et q étant premiers entre eux, le théorème de Bézout (théorème 1.229) nous donne a et b tels que 


ap + bg = 1. (19.140) 


Cela montre que b est un inverse de g modulo p. Donc Tr? est inversible, et il en découle que 7 
lui-même est inversible. 


ThoMiEiUm 
Théorème 19.39 (Loi de réciprocité quadratique). 
Soient deux nombres premiers distincts p,q > 3. Alors 


(?) Et —e — (2) | (19.141) 


Démonstration. Soit @, le polynôme 1 + X +:-:+ X9-l et l'anneau 
À = F,[X]/(64). (19.142) 


C’est un anneau de caractéristique p parce que son unité est le polynôme constant 1. Nous nommons 
a = X/(@a), c'est-à-dire que (a) = 0 dans À, et nous pouvons considérer la somme de Gauss 


T = à (i) a. (19.143) 


Notons que ceci est un élément de À et plus précisément un polynôme de degré zéro dans A, 
et encore plus précisément, une classe d’un tel polyôme. Donc les coefficients de « doivent être 
compris comme des éléments de F,. Nous savons (proposition 19.38) que 


2 (=) | (19.144) 


et en utilisant la formule (19.113) nous trouvons 


2 
(=) ep ob À mods (19.145) 
D 


En réalité sur cette dernière ligne, nous ne devrions pas préciser le & modulo p » parce que, comme 
mentionné plus haut, ce sont des éléments de F,. En utilisant cela, ainsi que (19.124), nous avons 


EC) = = (2) T (19.146) 


Puisque 7 est inversible, nous écrivons 


-0 ar 


19.4. CORPS FINIS 1713 


Nous utilisons maintenant la formule (19.113) sur le membre de gauche avec n = Tr? = (=) : 


ONCRO) ss 


Toujours avec la même formule nous pouvons substituer (+) par (—1)(4-1/2 et obtenir 


(2) he. (19.149) 


Lemoabzrn 
Lemme 19.40. 
Si p est un nombre premier p > 3, alors le symbole de Legendre x — (2) est l’unique morphisme 


non trivial de F5 dans {—1,1}. 


Démonstration. Le fait que le symbole de Legendre soit non trivial est simplement le fait qu’il y ait 
des carrés et des non carrés dans F? ; voir la proposition 19.36. Pour l’unicité, soit a: F5 — {—1,1} 
un morphisme surjectif (c’est-à-dire non trivial). Étant donné que 
F> = ker(a) L — ker(a), (19.150) 
le groupe FŸ/ker(a) ne contient que deux éléments : [1] et [—1]. Autrement dit, ker(æ) est d'indice 
2 dans F?. 
Or F,\{0} ne possède qu’un seul sous-groupe d’indice 2. En effet soit S un tel sous-groupe et a, 
un générateur de F,\{0} (qui est cyclique par la proposition 19.31), alors a? € S par le lemme 3.29. 
Par conséquent S contient le groupe des puissances paires de a. Le groupe $ ne peut rien contenir 
de plus parce qu’il est d'indice 2 et que l’ordre de F,\{0} est pair. 
Bref, le sous-groupe ker(a) est l’unique sous-groupe d'indice 2 dans F,\{0}. Mais la proposi- 
tion 19.36 nous indique que |(F,\{0})?| = c’est-à-dire que le groupe des carrés est d’indice 2. 


Nous avons donc, par l’unicité, 
ker(a) = (F,\{0})?°. (19.151) 


Au final, pour y e F,\{0}, 


1 si y est un carré 
a(y) = . (19.152) 
—]1 sinon. 
Ce qui est bien la définition des symboles de Legendre. 
PROPooCLEUooHWnoXM 


Proposition 19.41. 
Si p est un nombre premier, nous avons 


(°) L : si pe [1]s ou pe [7]s (19.153) 


—1 sinon. 


Démonstration. Soit le polynôme 
X*+1eF,[X] (19.154) 


et à, une racine dans une extension !° de F, {7. Nous posons 0 = à + «1! et nous calculons 


P=(a+ta tata = +2+() = +2-0=2 (19.155) 


parce que a+ étant —1, nous avons (a?) ! = —a?. Bref, 0? = 2. 


à 


16. Dans la source que je suivais (je ne sais plus où), on parlait ici de « fermeture » de F, et non d'extension. Il me 
semble que parler simplement d'extension suffit. Vous confirmez ? 
17. Voir par exemple la proposition 6.141 pour l’existence d’une extension comme il faut. 
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Dire que 2 est un carré modulo p revient à dire que est dans F,,. C'est-à-dire que pour calculer 


le symbole de Legendre ( 2). nous étudions pour quels p, l'élément 0 est vraiment dans F, et non 


seulement dans l'extension F,(a). En tenant compte de l’exemple 6.96, il faut distinguer deux cas : 
= a et a? # a. Autrement dit, si a = à pour un certain nombre premier k, alors le cas p = k 
est à traiter à part. La liste des puissances de @ est : 


2 


Lho,a.=l-men, 0, L 0. (19.156) 


Nous avons donc automatiquement ak — a, mais p = 9k est exclu parce que p est premier. Nous 
devons donc vérifier si une des propriétés 


= à (19.157a) 
a (19.157b) 
ee. (19.157c) 
où = à (19.157d) 


est possible. Il est aisément vérifiable, au cas par cas, que ces possibilités sont toutes incompatibles 
avec a? = —1. Nous avons donc certainement & £ @ et compte tenu de l'exemple 6.96, l'équation 
x? = x caractérise les éléments de F, dans F, (a). 

L'équation X? = 2 a exactement deux solutions qui sont +0. Nous avons donc 2 € F° si et 
seulement si Ÿ € F, si et seulement si @ = 0. Nous avons réduit notre problème à déterminer pour 
quels p nous avons #P = 0. D'abord nous avons, par le morphisme de Frobenius, 


P=(a+a!ÿ = @+aP. (19.158) 


Nous pouvons maintenant conclure facilement. Un nombre premier étant impair (sauf p = 2 qui 
peut être traité à part), p est automatiquement dans un des ensembles [1]8, [3]8, [5]s ou [7]8. Nous 
avons quatre petites vérifications à faire. Dans tous les cas a = 1. Si p = 1 + 8k, alors 


8 = alt to DE Loto te, (19.159) 


donc 2 est un carré dans F,. Si p € [3]s, alors @ = a + «7%. Si cela était égal à à + a}, alors 
nous aurions 
+ 1 = à* + ao, (19.160) 


et donc a? = 1, ce qui est impossible. Les vérifications pour p € [5ls et p € [7]s sont du même 
style. 


19.4.4 Théorème de Chevalley-Warning 


Lemme 19.42. 
Soit K un corps de caractéristique p et de cardinal q. Pour m € N nous définissons 
ae per. (19.161) 
xeK 


Alors nous avons 


—1 sim > 1 etm divisible par q —1 


Sn mod p = (19.162) 


0 sinon. 


Démonstration. Si m = 0, alors 2° = 1 et S,, = q. Par conséquent $,, mod p = 0 parce que la 
caractéristique d’un corps divise son ordre (proposition 1.346). 

Nous prenons maintenant m > 1 et nous voyons séparément les cas où q — 1 divise m ou non. 
Si q — 1 divise m, alors pour tout x Æ 0 nous avons 


a = (1) 7 (19.163) 


19.4. CORPS FINIS 1715 


parce que K\{0} est cyclique et 3971 = 1 par le petit théorème de Fermat (théorème 6.15). Par 


conséquent nous avons 
Date ÿ. di=get (19.164) 
xeK xeK\{0} 


Si le nombre m > 1 n’est pas divisible par qg — 1 alors nous prenons un générateur y du groupe 
K\{0}. Un tel élément vérifie y” Æ 1. En effet, si y vérifiait y” = 1 alors cela signifierait que 
l’ordre de K\{0} est un diviseur de m, ce qui n’est pas le cas ici, parce que l’ordre de K\{0} est 
q — 1. Pour un tel y, l’application 

g: K\{0} — K\{0} 


Tr YX 


(19.165) 


est une bijection !°. En ce qui concerne l’injectivité, ya = yb implique a = b. En ce qui concerne la 
surjectivité, si a est un générateur, si z = a! et si y = a*, alors 


z = q(alÀ), (19.166) 
Nous pouvons maintenant poser le calcul. 


>, = D NPD >, eye: (19.167) 


xeK\{0} xeK\{0} zeK\{0} 


Étant donné que y” 1, la seule solution est S,, = 0. 


ThoLTcYKk 
Théorème 19.43 (Chevalley-Warning{551]). 
Soit K un corps fini de cardinal q et de caractéristique p. Soient P1,...,P,. des éléments de 
K[X:1,...,X,] tels que D_. deg(P;) < n. Nous considérons l’ensemble des zéros communs à tous 
les polynômes : 
= {re K” tel que Pi(x) =... = P,(x) = 0}. (19.168) 
Alors Card(V) = 0 mod p. 
Démonstration. Nous considérons le polynôme 
P = [lu — pat) (19.169) 
Montrons que 
1 sitveV 
P(x) = Fe (19.170) 
O0 sinon. 


La première ligne est facile : étant donné que tous les P;(x) sont nuls pour x € V, nous avons 
P(x) = 1. Si x n’est pas dans V, alors nous avons un à tel que P;(x) € K\{0}. Mais dans ce cas 
(toujours la cyclicité de K\{0}) nous avons P,(x)%! = 1 et donc le produit est nul. 

En utilisant l'hypothèse sur le degré des P;, nous trouvons 


TA: 


deg(P) = ÿ» (q — 1) deg(P;) < n(q — 1). (19.171) 


i=1 


Pour un polynôme Q € K[X1,..., Xh]|, nous définissons 


Je 0) (19.172) 
æzeK” 


18. Notons que nous n’avons pas réellement besoin que y soit un générateur. Nous n’utilisons seulement le fait que 
mm 
y" let y #0. 
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Nous avons immédiatement 


Jr = Ÿ P(x)= D) 1=Card(V) mod p. (19.173) 


Nous insistons sur le « modulo p » parce que dans la formule P(x) = 1, le membre de droite est le 
1 de K ; il est donc automatiquement modulo la caractéristique de K. 
Il nous reste à prouver que { P = 0. Pour cela nous décomposons 


Ph GA ann FAO Va) 


où la somme s'étend sur les m € N” tels que €, # 0. Nous avons 


[r- D DO ee (19.175a) 


zeK® m 

= Ye | DIE de #) (19.175b) 
m xeK" 

D (19.175c) 


Le terme de plus haut degré dans la décomposition (19.174) est celui du m tel que Ÿ;; m; est le plus 
grand. Comme ce degré est plus petit que n(q — 1), pour chacun des m rentrant dans la somme, 
nous avons 


nm 
Dm < n(g—1). (19.176) 
i=1 
En particulier pour tout m e N°”, il existe à tel que m; < q — 1, et dans ce cas S$», = 0. Donc tous 
les termes de la somme 


À Ghohtr (19.177) 


meN? 


ont un facteur nul. 


CorfuHNKz 
Corolaire 19.44. 
Soit P; des polynômes à n variables avec Y_. deg(P;) < n. Si les P; n’ont pas de terme constant, 
alors ils ont un zéro commun non trivial. 


Démonstration. Nous reprenons les notations du théorème 19.43. Étant donné que les P; n’ont 
pas de terme constant, 0 € V, mais Card(V) = 0 mod p. Par conséquent nous devons avoir 
Card(V) > p. 


Exemple 19.45. 
Nous considérons les polynômes 


Pix, y,t,u) = xy+x+ur (19.178a) 
Pa(x,y,t,u) = x + y—3t. (19.178b) 


La somme de leurs degrés est 3 et ce sont des polynômes à 4 variables. Nous devons donc avoir, 
en vertu du corolaire 19.44, d’autres racines que la racine triviale (x,y,t,u) = (0,0,0,0). 

Le corolaire nous donne aussi une borne inférieure du nombre de racines à chercher : plus que la 
caractéristique du corps sur lequel nous travaillons. Nous pouvons dire cela sans avoir la moindre 
idée de la façon dont on pourrait résoudre le système P, = P2 = 0. PA 
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19.4.5 Contenu d’un polynôme 
LemHULrVaF 


Lemme 19.46 (de Gauss[103, 552]). 
Soient P,Q € ZÏX]. Alors 


c(PQ) = c(P}c(Q) (19.179) 


où c est le contenu, définition 3.110. 


Démonstration. Afin de fixer les notations, nous posons P = Y;a;X° et Q = D b;Yi. 


(1) Pour les polynômes primitifs 


Nous commençons par supposer que c(P) = c(Q) = 1. Dans ce cas si (PQ) Æ 1, nous 
considérons un nombre premier p divisant c(PQ). Puisque le contenu de P et de Q vaut 1, 
le nombre p ne peut pas diviser tous leurs coefficients. Nous définissons à de façon que a, 
soit le premier à ne pas être divisible par p, et jo de telle façon que b;, soit le premier à ne 
pas être divisible par p. Autrement dit : 


p | ao; D | a1,...,p | CR ER (19.180) 


et de façon similaire pour 39. Donc p ne divise ni a;,, ni b;,. Nous nous demandons alors avec 
malice quel est le coefficient de X*°*70 dans PQ. La réponse est : 


Giobjo + D, by. (19.181) 

i+j=i0 +30 

i<io où j<30 
Par définition p divise soit a; soit b; pour chacun des termes de la grande somme. Comme p 
ne divise pas @&i,0j,, il ne divise pas le coefficient de X'°*70 dans PQ, alors que nous étions 
partis en disant que p divisait tous les coefficients de PQ. 
Nous concluons donc que c(PQ) = 1. 

(2) Cas général 

Si P et Q sont maintenant des polynômes sans condition particulière dans Z[X], nous consi- 
dérons P; = eo et Q1 = © : ces deux polynômes sont primitifs et nous avons alors, en 
utilisant la première partie : 


(PQ) = 1. (19.182) 
Étant donné que . 
PQ: = PQ! Ÿ (19.183) 
nous avons 
c(PQ) = c(P)e(Q)c(P1Q1) = e(P)c(Q). (19.184) 


19.4.6 Théorème de l’élément primitif 


Définition 19.47. 
Soit K un corps. Une extension L de K est dite finie si L est un espace vectoriel de dimension 
finie sur K. 


Notez que la définition d'extension finie ne suppose ni que K, ni que L, soient finis en tant 


qu’ensembles. 
THOooYFLZooHYENKp 


Théorème 19.48 (de l’élément primitif). Si K est un corps fini, toute extension finie de K est 
: 19 
simple —”. 


Si K est un corps quelconque alors toute extension séparable finie est simple. 


19. Définition 6.92. 
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Démonstration. Nous ne donnons la preuve que dans le cas où K est fini. Dans ce cas nous savons 
par la proposition 19.31 que le groupe K\{0} est cyclique. Si de plus L est une extension finie 
alors L est fini en tant qu’ensemble. Par conséquent L\{0} est un groupe cyclique. Si a est un 
générateur de L alors L = K(a) et l’extension est donc simple. 

Une preuve de l’assertion dans le cas où K est infini peut être trouvée sur wikipédia. 


PROPooWNHYooSzMJqF 
Proposition 19.49. 
L'ordre d’un polynôme P vérifie les propriétés suivantes : 
(1) L'ordre de P est l’ordre multiplicatif de ses racines 
(2) L'ordre de P divise p" — 1. 
LemZrUUOz 


Lemme 19.50. 
Soit p un nombre premier et P un polynôme irréductible unitaire de degré n. Si a, B e F,[X]/P, 
alors (a + B)P = ap + BP. 


Démonstration. La preuve est exactement la preuve classique ?? : 


(a+8}P = o DNERT* (19.185) 


k 


où les coefficients binomiaux sont dans F, et donc nuls pour les k différents de p et de 0. 
Cette proposition est encore vraie avec à, 8 € Fr et (a + By". 


Lemme 19.51. 
Si ae F, est une racine d'ordre k de P (de degré n) alors les racines de X*—1 sont {a tel que à = 
Dal) 


Nous serions donc intéressés à construire F, comme quotient de F,[X] par un polynôme 
primitif. Le théorème suivant donne une description abstraite de F, qui va nous servir de point de 


départ pour la construction. 
ThoqSludu 


Théorème 19.52 (Théorème de l’élément primitif). 
Soit p un nombre premier, n E N et q = p". Soit K un corps à q éléments. Alors 


(1) I existe ae K tel que K = F,[al]. 
(2) I existe un polynôme irréductible P e F,[X] de degré n tel que 


: F[XI/(P) — K EqW 
_. au 
soit un isomorphisme de corps. 


Soient à et P choisis pour avoir les propriétés citées plus haut. Alors nous avons les propriétés 
suivantes. 


(1) P est primitif?}. 
(2) P est scindé dans K. 
(3) L'ensemble des racines de P est {a, a, , a" }. 


(4) Le polynôme P divise X1 — X dans F,[X|. 


Démonstration. Le corps K étant fini, il est cyclique par la proposition 19.31. Soit « un générateur 
de K\{0} alors 
K = F,[al. (19.187) 


20. Voir le coefficients binomiaux de la proposition 3.43. 
21. Définition 3.112. 
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Soit £ le plus grand entier tel que l’ensemble 
{l,a,-::,0 Deck (19.188) 


soit libre. Pour rappel, K est un espace vectoriel sur F,. Il existe des a; € F, tels que 


£—1 


o + ago +... + ag = 0. (19.189) 


De façon équivalente, il existe un polynôme unitaire P € F,[X] de degré L tel que P(a) = 0. Étant 
donné que a est générateur de K, 


K = Span{l,a,...,a@ l} (19.190) 


parce que K est généré par les puissances de « alors que les puissances de & plus hautes que { — 1 
peuvent être générées par 1,a,...,at7!. L'espace K est donc un F,-espace vectoriel de dimension 
{; par conséquent 

Card(K) = p* = q (19.191) 


et£=n. 

Montrons que P est irréductible dans F,. Si P était réductible dans F,, l'élément a e K serait 
une racine d’un des facteurs, c’est-à-dire qu'il serait racine d’un polynôme de degré inférieur à n, 
ce qui contredirait le fait que 

(a slt (19.192) 


soit libre. 


Montrons que l’application 
g: F[XT/(P) — K 


19.193 
X+ a 
est un isomorphisme. Pour l’injectivité, deux éléments Q1,Q2 € F,[X]/(P) s’écrivent 
n—1l _. 
Qi= D uœX (19.194a) 
k=0 
n—1l 
Q2= D X. (19.194b) 
k=0 
Dans ce cas si b(Q1) = D(Q2) alors 
n—1l n—1l 
PQ) = D ax0f = p(Q2) = Ÿ° bar. (19.195) 
k=0 k=0 
Mais l’ensemble {1,a,...,a"-!} étant libre sur F,, cela implique ay = b4. La surjectivité de ® 


provient du fait que a génère K. 

Nous passons maintenant à la seconde partie de la démonstration. Soient a € K tel que K = 
F,[a] et P e F,[X] un polynôme irréductible de degré n tel que a + X soit un isomorphisme 
entre K et F,[X]/(P). 

Le polynôme P est primitif parce que @ est d'ordre p” dans K alors que X + a est un 
isomorphisme. Par conséquent X est d’ordre p" dans F,[X]/P. 

Nous commençons par prouver que l’ensemble 


{a, æ, a”, ne Ne F0) 


est l’ensemble des racines distinctes de P. Pour cela nous posons 


P(X) = > ax X* (19.197) 
k=0 
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avec ax € F,. D'abord a est une racine de P. En effet 


PE) = ax" = 0 ERTAREG 


parce que cette somme est calculée dans F,[X]/(P). En appliquant l’isomorphisme ® à l'égalité 
(19.198) nous trouvons 


0 = (P(X)) = D'ab(X") = Y'axa. (19.199) 
k k 


Donc à est bien une racine de P dans F,[X]. Nous devons montrer qu’il en est de même pour 
les autres puissances dans l’ensemble (19.196). Étant donné que pour tout x dans F, nous avons 
x? = x, nous avons aussi 


POP)= Date GT (x (19.200) 
k k k 


alors que nous savons que x + x? est un automorphisme de F, par la proposition 1.348. Par 
conséquent 


p 
P(XP) = D (a XF} = > xt) = P(Xÿ. (19.201) 
k k 
Nous avons montré que si B est une racine de P, alors 6P est également une racine de P. Nous 
savons déjà que « est une racine de P, et que a est également générateur de K, c’est-à-dire que « 
est d’ordre qg — 1. Les puissances 
2 n— 

a, @,a ,..., a (19.202) 
sont donc distinctes (a?" = a = 1) et sont toutes des racines de P. Étant donné que P est de 
degré n il ne peut pas y avoir d’autres racines. Nous concluons que l’ensemble 


n—1 


{a, a, ,...,@" } (19.203) 


est l’ensemble des racines distinctes de P dans K. Le polynôme P est alors scindé dans K[X]. 

Le dernier point du théorème est de montrer que P divise X7 — X. Pour cela nous allons 
montrer que toutes les racines de P sont des racines de X1 — X. Soit B une racine de P: il s'écrit 
8 = a pour un certain k. Étant donné que a! = e = a"— 1, 


81 = (a ÿ* (19.204a) 
= (a°"-1a)" (19.204b) 
= (a la)" (19.204c) 
= of (19.204d) 

B (19.204e) 


Cela signifie que 57 = B et donc que £ est racine de X9 — X. 


Corolaire 19.53. 
Le corps fini à q = p" éléments est de caractéristique p. 


Démonstration. Nous considérons le corps fini K à g éléments sous la forme K = F,[X]/P comme 
indiqué par l'équation (19.186). Soit 1, la classe du polynôme 1 modulo P, nous considérons le 
morphisme 

u: Z—F, 


(19.205) 
nr nl. 


Le noyau de cette application est ker u = Z, parce que pl, = 0, les coefficients étant à comprendre 
dans F,. 
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DefnPNCFO 
Définition 19.54. 
Soient P, un polynôme de degré n, et p, un nombre premier. Un élément a e F,[X]/(P) est une 


racine primitive si les puissances de a parcourent tout le groupe multiplicatif (F,[X]/P)\{0}. 
Lembcerei 


Lemme 19.55. 
Soit p un nombre premier et P, un polynôme de degré n. Si a e F,[X]/P est une racine primitive 
de P alors les autres racines de P sont également primitives. 


Démonstration. Soit a € F,[X]/P une racine primitive de P. L'élément œ est également une 
racine parce que si P = ÿ y Te. Qi 


P(o?) = D {aa} = (5 axa*)? = 0 (19.206) 
k k 


où nous avons utilisé le fait que a} = ax étant donné que ax € F,. Par hypothèse «à est une racine 
primitive ; cela implique que les éléments @,a?,a?°,...,a?"-1 sont distincts dans F,[X]/P. Ces 
éléments constituent donc toutes les racines de P. 

Soit B — a?" une racine de P. Montrons que «a est une puissance de B. Étant donné que 
(F,[X1/P)\{0} est un groupe à p” —1 éléments, le corolaire 2.14 indique que a?” = a. En particulier 


avec 7 = p" * nous avons 


8 = a? = op = à. (19.207) 


Par suite toutes les puissances de « sont des puissances de 5, ce qui implique que B est générateur 
du groupe cyclique (F,[X]/P)\{0}. 


LemkzWjse 
Lemme 19.56. 
Soit p un nombre premier et n, un entier. Un polynôme de degré d, irréductible dans F,[X |, divise 
XP" — X si et seulement si, d divise n. 


Théorème 19.57. 
Soient P et Q deux polynômes irréductibles de degré n dans F,[X]. Alors les quotients F,[X]/P 
et F,[X]/Q sont isomorphes en tant que corps. 


En guise de démonstration de ce théorème, nous allons démontrer la proposition suivante. 
PropCRPjZsp 
Proposition 19.58. 
Si K et L sont deux corps à q = p" éléments, alors ils sont isomorphes. 


Démonstration. Soit a un élément primitif de K et P son polynôme minimal. Nous savons que 
K =F,[X]/P par le théorème de l'élément primitif 19.52. L'élément a est en particulier une racine 
de X7— X. Par ailleurs P divise X1 — X par le lemme 19.56. 
Nous avons aussi 
XX =[[(x-b) (19.208) 
beL 

par la proposition 19.33. Étant donné que P divise X7— X, un des éléments de L annule P. Soit 
be L tel que P(b) = 0. Soit Q le polynôme minimal de b. Par définition nous savons que Q divise 
P, mais P étant irréductible et unitaire, nous avons immédiatement P = Q. En particulier 


F,[X]/P = F,[X]/Q = K. (19.209) 
Nous montrons maintenant que F,[X1]/Q + L par l’application 


6: F[X1/0 + L 


19.210 
XX b 


qui se prolonge en R(X) — R(b) pour tout R € F,[X]. Cette application est bien définie parce 
que Q(b) = 0. Elle est injective parce que R(b) = 0 ne peut pas avoir lieu avec R € F,[X]/Q parce 
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que Q est le polynôme minimal de b. La surjectivité vient alors du fait que les deux corps ont le 
même nombre d'éléments. 


19.4.7 Construction de F» 


Le théorème 19.30 nous indique que, pour tout n € N et q = p", il existe un unique corps 
possédant q éléments. Ce corps est noté F,. 
Le théorème 19.52 nous incite à chercher à écrire F, sous la forme 


F; = F,[X]/(P) (19.211) 


pour un certain polynôme irréductible P € F,[X]. 


19.4.7.1 La version du faignant 


Nous pouvons construire le corps à q = p” éléments en prenant le quotient de F,[X] par 


n'importe quel polynôme irréductible de degré n. Le résultat est le suivant. 
PropHfrNCB 


Proposition 19.59. 
Soit P un polynôme unitaire irréductible dans F,[X]. Nous posons K = F,[X]/(P). Alors 


(1) K est un corps à q éléments. 
(2) a = X est une racine de P dans K. 


(3) K=F,[ol. 


ItemiEFRTg 


Démonstration. (1) En vertu du corolaire 6.44, K est un corps. Il est aussi un espace vectoriel 
de dimension n sur F,, et contient donc p" = q éléments. 


(2) Nous avons P(X) = 0 par construction de K = F,[X]/(P). 
(3) En tant que quotient de F,[X], les éléments de K sont des polynômes en X. 


19.4.7.2 La version plus élaborée 


Construire F, comme quotient de F,[X] par un polynôme irréductible quelconque ne donne 
pas d’information sur les générateurs de F,\{0}, et en particulier il n’est pas toujours vrai que X 
est générateur. 


Exemple 19.60. 
Construisons F4. Le polynôme X? + X + 1 est irréductible dans F2 parce qu’il n’a pas de racine 
(c’est vite vu : dans F il n’y a que deux candidats). Donc F4 = F2[X]/(X? + X +1). A 


Remarque 19.61. 

Le corps F2 n’est pas un sous-corps de € parce que leurs caractéristiques ne sont pas les mêmes. 

Une conséquence est que les racines de polynômes peuvent être très différentes. Par exemple le 

polynôme X? + 1 accepte x = 1 comme racine dans F2 tandis qu’il a pour racines +4 dans C. 
En changeant de corps, les racines peuvent donc complètement changer. Ce n’est pas juste qu'il 


y a des racines dans l’un et pas dans l’autre. 
ExemWUdrcs 


Exemple 19.62. 
Cherchons à construire F16 comme quotient de F2 par un polynôme de degré 4. 


| Sage Version 4.7.1, Release Date: 2011-08-11 | 
| Type notebook() for the GUI, and license() for information. | 


sage: x=polygen(GF(2)) 
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sage: -x-1 

x + 1 

sage: Q=x**15-1 

sage: Q.factor() 

(x + 1) x (x72 + x + 1) x (xT4 + x + 1) * (x74 + x73 + 1) 
+ (x74 + x73 + x72 + x + 1) 


Les polynômes candidats à avoir des racines génératrices sont donc au nombre de 3 : 


P=X+X+1 (19.212a) 
P=X+x8+1 (19.212b) 
Ps=X*+X8+X?+X +1 (19.212c) 


Dans le quotient F2[X]/P3, l'élément X n'est pas générateur. En effet nous avons X4 = XŸ + 
X? + X +1et par conséquent les puissances successives de X sont 


. (19.213a) 
+ (19.213b) 
sd (19.213c) 
PPS rS ee (19.213d) 
1. (19.213e) 


La classe de X dans F2[X|/P3 n’est donc pas génératrice du groupe (F2[X|/P3)\{0}. 
Le polynôme P, = X4+ X + 1 par contre est primitif parce que les puissances de X dans 
F2[X]/P; sont 


x (19.214a) 

x? (19.214b) 

À (19.214c) 

X +1 (19.214d) 

X?+X (19.214e) 

X° + Xx° (19.214f) 

X+14+%X (19.214g) 

X?+1 (19.214h) 

K°EX (19.214i) 

Er re (19.214j) 

X?+X + X$ (19.214k) 

X'eX ex (19.2141) 

12 X74 x? (19.214m) 

1 + XŸ (19.214n) 

1 (19.2140) 

Cela fait 15 puissances distinctes, ce qui prouve que P\ est primitif. Nous verrons plus loin comment 
alléger un peu la vérification de la primitivité de P1. A 
PropNsLqWb 


Proposition 19.63 ([1]). 

Soient un nombre premier p, un entier non nul n € N\{0} ainsi qu’un polynôme P irréductible 
unitaire primitif dans F,[X]. Nous considérons K = F,[X]/P et a = Xe K. En notant q = p" 
nous avons 
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(1) Les racines de P sont {a,a?,... a} et «1 = à. 

(2) P est le polynôme minimal de à. 

(3) P est scindé dans K. 

(4) P divise X1 — X dans K. 

(5) La famille {1,a,a?,...,a"-1l} est une base de K en tant qu’espace vectoriel sur F,. 

(6) En tant qu'ensemble, 

RS CUP A Te (19.215) 
et les a* sont distincts pour k = 1,...,q—1. 

Démonstration. La plupart des assertions sont des corolaires ou des paraphrases de résultats conte- 
nus dans les propositions précédentes. 


(1) L’assertion à propos des racines de P est contenue dans le lemme 19.55. D'autre part le 
groupe (F,[X]/P)\{0} est cyclique d'ordre q — 1. Par conséquent le corolaire 2.14 indique 
que «1! = 1 et donc «7 = a. 


(2) Soit P un polynôme annulateur de a. Nous voyons que si B est racine de P alors BP est 
également racine de P en utilisant les techniques habituelles. Par conséquent toutes les racines 
de P sont racines de P, ce qui implique que P est de degré au moins égal à celui de P. 


(3) Possédant n racines distinctes dans K, le polynôme P est scindé. 


D'après le lemme 19.33 un polynôme irréductible de degré n divise le polynôme XP" — X. 
Une autre façon de montrer ce point est de remarquer que le polynôme P est scindé et que 
toutes ses racines sont également racines de X4 — X. 


TR 
Æ 
nr 


(5) Une combinaison linéaire nulle entre les éléments de {1,a,a?,...,a"-1l} serait un polynôme 
annulateur de degré n — 1 de a. Cet ensemble est donc libre. Par ailleurs un ensemble libre 
de n éléments dans un espace vectoriel de dimension n est générateur. 


(6) Si a! = a" avec k < Let k,1 < q alors nous avons a” = 1 avec r = [—k < q, ce qui contredirait 
la primitivité de P. Les éléments 0, a«,...,a%-1 étant distincts et au nombre de 4, ils forment 
tout l’ensemble F,. 


19.4.8 Exemple : étude de F;6 


Dans cette section nous voulons construire F6. Nous considérons donc p = 2 et n = 4. Des 
polynôme irréductibles de degré 4 dans F2[X] ne sont pas très difficiles à trouver. Par exemple 
XI+XS + X2+ X +1. 

Si vous en voulez d’autres, en voici. 


ii Avertissement /question à la lectrice !! 19.64 


Le lemme suivant me semble douteux. Ecrivez-moi si vous avez une preuve ou un contre-exemple. 
LEMooTBROooANstIL 


Lemme 19.65 ([1]). 
Soit un polynôme de degré 4 dans F2[X]. Si il vérifie 


(1) le terme constant est non nul, 
(2) il y a un nombre impair de termes non nuls, 


alors à est irréductible. 


Les polynômes primitifs par contre, doivent être trouvés parmi les diviseurs irréductibles de 
X15 — 1. Montrons que 


P=X*+Xx%+1 (19.216) 
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est primitif. Nous posons w = X € F2[X]/P. L'ordre de w dans le groupe (F2[X]/P)\{0} doit être 
un diviseur de 15 et donc peut être seulement 1, 3, 5 ou 15. Le fait que l’ordre ne soit ni 1 ni 3 est 
trivial parce que le degré de P est 4. Montrons que l’ordre de w n’est pas 5 non plus : 


9 = Wu = (a + 1jw = + w = +w +141. (19.217) 
Dans ce calcul nous avons abondamment utilisé le fait que —1 = 1. 
À partir de maintenant nous posons K = F2[X|/P. Les racines de P sont w,w 
effet si B est une racine de P, alors 3? est une racine en vertu de 


20 el. En 


P(8?) = (82)* + (82) +1 = (81)? + (85)? +12 = (84 + 8 +1)? = 0. (19.218) 


Ici nous avons implicitement utilisé le lemme 19.50. D'autre part P ne peut pas avoir plus de 4 
racines. 


Proposition 19.66. 


L'ensemble {w,w?,w*,wS} est une base de F6 sur F2. 


Démonstration. Nous savons que {1,w,w?,w} est une base. En effet cet ensemble est libre (sinon 
w aurait un polynôme annulateur de degré 3) et générateur parce que l’espace engendré par 4 
vecteurs indépendants sur F2 contient 21 = 16 éléments. 

Nous posons eo = 1, e1 = w, eo = w?, e3 = u9 et f1 = w, fa = w?, fa = w, fa = w8. En 
utilisant le calcul modulo w? + w° + 1 = 0 et 2 = 0 nous trouvons 


fi =w (19.219a) 
f2 = w? (19.219b) 
fa = w$ +1 (19.219c) 
fa = ui + u? + w. (19.219d) 


Ensuite nous montrons que les vecteurs e; peuvent être construits comme combinaisons linéaires 
des vecteurs f; : 


h+f ++ (19.220a) 
fi=e (19.220b) 

J2 = e2 (19.220c) 

Ji + fo + ja = es. (19.220d) 


Les quatre vecteurs f; forment donc bien une base parce qu'ils sont générateurs d’un espace de 
dimension 4. 


5 


Exemple 19.67. (1) Résoudre dans F6 l’équation x° = a en discutant éventuellement en fonc- 


tion de la valeur de a. 


(2) Montrer qu’il existe quatre éléments + € F16 tels que pour chacun d’eux l’ensemble B, = 
{4,%°,7", 7%} est une base de F16 sur F2 telle que le produit de deux éléments de B, est, 
soit un élement de B,, soit 1. 

C’est parti! 


(1) Si a = 0, alors x = 0 est la seule solution. Si a 0 alors a est une puissance de w; nous 
posons a = w!. Nous cherchons x sous la forme x = w*. L'équation à résoudre pour k est 


SR = (ol (19.221) 
où l est donné. Cette équation revient à 


5k =l mod 15. (19.222) 
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Si { n’est pas un multiple de 5, alors il n’y a pas de solution. Il n’y a des solutions que pour 
l = 0,5,10 et elles sont : 
3,6,9,12 si {—0 
k= 41 si 1=5 (19.223) 
2 si {—10 


(2) Nous cherchons + sous la forme + = w*. Parmi les nombreuses contraintes liées à l'énoncé, 
nous devons avoir 
MP cui 19.224 
9 —=197,:7,:7.: ( : ) 
Les possibilités +° = +,7?,7*,7° ne sont pas bonnes parce qu’elles impliqueraient que B, 
n'est pas une base. Reste à explorer +° = 1. 
Étant donné le premier point, nous restons avec les possibilités 


y = 1,4, w6, w°,wt2, (19.225) 

Évidemment 7 = 1 ne produit pas une base. Avec + = wŸ nous trouvons 
Bd un ut) = {ur furent} (19.226) 

où nous avons utilisé le fait que w* = w* M0d15, En utilisant le fait que wT = w° + 1 nous 
trouvons 

W9 = uw +w +1 (19.227a) 

W6 = 49 + ui? +w +1 (19.227b) 

uw =w?+1 (19.227c) 

WE = 45 +1. (19.227d) 
L'ensemble B, est alors formé des éléments 

hi =4 (19.228a) 

fa = 0 + uw? +w+1 (19.228b) 

f=w+i (19.228c) 

fa = w? +1. (19.228d) 


Il est assez simple de vérifier que c’est une base en remarquant que fi + fo + fo + fa = 1. 


Les possibilités + = w6,w°,wl? produisent les mêmes ensembles B,,. 


A 
19.49  Polynômes irréductibles sur F, 
DefWXBkOxg 
Définition 19.68. 
La fonction de Môbius est la fonction u: N\{0} — {—1,0,1} définie par 
() sin est divisible par un carré différent de 1, 
u(n) = 41 si n est le produit d’un nombre pair de nombres premiers distincts, (19.229) 
—1 sin est le produit d’un nombre impair de nombres premiers distincts, 
PROPooOVYJooFvmxyj 
Proposition 19.69 ([553]). 
Sim et n sont strictement positifs et premiers entre eux, alors 
a(mn) = (m)u(n). (19.230) 


De plus nous avons 


S'u(d) = ' Dis (19.231) 
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PropLBZoloU 
Proposition 19.70 (Formule d’inversion de Môbius[553]). 
Soient f,g: N — € telles que pour tout n > 1, 
g(n) = ÿ_ f(d). (19.232) 


din 


Alors 
f(n) =D n (2) g(d) (19.233) 


où u est la fonction de Môbius pour tout n > 1. 


LemRGuWqNu 
Lemme 19.71 ([554)). 
Soient P,Q € K[X] ayant une racine commune dans une extension L de K. Si P est irréductible, 
alors P | Q. 


Démonstration. Si P ne divise pas Q, alors P et Q sont premiers entre eux parce que dans la 
décomposition en irréductibles de Q, il n’y a pas de P tandis que dans celle de P, il n’y a que P. 
Par conséquent, il existe a,b € K[X] € L[X] tels que ?? aP + bQ = 1. Cette dernière égalité est 
encore valable dans L et donc rend impossible l’existence d’une racine commune. 


PropVFNOvzZz 
Proposition 19.72 ([554, 103]). 
Soit p un nombre premier, n > 1 et r € N\{0}. Nous notons q = p", A(n,q), l’ensemble des 
polynômes unitaires irréductibles de degré n sur F4. Nous notons aussi I(n,q) = Card (A(n, q)). 
Alors : 


(1) Le polynôme X%° — X se décompose en irréductibles de la façon suivante : 


X"-X=]] [][] P. (19.234) 


din PEA(d,q) 
(2) Le nombre d’irréductibles est donné par 
1 n 
Ing == (=) g° (19.235) 
nn d 


où est la fonction de Môbius (définition 19.68). 
(3) Nous avons l’équivalence de suite 


n 


16e _ (19.236) 


Démonstration. (1) Soit un diviseur d den et P € A(d, q). Montrons que P divise X° — X. Nous 
considérons le corps K = F,[X]/(P), qui est une extension de degré deg(P) de F, parce qu'il 
s’agit des polynômes de degré au maximum deg(P) à coefficients dans F,. Ce corps possède 
donc q% éléments et est isomorphe à Fa par la proposition 19.58. Par construction dans K, 
l’élément a = [X] (la classe de X dans le quotient par P) est une racine de P. Cet élément 
est également une racine de X FX parce que tout élément de Fa est une racine de ce 
polynôme. Ce dernier point est la proposition 19.33. 

Nous sommes donc dans la situation où P et X4°— X ont une racine commune dans l’extension 
F,[X]/(P). Nous en déduisons que «a est aussi une racine de X% — X. En effet en utilisant 
le fait que aT = «à, nous avons 


n kd d_(k—1)d no (k—1)d 
nf = gt L (a ) = a : (19.237) 


22. Théorème de Bézout, 6.47. 
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donc par récurrence, on a encore a” = a, et a est racine de X%° — X. Puisque P est 
irréductible, le lemme 19.71 nous indique alors, que P divise X9° — X. 

Étant donné que tous les éléments de A(d, q) divisent X° — X et sont irréductibles, leur 
produit divise encore X%° — X : 


JT II Pix - x (19.238) 


din PEA(d,q) 


Nous devons à présent montrer que tous les facteurs irréductibles de X%° — X sont dans un 
A(d, q) avec d | n. Soit donc P un facteur irréductible de X° — X de degré d > 1. Nous 
posons encore K = F,[X]/(P) et nous utilisons la propriété de multiplication sur les degrés 
(proposition 6.63) : 

[For : KIK : F4] = [Fm :F]l=n, (19.239) 
donc [K : F,], qui vaut deg(P) est un diviseur de n. 
Étant donné que X” — X n’a que des racines simples sur For (à nouveau la proposition 19.33), 
dans sa décomposition en irréductibles sur F,, il n’a pas de facteur carré; il n’a donc qu’une 
fois chacun des P € Afd,gq) avec d | n. Autrement dit, tous les facteurs irréductibles de 
X9° — X sont dans le produit [| de [ [pe A(d,g) P et donc X%° — X divise ce gros produit : 


XT-X]|[][] [] 2. (19.240) 
din PEA(d,q) 
Ayant déjà obtenu la divisibilité inverse et les polynômes étant unitaires, nous avons égalité. 
Nous passons au degré dans l'expression que nous venons de démontrer : 
g" = ÿ_ dCard (A(d,q)) = Ÿ dI(d,q). (19.241) 
din din 


Nous pouvons utiliser la formule d’inversion de Môbius (proposition 19.70) pour les fonctions 
g(n) = q" et f(n) = din, q). Nous écrivons alors 


fn) =D u (2) d”, (19.242) 


din 
ou encore 


I(n,q) = : D (©) d, (19.243) 


ce qu'il fallait. 
Nous posons 
n 
= Yu (°) qi, (19.244) 


din 
d<n 


mais sachant que les diviseurs de n, outre n lui-même, sont tous plus petits ou égaux à n/2 
et qu’en valeur absolue, la fonction de Môbius est toujours plus petite ou égale à ?* 1, 


In/21 _ 4/2] m2] 1  Jr/2+t 
ral < D gt = 10 2,5 <* (19.245) 
2 l—q qg—l qg—l 
D'autre part en reprenant la formule déjà prouvée, 
1 1 + q" 
Ing) = = u(e)gt= = (r+n() gt) = EE. (19.246) 
nu d n n n 


Au numérateur, le plus haut degré en n est g” parce que r, est en ql”/2l. Donc nous avons 


bien l’équivalence de suite pour n — 0 : 
 — (19.247) 
n n 


23. Dans [103], ma dernière inégalité arrive comme une égalité. 
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19.4.10 Matrices 


Proposition 19.73. 
Nous avons 


IGL(n, F})| = (p° —1)(p" — p)...(p° — pt). (19.248) 


Démonstration. Par construction il existe une bijection entre GL(n,F,) et l’ensemble des bases 
de F5. Nous devons donc seulement compter le nombre de bases. Pour le premier vecteur de base 
nous avons le choix entre les p" — 1 éléments non nuls de F?. Pour le second nous avons le choix 


entre p” — p éléments, et ainsi de suite. 


LemcDOTzM 
Lemme 19.74. 
Soit K un corps fini autre que F2 **, soit un groupe abélien M et un morphisme w: GL(n,K) — M. 
Alors il existe un unique morphisme 0: K\{0} — M tel que y = Ô o det. 


Démonstration. D'abord le groupe dérivé de GL(n,K) est SL(n,K) parce que les éléments de 
D(GL(n, K)) sont de la forme ghg=!h-1 dont le déterminant est 1. 

De plus le groupe SL(n, K) est normal dans GL(n, K). Par conséquent GL(n, K)/SL(n, K) est 
un groupe et nous pouvons définir l’application relevée 


GL(n, K) 


M (19.249) 


@: 
vérifiant © = Gor où 7 est la projection. 
Nous pouvons faire la même chose avec l’application 


det: GL(n,K) — K\{0} (19.250) 
qui est un morphisme de groupes dont le noyau est SL(n, K). Cela nous donne une application 


- _ GL(n,K) 
det: = K\{0 19.251 
telle que det = detor. Cette application det est un isomorphisme. En effet, elle est surjective parce 
que le déterminant l’est, et elle est injective parce que son noyau est précisément ce par quoi on 
prend le quotient. Par conséquent det possède un inverse et nous pouvons écrire 


p=gpodet  odetor. (19.252) 


Étant donné que det o x = det, nous avons alors @ = 6 o det avec Ô = Go det””. Ceci conclut la 
partie existence de la preuve. 

En ce qui concerne l’unicité, nous considérons 0’: K\{0} — M telle que 4 = 6’ odet. Pour tout 
u € GL(n, K) nous avons d/(det{u)) = w(u) = d(det(u)). L'application det étant surjective depuis 
GL(n, K) vers K\{0}, nous avons 0’ = 6. 


Théorème 19.75. 
Soient p > 3 un nombre premier et E, un F,-espace vectoriel de dimension finie n. Pour tout 


u € GL(E) nous avons | 
e(u) = (=) (19.253) 


Ici e est la signature de u vue comme une permutation des éléments de F,,. 
Démonstration. Commençons par prouver que 


CL), (19.254) 


24. Je ne comprends pas très bien à quel moment joue cette hypothèse. 
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est un morphisme. Si nous notons & € S(E) l’élément du groupe symétrique correspondant à la 
matrice u € GL(E), alors nous avons U0 = % 0 5, et la signature étant un morphisme (proposi- 
tion 1.293), 


e(uv) = e(t o ©) = e(u)e(©). (19.255) 


Par ailleurs {—1,1} est abélien, donc le lemme 19.74 s'applique et nous pouvons considérer un 
morphisme 0: F,\{0} — {—1,1} tel que e = do det. 

Nous allons utiliser le lemme 19.40 pour montrer que 6 est le symbole de Legendre. Pour cela 
il nous faudrait trouver un x € F,\{0} tel que (x) = —1. Étant donné que det est surjective, nous 
cherchons ce x sous la forme x = det(u). Par conséquent nous aurions 


(x) = (Ô 0 det)(u) = e(u), (19.256) 


et notre problème revient à trouver une matrice u € GL(E) dont la permutation associée soit de 
signature —1. 

Soit n = dim E ; en conséquence de la proposition 19.59(3), l’espace E, = F,» est un F,-espace 
vectoriel de dimension n et est donc isomorphe en tant qu’espace vectoriel à E. Étant donné que 
F, est un corps fini, nous savons que F,\{0} est un groupe cyclique à g — 1 éléments. Soit y, un 
générateur de F,\{0} et l'application 


BF, —F, 


TT yT. 


(19.257) 


Cela est manifestement F,-linéaire (ici y et x sont des classes de polynômes et F, est le corps des 
coefficients). L'application 8 fixe zéro et à part zéro, agit comme le cycle 


Connu (19.258) 


Nous savons qu’un cycle de longueur n est de signature (—1)"*{. Ici le cycle est de longueur q — 1 
qui est pair (parce que p > 3) et par conséquent, l'application 8 est de signature —1. 


19.5 Constructions à la règle et au compas 


Définition 19.76 ([555]). 
Soit E une partie de R?. Un point de R? est constructible en une étape à partir de E si il est un 
point de E ou une intersection de deux objets parmi 


— les droites passant par deux points distincts de E ; 
— les cercles centrés en un point de E et dont le rayon est la distance entre deux points de E. 


Nous notons C1(E) l’ensemble des points constructibles en une étape à partir de E. 
Les points constructibles en n étapes à partir de E sont définis par récurrence : Cn+1(E) = 
Ci (Cn(E)). Enfin un point de R? est constructible à partir de E si il appartient à 


C(E) = Ü Ch(E). (19.259) 
n=1 


Un réel est constructible si il est l’abscisse d’un point constructible. 


Pour toute la suite, nous allons considérer les points et réels constructibles à partir de l’ensemble 
E = {(0,0),(0,1)}. 


19.5.1 Quelques constructions 
PropIMFooDWAyoH 


Proposition 19.77 ([556]). 
Les nombres rationnels sont tous constructibles. 


Démonstration. Si le réel r est constructible, alors kr est également constructible pour tout k € Z. 
Nous devons donc seulement pouvoir construire le nombre 1/n pour tout n € N\{0}. 
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La méthode pour construire le nombre 1/n est la suivante. Soit [AB] un segment de longueur 
1 (par exemple À = (0,0) et B = (1,0)) et un point C, non aligné avec À et B, et tel que [ AC] 
ait une longueur n. Nous plaçons sur [ AC] le point K situé à une distance 1 de À en pointant le 
compas en À et en traçant le cercle de rayon [AB]. 

La droite passant par K et parallèle à (BC) coupe [ AB] en un point L. Maintenant, le segment 
[AL] a une longueur de 1/n, par le théorème de Thalès ?. 


ExGROoo!losiBt 
Exemple 19.78 (Multiplication à la règle et au compas[555]). 
Soient x et y deux nombres constructibles. Montrons qu’il est possible de construire le nombre xy. 
La construction est la suivante : 


— On trace deux droites sécantes en À. 

— Sur la première nous plaçons le point Ÿ à distance y de À et le point P à distance 1 de À. 
— Sur la seconde on place le point X à distance x de À. 

— On trace la droite (PX) 

— Puis la parallèle à (PX) passant par Y. 


— Le point d’intersection entre cette dernière droite et (AX) est le point B. 


La longueur AB est égale à xy. A 
ExTYMooSMCvSr 


Exemple 19.79 (Racine carrée à la règle et au compas|555]). 
Nous supposons que le nombre x est constructible, et nous voulons une construction qui donne un 
segment de longueur /x. Nous traçons un segment [BC] dont la longueur correspond à la plus 
grande des valeurs entre x et 1, puis le cercle de diamètre BC, ensuite le point H sur [BC tel que 
BH corresponde à la plus petite des valeurs entre x et 1, enfin la perpendiculaire à (BC) menée 
par À, qui rencontre le cercle en un point A. D’après le théorème de Thalès sur le cercle #, le 
triangle ABC est rectangle en À. 

Les triangles ABC et ABH sont donc semblables parce qu'ils sont rectangles avec un angle 
(autre que l’angle droit) égal. Nous avons donc proportionnalité des longueurs des côtés : 


AB BC 


= 19.2 
BH AB (8280) 


ce qui donne AB? = BC x BH = x (BC'et BH valent respectivement 1 et x ou le contraire). 


25. Théorème 12.162. 
26. Théorème 12.163. 
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A 


VA 
ExAHCooELGGPa 


Exemple 19.80 (Duplication d’un angle). 
Si un angle a est constructible, nous allons construire les angles 2a, 3a, etc. Pour cela nous 
considérons un cercle de centre © et les points À et J sur le cercle tels que AOÏ = «. Le cercle de 
centre À et de rayon A] intersecte le cercle de départ en les points I et B. 

Le point À est à égale distance de B et TZ; le point O également. Donc la droite (OA) est 
médiatrice du segment [BI]. Par conséquent elle est la hauteur du triangle isocèle OBI. L'angle 
BOA est alors le même que AOI ;: par conséquent BOI = 2a. 


pris, 
N À 


I 


En traçant le cercle de centre B et de rayon BA, nous continuons et nous construisons 3a. A 


L'exemple suivant qui permet d’additionner des angles repose sur le fait que deux cordes de 
mêmes longueurs sous-tendent des angles égaux, et est une adaptation simple de la duplication 
d'angle. 

ExOVDooXnWPD1 
Exemple 19.81 (Addition d’angles). 
Quitte à soustraire ou additionner un certain nombre de fois 90°, nous supposons que les deux 
angles donnés sont entre 0° et 90°. 

Soient À, B, 1 sur un cercle de centre ©, et nous notons a = OAI , B = BOI. Nous traçons le 
cercle de centre B et de rayon Al : il intersecte le cercle en des points 3 et K°. Les angles K:OB 
et K:O0B sont tous deux égaux à a. 

Les angles K,0A et K202A sont égaux à 6 — a et 5 + a. A 


19.82. 
Notez que l’exemple 19.81 donne un moyen de construire a + 5 et a — 5 ensemble. Il ne permet 
pas de savoir lequel est «& + B et lequel est a — B. 


19.5.2 Nombres constructibles 
ThoRHFooZsLbqd 


Théorème 19.83 (Wantzel[557]). 
Le réel a est constructible si et seulement si il existe une suite finie de corps L; tels que 
(1) Lo = Q, 


(2) Li: est un extension quadratique?T de L; 


27. C'est-à-dire une extension finie de degré 2. 


19.5. 
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(3) a € Lu. 


Démonstration. Soit K un corps de nombres constructibles (par exemple Q); nous notons EK 
l'ensemble des points de R? dont les coordonnées sont dans K. Ce sont des points forcément 
constructibles. 


(1) 


Intersection de droites Si À,B € Ex alors la droite (AB) a pour équation ax +by+c = 0 
avec a,b,c € K, et le point d’intersection entre deux droites est donné par la solution du 


système 
az +by+c=0 (19.261a) 
ax+by+c =0, (19.261b) 


dont les solutions sont encore dans K. 


Intersection droite-cerle L'’équation d’un cercle est de la forme 


(œ—u) + (y—v) = 7° (19.262) 


où (u,v) e Ex et r est la distance entre deux points de Ex ; donc r? € K. En développant 
et en redéfinissant u,v nous voyons que tous les cercles à considérer ont une équation de la 
forme 

2? + +ux + vy +t=0 (19.263) 


avec u, v,t € K. Il s’agit de voir où sont les solutions du système 


az+by+c=0 (19.264a) 
a? + + ux + vy +t= 0. (19.264b) 
Si a Æ 0 alors nous pouvons opérer la substitution x = —(c + by)/a et obtenir l'équation 
suivante pour y : 
—c— by\? 9 6 dy 
(+) +y+u (+) + vy +t = 0. (19.265) 


Cette équation est de la forme P(y) = 0 où P est un polynôme du second degré à coefficients 
dans K. 
Si a = 0 nous substituons y au lieu de x et le résultat est le même. 
C’est le moment de relire la proposition 6.102 qui nous assure que si le réel « est une solution 
de P(y) = 0 hors de K, alors l’extension K(a) est de degré 2 parce que le polynôme minimal 
de a est de degré 2 : 

[Ka] : K] = 2. (19.266) 
De plus K[a] = K(a). 


Intersection cercle-cercle Le système 


a? + y? + ux + vy +t = 0 (19.267a) 
2? +? + ax + by + c = 0 (19.267b) 


est équivalent au système (en substituant la seconde équation par la différence entre les deux) 


a +y +ur+vuy+t=0 (19.268a) 
(u— ar +(v—-b}y+t—-c=0 (19.268b) 


qui est à nouveau une intersection entre un cercle et une droite. 


Passons à la conclusion. Si «a est un nombre constructible, alors il apparaît dans les coordonnées 
d’un point de C»(ÆEQ) pour un certain m. Nous supposons (pour la récurrence) que chaque réel 
constructible en m— 1 étapes possède sa pile d'extension quadratiques en partant de Q. Le nombre 
a vérifie donc 


ao? + ba + c = 0 (19.269) 
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avec à, b,c trois réels constructibles en m — 1 étapes. L'hypothèse de récurrence donne donc des 
piles d’extensions 


Lo = À 6 = Q 0 = Q 
Lin = Li(&) Lis = Lib) Li1 = Li(ci) (19.270) 
ae L»h beL/, ce L}r. 


Nous considérons donc la suite d’extensions de Q qui consiste à étendre successivement par les 


nombres &1,...,@n,01,...,0n,C1,...,@# tout en excluant les doublons : il est possible que par 
exemple b3 soit déjà dans Q{(a1,...,an). Cela nous fournit une suite d'extensions 
Mo = Q 
M;:: _ M;(@i) (19.271) 
a,b,ce My. 


Ici le n n’est pas spécialement le même que celui plus haut. Maintenant, a est dans une extension 
quadratique de M,. 

Pour la réciproque, nous supposons avoir une tour d’extensions quadratiques Lo = Q, L:;, et 
a € L, et nous voulons prouver que « est constructible. Nous y allons par récurrence : si n = 0 
alors à est rationnel, et il est constructible par la proposition 19.77. 

Supposons que tous les points à coordonnées dans L; sont constructibles. Alors, nous allons 
prouver que les éléments de L;,: le sont également. Puisque « est solution d’une équation de degré 
2 à coefficients dans L;, nous avons 

aa? + ba + c = 0 (19.272) 


pour certains à, b,ce L; et donc 


: —b + Vb2 — 4ac 
2a ‘ 


Les exemples 19.78 et 19.79 montrent que les produits et les racines carrées de nombres construc- 
tibles sont constructibles. Donc a est constructible. 


a (19.273) 


19.5.3 Polygones constructibles 


Définition 19.84. 
Un angle à est constructible si le nombre cos(a) est constructible. 


La raison est qu’il suffit de prendre la perpendiculaire à l'axe horizontal. 
LemMAHooXcOCpr 


Lemme 19.85 ([103]). 
Soient m et n, deux nombres premiers entre eux. L'’angle 27 est constructible si et seulement si 


mn 
2 et 2 sont constructibles. 


les angles 
Démonstration. (1) Sens direct Il suffit de pouvoir multiplier un angle par un entier, ce qui 
est fait dans l'exemple 19.80. 


(2) Sens réciproque Le théorème de Bézout 1.229 nous donne a, b € Z tels que an + bm = 1. 
Cela donne immédiatement 


1 
ae (19.274) 
mn m nm 
et donc 
2 2m 2 
Pur (19.275) 
mn m nm 


ce qui fait que l’angle 27/mn est une combinaison entière d’angles constructibles. Il est donc 
constructible par l’exemple 19.81. 
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LemUKNooSBzDyY 
Lemme 19.86. 
Soit un entier n > 3 ayant 


k 
i=1 


comme décomposition en facteurs premiers. Le polynôme régulier à n côtés est constructible si et 


seulement si les angles sd sont constructibles. 
è 


Démonstration. Le polygone régulier à n côtés est constructible si et seulement si l’angle 2 est 


constructible, c’est-à-dire si l’angle 
27 


k i 
[T1 pi 


est constructible. Par récurrence sur le lemme 19.85, cet angle est constructible si et seulement si 
les angles er sont constructibles. 


(19.277) 


ThoTWAooEsL;jJu 

Théorème 19.87 (Gauss-Wantzel[103]). 
Soit a € N\{0ÿ- ItemFSEooONDFrSi 
(1) L'angle 3 est constructible. a 


(2) Si p est premier et p Æ 2, alors l’angle : est constructible si et seulement si a = 1 et p est 


se 28 
un nombre de Fermat, c’est-à-dire de la forme 1 + 22°) pour B € N. ItemFSEoo0NDFrS iii 


(3) Le polygone régulier à n côtés est constructible si et seulement si n est le produit d’une 
puissance de 2 et d’un nombre fini de nombres premiers de Fermat distincts. 


Démonstration. Le point (1) est une construction de bissectrice, et le point (3) consistera à remettre 
en place différents morceaux. Le gros de la preuve est donc consacré à (2). 


(1) Sens direct Nous supposons que l'angle 27 est constructible; alors le nombre cos (27/p°) 
l’est également et le théorème de Wantzel 19.83 nous indique que 


[Q( cos(2x/p°)) : Q| 07 (19.278) 


pour un certain m. Posons g = p® et w = e2i7/4, Grâce au corolaire 19.24, nous savons que 
le polynôme minimal de w est le polynôme cyclotomique 4, dont le degré est ?? 


p°—"(p-—1). (19.279) 


_ 
A 
[ 
+ 
"S 
2 
[ 


Par conséquent 
[Q() : Q] = 2°" (p-1). (19.280) 


Mais par ailleurs 


w +w7 1 = 2cos(27/q), FaJDBop APE 


donc cos(27/q) € Q(w). Et en multipliant (19.281) par w nous trouvons le polynôme annula- 
teur suivant pour w : 


2 27 
w® —2cos | — | w +1 = 0. (19.282) 
q 


Cela signifie que w est de degré 2 dans Q( cos(27/q)), c’est-à-dire 


[Q(w) : Q(cos(27/q)) | = 2. FaS TX op R EEE 


28. Voir juste en dessous de la définition 19.17. 
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En remettant bout à bout et en utilisant la propriété multiplicative des degrés des exten- 


sions ?”, 
[Q() : Q] = [Q(&) : Q(cos(2r/p°)) | | Q(cos(2r/»°)) : Q}, (19.284) 
Le 
pa l(p—1) 2 2m 


donc p%-1(p — 1) = 2"T1, mais comme p est premier et impair, a = 1 et p = 2"*1 +1. Par 
ailleurs m + 1 est un entier et nous nous proposons de mettre en facteur la puissance de 2 
dans son développement en facteurs premiers : m+1 = X2° avec B € NN et un certain nombre 
impair À € N*. Nous avons : 


À 
p=2%+1- (2) FD (19.285) 


À 
mais le lemme 3.133(1) nous indique alors que 1 + 22° divise 1 + 6) = p. Mais vu que 
p est premier, il ne peut être divisé que par p lui-même et donc À soit être égal à 1 et nous 
avons | 
p=1+%, (19.286) 
ce qui signifie que p est un nombre de Fermat premier. 


Sens réciproque Nous supposons que p est un nombre premier de la forme p = 1 + 22° 
et nous devons prouver que l’angle 2r est constructible. Pour cela nous posons tout de suite 


TS 
ND 
nr 


n = 28 et w = e2i7/P, Comme dans la première partie nous nous souvenons que le polynôme 
minimal de w est le polynôme cyclotomique ®, de degré p — 1; donc 


[Q(w) : QÏ = p —1. (19.287) 


(2a) Un groupe d’automorphismes Nous considérons le groupe G = Aut@Q (Q(w)) des 
automorphismes du corps Q(w) agissant sur Q comme l'identité. Tous les éléments de 
Q(w) étant des polynômes en w (proposition 6.102), un élément g € G est uniquement 
déterminé par g(w), et de plus g(0) = 0 ainsi que d,(w) = 0 et que d, commute avec 9, 


donc 

P(g(w)) = g(8(w)) = g(0) = 0, (19.288) 
ce qui signifie que g(w) est une racine du polynôme cyclotomique #,. Par définition 19.17, 
les racines sont {w, w?, .. sup}, ce qui signifie que l’action de g consiste à élever w à 


une certaine puissance entre 1 et p — 1. Le groupe G est donc d'ordre [G| = p—1et a 
pour éléments 
ge: w ++ wi (19.289) 
avec & = 1,...,p — 1. L'application %0 
ÿ:G— (Z/p2) 


ge kb. (19.290) 


est un morphisme surjectif entre deux groupes finis de même cardinal, donc c’est un 
isomorphisme. Le corolaire 19.32 nous donne de plus l’isomorphisme (Z/pZ)* = Z/(p — 
1)Z, ce qui fait que G à un élément d'ordre p — 1 (parce que Z/(p — 1)Z en a un). Nous 
notons go cet élément. 


(2b) La tour d’extensions À partir de cet élément go € G nous définissons avec 0 < à < n: 


K; = {ze Q{(w) tel que gè (2) —#}, (19.291) 


Ces ensembles sont bien des corps parce que go est un morphisme : g(2z') = go(z)go(2°) ; 
on en déduit immédiatement que gà(z2/) = gÿ(z)g8 (2). 


29. Proposition 6.63. 
30. Pour rappel, la notation [k], est la classe de l’entier k modulo p, qui est un élément de Z/pZ. 
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(2c) 


(24) 


(2e) 


Kn = Q(w) Cela est dû au fait que g est, par définition, d’ordre 2”, ce qui signifie 
que gè (2) = z pour tout z € Q(w). 
Ko = Q Puisque les éléments de G laissent À invariant nous avons forcément À € 
Ko. Nous nous attelons maintenant à prouver l'inclusion inverse. Nous savons par la 
proposition 6.102(2) que {w*};-0...-2 est une base °! de Q(w). Vu que go: Q(w) — Q(w) 
est un isomorphisme, l’image d’une base est une base : 
{go(w)'}i=0..p-2 (19.292) 
est également une base de Q{w). Soit ze Ko et décomposons-le dans cette base *? : 
— EqTMZopCU 
z = > Àigo(w)"; - 10 5035 
i=0 
nous appliquons go à cette égalité en tenant compte du fait que go(z) = z : 


2 
3 = 5 Xgo(w)*1. FaGéDon éme 
i=0 


En identifiant les coefficients (et en remarquant que le dernier terme dans (19.293) est 
le premier dans (19.294)) nous voyons que tous les coefficients sont égaux : 

2 = Xogo(w + +: +01) = A6go(dp(w) — 1) = —)0 € Q. (19.295) 
Dans cette chaine d’égalités nous avons utilisé le fait que ,(X) = 1+X +:...+ XP! 
(corolaire 19.22) et que d,(w) = 0 par définition. 


K; € K;:1 strictement Nous avons une inclusion pour la simple raison que si z € K;, 


alors g2 (2) = z. Par conséquent : 


i+1 u i 
gg (2) = 67 (2) = (g )(z) = z. (19.296) 
Afin de voir que l'inclusion est stricte nous montrons que l’élément 


ani] 


— ; 2 () EqTBLo 18397 


k=0 
est dans K;,1\K;. Dans la base {1,w,...,w?1} l'élément x a une composante w avec 
le terme k = 0, mais si on lui applique g£ nous obtenons 
oqn—i-1l 7 


Ra)= D gt (u). (19.298) 
k=0 


Une composante w pour cela demanderait d’avoir 2*(1 + 2k) = À2" avec À € N; cela 


demanderait : 
k=— 227 1 e (19.299) 


ce qui est impossible. Donc x € K;. 
Nous montrons que x € K;:1 de la même manière : 
i+1 Po +1 eqXHSooGy 
RU@= > pH) 300) 
k=0 

Soit ko entre 0 et 271 _ 1; nous voulons trouver un k entre 0 et 2-1 _ 1 tel que 
ko2°T1 = 2F1(k + 1); cela est très simple : il suffit de prendre k = kg — 1 tant que 
ko # 0. Si ko = 0 alors cela correspond au terme w dans (19.297), et il se trouve dans 
(19.300) avec & = 2%—i-1 1, Donc g2 (x) =zxet x € Kis1. 


31. Ici [103] parle de Q(w)/Q. Dans ce cas il me semble qu'il faille faire partir les valeurs de à de 0 et non de 1. 
32. Il s’agit d’une base en tant qu’espace vectoriel sur Q, donc les À; sont dans Q. 
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Les degrés dans la tour Par définition de n et de w, et par la propriété multiplica- 


tive des degrés ** nous avons : 


2 = p—1 = [Q(w) : Q] = [Q(u) : Ka-1]... [Ki : Q|]. (19.301) 


n facteurs 


Un produit de n facteurs entiers tous strictement plus grands que zéro doit valoir 27. 
Ils doivent donc tous valoir 2 et nous avons en particulier 


LRU Se (19.302) 
cos(27/p) E Kh-1 Soit f — de : puisque l’action de go (comme de tous les éléments 


de G) est de décaler les puissances de w, il existe À € NN tel que f(w) = w”. Mais f? = Id 
donc 


w = f?(w) = w?, (19.303) 


: 2_ si : sc 
ce qui donne 1 = w —! ou encore que p divise À? — 1 parce que w est une racine primitive 


p°de l'unité. Par conséquent [A?—1], = 0 ce qui donne [A], = +[1],, mais comme f # Id 
nous avons 
[AD = —[1]»: (19.304) 


Ce que donne f(w) =w 1. 


Par ailleurs Q(w) est un corps, donc il contient 
2 1 
cos (=) = 5 La Tr. (19.305) 


Nous en déduisons que cos(2r/p) est un point fixe de f = gg : 


1 : 
f(cos(2r/p)) = 0) + f(w71)) = cos(27/p). (19.306) 
Être un point fixe de ”. signifie être un élément de K,,_1 : 
2 
cos (=) kr (19.307) 
P 


Questions de degrés Nous avons alors les (non)inclusions suivantes : 


Q (cos(2r/p)) € Kn-1 & Kn = Q(w), (19.308) 


ce qui fait que 
1 < [Q{w) : Kn-1] < [Q(w) : Q(cos(27/p))] = 2 di LG 10.308 


La première inégalité est le fait que Q{(w) n’est pas égal à K,,_1. La dernière égalité se 
démontre de la même manière que (19.283) (ici & = 1). Les inégalités de (19.309) sont 
donc en réalité des égalités : 


[Q() : Kn-1] = [Q(w) : Q(cos(27/p))] = 2. (19.310) 
Cela, combiné au fait que Q( cos(27/p)) € Kh-1 donne 
Kn-1 = Q(cos(2x/p)). (19.311) 
Mais nous savons déjà que [K,_1 : Q] = 2"7!, donc 
[Q(cos(2x/p)) : Q] = 2"! (19.312) 


et le nombre cos(27/p) est bien sûr le sommet d’une tour d’extensions quadratiques 
partant de Q. Il est donc constructible par le théorème de Wantzel 19.83. 


33. Proposition 6.63 
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Il est maintenant l'heure de conclure en prouvant le point (3). D’abord si n est un produit de 


nombres premiers de Fermat distincts, alors n = p1...p» et l’angle îT est constructible si et 
seulement si chacun des angles 2 est constructible (lemme 19.86), ce qui est le cas d’après la 


partie (2). Si n est le produit d’une puissance de 2 avec un produit de nombres premiers de 
Fermat, le polygone à n côtés est tout autant constructible : il suffit de bissecter les angles. 

À l'inverse si le polynôme à n côtés (avec n impair) est constructible, alors n = Jl;p;", dont 
l’angle est constructible si et seulement si à = 1 et p; est un nombre premier de Fermat. Et si le 
polygone à n côtés (n pair) est constructible, alors n = 2* Il;p;". Ce polygone est constructible 
si et seulement si le polygone à [];p;* côtés est constructible : il suffit de regrouper les côtés par 
deux. 


Remarque 19.88. 
D’après Wikipédia[558], les seuls nombres de Fermat connus pour être premiers sont 


Fo =3 (19.313a) 
F =5 (19.313b) 
PF = 17 (19.313c) 
F3 = 257 (19.313d) 
Fa = 65537. (19.313e) 


Pour les autres, essentiellement on ne sait pas. Il n’est même pas sûr qu’il y en ait d’autres. Le 
problème des polygones constructibles n’est donc pas encore tout à fait terminé. 


Remarque 19.89. 


Les angles ne avec p premier et à > 1 ne sont pas constructibles. Il n’est donc pas possible de 


trisecter l’angle 2. Voilà qui règle un des vieux problèmes de l’antiquité. 
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Chapitre 20 


Intégration sur des variétés 


20.1 Variétés 


20.1.1 Introduction 


Soit f : S? — R une fonction définie sur la sphère usuelle $? & RŸ. Une question naturelle est 
d'estimer la régularité de f ; est-elle continue, dérivable, différentiable ? Il n'existe pas de dérivée 
directionnelle étant donné que le quotient différentiel 


f(x + eu, y + eus) — f(x, y) 
€ 


n’a pas de sens pour un point (x + eu1,y + eu2) qui n’est pas -sauf valeurs particulières- dans la 
surface. Pour la même raison il n’est pas possible de parler de différentiabilité de cette manière. 
Comment faire, sans devoir étendre le domaine de définition de f à un voisinage de la sphère ? Une 
solution possible est de parler de la notion de variété. 

Une variété est un objet qui ressemble, vu de près, à IR”? pour un certain m. En d’autres 
termes, on imagine une variété comme un recollement de morceaux de R”? vivant dans un espace 
plus grand IR”. Ces morceaux sont appelés des ouverts de carte, et l’application qui exprime la 
ressemblance à Rest l’application de carte. 


20.1.2 Définition, carte 
DEFooJOAHooAxcLHe 


Définition 20.1. 
Une variété de dimension m de classe C! est une partie M de R" {n > m) munie d’un ensemble 
de paires {Un, Pa} où U, est un ouvert de R" et pa: Un — R° est une application vérifiant 


(1) pa est une bijection entre U, et ba(Ux) ; 
(2) pour tout a € M, il existe un à tel que a € ba(Ua) ; 
(3) pour tout a, B, la partie pa (Ga(Ua) N pa(Us)) est un ouvert de U, ; 
(4) L'application 
P3 Pa: Pa (PalUa) N palUs)) — Ug (20.1) 


est un C!-difféomorphisme vers son image. 


Notez que cette définition n'utilise pas du tout la structure de R”' dans lequel se trouve M. 
Seulement la structure différentielle du IR”? depuis lequel les cartes partent. En particulier, nous 
n'avons pas dit si wa: Ua — M était de classe C1 pour une topologie induite de R” vers M. Nous 
pouvons en réalité définir plus généralement une variété en remplaçant « une partie de IR" » par 
« un ensemble » sans rien y changer. 

La difficulté qui apparaît lorsque nous voulons dire que M est un ensemble quelconque au lieu 
d’une partie de Rest pour la mesure. 

Nous verrons plus loin comment les cartes &, peuvent transporter la mesure de U, (celle de 
Lebesgue dans R°”°) vers une partie de R” en utilisant le déterminant de dy,. Cela n’est possible 
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que parce que R” a une structure différentielle qui permet de définir dy,. Si M est un ensemble 
quelconque, cette façon de faire n’est plus possible. Dans ce cas, il faut définir des fibrés tangents 
et cotangents puis en extraire une « forme volume ». Le choix de la forme volume n'étant pas 
canonique, il n’y a pas d’intégrale canonique sur une variété générale comme il y en a une sur une 


variété « dans R? ». 
DEFooWABZooGIEDEV 


Définition 20.2. 
Soit une variété M de dimension m. Une carte pour M est un couple (U,4) où U est un ouvert 
de R? et ç: U — M est une application 


(1) qui est une bijection entre U et son image, 
(2) pour tout a, 
(x à 9 D: pl (p(U) a PalUa)) > pa (g(U) a PalUa)) (20.2) 


est un C'-difféomorphisme. 


Proposition 20.3 ([1]). 
Si (Ui,w1) et (U2,w2) sont des cartes pour la variété M, alors en posant S = @1(Ui) n wa(U), 
l’application 


pz' op: pr (S) — p3'(S) (20.3) 


est un C!-difféomorphisme. 


Démonstration. Le fait que > lo (1 soit une bijection est dû au fait que nous ayons choisi les 
espaces de départ et d’arrivée pour que ce soit une bijection. 

Soit a € w1(Ui) Nn pa(U2). Soient a tel que a € pa(Ua) et un ouvert À autour de w5l(a) tel que 
Pa(A) € i(Ui) n ga(U>). Nous allons montrer que 


pa 0 p1: p1(pa(4)) — p3"(pa(A)) (20.4) 
est un Cl-difféomorphisme. Nous avons 
si 1 = 
Pa 0P1—P9 ©Pa0Pa © 1; (20.5) 


mais vu que w1 et w2 sont des cartes, les applications er © Pa Et Pa © w1 sont de classe CT et 
d’inverses CT. La composition l’est encore. 


Nous avons demandé qu’une variété n’admette que des cartes partant d’ouverts de R’”. Aurions- 
nous pu admettre, dans la définition 20.2 que la carte parte d’un ouvert de R? avec p Æ m7? Non. 
Voici une résultat qui dit que si une carte part de R””, alors toutes les cartes doivent partir de IR”. 


Proposition 20.4. 
Soit une variété M de dimension m et une carte ba: Us — M. Si U est un ouvert de IRP et si 
op: U — M est telle que x! 04 soit un difféomorphisme, alors p = m. 


Démonstration. Soit À = pa(Ua) n g(U). Les parties w%!(A) et 5-1 (U) sont des ouverts de R”? 
et de R? respectivement. Par hypothèse, l’application 


Pa 0:97" (4) — px (À) (20.6) 


est un difféomorphisme entre l’ouvert w-1(4) € R? et l’ouvert w,!(4) € R”. La proposition 
11.247 implique que m = p. 


20.1.3 Ancienne définition 


Cette section est à recycler. 
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Définition 20.5. 

Soit G£MCR",1<m<netk > 1. M est une variété de classe C* de dimension m st 
pour tout a € M, il existe un voisinage ouvert U de a dans R", et un ouvert V de R’? tel que 
U n M soit le graphe d’une fonction f : V & R" — R"" de classe C!, c'est-à-dire qu'il existe 
un réagencement des coordonnées (mé... i rise di, ) QUEC 


Lin+i — Je | 
MU = < (is Mn) ER del que (ni 0m) eV : : 


Tin În-m(Ti, re tn) 
où V est un voisinage ouvert de (a;,,...,a,)E€ R. 


La littérature regorge de théorèmes qui proposent des conditions équivalentes à la définition 
d’une variété. Celle que nous allons le plus utiliser est la suivante 


Proposition 20.6. 

Soit MCR'"'et1l<m<n—1. L'ensemble M est une variété si et seulement si Va € M, il existe 
un voisinage ouvert U de a dans R” et une application F: W € R°* — R" où W est un ouvert 
tels que 


(1) F est un homéomorphisme de W vers M NU, 
(2) Fe C'(W,R"), 
(3) Le rang de dF(w) e L(R”,R?) est de rang maximum (c’est-à-dire m) en tout point w € W. 
Pour rappel, si T: R" — R" est une application linéaire, son rang ! est la dimension de son 
image. Si À est la matrice d’une application linéaire, alors le rang de cette application linéaire est 
égal à la taille de la plus grande matrice carrée de déterminant non nul contenue dans A?. 


La condition de rang maximum sert à éviter le genre de cas de la figure 20.1 qui représente 
l’image de l’ouvert [—-1,1] par l'application F(t) = (t?,t%). 


À 


FIGURE 20.1: Quelque chose qui n’est pas de rang maximum et qui é#ePRSERem A EtéÉRang 


La différentielle a pour matrice 
dF(t) = (2t,3t?). (20.7) 


Le rang maximum est 1, mais en { = 0, la matrice vaut (0,0) et son rang est zéro. Pour toute autre 
valeur de t, c’est bon. 
Une autre caractérisation des variétés est donnée par la proposition suivante 


1. Définition 4.45. 
2. Proposition 4.124 
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PropCarVarZerFonc 
Proposition 20.7. 
Soit MCR"'eti<m<n—1. L'ensemble M est une variété si et seulement si Va € M, il existe 
un voisinage ouvert U de a dans R" tel et une application G € C'(U,R"") tel que 
(1) le rang de dG, € L(R",R"") soit maximum (c’est-à-dire n — m) en tout a € M, 
(2) M NU = {x EU tel que G(x) = 0}. 


20.1.4 Espace tangent 


DEFooMCEYooHuCAdg 
Proposition-Définition 20.8 ([559]). 
Soit une variété M de dimension m dans R”. Soit a € M. L'ensemble 
eC1(1-1,1[,M 
TM = {/(0) tel que |? EM) } (20.8) 
7(0) = a 


est un sous-espace vectoriel de dimension m, appelé espace tangent de M en a. 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


20.2 Intégration 


20.2.1 Le problème pour une intégration globale 


Soient une variété M et une partie À de M. Si nous avons une fonction f: À — R, nous 
voudrions définir une intégrale de f sur À en utilisant les cartes. 

Il y à une petite complication. Supposons que À soit dans va(Ua) N ws(Ug). Pour la carte va 
nous aurions tendance à vouloir écrire 


J de J Fa ERSUENHe RES 
A pa” (A) 


pour la mesure de Lebesgue induite de R”? vers son ouvert U,. Pas de problème à ce que (20.9) 
soit bien définie. Le problème est que a n’est pas à priori spécial par rapport à 8 et qu'il faudrait 


également que 
] = Î L Ho, EROEOI Res An) 
A pg (A) 


Mais en utilisant le changement de variable (théorème 14.290(3)) pour le C1-difféomorphisme 
d=vpilo @B; nous avons 


Lun] 
Pa (4) gp 


À moins d’une coïncidence extraordinaire sur les valeurs du jacobien, il n’y aura pas égalité entre 
(20.9) et (20.10). 

Pour faire mieux, il faudra ajouter quelque chose qui compense l’arrivée du jacobien. C’est ce 
que nous allons faire maintenant. 


Fopacgtops]la= | (owslda. (010 


"(4 (4) 


8 Pg 


20.2.2 Intégrale sur une carte 


Dans un premier temps, nous allons définir l’intégrale sur une carte. Nous verrons plus tard 


comment combiner les cartes pour faire une intégrale sur une variété entière. 
PROPooUAHWooAfxvyv 


Proposition-Définition 20.9 ([1]). 
Soient deux cartes (U1,w1) et (U2,w2) pour la partie À d’une variété de dimension m dans R”. 
Soit une fonction mesurable f: À — [0, +00]. 


3. Si f est seulement mesurable, allez voir les hypothèses du théorème 14.290(3). 
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Alors“ 


le (fo gr)(x)4/det ((d1)#(de1):)dr = jé (fo pa)(y)4/det ((dy2)i(der)y)dy (20.12) 


où les deux intégrales sont au sens de la mesure de Lebesque sur des ouverts de IR”. 
Ce nombre est l’intégrale de f sur À, et est noté 


[. f. (20.13) 


Démonstration. Vu que nous sommes en présence de cartes pour une variété, les applications 
wi: U1 — À et w2: Us — À sont des bijections telles que p' 0 w2: Us — Ui soit un C1- 
difféomorphisme. 

Nous considérons le C'l-difféomorphisme 9 = ep," 0 2. Notre but est d'utiliser le théorème de 
changement de variables 14.290(2). 

Vu que @1 est une bijection, (41 0 w, ')(A) = A et nous avons 


"(pr (4)) = w2"(4). (20.14) 


Ensuite, f o w1 0 = f o w2. 

Jusqu'ici, rien de drôle me diriez-vous. Ok. Alors voyons un peu comment se passe le jacobien 
et ce qui se trouve sous la racine carrée. 

L'application x + det ((dy1)% © (dp1}») doit être composée avec ® pour donner 


ve det ((de1) Sy) O (d1)6ty)): (20.15) 
Attardons-nous un peu sur (d:) eQy)- Nous savons par la règle de différentiation en chaine 11.242 
que : 
EQooCBGAoo 
d(g1 0 d)y = (de1)gty ° (dP)y- (RTE) 


Le lemme 11.246 nous dit que l’application linéaire do, : R7 — IR? est inversible et que d@,, D 
(db! )4y: En composant les deux côtés de (20.16) par cela nous trouvons 


(dpi) = dpi © )y © (db)! = (dp2)y © (dh st: (20.17) 


C'est me moment d'utiliser la proposition 9.37 à propos de la composition des applications ad- 
jointes. Ce qui est dans le déterminant est : 


((dp2)y o (dpt) ((dp2)y 0 (db su) = GR 7 Jo ° (dp2)% © (dp2)y° (dp")gty) + (20.18) 
7 ee, ——7 
ee R?—RT R?—R?m 


Nous utilisons à présent un combo entre les propriétés des déterminants et de l’adjoint : les pro- 
positions 9.13(2) et 9.36 font sortir | det ((dÿ”-1);(,,)| de la racine carré. Ne pas oublier la valeur 


absolue parce que Vx? = |x| et non Vx? = x. Cela pour dire que 


/det ( (dei) © (dp1)ey) = |det (( a)la/det (( ((dp2)à © (d2)y). (20.19) 


En ce qui concerne l’intégrale que nous voulons calculer, en mettant les bouts ensemble, 


J ; fovi)(x)\det(---)dx 
CT 2 


1 
(20.20) 
- | 0 72) det (26 au)ly/et (des © pa), | det( dé) 
Pa 
Enfin, les déterminants se suppriment : dans la valeur absolue nous avons : 
det ((dp” De y) det(dpy) = det (4 )sty) o dpy) = det(Id) = 1. (20.21) 


4. Voir la définition de l’adjoint 9.34. 
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20.10. 
Notez que si À est un ouvert de R”” lui-même, le nombre défini dans la définition 20.9 est l’intégrale 
usuelle. Pour le voir, choisir U = À ainsi que la carte 

pi U — A 


LR EL. 


(20.22) 


La différentielle de w est l'identité, de telle sorte que det ((dp)#(dgp)x) = 1. De même, fow= f. 
Il reste seulement {,, f(x)dx. 


Si nous voulons que la formule de la proposition 20.9 fournisse une définition raisonnable de 
(4 f, il faut que si (U,) est une carte, 


det (dr o dpz) > 0 (20.23) 
pour tout x, et ne soit nul sur aucun ouvert de U. 


Lemme 20.11 ([1]). 
Soit une carte (U,4w) d’une variété M de dimension m. Soit x € U. Alors 


(1) L'opérateur dyp% o dy est autoadjoint semi-défini positif. 


(2) Il existe une base de R”' formée de vecteurs propres de dp% o dyx. Les valeurs propres sont 
réelles et positives. 


(3) Pour tout x EU nous avons 
det(dpf o dpx) > 0. (20.24) 


Démonstration. Point par point. 


(1) Soit x e U. Nous notons À = dy. Par la proposition 9.37 nous avons (AA*)* = AA* du fait 
que (A*)* = À. Donc A*A est autoadjoint. Sa matrice est donc symétrique par la proposition 
9.34(2). 

De plus, pour tout u € R°” nous avons 


<A* Au, u) = (Au, Au) > 0. (20.25) 


Cela implique que la matrice de A*A est semi-définie positive par le lemme 9.228(2). L'opé- 
rateur A* A est également semi-défini positif par la proposition 9.229. 


TS 
ND 
nr 


L'existence de la base de vecteurs propres est le théorème 9.221. Ce théorème dit de plus 
que les valeurs propres sont réelles. Le fait qu’elles soient positives est le fait déjà prouvé que 
A*A est semi-défini positif. 

(3) Dans la base de vecteurs propres, la matrice est diagonale avec des nombres positifs sur la dia- 
gonale. Le déterminant est alors le produit des valeurs propres. Voilà pourquoi le déterminant 
est positif. 

Il nous reste à montrer que ce déterminant ne peut pas être nul. Si det(dyp# o dy) = 0, alors 
l'application dp* o dy à un noyau (proposition 9.13(2)), c'est-à-dire un vecteur uw tel que 
dpsdpatu) = 0 en particulier, 


0 = {dpi dpau,u) = {dpau, dpau, ) = Idpaul?. (20.26) 


Donc dpa(u) = 0. 

Mais @: U — o(U) est bijective, donc l’application #7": &{(U) — U l’est aussi et vu que y est 
une carte, l'application wo w: U — U est égale à l'identité. L'identité est une application 
linéaire dont la différentielle est elle-même, c’est-à-dire que 


d(w lo wa = (dp!) (a) © da = Id. (20.27) 


Si donc u # 0, nous devons avoir dp(u) # 0. 


1 
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20.2.3 Quelques expressions pour l’élément de volume 


Ce que nous appelons « élément de volume » (pour des raisons qui apparaîtront plus tard) 
est le coefficient 4/det(dyp* o dyz), introduit pour le besoin de compenser l’arrivée du jacobien en 
cas de changement de variables. Mais à quoi ressemble ce coefficient pour les variétés de petite 
dimension ? 

C’est ce que nous allons voir maintenant. 


20.2.3.1 En dimension un 


Nous supposons une variété de dimension un dans IR”. Une carte est donc une application 
o: R — R” dont nous notons w; les composantes. Nous avons, pour u € R, 
: gi(a + tu) gi(a) 
à _ | t | RE : — : = uw'(a). 20.28 
ealu) = Efea+tw) 5 : ul: ]-w0) (20.28) 
Pn(a + tu) Pn(a) 


Là dedans, vous vous souviendrez que a € R et que y'(a) € R’. 
Nous devons savoir ce que vaut dpÿx lorsque a € R et x € R”. Pour tout u € R nous avons 


(dpar,u)R = (x, dpa(u)yrr = Ur, 9’ (a))Rr = ug'(a) : à = (w'(a) : r,u)m. (20.29) 


Donc dp#(x) = g'(a) - x. 
Question notation, nous avons noté (a, br = ab et indifféremment x, Y)Rr = æ : y. 
L'application dp* o dy, est une application linéaire bijective entre R et R. Sa matrice est donc 
1 x 1 et elle se calcule en appliquant l’application au vecteur de base 1 de R : 


(dpa © dpa)(1) = dpi (v'(a)) = p'{a) - p'{a) = |w/(a)l”. (20.30) 


Nous avons donc 
det (dx © da) = |’ (a). (20.31) 
20.2.3.2 En dimension quelconque 


Soit une carte w: IR — IR" pour une variété de dimension m. Les éléments de matrice de la 
différentielle d’une application sont donnés par la proposition 12.260 : 


(deu) = FE a) (20.32) 


Les éléments de la matrice de dp* sont ceux de la matrice transposée. En ce qui concerne la 
composition, c’est le produit des matrices : 


Pr a) € ( 
(dp* o dpa)iÿ = DOALCSE = - ire) ki(dPa)x3 2 Gus (0) 2 (20.33) 
Cela pour écrire cette bonne formule : 
(da © dPa)ij = u (a) : _ (a). D ANE ES DO 
CHE Ôt; 


20.2.3.3 En dimension deux 


Nous considérons maintenant une carte 4: U — IR° avec U € R?. En notant v; = 6;y(a) nous 
notons la formule (20.34) sous la forme 


# = Uy © V1 V1 V2 
det (des 5 dpa) = det e * V1 V2 * V2 


} = tuer (om). (2035) 
L'identité de Lagrange de la proposition 11.32 nous donne alors 


dp à 
1/det(dpi o da) = ES x al (20.36) 
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20.2.3.4 En dimension trois 


Nous considérons maintenant une carte w: U — IR° avec U € R°. Nous notons u = ae (a), 
__ dp _ à 
v = (a) et w = = (ah 


En utilisant l’expression du lemme 11.30 à propos du produit mixte, la formule 20.34 donne 
det(dpà o dpa) = det{u:u vf? vw |=|(u x v) : wl. (20.37) 


Donc 


det(dyp® o d£a) = [E20 x (a) É (al. EqooYIJS0oH ete 


20.2.4 Intégrale d’une n-forme sur une carte 


<++> 


20.3 Intégrale sur une variété 


20.3.1 Mesure sur une carte 


Nous considérons dans cette section uniquement des variétés M de dimension 2 dans R?. Une 
particularité de R° (par rapport aux autres R”) est qu’il existe le produit vectoriel. 

Si v, we R*, alors le vecteur v x w est un vecteur normal au plan décrit par v et w qui jouit 
de l’importante propriété suivante : 


aire du parallélogramme = |v x w||. (20.39) 


L’aire du parallélogramme construit sur v et w est donnée par la norme du produit vectoriel. Afin 
de donner une mesure infinitésimale en un point p € M, nous voudrions prendre deux vecteurs 
tangents à M en p, et puis considérer la norme de leur produit vectoriel. Cette idée se heurte à la 
question du choix des vecteurs tangents à considérer. 

Dans IR?, le choix est évident : nous choisissons e, et e,, et nous avons |e; x e,|| = 1. L'idée 
est donc de choisir une carte F: W — F(W) autour du point p = F(w), et de choisir les vecteurs 
tangents qui correspondent à e, et e, via la carte, c’est-à-dire les vecteurs 


0F ÔF 
en t — (w). 20.4 
eu) et Su) (20.40) 
L'élément infinitésimal de surface sur M au point p = F(w) est alors défini par 
0F °F 
dor = |=(w) x à (w)|duw, (20.41) 


et si la partie À € M est entièrement contenue dans F(W), nous définissons la mesure de À par 


: ns or, or ” EqDefMuDe 
pa = [are [art x Stu)lau 5) 


Remarque 20.12. 

Afin que cette définition ait un sens, nous devons prouver qu’elle ne dépend pas du choix de la 
carte F. En effet, les vecteurs 0,F et ©,F dépendent de la carte F, donc leur produit vectoriel 
(et sa norme) dépendent également de la carte F choisie. Il faudrait donc un petit miracle pour 
que le nombre y2(A) donné par (20.42) soit indépendant du choix de F. Nous allons bientôt voir 
comme cas particulier du théorème 20.15 que c’est en fait le cas. C'est-à-dire que si F et F sont 
deux cartes qui contiennent À, alors 


Ï dop = ] do ÿs. (20.43) 
F71(4) F-1(4) 
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20.3.1.1 Exemple : la mesure de la sphère 


Nous nous proposons maintenant de calculer la surface de la sphère S$? = x? + y? + 2? = R?. 
L'application F: B((0,0),R) — R° donnée par 


x 
FE, 4) = y (20.44) 
R2 = x? — y? 

est une carte pour une demi-sphère. Ses dérivées partielles sont 
0F | OF 
Lee 0 , —= 1 . (20.45) 
Ox L z ©y y 
R2—x2y? V/R2-x2-ÿ2 


Le produit vectoriel de ces deux vecteurs tangents donne 


OF OF 4 
3 9) X y (x, y) = me Li “ea + eg (20.46) 
où à = 4/R2 — x? — y2. En calculant la norme, nous trouvons 
0F 0F R?2 
5 9) x CN EN RE (20.47) 


et en passant aux coordonnées polaires, nous écrivons l’intégrale (20.42) sous la forme 


[ 
[ ler x ,F| = | dé af = _ dr=27R2, RER) 


qui est bien la mesure de la demi-sphère. 


20.3.2 Intégrale sur une carte 


Nous pouvons maintenant définir l'intégrale d’une fonction sur une carte de la variété M. 
DEFooZNFOooZPiBWY 


Définition 20.13. 

Soit F: W © R? — R*, une carte pour une variété M. Soit À, une partie de F(W) telle que 
A = F(B) où BC W est mesurable. Soit encore f: À — R, une fonction continue. L'intégrale 
de f sur À est le nombre 


°F 0F EqgDefIntDe 
[r- [rar - Lt DO OP 01 bu) 


Remarque 20.14. 

L'intégrale (20.49) n’est pas toujours bien définie. Étant donné que F est C1 et que f est continue, 
l’intégrande est continue. L'intégrale sera donc bien définie par exemple lorsque B est borné et si 
la fermeture À est un compact contenu dans F(W). 


Le théorème suivant montre que le travail que nous avons fait jusqu’à présent ne dépend en 
fait pas du choix de carte F' effectué. 
TholntIndepF 
Théorème 20.15. 
Soient F: W — F(W) et F: W — F(W), deux cartes de la variété M. Soit une partie À € 
F(W) n F(W) telle que À = F(B) avec B < W mesurable. Alors A = F(B) avec B « W 


mesurable. 
Si f est une fonction continue, et si à Jdor existe, alors à do; existe et 


[. fdor = [. fdog. (20.50) 
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20.3.3 Exemples 


Intégrons la fonction f(x, y,z) sur le carré X = ]0,1[ x ]0,2[ x {1}. La première carte que nous 
pouvons utiliser est 
F:10,1[ x 10,2 — K 


(20.51) 
(x, y) + (&,y,1). 
Nous trouvons aisément les vecteurs tangents qui forment l'élément de surface : 
1 0 
0F 0F 
7. \o Y  \o 
donc dor = 1 : dxdy, et 
IntKS 
J Jdor - | fev: 1) * 1 *: drdy: sl nr 53) 
K J0,1[x<10,2[ 
Nous pouvons également utiliser la carte 
F: 10, =[ x ]0,6[ — K 
ÿ (20.54) 
Les vecteurs tangents sont maintenant 
= 2 = 0 
0F OF 
ok — -|18) (20.55) 
7. \o 4 0 
et nous avons donc dog = |3e3| = ?. Cette fois, l'intégrale de f sur K s'écrit 
- Ÿ 2 _—. 
fdos = J(28, 2,1) : = - dëdÿ. (20.56) 
K 10,20+<10,6[ 3 3 


Conformément au théorème 20.15, cette dernière intégrale est égale à l'intégrale (20.53) parce qu'il 
s’agit juste d’un changement de variable. 


20.3.4 Orientation 


Soient F: W — F(W)et F: W — F(W), deux cartes de la variété M. Nous pouvons considérer 
la fonction h = Flo F, définie uniquement sur l'intersection des cartes : 


h: FEW) © F(W)) — ÊT(F(W) © F(W)). (20.57) 
Nous disons que F et F ont même orientation si 
Jh(w) > 0 (20.58) 


pour tout we F1(F(W) A F(W)). 


Considérons les deux cartes suivantes pour le même carré : 


(x,y) + (x,y,0) (20.59) 
et | , 
ne (20.60) 
(x, y) ns (2x, 3y, 0) 
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Ici, A(x, y) = (5, y) et nous avons Jp = i > 0. Ces deux cartes ont même orientation. Notez que 


0F 0F 

ie 20.61 

Le X Ôy €3; ( 0.6 ) 
tandis que : : 
0F 0F 

en X En DE 6ez. (20.62) 


Les vecteurs normaux à le paramétrage pointent dans le même sens. 
Si par contre nous prenons le paramétrage 


G: ]0,1[ x ]0,1[ — R° 


(20.63) 
(x, y) Es (æ, (1 = y), 0), 
nous avons °G 5G 
m'a % (20.64) 


etsig=G loF, alors Jy = —1. 
L'orientation d’une carte montre donc si le vecteur normal à la surface pointe d’un côté ou de 


l’autre de la surface. 
DEFooSWREooNdQpdA 


Définition 20.16 (Variété orientable). 
Une variété M est orientable si il existe un atlas de M tel que deux cartes quelconques ont 
toujours même orientation. Une variété est orientée lorsque qu'un tel choix d’atlas est fait. 


Proposition 20.17. 
Soit M, une variété orientable et un atlas orienté {F;: W; — R}. Alors le vecteur unitaire 


or Ca 

de OU) X GT 

5 5 (20.65) 
15 (& PR 9) 


ne dépend pas du choix de F parmi les F;. 


Démonstration. Considérons deux cartes F1 et F2, ainsi que l’application h = F; lo F1. Écrivons 
le vecteur ©, F1 x @,F1 en utilisant F, = F2 0 h. D'abord, par la règle de dérivation de fonctions 
composées, 


o(P O h) L 0P Ch: 0P Cha 


| 20.66 
Ox 0x 0x y 0x 

Après avoir fait le même calcul pour fgenl, nous pouvons écrire 
0x(P2 O h) x Oy(Æ2 O h) = (0rh10% F2 + Oxh20yP2) X (Oyh1 Or F2 + Oyh20y F3). (20.67) 


Dans cette expression, les facteurs 0;h; sont des nombres, donc ils se factorisent dans les produits 
vectoriels. En tenant compte du fait que ©:F2 x © F2 = 0 et ©,F2 x 04F2 = 0, ainsi que de 
l’antisymétrie du produit vectoriel, l'expression se réduit à 

( F3 


ES X me) (0x h1 0yho = Oxh20yh2). (20.68) 


Par conséquent, 


: dù © 


°F OF 0(P O h) 0(P2 O h) 0P °F 
X X = 
Ôx °y 0x y 


) det Jp. (20.69) 


Donc, tant que J} est positif, les vecteurs unitaires correspondants au membre de gauche et de 
droite sont égaux. 
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Corolaire 20.18. 
Si nous avons choisi un atlas orienté pour la variété M, nous avons une fonction continue G: M — 
R? telle que |G{(p)| = 1 pour tout pe M. Cette fonction est donnée par 


Œ (x, y) X ÆŒ (x, y) DefCarte j 
NUS dv if 
MA RE EE der] CE) 


sur l’image de la carte F. 


Démonstration. La fonction Gest construite indépendamment sur chaque carte F(W) en utilisant 
la formule (20.70). Cette fonction est une fonction bien définie sur tout M parce que nous venons 
de démontrer que sur F1(W1) n F2(W2), les fonctions construites à partir de F; et à partir de F2 
sont égales. 


Il est possible que prouver, bien que cela soit plus compliqué, que la réciproque est également 


vraie. 
PROPooGHXTooPrAESF 


Proposition 20.19. 

Une variété M de dimension 2 dans R° est orientable si et seulement si il existe une fonction 
continue G': M — R? telle que pour tout pe M, le vecteur G(p) soit de norme 1 et normal à M 
au point p. 


20.4 Longueur, aire, volumes etc. 


Grâce à la mesure de Lebesgue (définition 14.242), nous avons la définition d’aires dans IR? 
et de volumes dans R°. Dans tout ce qui suit, nous considérons toujours la tribu de Lebesgue, la 


mesure de Lebesgue, et l'intégrale de Lebesgue correspondante. 
DEFooPZRDooWbbBXy 


Définition 20.20. 
L'aire de la partie mesurable S de R? est le nombre 


J 15 (20.71) 
R2 


au sens de l'intégrale pour la mesure de Lebesgue de la fonction caractéristique de la partie S. 


Définition 20.21. 
Le volume de la partie mesurable V de R° est le nombre 


| ly (20.72) 
R3 


au sens de l’intégrale pour la mesure de Lebesgue de la fonction caractéristique de la partie V. 


Ceci est bien beau, mais ne permet pas de définir l’aire d’une surface dans R?, ni une longueur 
dans R?. Nous n’avons pas encore défini ce que nous appelons une surface dans R?, mais selon 
toute définition raisonnable, si S en est une, elle sera négligeable au sens de la mesure de Lebesgue 
dans R° et nous aurons toujours 


J 15 — 0. (20.73) 
R3 

L'objet de ce chapitre sera de donner un sens aux notions de longueurs dans R?, de surfaces 
dans R° et d’y définir des intégrales permettant de définir longueurs et aires. 
20.4.1 Quelques aires faciles 


Nous nous souvenons de la proposition 11.34 qui donnait une bonne propriété du produit 
vectoriel dans R°. Nous en donnons une autre. 
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LEMooVHGKooDjcfOL 
Lemme 20.22. 
L'aire d’une droite dans R? est nulle. 


Démonstration. Nous considérons la mesure le Lebesgue À sur R et une droite À dans R?. 
La mesure dans R? est donné par la définition 14.242 qui demande de calculer les intégrales 
(14.743) : 
824) = | 


R 
où A2(x) = {ye R tel que (x,y) € A} et Ai(y) = {x e R tel que (x, y) € A}. 
En vertu du lemme 12.152, cette droite est soit d’équation y = ax + b, soit d’équation x = a. 


A(4))ax(e) = [Aa FPE 


(1) Droite y = ax +b Dans ce cas, A2(x) = {ax + b}. C’est un singleton et nous avons 
X(4(x)) = 0 pour tout &. Nous avons donc (À @ À)(A) = 0. 
(2) Droite x = a Nous utilisons la seconde possibilité laissée par l'égalité (20.74). L'ensemble 


A1 est facile à déterminer : A1(y) = {a} pour tout y. Donc A(A:(y)) = 0 pour tout y, et 
l'intégrale est nulle. 


Remarque 20.23. 
Dans la preuve de 20.22, nous aurions pu faire le cas x = a en utilisant la première formule. Dans 
ce cas nous serions partis de 


At La ne (20.75) 


et donc de 
dd siT—=a 


X(A(x)) = (20.76) 


O0 sinon. 


Le lemme 14.167 nous dit que l’intégrale de A2 sur R est nulle. 
DEFooDTFCooCTdaDO 
Définition 20.24. 


Soient a, u1 et u dans R°. Le parallélogramme basé en a formé sur u1 et u2 est l’ensemble 
{a + sui + tua tel que 0 <t<1,0<s<1}. (20.77) 


Assez souvent, nous supposeront que u1 et u2 ne sont pas colinéaires. 
PROPooAVVNoo001Szr 


Proposition 20.25. 
L'aire® du parallélogramme basé en a et formé sur u et v (que nous supposons n'être pas coli- 
néaires) est donnée par 

fu x vu] = Juju2 — vil. (20.78) 


Démonstration. En vertu de la définition 20.20 d’une aire, le nombre à calculer est | D 1dA où 
Do = {a + œu + y tel que x € [0,1],ye [0,1]}. (20.79) 


En posant 
D = {a + œu + yv tel que x € ]0,1[,ye ]0,1[}, (20.80) 


Ï a= | dx, (20.81) 
Do D 


parce que ce que nous avons enlevé sont des segment de droites alors que les droites sont de mesure 
nulle (lemme 20.22). 


nous avons 


5. Définition 20.20. 
6. Définition 20.24. 
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Nous considérons la paramétrisation 


g: ]0,1[ x ]0,1[ — D 


20.82 
(x,y) + a + œu + yv. 


Pour le théorème 14.290, nous devons montrer que @ est un C!-difféomorphisme. Comme nous 
sommes un peu fatigués, nous allons seulement prouver @ est injective ”. Supposons que @(x1,x2) = 


®(y1, y). Alors 


(1 — xo)u + (y1 — ya)v = 0. (20.83) 

Si y — Y2 = 0, alors +1 — x2 = 0 et on est bon. Sinon, 
= (20.84) 

Y1 — Y2 


Vu que les vecteurs u et v ne sont pas colinéaires, nous en déduisons que z1 — æ2 = 0 et on est 
encore bon. 

Nous utilisons la formule (14.885) de changement de variable avec la fonction 6. Le jacobien à 
calculer est 


_ (drP1)(r,y) (0:02)(x,y)\ ui U2\ en 
J = det Dore = det É “) = [ui v2 il 2|. (20.85) 


Le lien avec le produit vectoriel est un petit abus de notation : il s’agit du produit vectoriel 
entre (ul,u2,0) et (v1,v2,0) qui peut être obtenu en utilisant directement la formule de définition 
(11.73). 


20.5 Autres théorèmes de points fixes 
SECooDWMPooWZgzRZ 
En termes de théorème de points fixes nous avons déjà vu le théorème de Picard 17.37. Voir 
aussi le thème 64. 


20.5.1 Brouwer 


Proposition 20.26. 
Soit f:[a,b] — [a,b] une fonction continue. Alors f accepte un point fixe. 


subSecZCCmMnQ 


Démonstration. En effet si nous considérons g(x) = f(x)—x alors nous avons g(a) = f(a)—a > 0et 
g(b) = f(b) —b < 0. Si g(a) ou g(b) est nul, la proposition est démontrée ; nous supposons donc que 
g(a) > 0 et g(b) < 0. La proposition découle à présent du théorème des valeurs intermédiaires 10.89. 


Exemple 20.27. 
La fonction x + cos(x) est continue entre [—1,1] et [—-1,1]. Elle admet donc un point fixe. Par 
conséquent il existe (au moins) une solution à l'équation cos(x) = x. A 
PROBooSSOBooCsovCy 

ii Avertissement /question à la lectrice !! 20.28 
La démonstration de la proposition 27.73 souffre de quelques problèmes. Voir en particulier la 
question et la réponse dans [560]. 

En fait, prouver réellement ce théorème via le théorème de Stokes nous mènerait trop loin. Si 
vous voulez le faire, n'hésitez pas à compléter. Mais sachez qu'il faudra d’abord définir complètement 


l’intégration sur des variétés. 
THOooZMUAooSP1qUx 


Théorème 20.29 (Brouwer dans R”, version continue). 
Toute application continue® B(0,1) — B(0,1) admet un point fire. 


7. Pour le reste, écrivez l'inverse explicitement, et prouvez que c’est C. Si ça pose problème, écrivez-moi parce 
que je n’ai pas vérifié. 
8. Une fonction continue sur un fermé de R" est à comprendre pour la topologie induite. 
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Une démonstration se basant sur la version C'© est dans 27.74, mais la version C® se base sur 
le théorème de Stokes. 


20.5.2 Théorème de Schauder 


Une conséquence du théorème de Brouwer est le théorème de Schauder qui est valide en di- 


mension infinie. 
ThovHJXIU 


Théorème 20.30 (Théorème de Schauder{561]). 
Soit E, un espace vectoriel normé, K un convexe compact de E et f: K — K une fonction 
continue. Alors f admet un point fixe. 


Démonstration. Étant donné que f: K — K est continue, elle y est uniformément continue. Si 
nous choisissons € alors il existe 0 > 0 tel que 


1 f(x) — f(y)] < € (20.86) 


dès que |x — y| < 6. La compacité de K permet de choisir un recouvrement fini par des ouverts 


de la forme 
Ke U B(r;,0] FER, 


1<i<p 


où {21,...,2p} © K. Nous considérons maintenant L = Span{f(x;) tel que 1 < j < p} et 
era (20.88) 


Le fait que K et L soient convexes implique que K* est convexe. L'ensemble K* est également 
compact parce qu’il s’agit d’une partie fermée de K qui est compact (lemme 7.91). Notons en 
particulier que K* est contenu dans un espace vectoriel de dimension finie, ce qui n’est pas le cas 
de KX. 

Nous allons à présent construire une sorte de partition de l’unité subordonnée au recouvrement 
(20.87) sur Æ (voir le théorème 27.65). Nous commençons par définir 


Vj(x) = L el (20.89) 


1 — les sinon. 


pour chaque 1 < j < p. Notons que 4; est une fonction positive, nulle en-dehors de B(x;,0). En 
particulier la fonction suivante est bien définie : 


eg) = Se) 


Se (20.90) 


et nous avons D p;(x) = 1. Les fonctions 4; sont continues sur K et nous définissons finalement 
p 
g(x) = D pi(x)f(x5). (20.91) 
j=1 


Pour chaque x € K, l'élément g(x) est une combinaison des éléments f(x;) € K*. Étant donné que 
K* est convexe et que la somme des coefficients ;(x) vaut un, nous avons que g prend ses valeurs 
dans K* par la proposition 8.29. 

Nous considérons seulement la restriction g: K* — K* qui est continue sur un compact contenu 
dans un espace vectoriel de dimension finie. Le théorème de Brouwer 20.29 nous enseigne alors que 
g à un point fixe. Nous nommons y ce point fixe. Notons que y est fonction du € choisi au début 
de la construction, via le Ô qui avait conditionné la partition de l’unité. 
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EqoXuTzE 
Nous avons | 4 


F(y) — y = f{y) — gay) (20.92a) 
D- De (20.92b) 


Dao 
= Let 


— f(x;)). (20.92c) 


Par construction, w;(y) Æ 0 seulement si |y — x;} < Ô et par conséquent seulement si | f(y) — 
f(x;)| < €. D'autre part nous avons 4;(y) > 0; en prenant la norme de (20.92) nous trouvons 


P P 
Lf(y) — yl < 2 AU — fa) < À vue = (20.93) 
j=1 j=1 


Nous nous souvenons maintenant que y était fonction de €. Soit y» le y qui correspond à € = 277. 
Nous avons alors 


| (um) — Um < 27. (20.94) 


L'élément y est dans K* qui est compact, donc quitte à choisir une sous-suite nous pouvons 
supposer que Ym est une suite qui converge vers y* € K °. Nous avons les majorations 


LAC) — A < AA) — Fm) | + NÉ) — Ymll + Îym — 9°]: (20.95) 


Si m est assez grand, les trois termes du membre de droite peuvent être rendus arbitrairement 
? 
petits, d’où nous concluons que 


FG")=Y (20.96) 


et donc que f possède un point fixe. 


20.5.3 Théorème de Cauchy-Arzella 


ThoHNBooUïipgPXx 
Théorème 20.31 (Cauchy-Arzela[181]). 
PAR 
Nous considérons le système d’équation différentielles | 
y = f(t,y) (20.97a) 
y(to) = Yo. (20.97b) 


avec f: U — R”, continue où U est ouvert dans IR x IR”. Alors il existe un voisinage fermé V de 
to sur lequel une solution C1 du problème (20.97) existe. 


Idée de la démonstration. Nous considérons M = | f|, et K, l’ensemble des fonctions M-Lipschitz 
sur U. Nous prouvons que (K,|.|.) est compact. Ensuite nous considérons l’application 


GK —K 


t (20.98) 
P(f)(t) = xo + | f(u, f(u))du 
to 
Après avoir prouvé que ® était continue, nous concluons qu’elle a un point fixe par le théorème de 
Schauder 20.30. 


Remarque 20.32. 
Quelques remarques. 


9. Notons que même dans la sous-suite nous avons | f(ym) — Ym|| < 27°, avec le même « m » des deux côtés de 
l'inégalité. 
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(1) Les théorème de Cauchy-Lipschitz et Cauchy-Arzella donnent des existences pour des équa- 
tions différentielles du type y = f(t,y). Et si nous avons une équation du second ordre ? 
Alors il y a la méthode de la réduction de l’ordre qui permet de transformer une équation 
différentielle d'ordre élevé en un système d’ordre 1. 


(2) Ces théorèmes posent des conditions initiales : la valeur de y est donnée en un point, et la 
méthode de la réduction de l’ordre permet de donner l’existence de solutions d’un problème 
d'ordre k en donnant les valeurs de y(0), y/(0), ...y(®—1)(0). C'est-à-dire de la fonction et de 
ses dérivées en un point. Rien n’est dit sur l’existence de conditions aux bords. 


Ces deux points sont illustrés dans les exemples 32.17 et 32.18. 


20.5.4 Théorème de Markov-Kakutani 


Le théorème de Markov-Kakutani, nous donne l'existence d’une mesure de Haar sur un groupe 


compact. 
ThoeJCdMP 


Théorème 20.33 (Markov-Katutani[562]). 
Soit E un espace vectoriel normé et L, une partie non vide, convexe, fermée et bornée de E'. Soit 
T': L— L une application continue. Alors T a un point fire. 


Démonstration. Nous considérons un point x0 € L et la suite 


LL 
— T'xo. 20.99 
É n+l à Fe ( ) 


La somme des coefficients devant les T'(xo) étant 1, la convexité de L montre que x, € L. Nous 
considérons l’ensemble 


C' = R {Tm tel que m > n}. (20.100) 
neN 


Le lemme 7.286 indique que C n’est pas vide, et de plus il existe une sous-suite de (x,) qui converge 
vers un élément x € C. Nous avons 


lim z(n}(v) = t(v) (20.101) 


n— 00 


pour tout v € E. Montrons que x est un point fixe de 7. Nous avons 


o(k) o(k) 
1 
 —. _ Fe Ti Ti v)] 20.102 

I(Tx (k) — € &))v|| 1+0(k) 2 zo(v) — TE à zo(v ( a) 

_ L—— a 5> TH xo(v) — v) — T'xo(v)] (20.102b) 

= ro æo(v) — zo(v)| (20.102c) 

2M 
an (20.102d) 
où M = Ÿ er |y(v)| < © parce que L est borné. En prenant k — 0 nous trouvons 

lim Tr = Lo(k))V == 0, (20.103) 


k—00 


ce qui signifie que T'x = x parce que T' est continue. 
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20.6 Intégrales curvilignes 
secintcurvi 


20.6.1 Chemins de classe C! 


Définition 20.34 ([563]). 
Soit p,q € R". Un chemin C! par morceaux joignant p à q est une application continue 


DEFOooQTAWooUCmSJo 


7: [a,b] — R° (20.104) 


vérifiant : 
(1) L'application y: [a,b] — R" est continue. 
(2) Les extrémités : y(a) = p, y(b) = q 


(3) I existe une subdivision a = to < t1 < ... < ty_1 < tr = d telle que la restriction de + sur 
chaque fermé [t;,t;:1] est de classe C. 


Pour être d'accord sur les définitions, quand on dit qu'une application est C? sur un fermé, c’est 
qu’elle est C! sur ce fermé, avec la topologie de ce fermé (induite! de R). Autrement dit, toutes 
les limites et tous les ouverts qui interviennent dans la notion de « être C! » sont à prendre dans 
la topologie du fermé [a:;, b;]. 


Remarque 20.35. 
Si a et b sont des points de R”, on peut créer le chemin particulier 


7:[0,1]—R":te (1—-t)a +tb (20.105) 
qui relie ces points par un segment de droite. 


Il existe des fonctions C! par morceaux qui ne sont pas C1. 


Proposition 20.36. 
L'application 
J:R—R 


ë sir <0 (20.106) 
TH 


2% six >0 


est C1 par morceaux. 
Elle n’est pas de classe C!. 


Démonstration. Le fait que f ne soit pas de classe C'! est immédiat parce que sa dérivée n’est pas 
définie en zéro. 
Pour montrer que f est C'! par morceaux, nous définissons les deux fonctions 


Ji: ]-—00, 0] — KR 


(20.107) 
TT 
et 
: [0,|[ — R 
f2: 10,œ (20.108) 
ze 2x. 
Nous calculons la dérivée de f1 en x = 0. C’est par définition 
pa AO Me) (20.109) 
z—0 x z—0 Z 


Attention : cette limite est à comprendre au sens de la topologie de |—,0]. Nous allons montrer 
que cette limite vaut 1, en remontant aux définition pour le sport. 


10. Topologie induite, définition 7.24. 
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Posons g(x) = f(x)/x. Si V est un voisinage de 1 dans R, il existe une boule B(1,r) qui contient 
V. Nous allons trouver un € > 0 tel que g(B(0,e)\{0}) « B(1,r). Attention : à gauche c’est une 
boule au sens de la topologie induite. Au sens de la topologie normale, nous cherchons € > 0 tel 
que 


g((8(0,9 n]-%,0])\{0})) (20.110) 


Bref, pour tout x dans cette boule, nous devons avoir |g(x) — 1] < r. Vu que x € [—-c,0]\{0}, nous 
avons g(x) = 1 pour tout x. Et voila, n'importe que € fait l’affaire. 
Nous avons prouvé que la dérivée de f1 est donnée par 


fi: 100,0] — R 


(20.111) 
x 1. 


Elle est continue. Nous laissons la démonstration de la continuité de f{ au lecteur; attention : 
continuité pour la topologie induite, toujours. Bref, f1 est de classe C!. 
Nous démontrons de même que f2 est de classe C? et que f(x) = 2 pour tout x. 


20.6.2 Intégrer une fonction 
DEFooFAYUooCaUdyo 


Définition 20.37. 
Soit f : D € R" — R une fonction continue, et y : [a,b] — D un chemin CT. On définit 
l’intégrale de f sur 7 par 


[ra-fr-| TOO US 


Note : dans le cadre de l’analyse complexe, ce n’est pas exactement cette définition. Voir 26.5. 


Exemple 20.38. 
Soit l’hélice 


o: [0,27] — R° 
cos(t) (20.113) 
tr | sin(t) |, 
! 


et la fonction f(x, y, 2) = x? + y? + 2?. L'intégrale de f sur o est 
27 
J pe Î (cos? + + sin2+ + 2)|o/(t)|dt 
©œ 0 


= [a + 4?) V2dt 


| a. 4h (20.114) 
= 42 (2 + ) 
A 


Remarque 20.39. 
Si f = 1, alors nous tombons sur 


b 
Î ds = J | (6) dt, (20.115) 
7 a 


Nous verrons par le théorème 21.9 que cette dernière intégrale est la longueur de la courbe. Il est 
un fait général que l’intégrale de la fonction 1 sur un ensemble en donne la « mesure ». Cela est à 
mettre en rapport avec le lemme 14.170 en gardant en tête que h 1 n’est pas la mesure de l’image 
de y dans R?. 


1760 CHAPITRE 20. INTÉGRATION SUR DES VARIÉTÉS 


Proposition 20.40 (Indépendence en le paramétrage). 
La valeur de l’intégrale de f sur y ne dépend pas du paramétrage (équivalent ou pas) choisi. 


Démonstration. Soit donc un chemin +: [c, d] — IR* ainsi que @: [c, d] — [a,b], un reparamétrage 
de classe C!, strictement monotone et le chemin © définit par 7(s) = o(p(s)) avec s € [c, d]. En 
supposant que w’(s) > 0, nous avons 


d 
re Î = J f((s))ln/(s)lds 
L . (20.116) 


| [r(otets)) lo’ (e(s))lle/(s)lds. 


C 


Pour cette intégrale, nous posons = w(s), et par conséquent dt = w/(s)ds. Étant donné que 
p'(s) > 0, nous pouvons supprimer les valeurs absolues, et obtenir 


p(d) 
Fe J f(o(#)}llo/(t) dt 
g(c) 


- | ETOILO (20.117) 


L: 


Essayez de faire le cas /(s) < 0. 
RemiqswPd 


Remarque 20.41. 
Attention : les intégrales sur des chemins dans € ne sont la même chose. En effet € doit être 
souvent plutôt traité comme IR que comme R?. Si + est un chemin dans C, l'intégrale 


Î Î (20.118) 
. 


doit être comprise comme une généralisation de ç f(æ)dx et non comme l'intégrale sur un chemin. 
La différence est qu’en retournant les bornes d’une intégrale usuelle sur IR on change le signe, alors 
qu’en retournant un chemin dans IR?, on ne change pas. Bref, la définition est que si y: [a,b] — © 
est un chemin, alors 
b 
[r- [ro - [ r0w) 08, (20.119) 
+ % a 


sans valeur absolue autour de y/(t). 


20.6.3 Intégrer un champ de vecteurs 
DEFooSHHFooVdsxMf 


Définition 20.42. 
Un champ de vecteur est une application G : IR" — IR. On définit l'intégrale de G sur un 
chemin 7 : [a,b] — R”? par 


b 
Î ce J CON ION 
07 a 


Remarque 20.43. 
Cette définition ne dépend pas du paramétrage choisi, mais le signe change selon le sens du chemin. 


20.6.4 Intégrer une forme différentielle sur un chemin 


La formule d’intégration d’un champ de vecteur !!, 


[e-f" «otre (20.120) 
7 [ab] 


11. Définition 20.42. 
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contient quelque chose d’intéressant : la combinaison {G(y(t)),7(t)). Cette combinaison sert à 
transformer le vecteur tangent (ft) en un nombre en utilisant le produit scalaire avec le vecteur 
GE). 

Si G est un champ de vecteur sur IR”, et si x € IR", nous pouvons utiliser l’isomorphisme 
musical (définition 12.635) 


G:R°'—R 
(20.121) 
vi (G(x),v) 
pour écrire de façon plus compacte : 
Î G=| Go(r(t)d. (20.122) 
‘ [ab] 
DEFooRMHGooFtMEPB 


Définition 20.44. 
Soient une forme différentielle w sur R" et un chemin de classe C! +: [a,b] — R". L'intégrale 


de w sur y est définie par 
b 
Î w = J w(e 7 (t)dt FT ASS) 
7 a 


Remarque 20.45. 
Cette définition ne dépend pas du paramétrage choisi, mais le signe change selon le sens du chemin. 


20.6.5 Intégration d’une forme différentielle sur un chemin 


Les formes intégrales que nous avons déjà vues sont celles de fonctions et de champs de vecteur 
sur des chemins. Si y: [a,b] — IR” est le chemin, les formules sont 


Î = | fh@) In It 
7 [ab] 


(20.124) 
[e-f Go) rio. 
7 [ab] 


Dans les deux cas, le principe est que nous disposons de quelque chose (la fonction f ou le vecteur 
G), et du vecteur tangent y/(t), et nous essayons d’en tirer un nombre que nous intégrons. Lorsque 
nous avons une 1-forme, la façon de l’utiliser pour produire un nombre avec le vecteur tangent est 
évidemment d’appliquer la 1-forme au vecteur tangent. La définition suivante est donc naturelle. 


Définition 20.46. 
Soit y: [a,b] — R”, un chemin de classe C! tel que son image est contenue dans le domaine D. Si 
w est une 1-forme différentielle sur D, nous définissons l’intégrale de w le long de 7 le nombre 


[u- foutre 
b 


(20.125) 
A CCOT CEE CO OI 


Cette définition est une bonne définition parce que si on change le paramétrage du chemin, on 
ne change pas la valeur de l'intégrale, c’est la proposition suivante. 


Proposition 20.47. 
Si et B sont des chemins équivalents, alors 


[=- Le (20.126) 


c’est-à-dire que l'intégrale est invariante sous les reparamétrages du chemin. 
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Démonstration. Deux chemins sont équivalents quand il existe un difféomorphisme CT h: [a,b] — 
[c, d] tel que y(t) = (Boh)(t). En remplaçant 7 par (80h) dans la définition de É w, nous trouvons 


b 


b 
J ws(o (7 (#))dt = J &(8on)(9 (8 0 h)'())dt. (20.127) 


a a 


Un changement de variable u = h(t) transforme cette dernière intégrale en 5 w, ce qui prouve la 
proposition. 


Remarque 20.48. 
Si + est une somme de chemins, + = +) +... +0), où chacun des +) est un chemin, alors 


fe É > L ” (20.128) 


parce que w est linéaire. 


Remarque 20.49. 
Si —7 est le chemin 


(20.129) 


[Le = -fe (20.130) 


c’est-à-dire que si l’on parcours le chemin en sens inverse, alors on change le signe de l’intégrale. 


alors 


L'intégrale d’une forme différentielle sur un chemin est compatible avec l’intégrale déjà connue 
d’un champ de vecteur sur le chemin parce que si G est un champ de vecteurs, 


[&-fe. (20.131) 
7 7 
En effet, 


= J CON ERECO) AC OR 0) 
a (20.132) 


Proposition 20.50. 
Soit w = df, une 1-forme exacte et continue sur le domaine D. Alors la valeur de E df ne dépend 
que des valeurs de f aux extrémités de 7. 


Démonstration. Nous avons 


ÉCROr Pr 
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20.6.6 Interprétation physique : travail 


Définition 20.51 ([564]). 
Une force F: D CR" — R'" est conservative si elle dérive d’un potentiel, c’est-à-dire si il existe 
une fonction V e C(D,R) telle que 


F(x) = (VV )(x). (20.134) 
Étant donné que F est un champ de vecteurs, nous avons une forme différentielle associée F”, 
F:vr (F(x),v). (20.135) 


Lemme 20.52. 
Le champ F est conservatif si et seulement si la 1-forme différentielle F° est exacte. 


Démonstration. Supposons que la force F' soit conservative, c’est-à-dire qu’il existe une fonction 
V telle que F = VV. Dans ce cas, il est facile de prouver que F° est exacte et est donnée par 
F? = dV(x). En effet, 


Fev) = (F(x),v) 
= Fi(c)ui +: + Fi(t)un 
OV OV (20.136) 
= Ze (0 Re 2, (2)0n 
= dV(x)v. 


Pour le sens inverse, supposons que Æ” soit exacte. Dans ce cas, nous avons une fonction V 
telle que F° = dV. Il est facile de prouver qu’alors, F = VV. 


En résumé, nous avons deux façons équivalentes d'exprimer que la force F' dérive du potentiel 
V : soit nous disons F = VV, soit nous disons F° = dV. 


Proposition 20.58. 
Si F est une force conservative, alors le travail"? de F lors d’un déplacement ne dépend pas du 
chemin suivi. 


Démonstration. Le travail d’une force le long d’un chemin n’est autre que l’intégrale de la force le 
long du chemin, et le calcul est facile : 


W,(F) J F J dV = V(x(b)) - V{a(a)). (20.137) 
7 : 


Donc si 5 est un autre chemin tel que Ba) = (a) et B(b) = 7(b), nous avons Wa(F) = W,(F). 


20.6.7 Intégrer un champ de vecteurs sur un bord en 2D 
Si D & R? est tel que 0D est une variété de dimension 1 et tel que D accepte un champ de 


vecteur normal extérieur unitaire v. Si nous voulons définir 


ei (20.138) 
0D 


le mieux est de prendre un paramétrage y: [0,1] — IR? et de calculer 


1 . 
(6) 
Ge, dt. (20.139) 
| DAS TO] 
Hélas, cette définition ne fonctionne pas parce que son signe dépend du sens du paramétrage +. Si 
le paramétrage tourne dans l’autre sens, il y a un signe de différence. 


12. Voir [565]. 
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Nous allons définir 


L e-[ewro EarntVectbgraens 
0D 0 


où T(t) = Y(t)/|5(t)| et où y est choisi de telle façon que la rotation d'angle 7? amène v sur T. 
Cela fixe le choix de sens. 

Ce choix de sens aura des répercussions dans l’application de la formule de Green et du théorème 
de Stokes. 


20.6.8 Intégrer une forme différentielle sur un bord en 2D 


Nous n’allons pas chercher très loin : 


| u=| w, (20.141) 
0D oD 


c’est-à-dire que l'intégrale de la forme différentielle est celle du champ de vecteur associé. Le 
membre de droite est défini par (20.140), avec le choix d’orientation qui va avec. 
20.6.9 Intégrer une forme différentielle sur un bord en 3D 


Nous allons maintenant intégrer une forme différentielle sur certains chemins fermés dans R°. 
Soit F(D) € R*, une variété de dimension 2 dans R° où F: D € R? — R° est la carte. Nous 
supposons que D vérifie les hypothèses de la formule de Green. Alors nous définissons 


] = | F* ess 
F(@D) 


où F*w est la forme différentielle définie sur 0D par (F*w)(v) = w(dF(v)). 
Cette définition est très abstraite, mais nous n’allons, en pratique, jamais l'utiliser, grâce au 
théorème de Stokes. 


20.6.10 Intégrer un champ de vecteurs sur un bord en 3D 


Encore une fois, nous n’allons pas chercher bien loin : 


J G = ci (20.143) 
F(0D) F(6D) 


où G? est la forme différentielle associée au champ de vecteur. Le membre de droite est défini par 
l'équation (20.142). 


20.6.11 Dérivées croisées et forme différentielle exacte 


EqskfgfN 
Nous considérons le problème suivant : trouver une fonction f: R? — R telle que | LS 
0 
cf = a(x,y) (20.144a) 
Of 
— = b(x, 20.144b 
SE = Ua) (20.144b) 


où a et b sont des fonctions supposées suffisamment régulières. Nous savons que ce problème n’a 
pas de solutions lorsque 


a ©b 
— £ — 20.14 
0y “ Ox 0) 


parce que cela impliquerait Œ fee Fe f. Nous sommes en droit de nous demander si la condition 


a  ©b 
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impliquerait qu’il existe une solution au problème (20.144). La réponse est oui, et nous allons 
brièvement la justifier. Pour plus de détails nous vous demandons de chercher un peu. La référence 
[566] peut être utile. 


Proposition 20.54. 
Si a et b sont des fonctions qui satisfont à la condition 


Ca  ©b 
ae =. 20.14 
alors la fonction - : 
f(x, y) -| att,o)at + | b(x, t)dt #80 148) 
0 0 
répond au problème 
of 
= a(z, y) (20.149a) 
of 
 — 20.14 
dy b(x, y) (20.149b) 


La preuve qui suit n’en est pas complètement une parce qu’il manque des justifications, no- 
tamment au moment de permuter la dérivée et l'intégrale. 


Démonstration. La clef de la preuve est le théorème fondamental de l’analyse : 


=. y)dt — 20.1 
; Sa v)dt = f(x, y) (20.150) 
et son pendant par rapport à y : 
y 
O1 (x, tydt = f(x, y). (20.151) 
o Ôy 


En appliquant ces version du théorème fondamental, nous obtenons immédiatement. 


Of 
=D . 20.152 
SL = ben) (20.152) 
En ce qui concerne la dérivée par rapport à y, 
Of Y ©b 
EE un 20.1 
2x a(x, 0) + Lo (x, t)dt (20.153a) 
ÿ Oa 
= a(x,0)+ | —(x,t)dt (20.153b) 
o 0y 
= a(x,0) + [a(x,t)]=4 (20.153c) 
= ax; y): (20.153d) 


En ce qui concerne l’unicité, supposons que f et g soient deux solutions au problème. L’équation 


= als ul °9 (20.154) 
0x Ôx 


implique que 
Je, y) = gx, y) + C(y) (20.155) 


où C est une fonction seulement de y. L'autre équation implique 


f(x, y) = g(x,y) + D(x) (20.156) 
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où D est seulement une fonction de x. En égalisant nous voyons que les fonctions C' et D doivent 
être des constantes. 

Par conséquent la fonction f est donnée à une constante près et en réalité la fonction (20.148) 
est suffisante pour répondre au problème de trouver toutes les fonctions dont les dérivées partielles 
sont données par les fonctions a et b. 

La fonction f ainsi créée est un potentiel pour le champ de force 


F(x,y) = Le a (20.157) 


Notez que ce champ de vecteurs est le gradient de f. La question initiale aurait donc pu être posée 
en les termes suivants : trouver une fonction f dont le gradient est donné par 


Vf = . oi | (20.158) 


20.7 Surfaces paramétrées 


De la même façon qu’un chemin dans R° est décrit comme une application o: IR — R°, une 
surface dans IR? sera vue comme une application @: IR? — R°. Une surface paramétrée dans 


R* est une application 
pp: DcR?'—R° 


æ(u, v) (20.159) 
(u, v) r? pu, v) = y(u, v) | 
Nous allons parler de la « surface 4 » pour désigner l’image de 4 dans R?. 
Si on fixe le paramètre u = wo, alors l’application 


ur p(uo,v) (20.160) 


est un chemin dans la surface. Un vecteur tangent à ce chemin sera tangent à la courbe : 


0 de (0, vo) 
So (uor vo) = | A Cuo, vo) |: (20.161) 
SE (uo, vo) 
De même, en fixant vo, on considère le chemin 
u + p(u, vo). (20.162) 


Le vecteur tangent à ce chemin est égalent tangent à la surface : 


. du (D, V0) 
ie = + (Uo, vo) (20.163) 
52 (uo, vo) 


DefSurfReguliere 
Définition 20.55. 
Nous disons que la surface est régulière si les vecteurs 0,w(uo, vo) et C(uo, vo) sont non nuls et 
non colinéaires. 


Si la surface est régulière, les vecteurs tangents au paramétrage forment le plan tangent à la 
surface au point w(uo, vo). 

Un vecteur orthogonal à la surface (et donc au plan tangent) est donc donné par le produit 
vectoriel : 


Ô Ô 
n(uo, vo) = 2 (uo, vo) x 2 (uo, vo). (20.164) 
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L’équation du plan tangent est alors obtenue par 
_ EdPlanTgSurfaçceP 
y — yo | * A(uo, vo) = 0 (0.168) 
Z — 20 
où to = t(uo, Vo), Yo = Y(Uo, vo), Zo — Z(Uo, Vo). 
20.7.1 Graphe d’une fonction 
Soit la fonction f: D € R? — R. Le graphe de f est l’ensemble des points de la forme 


(x, y, f(x, y)) (20.166) 


tels que (x, y) € D. Cela est une surface paramétrée par 


p: D—R° 
__. y (20.167) 
f(x, y) 


Les vecteurs tangents sont 


1 
0p 0 of 


Lee 20.168 
ox of]  ©y of ) 


La surface est donc partout régulière parce que ces deux vecteurs ne sont jamais nuls ou colinéaires. 
Un vecteur normal à cette surface au point (x0, Yo, f(xo, Yo)) est donné par le produit vectoriel 


Ex y ez . of 
n=|1 0 @f(xo,y)l = 3 (0: Y0)ex — 3, (0: vo)ey +e,. (20.169) 
1 ©yf(xo, Yo) 


LT — TG —&e (0. v0) 
y— yo | | —$(xo.v0) | 0, (20.170) 
7 — 20 1 
c'est-à-dire 
Of Of 
(5 to) (0; Uo) — (y — Yo) (0; Yo) + < — (ro, Yo) = 0, (20.171) 
x ©y 
ce qui revient à 
Of Of 
2 — f(xo; Yo) = ax 0: Yo) (x — &o) + EM yo)(y — Yo). (20.172) 


Nous retrouvons donc l’équation du plan tangent à un graphe. 


Exemple 20.56. 
La sphère de rayon R peut être paramétrée par les angles sphériques : 


R sin 0 cos w 
(8,4%) = | Rsinbsinv (20.173) 
R cos 0 


avec (0,4) € [0,x] x [0,2x|. 
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Tentons d’en trouver le plan tangent au point (x,y,2) = (R,0,0). Un petit dessin nous montre 
que c’est un plan vertical d’équation x = R. Montrons cela en utilisant la théorie que nous venons 
de découvrir. D'abord le point (R,0,0) correspond à 4 = % et 4 = 0. Les vecteurs tangents sont 


R cos 0 cos 0 
To = OR, 70) = | Rcosôsinp |= | 0 |, FaTthet42i) 
—Rsin 0 —R 
et 
— À sin 0 sin 0 
0 EqT 
1 ?(R L. 0) = | RsinOcosy |=|R|. É TIR) 
0p 2 0 0 


Cela sont de toute évidence bien les deux vecteurs tangents à la sphère au point (x, y, z) = (R,0, 0). 
Le vecteur normal est 
Ex “Eye (eg 
0 O0 —R|= R?e,. (20.176) 
0 R 0 


Ici encore, nous avons le vecteur que nous attendions sur un dessin. L’équation du plan tangent 
est maintenant 


z—R PF 
y |: [o|=0, (20.177) 
Zz 0 
c’est-à-dire R?(x — R) = 0 et donc x = R. A 


20.7.2 Intégrale sur une partie de R”” 


Soit M une variété de dimension n dans R°”. Soit F : W € R" — M un paramétrage d’un 
ouvert relatif de M. 

Si f est une fonction définie sur un sous-ensemble À € F(W) tel que F—!(A) est mesurable, 
l'intégrale de f sur A est définie par 


Lr- [2 fc) Var) 7rtupau 
A F-1(4) 


où l'intégrale est l'intégration usuelle (de Lebesgue) sur F!(A) € R". On écrit parfois cette 
intégrale Îr-1(4) f(F(w))do où 


do = /det(Jr(u) Jr(w))dw NES 


est l'élément infinitésimal de volume de la variété. 
Sim = 3 et n = 2, l'élément infinitésimal de volume vaut 


LORS 
Ow Owo 


do = dw 


où x représente le produit vectoriel dans RŸ, et (w1,w2) sont les coordonnées sur W € R?. Dans 
la suite, nous ne regarderons plus que ce cas. 


20.8 Intégrales de surface 
secintsurfaciques 
20.8.1 Intégrale d’un champ de vecteurs 


Dans l'intégration curviligne, on a noté que si l'intégrale d’une fonction ne dépendait pas 
de l'orientation du chemin, l'intégrale d’un champ de vecteurs ou d’une forme différentielle en 
dépendait. Ce problème d'orientation apparait également dans l'intégration sur des surfaces de 
l’espace. 
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DEFooFTQLooXXbtOQ 
Définition 20.57. 
Une orientation sur une surface S & R? est le choix d’un champ de vecteurs continu v : S — R° 
dont la norme en tout point de S vaut 1. 


On remarque qu'ayant fait un tel choix d'orientation (x) en un point x, le seul autre choix 
possible en x est —v(x). Si S est le bord d'un ouvert D € R*, l'orientation induite par D sur S 
est, si elle existe, l'orientation qui pointe hors de D en tout point de S. Plus précisément, il faut 
que pour tout x € D il existe € > 0 vérifiant, pour tout 0 < t < €, la relation tv(x) & D. Dans ce 
cas, le champ de vecteurs r est appelé le vecteur normal unitaire extérieur à D et il est forcément 
unique. 

Soit G un champ de vecteurs défini sur une surface orientée par un champ v. L'intégrale de G 
sur $, aussi appelée le flux de G à travers S, est 


J J Case | J (G, v) do. 6 150) 


S 


Si on suppose que la surface est paramétrée par une application 
F:WCR?-—R:{u,v)- (F(u,v), P(u,v),Fs(u,v)) 


alors un vecteur unitaire v peut s’écrire sous la forme 


oF k êF 
= ou Ov 
[SE or 


Ex | 


et grâce à ce paramétrage l'intégrale (20.179) devient 


Île . d$ = JC eureman. 3, . _ ua 


S 


où on utilise l'expression de do obtenue précédemment dans le cas qui nous intéresse (surface dans 
l’espace). 


20.9 Aires et intégrales 


20.9.1 Aire d’une surface paramétrée 


Lorsque nous avions vu la longueur d’une courbe paramétrée, nous avions pris comme « élément 
de longueur » la norme du vecteur tangent. Il est donc naturel de prendre comme « élément de 
surface » une petite surface que l’on peut construire à partir des deux vecteurs tangents à la surface. 

Au point w(uo, vo), nous avons les deux vecteurs tangents 


0 0 
Ta = SE (uo, vo) Ta = SE (uo, vo). (20.180) 


L'élément de surface que nous pouvons construire à partir de ces deux vecteurs est la surface du 

parallélogramme, donnée par la norme du produit vectoriel : 
E NYWS P 

dS = IT, x T,|. LS nt 


L'’aire de la surface donnée par w: D € R? — R* sera donc donnée par 


Aire(p(D)) = (l Tu x To |du dv. (20.182) 
D 
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Exemple 20.58. 
Calculons l’aire de la sphère. Les vecteurs tangents ont déjà été calculés aux équations (20.174) et 
(20.175) : 


R cos 4 cos & — R sin 0 sin 
To = | Rcosôsing |, T, = | RsinOcosp |. (20.183) 
— R sin 0 0 
Le produit vectoriel vaut 
Ex y é 
To XT;, = | RcosOcosp Rcosôsing —Rsin0 
—Rsin@siny Rsinôcosv 0 (20.184) 


= (R? sin? 0 cos )ez + (R? sin? 0 sin ve, 
+ (R? cos 8 sin 8 cos? + R? sin Ÿ cos 0 sin? w)e... 
La norme demande quelques calculs et mises en évidences. Le résultat est : 


(To x T| = R? sin 6. FaProdVepies 


L’aire de la sphère est donc donnée par 
27 T 
Aire = Î dy Î R? sin 0d0 = 2 R?[- cos 0]% = 4m R?. (20.186) 
0 0 


Il est bon de se souvenir que, en coordonnées sphériques, 
ÎTe x To] = R? sin 0. (20.187) 


Or nous savons que ce vecteur est dirigé dans le sens de e,; parce que ce dernier est le vecteur qui 
est constamment dirigé radialement. En coordonnées sphériques nous avons donc 


To x T,, = R?sin(8)e,. Fate TRE) 
A 


Remarque 20.59. 
L'équation (20.185) donne l’élément de surface pour la sphère. Notez que cela est justement l’ex- 
pression du jacobien des coordonnées sphériques. Cela n’est évidemment pas une coïncidence. 


Exemple 20.60. 
Nous pouvons donner l’aire du graphe d’une fonction quelconque. La surface est paramétrée par 


x 
px y)= | y |: (20.189) 
f(x, y) 
Les vecteurs tangents sont 
1 0 
BE = 0 L Gel (20.190) 
Oxf Oyf 
Le produit vectoriel est donné par 
Ex Ey Cz 


L ôf 2 of 2 
is /(A) + (0) 4 0209 
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et la surface du graphe sera 


es [eu) 7 (en) Lésd (20.193) 
D 


VAS 
20.9.2 Intégrale d’une fonction sur une surface 
Si S est une surface dans R° paramétrée par 
po: D—R° 
(20.194) 


(u,v)r pluv)es, 
et si f est une fonction f: R° — R définie au moins sur S, l'intégrale de f sur S est logiquement 
définie par 


I Faÿ = J ] feu, v))|Tatu, v) x To(u, 0) |dudo (20.195) 
5 D 


a 
(7 


et T, = de, La quantité 


où 1}, = ê 
ITatu,v) x T(u,v)|dudu (20.196) 


est appelé élément de surface. 
Encore une fois, si on prend f = 1, alors on retrouve la surface de S : 


J ist): (20.197) 
S 


Remarque 20.61. 
Le nombre Va fdS ne dépend pas de le paramétrage choisie pour S$. 


20.9.3 Intégrale d’une 2-forme 
Nous considérons w, une 2-forme différentielle sur IR?. 


Définition 20.62. 
Si Dry) = U(x,y)dx À dy et si D est un ouvert de R? alors nous définissons 


Lo = le add (20.198) 


Nous voulons maintenant intégrer une 2-forme sur une surface dans R?. Soit S & R*, une 
surface orientée (c’est-à-dire que nous avons un choix continu d’un vecteur normal unitaire n). 
Nous supposons de plus avoir un paramétrage D: D — S de S avec D ouvert dans R? compatible 
avec l'orientation, c’est-à-dire que pour tout (t,s) € D, 


n(o(t, s)) = (9 x Ds). (20.199) 


Définition 20.63. 
Pour intégrer w sur S nous faisons 


Le _ IL p*w (20.200) 


où ®*w est de la forme F(t,s)dt A ds. 
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Montrons ce que cela fait. Soient u,v des vecteurs de D et calculons 
(d*w)(u, v) = w(dé(u), dé(e)) (20.201) 
0 0 Q 
=wlu ‘à + u2 , V1 da + va És : (20.201b) 
O1 0x2 T1 


Les termes en uju1 et uav2 sont nuls; par exemple : 


0® 09 \ 00 0 \. 
w (agen) = UjUiW (CE =) 1 (20.202) 


parce que w est antisymétrique. Il nous reste donc 


(D'w)(u,v) = (urv2 — uovi)w (GE a) (20.203a) 
0 à 
= W (2. =) (dt À ds)(u, v). (20.203b) 


Cette dernière ligne est bien de la forme d*w = F(t,s)dt À ds. 


20.10 Flux d’un champ de vecteurs à travers une surface 


Nous voulons construire un moulin à eau. Comment placer les pales pour maximiser le travail 
de la pression de l’eau? On n’a pas attendu l'invention du calcul intégral pour répondre à cette 
question. Trois paramètres rentrent en ligne de compte : 

(1) plus il y a d’eau, plus ça pousse ; 

(2) plus la surface de la pale est grande, plus on va utiliser d’eau ; 

(3) plus la pale est perpendiculaire au courant, plus on va en profiter. 
Nous voyons sur la figure 20.2 que lorsque la pale du moulin est inclinée, non seulement elle prend 
moins d’eau sur elle, mais qu’en plus elle la prend avec un moins bon angle : une partie de la force 
ne sert pas à la faire tourner. 


———— =———— 
—— — — ss 
M ———— A — 


Labe1FigUUNEooGNVOÜsssLabeiSubTigRNENUMDAsENVOUsSsL abe 15 


(a) L’eau pousse bien perpendiculaire- (b) Lorsque l’eau ne pousse pas perpen- 

ment à la palle du moulin. diculairement, une partie de la force est 
perdue. Ici la partie normale (en rouge) 
est très petite. 


FIGURE 20.2: La partie rouge de la force est perdue si l’eau ne pousse pas perpendiculairement. 
De plus lorsque la pale est inclinée, elle prend moins d’eau sur elle. LabelFigUUNEooCNVOUs 


L'idée du flux d’un champ de vecteurs à travers une surface est de savoir quelle est la quantité 
« utile » de vecteurs qui traverse la surface. Ce sera simplement l'intégrale sur la surface de la 
composante du champ de vecteurs normale à la surface. Il reste deux problèmes à régler : le 
premier est de savoir quel est le vecteur normal à la surface, et le second est de savoir comment 
« sélectionner » la composante normale d’un champ de vecteurs F. 

Le problème de trouver un vecteur normal est résolu par le produit vectoriel des vecteurs 
tangents. Si la surface est donnée par w: D € IR? — IR*, les vecteurs tangents sont T,, = 2,ç(u, v) 


et Ty = Cyp(u,v). Le normal de norme 1 est donné par : 


KE, 


À 20.204 
IT xT ee 


n(u,v) 
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Si p est un point de la surface w(D), la composante de F(p) qui est normale à la surface au 
point p est donnée par le produit scalaire 


F(p)1 = F(p) : np). (20.205) 


C’est ce nombre là que nous intégrons sur la surface. 


Définition 20.64. 
Le flux du champ de vecteurs à travers la surface S = $(D) est 


JF “do = Jr - ndudv. (20.206) 


Une petite simplification se produit lorsqu'on veut calculer effectivement cette intégrale. En 
effet F + n est, en soi, une fonction sur S. Pour l’intégrer, il faut donc la multiplier par |T, x T,| 
(c'est la définition de l'intégrale d’une fonction sur une surface). Donc, étant donné que n — 
(Tu X To)/ÏTu X Ty], nous avons 


Jr LS Î[ F(etu.v) + (TX Ty) dudé (20.207) 
D 
où Ty, = 28 et T, — Êe, 
Exemple 20.65. 
Soit le champ de vecteurs 
2x 
F = |2y|. (20.208) 
2z 


Calculons son flux au travers de la sphère de rayon À. 
Nous choisissons de paramétrer la sphère en coordonnées sphériques avec (0, ©). Nous pouvons 
reprendre le résultat (20.188) : 


To X T, = R°sin(0). (20.209) 
Nous savons aussi que 
F(9(8,ç)) = Re. (20.210) 
L'intégrale à calculer est donc 
T 27 
1 Î dO | dp2e, : (R?sin()e,). (20.211) 
0 0 
Vu que le produit scalaire e, : e,. vaut 1, nous calculons 
I = re | sin(0)dO = 8x R?. (20.212) 
0 
A 


Exemple 20.66. 
Calculons le flux du champ de force de gravitation d’une masse au travers de la sphère de centre 
R centrée autour la masse. À un coefficient constant près, le champ vaut 


1 


Gr, 0,4%) = 7207. (20.213) 
Sur la sphère de rayon À, nous avons 
G(#(8,4)) = me. (20.214) 
L'intégrale est donc 
IR dû [ Der + (R?sin(#)e,)d = 8. (20.215) 


Ce flux ne dépend pas de À. A 
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Exemple 20.67. 
Soit S le disque de rayon 5 placé horizontalement à la hauteur 12. Calculer le flux du champ de 
vecteurs 


F(x,y,2) = ve; + yey + 2e. (20.216) 
Les équations de la surface sont z = 12, x° + y? < 25. Nous prenons le paramétrage en coordonnées 
cylindriques : 
r cos(0) 
w(r,0) = | rsin(0) |. (20.217) 
12 
Les vecteurs tangents sont 
2 cos Ü 5 —r sin 0 
= TP = [sing TD = TP = | rcos0 |. (20.218) 
Ôr 00 
0 0 
Le vecteur normal est alors 
T, x To = re,. (20.219) 
Sur la surface, le champ de vecteurs s'écrit 
F(o(r,0)) = r cos(@)ez + rsin(#)ey + 12e.. (20.220) 
Par conséquent 
F - (T, x To) = 12r. (20.221) 
L'intégrale à calculer est 
5 27 D 
Î ar | 12r d0 = 12 : 2r | r dr 
0 0 0 
2 | 
_25,, (20.222) 
2 
= 3007. 


20.11 Divergence, Green, Stokes 


Le théorème de Stokes (et ses variations) peut se voir comme une généralisation du théorème 
fondamental du calcul différentiel et intégral qui stipule que 


b 
J f(@)dr = f(b) — (a) 


c’est-à-dire qui relie l'intégrale de f” sur 1 = [a,b] aux valeurs de f sur le bord 07 = {a,b}. Le 
signe — qui apparait vient de l'orientation ; celle-ci requiert de la prudence dans l’utilisation des 
théorèmes. 


Voici, pour votre culture générale, un énoncé général : 
ThoATsPuzF 


Théorème 20.68. 
Si M est une variété orientable de dimension n avec un bord noté OM, alors pour toute forme 
différentielle w de degré n — 1 on a 
duw = ] w. 
M M 


où dw désigne la différentielle extérieure de w. 


Nous allons maintenant voir quelques cas particuliers. 
Une des nombreuses formes du théorème de Stokes (théorème 20.68) est que si la forme diffé- 
rentielle w est exacte alors son intégrale est facile. 
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ThoUJMhFwU 
Théorème 20.69 ([1]). 
Si est une chemin de classe C! dans un ouvert Q et siw est la forme différentielle exacte w = df, 
alors 


Î df = f(a()) — f(n(0)). (20.223) 
. 


Démonstration. C’est une application du lemme 12.292 et du théorème fondamental du calcul 
intégral 14.263. 


20.11.1 Théorème de la divergence 


Si nous considérons une surface dans R” et un champ de vecteurs, il est bon de se demander 
quelle « quantité de vecteurs » traverse la surface. Soit D, un ouvert borné de R” telle que 0D soit 
une variété de dimension n — 1, et G, un champ de vecteurs défini sur D. Afin de compter combien 
de G traverse 0D, il faudra faire en sorte de ne considérer que la composante de G normale à CD : 
pas question d’intégrer par exemple la norme de G sur 0D. 

Comme nous le savons, la composante du vecteur v dans la direction w est le produit scalaire 
v - ly où l est le vecteur de norme 1 dans la direction w. Nous allons donc introduire le concept 
de vecteur normal extérieur. 


Définition 20.70. 
Soit x e OD etre R", nous disons que v est un vecteur normal extérieur de 0D si 
(1) &v,v) = 0 pour tout vecteur tangent v à 0D au point x. Pour rappel, 0D étant une variété 
de dimension n — 1, il y a n — 1 tels vecteurs v linéairement indépendants. 
(2) I existe un 6 > 0 tel que Vte ]0,6[, nous avons x + tv # D etx -tve D. 


Nous pouvons maintenant définir le concept de flux. Soit D € R" tel que 0D soit une variété 
de dimension n — 1 qui admette un vecteur normal extérieur v(x) en chaque point. Soit aussi 


G: D — R", un champ de vecteur de classe C!. Le flux de G' au travers de 0D est le nombre 
{G{x),v(x))do(x). (20.224) 
0D 


Cette intégrale est en général très compliquée à calculer parce qu’il faut trouver le champ de 
vecteur normal, puis un paramétrage de la surface 0D et ensuite appliquer la méthode décrite au 
point 20.8. 

Heureusement, il y a un théorème qui nous permet de calculer plus facilement : sans devoir 
trouver de vecteurs normaux. 

Il n’est pas plus contraignant d’énoncer ce théorème dans le cadre d’une hypersurface de IR?, 
ce que nous faisons donc : 


Théorème 20.71 (Formule de la divergence). 
Soit D un ouvert borné de IR” dont le bord est « assez régulier par morceaux », c’est-à-dire : 


0D = AU... A UN (20.225) 
où 
(1) A1,...,4,,N sont deux à deux disjoints, 
(2) pour tout i < p, À; est un ouvert relatif d’une certaine variété M; de dimension (n — 1) 
(3) Ac M; 
(4) N est un compact contenu dans une réunion finie de variétés de dimensions (n — 2). 


Supposons également qu’en chaque point de A1 L...U À, il existe un vecteur normal extérieur v. 
Si G est un champ de vecteurs de classe C? sur D alors 


L V -G- > [. Gun. (20.226) 


L'intégrale du membre de gauche est l'intégrale sur un ouvert d’une simple fonction. 
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20.11.2 Lacets et homotopie 
DEFooQZMSooYYkGDv 


Définition 20.72 (chemin, lacet[201, 567]). 
Plusieurs notions autour de chemins dans un espace topologique X. 


(1) Un chemin dans un espace vectoriel X est une application continue y: [a,b] — X avec 
a < b. 


(2) Un lacet dans X est un chemin 7: [a,b] — X tel que y(a) = y(b). 

(3) Un chemin y: [0,1] — R" est régulier si il est C! et si y'(t) Æ 0 pour tout t 

(4) Le chemin 7: [a,b] — X est un chemin de Jordan si il est injectif. 

(5) Un lacet y: [a,b] — X est un lacet de Jordan si y: [a,b[ — X est injective. 

(6) Une courbe de Jordan est l’image d’un lacet de Jordan. 

(7) Une courbe simple est l’image d’un chemin de Jordan. 
L'homotopie sera définie en 20.74. 
20.73. 
Un chemin de Jordan peut évidemment être vu comme une application y: [0,27] — IR? telle 
que (0) = (2x). En particulier il n’est jamais mauvais de se rappeler qu’on peut choisir un 
paramétrage normal par la proposition 21.46. 


DEFooHJQTooYUFcee 
Définition 20.74 (homotopie de lacets). 


Soit un espace topologique X. Les lacets !* 0,7: [a,b] — X sont homotopes dans X si il existe 
une application continue 


H:1[0,1] x[a,b] — X (20.227) 
telle que 
(1) Pour tout s € [0,1], l’application 


no ne (20.228) 
te H(s,t) | 
est un lacet dans X. 
(2) Nous avons lo = % et l1 = 1. 
L'application H est l’'homotopie entre yo et 71. 
DEFooLXDTooDPgxqL 


Définition 20.75 (Homotopie à extrémités fixées[201]). 

Soit un espace topologique X. Soient des chemins 0, "1: [a,b] — X. Nous supposons que leurs 
extrémités soient égales, et nous les notons p,q : yo(a) = na) = p et yo(b) = (bd) = q. Nous 
disons que Yo et y1 sont homotopes avec les extrémités fixées si il existe une application 
continue H: [0,1] x [a,b] — X telle que 


(1) les extrémités sont fixées : H(s,a) = p et H(s,b) = q pour tout s€ [0,1]. 
(2) pour tout te [a,b], nous avons H(0,t) = ot) et H(1,t) = yi(t). 


20.11.3 Formule de Green 


La formule de Green est un cas particulier du théorème de la divergence dans le cas n = 2, 
légèrement reformulé. 
THOooQSWMooAZasTl 
Théorème 20.76. 


Soit D € R? ouvert borné tel que son bord est la réunion finie d’un certain nombre de chemins 


13. Définition 20.72. 
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de classe C? de Jordan réguliers. Supposons qu’en chaque point de son bord, D possède un vecteur 
normal unitaire extérieur v. Soient P et Q deux fonctions réelles de classe C} sur D. Alors 


J J (:Q — 8, P)dr dy = Ÿ Pdx + Qdy DU) 


0D 


où chaque chemin y formant le bord de D est orienté de sorte que Tv = mr où T' représente la 


rotation d'angle +3. 


Justifions le fait que cela soit un cas particulier de la formule de Stokes du théorème 20.68. 
Nous considérons la forme différentielle 


w = Pdx + Qdy, (20.230) 
et sa différentielle 
dw = ÿ_ du A dti (20.231a) 
_ {2P 0P 0Q 0Q 
( dx + du 7) A dŒ + (Star + Fed) A dy (20.231b) 
0Q oP 
(£ _ —) dx À dy. (20.231c) 


Intégrons cette forme dw sur le domaine ouvert D que nous paramétrons de façon triviale par 


w: D — R? 


(u,v) + (u,v). 


I Ï du = J ] due) (SE. se) dudv FEES 


D 


(20.232) 


Ce que nous avons est 


1 
Nous avons aussi 7}, — ge _ ( ) et Ty — ge = () et donc 


(dx À dy)(Tu, Tu) = di(Tu)dy(Ty) — de(Ts)dy(Tu) = 1-0 = 1. (20.234) 


L'intégrale (20.233) se développe donc en 


J J = J (Tv = C0) bn D Tad = | ] (& . ) dudv. (20.235) 


D D 


Par conséquent la formule de Stokes nous donne la formule (20.229). 
La formule de Green nous permet de calculer l’aire de la surface délimitée par une courbe 
fermée en termes de l’intégrale d’une forme bien choisie le long du contour. Pour cela nous prenons 


la forme E 
w = —Sdr + du 86538) 


de telle sorte que 0:Q — 0,Q = 1 et que 


(Il dw = J dudv = S$, (20.237) 
D D 


et au final l'aire est donnée par 


. y É 
s [. ( de + 1) (20.238) 
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Lorsque le bord de D est paramétré par 


7: [a,b] — R°? 
x(u) (20.239) 
on Gt) | 
(Pdx + Qdy)y(u) = Px'+Qy, (20.240) 
et alors 
b 
L. Pdx + Qdy = J P{x(u), y(u))z'(u) + Q(x(u), y(u))y(u)du. (20.241) 


En ce qui concerne l’aire de la surface, nous prenons les P et Q de la forme 20.236 : 
1 f 
S=e J ( — y(u)x'(u) + 2(u)y/(u)) du. Eq6 495 


20.11.4 Formule de Stokes 


secstokesusuel 

La formule de Stokes est la version classique, qui permet d’exprimer la circulation d’un champ 

de vecteur le long d’une courbe de R° comme le flux de son rotationnel à travers n'importe quelle 
surface dont le bord est la courbe. La version présentée ici suppose que la surface peut se paramétrer 


en un seul morceau : 
THOo0oDCPKooMqNOMU 


Théorème 20.77 (Formule de Stokes). 

Soit F:W CR? — R° un paramétrage (carte) d’une surface dans R°, supposée de classe C?. 
Soit D un ouvert de R? vérifiant les hypothèses de la formule de Green, et tel que D & W. Soit 
Gun champ de vecteurs de classe C\ défini sur F(D), et soit N le champ normal unitaire donné 
par le paramétrage 


N= 07 (20.243) 


alors 


I (V x G,N)dor = J G FaS tes 75) 
F(@D) 
F(D) 
où les chemins formant le bord OD sont orientés comme dans le théorème de Green. 


Notons, juste pour avoir une bonne nouvelle de temps en temps, que 


F 
nm 


nMÈE dudv, (20.245) 


mais cette norme apparaît exactement au dénominateur de N. Il ne faut donc pas la calculer parce 
qu'elle se simplifie. 
Sous forme un peu plus physicienne l*#, la formule (20.244) s'écrit 


| Re Ï (GC, Tyds (20.246) 
F(D) F() 


où Test le vecteur unitaire tangent à F(). 


14. et surtout plus explicite. 
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20.11.4.1 Quelle est la bonne orientation ? 


Le signe du vecteur normal N dépend du choix de l’ordre des coordonnées dans la carte. 
Supposons que je veuille paramétrer la surface æ? + y? = 1, z = 1. Nous prenons naturellement 
comme carte le cercle C de rayon 1 dans R? et la carte 


r cos Ô 
F(r,0) = | rsin0 |. (20.247) 
1 


Mais nous aurions aussi pu mettre les coordonnées r et 0 dans l’autre ordre : 


: r cos Ô 
F(0,r) = | rsin0 |. (20.248) 
1 


Les vecteurs normaux ne sont pas les même : la carte F donnera 0,.F x ©9F', tandis que l’autre 
donnera @F x @,F. Le signe change! 

Il faut savoir laquelle choisir. Le cercle C' € R? a une orientation donnée par le théorème de 
Green. Nous choisissons l’ordre des coordonnées pour que 19 et 1; soient dans la même orientation 
que les vecteurs v et T tels que donnés par le théorème de Green, et tels que dessinés sur la 
figure 20.3. 


FIGURE 20.3: L'orientation sur le cercle. Si nous les prenons dans l’ordre, les vecteurs (1,, 19) ont 
la même orientation que celle donnée par les vecteurs (v,T) donnés par la conveion:dereeRnu 


Plus généralement, nous choisissons l’ordre des coordonnées u et v pour que la base (1,4, 14) ait 
la même orientation que (v,T) où Ta le sens convenu dans le théorème de Green. 


20.12 Résumé des intégrales vues 


Nous sommes maintenant capables de revoir tous les types d’intégrales vues jusqu'ici de façon 
très cohérentes. Nous commencerons par les intégrales de fonctions et nous ferons ensuite les 
intégrales de champs de vecteurs. 


20.12.1 L'intégrale d’une fonction sur les réels 


Si f:[a,b] € R — R est une fonction usuelle, sont intégrale est 
b 
J ro (20.249) 


où Fest une primitive de f. 
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20.12.2 Intégrale d’une fonction sur un chemin 


Si f est une fonction sur IR° et si o: [a,b] — IR° est un chemin dans R, l'intégrale de f sur o 
est, par définition, 


b 
J Îde= J f(o)llo/(t)ldt. (20.250) 


20.12.3 Intégrale d’une fonction sur une surface 


Nous devons paramétrer la surface S par une application @: D € IR? — IR. À partir d’un 
tel paramétrage, nous construisons un élément de surface en prenant le produit vectoriel des deux 
vecteurs tangents : 


dS = — x aude. (20.251) 


L'intégrale est 


J f ds = J J f (pu, v)) . x : dudv. D 1) 


Il ne faut pas rajouter de jacobien : la norme du produit vectoriel est le jacobien. 


Remarque 20.78. 
La formule (20.252) est autant valable pour des surfaces dans IR? que dans R°. Si nous considérons 
une surface dans IR?, nous la voyons dans R° en ajoutant un zéro comme troisième composante. 


Exemple 20.79. 
Les coordonnées polaires sont données par 


r cos 0 
p(r,0) = | rsin0 |. (20.253) 
0 
Les vecteurs tangents à ce paramétrage sont 
2 cos 0 9 —r sin Ô 
TL TP 2 | sine , To = 2 post |. (20.254) 
Ôr 00 
0 0 
Le vecteur normal est 
9 2 Ex Ey ez 
_ x mn —| cosû  sin® O0|=7re.. (20.255) 
FR 


—rsin® rcosû O0 


Nous trouvons donc que l’élément de surface est la norme de re,, c’est-à-dire r, le jacobien connu. 
A 


20.12.4 Intégrale d’une fonction sur un volume 


Si V est un volume dans R?, nous effectuons la même procédure : nous trouvons un paramé- 
trage, et nous formons un élément de volume avec les vecteurs tangents de le paramétrage. Nous 
avons donc un volume déterminé par l’application 


w: DCR —R*, (20.256) 
et ses trois vecteurs tangents à 
P 
TE 
“Qu 
Ty = 2e (20.257) 
Ov 
op 
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Comment former un volume avec trois vecteurs ? Réponse : le produit mixte. L'intégrale de f sur 


V sera 
Ô Q Ô 
[sav = [If Cotu 0) = À (& x =) dudvdw. (20.258) 
D 


Encore une fois, le produit mixte est le jacobien. Prenons les coordonnées sphériques : 


x(r,0,@) = rsin(4) cos(s) 
y(r,0,ç) = rsin(0) sin(ç) (20.259) 
z(r,0,%) = r cos(0) 


Les trois vecteurs tangents seront 


= sin(@) cos(o) 

Le = : = | sin(0)sin(s) (20.260a) 
Œ cos(6) 
r cos(Ô) cos(s) 

1% : = r cos(8) sin(o) (20.260b) 
5 —r sin() 
de —rsin(@) sin() 

= œ = RS (20.260c) 
6 


Nous avons vu que le produit mixte revient à mettre toutes les composantes dans une matrice. Ici 
nous avons donc 


0p [op 0) | à à 
ôr (xs) % % À Coen 
gp Op 0p 


Cela est précisément le jacobien dont nous parlions plus haut. 


20.12.5 Conclusion pour les fonctions 


Lorsque nous intégrons une fonction sur un chemin, une surface ou un volume, la technique est 
toujours la même : 
(1) Trouver un paramétrage à une, deux ou trois variables. 
(2) Dériver le paramétrage par rapport à ses variables. 


(3) Construire un élément de longueur, surface ou volume à partir des vecteurs que l’on a. Cela 
se fait en prenant la norme, le produit vectoriel ou le produit mixte. 
20.12.6 Circulation d’un champ de vecteurs 


Pour les champs de vecteurs, nous faisons la même chose, mais au lieu de multiplier par l’élé- 
ment de longueur ou de surface, nous prenons le produit scalaire. Si nous considérons la courbe 
paramétrée o : [a,b] — IR? et le champ de vecteurs F, nous avons donc 


[Fr = Jr do ['rtot) - a’(t)dt. (20.262) 


20.12.7 Flux d’un champ de vecteurs 
Si la surface S & R? est paramétrée par 
db: DcR?—R° 


(u,v) > b(u, v), (20.263) 
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et si Fest un champ de vecteurs, alors on a 


r={r.as- [[r(ouu): (x) dur. FREE 
Les Qu“) 


Ou Ov 


20.12.8 Conclusion pour les champs de vecteurs 


La circulation et le flux ne représentent pas tout à fait la même chose. En effet pour la circula- 
tion, nous sélectionnons la composante tangente à la courbe, c’est-à-dire la partie du vecteurs qui 
« circule » le long de la courbe. Une force perpendiculaire au mouvement ne travaille pas. 

La situation est exactement le contraire pour le flux. Etant donné que le vecteur 

0® | 0® 

TT x TE 20.265 

Ou Ov 
est normal à la surface, le fait de prendre le produit scalaire du champ de vecteurs avec lui 
sélectionne la composante normale à la surface, c’est-à-dire la partie du vecteur qui traverse la 
surface. 


20.12.9 Attention pour les surfaces fermées ! 


Si nous considérons une surface fermée, il faut faire attention à choisir une orientation. Les 
vecteurs normaux doivent soit tous pointer vers l’intérieur soit tous vers l’extérieur. En effet, en 
tant que vecteur normal, nous avons choisi de prendre 


HT. (20.266) 


Mais le vecteur T, x T,, est tout aussi normal! Il n’y à pas à priori de façon standard pour choisir 
l’un ou l’autre. Il faut juste être cohérent : il faut que si on divise la surface en plusieurs morceaux, 
tous les vecteurs pointent dans le même sens. 

Notez que si vous faites un choix et que votre voisin fait le choix inverse, vous obtiendrez des 
réponses qui diffèrent d’un signe. Sans plus de précisions !”, les deux réponses sont correctes. 

Un exemple de ce problème est donné dans l’exemple 20.80. 


EXooAJRLooSTPCRN 
Exemple 20.80. 
Calculer le flux du champ de vecteurs 
F(r,uÿ,e) =; (20.267) 
au travers du cylindre de rayon À et de hauteur À autour de l’axe z. 
Même question si le cylindre est autour de l’axe x. 
Remarque : ces cylindres sont considérés avec leur « couvercles ». 
Un paramétrage du cylindre autour de l’axe z est 
R cos 0 
®(0,z) = | RsinO |. (20.268) 
z 
Les vecteurs tangents sont 
— Rsin 0 0 
To = | RcosO |,T, = 1|0|. (20.269) 
0 1 
Le vecteur normal est donc 
To x T, = Rcos(8)ez + Rsin(6)e,. (20.270) 


15. Il faudrait définir ce qu’est une surface orientable et choisir une orientation. 
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C’est un vecteur dirigé vers l'extérieur. 
Le champ de vecteurs considéré est constant : F (0,2) = e,. Nous avons donc 


F(0,z) : (To x T,) = Rcos(6) (20.271) 

et le flux vaut : : 
P — Î ae | R cos(0)dz = 0. (20.272) 

0 0 

En ce qui concerne les couvercles haut au bas, ils sont paramétrés par 
R cos(4) R cos(0) 
i(r,0) = | Rsin(4) |,@o(r,0) = | Rsin(0) |. (20.273) 
h 0 


Les vecteurs normaux correspondants sont dans la direction de e,, de façon que le produit scalaire 
avec F(r,0) soit nul. Le flux total est donc nul. 
Regardons maintenant le cylindre le long de l’axe x. Un paramétrage est 


æ 
®(0,x) = | Rcos() |, (20.274) 
Rsin(4) 
et le vecteurs tangents sont 
0 1 
To = | —Rsin0 |,T, —=|0|. (20.275) 
R cos 0 () 
Le vecteur normal est alors donné par 
To X Tr = Rcos(8)ey + Rsin(0)e.. (20.276) 


Nous avons par conséquent F(0,x) : (To x T}) = 0. Pas de flux par le côté du cylindre. 
Regardons les « couvercles ». Le premier est donné par le paramétrage 


0 
1(r,0) = | rcos(0) |. (20.277) 
r sin() 
Le vecteur normal serait 7, x Ty = rex, et le flux 
27 R 
E — Î de | r dr = mr R?. (20.278) 
0 0 
Le second couvercle est donné par 
h 
Da(r,0) = | rcos(0) |. (20.279) 
r sin(6) 


Le vecteur normal est encore rez, et le flux est à nouveau TR?. 

Le flux total serait donc 27 R°. 

Cela n’est pas possible parce que tous les vecteurs qui « rentrent » d’un côté doivent « sortir » 
de l’autre côté. L'erreur est le le premier vecteur normal est un vecteur qui pointe vers l’intérieur 
du cylindre, tandis que le second pointe vers l’extérieur. Si nous choïisissons, par convention, de 
prendre uniquement les vecteurs extérieurs, il faut changer le vecteur normal du premier couvercle 
en —rez. Le premier flux vaudra donc 

—rR?, (20.280) 


de telle sorte que le flux total sera nul. A 
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20.13 Formes différentielles exactes et fermées 


Nous avons déjà parlé de formes différentielles et de leurs intégrales sur un chemin dans la 


section 12.21. 
DefEFKQmPs 


Définition 20.81. 
La forme différentielle w est exacte si il existe une fonction f telle que w = df ; elle est dite 
fermée si dw = 0. 


Dire que la forme différentielle w = fdx + gdy est fermée, c’est dire que 


ôg _ Of 
Te (20.281) 
Il est naturel de se demander si toutes les formes différentielles sont des différentielles de fonc- 
tions. Une réponse complète est délicate à établir, mais a d'innombrables conséquences en physique, 
notamment en ce qui concerne l'existence d’un potentiel vecteur pour le champ magnétique dans 
les équations de Maxwell. 
Le fait qu’une forme exacte soit fermée est relativement facile à établir; c'est la proposition 
suivante. La question plus délicate est la réciproque : sous quelles conditions une forme fermée 
est-elle exacte ? 


Proposition 20.82. 
Si w est une 1-forme exacte de classe C*, alors w est fermée. 


Démonstration. Le fait que w soit exacte implique l’existence d’une fonction f telle que w = df, 
c’est-à-dire 


bn — > ddr — > c1 Gide (20.282) 


c’est-à-dire que a;(x) = AL (x). L'hypothèse que w est C'! implique que f est C?, et donc que nous 
pouvons inverser l’ordre de dérivation pour les dérivées secondes dé | = d J. Nous pouvons donc 
faire le calcul suivant : 


Oa 0 Ôf Ô Ôf da; 
CE; 0x; OT; OT; 0%; ÔT; 


(20.283) 


ce qu'il fallait démontrer. 


La réciproque est vraie sur un ouvert simplement connexe. 
ThoFermeExactFormRappel 


Théorème 20.83. 
Supposons que D € R" soit un ouvert simplement connexe. Alors toute forme différentielle de 
degré 1 et de classe C? sur D qui est fermée est exacte. 


Nous allons prouver ce théorème dans un cas un peu moins général : celui d’un domaine étoilé 


de R? plutôt que simplement connexe de R”. 
ThoMSofFxL 


Théorème 20.84. 
Soit D & R?, une ouvert étoilé, et w, une 1-forme fermée de classe C'. Alors w est exacte. 


Démonstration. Soit D € R?, un ouvert étoilé par rapport à l’origine. Soient f: D — IR, g: D — 
R, des fonctions de classe C1 telles que 
Of _ 0g 


de (20.284) 


sur D, et 


1 
F(x,y) = Î CF (bx tu)e + gt, tyy]dt EaTNDefF{0rnLs 


pour tout (x, y) € D. 


20.13. FORMES DIFFÉRENTIELLES EXACTES ET FERMÉES 1785 


Étant donné que nous ne définissons F(x,y) que pour des (x,y) € D, la fonction {+ f(x, ty) 
est CT sur tout le compact [0, 1] et aucune divergence de l’intégrale n’est à craindre. Nous sommes 
donc dans le cadre de la proposition 17.27, et nous pouvons dériver sous le signe intégral. 

Nous calculons, en utilisant la règle de dérivation de fonctions composées 


: Ô 
en = | [rétemntune + eut + Eu] à 


FalMTSSds a ge 
L of of | 
= Î (a Eten tn : var (tx ty) + Ft tu)| dt 


0 
où nous avons utilisé l'hypothèse ©,f = 0,g. Ce qui se trouve dans la parenthèse n’est autre que 
on (Fe; ty)), plus précisément, si nous posons F(x,y,t) = f(tx,ty), nous avons 
CF of © f 


Oo" 2 lp TT te ta. 20.2 
à (x, y,t) Ron) UE (Re y) (20.287) 


En recopiant le résultat (20.286) en termes de F, nous avons 


°F 1/0F 
3x (x, y) -| (: 3 und + Fab) dt 


0 


_ [ (EF (x, y,t)}dt 


0 (20.288) 
= [eF(s,v, 5] 
= F(x,y,1) 
= f(x,y). 
Le résultat correspondant pour (x, y) = g(x, y) s'obtient de la même manière. Nous avons donc 
obtenu que 
_ Pr. ‘ . FaTNFornT ASF ££qs 


En ayant prouvé cela, nous avons prouvé que si w = fdx + gdy avec ©, f = 0rg, alors w = dF où 
Fest définie par (20.285). 


Démonstration alternative du théorème 20.84. Nous posons u = tx et vu = ty, ainsi que F(x, y,t) = 
flu,v) et G(x,y,t) = g(u,v). Avec cette notation, nous avons 


1 


F(x,y) = [ (u.F (4,0) + yG(x, y,t))dt, (20.290) 


t 
° CF ofôu ôfôv of 


+ 
Ôx duôr ÔvÔôr Cu 
5 y (20.291) 
Ôx Qu. 


F 1 
| (a +r4v)à 


Ainsi, 


0 Ox 


1 
= Î HR i dt (20.292) 
ou Ou 


: © © 
= Î Le (3 +1$) +7 dt. 
0 ou Ov 
où nous avons utilisé le fait que, par hypothèse, 29 _ of. Nous calculons par ailleurs que 


OF Ofou ofôv of of 
Out ovét ‘ou Vo (20.293) 
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Donc, nous avons 


OF. Por 19 
ui — ee L—= —(tF)dt. 20.294 
a (rs) [xt (20.294) 
Par conséquent, 
0F 
an = Lo = Fay, 1) = (x, y). (20.295) 


Le même genre de calculs fournit Œ = g(r, y). 


20.14 Théorème d’Abel angulaire 

ThoTGjmeen 
Théorème 20.85 (Abel angulaire[103]). 
Soit >, an2" une série entière de rayon de convergence plus grand ou égal à 1 et de somme f. Soit 
Oo € [0, 5[. Nous posons 


Ag, = {z=1-— pe tel que p > 0,4 € [—60, 60], || < 1}. (20.296) 
Nous supposons de plus que Ÿ,, an converge. Alors 
(we) 
lim fle) = > be (20.297) 
zEAo k=0 


Démonstration. Le résultat de ce théorème est que l’on peut calculer la limite z — 1 avec des 
chemins contenus dans un domaine de la forme de celui dessiné à la figure 20.4. 


<&. 
Ÿ 


FIGURE 20.4: La zone dans laquelle peut être le chemin qui va vers 4bd1FigJGukEjH 


De façon très classique nous posons 


00 
sh Der (20.298) 


et Rh = S — S,. En particulier ay = Rn_1 — Rn. 

Le but du théorème est de montrer que ÿ'a,z" converge vers S lorsque z converge vers 1 à 
l’intérieur de A4,. Pour cela nous calculons pour un N donné la différence 7. anz" — SN en 
triant les termes par ordre de R,, en isolant le terme Ro et le terme Rn : 


N N 
D An2— Sn = Nan?" — 1) (20.299a) 
n=0 n=1 
N 
=\NUR, 4h) 0 (20.299b) 
n=1l 
N—-1 
= Ro(z—1)+ 9 Ra 1— 2% +1) + Ry(zN —1) (20.299c) 
n=1 
N-1 
= Ro(z—1)+ 9 Ras" (z—1) + Ra(zŸ — 1) (20.299d) 
n=1l 
N—-1 
= (21) N Re Rae" 1), (20.299e) 
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Cela est valable pour tout N et |z| < 1. Nous avons donc 


N N-1 
San2— Sn = (2-1) D Rn2° + Ra(2N — 1). (20.300) 
n=0 n=0 


Par hypothèse nous avons limn_, Rx = 0. Et de plus le membre de gauche converge parce que 
chacun des deux termes converge séparément. En passant à la limite nous avons pour tout |z| < 1 : 


fG)-S=(z-1) > Re”. (20.301) 
n=0 


Nous voudrions étudier le comportement de la différence f(2) — S lorsque z tend vers 1. Pour cela 
nous nous fixons € > 0 et N > 1 tel que |R,| < € dès que n > N. Alors pour tout |z] < 1 nous 
avons 


N 00 
\f(2) — 51 < 12 — 11 | D Rat 12% + D lRal le] (20.302) 
A=0 nn en 


cl n=N+1 Le 


N 
ke 1 
<|z—1 R 20.302b 
2-1 DIR + (20.302) 
n=0 
où nous avons utilisé la somme de la série géométrique (1.657) et l'égalité |2°| = [z[". Avant de 


nous particulariser à z € Ag, nous devons anticiper un problème au dénominateur en multipliant 
par le binôme conjugué : 
2-1 l2—11(1 +12) 


20.303 
EE Fe 


C’est maintenant que nous nous particularisons à z € A9, en posant z = pe? et en remarquant 
que |z[? = 1 — 2pcos(y) + p?. Nous avons le calcul suivant : 


1211 v(1+12)) 


20.304 
1—1z)  2pcos(p) — p? 2) 
1 

(20.304b) 

2cos(y) — p 

2 

LE — (20.304c) 

2cos(y) — p 

2 
< 20.304d 
2 cos(ç) — cos(6o) 
2 
< 20.304 
2 cos(@o) — cos(60) É 
2 
L : 20.304f 
cos(o) 
Quelques justifications. 
— Vu que nous avons dans l’idée de faire p — 0 nous supposons que p < cos(6o). 
— Nous avons cos(w) > cos(do) parce que z est dans A4. 
Nous avons donc, pour tout z € À, que 
: 2 
Lf(2) — 81 < 12 — 1] D | RAl + € (20.305) 
en cos(o) 


Il suffit de prendre p assez petit pour que 


N 
lz—1] D |Ral < € (20.306) 
n=0 
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et nous avons 


[f(z) — ST< € (: + —%) (20.307) 


Nous avons donc bien lim,-,1 f(z) = $, comme nous le voulions. 
ze Ao 


La réciproque du théorème d’Abel angulaire est que si f(z) = ÿ,, az" sur B(0,1) se prolonge 
par continuité en z = 1 alors cette prolongation se fait par f(1) = ÿ,, an. Cela est faux comme le 
montre l’exemple suivant. 


Exemple 20.86. 
Nous considérons la série entière Y7_4(—1)"2" qui converge !° vers 


1 
= 20. 
f@ = (20.308) 
sur B(0,1). De plus nous avons 
| 1 1 
lim eu. (20.309) 


Donc la fonction converge bien vers quelque chose lorsque z tend vers 1. La fonction f se prolonge 
par continuité en 1. Pourtant la série ses coefficients ÿ,,(—1)" ne converge pas. A 


Le théorème suivant donne une espèce d’inverse au théorème d’Abel angulaire. En effet il dit 
que si la série converge en allant vers 1 le long de l’axe réel, alors ça converge vers la somme des 
coefficients. [Il faut cependant une hypothèse en plus sur les a. 


Théorème 20.87 (Théorème taubérien faible[103]). 
Soit >, an2" une série entière de rayon de convergence 1 et de somme f. Nous supposons 


(1) I existe S e © tel que lim %-1 f(x) =S. 


xe]—1,1[ 


(2) lim nas = 0: 


Alors la série D F_p an converge et vaut S. 


Démonstration. Nous notons S, = Y5_0 ax et M = supz>1 k|ax|, qui est fini par hypothèse. Pour 
€ ]0,1[ et n > 0 nous avons 


nm nm O0 nm O0 
= y, ak — > agt* — > agx” D) ax(1 — Pal — ÿ ar. (20.310) 
k=1 k=1 k=n+1 k=1 k=n+1 


Nous utilisons la série géométrique sous la forme 1 — æ* = (1 — x) Do x pour écrire 


Sn — f(x) = > ax(1 — x DE x" — > axx* (20.311a) 
k=1 


< > kag(1 — x) . arr, (20.311b) 


16. C’est la série géométrique de raison —z. 
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donc en passant à la norme 


[Sn f(x) <(-r)Mn+ D lalr (20.312a) 
k=n+1 
ok 
<(1-z)Mn+ D al r” (20.312b) 
pH 
<M/n 
M 00 
<(i-zMn+— N z* (20.312c) 
LL k=n+1 
M 1 
£<(1—-x)M — : 20.312d 
G-z)Mn+e— ( ) 


Ce que nous cherchons à étudier est le comportement x — 1 et montrer que 5, — S, ce qui nous 
incite à calculer |Sx — f(1 — £)| avec 0 < e < 1 : 


Sn-f(i-)<em+e (20.313) 


Nous choisissons N; tel que _ < €? dès que n > M1. En sus nous savons que 


lim f(1— €) = S. (20.314) 
Nous choisissons M, de telle sorte à avoir 
Lf Gi = =) - s fe, (20.315) 
et en prenant n > max(N;, N2) nous avons 


[Sn — S| < 


= f(1-<)+|r (1-2) - 58] < em +26. (20.316) 


Il suffit de choisir e suffisamment petit (en particulier pour que M soit petit) pour montrer que 
[Sn — S| est borné par un nombre arbitrairement petit. 


20.15 Passage à la limite sous le signe intégral 


Un autre résultat très important pour l’étude de l’intégrabilité est le théorème de la conver- 
gence dominée de Lebesgue : 


Théorème 20.88. 
Soit E € R'" un ensemble mesurable et {f,}, une suite de fonctions intégrables sur E qui converge 


simplement vers une fonction f: E — IR. Supposons qu'il existe une fonction g intégrable sur E 
telle que pour tout k, 


[f(æ)1 < g(x) (20.317) 
pour tout x € E. Alors f est intégrable sur E et 
Ï = im | Je. (20.318) 
E ko JE 


20.15.1 Intégrale en dimension un 


Proposition 20.89 (Critère de comparaison). 
Soit f mesurable sur |a, | et bornée sur tout |a,b], et supposons qu'il existe un X0 > a, tel que 
sur |Xo, |, 

LC) < g(x) (20.319) 


où g(x) est intégrable. Alors f(x) est intégrable sur ]a, 1. 
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Corolaire 20.90 (Critère d'équivalence). 
Soient f et g des fonctions mesurables et positives ou nulles sur |a,[, bornées sur tout ]a,b], 
telles que 
ORALE, (20.320) 
0 g(x) 
existe dans R. 
(1) Si L Æ et ( g(x)dx existe, alors Fe f(x)dx existe, 
(2) Si L Æ0 et si ( f(x)dx existe, alors ( g(x)dx existe, 
CorCritFonsTest 
Corolaire 20.91 (Critère des fonctions test). 
Soit f(x) une fonction mesurable et positive ou nulle sur ]a,[ et bornée pour tout |a,b]. Nous 
posons 
L(a) = lim x°* f(x), (20.321) 


Æ—>00 

et nous supposons qu’elle existe. 

(1) Si il existe a > 1 tel que L(a) Æ ©, alors ÊŸ f(x)dx existe, 

(2) Si il existe a < 1 et L(a) Æ 0, alors [7 f(x)dx n'existe pas. 

CorAlphalLCasInteabf 

Corolaire 20.92. 
Soit f: |a,b] — R une fonction mesurable, positive ou nulle, et bornée sur [a + €,b] Ve > 0. Si 
lim,_,,4(x — a) f(x) = L existe, alors 


(1) Sia<1et LZ ©, alors ç f(x)dx existe, 
(2) Sia>1et LZO0, alors ( f(x)dx n'existe pas. 


20.15.2 Intégrales convergentes 


Définition 20.93. 
Soit f, une fonction mesurable sur [a, co, bornée sur tout intervalle [a,b]. On dit que l’intégrale 


(ve) 
J f(x)dx (20.322) 
(02 
converge si la limite 
X 
Jim J f EqDEfConvergeZe sx 
X—00 J, 


existe et est finie. 


20.15.3 La méthode de Rothstein-Trager 
subSecBCRYooRVjFps 


Mes sources pour parler d’intégration de fractions rationnelles : [568]. 
ThoXJFatfu 


Théorème 20.94 (Rothstein-Trager[569]). 

Soient P,Q € Q[X] premiers entre eux avec pgcd(P, Q) = 1 et deg(P) < deg(Q). Nous supposons 
que Q est unitaire et sans facteurs carrés. Supposons que nous puissions écrire, dans un extension 
K de À la primitive de P/Q de la façon suivante : 


J : = Ÿ cIn(P;) FU 


où les c; sont des constantes non nulles et deux à deux distinctes et où les P; sont des polynômes 
unitaires non constants sans facteurs carrés et premiers deux à deux entre eux dans K[X]. 
Alors les c; sont les racines distinctes du polynôme 


R(Y) = resx(P - YQ',Q) e K[Y] (20.325) 


et 
P; = pecd(P — c;Q/,Q). (20.326) 
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Démonstration. Nous posons 


(1) 


=||e.: (20.327) 
JA 
Question de division Ensuite nous dérivons formellement l’équation (20.324) et nous 
multiplions les deux côtés du résultat par Ms F4 


PI] -0 De [IP =QY aPRU, ER SU 


Une première chose que nous en tirons est que Q divise le produit P ne P;; mais P et Q 
étant premiers entre eux, 


Q | [12 (20.329) 
j=1 


par le théorème de Gauss 6.50. 


Une seconde chose que nous tirons de (20.328) est que P; divise QD, & P/U;. De cette 
somme, à cause du U; qui est divisé par P; pour tout À sauf à = j, le polynôme P; divise tous 
les termes sauf peut-être un. Donc il les divise tous et en particulier 


P; | Qc;P;U; (20.330) 


En nous souvenant que les P; sont premiers entre eux, P; ne divise pas U;. De plus P; étant 
sans facteurs carrés, les polynômes P; et de sont premiers entre eux. Il ne reste que Q. Nous 
en déduisons que 

PF; | Q (20.331) 


pour tout 1 < j < n. Et vu que les P; sont premiers entre eux, le fait que chacun divise Q 
implique que leur produit divise Q, c’est-à-dire 


[12 | Q. (20.332) 


Or nous avions déjà prouvé la division contraire. Du fait que les deux polynômes sont unitaires 
nous en déduisons qu’ils sont en réalité égaux : 


a=[[2 FaranNs 


Nous pouvons simplifier les deux membres de (20.328) par cela : 


P_Ÿ GPU, BU 


i=1 


Encore un peu de division 


En dérivant (20.333) nous trouvons 
nm 
Q'= 7 PU, (20.335) 
j=1 
et en écrivant P sous sa forme (20.334), 


PaQ =) GPU alu Ÿ(e-e)PU,. 8 
j=1 j=1 


Le terme à = j de la somme est nul; en ce qui concerne les autres termes, ils sont divisés par 
P; parce que P; | U;. Donc PF; divise tous les termes de la somme et nous avons 


P.|P-cQ. (20.337) 
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(3) Un pgcd pour continuer 


Nous montrons à présent que P; = pgcd(P — c;Q',Q). Pour cela nous utilisons la multiplica- 
tivité du PGCD lorsque les facteurs sont premiers entre eux : 


n 
pecd(P — c;Q",Q) = pgcd(P — c;Q, Il P;) = | pecd(P — cQ", P;). (20.338) 
j=1 
Nous remplaçons P — c;Q’ par son expression (20.336) et nous écrivons un des facteurs du 
produit : 
nm 
pgcd(P — c;Q", P;) = pgcd( Zi = @)PRUxs Pr) (20.339) 
Le polynôme P; divise tous les U} sauf celui avec . = j. Donc le lemme 6.57(1) nous permet 
de dire 
, ; 1 siizj 
pecd(P — cQ,P;) = pgcd ((c; — G)P;U;, Pire P, di=j (20.340) 
j = 7. 


La seconde ligne provient du fait que nous ayons déjà montré que P; | P — c;Q. En fin de 
compte, 
pgcd(P — c;Q",Q) = P.. (20.341) 


(4) Une histoire de résultant 


Les nombres c; sont tels que les polynômes P — c;Q’ et Q ne sont pas premiers entre eux. Vu 
que les P; sont non nuls, la proposition 9.22 nous dit que le résultant 


resx(P — cQ',Q) = 0. (20.342) 

Donc les c; sont des racines du polynôme (en Y) 
R(Ÿ) = resx(P — YQ',Q). ER) 
Nous n’avons pas prouvé qu'ils étaient toutes les racines !?. 


(5) Toutes les racines 


Nous allons maintenant montrer que les c; étaient toutes les racines imaginables du polynôme 
(20. 343) dans toutes les extensions de Q. Soit donc c une racine de À dans une extension 
K de K qui ne soit pas parmi les c; de la formule (20.324). Étant donné que c est racine du 
résultat, les polynômes P — cQ et Q ont un PGCD non trivial, c’est-à-dire non constant. 
Donc 

pgcd(P — cQ',Q) = Se K[X] (20.344) 


est un polynôme non constant. Si T un facteur irréductible de S$, alors T divise P — cQ' et 
Q, mais Q = [[;_, P; avec les P; premiers entre eux. Donc T ne peut diviser que l’un (et 
exactement un) d’entre eux 5. Soit P;, celui qui est divisé par T. La relation (20.336) dans 
ce contexte donne : 


— cQ! = De — c)P;U; (20.345) 


Le polynôme T divise tous les U; avec j Æ io, mais comme en plus il divise P — cQ, il divise 
aussi le dernier terme de la somme : 


T | (a, = c) PE Use (20.346) 


Le polynôme T ne divisant pas U;, et (c, — c) étant non nul, nous concluons que T divise 


; . ; : 3 
F;.. Mais cela n’est pas possible parce que nous avons supposé que P;, était sans facteur 


carré, ce qui voulait entre autres dire que P;, et P;, n’ont pas de facteurs communs. 


17. De plus, nous n’avons pas de garanties que ces racines soient dans Q, et en fait il y a des cas dans lesquels les 
ci n’y sont pas. 
18. On ne peut pas diviser deux trucs qui sont premiers entre eux; c’est une question de cohérence, madame ! 
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Ce théorème suggère la méthode suivante pour trouver la primitive de la fraction rationnelle 
P/Q (si elle vérifie les hypothèses) 


(1) Écrire le résultant R(y) = resx(P — yQ',Q) et en trouver les racines {c};=1..n. 
(2) Calculer les polynômes P; = pgcd(P — c;Q',Q). 


(3) Écrire la réponse : 


a > éln(r (20.347) 


Notons que le polynôme R(Y) est de degré deg(Q) (pour le voir, faire un peu de comptage de 
lignes et colonnes dans la matrice de Sylvester), donc il n’est à priori pas pire à factoriser que Q 
lui-même !”. Mais il se peut que nous ayons de la chance et que R soit plus facile que Q. 

À part qu’on a peut-être plus de chance avec À qu'avec Q, l'avantage de la méthode est qu’elle 
permet d'éviter de passer par des extensions de Q non nécessaires 2°. 


Exemple 20.95 ([569]). 
Prenons la fraction rationnelle ==. L'intégration via les fractions simples est : 


z 1 1 1 1 1 1 1 
dx = = =] 1 = — In(x° —3). (20.34 
ET 5 6 5 (x V3)+, In(x+ V3) 5 (x 3). (20.348) 


Nous voyons que dans la réponse, il n’y a pas de racines. Passer par l'extension Q[4V3] est par 
conséquent peut-être un effort inutile. Voyons comment les choses se mettent avec la méthode 
Rothstein-Trager. 


D'abord 
R(Y) = resx(X — 2Y X,X°? 3) (20.349a) 
= resx ((1—2Y)X, X° —3) (20.349b) 
1=9Y 0 
= det 0  1-—-2Y O0 (20.349c) 
1 0 —3 
= (1-2Y)(—-3(1-2Y)) (20.3494) 
= -3(1-2Y), (20.349e) 


dont les solutions sont faciles : il n’y a que la racine double y = 1. La somme (20.324) sera donc 
réduite à un seul terme avec € = 1. Nous calculons P : 


1 
Pi = pacd(X — 52%, X? — 3) = pgcd(0, X? — 3) = X? — 3, (20.350) 
et par conséquent 
J > (X2— 3) (20.351) 
5 3 = -m — à). ; 
= 
À aucun moment nous ne sommes sortis de A. PA 


Comme vu sur cet exemple, l’intérêt du théorème de Rothstein-Trager est de permettre, lors- 
qu'on a de la chance, d’en profiter, et non de nous en rendre compte à la fin en remarquant 
bêtement que la réponse pouvait s’écrire dans QIX]. 


19. C’est de la factorisation de Q qu’on a besoin pour utiliser la méthode de décomposition en fractions simples. 
20. J'imagine que pour un ordinateur, c'est plus facile d'éviter les extensions. 
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Remarque 20.96. 
Afin d'utiliser cette méthode, il faut s'assurer que Q soit sans facteurs carrés. Si nous devons 


intégrer un £ quelconque, nous devons commencer par écrire 


Q 
Q = Q1Q50$...%, (20.352) 


et ensuite il y a moyen de ramener l'intégrale de P/Q à des intégrales de md Cela ne demande 
pas de factoriser complètement Q, mais seulement de trouver ses facteurs irréductibles Q; dans 
QLX]. 

Dans l’exemple donné plus haut, Q = X?-—3 a des facteurs irréductibles autres que Q lui-même 
dans R[X], mais nous n’en avons pas besoin. 


Voici une exemple où nous évitons de passer par les complexes. 


EXo0TPEQooGKDjea 
Exemple 20.97 ([570]). 
À calculer : Ers La décomposition en fractions simples donne : 
1 1 1/2 1/2 
3 o / / =. (20.353) 
T° +X T Æ—1 X+1 
Déjà cette décomposition passe par l'extension Q[i], et le calcul de la primitive de 5 demande le 


logarithme complexe qui ne sera vu que dans la proposition 26.42 au prix d’un peu de sang. Nous 
verrons dans l’exemple 26.43 comment ça se passe en passant par les complexes. 

En ce qui concerne la méthode de Rothstein-Trager, nous commençons par calculer le résultant 
(qui est tout de même un peu de calcul) : 


P(y) = resx (—3yX°-y+1,X°-—X) (20.354) 
—3y OÙ 1-7 0 0 
O0  —3y 0 1-7 0 
= det | 0 0 —3y 0 1-y (20.354b) 
1. 0 1 0 0 
0 1 0 1 0 
= —(y —1)*(2y +1) (20.354c) 


| Sage Version 5.7, Release Date: 2013-02-19 

| Type "notebook()" for the browser-based notebook interface. | 

| Type "help()" for help. | 

sage: y=var(’y’) 

sage: R=matrix(5,5,[-38*y,0,1-y,0,0,0,-3*y,0,1-y,0,0,0, 
-3*y,0,1-y,1,0,1,0,0,0,1,0,1,0]) 

sage: R.determinant ().factor() 

(y — 1)*(2*y + 1)72 


Les solutions sont €1 = 1 et c2 = —}. Nous pouvons alors calculer les P; : 
Pi = pecd(—-3X?,X$ + X) = X (20.355) 
et 
P; = pacd(=X? + 5 X° + X) = X?+1, (20.356) 
et finalement : 
PTE A0 EN) == CR 1) (20.357) 
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Notons qu’il n’y a pas de miracles : lorsque la réponse contient des racines, nous ne pouvons 
pas couper à passer par des extensions et factoriser un peu à la dure. 


ExYQODuyU 
Exemple 20.98 ([570]). 
Nous voulons calculer , 
| 20. 
J Xi (20.358) 
Nous posons donc P = 1 et Q = X? + 1. Le résultant à calculer est 
—2y 1 O0 
P(y) = resx(—2yX + 1,X? +1) = det | O —2y 1 |=4y°? +1. (20.359a) 
1 0 1 
Les racines de cela sont complexes et il n’y a donc pas d’échappatoires : «1 = ï, Ca = —À. Ensuite, 
étant donné que X? + 1—(X +4)(X — à) = i(—iX + 1)(X — à) nous avons 
Pi = pgcd(—iX +1,X?2 +1) = X +i. (20.360) 


Notons que de façon naturelle, nous aurions écrit P; = 1—iX, mais par convention nous considérons 
le PGCD unitaire. Cela ne change rien à la réponse parce que changer P; en &P,; ne fait que rajouter 
une constante In(k) à la primitive trouvée. 

De la même façon, 


P> = pecd(1 +iX,X? +1) = X —i. (20.361) 
Au final nous écrivons 
X — : i). 20. 
fr -: 5 MX +); In(X — i) (20.362) 
A 


Remarque 20.99. 
Tout cela est si nous voulons absolument écrire la primitive avec des logarithmes de polynômes. 
Pour celui de l'exemple 20.98, nous avons trouvé 


: EqBC) 
fr - 5n0 +5 -Em(x à BE 
Mais 

sage: f(x)=1/(x++x2+1) 


sage: f.integrate(x) 
x |--> arctan(x) 


Si nous acceptons de passer aux fonctions trigonométriques (inverses), la primitive prend un tour 
très différent et bien réel. Ces deux visions de l’univers sont bien entendu ?! compatibles. En effet, 
afin de tomber juste, nous allons prendre la primitive 


In(ix — 1) ; Inéx +1) (20.364) 


au lieu de (20.363). Il s’agit seulement de multiplier l’intérieur des logarithmes, ce qui ne donne 


qu'une constante de différence. Ensuite nous passons à la forme trigonométrique des nombres 
complexes : ie — 1 = 4/4? + lefarctan(x) et jy + 1 = /x2 + Lefarctan(x), Avec un peu de calcul, 


Flo =; (arctan(-2) — arctan(x)) = arctan(x). (20.365) 


21. Si on croit que la mathématique est cohérente. 
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20.16 Rappel sur les intégrales usuelles 


Soit une fonction 
f:fabcR-Rt 
ze f(x). 
L'intégrale de f sur le segment [a, b|, notée (a f(x)dx est le nombre égal à l’aire de la surface située 
entre le graphe de f et l’axe des x, comme indiqué à la figure 20.5. 


(20.366) 


À 


N 2 


a b 


FIGURE 20.5: L'intégrale de f entre a et b représente la surface sous là don£ékRLooMb j xl 


Définition 20.100. 
Si f est une fonction de une variable à valeurs réelles, une primitive de f est une fonction F 
telle que F' = f. 


Toute fonction continue admet une primitive. 


Théorème 20.101 (Théorème fondamental du caclul intégral). 
Si f est une fonction positive et continue, et si F est une primitive de f, alors 


[ f(x)dx = F(b) — F(a). (20.367) 


Remarque 20.102. 

Si f est une fonction continue par morceaux, l’intégrale de f se calcule comme la somme des 
intégrales de ses morceaux. Plus précisément si nous avons a = ï0 < 1 <...< x, = b et si f est 
continue sur |x;,æ;+1| pour tout à, alors nous posons 


[ f(x)dx = [ F(x)dæ + [' f{x)dr +-..+ [ f(x)dx. (20.368) 


Sur chacun des morceaux, l’intégrale se calcule normalement en passant par une primitive. 


20.17 Intégrales le long de chemins 


20.17.1 Circulation d’un champ de vecteur 


Définition 20.103. 
Soit F: IR? — IR un champ de vecteurs et un chemin a: [a,b] — IR°. On appelle circulation de 
F le long du chemin © le scalaire 


J F(o(t)) : o'(tdt. DRE) 


Îl existe de nombreuses notations pour cela ; entre autres : 


[F- [F - ds. (20.370) 
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En physique, la circulation de la force le long d’un chemin est le travail de la force. 


Exemple 20.104. 
À la surface de la Terre, le champ de gravitation est donné par 


0 
G(x,y,z) = —mg | 0 |. (20.371) 
1 


Si nous considérons un mobile qui monte à vitesse constante jusqu’à la hauteur h, c’est-à-dire le 
chemin 


0 
o(t) = |0 (20.372) 
t 


avec { € [0,h]. Le travail de la gravitation est alors donné par 


h 0 h 0 0 
14 -| G(o(t)) : [0 | = ma | 0] - [0] =-mgA. (20.373) 
û 1 Gt 1 


Cela est bien le résultat usuel de l’énergie potentielle. Nous allons voir bientôt que nous nommons 
la fonction mgh énergie potentielle précisément parce que la force dérive de ce potentiel. A 


Exemple 20.105. 
Soit le chemin 


o: [0,2x] — R° 
sin(s) (20.374) 
tr | cos(t) 
t 
et le champ de vecteurs 
x x 
Flyl= ty |: (20.375) 
z z 


La circulation de ce champ de vecteur le long de l’hélice © est 


[F fie [eco be 


0 
27 [/sin(t) cos(t) 
= Î cos(t) | : | —sin(t) | dt 
g t 1 
2x (20.376) 
= Î tdt 
0 
12 27 
El 
= 27°. 
A 


Proposition 20.106. 
La circulation d’un champ de vecteurs le long d’un chemin ne dépend pas du paramétrage. En 
d’autres termes, si o1 et o2 sont deux chemins équivalents, alors 


Î F= L Æ (20.377) 
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Démonstration. Soient deux chemins 01: [a,b] — IR? et 02: [c, d] — IR° équivalents, c’est-à-dire 
tels que 
oi(t) = o(p(t)) (20.378) 


où p: [a,b] — [c,d] strictement croissante. En utilisant le fait que o!(t) = g'(t)o2((t)), nous 
avons 


L HUE ['rçat0) - oï(t)dt 


a 


(b) 
= [ : F(o2(s)) - o2(s)ds (20.379) 


d 
- | F(o2(s)) : o(s)ds 


C 


- | F : ds. 
02 


où nous avons effectué le changement de variables s = w(t), ds = w'(t)dt. 


Remarque 20.107. 
Si o2 est le chemin opposé de ©, alors 


[ F=- L F. (20.380) 


20.18 Circulation d’un champ conservatif 


Si nous avons une fonction scalaire V : R° — R, nous pouvons construire un champ de vecteur 
en prenant le gradient : 
F(x) = VV(x). (20.381) 


On dit que le champ de vecteur F dérive de V, et on dit que V est le potentiel de F. Nous 
posons la définition suivante : 


Définition 20.108. 
Un champ de vecteurs F: R? — RŸ est un champ conservatif si il existe une fonction V : R? — R 
telle que 

Er) = VV (G): (20.382) 


Nous disons aussi parfois que le champ F dérive d’un potentiel ou bien qu'il s’agit d’un champ de 
gradient. 


Les champs de vecteurs conservatifs sont particulièrement importants parce que presque toutes 
les forces connues en physiques dérivent d’un potentiel. Nous verrons que la terminologie « conser- 
vatif » provient du fait que les forces de ce type conservent l’énergie associée. 


Proposition 20.109. 
Considérons une fonction V : R° — IR {que nous appellerons potentiel) et le champ de vecteur qui 
en dérive : 


FE = VV. (20.383) 
Alors 
l A A 0 AC OO) (20.384) 


Autrement dit, le travail nécessaire pour déplacer un objet d’un point à un autre dans un champ 
de force conservatif vaut la différence de potentiel entre le point de départ et le point d'arrivée. 
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Démonstration. Par définition, 
b 
J ee | F(o(t)) + o/(t)dt. Eqintpardgftrer 


Nous pouvons transformer l’intégrante de la façon suivante : 


F(o(#)) - o/(#) = VV (o{t)) : o'(t) 


COL OA COLE OEE2000 0880 
d 


où nous avons posé 


Ox(t) 
o(t) = | oy(t) (20.387) 
Galt) 
et utilisé à l’envers la formule de dérivation de fonction composée pour 


Gt] = (V6) (20.388) 


En remettant ces expressions dans l'intégrale (20.385), 


[F — [ CON = V(o(b)) — V(c{a)). (20.389) 


Exemple 20.110. 

Nous savons que le champ de gravitation dérive d’un potentiel. À la surface de la Terre, le potentiel 
de gravitation vu par une masse m est donné par la fonction V(x,y,z) = mgz. Si nous voulons 
soulever cette masse d’une hauteur h, cela demandera toujours une énergie mgh, quel que soit le 
chemin suivi : en ligne droite vertical, en diagonal, en hélice, ..…. A 


Exemple 20.111. 
À plus grande échelle, le champ de gravitation est encore un champ qui dérive d’un potentiel. En 
coordonnées sphériques, 

V(p, 8,6) = . (20.390) 


Lorsqu'un satellite a une orbite de rayon R autour la Terre, il reste sur la sphère p = R. Donc il reste 
sur une surface sur laquelle V est constante. Il n’y a donc pas de travail de la force de gravitation ! 
C’est pour cela qu’un satellite peut tourner pendant des siècles sans apport énergétique. A 


Exemple 20.112. 
Soit le champ de vecteurs 


et le chemin 4 
t*/4 
o(t) = mn (20.392) 


Nous voulons calculer la circulation de F le long du chemin © entre t =0 et t = 1. 
La première chose à voir est que F = VV avec V(x,y) = æy. Donc la circulation sera donnée 


par 
J F : ds = V(o{1)) —- V(o(0)) = V(1) — V(0,0) = ; —0 = . (20.393) 


Nous n'avons pas réellement calculé l'intégrale. A 
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20.19 Intégration de fonction à deux variables 


20.19.1 Intégration sur un domaine rectangulaire 
PgRaplntMultFubiniRect 


Soit une fonction positive 
f: [ab] x [c, d] — R* 


(x, y) > f(x, y). 


L'intégrale de f sur le rectangle [a,b] x [c,d] est le volume sous le graphe de la fonction. 
C'est-à-dire le volume de l’ensemble 


(20.394) 


{(x, y, 2) tel que (x, y) € [a,b] x [c,d],z < f(x,y)}. (20.395) 


Théorème 20.113 (Théorème de Fubini). 
Soit une fonction f: IR? — IR une fonction continue par morceaux sur R = [a,b] x [c,d]. Alors 


LÉ Fond le | [ ‘ Fa du _— [ | | [ Fa sd a (20.396) 


En pratique, nous utilisons le théorème de Fubini pour calculer les intégrales sur des rectangles. 


Exemple 20.114. 
Nous voudrions intégrer la fonction f(x, y) = 4 + x? + y? sur le rectangle de la figure 20.6. 


À 


2 J 
1 < 
1 
FIGURE 20.6: Intégration sur un rectangle LabelFigVNBGooSqMsGU 


L'ensemble sur lequel nous intégrons est donné par le produit cartésien d’intervalles Æ = 
[0,1] x [0,2]. Le théorème de Fubini montre que nous pouvons intégrer séparément sur l'intervalle 


horizontal et vertical : 
Ï — Ï | Ï (= Pi) dx. (20.397) 
E=[0,1]x[0,2] (0,11 | Jf0.2] 


Ces intégrales sont maintenant des intégrales usuelles qui s'effectuent en calculant des primitives : 


1 r2 1 y 2 
Î | Ga? - 1)aydr = | Lay en - À dx 
o Jo 0 3 Jo 


à 8 
=[« 2x? 3)d7 


0 (20.398) 
: E et 
8 4) 
_ 14 
3 


Avec Sage, on peut faire comme ceci : 


| Sage Version 4.6.1, Release Date: 2011-01-11 | 
| Type notebook() for the GUI, and license() for information. | 
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sage: f(x,y)=4-xxx2-yx42 
sage: f.integrate(y,0,2).integrate(x,0,1) 
(és va ==> 1478 


20.19.2 Intégration sur un domaine non rectangulaire 
PgRaplntMultFubiniTri 


Nous voulons maintenant intégrer la fonction f(x, y) = x? + y? sur le triangle de la figure 20.7. 


2 2. 
1 21 
1 2 
FIGURE 20.7: Intégration sur un triangle LabelFigCURGooXvrulV 


Étant donné que y varie de 0 à 2 et que pour chaque y, la variable x varie de 0 à y, nous 
écrivons l’intégrale sur le triangle sous la forme : 


2 
J (x? + y?)dxdy = Î ( 
triangle 0 


Il existe principalement deux types de domaines non rectangulaires : les « horizontaux » et les 
« verticaux », voir figure 20.8. 


y 
Î (x? + ar) dy. (20.399) 
0 


\ d Éd: 5 
ce 
+ —+ 
a b mu UN no 
(a) Un domaine horizontal. (b) Un domaine vertical. 


FIGURE 20.8: Deux types de surfaces. Nous avons tracé un rectangle qui contient chacune des 
deux surfaces. L'intégrale sur un domaine sera l’intégrale sur le rectangle de la fonction qui vaut 
zéro en dehors du domaine. LabelFigHCJPooHsaTgI 


Les surfaces horizontales sont de la forme 


D = {(x,y) tel que x € [a, b], ç1(x) < y < pa(x)} (20.400) 
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où 1 et w2 sont les deux fonctions qui bornent le domaine. Le domaine D est la région comprise 
entre les graphes de 41 et 42. Pour un tel domaine nous avons 


+ 
l f(x, y)dxdy -f a |" 1 (20.401) 
pi(x) 
Les surfaces verticales sont de la forme 
D = {(x,y) tel que y e [c, d], Y1(y) < x < Ya(y)} (20.402) 


où 1 et w2 sont les deux fonctions qui bornent le domaine. Le domaine D est la région comprise 
entre les graphes de 41 et 42. Dans ces cas nous avons 


o 
L 7 -f à [+ (20.403) 
d1(y) 
Proposition 20.115. 


L'’aire du domaine D vaut l'intégrale de la fonction f(x, y) = 1 sur D : 
Aire(D = [ dxdy. (20.404) 


Démonstration. Supposons que le domaine soit du type « horizontal ». En utilisant le théorème de 
Fubini avec f(x,y) = 1 nous avons 


É dxdy = [ | [© 7 dx = Î [p2(x) — w1(x)]. (20.405) 


Cela représente l’aire sous 42 moins l’aire sous 41, et par conséquent l’aire contenue entre les 


deux. 


Exemple 20.116. 
Cherchons la surface du disque de centre (0,0) et de rayon 1 dessinée à la figure 20.9. 


À 


FIGURE 20.9: En bleu, la fonction Vr? — x? et en rouge, la fonctiopaba/FiscMiooqegASg 
Le domaine est donné par w1(x) < y < ga(x) et x € [—r,r] où g1(x) = —Vr2 — x? et wa(x) = 
Vr2 — 2. L’aire est donc donnée par 


T 


A= | fox) — pi(x)]dr = 2 [ V/72 = x2dx = 4 [ V/72 = x2. (20.406) 


7 


Nous effectuons le premier changement de variables x = ru, donc dx = rdu. En ce qui concerne 
les bornes, si æ = 0, alors u = 0 et si x = r, alors u = 1. L'intégrale à calculer devient 


1 1 
A = il Vr2 — rZu?rdu = a | V1 — u?du. (20.407) 
0 0 
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Cette dernière intégrale se calcule en posant 


u = sin(t) du = cos(t)dt 


ù = t=0 (20.408) 
u = b = #2, 
Nous avons 
7/2 r/2 
A = a | 4/1 — sin?(t) cos(t)dt — a | cos? (t)dt. (20.409) 
0 0 
En utilisant la formule 2 cos?(x) = 1 + cos(2x), nous avons 
el de 
A= a | = _ Le (20.410) 
0 
A 


20.19.3 Changement de variables 


Nous n’allons pas parler de changements de variables maintenant parce que les principaux 
exemples sont les coordonnées polaires, cylindriques et sphériques qui requièrent les fonctions 
trigonométriques. Ce sera pour la section 18.15. 


20.20 Les intégrales triples 


Les intégrales triples fonctionnent exactement de la même manière que les intégrales doubles. 
Il s’agit de déterminer sur quelle domaine les variables varient et d’intégrer successivement par 
rapport à x, y et z. Il est autorisé de permuter l’ordre d'intégration ?? à condition d’adapter les 


domaines d’intégration. 


Exemple 20.117. 
Soit le domaine parallélépipédique rectangle 


R = [0,1] x [1,2] x [0,4]. (20.411) 


Pour intégrer la fonction f(x,y,z) = x?ysin(z) sur R, nous faisons 


I -| x? ysin(z) dxdydz 
R 


1 2 4 
= | dr | dy| x?ysin(z)dz 
0 1 0 
1 2 
= dx | z?y(1 — cos(4))dy (20.412) 
1 
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| Sage Version 4.6.1, Release Date: 2011-01-11 | 
| Type notebook() for the GUI, and license() for information. | 
sage: f(x,y,z)=x*x*x2*y*sin(z) 

sage: f.integrate(x,0,1).integrate(y,1,2).integrate(z,0,4) 

(x, y, z) |--> -1/2*cos(4) + 1/2 


22. En toute rigueur, cela n’est pas vrai, mais nous ne considérons seulement des cas où cela est autorisé. 
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A 


Exemple 20.118. 
Soit D la région délimitée par le plan x = 0, y = 0, z = 2 et la surface d’équation 


z= 2 +y. (20.413) 
Cherchons à calculer ( D + dx dy dz. Ici, un dessin indique que le volume considéré est z > x? + y. 
Il y a plusieurs façons de décrire cet ensemble. Une est celle-ci : 
z:0—2 
z: 0 — z (20.414) 
y: 0 — 1/2 — x2. 
Cela revient à dire que z peut prendre toutes les valeurs de 0 à 2, puis que pour chaque z, la 


variable x peut aller de 0 à 4/7, mais que pour chaque z et x fixés, la variable y ne peut pas 
dépasser V2 — x?2. En suivant cette méthode, l'intégrale à calculer est 


dz dx f(x, y, z)dy. (20.415) 


| Sage Version 4.6.1, Release Date: 2011-01-11 | 
| Type notebook() for the GUI, and license() for information. 


sage: f(x,y,z)=x 

sage: assume (z>0) 

sage: assume(z-x*x*2>0) 

sage: f.integrate(y,0,sqrt(z-x*x*2)).integrate(x,0,sqrt(z)).integrate(z,0,2) 
(x, y, z) |--> 8/15*sqrt(2) 


Notez qu’il a fallu aider Sage en lui indiquant que z > 0 et z — x? > 0. 
Un autre paramétrage serait 


y: 0 — V2 — x? (20.416) 


| Sage Version 4.6.1, Release Date: 2011-01-11 | 
| Type notebook() for the GUI, and license() for information. 


sage: f(x,y,z)=x 

sage: assume (2-x*x*2>0) 

sage: f.integrate(y,0,sqrt(z-x*x*2)).integrate(x,0,sqrt(z)).integrate(z,0,2) 
(x, y, z) |--> 8/15*sqrt(2) 


Écrivons le détail de cette dernière intégrale : 


v2 V2-x? 2 
I = Î dx | du | xdz 
(0 0 æ2+y? 
V2 V2-x2? 
= Î dx | x(2 — x? — y )dy 
0 0 
V2 37 V2-2? 
= | ar |@-y- À] 
0 3 


_ v22 23/2 
_ x(2 — x)” dx. 
0 3 


(20.417) 


0 


20.20. LES INTÉGRALES TRIPLES 1805 


Ici nous effectuons le changement de variable u = x?, du = 2xdx. Ne pas oublier de changer les 
bornes de l'intégrale : 


1 r2 
I = | (2—u)?du. (20.418) 
3 Jo 
Le changement de variable t = 2 — u, dt = —du fait venir (attention aux bornes! !) 
L (° 1[#21 85 
T=-- | t7/“dt = — 2. 20.419 
3 [ 3 | 5/2 , 15 
x 
20.20.1 Volume 
Parmi le nombreuses interprétations géométriques de l'intégrale triple, notons celle-ci : 
Proposition 20.119. 
Soit D € R°. Le volume de D est donné par 
Vol(D = [ dxdydz. (20.420) 


C'est-à-dire l'intégrale de la fonction f(x, y,z) = 1 sur D. 


Suivant les points de vue, cette proposition peut être considérée comme une définition du 


volume. 
ExemVolSphCart 


Exemple 20.120. 
Calculons le volume de la sphère de rayon À. Le domaine de variation des variables x, y et z pour 
la sphère est 


zx: —R—R 
y: — VR—-x2— VR2- 7x2 (20.421) 
_- R2 — 22 — y? — \/R2 — 2 — y2. 


Par conséquent nous devons calculer l'intégrale 


VR2-x2 V/R2-x2-42 
V = le af, du | dz. (20.422) 


VR2=x? R2_ x? y? 


La première intégrale est simple : 


VR2- x? 
= vaf &æ[ V/R2 — x? — y’ dy. (20.423) 


VR2-x?2 


Afin de simplifier la notation, nous posons a = R?—x?. Ceci n’est pas un changement de variables : 
juste une notation provisoire le temps d'effectuer l'intégration sur y. Étudions donc 


Va 
= Î V/a— y?dy, (20.424) 
va 


ce qui est la surface du demi-disque de rayon 4/a. Nous avons donc 


et 
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Exemple 20.121. 
Nous pouvons calculer le volume de la sphère en utilisant les coordonnées sphériques. Les bornes 
des variables pour la sphère de rayon R sont 


p:0—R 
0:0—7 (20.427) 
@: 0 — 27. 


En n’oubliant pas le jacobien p? sin(0), l'intégrale à calculer est 


R 27 T 
V = Î d | de | p° sin(0)d (20.428) 
0 0 0 
L'intégrale sur 4 fait juste une multiplication par 27. Celle sur p vaut 
R 3 
R 
| pdp = —. (20.429) 
0 3 
L'intégrale sur 0 donne 
Î sin(0)d0 = [— cos(0)]G = 2. (20.430) 
0 
Le tout fait par conséquent 
4 
V = TR. (20.431) 


Sans contestes, le passage aux coordonnées sphériques à considérablement simplifié le calcul par 
rapport à celui de l’exemple 20.120. A 


20.21 Un petit peu plus formel 


20.21.1 Intégration sur un domaine non rectangulaire 


FIGURE 20.10: Intégrer sur des domaines plus complexg®belFigPONXooXYjEot 


La méthode de Fubini ne fonctionne plus sur un domaine non rectangulaire tel que celui de la 
figure 20.10. Nous allons donc utiliser une astuce. Considérons le domaine 


E = {(x,y) e R?° tel que a < x <bet a(r) < y < B(x)} (20.432) 


représenté sur la figure 20.10. Nous considérons la fonction 


- on si(æ,y)eE 


À(æ,y) = (20.433) 
0 sinon. 


Ensuite intégrons f sur un rectangle qui englobe la surface à intégrer à l’aide de Fubini. Étant 
donné que f = f sur la surface et que f est nulle en dehors, nous avons 


Lee 


Dans le cas de l'intégrale de f(x, y) = x? + y? sur le triangle de la figure 20.7, nous avons 


2 y 
Î (x? + y?)dxdy = | (| (a? + vd) dy. (20.435) 
triangle 0 0 


B(x) 
J J(æ, ous) dx. (20.434) 


a(x 


20.21. UN PETIT PEU PLUS FORMEL 1807 


Remarque 20.122. 
Le nombre ( D (x, y)dxdy ne dépend pas du choix du rectangle englobant D. 


En pratique, nous calculons l'intégrale en utilisant une extension du théorème de Fubini : 


Théorème 20.123. 
Soit f: DCR? —R une fonction continue où D est un domaine de type vertical où horizontal. 


(1) Si D est vertical, alors 
. 
hi -[ DRE CS sn dx. (20.436) 
p1(x) 


[s-f | [os - us | ” Fr. 


20.21.1.1 Coordonnées polaires 


(2) Si D est horizontal, alors 


Les coordonnées polaires sont données par le difféomorphisme 


g: 10, of x ]0,27[ — R?\D 


(r,0) (r cos(6), rsin(8)) (20.438) 


où D est la demi-droite y = 0, x > 0. Le fait que les coordonnées polaires ne soient pas un 
difféomorphisme sur tout IR? n’est pas un problème pour l'intégration parce que le manque de 
difféomorphisme est de mesure nulle dans R?. Le jacobien est donné par 


: x Opt\ cos(9) —rsin(0)\ 
Jg = det Le 4 = det ee. DéoB D) É (20.439) 


20.21.1.2 Coordonnées sphériques 


SubSubCoordSpJxhMwm 
Les coordonnées sphériques sont données par 
x = r cos Üsin r € ]0,l 
; ; OMEqChnVars 
y =rsnô6sny avec 0€ ]|0,27| Fe PES 140) 
2 = Tcosp pe]0,7r|. 
Le jacobien associé est Jg(r, 0,4) = —r?sinçg. Rappelons que ce qui rentre dans l'intégrale est la 


valeur absolue du jacobien. 
Si nous voulons calculer le volume de la sphère de rayon À, nous écrivons donc 


R 27 T 
Î ar | de | r?sin()dp = 4rR = TR (20.441) 
0 0 0 


Ici, la valeur absolue n’est pas importante parce que lorsque 6 € ]0,7,|{, le sinus de 6 est positif. 
Des petits malins pourraient remarquer que le changement de variable (20.440) est encore un 
paramétrage de R° si on intervertit le domaine des angjles : 


0:0—7 


Rue (20.442) 


alors nous paramétrons encore parfaitement bien la sphère, mais hélas 


Î É” Î "db Î Tsn(édé 0. FA VolmmeIncorrectinere 
0 0 0 
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Pourquoi ces « nouvelles » coordonnées sphériques sont-elles mauvaises ? Il y a que quand l’angle 
@ parcours [0,27[, son sinus n’est plus toujours positif, donc la valeur absolue du jacobien n’est 
plus r?sin(@), mais r?sin(é) pour les @ entre 0 et t, puis —r?sin(p) pour @ entre x et 27. Donc 


l'intégrale (20.443) n’est pas correcte. Il faut la remplacer par 


[ar [ dô L rsnçoas - [ef w]” r2sin(é)dp = Sr (20.444) 


20.22 Aire et primitive 


Soient f : R — R une fonction continue et x € R. Pour chaque a € R, nous pouvons considérer 
le nombre F(x) défini par 


F(x) = | f(bdt. (20.445) 


FIGURE 20.11: Surface sous une courbe Labe1FigVSZRooRWgUGu 


La fonction F' ainsi définie a deux importantes propriétés : 
(1) C’est une primitive de f, 
(2) Elle donne la surface en dessous de f entre les points a et x, voir la figure 20.11. 


Notons que tant que f est positive, la surface est croissante. 
La manière de calculer la surface comprise entre deux fonctions est dessinée à la figure 20.12. 
La surface entre les deux fonctions y1(x) et y2(x) se calcule comme suit. 


(1) On calcule les intersections entre yl et y2. Notons a et b les ordonnées obtenues. 


(2) La surface demandée est la différence entre la surface sous la fonction y1 (la plus grande) et 
la surface sous la fonction y2 (la plus petite), donc 


S = [u- [u (20.446) 


20.22.1 Longueur d’arc de courbe 


La longueur de l’arc de courbe de la fonction y = f(x) entre les abscisses z9 et x1 est donné 


par la formule 
wo, 1) = [ VT+ yat. EaLongregouats 


Lorsque la courbe est donnée sous forme paramétrique 
nn) (20.448a) 
y = y(t), (20.448b) 


alors la formule devient 


t2 
l,to) = | V7 + ÿ(6)7dt, FqLongiEef are 
t1 


20.23. L’AIRE EN DESSOUS D'UNE COURBE 1809 


(a) La grande surface. 


(b) La surface à soustraire. 


e e > 
a b FePAIESENORR oz 20TISSESReTEURES 


(c) La surface entre les deux fonctions. 


FIGURE 20.12: Le calcul de la surface comprise entre deux fopgbias.5Q0BA00ZZZ0r1 


20.22.2 Aire de révolution 


Pour savoir l’aire engendrée par la ligne y = f(x) entre a et b autour de l’axe Ox, on utilise la 
formule 


CE J AT FO je. (20.450) 


20.23 L’aire en dessous d’une courbe 


Soit f une fonction à valeurs dans R*. 

Nous voudrions pouvoir calculer l’aire au-dessous du graphe de la fonction f. Nous notons S (x) 
l’aire là-dessous de la fonction f entre l’abscisse 0 et x, c’est-à-dire l’aire bleue de la figure 20.13. 

Si la fonction f est continue et que Àx est assez petit, la fonction ne varie pas beaucoup entre x 
et x + Ax. L'augmentation de surface entre x et x + Ax peut donc être approximée par le rectangle 
de surface f(x) Ax. Ce que nous avons donc, c’est que quand Ax est très petit, 


Sy(x + Az) — S;(x) = f(x)Ax, (20.451) 


ou encore 
fa) = LE + 50) — ÊrG), (20.452) 


a b FAR FRANS QUES EeReReRREs 


a b ÉARSTFSROPAQN PORTES RAR e RER 


1810 CHAPITRE 20. INTÉGRATION SUR DES VARIÉTÉS 


N | 


T' x + Ax 


FIGURE 20.13: L’aire en dessous d’une courbe. Le rectangle rouge d’aire f(x) x approxime de 
combien la surface augmente lorsqu'on passe de x à x + Ax. LabelFigKKRooHseDzC 
Nous formalisons la notion de « lorsque Ax est très petit » par une limite : 


| (20.453) 


Donc, la fonction f est la dérivée de la fonction qui représente l’aire là-dessous de f. Calculer des 
surfaces revient donc au travail inverse de calculer des dérivées. 


20.24 Propriétés des intégrales 

Lemlneqnormeintintnorm 
Lemme 20.124. 
Pour toute fonction u: [a,b] — R”, nous avons 


b b 
| | u(t)dt| < J POI. (20.454) 


pourvu que le membre de gauche ait un sens. 


Démonstration. Étant donné que [a u(t)dt est un élément de R”, par la proposition 11.9, il existe 
un £e R” de norme 1 tel que 


b b b b b 
| J u(#)dt| = € : J u(#)dt = J u(#) - Edt < J POIRE J lu(#)dt. (20.455) 


Proposition 20.125 (Relations de Chasles). 
Soit f une fonction continue sur l'intervalle T. Si a, b,ce I nous avons 


Fee ol Ode (20.456) 
a a b 


Sur la figure 20.14, la surface de a à c est évidemment égale à la somme des surfaces de a à b 
et de bà c. 


Corolaire 20.126. 


b a 
J (rar = -| f(x)dx. (20.457) 
b 
l lineariteintegrale 
Proposition 20.127 (Linéarité de l’intégrale). 
Si f et g sont deux fonctions continues sur I € R, a, be TI et ÂE R nous avons 


b 


b b 
[ (f(x) + g(x))dx = J Éd J ie (20.458) 


a a 
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FIGURE 20.14: Illustration pour les relations de Chaslespabe1FigNNDoo00bSHB 


et 


[ace = à f rca. 


Proposition 20.128 (L'intégrale est monotone). 
Soient a, be I avec a < b. Si f > g sur [a,b] alors 


Corolaire 20.129 (Positivité). 
Sia <bet f > 0 sur [a,b] alors 


[sea > 0 


(20.459) 


PropCJIooHqECbq 


(20.460) 


PropHVWooBDRhCXx 


(20.461) 


Ce résultat n’est qu’une application de la proposition 20.128 car il consiste à prendre comme 


fonction g la fonction nulle. 


20.25 Techniques d'intégration 


Par le théorème 14.263, la calcul d’une intégrale consiste essentiellement à trouver une primitive 
de la fonction à intégrer. Il est donc indispensable de bien connaitre les dérivées des fonctions 


usuelles. 


Voici un tableau des primitives à connaitre. 


PageLCHooMbWj0; 
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Fonction Primitive Ensemble de définition Remarques 
Fa) f(x) dx de f 
2 il a +C dépend de «a ae R\{-1} 
I In (|x|) + C zx Æ0 
__ arctan(x) + C R 
_— arcsin(x) + C ]-1,1[ 
TT arccos(x) + C ]-1,1[ 
e? É RC R 
sin(x) — cos(x) + C R 
cos(x) sin(x) + C R 
1+tan?(x) | tan(x)+C | un intervalle de la forme 7, 5[+ kr 


Notez que au signe près, les fonctions arcsin et arccos ont la même dérivée. 

Si la fonction à intégrer est une combinaison linéaire de fonctions usuelles alors sa primitive peut 
être calculée en utilisant la proposition 20.127. Dans les sections suivantes on abordera deux autres 
cas où la fonction à intégrer peut s’écrire en termes de fonctions dont on connaît une primitive. 


20.25.1 Intégration par parties 
PROPooRLFIooQHnyJY 


Proposition 20.130 ({[1]). 
Siu et v sont deux fonctions dérivables de dérivées continues sur l'intervalle [a, b] alors 


b b 
J u(x)v'(x)dx = [u(x)o(x)]! - | u'(x)v(x)dx. dc 46) 


00 00 
J u(x)v'(x)dx = [u(æ)o(x)]® — | u'(x)v(x)dx. (20.463) 
Démonstration. Il s’agit d'utiliser à l’envers la formule de dérivation d’un produit : 
uv’ = (uv) — u'v. (20.464) 


Les fonctions à gauche et à droite étant égales, elles ont même intégrale sur [a, b] et par linéarité, 
voir proposition 20.127, on a : 


J Pr J co - J oo (20.465) 


a a 


La fonction uv est évidemment une primitive de (uv), de telle sorte que l’on puisse un peu simplifier 
cette expression : 


[ u(x)v'(x)dx = [u(r)o()] _ [ u’(x)v(x)dx, (20.466) 


ce qu'il fallait démontrer. 
En ce qui concerne l’affirmation avec b = ©, le lemme 14.254 est applicable et il suffit de passer 
à la limite dans (20.462). 


ExWIEooVUgvSp 
Exemple 20.131. 
Un cas typique d'utilisation de l’intégrale par parties est le suivant. Soit à calculer 


LL x cos(x)dx. (20.467) 
0 
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Nous devons écrire xcos(x) comme un produit u(x)v'(x). Il y a (au moins) deux moyens de le 
faire : 


u= x (20.468a) 
F = cos(r). (20.468b) 
u = cos(x) (20.469a) 
Wir, (20.469b) 


Nous allons choisir le premier ”. Nous avons donc 
(20.470) 


En utilisant la formule d'intégration par parties, 


L rcos(a)ar = Ë sin(a)] — [ 1 x sin(x)dx = rsin(r) — | — cos(x) |" = —2. (20.471) 


Le plus souvent, pour alléger les notations, il est plus pratique d'utiliser l’intégration par parties 
pour déterminer une primitive. Nous utilisons pour cela la formule (sans doute plus simple à retenir) 


fu = UU — fue (20.472) 
ExLTJooDZIYWP 


Exemple 20.132. 
Nous reprenons l'exemple 20.131 en déterminant cette fois une primitive de x cos(x) : 


[= cos(x)dx = æsin(x) — fsintaar = xsin(x) + cos(x) + C, C'ER. EaTONo TN 


Nous retrouvons le résultat numérique de l’exemple précédent en ajoutant les extrêmes d’intégra- 
tion . 
Î x cos(x)dx = [xsin(x) + cos(x) |, = —2, (20.474) 
0 
A 


Remarque 20.133. 
Lorsqu'on calcule des intégrales, il est bon de passer par la primitive (c’est-à-dire en suivant 
l'exemple 20.132 et non 20.131) parce qu’il est alors facile de vérifier le résultat en calculant la 
dérivée de la primitive trouvée. 

Par exemple pour vérifier si (20.473) est correct, il suffit de dériver xsin(x) + cos(x) : 


(æsin(x) + cos(æ))" = sin(x) + æcos(x) — sin(x) = x cos(x). (20.475) 


La fonction xsin(x) + cos(x) est donc bien une primitive de x cos(x). 
primin 
Exemple 20.134 (Primitive du logarithme). 
La primitive de la fonction logarithme définie en 15.81 nous offre un bon moment d’intégration 
par partie. 
Trouver la primitive de la fonction x + In(x). Pour calculer 


fntoar (20.476) 


23. Mais nous conseillons vivement au lecteur d’essayer le deuxième pour se rendre compte qu’il ne fonctionne pas. 
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nous écrivons In(x) = 1 x In(x) et nous posons uw’ = 1 et v = In(x), c’est-à-dire 


1 (20.477) 

= = 

œ 

La formule d'intégration par parties (20.462) donne donc 

1 
[to = (a) - [+ = = sin(a)- [1 = xin(x)-x+0C, CEeR. (20.478) 
Il est facile de vérifier par un petit calcul que 

(zin(x) — x) = In(x). (20.479) 
A 


20.25.2 Changement de variables — pour trouver des primitives 


De la même manière que l’utilisation « à l’envers » de la formule de dérivation du produit avait 
donné la méthode d'intégration par parties, nous allons voir que que l’utilisation « à l’envers » 
de la formule de dérivation d’une fonction composée donne lieu à la méthode d'intégration par 
changement de variables. 

PROPooMVIUooZmvHxS 
Proposition 20.135. 
Soient I et J des intervalles de R, u: 1 — J une fonction qui est dérivable de dérivée continue et 
f:J—R une fonction admettant une primitive F. Alors la fonction 


zx F(u(x)) (20.480) 


est une primitive de 


Démonstration. Cela est une utilisation immédiate de la formule de dérivée des fonctions compo- 
sées. 


Exemple 20.136. 
Soit à calculer 


fev 1 = dr. (20.482) 


La fonction g(x) = xV1—x° est le produit de x et de V1 — x?. On remarque que la dérivée de 
1— x? est —2x : nous avons alors, à un facteur —2 près, une expression de la forme (20.481) où 
la racine carrée joue le rôle de f, f(t) = V4, et 1 — x? le rôle de u. Une primitive de la fonction 


f() = Vt est F(t) = 249/2/3. 
Donc la fonction ee L 2(1 22)%2 est primitive de —2x1 — 42 = —2g(x). Autrement 
1 — x2)9/2 


dit, 
[-2vi er 3 


et en divisant par —2 nous trouvons la primitive demandée : 


1 r2)7/2 
frvi ru er (20.484) 


3 


+ C, (20.483) 


A 


L'exemple suivant donne une façon plus économe de retenir la méthode du changement de 
variables. 
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exempleprimitivechangvar 
Exemple 20.137. 
Soit à calculer 


J cos(r)et dx. (20.485) 


Vu qu’il y a beaucoup de fonctions trigonométriques dans la fonction à intégrer, nous allons poser 
u(x) = sin(x), et remplacer élément par élément tout ce qui contient du « x » dans l'intégrale 
demandée par la quantité correspondante en termes de u. 

La difficulté est de savoir ce que nous allons faire du « dx » dans l'intégrale. Ce dx marque 
une variation (infinitésimale) de x. La formule des accroissements finis dit que si x augmente de la 
valeur dx, alors u(x) augmente de w’(x)dx, c’est-à-dire que 


du = cos(x)dx. (20.486) 


Nous avons donc les substitutions suivantes à faire : 


sin(x) = u (20.487a) 
du = cos(x)dx (20.487b) 
du 
= . 20.4 
dx nt) (20.487c) 


La chose « magique » est que le cos(x) se trouvant dans la fonction se simplifie avec le cosinus qui 


arrive lorsqu'on remplace dx par OO Les substitutions faites nous restons avec 


Jeostaete) dr = Je"au = +0, où u = sin(x). (20.488) 


Attention : la réponse doit être impérativement donnée en termes de x et non de uw. Nous écrivons 
donc 


J cos(r)et = en) + C. (20.489) 


A 


20.25.3 Changement de variables — pour calculer des intégrales 


Le théorème 14.263 fixe la relation entre la recherche des primitives de f et la calcul de l'intégrale 
de f sur l'intervalle d’extrêmes a et b. On a vu dans la section précédente comment utiliser le 
changement de variable pour trouver une primitive de f. Il faut maintenant comprendre comment 
appliquer ce qu’on a vu dans le calcul d’une intégrale. 

En effet nous avons le choix entre 

— trouver une primitive de f comme dans la section précédente et appliquer ensuite la formule 
du corolaire 14.263 ; 


— écrire une intégrale pour la nouvelle variable u = u(x) sur l'intervalle entre u(a) et u(b). 
Nous allons voir ces deux méthodes dans des exemples. 


Exemple 20.138. 
Soit à calculer 


12 
Ï x V1 — x?dr. (20.490) 


1/3 


Les primitives \zv 1 — x2dx ont été trouvé dans l’exemple 20.137. Une primitive est 


Ps) = frv 1 — x2dx = î _… (20.491) 
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Nous pouvons maintenant calculer l’intégrale de x41 — x? sur l’intervalle [1/3, 1/2] par la définition 


e. fr G) F G) 7 (20.492) 


1/3 3 8 81 


A 


Remarque 20.139. 

Pour que le calcul d’intégrale donne quelque chose de sensé il faut absolument que la primitive 
soit écrite en tant que fonction de x et non comme fonction de u. La méthode que nous allons voir 
dans l’exemple suivant réduit grandement la probabilité d'oublier ce détail, d’où le fait qu’elle soit 
de loin la plus utilisée. 


Exemple 20.140. 


Calculons à nouveau 7 


x V1- 2247. (20.493) 


1/3 
Cette fois nous allons toucher à l’intervalle d'intégration en même temps que faire le changement 
de variables. Nous savons déjà les substitutions 


u= 1-7: (20.494a) 
du = —2xdx (20.494b) 
du 
dx = —. 20.494 
ner (20.494c) 


En ce qui concerne les extrêmes d'intégration, si x = 1/3 alors u = 1 — à = 5 et si x — à alors 
u = à. Nous avons donc encore les substitutions suivantes : 


{ x = 1/3 — u = 8/9 (20.495a) 
= 1/2 — u = 3/4 (20.495b) 
Le calcul est alors 
1/2 1 r3/4 slsel 162 
til de -;| V'udu = - — v3 + V2 (20.496) 
Le 2e 21372 8 81 
/ / 8/9 


Attention : la dernière égalité n’est pas immédiate; elle demande quelques calculs et une bonne 
utilisation des règles de puissances. PA 


La deuxième méthode est plus utilisée et, avec un peu d’exercice, plus rapide à mettre en place 
que la première. 

Jusqu'à présent nous avons utilisé des changements de variables dans lesquels nous exprimions u 
en termes de x. Comme le montre l'exemple suivant, il est parfois fructueux d'utiliser le changement 


de variable dans le sens inverse : avec x exprimé en termes d’un paramètre. 
exemplepassagepolaires 


Exemple 20.141. 


À calculer : 
3/2 


V1 - x?dr. (20.497) 


Nous posons x = sin(Ÿ) parce que nous savons que 1 — sin?(9) — cos?(0) ; nous espérons que le 
changement de variables simplifie l'expression ?*. Les substitutions à faire dans l'intégrale sont : 

x = sin(6) (20.498a) 

dx = cos(0)d6, (20.498b) 


1/2 


24. Lorsqu'on fait un changement de variables, il s’agit toujours d’espérer que l’expression se simplifie. Il n’y a pas 
moyen de savoir à priori si tel changement de variable va être utile. Il faut essayer. 


20.25. TECHNIQUES D'INTÉGRATION 1817 


et en ce qui concerne les bornes, si x = 1/2 alors sin(0) = +, c'est-à-dire 0 = 2. Si xæ = 43/2 alors 
0 = 5%. Donc 
V3/2 7/3 
V1 — x°dx = J 4/1 — sin?(8) cos(0)dO. (20.499) 
1/2 x/6 


Nous avons 1 — sin?(9) = cos?() et vu que 8 e [7, 5] nous avons toujours cos(8) > 0, ce qui donne 
cos2(0) = cos(8). Nous devons donc calculer 


r/3 
] cos? (0)d. (20.500) 


Pour celle-là, il faut utiliser une formule de trigonométrie  : 


_ 1 + cos(20) 


cos? (0) 2 (20.501) 
Donc ; , ” , 
ñ/3 ñ/3 9 T T/3 20 
] cos? (0)dO - | mu0)"2 (| +| SC) 9 (20.502) 
r/6 x/6 2 2]r/6 Jr 2 


Pour calculer proprement la dernière intégrale nous effectuons un autre changement de variable 
(facile) en posant t = 20, dt = 2d6, t(x/6) = x/3 et t(x/3) = 27/3, nous avons alors 


ne g]7* 27/3 cos(t) OÙ 7 x T 
*(8)d8 = | dt = = - 20.503 
[. LS HER ao le né 6 12 12° 


parce que sin (2) = sin (3). Au final, 


3 
3/2 


T 
Leds 20.504 
V D Eat 5 ( ) 


1/2 


20.25.4 Intégrations des fractions rationnelles réduites 


Définition 20.142. 
Une fraction rationnelle est un quotient de deux polynômes à coefficients réels ou complexes. 


Par exemple 
5 4 x° 
ET = +v 
x? — 1 


(20.505) 


est une fraction rationnelle. 

Il sera expliqué dans le cours d’algèbre que toute fraction rationnelle peut être écrite sous 
forme d’une somme d'éléments simples, c’est-à-dire de fractions rationnelles d’un des deux types 
suivants : 


= a,acR,menN Cas oran 


(x a)"” 
RE a, B,a,beR,me N, a? — 4b < 0. Gaston, 


(x? + ax + by 


Nous allons nous contenter de donner un exemple de chaque type. 


(1) En ce qui concerne le cas (20.506a) avec m = 1, nous avons par exemple 


1 
J — zdr = nm (|xz—3]) +C: (20.507) 


Si vous voulez en être tout à fait sûr, effectuez d’abord le changement de variables u = x — 3 
qui donne dx = du. 


25. En fait, il y a moyen de terminer le calcul en intégrant deux fois par parties, mais c’est plus compliqué. 
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(2) En ce qui concerne le cas (20.506a) avec m £ 1, nous avons par exemple 


Î (x : Di _ 3(x . 1) +C. (20.508) 


Encore une fois, pour s’en convaincre, utiliser le changement de variables u = x —1, dx = du : 


1 1 ï u Li à 
pe fo fu du = 3 +C= PE AS (20.509) 


(3) En ce qui concerne le cas (20.506b) avec a Æ 0, nous avons par exemple 


x 1 2 
Pour ce faire, il faut faire le changement de variables u = x? + 4, du = 2xdx, dx = du qui 
donne : 
x 1 u ÏÎ 1 
= == = —In(|x° +4 | 20.511 
[ur 3 [Te Smu)+c = smfe+d)+c (0511 


Dans ce cas nous pouvons oublier d'écrire la valeur absolue dans le logarithme parce que de 
toutes façons, x? + 4 est toujours positif. 


(4) En ce qui concerne le cas (20.506b) avec a = 0, nous avons par exemple 


dx 1 dx 1 x 
L - Ne. 20.512 
Êe 1e. > aire 


où nous avons utilisé la primitive | dr = arctan(x) du tableau de la page 1811. Pour vous 
en convaincre vous pouvez faire la dernière étape avec le changement de variables u = x/2, 
dx = 2du. 


20.25.5 Quelques formules à connaitre 


À retenir 20.143 


[arc + Bg(x)) dx = a J f(x) dx + 8 [ate) dx. (20.513a) 
[rt9 (0) dr = f(x)g(x) — [ rate) dæ. (20.513b) 
[rCutau(e) dé [FO dt, avec t = u(x). (20.513c) 


! 
J me dx = log|f(x)| + C, c’est un cas particulier de la formule précédente. (20.513d) 
x 


20.25.6 Approximation de In(2) 
THOooDGCJooXKmFTT 


Théorème 20.144 (Taylor, reste intégral). 
Soit une fonction f: [a,b] — IR de classe C"*1. Alors pour tout N < n nous avons 


N 
f() = f(a) + à Le (bete [e — HN F4) (4) qe FROOSCK CORTE SCT 
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Démonstration. Notons que dans l'énoncé, n est fixé; nous faisons une récurrence sur N. Ça ne 
change pas grand chose, mais il faut être conscient de ce qui est exactement dans l'hypothèse du 
théorème et ce qui est dans l'hypothèse de récurrence. 
Bref, n est fixé, la fonction f est de classe C"*l et nous vérifions d’abord la formule avec N = 1. 
À droite dans (20.514) nous avons 
b 
He Pod J (b—+)f"(6)dt. BIGOT EE 


a 


Nous évaluons l'intégrale à part en faisant une intégration par parties 6. Il s’agit de poser 


u=b—t (20.516a) 
vf", (20.516b) 
de déduire 
uw = —1 (20.517a) 
v = f! (20.517b) 


et d'écrire 
b b b 
J O2)" (dt = [(b— #76] — J (-)f'(bdt (20.518) 


= —(b—a)f'(a) + [ f'(t)dt (20.518b) 
—(b — a)f'(a) + f(b) — f(a). (20.518c) 


Dans le calcul nous avons utilisé le théorème fondamental du calcul intégral 14.263. En remettant 
ça dans (20.515) nous trouvons f(b) comme il se doit. 
En ce qui concerne la récurrence, nous devons calculer 


b 
+ D RGO + yen [6 = DD (QUE 


Ici encore, il s’agit de faire une intégration par partie, et sortir de la somme le terme k# = N +1. 
L'intégration par partie donne 


| "@ = POP AE = (he FOND Lo) CN 1) J & NF) Ed (20520) 


a a 


En remettant tout ensemble, il y a encore deux termes qui se simplifient, et des termes qui se 
remettent pour former la formule de récurrence. Bref, on obtient que (20.519) se réduit bien à 


F(b). 


Cette formule avec reste intégral sert par exemple à prouver un encadrement pour In(2), voir 
la proposition 20.145. 


PROPooHOMYo0oFc1kCU 
Proposition 20.145 (Approximation de In(2)[571]). 
Pour tout n nous avons 
| mn Lu 1 
2 < ; 20.521 
A0) 2 k n +1 ( 


26. Proposition 20.130. 
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Démonstration. Nous écrivons la formule de Taylor avec reste intégral du théorème 20.144 pour la 
fonction f = In et pour a = 1 et b = x. Cela donne : 


(x) = n(1) + Ÿ = + Ci | [ “(a 0) MOV (pdt. (20.522) 


Sachant que la dérivée du logarithme ?? est 1/x et faisant une petite récurrence, pour k > 1 nous 
avons 


—1)FH1(k — 1)! 
In) (x) = = . li (20.523) 
En remplaçant, 
M (1 1e 4 
a (x —1)* + — mad (20.524) 
L= 1 
C’est le moment de poser x = 2 et de faire les simplifications qui s'imposent, 
N k+1 2 N N 
(-1) [ (-1)" (2-5) 
2 + a —— di. (20.525) 
a 1 eN+ 
Nous déplaçons la somme à gauche, et nous prenons la valeur absolue des deux côtés : 
N k+1 2 N N 
—] —1)"(2-+t 
|In(2) — ÿ ( ? | = il ( _ ) dt| (20.526a) 
k=1 
2(2—4)Y SUBEQooZSXEooV 
<[ rt FepeBpd 
2 
- J (2 - bat. SUBEQooHGZL PsF te a 
1 


Justifications : 
— Pour 20.526b. Majoration en rentrant la valeur absolue dans l'intégrale, suppression de 
(—1)V, et le fait que pour te [1,2], 2 —# > 0. 
— Pour 20.526c. Majoration en supprimant purement et simplement le dénominateur #V +1 > 1. 


Ais-je vraiment besoin de vous dire que la dernière intégrale se calcule en posant le changement 
de variables  u = 2 — +? Le résultat est que 


: N 
[e-» dt = — 


(20.527) 


+ 
= 


EXo0YMEF0oMGpUNM 
Exemple 20.146 ([1]). 
La convergence de l’encadrement (20.145) n’est pas terrible. Pour avoir une erreur de +; il faut 


DRE (20.528) 
10 n+1? ‘ 


ce qui demande n = 9. Ça reste jouable, même pour les jeunes d’aujourd’hui. Ecrivons 9 termes : 


LL. dd, LL. 4 EL. 1 1 


In(2) — 1 — 20.529 
M@)-1+5-3+2-5t6-7t8 010 ( 
En calculant ?”, 
1879 1 
(2) El < 2 20.530 
LORS (20.530) 


27. Voir la proposition 15.91. 
28. Proposition 20.135. 
29. Moi j'ai utilisé Sage, mais si tu es au tableau, débrouille-toi. 
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Voici donc un bel encadrement 


1 1 1 1 
0 le en (20.531) 
2520 10 2520 10 


Pour avoir quelque chose avec des virgules, d’abord un peu de calcul mental donne 


1879 


—— = 0.745634920634921. 20.532 
2520 


Donc en majorant et minorant, disons, la troisième décimale °°, on n’est pas moins précis que le 
+: On a 
1 1 
0.744 — — < In(2) < 0.746 + —. 20.533 
Bref, on retient l’approximation 
0.644 < In(2) < 0.846. (20.534) 


Pour la quantité de travail, avouez que ce n’est pas terrible comme résultat. Eh oui; le calcul 
numérique c’est tout un métier ; il existe des méthodes nettement plus efficaces que ce que nous 


venons de faire. VAN 
PropAXaSC1x 


Proposition 20.147 (Formule de Taylor avec reste intégral[572, 405]). 
Soient X et Ÿ des espaces normés et un ouvert O € X. Si f e C(O,Y) et si[p,x] € © alors 


m—1 
1 
fe) = f(p)+ D (f(x — p)* 
D; 1 (20.535) 
L m—1/, jm . 
NE) | GE) (A Pott(e-»)(e — PT" dé 
où wpu* signifie wy(u,...,u) lorsque w € OF. Cette formule est le développement de Taylor à 


l’ordre m — 1. 


Remarque 20.148. 
Quelques remarques sur l'énoncé. 


(1) Dans le cas m = 2, la proposition 12.359 donne de bonnes formules pour calculer (d? f),(u, v). 


(2) Notez que l'intégrale n’est pas une intégrale faisant intervenir les espaces X ou Ÿ. Elle est 
une simple intégrale d’une fonction R — IR, comme définie par la mesure de Lebesgue de la 
définition 14.139. 


(3) Comme expliqué dans l’exemple 12.358, toute ces applications de différentielles se réduisent 
à des termes de la forme 


F0 (p)(x — p)* (20.536) 


dans le cas d’une fonction R — KR. 


20.26 Constructions plus naïves de l’intégrale dans le cas réel 


Les sections 14.2 et 14.8 ont donné une construction très complète de la mesure de Lebesgue, 
et nous avons définit la théorie de l’intégration sur un espace mesuré quelconque dans la défini- 
tion 14.163. 

Dans cette section nous allons donner différentes choses plus rapides qui servent souvent de 
définition dans les cours moins avancés. 


30. Notez ici que nous utilisons le fait que la division euclidienne, elle, donne un encadrement pour les fractions. 
Pensez-y. 
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20.26.1 Mesure de Lebesgue, version rapide 


Nous construisons à présent la mesure de Lebesgue sur R’?. Un pavé dans R’" est un ensemble 


de la forme 


B =] [lab]; (20.537) 


i=1 


le volume d’un tel pavé est défini par Vol(B) = ] [;(b; — ai). Soit maintenant À € R”. La mesure 
externe de À est le nombre 


m*(A) = inf{ » Vol(B) où F est un ensemble dénombrable de pavés dont l’union recouvre À.} 
oi (20.538) 
DefKTz01yH 
Définition 20.149. 
Nous disons que À est mesurable au sens de Lebesgue si pour tout ensemble S € R" nous avons 
l’égalité 
m°(S)=m*(AnsS)+m*(S\A). (20.539) 


Dans ce cas nous disons que la mesure de Lebesgue de À est m(A) = m*(A). 
PropNCMToWI 


Proposition 20.150. 
Deux fonctions continues égales presque partout pour la mesure de Lebesgue*! sont égales. 


Démonstration. Soient f et g deux fonctions continues telles que f(x) = g(x) pour presque tout 
x € D. La fonction h = f — g est alors presque partout nulle et nous devons prouver qu’elle est 
nulle sur tout D. La fonction h est continue; si h(a) 0 pour un certain a € D alors h est non 
nulle sur un ouvert autour de a par continuité et donc est non nulle sur un ensemble de mesure 
non nulle. 


20.26.22 Pavés et subdivisions 


Définition 20.151. 
Nous appelons pavé de R? toute partie de IR? obtenue comme produit de p intervalles de R. Plus 
explicitement, une partie R est un pavé de RP si il s'écrit sous la forme 


R= (us mie Here...) 
où T; est un intervalle de R pour tout à = 1,...,p. 


On appelle pavé fermé de IR? le produit de p intervalles fermés 


On définit de même le pavé ouvert 


Un pavé R = ][}_,7; est dit borné si tous les intervalles Z; sont bornés dans R. Les pavés non 
bornés sont des produits d’intervalles où un (ou plusieurs) des intervalles n’est pas borné. Par 
exemple, 

N =]- 00,5] x [0,13]. 


L'espace LR?, lui-même, est un pavé de IR?. 


31. Définition 20.149. 
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Définition 20.152. 
Une partie À de R? est dite pavable si il existe une famille finie de pavés R;, j = 1,...,n, et 
deux à deux disjoints tels que 
nm 
A={JR;. 
j=1 


Un exemple d'ensemble pavable dans R? est donné à la figure 20.15. Il existe beaucoup d’en- 
sembles dans R? qui ne sont pas pavables, par exemple les ellipses. 


FIGURE 20.15: Un ensemble pavable. LabelFigPolirettangolo 


Le complémentaire d’un pavé est un ensemble pavable et, en particulier, tout complémentaire 
d’un pavé borné est une réunion de pavés non bornés. Toute union finie et toute intersection 
d'ensemble pavables est pavable. 


Définition 20.153. 

Soit R un pavé borné de IR?, pour fixer les idées on peut penser R = [[f_,[a;,b;]. On appelle 
longueur de l’i-ème arrête de R le nombre b; — a;. La mesure p-dimensionnelle de R, m(R), 
est le produit des longueurs 


Exemple 20.154. 
Dans RŸ, l’ensemble R = [-1,1] x [3,4] x [0,2] est un pavé fermé de mesure 


m(R) = (1+1) :(4—3) : (2-0) = 4. 
Il s’agit du volume usuel du parallélépipède rectangle. A 


Exemple 20.155. 
L'ensemble R = ]-1,1[ x [3,4] x [0,2] est un pavé de IR*. Il n’est ni fermé ni ouvert, sa mesure 
est encore 4. A 


Si R est un pavé non borné on peut encore définir sa mesure. La notion de mesure se généralise 
en deux étapes. D'abord on dit que la longueur d’une arête non bornée est 0. Ensuite, on adopte 
la convention 0 - © = 0. Il faut remarquer que avec cette généralisation tout point et toute droite 
dans R? ont mesure nulle. 

Afin de définir les intégrales, nous allons intensivement faire appel à la notion de subdivision 
d’intervalles, voir définition 21.2 et la discussion qui suit. 

Lorsqu'on considère un pavé borné R = ] [}_, 7; de R?, on note &; l’ensemble des subdivisions 
de l'intervalle Z;. La notion de subdivision de généralise au cas des pavés. 


Définition 20.156. 
Soit R un pavé fermé borné de IR?, pour fixer les idées on peut penser à R = [[}_,[a,b;]. On 
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appelle subdivision finie de R les éléments de l’ensemble S = T[}_,S;, 


On peut définir de même l’ensemble des subdivisions d’un pavé non borné. 


Souvent, une subdivision d’un pavé R = ][f_, T; sera noté o = (yi5)521. Dans cette notation, 
on sous-entend que pour chaque À fixé, les nombres y;,; (il y en a n;) forment une subdivision de 
l'intervalle Z;. Afin de vous familiariser avec ces notations, repérez bien tous les éléments de la 
figure 20.16. 


À 


ba — Yy23 
U22 € 
U21 + 
a2 = UY20 @: ii 
& & é——& & 8 — 
@1 — Y10 y12 U14 


FIGURE 20.16: Une cellule d’une subdivision d’un pavé de R?. La cellule BL er Ge 11 à 


Définition 20.157. 
Si o est une subdivision d’un pavé R, un raffinement de © est une subdivision de R obtenue en 
fixant plus de points dans chaque intervalle. 


La subdivision o de R détermine nin2...n, pavés fermés de la forme 


Rank) = {(@1---,%p) € RP RS 


où k; est dans {1,...,n;} et à dans {1,...,p}. On les appelles cellules de o. On remarque que les 


cellules de o sont toujours deux à deux disjointes (sauf au plus sur leurs bords). 
meas_sous 


Lemme 20.158. 
Soit R un pavé borné de R? et soit à = (yi,5);2 une subdivision de R. On a 


m(R) = D MR kp))» 
Gk)eK 


où Elie Keno} Nas ssl 


Le lemme 20.158 suggère de définir la mesure d’un ensemble borné pavable P = Ui: R; comme 
la somme des mesures des pavés disjoints R;, j = 1,...,n. 


Définition 20.159. 
Une application f : R? — R est dite application en escalier sur R? si 


— f est une application bornée, 


— il existe une subdivision o de IR? telle que la restriction de f est une application constante 
sur toute cellule Rx de o 
Îr, = Ch CER, 


Une telle subdivision o est dite associée à f. 
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Exemple 20.160. 
La fonction f de R? dans R définie par 


1 si (æ,y) € [0,3] x [—-1,2|, 


fr) = { 2 sinon. Ge 


est une application en escalier. Exercice : donner une subdivision de R? associée à cette fonction. 


A 
Exemple 20.161. 
La fonction f de R? dans R définie par 
1 . 
rt si (æ,y)efmm+1|x[Inn+1], m,ne No, 
Ï(æ,y) { 0. Re (20.541) 


est une application en escalier. Observez que, dans ce cas, il n’existe pas une subdivision finie de 
R? associée à f. VAN 


Remarque 20.162. 
Si la subdivision © est associée à f alors tout raffinement de © (c’est-à-dire, toute subdivision 
obtenue en fixant plus de points dans chaque intervalle) a la même propriété. 

Si f et g sont deux applications en escalier sur R et of et a, sont des subdivisions de R 
associées respectivement à f et g, alors on peut construire une troisième subdivision de À qui est 
associée à f et à g en même temps. Soient o; = (Y1,...,Y,) et og = (Z1,..., Zn), Où Yi = (wi) 
et Z; — CAE sont des subdivisions de l’intervalle [a;, b;], pour à = 1,...,p. La subdivision de 
[a;,b;] obtenue par l'union de Y; et Z; est encore une subdivision finie, qu’on appellera Ÿ;. La 
subdivision à = (Ÿ1,...,Ÿ,) de R est un raffinement de of et de o,, donc elle est associée à la fois 
à f et à g. 

Cela nous permet de prouver que si f et g sont des applications en escalier, alors f + g, fg, 
min{f,g}, max{f,g} et |f| sont des applications en escalier. 


20.26.3 Intégrale d’une fonction en escalier 


Définition 20.163. 
Soit f une fonction de R"? dans R”. Le support de f est la fermeture de l’ensemble des points x 
tels que f(x) # 0. 


Définition 20.164. 
Une application en escalier f est dite intégrable si son support est compact. 


Soit f une application en escalier sur R?. Soit o une subdivision de IRP associée à f et appelons 
R, les cellules de o, avec k = (k1,...,k,) dans K° = {1,...,n1} x {1,...,n0} x ... x {1,...,n}. 
Alors 
da: — C%, C% e R. 


Définition 20.165. 
On définit l'intégrale de f sur IR? par 


LE FAV = D Cym(R). 


keK 
L'intégrale ainsi définie est un nombre réel. La proposition suivante nous dit que l'intégrale est 


« bien définie », au sens que sa valeur ne dépend pas de la subdivision associée à f qu’on utilise 
dans le calcul. 


Proposition 20.166. 
Soit f une application en escalier intégrable sur IR?. Soient o1 et o2 deux subdivisions de IR? 
associées à f. L'intégrale de f ne dépend pas de la subdivision choisie. 
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On ne donne pas une preuve complète de cette proposition. En fait elle est une conséquence de 
la formule de réduction introduite dans la suite de ce chapitre. 


20.26.4 Intégrales partielles 


Soit f de R? dans R une fonction continue, nulle hors du pavé borné R. Posons R = [ [?_,[a:,b;]|, 
pour fixer les idées. Pour chaque à dans {1,...,p} fixé, on peut associer à f la fonction F; de p—1 
variables définie par 


b; 
RP EE 0 Ro J A PR 0 NE 
Qi 


La fonction F; est l’intégrale partielle de f par rapport à la i-ème variable. En particulier, si 


Frise. 25) =D hist Pia Dh) :0n-0btient 
F; = J RER sa Es du =" J g dy. 

Qi &i 
La fonction d’une seule variable qu'on obtient à partir de f en fixant %1,...,%5-1,%541,...,%p 
et qui associe à x; la valeur f(x1,...,%5-1,%5,æi41,...,%), est appelée x;-ème section de f en 
L1,-..,%i-1, Lit, Xp. 
Exemple 20.167. 
Soit f la fonction de R? dans R définie par 

æ+3y si(x,y)e [9,10] x |r,5 
“ie À y si (æ,u) € [9,10] x Jn,5] cd 
0 sinon. 
Les intégrales partielles de f sont 
10 2 = 10 
x 19 
Fu) = | s +ayar = [5 + av] = — + 3y, 
9 2 xæ—=9 2 
D 2-Y=5 
3 3 
P(x) - | x + 3y dy = Lau + ; | = 2(5—7)+5(25 T°). 
T Y=R 
A 


20.26.5 Réduction d’une intégrale multiple 


Soit R = [a,b] x [c,d] un pavé fermé et borné de R? et soit f une application en escalier 
intégrable sur R? telle que le support de f soit contenu dans À. On considère la subdivision o de 
R définie par les subdivisions 


a = TX) < T1 <... < Tm = b, 
C = Yo <SY1 <... <Yn = d. 
Les cellules de ©& sont 
Rise (rt X Piste i1=0,...,m—1, j=0,...,n—1. 


La mesure de R est la somme des mesures des R; ; 


m(R) = y mis) = 
(i,j)e{0,..m—1}x{0,..,n—1} 


n—lm—1 
= D D (min) : (yen — wi) = 
j=0 i=0 (20.543) 
m—1 n—1 
A » (rx = ne) ” D. (yi+1 = Yi) =, 
i=0 j=0 


20.26. CONSTRUCTIONS PLUS NAÏVES DE L'INTÉGRALE DANS LE CAS RÉEL 1827 


Si f est constante sur chaque cellule de © on peut écrire f de la forme suivante 


n—-lm—1 
= D D CiixR 
j=0 i=0 


où les C:,; sont des constantes réelles et Xr,, est la fonction caractéristique de R;; 


A (20.544) 


0, sinon. 


Comme (x, y) est dans R; ; si et seulement si x € [x:,x;41] et y € [y;, y;+1], on vérifie que la fonction 
XR;,, est égal au produit des fonctions caractéristiques des intervalles [x;,x;+1] et [y;,y;+1] 


XRi,j (x, y) n X[xi,ti+1] (x) ‘ Xlwsus (8): 


On peut donc écrire la fonction f de la façon suivante 


FC y) y x Cij Xri11() ° X [y Y5+1] (y). 


n—lm—1 n—lm—1 
_ J dV — + > Cij m(R;,;) = D > Ci (tir — Li) : (y5+1 — di). (20.545) 
j=0 i=0 j=0 i=0 


Cette intégrale peut être réduite à la composition de deux intégrales partielles. Il suffit de remar- 
quer que la valeur de l'intégrale de la fonction caractéristique d’un intervalle est la longueur de 
l'intervalle, 


Cij(migr — Gi) * (yjr1 — Y5) = 


Ti+1 #54 
= Gi; ([ Xfriæl(®) a) | | ne Li Ds (20.546) 
Ti J | 


b d 
7 Cig (| XLriri41](E) dx) ° (| OR LU)) &) ? 


et utiliser les propriétés de linéarité de l'intégrale 


n—im—1 b d 
Fa EG (fumeur) - ([ xmat ds) = 


j=0 i=0 a 


bn—-lm—1 


-[ [ > > Ci Xfrimi1]E (x ) : Xbersa(0) dxdy = (20.547) 


j=0 i= 


En 


De même on obtient 


dn—-1m—1 
[rs - [ [ > D Ci Xfrieis1(©) Xlu54+11(U) dxdy = 
ER (20.548) 


= [frere 


En général, on prouve la proposition suivante 
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Proposition 20.168. 
Soit f une application en escalier intégrable sur IR? et soit R un pavé borné dans R? qui contient 
le support de f. Comme d'habitude, pour fixer les idées nous écrivons R = [[?_,[a:;,b;]. Alors 


bp fbp-1 bi 
fee av = | J ... fs) dede 
Gp Jap—1 ai 
Lo. à (20.549) 
- | J ... lisent) dr "0e, 
Asp Vasp_1 


&s] 


pour toute permutation (s1,...,8) de l’ensemble {1,...p}. 


20.26.6 Propriétés de l’intégrale 


Soient f et g deux fonctions en escalier intégrables de R? dans R, et soient a et b dans R. 
Linéarité de l’intégrale : 


— Additivité : f + g est intégrable et 
fu+oav-f rar sav 
R? R? R? 
— Homogénéité : Àf est intégrable pour tout réel À 
J Xf dV = À f dv, 
R? R? 


Monotonie Si f < g alors 


[ra gdV, 
IR? RP 


Cette dernière inégalité s’obtient de la façon suivante : 


[ravi 


Inégalité de Cebiteff Si f est une application en escalier alors pour tout a > 0 dans R l’ensemble 
{x e R? : |f(x)| > a} est pavable et borné, et l’inégalité suivante est satisfaite 


Inégalité fondamentale 


». Crm(Ry)| < y |Crlm(Rx) = J | |f| dv. 


keK keK R 


m (fee R à Le) > a) < à [ fldV 


20.26.7 Intégrales multiples, cas général 


Nous voulons généraliser la définition d’intégrale multiple au cas des domaines non pavables et 
de fonctions qui ne sont pas en escalier. Il y a plusieurs méthodes de le faire et ici on ne considère 
qu’une seule, introduite par Riemann. 


Définition 20.169. 
Soit f : IR? — R une fonction. 


— Pour toute application en escalier intégrable f. telle que f, < f, l’intégrale de f, est dit une 
somme inférieure de f. 


— Pour toute application en escalier intégrable f* telle que f* > f, l’intégrale de f* est dit une 
somme supérieure de f. 
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Soient »;, f et >}* f les ensembles des sommes inférieures et supérieures de f. Grâce à la 
propriété de monotonie de l’intégrale on sait que si a est dans Ÿ;, f et b est dans D f alors a < b. 


Définition 20.170. 
La fonction f est intégrable (au sens de Riemann) si Y,, f et 3 f ne sont pas vides et 


of l=supEf. 
Dans ce cas, la valeur T est appelée intégrale de f sur R?. 


Remarque 20.171. 
Toute fonction intégrable est bornée et à support compact. En effet, si le support de la fonction 
n’est pas compact alors soit »,, f soit 3* f doit être vide! 


L'intégrale qu’on vient de définir possède toutes les propriétés de l’intégrale pour les fonctions 
en escalier. Le produit de deux fonctions intégrables est intégrable. 

Il y a des cas où l’intégrabilité d’une fonction n’est pas évidente. Cependant, dans la plupart 
des exercices et des exemples de ce cours, nous nous aidons avec le critère suivant 


Proposition 20.172. 
Toute fonction continue à support compact est intégrable. 


Cette proposition n’est à priori pas étonnante, vu qu’une fonction continue sur un support 
compact est bornée (théorème de Weierstrass 7.138). 


20.26.8 Réduction d’une intégrale multiple 


On n'utilise jamais la définition pour calculer la valeur d’une intégrale multiple. La méthode 
plus efficace, en pratique, est de réduire l'intégrale à la composition de plusieurs intégrales d’une 


variable. 
fub 


Théorème 20.173 (de Fubini). 
Soit f une fonction intégrable de R? dans R.. Si pour tout x dans R la section f(x, : ) est intégrable 


par rapport à y, alors 
fawav = | (| fade) dy 
R?2 R R 


De même, si pour tout y dans R la section f( : ,y) est intégrable par rapport à x, alors 


J : f(x, y) dV = J (| f(x, y) w) dx. 
: Du ThoSectionINte 


En général, on ne peut pas dire que les sections d’une fonction intégrable sont intégrables, donc 
il faut vraiment se souvenir des hypothèses du théorème 20.173. En dimension plus haute, on a le 
même résultat 


Théorème 20.174. 
Soit f une fonction intégrable de R? dans R. Si pour tout (p — 1)-uple (x1,...,%i-1,%iy1,...,%p) 
dans RP! la section f(æ1,...,æ5 1, * ,Tir1,... ,Tp) est intégrable par rapport à x;, alors 


gav= [(f sav) du 


Si f est une fonction positive et intégrable de R? dans R on peut interpréter l'intégrale de 
f comme le volume du solide au-dessous du graphe de f. Avec cette interprétation, l'intégrale 
partielle par rapport à x pour y = yo fixé est l’aire de la tranche qu’on obtient en coupant le solide 
par le plan y = %. 
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Exemple 20.175. 
Le premier exemple à faire est celui d’une fonction en escalier intégrable et positive. Soit f: R? — R 
la fonction 
1 si(x,y) € R1 = ]-1,3] x [4,5] 
f(x, y) = 43 si(x,y) € Ro = ]13,15[ x [0,2[ (20.550) 


O dans les autres cas. 


L'intégrale de f sur IR? est 1 : m(R1) +3 : m(R2) = 16. On voit tout de suite qu’il s’agit de la 
somme du volume des deux parallélépipèdes de hauteurs respectives 1 et 3 et bases R1 et Ro. A 


Exemple 20.176. 

On veut calculer le volume du solide S, borné par le paraboloïde elliptique x? + 2y? + z = 16 et le 
plan x =2,x = 0, y=2y=0, 2 = 0. On observe que la portion de paraboloïde elliptique qui nous 
intéresse est le graphe de la fonction f(x, y) = 16 — x? — 2y? pour (x,y) dans R = [0,2] x [0,2]. 
La fonction f est continue ainsi que ses sections, donc on peut appliquer le théorème 20.173 et 
décomposer l’intégrale double en deux intégrales simples : 


2 r2 
Ï 164? 2 av = | [ f(x, y) dxdy = 
R o Jo 


2 x æ=2 
_ Î 6 — 2 )r — =. dy = (20.551) 
0 3 æ=0 
41 16 + 32 
Ne pi 
3 3 4 3 


Vérifiez, comme exercice, qu’on obtient le même résultat en intégrant d’abord par rapport à y et 
puis par rapport à x. 


Exemple 20.177. 

Dans les hypothèses du théorème 20.173 l’ordre des intégrations partielles ne change pas la valeur 
de l'intégrale. En fait, si les calculs sont faits par des êtres humains l’ordre d'intégration peut faire 
une certaine différence comme dans cet exemple. On veut évaluer la valeur de l’intégrale 


[. F(æ,y) dV 


fG)= LS si (x,y) € [1,2] x [0,x| (20.559) 


0 sinon. 
Les deux sections de f(x,y) = ysin(xy) sont continues. Si on intègre d’abord par rapport à y on 
obtient . . 
T COS(TT sin(rx 
: Ï Fete), + J DO 
1 T 1 T 
qui n’est pas du tout immédiat, alors que, si on intègre d’abord par rapport à x on obtient 


Î cos y — cos(2y) dy. 
0 


20.26.9 Intégrales sur des parties de R? 


On veut évaluer l'intégrale de la fonction f(x, y) = V1 — x? sur son domaine, la boule unité 
B((0,0),1). La théorie introduite jusqu'ici n’est pas suffisante pour résoudre ce problème, parce 
que B((0,0),1) n’est pas pavable. Les parties bornées de R? sur lesquelles on peut intégrer des 
fonctions sont dites mesurables (au sens de Riemann) parce que, comme on verra dans la suite, la 
mesure d’une partie de R? est l'intégrale (si il existe) de sa fonction caractéristique. 
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On peut dire qu’une partie de RP? est mesurable si son bord est «assez régulier». Dans R? il est 
suffisant que le bord de À soit une réunion finie de courbes paramétrées continues. En particulier, 
on est très souvent dans un des deux cas suivants 
Régions du premier type À est borné et contenu entre les graphes de deux fonctions continues 

de x 
A={(xyeR’ :a<zr<b, gx) <y< gr)}, 
avec g1 et g2 continues. 
Régions du deuxième type À est borné et contenu entre les graphes de deux fonctions conti- 
nues de y 
A={(ay)eR : c<y<d, h(y) <x< ho(y)}, 


avec h1 et ho continues. 


(a) Une region du premier type 


h 
hi : 


> 


(b) Une region du deuxième type 


FIGURE 20.17: Régions du premier et du déiaiemmdyNhiPrimoesecondoTipo 


Exemple 20.178. 
Il y a des régions qui sont des deux types au même temps, comme les boules centrées à l’origine, le 
triangle de sommets (0,0), (0, a) et (b,0), ou la région C délimité par les courbes y = 2x et y = x?. 


Cette dernière admet les représentations suivantes 
C={(x.yeR?:0<7<1,r° <y<2r} 


et 
C={(xyeR?:0<y<1,y/2<x< y}. 


®— 
b REPÉRER TOR ANQES SERA EEE 


FAReIReRen to Rose eengeT 
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A 


Définition 20.179. 
Soit f une fonction de R° dans R dont le support A est une région du premier ou du deurième 
type. On définit la fonction f comme 


Fe = | f(x, y), si(x,y)e À, (20.553) 


0, sinon. 


La fonction f est dite intégrable si f est intégrable, et la valeur de son intégrale est 


[ra - mie 


Une fonction continue définie sur une région du premier ou du deuxième type est toujours 
intégrable. 

Pour fixer les idées on suppose ici que À est du premier type et contenue dans le pavé borné 
R = ]{a,b] x [c,d]. En suivant la définition on obtient 


f dV = f dV 
À R?2 
b rd 
= J f dydx 
b gi(x) _ g2(x) d (20.554) 
- | l faut | Faut | Î dy | dx 
a (ve g1(x) g2(x) 
b pg2(x) 
= J J f dydx 
a Jg1(x) 
De même, si À est du deuxième type on obtient 
d_fha(y) 
] fdV = J l Î dxdy. (20.555) 
A c Jhi(y) 


Exemple 20.180. 

On peut maintenant résoudre notre problème de départ, évaluer l'intégrale de la fonction f(x, y) = 
V1— 2? sur B((0,0),1). Nous choisissons de décrire la boule unité de IR? comme une région du 
premier type : B((0,0),1) = {(x,y) : xe[-1,1], —-V1- 2 < y< V1 -x?}. 


1 prvi-x? 
= Ï V1 x?2dV = ] I V1 — x?dydx (20.556) 
B —1 J_V1-x2 


La première intégrale à effectuer, par rapport à y, est l’intégrale d’une fonction constante. Ne pas 
oublier que l’on intègre 41 — x? par rapport à y; c’est bien une constante et l'intégrale consiste 
seulement à multiplier par y : 


L y=Vi-r? 1 ou 
F= ] Lu = ?] dx = 2 | (1 — x?)dx. (20.557) 
_—] y=—Vi—x? ZT 
Cela est à nouveau une intégrale simple à effectuer. Le résultat est 
1 372=1 8 
2 | (1— x2)dx = 2 Ê À 5 Le (20.558) 
1 dal à 
A 


Remarque 20.181. 
Toutes les techniques d’intégration à une variable restent valables. Par exemple, lorsqu'une des 
intégrales est l’intégrale d’une fonction impaire sur un intervalle symétrique par rapport à zéro, 
l'intégrale vaut zéro. 
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NORMooDSNXooFhyHkx 
20.182. 
Par le lemme 14.170 nous savons que la mesure d’une région bornée de R? est l'intégrale de sa 
fonction caractéristique, si elle existe. 
La mesure d’une région bornée de IR? est dite son aire, et celle d’une région bornée de R? est 
son volume. Voir aussi la remarque 21.10. 


exint 
Exemple 20.183. 
On veut calculer l’aire de la région de la figure 20.18 définie par 
A={(r,y)eR?|[0<r<1,r—-1<y< r}. 
On considère l’intégrale 
D ; 1 1 5 
J xaav = | | 1dyde = | -2°+2+1dr- +=+1=—. 
R? O0 Jxè+1 0 4 2 4 
A 


FIGURE 20.18: La région de l’exemple 20.183. Dans l'exemple, l’ipageresteommérethtégration 


Exemple 20.184. 

Parfois la région sur laquelle on veut intégrer peut être décrite indifféremment de deux façons, mais 
la fonction à intégrer nous force a choisir un ordre particulier. Vérifiez que la fonction f(x,y) = 
sin(y?) sur la région triangulaire de sommets (0,0), (0,2), (2,2) doit être intégrée d’abord par 
rapport à x. A 


Si une région bornée n’est pas de premier ou de deuxième type on peut normalement la découper 
en morceaux plus faciles à décrire. On utilise alors la propriété suivante. 


Lemme 20.185. 
Soit À un sous-ensemble borné de R? et soient B1 et B2 deux parties de A telles que B1 n B2 = @ 
et B1 L B2 = A. Alors, pour toute fonction f intégrable sur A (et en particulier pour sa fonction 
caractéristique) on a 

[sav - | f dV + f dv. 

A Bi 


B2 
exint2 


Exemple 20.186. 

La région D que nous voyons sur la figure 20.19 est bornée par la parabole y? = 2x +6 et la droite 
y = æ — 1. La région D est une région du deuxième type. Nous pouvons aussi la décrire comme 
l’union de deux régions du premier type D1 et Do, 


Di = {(m,y) : -3< 7 < -1, -V2r +6 < y < V2r +6}, 
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et 


A 


20.26.10 Intégrales sur des parties de R° 


Dans ces notes nous n’avons pas l’ambition de traiter d’une façon rigoureuse l’étude des en- 
sembles mesurables de R°. Comme dans la section précédente on se limitera à considérer des cas 
particuliers. 

primotipo_solida 
Définition 20.187. 
Soit E une région de R°. On dit que E est une région solide de premier type si E est contenue 
entre les graphes de deux fonctions continues de x et y. 


E={(x,y,2)e R°|(x,y)e AC R?,u(x,y) < z < u(x, y)}. 


Le sous-ensemble de À de R? qui apparaît dans la définition 20.187 est la projection (ou l’ombre) 
de E sur le plan x-y. 


cornet 
Exemple 20.188. 
La région E donnée par une portion de sphère collée à un cône est une région solide de premier 


type 


E = {(x,y,2) € R°|(x,y) e B((0,0),1), 1/2? + y? & 2 & V1 — x? — y?}. (20.559) 


L'ombre de E est la boule unité de R?. L'ensemble 4/72 + y? < z est un cône posé sur sa pointe 
tandis que l’ensemble z < 4/1 — x? — y? est la demi-sphère. L'ensemble E contient les points entre 
les deux, voir la figure 20.20. 

A 
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FIGURE 20.20: Il faut voir ça en trois dimensions.  LabelFigCornetGlace 


Si la fonction f, à intégrer sur E, et ses sections sont intégrables alors on peut réduire l'intégrale 


Lien [ (fi rende) are 


(20.560) 
= [. (Fe, yruo(e, )) — F(e,u, (a, 9))) dv, 


où Fest une primitive de f par rapport à la variable z, c’est-à-dire en considérant x et y comme 
des constantes. Il faut ensuite évaluer la partie qui reste comme dans la section précédente. Comme 
le calcul des aires dans IR?, le calcul des volumes dans R est fait par des intégrales. En fait le 
volume d’une région solide dans R° est sa mesure. 


Définition 20.189. 
La mesure d’une région de R> est l'intégrale de sa fonction caractéristique. 


Soit Æ une région solide du premier type, nous pouvons évaluer son volume par l'intégrale 


] (u2(x, y) — (x, y)) dV. 
A 


Parfois c’est plus intéressant de calculer le volume avec la formule de réduction contraire : l'intégrale 
double d’abord et puis l'intégrale simple par rapport à z. On parle alors de calcul de volume « par 
tranche ». 


Exemple 20.190. 
On veut calculer le volume de la boule de rayon a, centrée à l’origine B = {(x,y,2) € R°|x°? + 
y? + 2? < a}. On peut décrire B par 


B = {(2,y,2) € R°| (2,9) € Da. Va? 2 PLIS Vera}, 


où D, est le disque de rayon a centré en (0,0), donc le volume B sera 


2 | \/a2 — x2 — y?dV. 


Cette intégrale est un peu ennuyeuse à calculer. On peut simplifier le calcul en observant que pour 
Z fixé dans l'intervalle [—-a, a] la section de la boule au niveau Z est un disque de rayon Va? — 22. 
L’aire d’un tel disque est r(a? + 22). Si on réduit l'intégrale de volume de la façon 


J av = | Va? — 22 dz, 
B —@ 


on obtient tout de suite la valeur cherchée : le volume de B est 4/3Taÿ. A 


Exemple 20.191. 

On calcule l’intégrale de f(x,y,z) = z sur la pyramide P bornée par les plans x = 0, y = O, 
æ+y+z = 1, x+y+2/2 = 1. On remarque tout de suite que les plans x + y +2 = 1, 
x + y + 2/2 = 1 se coupent en la droite x + y = 1, z = 0 (on se souvient qu’une droite dans IR, 
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c'est deux équations). Cela veut dire que la projection de P sur le plan x-y est le triangle T borné 
par les droites x = z2=0,y=2=0etx+y=1,2= 0. On décrit donc P par 


P={(x,y2)eR°|{(x,y)eT, 1-27 —2y<2z<1-x—7y} 
et T'par 
T={(ry)eR|0<r<1,0<y<1-—x}, 


donc l’intégrale de f sur P est 


1 plz pl-x-y 1 
J fmy2)av = | Î Ï z dz dy dx = ——. 
P. 0 JO —22x—2y 24 


Notez que lorsque x et y sont entre 0 et 1, nous avons bien 1 — 2x — 2y < 1 — x — y, d’où le fait 
que nous mettons 1 — 2x — 2y dans la borne inférieure de l'intégrale. A 


De façon analogue on définit les régions solides du deuxième et du troisième type. 


20.26.11 Intégrales de fonctions non bornées sur des ensembles non bornés 
Soit f: R° — R, une fonction positive. Nous notons Æ, = E n B(0,r). On dit qu’elle est 
intégrable sur E € R' si 
(1) Pour chaque r > 0, la fonction f,(x) = f(x)1,4, est intégrable sur E, ; 
(2) la limite lim,_,w Ve, fr est finie. 
Dans ce cas, on pose 


[ f= im L. fr. (20.561) 


ThoFnTestIntnnBorn 
Théorème 20.192. 
Soit E mesurable dans R" et f: E — R. Si f est mesurable et si il existe g: E — R intégrable 
sur E telle que |f(x)| < g(x) pour tout x € E, alors f est intégrable sur E. 
Réciproquement, si f est intégrable sur E, alors f est mesurable. 


LemTHBSEs 
Lemme 20.193. 
Si f est une fonction sur [a,w[, alors nous avons la formule 
b 00 
ee J fase | od (20.562) 
bo J, a 


au sens où si un des deux membres existe, alors l’autre existe et est égal. 


Démonstration. Supposons que le membre de gauche existe. Cela signifie que la fonction 
HA 
d(x) = J Î (20.563) 
a 


est bornée. Soit M, un majorant. Pour toute fonction simple & dominée f, on a [w < M, donc 
| col . 2 N 
l’ensemble sur lequel on prend le supremum pour calculer (s f est majoré par M et possède donc 
un supremum. Nous avons donc 


Î : f< lim [ | Fe (20.564) 


b—00 
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20.26.12 Lemme de Morse 


Lemme 20.194 (Lemme de Morse). 

Soit f € C(U,R) où U est un ouvert de R" contenant 0. Nous supposons que dfo = 0 et que & fo 
est non dégénérée * et de signature (p,n — p). Alors il existe un C!-difféomorphisme ç entre deux 
voisinages de 0 dans IR” tel que 


(1) &(0) = 0, 
(2) si p(x) = u alors 


LemNQAmCLo 


F(R)= F(0) = nf + Et = ques 06. (20.565) 


Une autre façon de dire est qu'il existe un C*-difféomorphisme local # tel que 


(fe 0) Ce) = MO) = Re di = (20.566) 


Démonstration. Nous allons noter Hf la matrice hessienne de f, c'est-à-dire Hf, = df, € 
£@)(R",R). Écrivons la formule de Taylor avec reste intégral (proposition 20.147 avec p = 0 


et m = 2): 
1 


f@)- F0) = dute)+ fA-D  dfute) dt a Q(us (20.567) 
ni — 0 
—0 2H fhixt=<H fixt,t) 
avec j 
Q(x) = [ (1 —t)(H fhsadt (20.568) 


qui est une intégrale dans LU) (R",R). Nous prouvons à présent que Q est de classe C1 en utilisant 
le résultat de différentiabilité sous l’intégrale 17.28. Pour cela nous passons aux composantes (de 
la matrice) et nous considérons 


ha: U x[0,1]—R 


d (20.569) 
haut) = (1-0 (6). 


Étant donné que f est de classe C”, la dérivée de y par rapport à x; ne pose pas de problèmes : 


Ch of 
= t(t t 20.570 
êt; ER PE “ 
qui est encore continue à la fois en t et en x. La proposition 17.28 nous montre à présent que 
1 
Qu(x) = Î (1 — t)h(tæ)dt (20.571) 
0 


est une fonction C1. Étant donné que les composantes de Q sont C1, la fonction Q est également 
CE, 
Nous avons Q(0) = À(H fo € Sn n GL(n,R), d'abord parce que f est C? (et donc la matrice 
hessienne est symétrique), ensuite par hypothèse d? fo est non dégénérée. 
À partir de là, le lemme 17.121 donne un voisinage V de Q(0) dans $, et une application @ de 
classe C1 
D: V — GL(n,R) (20.572) 


telle que pour tout AE V, 
(4)'Q(0)#(4) = A. (20.573) 


Si on pose M = poQ, et si x est dans un voisinage de zéro, Q étant continue nous avons Q(x) € V 
et donc 
Q(x) = M(x)' Q(0)M(x). (20.574) 


32. En tant qu’application bilinéaire. 
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Notons que l’application M: IR — GL(n,R) est de classe C! parce que Q et @ le sont. 
Nous avons 


f(æ) — (0) = z'Q(x)x = a M(x) Q(0)M(x)x = y(x) Q(0)y(x) (20.575) 
où y(x) = M(x}x = (po Q)(x)x est encore une fonction de classe C! parce que la multiplication 


est une application C®. 
D'un autre côté le théorème de Sylvester 9.245 nous donne une matrice inversible P telle que 


Q(0) = P! ( ji ) P. (20.576) 
Aire 
Et nous posons enfin u = @(x) = Py(x) qui est toujours de classe CT et qui donne 
f(x) — (0) = y'Q(0)y (20.577a) 
= y P° 4 ” Py (20.577b) 


= ( : 1) . (20.577c) 
= Uf + HUE — Uhr ee — Uf. (20.577d) 
Nous devons maintenant montrer que, quitte à réduire son domaine à un ouvert plus petit, 
est un C!-difféomorphisme. Dans la chaine qui donne w, seule l'application 
g:UCcR"-—-R" 
ze M(x)x 


est sujette à caution. Nous allons appliquer le théorème d’inversion locale. Nous savons que g est 
de classe Cl et donc différentiable ; calculons la différentielle en utilisant la formule (12.674) : 


dgo(x) = Slot]. . Sema] = M(0)r. (20.579) 


Note que nous avons utilisé la règle de Leibnitz pour la dérivée d’un produit, mais le second terme 
s’est annulé. Donc dgo = M(0) € GL(n,R) et g est localement un C!-difféomorphisme. 

Il suffit de restreindre @ au domaine sur lequel g est un C'!-difféomorphisme pour que 4 devienne 
lui-même un C!-difféomorphisme. 


(20.578) 


Définition 20.195. 
Un point a est un point critique de la fonction différentiable f si dfa = 0. 


Corolaire 20.196 ([573]). 
Les points critiques non dégénérés d’une fonction CŸ sont isolés. 


Démonstration. Soit a un point critique non dégénéré. Par le lemme de Morse 20.194, il existe un 
C!-difféomorphisme 4 et un entier p tel que 


(fop)(x)=a?+...+a2— 22,1 —...— 22 + f(a) (20.580) 


sur un voisinage Ü de a. Vue la formule générale df,(u) = V f(x) : u, si x est un point critique de 
f, alors Vf(x) = 0. Dans notre cas, les points critiques de f o 4 dans {{ doivent vérifier x; = 0 
pour tout 7, et donc x = a. 

Nous devons nous assurer que la fonction f elle-même n’a pas de points critiques dans {{. Pour 
cela nous utilisons la formule générale de dérivation de fonction composée : 


V(fow)(x) = © . (ax) Vox(e). (20.581) 
k 


Si d(x) est un point critique de f, alors le membre de droite est le vecteur nul parce que tous les 

Op f (Y(x)) sont nuls. Par conséquent le membre de gauche est également nul, et x est un point 

critique de f o #. Or nous venons de voir que f o Ÿ n’a pas de points critiques dans {4. 
Donc f n’a pas de points critiques dans un voisinage d’un point critique non dégénéré. 
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20.27 Autres intégrales sympathiques 


20.27.1 Intégrale de Wallis 


LEMooMGUVooIIQSmC 
Lemme 20.197 ([574, 1]). 
Nous définissons les fonctions I, par récurrence de la façon suivante : 
Ie) => (20.582a) 
Li(x) = cos(x) (20.582b) 
. n—1l =] 
ou ue Ne ne) (20.582c) 
n 
Pour chaque n, la fonction “Eos HS AEEEEIR"e de sin” (x). 
De même en définissant 
Lo(x) = x (20.583a) 
Li(x) = sin(x) (20.583b) 
n—1 : _] 
Poe un — Ft (20.583) 
n 


nous avons des primitives de cos”(x). 


Démonstration. Nous faisons par récurrence. Les cas n = 0 et n = 1 sont immédiats. Pour J, c’est 
pas trop compliqué non plus : il suffit de dériver en supposant que 1} _,(x) = sin" ?(x). Voici le 
calcul : 


1 = 
I (x) = —(—sin"(x) + cos(x)(n — 1)sin” ?(x) cos(x)) — _ sin ?(x) (20.584a) 
n 
1 — 1 
= — sin" ?(x)( — sin/(x) + (n — 1) cos’(x)) — = sin" ?(x) (20.584b) 
n 
1 
= — sin"—?(æ)( — sin?(x) + (n — 1)cos?(x) — n + 1) (20.584c) 
n 
1 
= — sin"—?(x)(n cos? (x) — n) (20.584d) 
n 
2 sin" ?(x)nsin?(x) (20.584e) 
n 
= sin” (x). (20.584f) 
Nous avons prouvé que la dérivée de Z,(x) est bien sin” (x). 
La formule (20.583) se démontre de la même façon. 
LEMooU0OIBooLyMDft 
Lemme 20.198 (1575, 576]). 
Nous posons 
7/2 
Wa = | cos" (t)dt. (20.585) 
0 


Alors : 


(1) une formule de récurrence : 


— 1 E ILMZ 
qe = RTL RER 
(2) et une formule un peu explicite : 


Wa, = (2n)! 7 EQooUYIDoREpEGER 


(2nn1)2 2° 


Démonstration. Le nombre W, est seulement la seconde intégrale du lemme 20.197, évaluée entre 
0 et t/2. En partant donc de (20.583), nous avons 


7/2 n—1 : m/2 =] x/2 
Wh = Î cos" (x)dx = = @) ne) 2 Î cos” ?(x)dr. (20.588) 
0 0 


nm nm 0 
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Le terme aux bords disparaît grâce aux valeurs trigonométriques remarquables *. Il reste immé- 


diatement 
n—1 


Wh = = (20.589) 
nm 


À partir de là, nous démontrons (20.587) par récurrence. D’abord pour n = 0, c’est l'égalité 
Wo = 7/2 qui est correcte parce que 


7/2 r/2 
Î cos/(x)dx = | le: (20.590) 
0 0 
Pour la récurrence elle-même, 
2n +1 
Wo(n+1) = An+1) 1) V2r (20.591a) 
2n+1 (2n)! x 
= 20.591b 
2n + 2 (2n!)2 2 
..pas mal de petits calculs ..… (20.591c) 
2 2)! 
ae) (20.591d) 


((n + 1)192041)2 


Voilà. 


Maintenant, la suite (W,) se divise en ses termes pairs et ses termes impairs. Pour les pairs, 
nous avons une formule assez explicite donnée par le lemme 20.198. Pour les termes impairs, nous 
n'avons rien. Dans tous les cas, nous avons la formule de récurrence 


n—1 


Wa = Who (20.592) 
nm 


qui ne sert à rien pour déduire des choses sur les termes impairs à partir de ce que l’on sait des 
termes pairs. 


Sommes-nous perdus ? Non. La situation se débloque grâce au lemme suivant. 
LEMooZFBVooQsOu0x 


Lemme 20.199. 
La suite donnée par 


= Î cos" (x)dx (20.593) 
est décroissante. 


Démonstration. Vu que l'intégrale est sur [0, 7/2], le nombre cos(x) prend ses valeurs dans [0,1]. 
Nous avons donc 
cost l{x) < cos"(x). (20.594) 


Les intégrales suivent les mêmes inégalités. 


Ce lemme permet de relancer le jeu parce que les termes impairs sont coincés entre les termes 
pairs, qui décroissent. Les termes impairs doivent donc décroître à la même vitesse. Le lemme 


suivant met cela en musique. 
LEMooAXTEooLBXQuM 


Lemme 20.200. 
Nous posons 


7/2 
= Î cos" (x)dx (20.595) 
0 


La fonction a: N — R définie par Wn = a(n)Whn-1 vérifie lims_,w a(n) = 1. 


33. Par exemple la proposition 18.20(10). 
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Démonstration. Parce que nous en aurons besoin, nous triturons d’abord un peu la formule de 
récurrence (20.586). D'abord nous l’inversons un peu pour avoir 


2 
no . ne (20.596) 


et ensuite nous écrivons 


W,_ = de 1 Wii. EooYINNoREUEUYE 


Ne vous posez pas de questions, ça va être utile. Le fait que la suite soit décroissante (lemme 
20.199) nous permet d’écrire 
Wu Wa <Wh_1. (20.598) 


En y remplaçant W, par a(n)Wh+1 et Wh-_1 par (20.597), 


n + 
Was < a(n)Was1 < 


Wa. (20.599) 


Nous simplifions par W,:1 et nous trouvons l’encadrement, valable pour tout n : 


1 
Re (20.600) 
nm 


Nous en déduisons par la règle de l’étau que a(n) — 1. 


LEMooWQZAooUXAPQ0 
Lemme 20.201. 
Soit 
m/2 
Wa = | cos" (x)dx. (20.601) 
0 
Encore plusieurs choses à dire. 
(1) Pour tout n nous avons 
E LOLF 
FA SE LOL 
(2) Nous avons l’équivalence de suites * 
T 
Wa = Al —. 20.603 
AE (20.603) 
Démonstration. En deux parties 
(1) La suite constante Nous posons K, = nWhWh-1. Grâce aux formules de récurrence 
(20.586) que nous écrivons sous la forme 
n— 1 
Wh = Wa-2 (20.604a) 
n 
n 
Wa+1 = Wan- 20.604b 
n+1l nE | n—1l) ( ) 
nous avons 
n n—l 


Ky11 = (n + 1)Wn+1Wa — (n + 1) Wh-1Wn-9 = (n — 1)Wn-1Wn-2 = K,_1. 


(20.605) 


n + 


Nous avons montré que Kh11 = Kh_1. 
Il nous reste à prouver que K1 = K2 = 3. Pour cela nous avons immédiatement WG = 3 
ainsi que 


7/2 
Wie Î ct à: (20.606) 
0 


34. Définition 10.32. 
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Pour W, il ne faut pas calculer d’intégrales, mais seulement utiliser la formule (20.587). 
Nous trouvons vite W2 = 7. Donc 


= WiWo = 


(20.607) 


et 
Ka = 2W2Wi = - (20.608) 


(2) L’équivalence de suites Soit la fonction a définie par W, = a(n)Wh-_1. Le lemme 20.200 
nous dit que a(n) — 1. Nous l’utilisons dans (20.602) : 


: = nWaWn_1 = na(n)W2_.. (20.609) 
Donc _ 
w? 20.610 
n—1 no ) ( ) 
et 
Re Ci (20.611) 
FA) œ(n) V 2n° | 


Vu que le coefficient 4/1/a(n) tend vers 1 pour n — 1, nous avons l’équivalence demandée. 


20.27.2 Formule de Stirling 
LEMooDXJ0oo0GFclv 


Lemme 20.202 ([577]). 
Si ne N nous avons la formule 


1 ce 1 1 2k+1 
In(1 +=) ?Dzai G) (20.612) 


Démonstration. I] s’agit d'utiliser astucieusement le développement de la proposition 15.100. Nous 
avons d’une part 


O0 
nfl+aæ)= J'( ne (20.613) 
k=1 


et d’autre part, 


00 x* 
=.) = (20.614) 
k=1 


_ or: . EQooYVXHooNDetVx 
Cela permet de calculer, en utilisant l’associativité de la série * | 


hi (=) = m(1+4—Im(1—6) (20.615a) 


= 

20 DFE k Prul 

=D (2 + =) (20.615b) 
k=1 


DE msi SUBEQoOTTOBa gr Yq Ju 


parce que tous les termes pairs s’annulent, tandis que les termes impairs sont doublés. Notez que 
la somme dans (20.615c) commence à k = 0, contrairement aux autres qui commencent à 1. 
Et là c’est l'astuce : on écrit l’égalité (20.615) avec le t qu’il faut pour que 
l+4 1 


— =1+—-, 20.616 
l1—t ur ( 


35. Proposition 11.91. 
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nous avons 


1 00 1 1 2k+1 
in (1 = 2 20.617 
a ( +2) de. 


_ 1 
Nous posons donc { = > 


ce qu'il fallait. 


LemCEoBqrP 
Lemme 20.203 (Formule de Stirling[578, 579, 575, 577, 580]). 
Nous avons l’équivalence de suites *5 


n nm 
nl (=) mn. (20.618) 
e 
Démonstration. Nous posons 
nl! 
An = 20.619 


et bn = In(a,). 


(1) Une formule pour b, — b,+1 Nous faisons un beau calçul qui utilise les formules de la 


proposition 15.84 ainsi que In(e) = 1 : Pc 
An 
on in ( ) (20.620a) 
An+1 
(n E” 1,7+1/2 1 
= | ne (20.620b) 
l,, 
= In (He) —] (20.620c) 
n 
a us (20.620d) 
= = |In —) — 1. | 
T2 n 
(2) La suite (b,) est décroissante Nous écrivons l'égalité (20.620) en utilisant le lemme 
20.202 : 
1 1 
ba — bmx = (n+ )In(i+ =) 1 (20.621) 
1 o0 1 1 2k+1 
= —(2 1)2 1 20.621b 
\ des 
o0 1 1 2k+1 
= (2 1 20.621 
ie D °) 
ce 2k 
nn) 
=}, . (20.621d) 
2%+1\2n+1 


Notez que le terme k = 0 s’est simplifié avec le —1. Vu que le tout est une somme de termes 
positifs, nous avons 

be = b.1 0 (20.622) 
et la suite est décroissante. 


(3) Majoration pour by —b,y;1 Vu que ue. < 1, nous pouvons majorer : 


00 1 k 
bn — bnr1 & D, Gr) (20.623) 
= \Ur+1} 


36. Définition 10.32. 
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Nous remarquons que cela est une série géométrique déjà traitée dans la proposition 11.122. 
Nous faisons un peu de calcul en partant de 


e q 
Da : (20.624) 
k=1 


avec q = Ge Après quelques simplifications, 


1 1 
D ————_— 20.62 
D TT ET Poe) 
(4) Le coup de la somme télescopique Nous avons 
b1 — bn — (b1 — b2) En (b2 — b3) + + (bi — bi): (20.626) 


Chacun de ces termes est majoré; nous avons donc 


Le) 
1 
Di. 
he» TT 1) D" 4 20620 


m=l m=1l 


grâce au lemme 11.126 pour la dernière somme. 


(5) La suite b, est bornée vers le bas 


In(2 
Vu que bi = 1 — mo) nous avons 


1 3 In(2 
M>h-5=] _. (20.628) 


En utilisant la majoration de l’exemple 20.146 nous trouvons 
0.327 < bn < 0.427. (20.629) 


Cet encadrement n’est pas très important. Le point est que la suite (b,) soit bornée vers le 
bas ; savoir que la borne est strictement positive n’est pas indispensable. 


(6) Une limite pour (a,;) La suite (b,) est décroissante et bornée vers le bas, donc elle est 


convergente par le lemme 10.35. Vu que l’exponentielle est une fonction continue *’, la suite 
An = e°" est également convergente. 
Vu que limy_»,0 bn > 0, nous avons limy_,0 an = elMn-obn > 1, 
L'important est que nous sachions que (a,) est une suite convergente. Nous notons L sa 
limite : 

n! 


Lim ———,; = I. 20.630 
n—© 4/9n (2)" ( ) 


Ou encore : 
n! 


= atozva (2)", ERA Boo CCo ns 


= 1. (20.631) 


Autrement dit, en posant 


nous avons limy_, @(n) = 1. 


(7) Introduction de Wallis Nous avons déjà parlé dans le lemme 20.198 du nombre 


(2n)! 


UT 
=, 
207 (onnl)2 2 


(20.633) 


Le lemme 20.201 implique que la suite 7, = Wa, est équivalente à 4/7/4n. 


37. Parce qu’elle est dérivable, voir par exemple le théorème 15.75. 
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Cela étant dit, nous faisons un gros calcul en remplaçant les factorielles dans W2, par la 
formule (20.632). Après pas mal de calculs Ÿ, nous trouvons 


h = ne . (20.634) 
Nous avons donc ; . 
— k ne NA (20.635) 
Il existe donc une fonction B(n) avec B(n) — 1 telle que 
vT Un = B(n) ne NE . (20.636) 
En simplifiant par 1/4/n, 
vT = LORS — (20.637) 


Nous prenons à présent la limite n — c en nous rappelant que « et B donnent 1. Après 
simplifications, nous trouvons 


L = Vr. (20.638) 


(8) La fin Nous introduisons la valeur L = 4/7 dans l’expression (20.632) de la factorielle : 


n! = a(n)V2rn OI | (20.639) 


La dernière équation est exactement ce qui signifie l’équivalence de suite demandée. 


20.204. 
J'ai déjà dit du mal de la formule d'Euler e7 = —1 dans (18.12). La formule de Stirling est 


plus intéressante parce qu’elle lie (réellement) les nombres e et 7. Mais elle fait aussi intervenir le 
nombre 42, et la fonction factorielle. 

La formule de Stirling est également nettement moins triviale à démontrer : la formule d’Euler 
ne fait intervenir de non trivial que les définition et propriétés des fonctions trigonométriques. 
Toutes ces propriétés sont également utilisées pour prouver la formule de Stirling. 


20.27.3 La fonction sinus cardinal, intégrale de Dirichlet 


Définition 20.205. 
La fonction sinus cardinal est 


FO = Lu (20.640) 


ee sinon. 


Elle sert à plein de choses. Entre autres, le lemme 20.208 montrera que la fonction x + 
[sin(x)/x| a une intégrale sur R qui vaut 0. Cela nous permettra de donner un exemple d’une 
fonction dans L!(R) dont la transformée de Fourier n’est pas dans L!(R) (lemme 29.8). 


20.206. 
Le but que nous nous fixons maintenant est de prouver que 


[ sin(®) 


T 
b # à 


(20.641) 


Un adage dit que si un théorème est trop long, c'est qu’il n’a pas assez de lemmes. Nous allons 
faire plein de lemmes. 


38. Si vous êtes en manque de papier de brouillon, c’est le moment de vous inquiéter. 
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LEMooMJFBooA jtN jV 
Lemme 20.207. 
La fonction sinus cardinal est continue. 


Démonstration. Elle est continue en zéro parce que le lemme 18.247 nous donne 


in(t 
DE (20.642) 
t—0 A 
Nous commençons par une mauvaise nouvelle. 
LEMooEEWSooZwLSAP 
Lemme 20.208 (|1]). 
Nous avons ; 
J LS) Pr (20.643) 
R TL 


Démonstration. Soit > 0 tel que sur l'intervalle [5 — 6, 5 + 6], nous ayons sin(x) > 0.9 * . 


Les intervalles 14 = [5 — Ô +2kr,7 + à + 2krx] sont disjoints et la fonction que nous intégrons 
est partout positive. Nous découpons 


O0 
R=C+{|JIS-6+2k7,5 +6+2kr] (20.644) 
— 2 2 


où C est le complémentaire qu’il faut pour faire IR. 
La o-additivité de l'intégrale de Lebesgue (proposition 14.204) nous indique que 


sin(x), sin(x) _ sin(x) . 
fl | L à Pope \d (20.645) 


u que tous les termes sont positifs, nous obtenons une majoration en en supprimant un. Allons-y : 
SOA ER Etcl P J PP Y 


oËOBw 


sin(x) . Se sin(x) - . 
LÉ \d DRE (20.646a) 


k=0 # 
1 
> Y 0 | “dx (20.646b) 
k=0 ES 
(ee) 
> 0.9 Ÿ° 26 : SPPEUOO REA RES 
es  +rO+2RT 
= 1 SUBEQooJCQ0o0Y. 
À a 
> 1.86 5 TE 2081685 
k=0 
ve] 
Le, (20.646e) 
27 _— k +1 


Justifications : 
— Pour (20.646c), nous avons majoré À par THE sur 14. 
— Pour (20.646d), nous avons dit que 5 + à < 2x. 


La dernière somme dans (20.646) diverge. 
Donc la fonction sinus cardinal n’est pas dans L!(R). 


La mauvaise nouvelle suivante en est un corolaire immédiat. 


39. Ça existe par une astucieuse combinaison du théorème 10.89 des valeurs intermédiaires, de la valeur remar- 
quable sin(rx/2) = 1 (de (18.41)) et du fait que sin est continue (proposition 18.1). 
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LEMooBEQRooHaugxK j 
Lemme 20.209. 


La fonction t 0 n'est pas intégrable sur [0,00[ au sens de Lebesgue. 


Démonstration. Le lemme 20.208 nous dit que |f| = 00. Dans ce cas, FF f n'existe pas par le 
lemme 14.182. 


Donc l'intégrale [4 Sn 4 n'existe pas parce que la définition de l’intégrale de Lebesgue ne 


permet pas de profiter ds compensations qui arrivent entre les valeurs positives et négatives. 


Nous définissons donc — . 
[ sin(t) Re. [ _ EQooWAQLonTF AE 
0 0 


t b—00 


Pour chaque b, l'intégrale existe sans problèmes (fonction continue sur le compact [0,b]), et les 
compensations se font. Il n’est pas pas sans espoir que la limite (20.647) existe et vaille un nombre 


fini. 
LEMooTFVZooRAmjUN 


Lemme 20.210 ([581]). 
La limite 


De 
lim Î 7 (20.648) 


existe dans KR. 


Démonstration. En plusieurs parties. 
(1) Découpage 
Nous découpons l'intervalle [0,b] en morceaux du type [kx, (k + 1)7] et un morceau restant 
lorsque b n’est pas un multiple de 7 : 


N(b)— 
- Un ,(& + 1)r] U [N(b)r, b] (20.649) 


où IV(b) est un entier bien choisi 0. En tout cas limy_,% N(b) = 00. 
(2) Majoration 1 


Pour chaque b € R* nous avons 


b N(b) ‘ : 
[ sin(t) — ÿ Î sin(t) a+ | sin(t) (20.650) 
o L ko [kr &+r] É [(N@)+1)r8 À 


1 1 
r< 


— (N@+H)r 


Dans le dernier terme, nous majorons |sin(t)| < 1 et . Cela donne 


sin(t) 


| (N@)H}r0] Ÿ 


sh (N(E) +1)T - 1 (20.651) 


où nous avons encore majoré b < (N(b) +2)r. 

(3) Majoration 2 
En ce qui concerne les autres termes, sur l'intervalle [kt, (k + 1)r], nous avons sin(t) = 
(—1)F|sin(t)|. Nous avons alors 


| N(b) +1)r 
[ _ d = D (1 [ " _ Isin(e)|, | a(b) FIOOP RUES) 
k=0 di 


où |a(b)| < OP E ; l'important est que lims_, a(b) = 0. 


40. Il me semble que le traitement de ce terme manque dans [581]. 
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(4) Une suite alternée 


L'inégalité (20.652) nous incite à étudier la série X}_9(—1)*ax en ayant posé 


(k+1)r |: t 
= [ RO, (20.653) 


Nous montrons à présent que la suite (ax) vérifie les conditions du critère des séries alternées 
TL T2T; 
D'abord, ax+1 < ax. En effet en utilisant le changement de variables! u = t— 7, 


(k+2)x |: (k+1)r |: (k+1)r |: 
Ak+1 = | Isin(e)|,, = J |sin(u + 7) y : J |sin(u)| 
(k+1)r t kr u+T _. FR 


du < ag. (20.654) 


Nous avons utilisé le fait que | sin(u + æ)| = |sin(u)| pour tout u. 
De plus, vu que |sin(t)| < 1 et que te [kn,(k + 1)x], nous avons 


(k+1)r | (k+1)r _ 
[ |sin(t)| <| 1 (k+1)r—-kr 1 (20.655) 
kr t kr kT kT k 
Donc ag < È — (0. 
Le critère des séries alternées 11.127 nous dit que 
(0e) 
D (—1)far < 00. (20.656) 
k=0 
(5) Conclusion Nous repartons de (20.652) : 
b &: N(b) (k+IT | 6: 
L L 
Î = 1} | ls (20.657) 
o À Fa kr t 


Cette égalité est valable pour tout be R*. Le passage à la limite b — 0 à droite donne un 
nombre fini; donc à gauche aussi, et nous avons prouvé que 


b = 
t 
lim Î MO < (20.658) 
0 


b—00 


Notre tache n’est donc pas sans espoir. Au moins l’intégrale que nous cherchons à évaluer est 
finie. 


LEMooARP IooDPSGwR 
Lemme 20.211. 
Soit x € ]0,{. L'intégrale 
(ve) : t 
F(x) = Î ets Vu (20.659) 
0 
existe au sens de Lebesque usuel. 
Démonstration. Vu qu’en t = 0 nous avons en = 1,iln’y a pas de problèmes de ce côté. Lorsque 
t > 1 nous avons la majoration 
.Sin(t 
El { ) Es Eau (20.660) 
Lorsque t est assez grand, le lemme 15.105 nous donne aussi la majoration 
_ l 
ÉRIE 3 (20.661) 


La proposition 14.277(2) implique que Le & < ©. Et les majorations font que la proposition 14.171 
nous donne le résultat. 


41. Le théorème 14.290 est toujours bon à citer. 
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LEMooRDCSooBrWmep 
Lemme 20.212 ([581]). 
Îl existe une constante CE R telle que 
00 . t 
ICE) — Î ae ) à = — arctan(x) + C (20.662) 
0 
pour tout x > 0. 
Démonstration. En permutant dérivée et intégrale, nous allons prouver que l'(x) — >. 
(1) Permuter Nous posons 
in(t 
fat) = et _ ) (20.663) 


et nous vérifions les hypothèses du théorème 17.19. 


(1a) Pour chaque x > 0 fixé, la fonction t + f(x,t) est intégrable sur [0,!{, c’est le lemme 
20.211. 
(1b) Pour t > 0 fixé, la fonction x + f(x,t) est dérivable. 


(1c) Nous avons la dérivée partielle 


Ca, t) = —e % sin(t) (20.664) 
qui vérifie 
CL (2,0) Se (20.665) 


alors que la fonction t ++ e-{* est intégrable sur [0,00]. 


Nous pouvons donc dériver sous l’intégrale et obtenir 


F'(x) = — Î L e “sin(t)dt. (20.666) 


= Î tt sin(#dt. (20.667) 


Cette intégrale est une intégrale de Lebesgue toute simple. En effet, posons provisoirement 
s(t) = e*tsin(t). La partie positive de s vérifie s,(t) < e*t et la partie négative vérifie 
s_(t) > —e *t, Les deux ont une intégrale qui converge. La définition 14.181 dit alors que J 
est une intégrale tout à fait propre. Elle serait d’ailleurs mieux écrite sous la forme 


J(x) = Ï et sin(t)dt. (20.668) 
[0,c0] 


Bref. Tout ça pour dire que nous avons tout à fait le droit de la faire par parties ?, en deux 
fois. 


D'abord en posant u = e-*t et v' = sin(t) nous avons 


J(x) = [-e* cos(t)]{ "4 — L'xe-*t(e) cos(t)dt = 1 — x [ e “cos(t)dt. (20.669) 


Nous faisons l'intégrale encore par parties en posant u = e*! et v’ = cos(t) : 


[ 6 Péo(tidi= [e7# sin(t)]e — Pene sin(t)dt = xJ(x). (20.670) 
0 0 


42. Proposition 20.130. 
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Donc 
O0 
J(x) = 1- | e_*? cos(t)dt (20.671a) 
. 
= 1- : | e *! cos(t)dt (20.671b) 
0 (0e) 
= 1- (x | ee sin(#)dt ) (20.671c) 
0 
Re ———— 
J(x) 
= 1—2°J(x). (20.671d) 


Voilà qui prouve que J(x) = >: et donc que 


AR (20.672) 
(3) Et enfin 


Le théorème 18.38(2) nous dit que la dérivée de la fonction arctan est précisément 1/(1 + x). 
Donc F et arctan ont la même dérivée (au signe près). Donc il existe CE R tel que 


F(x) = —arctan(x) +C (20.673) 
pour tout x > (. 
LEMooEOUYHooVIMCCa 
Lemme 20.215. 
Nous avons _ 
in(t 
F{(x) = Î er 0 y = — arctan(x) + 5 (20.674) 
0 


pour tout x > 0. 


Démonstration. Le but de ce lemme est de fixer la constante laissée arbitraire dans le lemme 
20.212. Nous savons qu'il existe CE R tel que 


EQooTZGX ] 
F(x) = — arctan(x) + C. nn. 36.675) 
Le but est de prendre la limite x — 0 des deux côtés. 
Par le lemme 18.248, nous avons je) < 1 sur [0,00[. Donc 
ve) 1 t=00 1 
F(x) < Î e idt = 5e] = —. (20.676) 
0 Le t=0 TT 


Vu que F(x) < À pour tout x, nous avons certainement lims_, F(x) = 0. 
D'autre part, 
: T 
Jim arctan(x) = 5 (20.677) 


En passant à la limite dans (20.675), nous avons 


D=--+0 (20.678) 


T 
2 


et donc C = 7/2. 


Nous avons maintenant la formule 


F(s)= [ en 6 dt = — arctan(x) + (20.679) 


LI 3 
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qui est valable pour tout x > 0. 

Notre but sera de prendre la limite æ — 0 des deux côtés. Vu que arctan est continue, le 
membre de droite ne pose pas de problèmes et donne 7/2. Pour le membre de gauche, il faut 
encore permuter une limite et une intégrale. 

Pour la suite, nous allons étudier[581] 


[a - er EO a. (20.680) 


Cette intégrale n'existe pas au sens de Lebesgue et est définie par 


sn 


L(x) = lim | (1—-e-“*) dt. (20.681) 


Rien n’indique cependant pour l'instant que cette limite existe. 
LEMooZG0DooLaBuHo 


Lemme 20.214 ([581]). 
Soit x > 0. Nous posons 
(k+1)r : 
ge [qe lSnla Eee GS 


La suite (Li(x))Ken satisfait le critère des séries alternées 


décroissante à limite nulle. 


, c’est-à-dire que cette suite est positive, 


Démonstration. Notons que chacune des intégrales L£(x) est sans problèmes : fonction continue 
sur un compact. Trois éléments à prouver. 


(1) Positive Vu que dans toute notre histoire, x,t > 0, nous avons 1 — e-# > 0 et donc toute 
la fonction intégrée est positive. 


(2) Tend vers zéro Vu que 1 — e # < 1, nous avons 


(k+1)T 
L(x) < J ne FAoo CE EREES 
kr t kT k 


Donc limg_, Lx(x) = 0. 

(3) Décroissante Nous devons à présent prouver que Lz(x) est décroissante en k lorsque x est 
fixé. 
Nous avons Lx,1(0) = Zz(0) pour tout k. Nous allons montrer que L,,,(x) < L,(x) pour 
tout x > 0. De cette façon nous aurons bien Lz,1(x) < Ly(x) pour tout k et x. 
En permutant (encore) intégrale et dérivée, 


(k+2)r 
ne | et] sin(t)|dé PAoPAGCC a RTE 
(k+1)T 
(k+1)r 
= sr qu en PEER 
kT 
(k+1)T 
= e TT J e_“|sin(u)|du SUBEQOOYGDRa gt anne 
kr 
me FLE) (20.684d) 


Justifications : 
— Pour (20.684a), permuter dérivée et intégrale ; je ne donne pas tout le détail. Ça a déjà 
été fait. 


— Pour (20.684b), nous avons fait le changement de variables u = t — 7. 


43. Théorème 11.127. 
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— Pour (20.684c), nous avons utilisé le fait que |sin(u+x)| = |sin(u)| ainsi que e-(#+r)z = 
eve par (LAIT. 
Nous avons donc prouvé que 
Lo ee PE ie ba) (20.685) 
LEMooSWFDooGLfwoD 
Lemme 20.215. 
Pour chaque x > 0, nous avons la limite 
b : 00 
t 
im | (ie) 0, D (-DÉLi(æ) < oo. (20.686) 


Démonstration. Nous fixons (provisoirement) b et nous découpons l'intervalle d'intégration comme 


- Un , (k + 17] U [ON + Dr,b] (20.687) 


où NN est une fonction de b; quelque chose comme N(b) est le plus grand entier tel que (N (b) +1)T < 
b. Sur chacun des intervalles nous avons sin(t) = (—1)*|sin(t)|. Nous avons donc 


. 8). RL fOrDr 2 |sin(t)| 
il (le) dt par 1) [ _ (ie #) ; dt Eee GED 


— [ (1— et sin) dt 
(N+1)r l 


Le premier terme est in (—1)ËLy(x), dont nous savons que la limite b — 0 existe parce que 


Ly(x) vérifie le critère des séries alternées (lemme 20.214). En ce qui concerne le second terme, 


| cn sn), _b—(N+ir 1 
LR he t Fe (N +1) SNG +1 (20.689) 


La dernière inégalité est le fait que N(b) est choisi pour avoir b— (N(b) +1) < x. 
Les deux termes de (20.688) ont donc une limite lorsque b — 0. Nous pouvons donc passer à 
la limite en sommant les deux limites : 


[a et) 0 a = NX 1) Ly(x). (20.690) 


0 k=0 


Cette égalité est valable pour chaque x > 0. 
Le fait que la limite soit finie est dans le critère des séries alternées. Pour chaque x, la suite 
L£(x) vérifie ce critère par le lemme 20.214. 


LEMooNZVSooDbZCZx 
Lemme 20.216. 


Nous avons ” 
lim | (1 et) 


æ—0+ Jo 


dt (20.691) 


Démonstration. La définition de l’intégrale ainsi que le lemme 20.215 nous ont déjà donné 


we) 


dt= ÿ (—-1)*L(x) (20.692) 


k=0 


sin(t) 


00 : b 
Î ae) 6) y 2 im (Get) 


ainsi que l'assurance que le tout est un nombre réel fini * 


44. De toutes façons, il n’existe pas de nombres réels infinis, mais vous voyez ce que je veux dire. 
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(1) Majoration pour la série alternée 


- UBEQSQooLIGNooNAZzpmi 
Nous majorons un peu. Pour x > 0 et N € N nous avons F Fes j 


N 
| De 1)FLx(æ)| < D |Le(x)l (20.693a) 
k=0 
N (k+1) 
: ÿ Î (1— et) _ ELCIPr EQoo TN eg xEEnS 
k=0 kr 
N° AN+i)x 
SS J a) e0l y (20.693c) 
k=0 kT l 
(N+1)r t 
=: Î a. 0 (20.693d) 
0 
(N+1)r : 
: [ 20 dt FUÉPRoe Zee TEE 
0 
(N+1)r 
< rdt (20.693f) 
0 
= z(N +1)r. (20.693g) 


Justifications : 
— Pour (20.693b) c’est la définition (20.682). 
— Pour (20.693e), c'est le fait que 0 < 1—e 7" < u pour tout u > 0 ainsi que la sous- 
additivité de l'intégrale de la proposition 14.187. 


(2) Majoration pour l’intégrale 


Nous fixons N € N, et nous avons : PHÉENSAOSESSRONRRES 
sin(t) _ 
[aim fu ai dt|=| D (—-1)Lx(x)| (20.694a) 
N 00 
=D (-DfLx(z)+ Ù (1) Z(x)| (20.694b) 
k=0 k=N+1 
N 00 
<| D (DL) +] D (-DfZ(x)] (20.694c) 
k=0 k=N+1 
N 
BEQooŸ D y 
<| DL) + Enr) RTE Eat) 
k=0 
N 
1 SUBEQooDDRGooNDfx 
< _1)ÉL + AAA 
DRETCIES (0.6 
(20.694f) 
Justifications : 


— Pour (20.694d) c’est le reste du critère des séries alternées, théorème 11.127(3). 
— Pour (20.694e) c’est la majoration (20.683) déjà faite. 


(3) Les deux ensemble Pour chaque N et pour chaque x > 0 nous avons, en mettant (20.693) 
au bout de (20.694) : 


et) sin(t 1 
z(N +1 ; 20.695 
fatal <a + Dr + (20.695) 
En prenant la limite x — 0 nous trouvons 
+ in(t 1 
lim ae) 20) y < (20.696) 
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pour tout N. Donc cette limite est nulle : 


re ne 


dt = 0. (20.697) 


Maintenant que nous avons fait plein de lemmes, nous pouvons énoncer notre résultat principal, 
et le démontrer facilement. 


Théorème 20.217 (Intégrale de Dirichlet{[581]). 
Nous avons 


sin(t T 
fa Î SE PR (20.698) 
Nous avons écrit limp_,% . OP et non ss OP parce que cette dernière intégrale n’existe 


pas vraiment au sens de Lebesgue, voir le lemme 20.209. Dans la suite nous écrirons cependant 


“ se dt, en gardant en tête que cela n’est défini que via la limite. 


Démonstration. Nous nommons D la valeur que nous cherchons. Le lemme 20.210 nous assure que 


be 
D = lim Î #0 <®. (20.699) 


b—00 0 
Le lemme 20.213 nous donne, quant à lui, 


b ; 
t 
Jim 0 y = — arctan(x) + e (20.700) 
—> 00 0 


Vu que les deux limites existent, on peut permuter somme et limite * : 


be b : 
D + arctan(x) — 5 = Jim (| “0 + Î A) (20.701a) 
Re 0 0 
b ; 
= lim | (1- er) 0 a. 7 0 CON OIb 
—> 00 0 


Pour (20.701b), nous avons des fonctions bornées sur un intervalle borné (10, b[), donc il n’y a pas 
de mal à sommer les intégrales. 
Donc pour tout x > Ü, nous avons 


D + arctan(x) — : _ Î (1 — O0 à (20.702) 


Nous passons à la limite x — 0 en utilisant le lemme 20.216 et le fait que arctan(0) = 0 (lemme 
18.43) : 


c’est-à-dire que résultat annoncé. 


45. C’est une phrase un peu grandiloquente pour dire que limy-,a f(b) — limp-,a g(b) = limy-»a(f(b) — g(b)). Ici 
nous avons a = © et les fonctions f et g sont celles définies par les intégrales. 


Chapitre 21 


Arcs paramétrés 


La structure de ce chapitre, comme beaucoup de choses dans le Frido, est fortement liée au 
choix de présenter toutes les matières dans l’ordre mathématiquement logique. Nous devons donc 
le placer après la trigonométrie; les propriétés principales des fonctions trigonométriques étant 
dans la proposition 18.20, et c’est la proposition 18.58 qui nous permet de dire que (cos(#), sin(t)) 
décrit le cercle. 

Et enfin nous n’avons pas encore calculé la circonférence du cercle, et pour cause : nous n’avons 
pas encore donné de définition à la longueur d’un chemin dans R?. C’est pourquoi ce chapitre va 
aller droit à la longueur avant de donner des exemples. 


21.1 Définitions 


SecDeExCPar 
Définition 21.1. 
Un arc paramétré dans R? est un couple (1,7) où T est un intervalle de R et y est une application 
continue de I dans R?. Nous disons que (1,7) est un arc paramétré compact (ou un chemin dans 
R?) lorsque I est compact dans R. 


L'intervalle 7 d’un arc paramétré compact est toujours de la forme [a, b], étant donné que tous 
les intervalles compacts de R sont de cette forme. Un sous arc de (7,7) est un arc de la forme 
(Lo, y) avec Lo € I. 

La définition 20.72 a déjà dit qu’un chemin dans R” est une application continue ©: [a,b] — R”. 

Si le chemin © est dérivable, la fonction o’ est la vitesse du chemin oc. Si le chemin est deux 
fois dérivable, la fonction o” l’accélération. 

L'image de o dans R? est ce qu’on appellera la courbe. 


21.2 Longueur d’arc 
SecLongArc 
Nous voulons définir et étudier la notion de longueur d’un arc paramétré. Pour cela, le plus 
raisonnable est d'approcher l’arc par des petits segments de droites (dont les longueurs sont évi- 
dentes), et d'extraire la « meilleure » approximation. 
Une des notions clefs pour la suite est celle de subdivision d’intervalles. Cette notion sera encore 


utilisée par la suite à propos des intégrales. 
DefSubdivisionlntervalle 


Définition 21.2. 
Si I est un intervalle d’extrêmes a et b avec a < b, nous appelons subdivision finie de T un choix 
de nombres t; tels que 

a = to < ty <... <tn = b. (21:1) 


Nous disons qu’une subdivision o' est plus fine que la subdivision © si l’ensemble des points de 
o est inclus dans celui des points de o'. Dans ce cas, la subdivision 0’ est un raffinement de o. 
Nous désignons par S(1) l’ensemble des subdivisions finies de l'intervalle T. 
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Dans la suite, toutes les subdivisions que nous considérons seront des subdivisions finies. Aussi 
nous parlerons simplement de subdivisions sans préciser. Nous allons souvent noter o = (t;);_, pour 
désigner la subdivision formée par les nombres t;. Il faut garder en tête que dans une subdivision, 
les nombres sont ordonnés. 


7(t1) 


(ta) 


7(t3) 


FIGURE 21.1: La longueur d’un découpage. La somme des longueurs des segments droits est facile 
à calculer. LabelFigCourbeRectifiable 


DEFooDNZWooXmxhsU 
Définition 21.3. 
Soit un arc paramétré compact (1,7) et une subdivision o = (t;)?_) de I = [a,b]. À partir de + et 
du découpage o nous définissons le nombre (voir figure 21.1) 


Lt) = Dh an Re 0 
On appelle longueur de l'arc y le nombre 
Lo) = suple(n) € [0,0]. (21.3) 
Nous disons que 7 est rectifiable lorsque l(y) < . 


Lorsque nous voulons spécifier sur quel intervalle nous considérons l’arc, nous noterons {(1,) 
au lieu de {() pour être plus précis. 
Par l’inégalité triangulaire, si o1 est plus fine que o, nous avons 


lo (7) < loi(9), (214) 


Comme cela peut être vu sur la figure 21.2. 


FIGURE 21.2: Il est visible que la longueur donnée par l’approximation par des petits segments 
(verts) est plus longue et plus précise que celle donnée par les longs segpueRis {FelgueurFinesse 


PROPooCXLYooRpKDMs 
Proposition 21.4. 
Si P et Q sont des points de R?, alors le segment de droite joignant P à Q est le plus court des 
arcs paramétrés passant par P et Q. 


Démonstration. Si y est un arc paramétré joignant P et Q, la longueur de 7 est donné par un 
supremum dont un des éléments est la longueur du segment de droite. 


Dans la vie réelle, il est souvent difficile et peu pratique de calculer le supremum « à la main ». 
C’est pourquoi nous allons travailler à exprimer la longueur d’un arc à l’aide d’une intégrale 
(théorème 21.9). 
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Lemme 21.5. 
Nous avons {(7y) = 0 si et seulement si y(t) est un vecteur constant. 


Démonstration. Si l'application (t) est constante, le résultat est évident. Supposons maintenant 
que y ne soit pas constante. Cela signifie qu’il existe t1 et {2 dans I tels que y(t1) Æ 7y(t2). 
Dans ce cas, si nous prenons le découpage o = {a,t1,t2,b}, la somme (21.2) contient au moins le 
terme non nul |y(t2) — y(t1)|, et donc {,(7) > 0. Par définition du supremum, nous avons alors 
ln) 2 (7) > 0. 


Propletautredecop 
Proposition 21.6. 
Soit (1,7) un arc paramétré compact. 


(1) Siy = (1,7) avec l'E TI, alors l(7y') < (7). 
(2) Soit ce [a,b], et considérons les arcs y = ([a,cl, 7) et y = ([c,b], y). Alors 
19) = Un) + (2). (21.5) 
En particulier, y est rectifiable si et seulement si y1 et y2 le sont. 
Démonstration. (1) Nous notons 1 = [a,b] et 1! = [a/,b/]. Étant donné que L' € I, nous avons 


a<a <b<b. (21.6) 


Pour chaque subdivision 60 : 4 = to <t1 <... <t, = b! de l’, nous pouvons construire une 
subdivision de J en « ajoutant » les points a et b, c’est-à-dire 


TR RTE AL (21.7) 


Si nous calculons l,(7), nous avons tous les termes qui arrivent dans {,,(7/) plus le premier 
et dernier terme : |y(to) — y(a)| et |-7(b) — y(t:)]. Nous avons donc 


lo(T) < L(7) € sup (7) = 1). (21.8) 


Etant donné que pour toute subdivision 09 nous avons /,,(%/) < (7), en prenant le supremum 
sur les subdivisions o0 de J’, nous avons comme annoncé 


12) < 1). (21.9) 
(2) Soit o = {t;} une subdivision de [a,b]. Nous considérons les subdivisions o1 et 02 définies 


comme suit : 
01 : {t: tel que t; < c} LU {c}, 


21.10 
02 : {ti tel que t; > c} LU {c}. ) 

L’inégalité triangulaire implique que 
LH N) < but) = la (1) + lo (92) < Uni) + (02). (21.11) 


Nous avons donc 


19) < Un) + Hop). FaTneg” 8 gr 45) 


Nous prouvons maintenant l'inégalité inverse. Soit £ > 0. Étant donné que {(1) est le supre- 
mum des quantités {4 (71) lorsque o1 parcours toutes les subdivisions possibles, il existe une 
partition of telle que (idem pour 2) 


V 
= 
L 


los (11) T 


EqAllsigmaeps EPS) 


V 
s 
Le 


los (2) + 


DIMM 
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où of est une subdivision de [a, c] et o$ en est une de [c, b]. En faisant la somme des deux 
équations (21.13), nous trouvons 


ln) + (0) < los (ni) + los (92) + € = losuos (7) < (7) + €. (21.14) 
L’inégalité {(-y1) + {(42) < {(y) + € étant valable pour tout €, nous avons 


ln) +12) < Un). (21.15) 


Cette inégalité, combinée avec l'inégalité (21.12), donne bien {(+) = {(y1) + {(72). 


21.3 Abscisse curviligne 


Définition 21.7. 
Soit (1,7) un arc rectifiable compact avec T = [a,b]. L'application 


w:[a,b] —R* 
ne. (21.16) 


est la longueur d’arc de 7. 


Cette fonction nous permet de calculer la distance (suivant la courbe) entre deux points arbi- 
traires parce que si a <t < u < b, nous avons 


I([é, ul, 7) = qu) — p(t). (21.17) 
En effet, 
qlu) — p(t) = I(a,u], +) — {(La,tl,7), (21.18) 
mais en utilisant la proposition 21.6, nous avons 
[([a,u], y) _ I([a,tl,7) + L(Té, ul, 7). (21.19) 


Proposition 21.8. 
La longueur d’arc d’un arc rectifiable compact est une fonction continue et croissante. 


Démonstration. Soit (1,7) un arc paramétré rectifiable compact avec 1 = [a,b]. Afin de mon- 
trer que @ est croissante, prenons t € T ainsi que À > 0 et montrons que @(t + h) > ç(t). La 
proposition 21.6 implique que 


[[a,t+hl,7) =1([a,t],7) +1([t+hl],7), (21.20) 


c’est-à-dire 
p(t+h) = pt) +l([tt+h],7) > v(E. (21.21) 


Pour la continuité, soit t fixé dans [a,b] et € > 0. Il nous faut démontrer qu’il existe 7 > 0 tel 
que si s est dans [0,7] alors 


lp(t+s)—v(t)l<Ee, Vte [a,b]. 


Étant donné que L([£,b], y) est le supremum des [,([t, b], y), il existe une subdivision o donnée par 
les points t,t1,:-: ,{n—1,b telle que 


€ € 
(Ed), 7) > LE, 0],7) — 3 = 0) — 60) — 5: (21.22) 
La continuité de 7 implique qu’il existe un 7 tel que 
€ 
s € [0,7] = fr +s) 76) <> (21.23) 


2 
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Quitte à prendre 7 encore plus petit, nous supposons que t + n < t1. Soit s € [0,7] et considérons 
la subdivision de [t,b] donnée par 0’ = o U {t +5}. Étant donné que ©” est plus fine que o, le 
nombre Life, b],7) est inférieur ou égal à L,/ ( CE b], >). Nous avons donc les inégalités 


< Lo ([t, b],7) 

+5) — y(#)] + Lange (Té + s,b]y) (21.24) 
+8) — 7) + (b) — pt +s) 

p(b) —p(t+s). 


Au final, nous avons trouvé que 
pit+s)—-v(t)<eE, (21.25) 


ce qui prouve que est continue au point t. 


En guise de paramètre sur un arc, nous pouvons utiliser la longueur d’arc elle-même. En effet 
si (1,7) est un arc de longueur {, nous pouvons donner le même arc avec le couple ([0, {| g) où g 
est la fonction qui au réel s fait correspondre l’élément (7 "(s)) de R”. Dire 


P=(y0op7")(s) (21.26) 


revient à dire que le point P est le point sur la courbe sur lequel on tombe après avoir marché une 
distance s sur la courbe. 

Nous allons revenir sur ce « changement de paramètre » plus tard, en particulier dans la sec- 
tion 21.7. 


21.3.1 Formule intégrale de la longueur 


Nous pouvons voir un chemin y comme étant la trajectoire d’une particule en fonction du 
temps. Sa vitesse à l'instant t{ est le vecteur y/(t), tandis que sa vitesse scalaire est le nombre 
|y/(t)|. Une question naturelle est de savoir quelle est la longueur de la trajectoire parcourue entre 
t=aett=b. 

Si nous prenons un petit intervalle de temps dt, nous pouvons supposer que le mobile avance 
à la vitesse constante |/(t)|. Cela ferait un trajet parcouru de longueur |/(t)|dt. Nous nous 
attendons donc à une formule de la forme suivante pour la longueur de 7 : 


b . 
l(+) - | |) dt. EqDefLongueur ré) 


Plus explicitement, si (4) = (x(t),y(t), z(t)), alors nous aurions la formule 


I) = J | Va (07 + y (07 + 7 (D7dt. (21.28) 


ThoLongueurIntegrale 
Théorème 21.9. 
Soit (1,7) un arc paramétré compact de classe C}. Alors 7 est rectifiable et 


b 
(y) = J Ir (b)IIdt = J 1. EqLongGamnal fat 
a si 


où I = [ab]. 


Démonstration. L'égalité avec l’intégrale le long de 7 de la fonction 1 est simplement la défini- 
tion 20.37 de l'intégrale curviligne. 
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Si o = {t;} est une subdivision de l'intervalle [a, b], alors 


-ÿ Ar) = y) 
_ -ÿ | r. (t)d| 


. (21.30) 
<> | Il 
ne. 
= [ro 
Cela prouve déjà que 
D dolce nine 
(y) = sup lo( »<f /(t) lat. a: sise sie 
Nous devons maintenant prouver l'inégalité inverse. 
Notons 4 l’abscisse curviligne o(t) = {([a,t], y). Cette dernière vérifie 
EC + h) — (0) = U([ 4 + A], n) > IC + h) — I, (21.32) 


et en particulier 


y + 7 — (6) | - o(t + 7 — p(t) | Sn 


D'autre part, en utilisant (21.31) sur le segment [t,t + h], nous avons 
t+h 
p+h)—(t) = (fé E+h],7) < Ï Iy/(u)|du. (21.34) 
t 


Cela nous permet de continuer l’inéquation (21.33) en 


DE 0 PROC ECCER DT (21.35) 


Prenons la limite À — 0. À gauche nous reconnaissons la formule de la dérivée, et nous obtenons 
|y/(#)|; au centre nous avons w’(t) et à droite, si n(u) représente une primitive de la fonction 


ur |y(u)|, 
n(t+h) —n(t) 


=n"() = | (1. (21.36) 


Au final, 
RACIES AVES RAUIE (21.37) 


c’est-à-dire w’(t) = |y/(t)| et donc par le théorème fondamental du calcul intégral 14.263, 


a) = | Gldu (21.38) 


Par construction de la longueur d’arc, w(a) = 0 et en posant t = b nous obtenons la relation 
recherchée : 


b 
L J IC) [du (21.39) 


RemLongIntUn 
Remarque 21.10. 
Cela est cohérent avec 20.182, mais il faut garder en tête que {(+) n’est pas la mesure de Lebesgue 
de l’image de + dans R?. Cette dernière est nulle. 
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Exemple 21.11. 
Soient donc a et b deux points de R”", et 7 la droite joignant a à b, c’est-à-dire 


(6) = (1 — ta + tb (21.40) 


avec { € [0,1]. Le théorème 21.9 nous enseigne que la longueur de ce chemin est 


1 1 
= [ C6) ét = [ |—a+6|=|b- al, (2141) 


qui est bien la distance entre a et b. PA 


Exemple 21.12 (Circonférence du cercle). 
Nous savons que l’image de 
7: [0,27[ — R? 


tr (Rcos(t), Rsin(t)) (21.42) 


est le cercle de centre (0,0) et de rayon À > 0. Et de plus cet arc est de classe CT (et même C®) 
par la proposition 18.1. La longueur sera, d’après la formule (21.9) 


27 
= Î [+ (6) ldt = 27R (21.43) 
0 


grâce à la formule sin? + cos? = 1 du lemme 18.4. 

Mais tout cela n’est pas satisfaisant parce que nous n’avons pas encore de valeur numérique de 
T. 

Il y a une autre façon de faire en considérant le quart de cercle dont la longueur en fonction de 
7 est vite calculée par 


r/2 xR 
bi Î (dt = (21.44) 
0 
Cette même longueur est calculée en termes de fonctions plus courantes avec le chemin 


o: ]0,1[ — R? 


no . (21.45) 


ef Va. EnooTIKSoongNEuX 


Notons que le changement de variables t = Rsin(u) permet de retrouver l’expression {, = TR/2. 
Pour avoir une approximation de 7, il est a de calculer une approximation numérique de 
l'intégrale (21.46) (avec À = 1) et de l’égaler à 7/2. A 
PROPooDMSTooEOUFEx j 


La longueur s'exprime avec 


Proposition 21.13. 
Soit le cercle S = {x € R? tel que |x| = 1}. Nous considérons la bijection! w: [0,27[ — S. Soient 
deux points a,b € S ainsi que 0, = w7!(a), 0, = w!(b). Nous supposons que 0, < 0, et que 
a(0,0)b = f*, 

Nous considérons le chemin 


+: [da 0] — S 


te (Rcos(t), Rsin(t)). (21.47) 


Alors 1(y) = RO. 


1. Corolaire 18.59. 
2. Angle, définition 18.157 
3. Longueur d’arc, définition 21.3. 


1862 CHAPITRE 21. ARCS PARAMÉTRÉS 


Démonstration. Vu que |a] = |b| = R, la définition de l’angle aob dit que 


cos(@) —sin(8)\ a  b 
. cos() ) R KR ee 


En substituant a = R(cos(0,),sin(@)) et b — R(cos(@),sin(@)) et en faisant une petite multipli- 
cation matrice par vecteur : 


(0 De eo Er ao) (21.49) 


cos 
sin(@) cos(@,) + cos(0) sin(4,) sin(6,). 
En utilisant les formules de trigonométrie du lemme 18.14, il vient 


cos(0 + 4,) = cos(@,) (21.50a) 
sin(0 + @,) = sin(4). (21.50b) 


La proposition 18.23 nous enseigne alors que 4, = 0 + 0, + 2kT pour un certain k € Z. Vu que 6, 
et #, sont entre 0 et 27, il est obligatoire que k = 0 et donc que 4, = 04 + 6. 

Enfin nous calculons la longueur de 7 avec le théorème 21.9 qui permet de réduire la longueur 
à une intégrale : {(-y) = a (6) dt. 

Dans notre cas, y/(t) = R(— sin(t), cos(t)) et donc |y/(t)| = R. Donc 


0a+0 
un = | y (6) lat = R8, (21.51) 


a 


comme annoncé. 


Exemple 21.14. 
Considérons l’arc de cercle de rayon À interceptée par l’angle 0 présenté sur la figure 21.3. 


6 


FIGURE 21.3: Quelle est la longueur de la partie bleue de ce cerclerdear#@mdétoozzuoqa 


Par définition, cette longueur sera 


CA 
[ V/R25in2(#) + R2 cos2(#)dt = R(O1 — %). (21.52) 
00 


Le radian comme unité de mesure d’angle est donc l’unité parfaite : elle est la longueur d’arc 
interceptée (si le rayon est À = 1). A 


Une conséquence à peine indirecte de ce que nous venons de voir à propos de longueur d’arc 


de cercle est la proposition suivante {. 
PROPooYMMKooSUBtoo 
Proposition 21.15. 
Pour tout x,ye KR, nous avons 
Fe] < |x — yl|. (21.53) 
4. À mon avis il y a moyen de prouver ça avec un développement limité, mais je ne sais pas trop comment majorer 
l'erreur sans accepter que x soit arbitrairement proche de y. Si vous savez comment faire, écrivez-moi. 


le 
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Démonstration. Évacuons tout de suite la différence entre IR? et C : ils sont isométriques. Si vous 
n'êtes pas convaincu que tout se passe bien, vous pouvez récrire toute la démonstration en écrivant 
systématiquement (cos(x), sin(x)) au lieu de e?. Cela serait au passage un bon exercice pour voir 
que les formules de dérivation fonctionnent bien. 

Nous considérons les points ef? et eŸ dans C et deux chemins différents les joignant. Le premier 
est le segment de droite 


01: [0,1]— © 
: (21.54) 
ti teit + (1 — the. 
Le second est l’arc de cercle 
01: [0,1]— © 
(21.55) 


— e° (tx+(1-0y) | 


Nous avons o{(t) = e? — eŸ qui ne dépend pas de t, et donc la longueur est facile à calculer à 
1 
partir de la formule intégrale du théorème 21.9 : 


= [ Lo! (#)] = |eir — iv. (21.56) 
En ce qui concerne le second chemin, 
on(t) = (x — ppei(er+(—0v), (21.57) 
Nous avons ? |o/(t)| = |x — y| qui ne dépend pas non plus de t. Donc 
l(o2) = |x — y. (21.58) 


Étant donné la proposition 21.4 qui dit que le chemin le plus court est le segment de droite, 


l(o1) < l(o2) (21.59) 


et donc le résultat annoncé. 


21.16. 
Si on veut savoir la longueur d’une courbe donnée sous la forme d’une fonction y = y(x), un chemin 
qui trace la courbe est évidemment donné par 


TC) = (6, y()), (21.60) 


et le vecteur tangent au chemin est y/(t) = (1,y/(t)). Donc 


MG) = V1+ y), (21.61) 
et 


L= J "VIE y). Fa-0n8 one 


Exemple 21.17. 
La longueur de l’hélice 


o(t) = | sin(2t) (21.63) 


pour t € [0,47] est donnée par 


AT AT 
l(o) = [ y/4 sin?(2t) + 4 cos2(2t) + 5dt = ) V9 = 12r. (21.64) 


5. Si vous voulez citer des résultats, lemme 18.11 et proposition 10.101. 
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Définition 21.18. 
Soit o1: [a,b] — IR*, un chemin et 02: [c, d] — R*, un autre chemin. On dit que ces chemins sont 
équivalents si il existe une fonction 4: [a,b] — [c,d| strictement croissante telle que o1(t) = 


oo(y(t)). 


Deux chemins équivalents parcourent la même courbe dans le même sens. Ils ne le parcourent 
toutefois pas à la même vitesse. On dit que les chemins sont opposés si la fonction 4 de la 
définition est strictement décroissante. Dans ce cas, ils ont la même image, mais parcourue dans le 
sens opposés. Nous disons que deux chemins équivalents sont un changement de paramétrage 
pour la même courbe. 


Dans le cas d’un paramétrage équivalente, nous avons (a) = c et w(b) = d. Les points de 
départ et d'arrivée des deux paramètres coïncident. Dans le cas d’un paramètre qui va dans le sens 
opposé par contre nous avons automatiquement w(a) = d et @(b) = c. 


Proposition 21.19. 
La longueur d’une courbe ne dépend pas du paramètre (équivalent ou opposé) choisi. 


Démonstration. Soient 01: [a,b] — IR? et 02: [c, d] — R° tels que 
EqChmsi 
o1(t) = (p(t)) Fr (re 


où @: [a,b] — [c,d] est une bijection strictement monotone. Par définition on a 


b 
Lo) = | loi(Old (21.66) 
a 
Nous pouvons exprimer la dérivée de 01 en termes de celle de 02 en dérivant la relation (21.65) : 


o1(t) = p'(t)o(v(t)). (21.67) 


En ce qui concerne la norme, 
CAOIEATAUINEAUIE (21.68) 


Notez dans cette relation que w/(#) est un nombre (et non un vecteur). Étant donné que nous avons 
supposé que 4 était monotone, soit elle est monotone croissante et |w/(4)| = 4/(t) pour tout t, soit 
elle est monotone décroissante et |w/(t)| =’ o(t) pour tout t. 


Considérons d’abord le premier cas, c’est-à-dire |w'(t)| = w’(t). Nous posons s = w(t), ds = 
p'(t)dt. En remplaçant cela dans la formule de la longueur est 


b 
I(o1) = Î OIACONC 


/ 
p(a (21.69) 


= | lo(s)lds 


Si nous considérons maintenant un paramétrage strictement décroissante. Dans ce cas, w/(#) < 0 
et |g/(t)| = —g/(t). Nous posons encore une fois s = p(t), ds = w'(t)ds. Ici il ne faut pas oublier 
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que (a) = d et y(b) = c. Le calcul est à part cela le même en faisant attention au singe : 


b 
I(o1) J OIACON 


a 


I 
$ 2 
S 
C 
A 
D 
TR 
a 
— 
Sn 
La 


c (21.70) 


I 
Q 
ND 
PS 
M) 
— 
& 
La) 


Nous avons changé le signe en changeant l’ordre des bornes. 


21.4 Suite du chapitre 


Le grand avantage des arcs paramétrés par rapports aux graphes de fonctions est qu’un arc 
paramétré peut « faire des retours en arrière », ou bien des auto intersections. Outre les deux 
exemples typiques de la la figure 21.4, un exemple classique est la droite verticale. Les fonctions 
y = ax + b permettent de décrire toutes les droites, sauf les droites verticales. Dans le cadre 
des courbes paramétrées, les droites verticales et horizontales sont sur pied d'égalité. Quelques 
exemples classiques : 

Droite horizontale Une droite horizontale à la hauteur a est donnée par la courbe paramétrée 
7(6) = (a), avecteI=R. 

Droite verticale Une droite verticale à la distance b de l’origine est donnée par la courbe para- 
métrée y(t) = (b,t), avecte I =R. BeGraPiéanna 

Graphe d’une fonction Le graphe d’une fonction f: IR — IR est donné par l’arc (t) = (4, f(t)). 


Un cercle Le cercle de rayon R est donné par l’arc y(t) = (Rcos(t), Rsin(t)). 


at 
3+ 
2 | > 
1+ 
EF 2. 1 ù d FRRETERETRR à 07 RARES PER RREEReRD ANT EEARaUNs 
(a) y(t) = (2sin(t),t), avec 0 <t< 2r (b) y) = (sin(2t),sin(t)) avec 


—T<i<T 


FIGURE 21.4: Des exemples d’arcs paramétrées. Ceux ne sont pasdles gEaBhS$earcParam 


Remarque 21.20. 

Afin d’alléger la notation, nous allons le plus souvent désigner l'arc (1,7) simplement par la fonc- 
tion 7. Il est cependant toujours très important de savoir sur quel intervalle nous considérons le 
chemin. Cela dépendra le plus souvent du contexte, et nous indiquerons l'intervalle Z explicitement 
lorsqu'une ambigüité est à craindre. 
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Par exemple, lorsque nous considérons le cercle +(t) = (Rcos(t), Rsin(t)), le plus souvent 
l'intervalle de variation de t sera 1 = [0,27]. Par contre, si nous considérons la droite y(t) = (t,2t), 
l'intervalle de variation de t sera naturellement 7 = KR. 


21.5 Autres exemples 


Exemple 21.21. 
Soit ve R° et x0 € R?. Le chemin 
ot) = to + tv (21.71) 


est une droite. Sa vitesse est o/(t) = v. a 


Exemple 21.22. 
La courbe & 
cos(t 2 
t) = 21.72 
2) a + (2172) 
avec t € [0,271 est le cercle unité parcouru une fois dans le sens trigonométrique. 

Notez que si on prend t € [0,4x{, nous avons un autre chemin ; c’est le même cercle unité, mais 
parcouru deux fois. Même si le « dessin » (le graphe) des deux est le même, le chemin n’est pas le 
même. 

Le chemin 

cos(27 — t) 
t)= |. 21.73 
ue e. — di 
est le cercle unité parcouru une fois dans le sens inverse. Encore une fois le « dessin » est le même, 
mais le chemin n’est pas le même. A 


Exemple 21.23. 
Le chemin 


o(t) = (2) (21.74) 


est un chemin dont l’image est la parabole d’équation y = x°. A 


L'importance de la dérivée du chemin réside en le fait qu’elle donne la tangente. En effet le 
vecteur o/(t) est tangent au graphe de & au point o(t). 


CorKBEMooRvYAcJ 
Corolaire 21.24. 
La tangente à un cercle est perpendiculaire au rayon. 
Démonstration. Nous savons que pour un cercle, 
DOŸ EE. (21.75) 
REY 


Un point général du cercle a pour abscisse x = R cos(0). En remplaçant nous trouvons le coefficient 
directeur suivant pour la tangente : 


1 
l(Rcos(8)) = ———. 21.76 
v'(Reos(®)) = (21.76) 
Par conséquent une droite perpendiculaire à la tangente aurait comme coefficient directeur le 
nombre tan(@). Or cela est bien le coefficient directeur du rayon qui joint le point (0,0) au point 


(R cos(8), Rsin(8)). 


Exemple 21.25. 
Pour le cercle, 


ce É (21.77) 
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la dérivée est donnée par 
fs (=) 
a (t)= ( sl) ) (21.78) 
Le produit scalaire o(t) : a’(t) est nul. Le vecteur o’(t) est donc bien tangent (corolaire 21.24). A 


Exemple 21.26. 
Le courbe donnée par le chemin 


cos(t) 
o(t) = | sin(t) (21.79) 
t 
est une hélice. Sa vitesse est 
— sin(t) 
o'(t) = | cos(t) (21.80) 
1 
Notez que pour tout te R, nous avons |o’(t)| = V2. A 


Remarque 21.27. 
Lorsqu'on parle d’une courbe dans l’espace, l’intervalle sur lequel on considère la variation du 
paramètre est une donné fondamentale. Elle fait partie intégrante de la définition de la courbe. 


21.6 Élément de longueur 


21.6.1 Élément de longueur : cartésiennes 


Étant donné que la longueur d’arc d’une courbe paramétrée (1,7) est donnée par l'intégrale 
de |y/(t)|, il est naturel d’appeler le nombre |/(t)| dt, l'élément de longueur de la courbe + au 


point y(t). 
En coordonnées cartésiennes dans le plan, une courbe paramétrée est donnée par 


y(6) = (m1(),220)), (21.81) 


la’ (6)] dé = 4/24)? + (ah)? dt. FQETLORgP AT 


21.6.2 Élément de longueur : polaires (1) 


et l’élément de longueur est 


En coordonnées polaires, une courbe est donnée par 


(6) = (p(6),0(€)), (21.83) 


et le passage aux cartésiennes se fait via les formules 


(t) = p(t) cos (4(t)) (21.84a) 
y(t) = p(t) sin (8(+)). (21.84b) 


L'élément de longueur se trouve directement en remplaçant x(t) et y(t) dans la formule (21.82). 
Les dérivées sont données par 


t) = p'(t) cos 0(t) — p(t)0/(t) sin O(t) 


() = 
t) = p'(t) sin 0(t) + p(t)0/(t) cos O(t), 


! 


(21.85) 


TRS 


y 
et un calcul montre que 
CO) ECO) CIO) ECO) CO) Cie) 


Nous reviendrons plus en détail sur le concept de changement de paramétrage (ici, les polaires) 
à la section 21.7. 
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21.6.3 Élément de longueur : polaires (2) 
Parfois on utilise 4 comme paramètre. L’équation de la courbe est alors donnée en coordonnées 


polaires sous la forme A ; 
p(8) = f(8). . POLE 


où f est une fonction réelle et il faut comprendre que nous parlons de la courbe. (ee O).en. 
coordonnées polaires. En coordonnées cartésiennes, cette courbe est donnée par | 


x(t) = p(t) cos(t) (21.88a) 
y(t) = p(t) sin(t) (21.88b) 
avec t qui parcourt le plus souvent l'intervalle [0,27]. Notez qu’il se peut que le domaine ne soit pas 
toujours [0,27]; cela peut dépendre des circonstances. Quoi qu'il en soit, la donnée du domaine 


fait partie de la donnée d’une courbe, et il ne peut donc pas y avoir d’équivoques à ce niveau. 
Nous utilisons à nouveau la formule (21.82) en y mettant les valeurs (21.88) : 


{ x'(t) = p'(t) cos(t) — p(t) sin(t) (21.89a) 
y(t) = p'(t}sin(t) + p(t) cos(t), (21.89b) 
et 


COMCOOETOETOS PE GEO 


Remarque 21.28. 
N'oubliez pas, en utilisant ces formules, que ce qui rentre dans l'intégrale est la racine carré de 


(æ)? + (y)? 


Exemple 21.29. 
Calculons la circonférence du cercle. En coordonnées polaires, le graphe du cercle correspond à 
l'équation 


ExempleLongCercle 


(2(#),8(#)) = (R.5) (21.91) 
où R est constante (le rayon du cercle) et t va de 0 à 2x. En substituant dans l'équation (21.86), 
l’élément de longueur à intégrer est seulement 


VR=R (21.92) 


parce que p'(t) = 0 et 0/(t) = 1. La longueur du cercle est alors directement donnée par 


27 

1 = Î Rdt = 2rR. (21.93) 
0 

Nous pouvions aussi faire le calcul en coordonnées cartésiennes. Alors la courbe est donnée par 


les équations 
x(t) = Rcos(t) 


21.94 
y(t) = Rsin(t) ) 
et te [0,2]. La circonférence du cercle est alors 
27 
if” \/r2 sin?(t) + R2 cos?(t) dt = Î Rdt = 2rR. (21.95) 
0 
A 


Remarque 21.30. 

Il faut bien comprendre que quand on parle de courbes paramétrées en coordonnées cartésiennes 
on pense à une courbe dont le paramètre est, par exemple, t{ et les équations de la courbe sont 
(x(t), y(t)). Cela ne veut pas dire que x ou y soit le paramètre. Le cas où x ou y est le paramètre 
est un cas particulier qui est possible seulement pour certaines courbes et notamment pour les 
graphes. Le cercle de rayon 1 n’est pas un graphe, donc si on veut utiliser x ou y comme paramètre 
il faut d’abord découper la courbe en deux morceaux, par exemple, la moitié inférieure (y < 0) et 
la moitié supérieure (y > 0). 
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ExCycloLong 
Exemple 21.31. 
Une cycloïde est une courbe paramétrée par 
x(t) = a(t — sin(t)) (21.96a) 
y(t) = a(1 — cos(t)) (21.96b) 


avec a > 0 et te R. Comme montré sur la figure 21.5, la cycloïde donne lieu à un graphe périodique. 
Il est possible de montrer (le faire) que le premier arc correspond à { € [0,27]. Nous voulons donc 
calculer la longueur de l’arc sur cet intervalle. 


À 


2 + 


1+ 


FIGURE 21.5: La cycloïde de paramètre a = 1 entre 0 et ÂTLabelFigCycloideA 


Nous avons æ’(t) = a(1 — cos(t)) et y/(t) = asin(t), de telle façon que 


V/(x')2 + (y)? = a4/2 — 2 cos(t) = a /4sin? () = 20 


La longueur est donc donnée par 


sin [AE PET 


27 T 
t 
Î 2a| sin 5ldt = aa | sin(t)dt = 8a. (21.98) 
0 0 
A 


Exemple 21.32. 
La cardioïde est la courbe donnée par 


p(6) = a(1 + cos(6)). Facare pts) 


avec 0 E [—T,rx]. Le nom de cette courbe provient de son graphe illustré à la figure 21.6. 


FIGURE 21.6: Une cardioïde, p = 1 + cos(6). LabelFigCardioid 


L’équation (21.99) est donnée sous la forme (21.87), c’est-à-dire que 0(t) = t et 0'(t) = 1, et 
par conséquent l’élément de longueur est donné par 
(p'}? + (p}? = (— asin(0))” + a (1 + cos(0))” 
= a? sin?(0) + a? (1 + 2 cos(0) + cos” ()) 
= a? (1 +1+ 2 cos(8)) (21.100) 
= 2a° (1 + cos(8)) 


Q 
D 
a cos > 
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La longueur d’arc est donc donnée par 


T 0 7/2 
= ] 2a cos 3 d0 = za | cos(t)2dt = 8a. (21.101) 
—7/2 


—T 


21.6.4 Approximation de la longueur par des cordes 


Définition 21.33 (Point régulier, birégulier[582]). 
Soit un arc paramétré (1,7). Un point t € T est dit régulier si y(t) Æ 0, et il est dit critique 
si V(t) = 0. Le point t € TI est dit birégulier si les vecteurs y(t) et y”(t) sont linéairement 
indépendants et non nuls. 

Par extension, nous dirons également que le point y(t) lui-même est régulier, critique ou biré- 
gulier. Un arc est dit régulier lorsque tous ses points sont réguliers. 


Note : dans le lemme 21.71 et ses dépendances, nous utilisons effectivement que l’arc 7 est de 
classe C?. 

Nous savons que la longueur d’une courbe est donnée par le supremum sur toutes les subdivi- 
sions de la longueur des cordes correspondantes. De plus l’inégalité triangulaire nous enseigne que 
plus la subdivision est fine, plus la longueur sera grande. Il est donc naturel de penser que sur un 
petit intervalle, la longueur de la courbe ne doit pas être très différente de la longueur de la corde 
correspondante. 

La proposition suivante est un énoncé précis et quantitatif de ce fait. 


Proposition 21.34. 
Soit (I,y) un arc de classe C! et to € I un point régulier (c’est-à-dire y (to) Æ 0). Alors pour tout 
e > 0, ü y a un Ô > 0 tel que on trouve t,t'E TI A (to,0) tels que 


[ I Qu)Idu — 176) — 7 < 2elé — #1. (21.102) 


Intuitivement, cette proposition signifie qu’au voisinage de to, la longueur d’arc est équivalente 
à celle de la corde. 
Démonstration. Par la continuité de +’ (parce que + est Cl), pour tout €, il existe un 6 tel que 


lé tol < 5 = |y(t) — + (to)l < €. (21.103) 


Nous considérons la fonction 


ur y(u) — (to) — (u — to)Y (to), (21.104) 


dont la dérivée (par rapport à u) est 
d'(u) = v/(to). (21.105) 


Nous y appliquons la formule des accroissements finis entre t et {’ choisis dans 7 A |to — Ô,to + ôf. 
Il existe un w entre t et t/ tel que 


[yCE) — Go) — & — to} (bo) — +8) + (bo) + (#' — to) (to)| 
= |t—#]|y(u) — y (to)| (21.106) 
<elt—t|. 


En simplifiant ce qui peut être simplifié dans le membre de gauche, nous trouvons 


Int) — 16) — € #7 (éo)| < eh — #1 (21.107) 
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Le membre de gauche peut être minoré en utilisant la proposition 7.150 : 


FOOT AO EEE FANSORE IEEE EES 


D'autre part, les inégalités (7.128) montrent que 


(a) = + (to) < In Cu)| — 1 Co)l < 17°C) = + CT TE SEE) 


Si de plus w est compris entre t et t’, ces inégalités sont encore coincées entre —e et €. En intégrant 
(21.109) par rapport à u entre t et {’, nous obtenons 


re) 


Afin d’alléger les notations pour la ligne suivante, nous notons À le nombre positif : y (u)|du. 
Nous avons 


<elt—t|. (21.110) 


OR OI ES EU OETELTOIETC “Acces 
< [41-2117 (to)1] + Îlé— #11 (éo)] — 1 — I] 


L'équation (21.108) montre que le second terme est plus petit ou égal à et —t/|. En ce qui concerne 
le premier terme, étant donné que À est positif, 


LA #11 (ol) < [4 (#7) 1/0) < elt — #1: (21.112) 
Au final, l’inéquation (21.111) donne 


A — Ir) 1) < 218 #1, (21.113) 


ce qu'il fallait démontrer. 


21.7 Arc géométrique 

SecArPééämeEnidue 
Définition 21.35. 
Soient (1,7) et (J,g) deux arcs paramétrés de classe C*. On dit qu'il sont équivalents si il existe 
une bijection 0: I — J de classe CF, d’inverse de classe C* telle que g = 700. Nous notons 7 — g 
lorsque 7 et g sont équivalents (les ensembles T et J sont sous-entendus). 


Le passage d’un paramétrage (7,77) à une autre (J, g) se fait selon le diagramme suivant : 


7. pr 


I 
1 A 
J 
Proposition 21.36. 


La relation donnée dans la définition 21.35 est une relation d'équivalence. 


(21.114) 


Démonstration. Les trois points d’une relation d'équivalence se vérifient en utilisant le fait que @ 
est inversible, et que l'inverse 0-1 jouit des mêmes propriétés de continuité (CF) que 0. 


Réflexivité Nous avons y — 7 avec 0 = Id. 


Symétrie Si y — g, alors nous avons une application 4 telle que g = 700, et donc 7 = go87!, ce 
qui montre que g + 7. 
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Transitivité Si y — get g — h avec g = 700 et h = gow, alors h = 70 (fo w), ce qui montre 
que y — À. 


Si les arcs (7,7) et (J,g) sont équivalents, les images dans R” sont identiques, et décrivent 
donc « le même dessin ». Nous allons préciser cette notion plus loin. 


Définition 21.37. 
Pour cette raison les classes d’équivalences sont appelées des arcs géométriques (de classe C*). 


Si l'est un arc géométrique, ses représentants sont dits des paramétrages admissibles ou, 
plus simplement paramétrage. On dit que l'application 4: J — I est un changement de variable. 


Nous disons que un arc géométrique est compact quand ses représentants sont compacts. 
LemChamVarsStriMomnot 


Lemme 21.38. 
Dans le cas d’un arc C}, les changements de variables sont strictement monotones (croissants ou 
décroissants). 


Démonstration. Nous considérons (7,7) et (J,g), deux paramétrages différents du même arc géo- 
métrique, et 0 € C!(J, TI) le changement de variable. Nous allons noter t la variable sur J et s la 
variable sur J. Par définition, 0(971(t)) = t, et par conséquent, 


9(871(#))(87 1) (€) = 1. (21.115) 


En particulier 0’ (97 1(#)) ne s’annule pas pour aucune valeur de t. Mais 0-!(t) peut prendre n’im- 
porte quelle valeur dans J, donc nous avons #’(s) £ 0 pour tout s € J. Cela signifie bien que 4 est 
strictement monotone. En effet, 0’ étant continue, elle ne peut pas changer de signe sans passer 
par zéro (théorème 10.89 des valeurs intermédiaires). 


ThoLongArcGeom 
Théorème 21.39. 
La longueur d’un arc est indépendante de son paramétrage, c'est-à-dire que les représentants d’un 
arc géométrique compact de classe C! ont même longueur. 


Démonstration. Nous utilisons les mêmes notations que celles du lemme 21.38. Nous savons déjà 
que le changement de variable 0: J — I est strictement monotone. Supposons que Ÿ soit croissante. 
En effectuant un changement de variable dans l'intégrale qui donne la longueur nous avons 


I) = [ MOI 


J (21.116) 


Définition 21.40. 
Nous nommons longueur d’un arc géométrique la longueur commune de tous ses représentants. 
On dit que l’arc géométrique est rectifiable si sa longueur est < ©. 


6. Théorème 21.9. 
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21.7.1 Abscisse curviligne et paramétrage normal 
SubSecAbsCurv 


Définition 21.41. 
Soit (1,77) un arc paramétré continu rectifiable. Nous appelons abscisse curviligne de y toute 
application @: I — R telle que pour tout t,t' € I avec t < t/, nous ayons 


(Le, #1,7) = 1é(e) — 6). (21.117) 
Si il existe un to € I tel que d(to) = 0, alors nous disons que to est l’origine de l’abscisse @. 
DEFooJJQFOooEITCvG 


Définition 21.42. 
Un arc paramétré (I1,yN) continu rectifiable est dit normal si l'identité est une abscisse curviligne. 


LEMooLADUooB1HjuT 
Lemme 21.43. 
Si y est de classe C? et est un paramétrage normal, alors 
(1) pour tout choix de t et t’ dans T avec t < t', nous avons 
LÉ, dx) = # —t. (21.118) 
(2) |y(t)| = 1 pour tout t. 
Démonstration. Pour tout x1,x2 dans le domaine nous avons 
T2 
Hal) | lee. (21.119) 
T1 


Cela implique |/(t)| = 1 pour tout t. En effet, pour fixer les idées, supposons que |/(t)| > 1 
en un point, par continuité, cela reste strictement supérieur à 1 sur un intervalle ”. L'intégrale sur 
cet intervalle ne peut alors pas être la taille de l'intervalle. 


ExCerlceRadNorm 
Exemple 21.44. 
Le cercle unitaire est donné par l'arc 


y(t) = (cos(é), sin(t)) (21.120) 


et te [0,27]. Pour tout choix de t et {’ dans [0,27], nous avons 


t! 
(#1) = | y/sin?(u) + cos2(u)du = # —t. (21.121) 
t 
Les angles exprimés en radians forment donc un paramétrage normal du cercle de rayon 1. AS 


Lemme 21.45. 
Pour un arc paramétré compact, la longueur d'arc est une abscisse curviligne. 


Démonstration. Par définition de la longueur d’arc 4, nous avons 


E(£) — (8) = U(fa, 1,7) — (la, d,) = ©. (21.122) 
Supposons pour fixer les idées que # > t. En utilisant la proposition 21.6, nous avons 
L[a,t1,7) = (fa, t],7) +4([6,#1,+), (21.123) 
et donc après simplification de deux termes, 
© =i([t,#1,7), (21.124) 


ce qui est précisément la propriété demandée pour être une abscisse curviligne. 


7. Corolaire 10.86. 
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PropExisteChmNorm 


Proposition 21.46. 
Pour tout arc paramétré C? sans points critiques, il existe un changement de coordonnées qui rend 
l’arc normal. 


Démonstration. Soit (1,7) un arc de classe C!. Nous devons montrer qu’il existe un intervalle J 
et une application 0: J — I de classe C! et d’inverse C! tel que l’arc (J, y») soit C! où 4x = 700. 


Si I = [a,b], nous considérons la fonction 
IR" 


. Eponpen 
is J y (u)|du. 


Étant définie par l'intégrale d’une fonction C°, la fonction 6 est C!, et nous avons #’(t) = |/(t)| > 0 
pour tout t{ € I. Vue comme application : [a,b] — [0,{(7)], l'application 6 est bijective et d’inverse 
C!. Voyons cela point par point. 


(1) La fonction @ est injective parce que strictement croissante. 
(2) Elle est surjective parce que (a) = 0 et D(b) = i(+). 


(3) La continuité de l'inverse est plus délicate. Soit s € [0,{(y)] et € > 0. Pour prouver la 
continuité de dl en s, nous devons trouver un 6 tel que 


|s— 5} < 8 = [DT l(s) — #1 (s')] < e. (21.126) 


Étant donné que s et s/ sont dans l’image de ©, nous considérons les uniques t et t” tels que 
s = (t) et s = (t'). La quantité (t) — (t') devient 


. dl F EqCond 
J | Cu) du — | | Cu) du = [ ]yCu)ldu. qcondvpemnq sn 
D'autre part, D-1(s) = t et D !(s/) = #/, donc la condition (21.127) devient 
t 
il |y/(u)ldul < 8 = |t-#| <e. (21.128) 
t! 


Cela revient à la continuité des fonctions définies par une intégrale. 


(4) La dérivée de son inverse est donnée par ° 
OS) = _…, (21.129) 


Nous avons vu que @ ! et d étaient continues. La fonction (9-1) étant exprimée en termes 
de ces deux fonctions elle est également continue. 


Nous considérons l’arc paramétré (J,yx) avec J = [0,{(+)] et 


an(s) = (yo 877)(s). (21.130) 


8. Pour obtenir cette formule, dérivez les deux membres de l’équation p(pT"(s)) = 5. 
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Nous montrons maintenant que ce nouveau paramétrage est normal. Soient 0 < s < 8° < {(7), 


U(s#,9) = [ hétoldu 
pU'(s’ ; 
= [7 lorcotblétod 
p'(s 
pT'(s" 
= [ loxed) (lat 
a, (21.131) 
- | (at 
pT'(s 
pU'(s’ gT'(s) , 
= poa-[ roa 
0 0 


= x . à (7 (s)) 


— S 


- 


ce qui prouve que le paramétrage (J, y) est normal. 


Nous retenons que le paramétrage normal de est donné par (J, 7x) avec J = [0,{(7)] et 
_ EqFomVPc 
an(s) = (ro 871)(s) FO CEE) 
où 


| : EqFomVPco ARE 
be ['ivcotau D 


Notons aussi que ® est une fonction croissante, étant l'intégrale d’une fonction positive. 


Exemple 21.47. 
Trouvons les coordonnées normales pour la cycloïde donnée par 
x(t) = a(t — sin(t)), (21.134a) 
y(t) = a(1 — cos(t)) (21.134b) 
ette ]0,27[. Relire l'exemple 21.31. 


D'abord nous trouvons ® avec la formule (21.133) avec a = 0. En utilisant le bout de calcul 
(21.97), nous avons 


t 
o(t) = za | sin zdu = Aa (1 — COS :) ; (21.135) 


0 


Pour trouver 41(s), nous résolvons l'équation 
s = p(D(s)) (21.136) 


par rapport à D (5). Dans un premier temps, nous trouvons 


_ 
1 ” = . (21.137) 
donc #5) = arccos(41), et finalement 
2 = 4a /? 
| Aa — 5 
o (s) = 2 arccos TN (21.138) 


Il nous reste à injecter cela dans les expressions de x(t) et y(t) pour trouver (yx)z(s) et (yn)y(s). 
D'abord, 
(n)a(s) = a[d7"(s) — sin (97 "(s))]. (21.139) 
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Nous utilisons maintenant la formule trigonométrique sin(x) = 2sin ÿ cos ? afin de simplifier les 


expressions : 
4a — 4a — 4a — 
(IN )x = a[2 arCCOS (=) — 2sin (arccos (=) ) cos (arccos ( — :) )| 
2 
= a[2arccos 4a — 8 Aa —s 1 Aa — s | (21.140) 
4a 2a 4a 
4a — 4a — 
— 2aarccos ( “© — V8as — 5? — 
4a 8a 
où nous avons utilisé la formule sin (arccos(x)) = V1— +2. Ensuite, pour obtenir (x), nous 
devons calculer 
(n)y(s) = a[1-— cos (97! (s))]. (21.141) 
Encore une fois, il est intéressant d'exprimer le cosinus en termes des angles divisés par deux : 
cos(x) = cos? 5 — sin? £. 
_ À 
(YN)y = all cos? ‘à < ) + sin? ÿ 0) 
1 
= a[2 nn )] (21.142) 
4a — s\? 
=2a[ | 
do. 
Dans ce paramétrage, s € |0, 8a|. A 


Exemple 21.48. 

La cardioïde p(0) = a(1 + cos(8)) avec 0 entre —r et x. Avant d'utiliser la formule (21.133), nous 
devons trouver l'élément de longueur de la cardioïde. Étant donné la facon dont l'équation de la 
cardioïde nous est donnée, l'élément de longueur est donné par ? (21.90) : 


|y/(u)|? = a? sin?(u) + a?(1 + cos(u))? 
. (21.143) 
= 2a° (1 + cos(u)), 
et par conséquent !0 
t 
o(t) = Î /2a2(1 + cos(u))du 
0 
t 
= Î 2e Gi + cos? À — sin? ;)du 
oÙ 2 2 (21.144) 
_ za | cos — du 
0 2 
t 
— 4asin =. 
asns 
Pour trouver l'inverse, nous résolvons o(D !(s)) = 8 par rapport à D 1(s) : 
2 
4asin (° 2) = 5, 
(21.145) 


2 
D 1(s) = 2 arcsin (5) : 


9. Nous vous déconseillons d’étudier cette formule par cœur. Sachez cependant la retrouver assez vite. 
10. L'utilisation stricte de la formule (21.133) demanderait d’intégrer à partir de —7. Pour plus de simplicité, nous 
intégrons à partir de zéro, et nous verrons plus tard comment adapter l’intervalle du nouveau paramètre. 
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Avant d'écrire trop brutalement 4x (s) = (704-1)(s), il faut comprendre comment est +. Nous 
avons reçu la courbe sous forme polaire, c’est-à-dire 


(€) = (rt), (6)) = (a( + cos(é)),t). (21.146) 


C’est comme cela qu’il faut comprendre la donnée p(8) = a(1 + cos(8)). Maintenant la formule 
yn(s) = (79 971)(s) devient 


On}r(s) = (ps) (21.147) 
(nets) = (87 (s)). (21.147b) 


Étant donné que yg(t) = t, la seconde est facile : 


(yn)e(s) = 2arcsin (=) (21.148) 
a 
Pour la première, 
16 D, 12 
(yn)r(s) = a[1 + cos (2 arcsin rm] = = — (21.149) 
Nous écrivons donc le nouveau paramétrage en coordonnées polaires sous la forme 
16a? — 5? S 
—$——,2arcsin — |. 21.150 
( Ba arcsin à) ( ) 


La question qui arrive maintenant est de savoir quel intervalle parcours la nouvelle variable 5. 
D'après le résultat de l’exemple 21.99, la longueur de la cardioïde est de 8a et nous avons donc 
8 € [0,8a]. Cependant, la condition d’existence de arcsin nous interdit d’avoir s plus grand que 4a 
en valeur absolue. Où est le problème ? 

Le problème est que nous avons changé l’origine de notre paramètre en donnant @(t) comme 
une intégrale à partir de 0 au lieu de —7. Cela se voit en regardant de quel point nous partons : en 
s = 0 nous sommes sur le point (2a, 0) tandis qu'avec le paramètre original, c’est-à-dire 0 € [—x,x|, 
nous avons pour 0 = —7 le point (0,—7x). 

Il se passe donc que si nous commençons à parcourir la cardioïde avec s = 0, nous partons du 
milieu, et nous ne parcourons donc pas tout. Étant donné que le « premier » point de la cardioïde 


est le point (0, —7T), le paramètre s commence en s = —4a, et nous avons comme intervalle : 
s € [—-4a, da], (21.151) 
ce qui est en accord avec la conditions d’existence. A 


Quel enseignement tirer de cet exemple ? Lorsqu'on calcule @(t) pour trouver les coordonnées 
normales, il y a deux solutions. 
(1) Utiliser strictement la formule @(t) = (oi |y'(u)lldu, en prenant bien comme borne de départ 
le point de départ de le paramétrage de +. À ce moment la coordonnée normale construite 
aura [0,{(y)] comme intervalle de variation. 


(2) Faire commencer l’intervalle d’intégration en zéro (ou ailleurs). Un bon choix peut simplifier 
quelques calculs, mais alors il faudra bien choisir la valeur de départ de la nouvelle coor- 
données pour que le « premier » point de la courbe soit correct. Dans ce cas, la longueur de 
l'intervalle sera quand même {(+). Il n’y a donc pas de problèmes pour trouver la valeur du 
bout de l'intervalle de variation du paramètre normal. 


Dans tous les cas, il faut bien préciser l’intervalle de variation du paramètre lorsqu'on donne une 
courbe paramétrée. 
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21.7.2 Tangente à une courbe paramétrée 


Définition 21.49. 
Soit (I, y) un arc paramétré de classe CF avec k > 1. Nous disons que la courbe admet une tangente 
en (to) € R” lorsque les deux conditions suivantes sont remplies 


(1) (6) # y(to) pour tout t dans un voisinage de to ; 
(2) la direction de la droite qui passe par y(t) et (to) admet une limite lorsque t — to. 


Dans ce cas, la tangente sera la droite passant par le point y(to) et dont la direction est donnée 
par la limite. 


Dans cette définition, par direction d’une droite, nous entendons le vecteur de norme 1 pa- 
rallèle à celle-ci sans tenir compte du signe. La tangente sera donc la droite passant par y(t0) et 
parallèle au vecteur 

im 29 = Vo) (21.152) 
to |() — y(to)| 
Évidemment si nous avions écrit y(to) —(#), ça n'aurait pas changé la droite. Par abus de langage, 
nous parlerons souvent de « la direction uw » même lorsque u n’est pas de norme 1. 

Formellement, une direction est une classe d'équivalence de vecteurs pour la relation u + v si 
il existe À Æ O0 tel que u = Àv, mais nous n’aurons pas besoin de cette précision ici. 

Sans surprises, la tangente est à peu près toujours donnée par la dérivée lorsqu'elle existe. Plus 
précisément nous avons le 


Théorème 21.50. 
Soit (1,7), un arc paramétré de classe C* (k > 1) ettoe I tel que 


(to) = Ÿ'{to) = = 7 (to) = 0 (21.153) 


et 
J® (to) 0 (21.154) 


pour un entier 1 < q < k. Alors + admet une tangente en (to) de direction y(9 (to). 


Démonstration. Le développement de (0) en série de Taylor autour de t jusqu’à l’ordre q est 


79 (to) 


Le ip Lise a — tol* ÉapevTag {te 


1 = A0) + (o)lé ol + 7400) 


+ e(blé — ol? 


où € est une application €: R — R” telle que lims_,4, e(t) = 0. En utilisant les hypothèses, nous 
éliminons la majorité des termes dans le développement (21.155) : 


1 
7) — (to) = a (to)lt — tol? + e(t)|t — tol?. (21.156) 


La direction de la droite qui joint y(t) à (to) est donc donnée par 


76 = (to) 7% to)lt — tolf + e(t)lé — to/? 


L (21.157) 
ICE) — vo) 17 2 (éo)lt — tolt + E(E)It — tol2]| 
et la limite lorsque t — to donne 2 (to) comme direction de la tangente. 
Lorsque le théorème s’applique, le vecteur 
(a) (4 
== ——— e 0) (21.158) 
79 (éo)| 


est appelé le vecteur unitaire tangent en y(to) à l’arc paramétré 7. 
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CorTgSoCun 
Corolaire 21.51. 
Si (1,7) est un arc paramétré de classe C! régulier (c'est-à-dire y'(t) Æ O0 pour tout t) alors l’arc 
admet une tangente en tout point et le vecteur unitaire de la tangente est donné par 


(21.159) 


pour tout t dans I. 
CorUnitTgtaugpnorma 


Corolaire 21.52. 
Si y = (J,yn) est un arc paramétré de classe C!, normal, alors le vecteur unitaire de la tangente 
au point YN(s) est donné par T(s) = yN(s). 


Démonstration. Nous devons démontrer que dans le cas d’un paramétrage normal nous avons 
yN(s)| = 1 pour tout s. Par définition, 


u 


U(ss9) = [° Inituldu= ss: (21.160) 
Par conséquent, 
: 1 di ! : s+h—s 
un x | bhtu)ldu = Tim ES = 1 (21.161) 


Cela implique que |y,(s)| = 1, et donc en particulier que (J, 7x) est un arc régulier. Le corolaire 
précédent montre alors que 7(s) = yN(s)/lyn(s)] = N(s). 


Exemple 21.53. 
Considérons la courbe (t) = (t?,t*), et cherchons la tangente en to = 0. En dérivant nous avons 
successivement 


= (21,31°) (21.162) 
V"() = (2,64). 

En posant { = 0, nous trouvons que (0) = 0 mais +”(0) = (2,0) 0. Le théorème nous dit donc 

que la direction de la tangente est horizontale. Nous pouvons faire le calcul directement : 


7) _ (to) (2,4) (5,6) (1,t) 


GE) — yo)l VA+E Vire V1+82 


dont la limite { — 0 est bien le vecteur horizontal (1,0). 

La figure 21.7 montre quelques tangentes, c’est-à-dire quelques vecteurs dans la direction +/(t) 
(pour les t £ 0, il ne faut pas aller à la dérivée seconde). Nous remarquons que de part et d’autres 
du sommet, les vecteurs ne sont pas dirigés dans le même sens. En tant que vecteurs de norme 1, 
ces vecteurs n’ont pas de limites quand t — 0. Ce sont bien les directions qui ont une limite, parce 
que la direction ne tient pas compte du sens. 


(21.163) 


À 


21.8 Un peu de topologie 


La proposition 21.54 donne une sorte de théorème des valeurs intermédiaires pour le cas d’une 
application à valeurs dans un chemin. 
PROPooJYGVooShNewy 
Proposition 21.54 ([1]). 
Soit une application continue et injective y: [0,1] — R". Nous posons EL = ([0,1]) sur lequel 
nous considérons la topologie induite !! de R”. 


11. Définition 7.24. 
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FIGURE 21.7: Quelques tangentes de la courbe (t) = (La d1rigParanTangente 


Nous supposons que y-!: I — [0,1] est continue !? 
Nous considérons un chemin a: [0,1] — R" tel que 
(1) à est continu, 
(2) a(0) = (0) 
(3) a([0,1]) cr 
(4) a(1) = y(to) pour un certain to € [0,1]. 
Alors pour tout t € [0, to], ü existe u € [0,1] tel que au) = y(t). 


Démonstration. Nous commençons par montrer que l’application @: [0,1] — Test encore continue 
lorsque nous voyons bien l’espace d’arrivée comme I muni de sa propre topologie et non comme 
IR? muni de sa topologie usuelle. 

Soit un ouvert © de l'; il existe un ouvert ©’ de R” tel que © = O'AT. Vu que a ne prend ses 
valeurs que dans l', nous avons &_!(T n O') = à !(O') et comme @ est continue pour la topologie 
de R?, la partie a -!(O") est un ouvert de [0,1]. 

Nous considérons donc l’application 


y lo a: [0,1] — [0,1] (21.164) 


qui est continue et vérifie donc le théorème des valeurs intermédiaires 10.89. Les hypothèses a(0) = 
(0) et a(1) = y(to) donnent 
(lo a)(0) = 0 (21.165a) 
(lo a)(1) = to. (21.165b) 


Donc pour tout te [0, to], il existe u € [0,1] tel que (+! o œ)(u) = t. En appliquant + des deux 
côtés, nous voyons que ce u vérifie a(u) = y(t) comme demandé. 


La proposition suivante dit essentiellement que la longueur d’un chemin est minoré par la 


longueur de son graphe. 
PROPooXENVooMvkTZW 


Proposition 21.55 ([1]). 
Soient a,b € R". Soit une application continue et injective y: [0,1] — R" telle que (0) = a et 
7() = b. 


12. Je ne suis pas certain que cette hypothèse soit indispensable. 
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Nous considérons maintenant un second chemin continu a: [0,1] — R” tel que a(0) = a, 
a(1) = b et a([0,1]) € 7(10,1]). 
Alors la longueur de ÿ minore celle de & : [(+) < (a). 


Démonstration. Pour rappel, la longueur d’un chemin est donné par le supremum des longueurs 
des lignes brisées reliant des points du chemin (définition 21.3). Soit une subdivision o de [0,1] et 
la « longueur » correspondante pour 7 : 


LN) = Dr) — vin). (21.166) 
i=1 


Nous allons construite une subdivision de [0,1] pour laquelle la longueur de a sera la même. De 
cette façon, le supremum pour & sera un supremum sur un ensemble plus grand que celui du 
supremum pour 7. 

Vu que le graphe de @ est contenu dans celui de 7, et que les points de départ et d’arrivée 
sont les mêmes, la proposition 21.54 nous donne que pour tout t € [0,1], il existe u € [0,1] tel que 
a(u) = y(+). 

Cela ne suffit pas à considérer une subdivision (u;);=1..n de [0,1] pour laquelle a(u;) = (ti) 
parce qu’il faut encore que les u; soient ordonnés. Vu que « n’est pas injective, il n’y a pas de 
garanties de ce côté. Nous posons : 


u; = min{x € [0,1] tel que a(x) = y(t;)}. (21.167) 


Montrons que ce minimum existe. Ce minimum existe parce que «& étant continue, l’ensemble des 
x sur lesquels a(x) à une valeur donnée est fermé (le complémentaire est ouvert par le théorème 
des valeurs intermédiaires). De plus cet ensemble est borné parce qu'il est inclus dans [0,1]. Il est 
donc compact et possède un minimum. 

Nous prouvons à présent que w;71 > uw. Nous avons a(u;1) = 7(ti+1) et il existe u dans 
[0, u;+1[ tel quea(u) = (ti) (proposition 21.54). Vu que u; est le minimum de tels u, nous avons 
u € [0, u;+1[. Cela prouve bien que u; < u;+1. 

Ces (u;);=1,..n forment une subdivision de [0,1] telle que a(u;) = y(t;). La longueur associée 
à la subdivision (u;) pour a est la même que celle associée à (t;) pour 7. 

Donc (a) > l(y). 


Ir 
NV 


FIGURE 21.8: La figure de la proposition 21.56. LabelFigYWxOAKkh 


PROPooVXDNooPZYKPr 
Proposition 21.56 ([1]). 


Nous considérons la partie suivante de R? : 
A2 = {(6sin(1/t))} ou (21.168) 
qui est dessinée est sur la figure 21.8. Ensuite nous posons 
A = {(0,0)} U 4. (21.169) 
La partie À est connexe, mais pas connexe par arcs. 


Démonstration. En plusieurs points. 
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(1) A2 est connexe La partie A2 est l’image de la fonction 


f:1]0,1] — R? 


t- (t,sin(1/t)). (21.170) 


Vu que f est continue et que son ensemble de départ est connexe, A2 est connexe (lemme 
7.209). 

(2) À est connexe Soient deux ouverts disjoints ©1 et ©2 dont l’union contient A. Nous 
supposons que (0,0) € O1. Si ©: contient B((0,0),r), alors il contient tous les points de 
la forme GE: 0) pour k assez grand. Ces points sont dans 42. 


Vu que O; contient des points de 42, il doit contenir tous les points de À: ; sinon les ouverts 
O1 et O2 contrediraient la connexité de A2. Finalement, À € ©: et À est connexe. 


(3) Connexité par arcs : le chemin Pour faire aller le chemin dans le bon sens, nous consi- 


dérons 
7: [0,1[ — R? 


ee (21.171) 


Si À était connexe par arcs, il existerait une application continue a: [0,1] — À telle que 
a(0) = (1,sin(1)) = 7(0) et a(1) = (0,0). 

(4) Minoration de la longueur de à Vu que a est continue, ses composantes le sont et vé- 
rifient le théorème des valeurs intermédiaires. Pour tout t € ]0,1{, il existe u € ]0,1[ tel que 
a(u) = 7(#). 

Par la proposition 21.55, la longueur de & est minorée par la longueur du chemin 7 entre 0 
et to pour tout t. 


(5) La longueur de + Vu que y passe une infinité de fois par zéro et par 1, il est possible de 
construire une subdivision de ]0, 1[ par rapport à la quelle la longueur de 7 est arbitrairement 
grande. 


(6) Conclusion Donc la longueur de a est minoré par tous les nombres, arbitrairement grand. 
Autrement dit, la longueur de a est infinie. Mais @ étant un chemin continu depuis un 
compact, cela est impossible. 

Nous déduisons qu’un chemin continu liant (1,sin(1)) à (0,0) en restant sur À est impossible. 


21.9 Repère de Frenet 


SecFrenet 


Dans cette section, nous ne considérons que des courbes dans R°. 
Proptausclataupzero 


Proposition 21.57. 
Soit y = (J,yn) un arc paramétré normal de classe C?. Alors pour toute valeur de s dans J, nous 
avons 


Ts) «T'(s)= 0 (21.172) 
où T(s) = yN(s). C'est-à-dire que la dérivée seconde est perpendiculaire à la dérivée première. 


Démonstration. Le paramétrage étant normal, nous avons 


nm 
ha? = D xs) = 1; (21.173) 
i=1 
ce qui implique, en dérivant les deux membres, que 
nm 
0 = 2 > dax (s), (21.174) 
i=1 


c’est-à-dire exactement yy(s) : 7N(s) = 0; d’où la thèse. 
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Remarque 21.58. 
Si nous n’utilisons pas des coordonnées normales, la proposition 21.57 n’est pas spécialement vraie. 
Prenons par exemple la courbe qui donne la parabole : 


7) = G,#) (21.175a) 
V() = (1,24) (21.175b) 
v"() = (0,2) (21.175c) 


Nous avons y/(t) : y”(t) = 4t. Par conséquent, la dérivée seconde n’est la normale à la courbe que 
en t = 0. Cela est une propriété très intéressante des coordonnées normales : la dérivée seconde 
d’une coordonnées normale donne un vecteur normal à la courbe, c’est-à-dire perpendiculaire à la 


tangente. 
DefCourbureNormleUnit 


Définition 21.59. 
Soit y = (J,ynN) un arc paramétré normal de classe C?. 


(1) Le vecteur unitaire tangent est donné par le corolaire 21.51 : r(t) = y'(t)/|y'(#)|. 


2) La normale principale est le vecteur T'(s). Le vecteur unitaire normal est le vecteur 
P D 


_ rs) 46) 
= EN PLON ER 


Nous déduirons une formule plus pratique en dehors des coordonnées normales en (21.204). 


(3) La courbure au point yn(s) est le réel 


c(s) = [7 (s)] = la (s)|. (21.177) 
Note : il y a une notion de courbure signée qui sera donnée dans la définition 21.73. 
(4) Le rayon de courbure est le réel 
Cd 1 
cs) xts)l 


Par la proposition 21.57, nous avons (5) : T(s) = 0. En combinant toutes les formules, nous 
avons les différentes expressions suivantes pour le vecteur normal unitaire : 


vs) = À ; : : = R(s)r/(s) = R(s}y4(s). PRESENT 


(21.178) 


Proposition 21.60. 
La fonction courbure s'écrit c = | y x 7. 


Démonstration. Par la proposition 11.32 nous avons : 


NI? = = Invl? (21.180) 


CN + Ina x Ne = Ill 


parce que, le paramétrage étant normal, || = 1. Mais {74,7% = 0, donc il reste |} x 7%|? = 


Wii F, von Eqcsnor 
c(s) = |rX(s)| = Irvts) x 4 (s)| CPAS) 


pour chaque s dans J. 


Définition 21.61. 
Soit s un point birégulier (c’est-à-dire yN(s) Æ 0 et yN(s) À 0) de l’arc normal 7 = (J, x). Le 
vecteur unitaire de la binormale est le vecteur 


Es) = rs) x v(s) (21.182) 
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Par leurs définitions, 7 et v sont unitaires, tandis que la proposition 21.57 montre qu’ils sont 
également orthogonaux. Les propriétés du produit vectoriel font que 5 est également unitaire, et 
simultanément orthogonal à 7 et à v. 


Définition 21.62. 
Le repère orthonormal {r(s),v(s), B(s)} est le repère de Frenet au point yn(s). 


Lemme 21.63. 
Le vecteur unitaire normal est donné par v(s) = B(s) x r(s). 


Démonstration. Ceci est une application de la formule d’expulsion (11.90) et de l’orthonormalité 
de la base de Frenet : 


BRT=ÎTX PV) x T= (2: SITE Tuer. (21.183) 


21.9.1 Torsion 


Décomposons le vecteur B'(s) dans la base de Frenet. Pour cela nous allons utiliser la proposi- 
tion 9.170 et montrer que B'(s) : r(s) = B'(s) : B(s) = 0, ce qui voudra dire que, dans la base de 
Frenet, les composantes de B/ le long de 7 et B sont nulles. Le vecteur B’ sera donc colinéaire à . 

D'abord, étant donné que la norme de B(s) est constante par rapport à s, nous avons 


0= THB)? = 28/(s) + 89). (21.184) 

Ensuite, nous dérivons la définition 5(s) = T(s) x v(s) en utilisant la formule de Leïbnitz (12.439) : 
B'(s) = T's) x v(s) + rs) x (5). (21.185) 

Mais r'(s) = yN(s) tandis que v(s) = ——— de telle sorte que 7/(s) x v(s) = 0. Nous restons 


donc avec B'(s) = r(s) x v'(s), ce qui prouve que B'(s) est perpendiculaire à 7(s) et donc que 


B'(s) : Ts) = 0. 


Le vecteur B'(s) est donc un multiple de v(s). Nous notons t(s) le facteur de proportionnalité : 


B'(s) = t(s)v(s). (21.186) 
DefTorsion 

Définition 21.64. 
Soit y = (J,yN) un arc paramétré normal de classe CŸ. La torsion de y au point yn(s) est le réel 


ts) = 18"(s)] = Ir(s) x (8). (21.187) 
Lorsque t(s) Æ 0, le réel T(s) = re est le rayon de torsion de y en yn(s). 


Étant donné que pour chaque s, l’ensemble {7(s),v(s),B(s)} est une base, il est naturel de 
vouloir décomposer leurs dérivées dans cette base. D'abord, par définition de c et de t, nous avons 


! nt 
ue = c(s)r(s) (21.188) 
B'(s) = t(s)v(s) 
Il reste à décomposer v/(s). Définissons @,, a, et ag (qui peuvent dépendre de s) par 
'(s) = a T(s) + œv(s) + asB(s). (21.189) 


En vertu de la proposition 9.170, nous avons 
ar = (v'(s),T(s)) = —(v(s),r'(s)) = —(v(s),c(s)r(s)) = —c(s), 
ay = {W'(s),v(s)) = 0, (21.190) 
ag = (v'(s), B(s)) = —(v(s), 8"(s)) = —{(s), 


21.10. HORS DES COORDONNÉES NORMALES 1885 


|? = 1. Si nous mettons ces résultats sous 


où nous avons utilisé le fait que {v(s),v(s)) = |v(s) 
forme matricielle, nous avons les formules de Frenet : 


T'(s) O0 c(s) 0 T(s) 
v'(s) |= | —c(s) 0  —t(s) | [ vs) |. (21.191) 
B'(s) O  t(s) 0 B(s) 


Proposition 21.65. 
Si s est un point birégulier, alors la torsion est donnée par 


LL Où X 2N) x TK 91 192 
SR CAO E TOI 

Démonstration. Par l'équation (21.179), nous avons y(s) = c(s)v(s), et par conséquent 
AN(S) = d(s)v(s) + c(s)v/(s) = c'(s)v(s) + c(s)[ — c(s)r(s) — t(s)8(s)], (21.193) 


où nous avons utilisé la formule de Frenet pour 7/(s). Par ailleurs, sachant le corolaire 21.52 et la 
formule de Frenet pour 7’, nous avons 


YN X YN = T(s) x T'(s) = r(s) x c(s)v(s) = c(s)B(s). (21.194) 


En combinant les deux dernières équations, et en se souvenant que la base de Frenet et orthonor- 
male, 


(iv X AN) AN(S) = —c(s)t(s), (21.195) 
et donc, en remplaçant c(s) par la formule (21.181), 
Lea à 
He) 0e . ri (21.196) 
EN UN 


21.10 Hors des coordonnées normales 
Remfougnormoupad 


Remarque 21.66. 

Notons que la définition de r est donnée pour tout arc C! régulier (7,7) par r(t) = y(t)/|7/(#)|. 
La propriété 7 = y} n’est valable que lorsque le paramétrage est normal. Les autres définitions 
ont toutes été données dans le cas d’un paramétrage normal. 


La remarque 21.66 nous incite à exprimer toute la base de Frenet en termes de 7 lorsque le 
paramétrage n’est pas normal. Étant donné que nous pouvons toujours faire le changement de 
variable +(t) = yn(o(t)) (proposition 21.46), il est possible d'exprimer les vecteurs 7, v et B ainsi 
que les réels c et t en fonction de 7 et de ses dérivées. 

Nous allons maintenant travailler à écrire les formules. 

Pour plus de facilité, nous collectons les définitions. Afin d’alléger la notation, nous n’exprimons 
pas explicitement les dépendances en s : 


Vecteur unitaire tangent Par le corolaire 21.52, r est donné par T = yy. 

Vecteur unitaire normal Par la définition 21.59, y est donné par v = EE 

Vecteur unitaire de la binormale Par la définition 21.59, 5 est donné par B = 7T x v. 
Courbure Par la définition 21.59, c est donné par c = |7’||. 


Torsion Par la définition 21.64, t est donné par t = |f’|. 
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Le schéma du changement de variable est 


term CPE LRU) 


À A 


se J 


La difficulté ne sera pas d'éliminer yN de toutes les formules, mais bien de se débarrasser des 
fonctions D qui arrivent quand nous exprimons y» en termes de 7, et en particulier lorsque nous 
voulons exprimer les dérivées de x en termes de 7 et de ses dérivées. 

Regardons d’abord comment les dérivées de yn s'expriment en termes de 7. En utilisant le fait 


que yn(s) = (r047")(s) et que [4(s)| = 1, nous avons 


! —1)/ 1(4—1 —1)/ ! 
t 
oe Tv(s) : SR AË) : 6 (s))(6 L G) : VC) Eqgp\gprunx 
ROIS CSI O) RS LCR ONCE LA) 
où nous avons utilisé le fait que D! étant croissante (parce que l'inverse d’une fonction croissante 
est croissante), (D-1)’(s) = [(4-1)/(s)|. Pourquoi écrivons nous |-1!(s)| et non |g-1(s)|? 
Pour la dérivée seconde, nous dérivons la relation (21.198) : 
ve" (s)) (TT) (s) 
I(p-1(s))] 


Le petit calcul suivant va nous permettre de simplifier cette expression : 


—1\/ _ (4-1 _ 1 _ 1 Eavpemue 
EYE = CNE) = 75 = or (PNE) 


YN(s) = 


ACROLCRO! (21.199) 


Donc 


RC) = De +705 [OI] (21.201) 


où il est entendu que t = @ !(s). Avec cette expression, nous ne nous sommes pas encore débarrassés 
de la fonction ®, mais nous allons voir que cela nous sera suffisant. 
Pour le vecteur unitaire tangent 7(s), nous avons donc immédiatement 


er or EaTape ve 


RETOII 


Ici encore il est sous-entendu que le t dans le membre de droite est lié au s du membre de gauche 
par t = @ !(s). Il est donc naturel de nous demander si nous avons gagné quelque chose, étant 
donné que la formule (21.202) contient encore la fonction ®. 
Géométriquement, le vecteur 7(s) est le vecteur normal unitaire de la courbe au point yn(s). 
En utilisant les relations du diagramme (21.197), nous avons en réalité yn(s) = n(o(t)) = 7(#). 
v(#) 


Le vecteur Lx représente donc le vecteur normal tangent au point y(t). 


Pour calculer la courbure, nous devons d’abord calculer le produit vectoriel 


à [2 d à ! d ! 
AO RO = D» (be +0 [P'EI]) 


JC) x +" (€) 
PAU] 


parce que le deuxième terme dans la parenthèse est un multiple de y/(t), de telle sorte que son 
produit vectoriel avec y/(t)/|7/(#)| soit nul. En prenant la norme, 


eqgProdve S'SEREPE, 


_ IC) x O1 EqCourburet 
GE EP CS 
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Encore une fois, cette équation nous enseigne que la courbure au point y(t) € IR° est donnée par 
le membre de droite, qui ne dépend que de t. 
Le vecteur unitaire binormal est donné par B(s) = T(s) x v(s). En utilisant (21.202) et (21.179), 


De Deus tin (21.205) 


Les formules (21.203) pour le produit vectoriel et (21.204) pour la courbure donnent ensuite 


see 1 CE) x PE 
RAU] cs) y) x +) 
Cela donne le vecteur unitaire binormal au point y(t) en termes de +/(t) et y”(#). 
La torsion demande d'utiliser la dérivée troisième de 7x1. Nous avons 


ACCRO) RIDE E 1020) C0) Ce 
2 ( 


+4 par (21.200) 


où v est un élément de Span{y”(@"1(s)), (97! (s))}. Le vecteur v est donc perpendiculaire à 
y x y" et donc à yy x YN à cause de la relation (21.203) qui montre que + x +” est parallèle à 
7N X 9N. De ce fait, lorsque nous calculons (+, x 7N) * 7, la partie v de 7Y n’entre pas en ligne 
de compte. 

Nous avons donc le calcul suivant, en remplaçant les diverses occurrences de 7 x y} par sa 


valeur (21.203) en termes de ”, 


4(s) = On X YN) © VN 
Ia *X VNI2 
_ _ On X 9%) 7 0) 51308 
! I ||2 ! t 2 ( s ) 
lv XP IE 
(+! < +") . 7" 
I x 7"? 


Dans cette expression, il est sous-entendu que tous les yN sont fonctions de s et tous les 7 sont 
fonction de t où s et t sont liés par s = @(t). 


Voici un théorème qui résume ce que nous venons de faire. 
THOooXOVRooRXtEuU 


Théorème 21.67. 
Pour tout représentant (1,7), les éléments métriques (r,v,B,c,t) au point y(t) s'expriment en 
fonction de 4), Y(#), V'(E) et v"(#). 


Lemme 21.68. 
Si est le graphe de la fonction y alors la courbure de y est donnée par la formule 


PAU] 
c(y(t)) = CE POLE (21.209) 


Démonstration. Nous avons : 


7) = (6, y(t)) (21.210a) 
V6) = (1y(6)) (21.210b) 
v'() = (0,y”(t)). (21.210c) 
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Il s’agit maintenant seulement d'utiliser la formule (21.204) en se souvenant comment on calcule 


un produit vectoriel l* : 
€1 €2 €E3 
yVxy=l1 y 01=y. (21.211) 
0 y” 0 


21.11 Tracer des courbes paramétriques dans R? 
SecTracerParmCourbe 

Nous allons maintenant voir comment les concepts introduits nous aident à effectivement tracer 
des courbes dans le plan. Les courbes que nous regardons sont de la forme y(t) = (æ(t),y(t)), et 
nous supposons que ces fonctions soient suffisamment régulières (disons trois fois continument déri- 
vables). Nous ne supposons pas que la courbe soit donnée en coordonnées normales, en particulier, 
7/(t) n’est pas le vecteur normal en 7(t). 

La notion clef qui va jouer est le cercle osculateur de la courbe + au point y(t). Sans rentrer 
dans les détails, disons que c’est le cercle qui « colle » le mieux possible la courbe. Le rayon de ce 
cercle est le rayon de courbure : 


ICS 
R(t) = (21.212) 
RUES AU] 
En pratique, le produit vectoriel se calcule comme ceci : 
Ex Ey 
VOX TE =IrE y 0[=(xy"—x"y)e. (21.213) 


æ"(#) y") 0 


Le centre du cercle osculateur va se trouver quelque part sur la normale. Le vecteur normal est 
donné par 


(21.214) 


où J est la rotation d’angle 3 : 


æ()\ [O0 1\/fx(t)\ ft) 
en (21.215) 
Cela nous laisse deux possibilités pour le centre du cercle osculateur : y(t) + R(t)n(t) ou bien 


y(t) — R(t}n(t). Il faut savoir de quel côté de la courbe est situé le centre du cercle osculateur. Il 
faut choisir le côté de la concavité, c’est-à-dire le côté de la dérivée seconde. 


FIGURE 21.9: De quel côté de ?/(£) se trouvent n(t) et —n(t) LabelFigquelCote 


La difficulté maintenant est de savoir qui de n(t) ou —n(t) est du côté de y”(t). Il faut savoir si 
n(t) est du même côté de la droite tangente que +”(t) ou non. Par construction, si nous regardons 


13. Définition 11.25. 
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la figure 21.9, le vecteur n(t) sera toujours à gauche de y/(t). Le fait que y”(t) soit à gauche ou à 
droite de y/(t) est donné par le signe du produit vectoriel +/(t) x +”(t). Si ce produit vectoriel est 
positif, il faut choisir —n(t) et si il est négatif, il faut choisir n/(t). 


Le truc pour obtenir le signe de x/y” — x”y" est de faire 


(x y): eu 


21.216 

x v Et 
Le centre de courbure sera donc situé à la position 
ATÉ 

Q(E) = y) — nf) Il pt x (21.217) 


ICE) x y/(6) 
Nous pouvons écrire cela plus explicitement en nous souvenant que 4 x y” = (x/y” — x”/y')e,, par 


! 1 . 
conséquent œ ee 


X7Y CHE 1 
xvTE ram Nous avons 


12 12 
/ T° +y 
Q,(t) = x(t) — y Nr mr (21.218a) 
12 12 
/ T° +y 
Quelques exemples de cercles osculateurs sont sur la figure 21.10. 
FIGURE 21.10: Exemple de cercles osculateurs. LabelFigOsculateur 


21.12 Courbes planes 


Définition 21.69. 
Une courbe y: [a,b] — R” est fermée si (a) = 7y(b). Elle est simple si y(t) Æ y(t') dès que 
tt'ela,b[ ettÆt. 

DEFooSAZTooZGQrQG 
Définition 21.70. 


Nous disons qu’une courbe fermée est continue, de classe C*, de classe C? ou autre condition de 
régularité si son extension périodique comme application y: R — R? a cette régularité. 


21.12.1 Angle 
LEMooUECMooNBDGiR 


Lemme 21.71 ([520]). 
Soient des courbes régulières + et o de classe C? de l'intervalle ouvert I vers R?. Soit @ € R tel 
que 


V'(to) : a(to) 
1Y/(to)|o’(to)| 
Y(to) : Jo’ (to) 
17 (to)|o’(£o)| 


= cos(60) (21.219a) 


= sin(#o). (21.219b) 
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Alors il existe une unique fonction différentiable 0: TI — R 


s — COS | a 
ON °C) (21.220a) 
AU BEESORE* 

OM — se (0). (21.220b) 


Démonstration. Il suffit de prendre 


(21.221) 


et 
__Y(®) : Jo’(t) 
RAGE] 


dans la proposition 18.57. Ces courbes sont de classe C1 parce que 7 et a sont de classe C?. 


g(t) (21.222) 


21.12.2 Courbure signée 


Nous avons déjà défini la courbure d’une courbe en la définition 21.59. Nous introduisons 
maintenant la courbure signée qui est propre à la dimension deux. 


DEFooTSJXooTIyRXf 
Définition 21.72. 
La structure complexe sur R? est l’application 
J:R?—R? 
(21.223) 
fe: y) Fr? UE #): 
DEFooJFWEooXcIVUs 


Définition 21.73. 
La courbure signée de la courbe y: I — R? (I est un intervalle dans R) est la fonction 


= 2070 EnooHoUG ons 


où J est la structure complexe de la définition 21.72. 


Cette définition est motivée par le fait qu’en identifiant IR? à C, l'application J revient à 
l'application z + iz. 
Si v,w € R? nous avons formellement 


uv x w=—(v : Jw)es. (21.225) 
En particulier pour tout v € IR? nous avons 
v : Ju = 0. (21.226) 


Lemme 21.74. 
Soir une courbe régulière y: [a,b] — IR? et un difféomorphisme h: [c, d] — [a,b]. Si nous posons 


o =70h alors 
L ka(u) = sgn (h'(u))k,(h(u)). ÉnooSqNMoe EE 


Démonstration. Nous utilisons la définition (21.224) de la courbure signée. La règle de dérivation 
en chaine donne : 


o'{u) = y'(h(u))h'(u) (21.228a) 
ou) = +’ (h(u))h'(u)? + (h(u))h"(u). (21.228b) 
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La numérateur de kç(u) est : 
(yo h)h? + J(y ohjh! + R'(y oh) - J(y - hjh (21.229) 
dont le second terme est nul parce que v : Jv = 0. Il nous reste donc 


ŒY (oh) JA oh) Le (Hu 
Kko(u) QUE PAYIE gn(h')k,(h(u)). (21.230) 


LEMooKPORo0oEGJCRm 
Lemme 21.75 ([520]). 
Si yn est un arc paramétré normal, alors 


TN (8) = k(s)JN(s). (21.231) 


Démonstration. Vu que le paramétrage est normal, 79 * 7N = 1, et en dérivant, 4% : 7» = 0. 
Donc 7} est un multiple de J7/. En tenant compte du fait que le paramétrage est normal, la 
courbure est 


k(s) = YN(s) * Jy(s). (21.232) 
En y injectant 4”(s) = À(s)Jy(s) nous trouvons 
Kk(s) = A(s)Jy(s) : Jy(s) = X(s). (21.233) 


Donc le facteur de proportionnalité est #(s). 


THOooDLDVooFQnLin 

Théorème 21.76. 
Soit une courbe y: I — R? de classe C?. 

(1) 7 est une partie de droite si et seulement si K(t) = 0 pour tout t. 

(2) y est une partie d’un cercle de rayon r > 0 si et seulement si |k(s)| = +. 
Démonstration. Si y est une droite, la dérivée seconde est nulle et la courbure est nulle. Supposons 
pour la réciproque que k(t) = 0 pour tout t. Nous utilisons un paramétrage normal de 7, ce qui 
ne change pas que la courbure reste nulle. Nous avons par le lemme 21.75 que +”(s) = 0 et donc 
l'existence de a, b € R? tels que y(t) = at + b. 

Passons au cas du cercle. Si + est un cercle, le paramétrage normal est 


ù (21.234a) 
) (21.234b) 


cOS( 7 
ms À cos(+) 
del TR sin(£) J” (21.234c) 
Avec tout cela nous avons «(s) = y/(s) : Jy/(s) = À. 


Nous supposons enfin que k«(t) = 1/R et que le paramétrage soit normal (encore une fois, un 
reparamétrage ne change pas la courbure lorsqu'elle est constante). Nous définissons la courbe 


B: [b,c] — R? 


te y(t) + RJ7y(t). Ce 


Nous avons 8'(t) = y(t)+ RJy"(t). Mais par le lemme 21.75 nous avons +” = kJ7y = £J7. Donc 
B'(t) = Y() —Y(# = 0. (21.236) 


Du coup B est constante : Bt) = a. Alors a = y(t) + RJ7y/(t) et en particulier 


Ir) — al = RIVE) = r. (21.237) 


Donc effectivement 7 reste sur un cercle de rayon r et de centre a. 
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DEFooFAENooXWgBmh 
Définition 21.77 ([520|). 
La courbure totale de la courbe y: [a,b] — IR? est le nombre 


b 
EQooTIFW 
= J «In (6) dt RooTINongE seed 
a 
où k est la courbure signée définie en 21.73. 
Nous nommons aussi nombre de tours de 7 le nombre Turn() = K/27. 


Lemme 21.78. 
La courbure signée ne change pas sous reparamétrage positif, et change de signe sous reparamétrage 
négatif. 


Démonstration. Soit la courbe +: [a,b] — IR? et un difféomorphisme h: [a,b] — [c,d]. Il s’agit 
d'intégrer la relation (21.227) en effectuant le changement de variables t{ = h(u) : 


b 
K= | ki (lat (21.239) 
d 
= J K(R(u)) |7/(h(u))|R'(u)du. (21.239b) 
Ce y —— 
Ko(u) 
En utilisant le fait que o’(u) = +/(h(u))h'(u) nous avons alors 
d o'(u) 
Kn= | Ko(u) W(u) h'(u)du (21.240a) 
d h'(u 
= J Ko(u)||o’(u)| Det du (21.240b) 
= sgn(h’)K, (21.240c) 
LEMDEFooLPWJooAnWZjb 


Lemme-Définition 21.79 ([520]). 
Soit une courbe régulière y: I — IR? de classe C? et to dans l’intérieur de I. Soit 0 € R tel que 


VA 
Y (to) 
= (cos(6o),sin(6o)). (21.241) 
PC) = | ) 
Alors il existe une unique fonction différentiable 0: T — R telle que O(to) = do et 
"(4 
ne é En) (21.242) 
(O1 (sin (0(#)) 
pour toutte I. 
Cette fonction est l’angle de y déterminé par 60. 
Démonstration. Soit B(t) = (4,0); alors B/(t) = (1,0) et nous avons 
Ye = (21.243a) 
JF = (21.243b) 
Par la proposition 21.71 il existe une unique fonction 0: 1 — R telle que (to) = 60 et 
Pr 
cos (O(t)) = = (21.244a) 
CO) = Dome © 1 
: V0 
sin (0(t)) = = ——. 21.244b 
CE) = ner © T1 Co 


Une telle fonction est bien celle que l’on demande ici. 
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Lemme 21.80. 


1893 


LEMooWLAUooKetUiW 


Si y est une courbe régulière de classe C?, alors sa courbure et son angle vérifient la relation 


DE) = IT (IEC). 


Démonstration. Par définition de l’angle (lemme 21.79) nous avons 


ve) = (cos sin 
Prer — (6050085200) 


Dérivant cela, 


J7( 
EXO 


= #'(#) 


(21.245) 


(21.246) 


(21.247a) 
(21.247b) 


(21.247c) 


Nous prenons le produit scalaire de cette égalité avec J'en tenant compte du fait que y + J+y = 0: 


M, J ! 0! 
s: : 2 _ : Jy N JT. 
(ral (eAl 


En remarquant que Ju : Ju = |v|? nous trouvons #/|y/| = |y|?#k, et done 


DE) = |y()Ix(E), 
ce qu’il fallait prouver. 
Ce lemme nous fournit la formule attendue pour la courbure totale. 


Lemme 21.81 ([520]). 


(21.248) 


(21.249) 


Soit une courbe régulière de classe C? y: [a,b] — R?. Sa courbure totale * est donnée par 


K = 0(b) — O(a). 


(21.250) 


Démonstration. Il suffit de remplacer dans la définition (21.238) de la courbure totale l’intégrande 


par son expression du lemme 21.80 : 


b b 
K = | ki lt = | e(bat = 8(e) — 6(a) 


a 


par le théorème 14.263. 


21.12.3 Degré, indice et homotopie 


La définition de l’indice d’un chemin par rapport à un point est 26.50. 


Lemme-Définition 21.82. 


(21.251) 


DEFooTKBUooNVcheO 


Soit une application continue D: $! — Sl. Un relèvement de 6 est une application continue 


p: R—UR une application continue telle que 
, cos on) 
cos(t),sin(t)) = s ' 
6(cos(E)sn(9) = (an EU 
Le degré est l’entier deg(@) tel que 


g(2T) — p(0) = 2deg()r. 


Ce nombre ne dépend pas du choix du relèvement 4. 


14. Définition 21.77. 


(21.252) 


(21.253) 
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Démonstration. Soient w1 et 42, deux applications qui satisfont les contraintes. Nous avons une 
fonction continue n: $! — R telle que 


pit) — go(t) = 2rn(t). (21.254) 
La fonction n ne pouvant prendre que des valeurs entières et étant continue, elle est constante. Par 
conséquent 
p1(2T) — #1(0) = p2(2T) — w2(0), (21.255) 
ce que nous voulions. 
DEFooUCUQooUAlbLo 


Définition 21.83. 
Soit une courbe fermée y: [0,L] — IR? de classe C!. Nous posons 


D. (t) = =. (21.256) 


où Y(u) = (Eu). L'indice de rotation de 7 est le degré de ®., c'est-à-dire 
Ind(y) = deg(®.). (21.257) 


Notons que dans cette définition, ®, n’est rien d’autre que le vecteur unitaire tangent à 7, 
ramené à [0,2x|. 
PROPooXHSDooDDn1JQ 
Proposition 21.84. 
Pour une courbe fermée de classe! C?, l'indice de rotation est égal au nombre de tours. 


Démonstration. Soit y: [0, L] — IR? une courbe vérifiant les hypothèses. Par définition, Ind(-) = 


deg(®,) où . : 
do 10 (au) EQOoGTAPORpRGERG 


où nous avons noté Ô l'angle tournant 5 de 4 et 4 celui de +. Vu que Ô vérifie les hypothèses de la 
définition 21.82 nous pouvons calculer le degré de &, par 


27 
deg(®.) = (62) — à(0)) = : D(s)ds. Se 1) 


Il faut trouver le lien entre 4 et . Pour cela nous notons que 


(0 _ (44) (21.260) 


OI 


En comparant avec (21.258) il vient 
Ô(t) = 0(=—+) (21.261) 


ÿ'(s) Ly ( = s) (21.262) 


"27 \2%— 


et 


Le changement de variables { = ds est donc tout vu dans l'intégrale (21.259) : 


deu(e,) = D (eau = [ouate LP '(Oin(Otar = Tamntr) (21.263) 
Fe 27 Jo 27 27 27 Jo ouh : os ‘ 


où nous avons aussi utilisé le lemme 21.80 qui donne le lien entre #/ et K. 


15. La dérivée seconde arrive dans la définition de la courbure; il faudrait donc supposer au moins C? pour avoir 
la continuité de la courbure. 
16. Définition 21.79. 
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Les définitions à propos d’homotopie sont 20.74 et 20.75. 
LEMooTDTAooCRSYzI 


Lemme 21.85 ([1]). 
Soit un ouvert Q de ©. Soit un chemin continu y: [a,b] — Q. Soit une boule B contenant y([a, b]) 
ainsi que le segment joignant y(a) et y(b). 

Alors + est homotope !T au segment joignant y(a) et y(b). 


Démonstration. Notons d: [a,b] — ( le segment de droite joignant (a) à +(b). Nous notons aussi 
4 le segment joignant x à y et paramétré sur [0,1] : 


lu: [0,1] — Q 
sy: (D, 1] (21.264) 
te (1—t)x +ty. 
L’homotopie entre 7 et d est alors donnée par 
H:1[0,1|x{a,bl —Q 
Etes Pl (21.265) 
(5,1) + La (s). 
LEMooQNFCooWorCxN 


Lemme 21.86 ([201)). 
Soit un ouvert Q de C. Tout chemin dans ( est homotope à extrémités fixées ® dans Q à un chemin 
droit par morceaux. 


Démonstration. Nous allons utiliser le lemme 10.23 en considérant $S € [a, b] définie en disant que 
te S soit si { = a soit si le chemin y: [a,t] — Q est homotope à un chemin droit par morceaux à 
extrémités fixes. 

Nous prouvons que S est inductif (définition 10.22). 


(1) ae S Le point a est dans S par définition. 


(2) Site S Supposons quete [a,b[ n S, et cherchons s > t tel que [t,s] € S. Considérons une 
boule B = B(7y(t),ô) inclue dans (. Vu que + est continue, l’application u = |(#) —7(t+5s)| 
est continue. Pour s = 0, cette fonction est nulle. Il existe € > 0 tel que cette fonction reste 
plus petite que Ô, et donc tel que 


y(Ht+4]) € B(76),6) € Q. (21.266) 


Le segment de droite L,(4,,(4+2 est donc dans Q et la partie 7: [t,t + €] — Q est homotope 
à extrémités fixée à ce segment (lemme 21.85). 

En joignant ce segment aux segments de droites homotopes à (La, t)), nous avons des seg- 
ments de droites homotopes à +([a, s]). Donc [a, s] € S. 


(3) Sifa,t[c S Nous prouvons que t € $. Nous considérons 6 > 0 tel que B(y(t),6) € Q. 
Nous considérons également € > 0 tel que t — € > a. Par hypothèse, t —-e € S, et il existe 
une homotopie à extrémités fixées entre des segments de droites et y: [a,t + e] — Q. Nous 


complétons ces segments par le segment /,(_4).,(# et voila. 


Donc $ est inductif, et nous en déduisons que S = [a, b]. 


PROPooZTAKooHqtnZ;j 
Proposition 21.87 (Homotopie, degré et indice[520]). 
Îl y a deux résultats à ne pas confondre. 
(1) Si p;: S1 — S1 sont homotopes, alors deg(p1) = deg(2). 
(2) Si y: [0, L] — R? sont homotopes, alors Ind(-1) = Ind(-). 


ITEMooLEHFooXEyTHY 


Démonstration. Nous allons décomposer la preuve en deux parties. 


17. Définition 20.75. 
18. Définition 20.75. 
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Le degré pour les applications S! —> S! Soient deux applications homotopes +: 51 — 
St. Si F est l’homotopie !” entre 0 et y1, nous posons y(t) = F(u,t) qui est encore une 
courbe fermée +,: $1 — S1l. Nous pouvons donc considérer le degré de +,. C’est un entier 


nu qui vérifie 
Au(27) — Fu(0) = 27nu. (21.267) 


Le membre de gauche est une fonction continue de u ; dans le membre de droite n, ne pouvant 
prendre que des valeurs entières, elle est alors constante. 


Indice de rotation pour des courbes dans R? Soient maintenant 4 et y1 deux courbes 
homotopes de [0, L] dans IR?. Par définition, Ind(+;) = deg(®.,). Prouvons alors que ®., et 
homotope à ®.,. De cette façon, la première partie de la preuve conclura à 


Ind(y0) = deg(®.,) = deg(®.,) = Ind(). (21.268) 
Nous savons que 
t(L 
3-t 
D, — VG) (21.269) 
Ir (xt) | 
donc en posant 
1 (L 
3=t 
dp(u,t) — ul Zu ) (21.270) 
RAE] 


nous avons une homotopie entre ®., et ®... 


THOo00EQWOo0oBCRMMZ 


Théorème 21.88 ([520]). 
Pour une courbe simple fermée de classe C? dans R?, 


(1) le nombre de tours? vaut +1, 


(2) la courbure totale vaut +27. 


Démonstration. Soit une telle courbe 7 et son image l'. Notons tout de suite que les deux points 


sont équivalents parce que X = 27 Turn(). 


(1) 


Choix d’un point et d’une tangente 


Si £ est une droite dans le plan, soit p le point de [° le plus proche de £. Il n’est peut-être pas 
unique, mais la parallèle à £ passant par p est une tangente à l' telle que tout l se trouve 
d’un seul côté de £,. Pour voir cela, il suffit de choisir un système d’axes pour lequel £ est 
l’axe y = 0. La distance entre £ et les points de [est donnée par 7,, et donc les extrémums 
sont atteints là où Le = 0, c’est-à-dire pour les points sur lesquels la tangente est parallèle à 
{. 

Étant donné qu’il y a (au moins) un maximum et un minimum distincts, nous pouvons choisir 
le point p de telle sorte que pour tout point q € [’, l'angle du vecteur qg — p soit entre ao et 
ao + 7 et non entre ao — 7 et æ. Ce choix revient à choisir p de telle sorte que L° soit d’un 
côté ou de l’autre de 4,. 

Pour simplifier les notations plus tard nous choisissons {, horizontale, de telle sorte que 
ao = 0, et que Fest au dessus de £,. Les angles des vecteurs q — p pour q € l sont donc tous 
entre OÜ et T. 


Définition de Y» 


Soit L la longueur ?! de + et B, un paramétrage de telle que (0) = p. Nous considérons le 
triangle 


T = {(t1,t2) e R?° tel que 0 < #1 < t2 < L} (21.271) 


19. Définition 20.74. 
20. Nombre de tours et courbure totale, définition 21.77. 
21. Définition 21.3. 


21.12. COURBES PLANES 1897 


et l'application sécante Z: 7 — S1 définie par 


8'() 
DO sit =t2=t 
X(t1,t2) — TB"(0 | si Li = 0 et to = L (21.272) 
ADI Éd 
182) — 8(t1)| 


Continuité de 5 Nous devons prouver les limites ?? suivantes : 


B(t1) — 8(t2) _ B'(t) SUBEQOoDXJDe oO x BI 
mate 186) 8@) FE PS 


O<t1<t<t2<L ) ! 
B(t1) — 8(t2) _  B'(0) SUBEQoOUXGSQoXHEHEI 
l 

GaeC2 184) — 8) 180) 2 


Nous commençons par (21.273a) en multipliant et divisant par t2 — {1 : 


Bft2) — B(t1) Bt) — B(t1) ta à 
|8(t2) — B(t1)| t2—t1  |B(t2) — B(t)] 
Si chacune des limites des deux facteurs existent dans R, la limite du produit sera le produit 


des limites. Pour le premier facteur nous développons £(t2) autour de t = t1 via la formulation 
(12.1281) : 


(21.274) 


B(t2) = B(t1) + (to — t1)8"(t1) + a(te — #1) (21.275) 
où a est une fonction vérifiant lims_,0 a(t)/t = 0. Nous avons à calculer la limite de 
to —t1)B'(t to —t to —t 
(2 — t1)8/(1) + a(te — 1) B'(1) + af) (21.276) 
tt tt 


Prendre la limite (t1,t2) — (t,t) donne bien B/(t) parce que B est de classe Cl. En ce qui 
concerne la limite de la deuxième partie, nous allons la faire plus en détail pour la limite 
(21.273b). 

La limite (21.273b). Nous prenons la prolongation périodique de B. Alors si t2 = L — € nous 
pouvons écrire B(—e) au lieu de S(t2). Nous développons S(t1) autour de t = —e (parce que 
t1 est petit) : 


B(t1) = B(—e) + (41 + e)B(—e) + ati +6). (21.277) 
Après multiplication et division par t1 + €, la première limite à calculer est celle de 
B(—e) — 8(4) / af +e) 
_ 21.278 
t1 +€ À s à h+e ? 


pour (e,t1) — (0,0). Cela donne bien —//(0). La seconde limite à calculer est celle de 
ti +e : t1+€ : t1+€ 
18e) — 8) 1-1 +98(-e) —-afti+e)]  I(1+e8 (0 +a( + 
Nous calculons la limite de l'inverse (qui, si elle est non nulle donnera la réponse en inversant 
à nouveau) en nous souvenant de la formule 


[a — Jb]] < [a + b] < [a + [b|]|. (21.280) 


(21.279) 


Nous avons l’encadrement 
(1 + e)8(—e) — lat +0)|] - I@ +989 + a +e)| 


(21.281a) 
t1+€ h+e 
HO EE bb + 
<lG@ 989 +la(n +o)|] (21.281b) 
t1+€ 


Les limites des deux extrêmes existent et valent /3/(0) ; la règle de l’étau 12.224 conclu. 


22. Limite au sens de la définition 7.102, en sachant qu’elle est unique par la proposition 7.105. 
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(4) Deux chemins homotopes Nous considérons dans 7 les points À = (0,0), B = (0,2) 
et C = (L, L). Nous allons considérer le chemin direct de À à C et celui passant via B. Et 
comme ces chemins doivent être paramétrés de 0 à 27, il faut faire un peu attention. Nous 


définissons les chemins 


GR (21.282) 
par 
CQ[L, LAN PGLEn | FO | 
A A) ra do mo 
_ fE(0,£4) i0<{t<T 
CRETE sir <t< 27 PAESEUE) 


où nous avons repris les notations de la définition 21.83. Notons que pour 02, en t = x les 
deux expressions donnent 
B'(0) 


oa(x) = 2(0,L) = RETOIÉ 


(21.284) 


Ce sont des chemins fermés parce que 


B'(L) 8'(0) 

o1(27) = Y(L, L) = = = X(0,0) = o1(0). (21.285) 
I8/(L)1  18(0)1 

Notons que dans toutes ces définitions et calculs, nous avons utilisé de façon assez cruciale 
la définition 21.70 pour définir la dérivée de 6 en t = 0. 


Les chemins o1 et o2 sont homotopes par construction. 


S 
[SA 
—_— 


Indices et degrés La proposition 21.87(1) nous donne deg(o1) = deg(o2). Nous avons 
alors la chaine d’égalités 


deg(o2) = deg(o1) = deg(®) = Ind(8) = Ind(y) = Turn(y) SFR 0RES 


où les justifications sont : 
(5a) deg(o2) = deg( 
(5b) deg(o1) = deg( 
(5c) deg(®3 = Ind(f5) par définition 21.83 de l'indice. 
( 


5d) Ind(B) = Ind(y) par invariance de l’indice sous reparamétrage. 


01) par homotopie : proposition 21.87. 
3) parce que o1 = Pg. 


(5e) Ind(y) = Turn(y) par la proposition 21.84. 
Il nous reste à montrer que deg(o2) = +1. 


(6) La géométrie de o2 Notons que par définition les valeurs de o2(t) sont les vecteurs (uni- 
taires) joignant p aux points de l° lorsque 0 < t < 7, et les vecteurs inverses pour 7 < t < 2. 
Plus précisément nous avons, si 0 < a < T : 


Lo Lo - FE - 8 
PO EU TO Te(Ee) = BCD) Ci 
et 
Lol, n BU - (0) 
oa(r + a) = (Ta, L) 18) = #0) (21.288) 


En sachant que B(0) = B(L) nous avons alors 
oa(r + a) = —o2(a). D 6) 


Notons aussi que le fait que 7 soit une courbe simple assure que le numérateur et le dénomi- 
nateur de o2 ne s’annulent pas autrement que pour t = L ou t = 0. 
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(7) Un relèvement pour o2 Ces propriétés motivent cette idée pour le relèvement de 02 : 


0: [0,27] — [0,27| 


(21.290) 
tr l’angle du vecteur o2(t), 


avec 0(27) définit par continuité. Nous allons cependant voir, en étant plus prudent, que 
cette définition n’assure pas la continuité (surtout en { = 7). 

Soyons donc plus prudent et construisons Ô petit à petit. 

Étant donné que , est tangente à T au point p, la droite £, est parallèle à B/(0), et l’angle 
entre 4, et B/(0) est soit 0 soit x. Donc 4(0) devrait valoir soit 0 soit x. 


Nous commençons par définir ceci : 


0: [0,7[ — [0,7] 


21.291 
tr angle de o(t) = arccos (o2(t)x). ) 


C’est le choix d’avoir £, horizontale et [au dessus de {, qui nous assure que pour tout 
te [0,x|, l’angle de o2(t) peut être choisi entre 0 et x. De plus cette fonction est continue 
en tant que partie de la fonction arccos: [—1,1] — [0,7] qui est elle-même continue par le 
lemme 7.213. 


Le fait que 0 soit continue est assuré par le fait que o2 est C®. 
(7a) Si 0(0) = 0 
Cela correspond à la situation des vecteurs rouges sur la figure 21.11. 


Vu que o2(x) = —02(0), l’angle de 02 en t = 7 est le supplémentaire de celui en t = 0. 
Mais pour 0 < t < 7, O(t) prend ses valeurs entre 0 et 7, le seul supplémentaire de 0 
à être disponible est 0(x) = x (et non 0(x) = —7 par exemple). Nous définissons donc 


O(x) = x pour la continuité. 

En ce qui concerne les x < { < 27 nous savons que o2(7 + a) = —o2(a). Les angles sont 
donc les supplémentaires de ceux pour 0 < t < 7m. Pour assurer la continuité en { = x 
nous sélectionnons la place |r,2x]; et nous définissons 


0: ]m,27[ — ]r,27] 


21.292 
tr angle de o2(t). ) 


Le nombre 0(27) est défini par continuité. Il doit valoir 0(27T) = 2x. 
La fonction 0 ainsi définie est un relèvement pour 02, et le degré peut être calculé : 


deg(o2) — D (#2) — 0(0)) = 1. (21.293) 
bp 
P 


FIGURE 21.11: Les vecteurs représenant o2 dans le cas où f/(0) est dans le sens de £,, ou dans le 
sens inverse. Pour le sport nous avons dessiné la situation avec une droite / quelconque plutôt que 
horizontale. LabelFigERPMooZibfNOiU 
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(7b) Si 0(0) =x Cela correspond à la situation des vecteurs bleus sur la figure 21.11. 
Alors O(x) = 0 est obligatoire parce qu’il doit être supplémentaire à 4(0). Les angles 
atteints par o2(t) pour t € ]r,27| sont encore les complémentaires, mais cette fois la 
continuité en { = x nous impose de les chercher dans |—7,0] et nous définissons 


8: ]r,27[ — ]-x,0] 


21.294 
tr angle de o2(t). ) 
Par continuité nous devons avoir 0(27) = O(7m) — x et donc 0(27) = —7. 
Le degré de 02 est alors 
1 
deg(o2) = 5 (6(27) — 0(0)) = —1. (21.295) 


(8) Conclusion 
Nous avons montré que le degré de o2 est 1 ou —1, et en remontant les égalités (21.286) nous 
déduisons que Turn(+) = +1. 


21.13 Courbes fermées planes 


21.13.1 Cercle circonscrit 


La proposition suivante est dans le même esprit que l’ellipse de John-Loewer **. 
PROPDEFo0oCWESooVbDven 
Proposition-Définition 21.89 (Cercle circonscrit|583, 1]). 
Soit une courbe fermée simple et continue y: [0,1] — IR?. Soit L son image. Il existe un unique 
cercle de rayon minimum contenant l. Ce cercle est le cercle circonscrit à 7. 


Nous nommons C' ce cercle circonscrit à y. Il a les propriétés suivantes : 
(1) L'intersection C NT contient au moins deux points distincts. 


(2) Tout arc de C plus long que sa moitié intersecte T. 


Démonstration. Division de la preuve. 


(1) Existence L'application y étant continue, l’ensemble F est compact (théorème 7.211). Nous 
considérons l’ensemble Q des formes quadratiques de la forme 


Gar(æ) = [a x|° -r° (21.296) 


avec a € R? et r € R. Nous mettons sur cet ensemble la topologie de R? x R = R*. Le 
nombre qar(æ) est continu en a, r et x. Soit A l’ensemble des formes quadratiques de cette 
forme et vérifiant 

q(r(é)) < 0 (21.297) 


pour tout te [0,1]. 
Cet ensemble À est non vide parce que [est compact et donc borné; il existe donc une boule 
qui contient l'en son intérieur. 
Montrons que À est fermé dans Q. Si qar # À alors il existe {o tel que Qar (+(to)) > 0. Par 
continuité, il existe un voisinage de (a,r) dans R° et donc de q,r dans Q tel que qu,» (Y(to)) 
reste strictement positif pour tout (a/,r’) dans ce voisinage. Le complémentaire de À dans Q 
est ouvert. Donc À est fermé. 
L'ensemble 

B = {r > 0 tel que 1a tel que qur € A} (21.298) 


est fermé **. La partie B est évidemment borné vers le bas. De plus r = 0 n’est pas dans cet 
ensemble. Il possède donc un minimum strictement positif. Le cercle correspondant donne 
l’existence. 


23. Proposition 17.125. 
24. Lemme 7.307. 
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(2) 


Unicité 
En ce qui concerne l’unicité, si F est contenu dans les boules B(a, R) et B(b, R) alors 
TE B(a,R)n B(b,R). (21.299) 


À 


I 


Nous choisissons les axes comme indiqué sur le dessin et nous montrons que l’intersection 
est dans le cercle de centre © et de rayon |OJ| < R. Soit Q un point de l’intersection; par 
symétrie il est suffisant de supposer Q4 < 0 et Q,, > 0. Vu que Q est dans le cercle de centre 
B et de rayon À, il doit satisfaire 


(Br -Q:) +Q<R. (21.300) 
D'autre part le point 1 est d’abscisse Z; = 0 et d’ordonnée donnée par te = R? — B2. 
Nous devons prouver que Q2? + @ < 12 . I s’agit simplement de calculer 
Q$ + QŸ < Q$ + R° — BE + 2B:Qx — Qÿ = R° — B£ +2B:Qz < R° — B£ = If (21.301) 


parce que B, > 0 et Qzx < 0. 
Nous concluons que l'est inclus dans un cercle de rayon plus petit que À et donc que R n’est 
pas minimum. D'où l’unicité. 


Au moins deux intersections 


Nous nommons Cle cercle circonscrit à 7, et nous écrivons, pour pe l 
r(p) = d(p,C) (21.302) 


la distance entre p et C. Cela est une fonction continue sur le compact l°. Elle atteint donc 
ses bornes sur l. 
(3a) Impossible d’avoir zéro intersection 


Si CnT = @ alors r(p) > 0 pour tout p et le minimum est également strictement 
positif. Soit ro ce minimum : 


ro = min{d(p, C) tel que pe l'}. (21.303) 


Alors le cercle C> même centre que C' mais de rayon ro/2 n’intersecte pas non plus T. 
En effet soient pe let s € C2. Nous notons s/ le point de C situé sur la demi-droite ps. 
Nous avons 


d(p, s) > d(p, s/) - n > d(p,C)— > (21.304a) 
To To 
TR — 
To 9 9 (21 304b) 
> 0. (21.304c) 


Cela étant valable pour tout s € C2 (et d étant continue en s sur le compact C2), nous 
en déduisons que d(p, C2) > 0 pour tout pe FF. Donc F n C2 = . 
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(3b) Impossible d’avoir une seule intersection 


SiCnT = {q} alors un choix d’axe place le centre de C en (0,0), le point q en (1,0) et 
fixe le rayon de © à 1. Vu que [ne coupe C qu’un un seul point, situé tout à droite, il 
devrait être possible de décaller un peu C pour le « décoller » de g tout en continuant 
à ne pas toucher l'en les autres points. 

C’est ce que nous allons faire maintenant. 


Pour p € F nous notons r(p) la distance entre p et le point de C' situé sur sa gauche, 


c'est-à-dire, si p = (Px; Py); . 
= ne u æ _. EQooGWRDopReugi 


Cela est encore une fonction continue sur [ qui atteint son minimum valant ro. Nous 
considérons maintenant le cercle C2 de centre (®,1), et nous prouvons que T° est dans 
C2 (au sens dans la boule dont la frontière est C2) et que C2 NT = G. Donc C2 retombe 
dans un cas que nous avons prouvé être impossible. 

Soit pe l. Si pe C9, alors p — (r0/2,0) € C. Cela est impossible parce que la distance 
entre p et le point à sa gauche sur C est au moins ro. Donc On = G. 

Le point q est dans C2 parce que (1,0) € B((r0/2,0),1). Par continuité de C2 et de F, 
tous les points de [' sont dans C2. Sinon il y aurait une intersection. 


(3c) Si on en veut plus Nous avons fini de démontrer qu’il y à au moins deux intersec- 
tions. 


Pour le sport, notez que tout nombre de points d’intersection entre C' et l'est possible 
à partir de 2. Pour en avoir deux, prendre une ellipse, et pour en avoir plus, prendre 
des polynômes dont les angles sont un peu modifiés de façon à rester C1. 


(4) Intersection avec les demi-arcs 


Supposons, en fixant encore les axes, que le cercle circonscrit soit encore centré en (0,0) et 
que [' n’intersecte pas le demi-cercle x < 0. Alors pour tout p € [' la distance entre p et ce 
demi-cercle est strictement positive. Il y a un minimum ro. En décalant le centre du cercle 
de ro/2 vers la droite, nous obtenons un nouveau cercle contenant T mais ne l’intersectant 
pas. 


21.13.2 Description locale 
DEFooVQODooJSNYLw 


Définition 21.90. 
Une courbe plane différentiable est convexe si son graphe est en tout point d’un seul côté de sa 


tangente. 
LEMo0GEVE0o0HxPTMO 


Lemme 21.91 (|[1]). 
Soit une courbe simple, convexe y: [0,1] — IR? que nous supposons être de classe C!. Nous notons 
T l’image de y. Alors T est localement le graphe d’une fonction convexe (définition 17.79). 


Démonstration. Soit pe let L, la tangente à l'en p. Nous considérons un système d’axe centré en 
p de telle sorte que l, soit l’axe des abscisses et l’axe des ordonnées soit dirigé de tel manière que l 
se trouve dans la partie y > 0. De plus nous paramétrons 7 de telle sorte à avoir (0) = p = (0,0). 

Vu que l, = y = 0 est la tangente à l nous avons +,,(0) = 0 et +,(0) > 0. Nous en déduisons 
que 7, (t) > 0 pour tout t € B(0,6) pour 6 suffisamment petit. Nous posons alors 


g(x) = w (13 " (x) (21.306) 


qui est bien définie parce que y; est une bijection entre B(0,6) et son image. La fonction g est 
continue par le théorème de la bijection 12.54, et même dérivable par la proposition 12.190. De 
plus, vu la formule (12.466), la fonction g ! est de classe C! parce que (g_!)’ est une composée 
d'applications continues. 
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(1) Si g est C? Dans ce cas, g” ne peut pas changer de signe, sinon la tangente coupe le graphe. 
Par positivité de g (et le fait que g(0) = g/(0) = 0), il n’est pas possible d’avoir g” < 0 partout. 
Donc g” > 0 partout. Cela prouve que g est convexe par la caractérisation 17.87. 

(2) Si g est seulement de classe C1 Le graphe de g correspond au graphe de l'. Nous mon- 
trons que g est convexe en utilisant la caractérisation de la proposition 17.92. 


La tangente au graphe de g en x = 0, que nous notons lo, est la tangente à l'en t = +, !(xo). 
Le graphe de g, qui est une partie de [se trouve donc d’un seule côté de Lo. 
Nous nous restreignons g à un compact 1 et nous considérons la fonction 


da(z) = g(x) — (x) (21.307) 


qui donne la distance entre le graphe de g et la tangente à g en x = a. Cela est une fonction 
continue en x et en a. Le graphe de g est au dessus de la tangente en x = 0 (par construction 
des axes). Supposons que le graphe de g soit en dessous de la tangente en x = x2. Alors nous 
avons, pour tout x : 


do(x) > 0 (21.308a) 
dr, (x) < 0. (21.308b) 
Nous posons 
s(a) = sup d,(x), (21.309) 
xel 


qui est une fonction continue par la proposition 12.36. L'application s vérifie s(0) > 0 et 
s(x2) < 0. Il existe donc m € [0,x2] tel que s(m) = 0. À ce moment nous avons g(x) = l,(x) 
pour tout x € I et donc g est une droite, et en réalité toutes les inégalités sont des égalités. 
La fonction g est alors bien convexe (mais pas strictement). 


21.13.3 Enveloppe convexe 
PROPooWZITooTFiWsi 


Proposition 21.92 ([584, 1]). 
Soit une courbe simple, fermée et convexe y: [0,1] — IR? que nous supposons être de classe C?. 
Nous notons T l’image de y. Alors il existe un convexe D tel que OD =T. 


Démonstration. Pour p € T nous notons /, la tangente à Ten p et H, le demi-plan (fermé) 


contenant l. Nous posons EQooDYFTooC 
0 REoDYT on 
per 


Cet ensemble est convexe comme intersection de convexes ?* et fermé comme intersection de fer- 
més 26, Nous prouvons que L = 0D. 

L'inclusion l € 0D est la plus facile. Si p € l° alors p est dans chacun des Æ, et donc dans D. 
De plus tout voisinage de p contient des points en dehors de H,,, donc p n’est pas dans l’intérieur 
de D. Ce dernier étant fermé, un point hors de l’intérieur est sur le bord. Ergo p € 0D. 

Pour l'inclusion inverse, soit p € CD. 

(1) Il existe q tel que pet, Vu que D est fermé, le point p est dans D, et donc dans tous les 
H,. Supposons qu’il soit dans l’intérieur de tous les H,. Alors nous considérons la fonction 
d(p, lo) 


r(q) = on (21.311) 


définie sur L'. C’est une fonction continue ?’ strictement positive définie sur le compact [qui 
possède donc un minimum strictement positif. Si ro est ce minimum, alors B(p, ro) est inclue 
à tous les Æ,, ce qui ferait que p est à l’intérieur de D. Nous concluons à l'existence de q € l 
tel que p € l4. 


25. Proposition 7.147. 
26. Lemme 7.6(1). 
27. L'équation de la droite {, a des coefficients continus parce que 7 est de classe C1. 
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(2) Le point où ça décolle Nous supposons que p é l', sinon ce serait trop facile. Nous para- 
métrons 7 de telle sorte à avoir q = (0) et nous posons 


T={teR* tel que y = lo}. (21.312) 


Cela est un fermé dans IR parce que + est de classe C!. Nous posons tg = inf(1°) et pour 
tout € suffisamment petit, 


Ly(to+e) Æ las (21.313a) 
Ly(to—e) — bé (21.313b) 


La seconde est parce que si L,(4,_0 Æ l, nous aurions # — € € T*. Soit r = (to); nous 
avons l; = l4 parce que si {, Æ l, alors par continuité de y” nous aurions /,, # l, pour tout 
re y(B(to,6)). 

Graphe d’une fonction strictement convexe En suivant le lemme 21.91, l’ensemble 
est localement (autour de r) le graphe d’une fonction convexe au-dessus de L,.. Soit g: B(0,6) — 
R? cette fonction convexe. 


RS 
Co 
——_— 


Soit € > 0. Si g”’(x) = 0 sur ]0,€] alors g/ y est constante. Mais g/(0) = 0, ce qui signifierait 
que sur [0,€] nous ayons g/'(x) = 0 et donc g(x) = 0. Cela ferait que {,» = y = 0 pour tout r” 
de la forme (x,0) avec x € [0,e] (qui sont des points de l). Cela est en contradiction avec la 
définition de r. Donc il existe un point x € [0, ef tel que g”(x) > 0. 

Rappelons que p € {,, ce qui fait que p a pour coordonnées (p4,0). Nous restreignons 6 et € 
de telle sorte que p, soit plus grand à la fois que € et 6. 

Il existe donc un intervalle [a, b] avec a, b > 0 et a, b < p, sur lequel g est strictement convexe. 


TR 
Æ 
nr 


La tangente qui tue 


En particulier g(b) > 0, de telle sorte que le théorème des accroissements finis 12.195(1) nous 
donne l'existence de m € [0,b] tel que la tangente à g en x = m est parallèle au segment 
joignant (0,0) à (b, g(b)). Cette tangente, que nous nommons /,,, est en dessous de la corde, 
par stricte convexité. En particulier, son point d’intersection avec y = 0 est strictement entre 
0 et m. 

L'ensemble D est d’un seul côté de L,,. Ce côté est forcément celui de q = (0,0) (parce que 
geT € D), et donc le points de coordonnées (x,0) avec x > m ne sont pas dans D. Pas de 
chance, p est un point de ce type. 


2 
[SA 
—_— 


La contradiction Nous avons prouvé que si p € OD\T alors p n’est pas dans D, ce qui est 
impossible parce que, l’ensemble D étant fermé, nous avons 0D € D. 


Remarque 21.93. 
Bien que cela puisse paraitre évident dès le début, nous ne démontrerons que dans la proposi- 


tion 21.95 que D est l’enveloppe convexe de fl. 
CORooSXDGooJEmVcf 


Corolaire 21.94. 
Si p € Int(D) alors toute droite passant par p intersecte T en exactement 2 points. 


Démonstration. Vu que la partie D est bornée, toute droite passant par son intérieur coupe 0D en 
au moins deux points (un dans chaque sens, et en utilisant le lemme de passage de douane 7.122). 

Soit £ une droite passant par p et supposons qu’elle coupe [° en trois points distincts. Alors au 
moins deux d’entre eux sont du même côté de p. Soient q1 et g2 ces points. Nous avons donc dans 
l’ordre p € Int(D), q € OD et qg € OD. 

Vu que tout l'est d’un seul côté de ses tangentes, lesdites tangentes ne passent pas par l’intérieur 
de D. Ni p ni qg ne sont sur /,,, parce que si q € L,, alors {,, = €, ce qui est impossible parce que 
L passe par p € Int(D). 

Or p et gb sont de part et d’autres de /,,, ce qui est impossible parce que Fest d’un seul côté 
de cette droite. 
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PROPooUURPooCXrIQi 
Proposition 21.95. 
Soit D l’ensemble défini en (21.310). 


(1) D = Conv(T) (Conv(T) désigne l’enveloppe convexe de T) 
(2) 8Conv(T) =T. 


Pour la définition d’enveloppe convexe, voir la définition 8.38. 


Démonstration. L'ensemble D est un convexe contenant F. Donc Conv(T") € D. L’inclusion inverse 
est à prouver. 

Soit x € D. Si x € OD alors x € TL (proposition 21.92) et donc x € Conv(T). Nous ne devons 
donc traiter que le cas x € Int(D). 

Le corolaire 21.94 nous dit que toute droite passant par x coupe l'en exactement deux points. 
Soient p et q ces points. Alors p,q € € Conv(T). Vu que Conv(T) est convexe, tout le segment 
[p, gl est dans Conv(T'), et en particulier x € Conv(T). 

Nous passons à la seconde affirmation. Nous savons que D = Conv(T). En prenant le bord des 
deux côtés, 0D = à Conv(T), donc F = 8Conv(T). 


LEMooUEKQooWhGyKn 
Lemme 21.96 (Des tangentes parallèles[585]). 
Une courbe fermée + de classe C? est convexe si et seulement si elle ne possède pas 3 tangentes 
parallèles distinctes. 


Démonstration. Si le graphe T° possédait trois tangentes parallèles distinctes, une serait entre les 
deux autres et le graphe [' serait de part et d’autres de cette tangente. Dans ce cas, y n’est pas 
convexe. 

Nous montrons maintenant que si y n’est pas convexe, alors elle possède trois tangentes paral- 
lèles distinctes. Pour p € T° tel que l° soit des deux côtés de /,. 

Soient l'1 et l'2 les parties de l délimitées par /,. Nous notons q; le point de l'; le plus éloigné 
de la droite L,, il existe parce que T° est compact et que la fonction distance à {, est continue sur 
FT. Les points p, gi et g2 sont distincts (sinon /, ne couperait pas l'en deux parties). 

Montrons que l4, || {,. Pour cela nous choisissons un système d’axe dans lequel !, = y = 0. 
Dans ce système, la distance entre 7(t) et l, est 7,(t) et les extrémums de cette fonction ont lieu 
aux points t tels que 210) = 0, c’est-à-dire aux points sur lesquels la tangente est parallèle à /,.. 

À quel moment avons nous utilisé le fait que la courbe soit fermée? Au moment de dire que 
le point le plus éloigné devait vérifier +,(t) = 0. En effet un extrémum peut ne pas vérifier cette 
condition si il n’est pas à l’intérieur du domaine. Dans notre cas, nous avons 7: [0,1] — IR? qui 
est fermée : (0) = +(1). Donc en réalité nous pouvons considérer +: IR — IR? et tous les points 
du domaine sont intérieurs au domaine. L’extrémum doit donc vérifier la condition d’annulation 
de la dérivée. 


Exemple 21.97. 
Si la courbe n’est pas fermée, alors le lemme 21.96 ne tient pas comme le montre le contre-exemple 
du graphe de f(x) = x° — x. Il est non convexe et pourtant ne présente que 2 tangentes parallèles 


(dans chaque direction). Fa 
LEMooCSXCooIDPiKW 


Lemme 21.98. 
Soit y une courbe convexe et L une droite qui intersecte T mais qui n’est pas tangente. Alors 
l’intersection entre £ et L' comprend au maximum 2 points. 


Démonstration. Supposons que £ coupe T en trois points p,q,r (dans cet ordre). Vu que £ n’est 
pas tangente à l, la tangente /, est distincte de £ (et intersecte £ en l’unique point g). Les points 
p et r sont dans let sont pourtant de deux côtés différents de £,. Contradiction avec la convexité 
de 7. 


La proposition suivante nous dit que si deux points de l'ont la même tangente, alors entre ces 
deux points, l’est le segment de droite les joignant. 
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PROPooCKTZoo!IPcUca 
Proposition 21.99 ([1]). 
Soit y: [0, L] — R? une courbe fermée simple et convexe de classe C. Si la tangente en p = (sp) 
et la tangente en q = (54) sont identiques (pas seulement parallèles), alors soit 


(ES; 59l) = [pal (21.314) 
soi 


(sa LI) = [p,ql (21.315) 


Démonstration. Nous considérons un système d’axe dans lequel p = (0,0), 4, = {, = y = 0 et tel 
que yy(t) > 0 pour tout {. Nous choisissons enfin un paramétrage de 7 tel que p = 7(0). 

Supposons un instant que +ÿ([0,s]) = {0}. Nous avons 33(0) = px = 0 et x(84) = 
le théorème des valeurs intermédiaires 10.89 implique que toutes les valeurs entre 0 et qg; sont 
atteintes par +; entre 0 et s. Donc tous les points du type (4,0) avec 0 < t < q> sont atteints par 
7(t) avec 0 < t < 84. De plus aucun autre point ne peut être atteint parce que 7 étant simple, elle 
ne peut pas faire de retour en arrière. 

Nous supposons donc que 7, n’est pas identiquement nulle sur [0,s,]; il existe donc un sw 
avec 0 < sy < 8, qui maximise 4, sur [0,s,]. La tangente à Ten (sw) est horizontale. Les 
droites y = 0 et y = y,(sm) sont donc deux tangentes parallèles à T. Par le lemme des tangentes 
parallèles 21.96, il n’y a pas d’autres tangentes horizontales. Donc pour tout n € N la droite y — 1 
n’est tangente nulle part à l. 

Par le lemme 21.98, la droite y = 1 ne peut intersecter l' qu’en seulement deux points. Or le 
théorème des valeurs intermédiaires appliqué à 7, sachant que +,(0) = (54) = 0 et yy(sm) > 0 
nous donne an, bn tels que 


x. Donc 


0 < an < SM (21.316a) 
SM < bn < Sq (21.316b) 
et Jy(an) = Yy(bn) = +. Donc la droite y = À intersecte + deux fois dans [0,4]. En conséquence 


de quoi yy(t) < À pour tout te [s,, L]. Cela étant valable pour tout n nous avons ,([s4, L]) = {0} 
et nous sommes ramenés essentiellement au premier cas. 


PROPOoKHUQooIOUxF\w 
Proposition 21.100. 
Soit une courbe fermée simple y de classe C* et une droite L. Alors il existe au moins deux points 
distincts qi, q2 tels que La || Lo || € avec Lu # Lg 


Démonstration. Nous considérons un système d’axes dans lequel la droite £ est la droite y = 0 ?°. 
Nous considérons la fonction 

r:7—R 

pr Py- 

En tant que fonction continue sur un compact, elle possède un minimum et un maximum. Les 

extrémums arrivent en 7(s) avec 9,(s) = 0, ce qui signifie que les tangentes aux extrémums sont 

parallèles à £. Vu que le maximum et le minimum ne peuvent pas être égaux (sinon la courbe serait 

horizontale et pas simple), les tangentes en ces points sont distinctes. 


(21.317) 


Corolaire 21.101. 
Soit une courbe convexe fermée simple y de classe C?. L'ensemble Conv(T) est compact. 


Démonstration. Nous savons que Conv(T) n’est autre que D par la proposition 21.95. Nous sa- 
vons déjà que D est fermé. Il nous suffit donc de prouver qu’il est borné (théorème de Borel- 
Lebesgue 10.24). Nous considérons deux droites perpendiculaires et les 4 tangentes correspondantes 
par la proposition 21.100. Vu que l'est d’un seul côté de chacune de ces tangentes, elle est contenue 
dans le rectangle délimité par ces 4 droites. 


28. À part n = 0 et si par manque de chance, y,(sar) est un nombre de la forme 1/n. 
29. Pour bien faire, il faut faire la démonstration en deux parties : une qui montre le cas particulier { = y = 0, et 
un second qui en déduit rigoureusement le cas général. 
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21.13.4 Courbure et convexité 
SUBSECooNJOLooYuGRjA 


À propos de paramétrage normal. 
LEMooHMFSooFlhanD 


Lemme 21.102. 
Soit y: [0,L] — R? une courbe simple, fermée de classe C? en paramétrage normal. Nous consi- 
dérons sa fonction d’angle 0: [0, L] — R. 
Alors l’application 
Cet eA ESS 
cos (4(t)) (21.318) 
sin (9(t)) 
est surjective. 
Démonstration. Le théorème 21.88 nous dit que si 0(0) = a alors 0(2rx) ne peut valoir que a +27 


ou a — 27. Le théorème des valeurs intermédiaires nous dit alors que 0 prend toutes les valeurs 
entre a et a + 27 ou a — 27. 


PROPooWXUKooPOtPd;j 
Proposition 21.103 ([585]). 
Une courbe fermée simple de classe C? est convexe si et seulement si sa courbure est soit toujours 
positive, soit toujours négative. 


Démonstration. Nous considérons la courbe 7 munie d’un paramétrage de vitesse 1, c’est-à-dire 
avec |y/(t)| = 1 pour tout t. Si 0 est sa fonction d'angle Ÿ, alors nous avons 4’ = x par le 
lemme 21.80. Donc la fonction 0 est monotone si et seulement si la courbure ne change pas de 
signe. Nous allons montrer que # est monotone si et seulement si 7 est convexe. 


(4) = 
Nous supposons que 0 est monotone et y non convexe. Soient p € l' tel que l' soit des deux 
côtés de {,, et soient les points qg1, g2 donnés par le lemme des tangentes parallèles 21.96 
tels que £, || {an || y. Parmi les vecteurs tangents en p, qg1 et g», deux au moins ont la 
même direction ; supposons que ce sont q1 et g2. C'est-à-dire que si p = (80), gi = y(s1) et 
g = (52) alors nous avons y/(s1) = +/(s2) et donc aussi 


0(31) = 0(s2) + 2nT (21.319) 


pour un certain n. Mais 0 est monotone et la différence entre sa première et sa dernière valeur 
doit valoir 27 ou —27 par le théorème 21.88. Donc n ne peut valoir que —1, 0 et 1. 


Si n = 0 alors 0 est constante sur [s1,s2]. Si n = 1 alors 0(s1) = 0(s2) + 27 alors que sur 
toute la courbe, 0 ne peut faire que 27. Donc 0 est constant sur [0,s1] et sur [s2, L] (où L 
est le bord de le paramétrage). Si n = —1, même conclusion. 


Dans tous les cas, l' contient une ligne droite, soit de q1 à go, soit de q2 à qg1. Et dans ces cas 
nous avons {y = {y Ce qui est contraire à la construction de q;. 


Nous concluons que 7 est convexe. 
(2) <= 
Nous supposons que 7 est convexe, mais que 0 n’est pas monotone. Il existe donc s1 < 50 < 52 


tels que 
0(s1) = 0(s2) Æ 0(s0). (21.320) 


Et vu le lemme 21.102, il existe s3 tel que y/(s3) = —7/(s1). 


Donc en 51, 52 et s3 nous avons trois tangentes parallèles. La proposition 21.96 est alors 
formelle, y étant convexe, deux de ces tangentes doivent être identiques. 


La proposition 21.99 dit qu'entre deux points dont les tangentes sont identiques, la courbe 
doit être un segment de droite. Or sur un segment de droite, & = 0 et 0 est constante. 


30. Définition 21.79. 
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— La partie 7([s1, s2]) ne peut pas être droite parce que nous avions supposé l'existence 
d’un 50 € |s1,s2[ tel que (51) = 0(s2) Æ 0(s0). 


— La partie +([s1,s3]) ne peut pas être droite parce que 4(s3) Æ 4(s1). 
— La partie +([s2, s3]) ne peut pas être droite parce que 4(52) Æ 4(s1). 


Nous sommes donc devant une contradiction. 


Nous en concluons que Ô doit être monotone. 


21.13.5 Théorème des quatre sommets 
LEMooELIRooNDVXPh 


Lemme 21.104. 
Soit une droite L du plan. Il existe a, c € R? avec c Z 0 tels que z € L si et seulement si (z2— a) : c = 
0. 


Démonstration. Une droite est paramétrée par y(t) = p + tq. En posant a = p et c = Jq nous 
avons la réponse. En effet nous allons montrer qu'avec ces valeurs de a et c, nous avons z € L' si et 
seulement si (z— a) : c = 0. 

D'abord un point de 7 est de la forme z = y(t) = p + tq. Nous avons : 


(y) — a) : = (7) -p) : Ja=tg: Ja=0. (21.321) 


Et dans l’autre sens, si (2—a) + c = 0 nous devons prouver que z € T. Nous avons : (z2—p) : Jq = 
0, ce qui fait que z — p est un multiple de q. Autrement dit : z — p = Àq ou encore z = aq + p, qui 
est sur la droite F. 


Définition 21.105. 


Un sommet d’une courbe est un point d’extrémum local de la courbure. 
THOo0oFRBBooWKZcfY 


Théorème 21.106 (Théorème des quatre sommets[103, 520]). 
Soit un arc paramétrique y: R — R? fermé, simple et convexe! de classe C° et T-périodique. 
Alors y possède au moins 4 points critiques sur chaque période. 


Démonstration. Nous supposons que le paramétrage de 7 soit normal. 

Si la courbure « est constante sur une partie ouverte de la (du paramétrage de la) courbe, 
alors tous les points de cette partie sont des sommets et le théorème est fait. Nous supposons que 
k n’est pas constante et en particulier que L' ne contient ni bouts de droites ni bouts de cercles 
(théorème 21.76). 

La fonction « étant de classe C! sur le compact F, elle admet au moins un maximum et un 
minimum distincts. Vu que ces points sont intérieurs, ils correspondent au changement de signe de 
Kk’. Soient p et q ces points. Pour la simplicité nous supposons que + est paramétré de telle sorte 
que (0) = p, et g = y(s4) avec 0 < 5, <T. 

Nous supposons que p et q sont les seuls points de changement de signe de K’. 

Soit £ la droite passant par p et q. Tous les points du segment [p,q| (qui sont dans Conv(T)) 
ne peuvent pas être sur L (sinon nous aurions un morceau de droite). Donc certains points sont 
dans l’intérieur de Conv(T). Donc la droite { passe par l’intérieur de Conv(T) et le corolaire 21.94 
nous dit que la droite £ ne coupe l'en seulement deux points. 

Par conséquent, les ensembles ([0, Sq]) et (sa T1) sont de part et d’autre de l. Vu qu’en 
ces points, «' change de signe et qu’il ne change de signe en aucun autre points, la fonction x’ est 
positive d’un côté de £ et négative de l’autre. 

D'autre part par le lemme 21.104, il existe a e R? et c Z 0 tels que z € £ si et seulement si 
(z— a) : c= 0. La fonction z+ (z— a) : cest donc positive d’un côté de L£ et négative de l’autre. 


31. Par la proposition 21.103 nous pouvons aussi bien demander à la courbure d’être toujours strictement positive, 
comme le fait [103]. 
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En résumé les fonctions 


se K’/(s) (21.322a) 
sr (y(s)—a) : c (21.322b) 


changent de signe en même temps et le produit a donc un signe constant. Ce produit n’est de plus 
pas nul parce que #/ n’est nul sur aucun intervalle (sinon x y serait constant et lun segment de 
droite) et (y(5) — a) - cne s’annule pour aucun s sauf ceux qui correspondent à p et q. 

Nous avons donc 


‘4 
0 Æ [ K'(s)(y(s) — a) : cds (21.323a) 
T T 
= L (ts) — a) : en(s)[ -] k(s)y(s) : cds (21.323b) 
A=0 
ii 
= -| K(s)(y(s) : c)ds (21.323c) 
= [ Jy"(s) : cds (21.323d) 
: F 
= | y"(s) : cds (21.323e) 
0 
= J[(8) - JL (21.323) 
= 0 (21.323) 


Justifications : 
— L'expression À est nulle parce que les valeurs en 0 et en T sont identiques. 
— Nous utilisons le lemme 21.75 pour faire —K(s)y'(s) = Jy"(s). 


Le tout est une contradiction de la forme 0 Æ a = 0. 
Nous avons donc au moins un troisième point de changement de signe de x’. Vu que la courbe 
est périodique, il en faut un nombre pair et donc un quatrième. 


L'exemple de l’ellipse montre qu’il n’y a pas lieu de chercher d’autres extrémums de & à part 
les 4 déjà trouvés. 


Exemple 21.107. 
Nous trouvons les sommets de l’ellipse. 


y(t) = (acos(t), bsin(t)) (21.324a) 
V/(t) = (— asin(t), bcos(t)) (21.324b) 
V/(t) = —(acos(t),bsin(t)) (21.324c) 

(21.324d) 


La courbure est 


AUS ra (21.325a) 
= acos(t)\  f—bcos(t) 
= [a? sin2(#) + b? cos?(t)]?2 ... (21.325b) 
ab 


L | 21.325c 
[a? sin2(t) + b2 cos2(t)]#/2 
Vu que ab > 0, les extrémums de cela sont ceux du dénominateur et il suffit donc d'étudier les 


extrémums de 
f(t) = a? sin?(t) + b? cos?(t). (21.326) 
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Nous avons 
f'(#) = 2(a? — b?) cos(t) sin(t), (21.327) 


fonction qui s’annule effectivement 4 fois sur une période. Deux maximums et deux minima. A 


21.13.6 Espace topologique normal 
DEFooNNKVooLtzImT 


Définition 21.108. 
Un espace topologique normal est un espace topologique séparé dont les ouverts séparent stric- 
tement les fermés disjoints. 

Autrement dit, si F1 et F> sont des fermés disjoints de X, alors il existe des ouverts disjoints 


O1 et Où tels que F1 € Où et F5 € Où. 
PROPooWSKZooHKvuob 


Proposition 21.109. 
L'espace topologique R'"' est normal. 


ii Avertissement /question à la lectrice !! 21.110 
J'ai écrit le lemme 21.111 de façon adhoc pour une utilisation dans le théorème d’Urysohn. J'avoue 


n'être pas certain qu'il soit vrai. Si vous en trouvez une preuve, écrivez-mot. 
LEMooVVASooEXYKOZ 


Lemme 21.111 ([1]). 
Soit un espace topologique normal X. Si © est ouvert dans X et si F' est un fermé contenu dans 
O, alors il existe un ouvert U tel que 


FeUcUcO. (21.328) 


21.13.7 Théorème d’Urysohn 
LEMooWRLRooCdubfZz 


Lemme 21.112. 

Soit un espace topologique X. Soit une partie D dense de [0,1]. Nous considérons des ouverts 
{Us}sp de X indexés par D. Nous supposons que si s1 < 82 alors U,, € U,,. Enfin pour tout 
æe X nous posons 


A; = {se D tel que x e U;}. (21.329) 
Alors l’application 
f:X — [0,1] 
_ Lo sire(JenUs (21.330) 
1 sinon 


est continue. 


Démonstration. Dans la suite nous prenons les conventions suivantes : 


U v; = 9 (21.331a) 
seD 
aires (21.331b) 
se 

(21.331c) 


Soit te [0,1]. 
(1) {x tel que f(x) <t} ={(J,;U; D'abord nous considérons x € X tel que f(x) < t, et nous 
prouvons que & € | Jsp Us. Vu que f(x) = inf(Az) < t < 1, il existe so < t tel que 50 € Az. 
s<t 


Pour ce s, nous avons x € À.,, et donc 


see Lie (21.332) 


seD 
s<t 


Dans l’autre sens, soient 59 < t et x e U,,. Nous avons 50 € À, et donc f(x) < so <t. 
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(2) 


f est contiue 


{x tel que f(x) <t}=(]J..; 0% Sit = 1, alors {x tel que f(x) < t} = X, et N,.; Us 
Üseg U, = X. Supposons que t < 1. 

Soit x e X tel que f(x) < t. Vu que t < 1 et que D est dense dans [0,1], il existe s € D tel 
que 


s>1> j() =im(À;). (21.333) 


Donc il existe a € À, tel que a € linf(4,),s[. Vu que a € À,, nous avons x € U,, et vu que 
a < s, nous avons U, € U,. Donc 


rebelle (21.334) 


Donc x € U, pour tout s > t (dans D), et donc x € (,., U,. Nous avons donc déjà prouvé 
que 
{x tel que f(x cf} Es (21.335) 


seD 
s>t 


Nous faisons à présent l'inclusion dans l’autre sens. Soit x € f\ _ U;, et montrons que 
S! 


s>t 
f(x) < t. Nous avons déjà traité le cas t = 1; nous continuous à supposer que t < 1. 


Soit € > 0 assez petit pour avoir {+ € < 1. Vu que D est dense dans [0,1], il existe 51,52 € D 
tels que 
t<s<s2<t+e. (21.336) 


Par hypothèse x e U,, et donc : 
réels el. (21.337) 


Cela prouve que 52 € A4, et nous avons alors 
f(x) = inf(As) < 52 <t+e. (21.338) 


Étant donné que € est arbitrairement petit, nous avons f(x) < t. 


{x tel que f(x) <t} est ouvert pour tout te R Nous commençons par t € [0,1]. Dans 
ce Cas nous avons vu que 


{x tel que f(x) <t} = U Us (21.339) 


se D 
s<t 


qui est une union d’ouverts, et donc qui est ouvert. 
Si t < O0, alors 


Us = [JU = 9, (21.340) 


s<t seg 
est ouvert. Si t > 1, alors {x tel que f(x) <t} = X parce que f prend ses valeurs dans [0,1]. 


{x tel que f(x) <t} est fermé pour tout {ER Site [0,1], alors nous savons déjà que 


{x tel que f(x = |] b; (21.341) 


s>t 


qui est fermé comme intersection de fermés (lemme 7.6(1)). Vu que f prend ses valeurs dans 
[0,1], nous avons {x tel que f(x) < t} = @ lorsque t < 0 et {x tel que f(x) < t} = X lorsque 
t> 1. 


Soient a, be R avec a < b. Nous avons, 


Flat e<aN <del <oniis<e (21.342) 


Mais nous savons que {f < b} est ouvert et que {f < a} est fermé. Donc f”! (Ja, b[) est 
ouvert comme intersection d’ouverts. 

La proposition 7.130 dit (entre autres) que les ]a, b] forment une base de la topologie de R. 
La proposition 7.34 dit que cela suffit pour conclure à la continuité de f. 
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THOooKYYEooLFcNpg 


Théorème 21.113 (Théorème d’Urysohn{[201|). 
Soit un espace topologique normal X. Soient À et B, des fermés disjoints de X. Il existe une 
application continue f: X — [0,1] telle que f|A = 0 et flp = 1. 


Démonstration. Pour chaque m € IN nous considérons D, = {k/27}x-0..2m, et posons D = 


Uno Dm 
(1) D est dense dans [0,1] Soient x € [0,1] et e > 0. Considérons m tel que 1/2” < €. Dans 


(2 


(3 


) 
) 


— 


ce cas, il existe s € D, tel que |s—x| < + <e. 


Construction des U; Nous allons maintenant construire un ouvert U, pour chaque s € D. 
Et nous allons le faire de telle sorte d’avoir s1 < 52 = U,, € U,,. 


Pour 5€ Do Nous commençons avec les éléments de Do = {0,1}. D'abord nous posons 
U, = B°. (21.343) 


Vu que B est fermé, c’est un ouvert. 

Pour construire Üo, nous remarquons que À est un fermé disjoint de B dans l’espace normal 
X. Il existe donc des ouverts Us et Uf qui séparent À et B, c’est-à-dire tels que À € Un, 
BU, et Un Us = ©. 

Nous avons Uo & B°. En effet si a € Uo n B, alors a € B et donc US est un voisinage ouvert 
de a. Ce voisinage n’intersectant pas ÜUo, a n’est pas dans la fermeture de Us. 


Nous avons donc bien la relation . 
Uo c B° = U:. (21.344) 


Récurrence Nous avons défini VU, pour 5 € Do. Pour la récurrence, nous supposons que U, 
est défini pour s € Dy-1, et qu'ils vérifient la condition. Nous allons construire les U,; pour 
8€ Dh. 

Remarquons que Dy-1 € Dyn. Plus précisément, les éléments de D, qui ne sont pas dans 
Dy-1 sont ceux de la forme k/2” avec k impair. 


Soit donc k impair et considérons s = k/2”. Par hypothèse de récurrence nous avons déjà 
Ü(x-1)/2m es U(x+1)/2m. (21.345) 
Le lemme 21.111 nous permet de considérer un ouvert Ü tel que 


Ü-12m € U € Ü € Upsryam. (21.346) 


Nous posons Um = U et nous prouvons que Us, c U;, dès que s1 < 52 dans D. 

Soient s1 = k/27 et 52 = 1/2" avec k < [. Il y a quatre possibilités suivant la parité de k et 

I. 

(4a) Si k et | sont pairs Alors s1 et s2 sont dans D,,-_1 et l'hypothèse de récurrence dit 
Let, 

(4b) Si k est impair et { est pair Nous notons k = 2k/ +1 et { = 2l'. Vu que k < |, nous 
avons 4 + + < l’. Mais comme k’ et [’ sont entiers, nous avons 4’ + 1 < l’. Et nous 
sommes partis pour le calcul : 


Üss = Uxjam (21.347a) 
€ U(p+1)/2m construction pour k pair (21.347b) 
= Uquanjom- (21.347c) 
€ Uyrjam-1 hyp. rec. dans Dh: (21.347d) 
= Ujom (21.347e) 
= TJ. (21.347f) 
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(4c) Si k est pair et | est impair Laissé aux bons soins du lecteur. J’ai pas vérifié, mais 


[201] dit que c’est similaire. Écrivez-moi si vous voyez un problème. 


(4d) Si k et ! sont impairs Laissé aux bons soins du lecteur. J’ai pas vérifié, mais [201] 


dit que c’est similaire. Ecrivez-moi si vous voyez un problème. 


(5) Résumé Nous avons posé D,, = {k/2"}%-0..2m, et D = [J%_9 Dm. Nous avons prouvé 
que D est dense dans [0,1], et nous avons construit, pour chaque 8 € D un ouvert U, de X, 
de telle façon que 

bel (21.348) 


pour tout 51 < 52. Bref, le lemme 21.112 est applicable. Nous posons donc 


Fa si ze [ep Us (21.349) 
Tr 


1 sinon. 


avec À; = {s € D tel que x € U;}. 


(6) Ce f est ce qu’il nous fait Sixe B, alors x n’est pas dans U; et donc n’est dans aucun 
des U,. Donc f(x) = 1. 
Si x € À, alors nous avons æ € Un (parce que À € Uj). En particulier 0 € À,, et donc 
f(x) = inf(Az) = 0. 


21.114. 
Les fractions de la forme a/2° sont nommées fractions dyadiques et nous avons déjà vu qu'elles 
sont denses dans IR dans le corolaire 1.428. 
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Chapitre 22 


Géométrie hyperbolique 


22.1 Inversion 
LEMooNLYKooKBMdDk 


Lemme-Définition 22.1. 
Soit un cercle C et un point À du plan R?. Soit une droite passant par À et coupant C en deux 
points P et P' (pas spécialement distincts). Alors le nombre 


1APIIAP) (22.1) 


ne dépend pas du choix de la droite et est nommé la puissance du point À par rapport au cercle 


C. 


22.1.1 Cercles perpendiculaires 


Définition 22.2. 
Deux cercles sont perpendiculaires lorsque leurs tangentes aux points d’intersection sont perpen- 


diculaires. 
LEMooWMGOooAïieUjD 


Lemme 22.3 ([1|). 
Soient deux cercles perpendiculaires C1 et C2. Alors LTEMoo JVYYooSr1SdA 


(1) le centre de Ci est hors de Co. ITEMooTQATooNv11F 


(2) Si L est une droite passant par ce le centre de C1 (nommé O) et si L coupe C2 en les deux 
points P et P', alors P et P' sont situés du même côté de O. 


Démonstration. Nous nommons ©: le centre de Ci ainsi que Q et Q’ les points d’intersection de 
Ci avec C2. Si £Q et Lor sont les tangentes à Ci en Q et Q”, alors ce sont des rayons de C2 (parce 
que les cercles sont perpendiculaires). Par conséquent le centre O2 de C2 est le point d’intersection 
O = La [A] Lo. 

Le triangle O102Q est rectangle en Q et donc |O102|] > |QO2]. Or le nombre |QO2| est le 
rayon de C2, donc O; est en dehors de C». 

Ceci achève de prouver le point (1); nous démontrons le point (2). Les points Q et Q’ sont sur 
le cercle C2, donc tous les points du segment [QQ'] sont dans le cercle. Or le centre de C1 doit 
être en dehors de C2 ; il ne peut donc pas être dans le segment [QQ/|, ce qui prouve que Q et Q’ 
ne sont pas de part et d’autre de © sur la droite (0QQ'). 


PROPooYSVYooUFKxib 
Proposition 22.4 ([1]). 
Soit un cercle C; de centre O et de rayon R. ITEMooWYI JooAAmXUL 


(1) Un cercle C2 est perpendiculaire à C1 si et seulement si il existe une droite L passant par 
O telle que les points d’intersection {P, P'} = { n C2 soient situés du même côté de O et 
vérifient 

IOP|IOP'| = R?. (22.2) 


1915 


1916 CHAPITRE 22. GÉOMÉTRIE HYPERBOLIQUE 


ITEMooYKZ0OooYZKyhF 


(2) Dans ce cas, toutes les droites passant par O et coupant C2 en deux points P, P' vérifient le 
fait que P et P! soient du même côté de O et |OP||OP'| = R2. 


Démonstration. Nous commençons par prouver le point (2). Le fait que les points P et P’ soient 
du même côté de © est le lemme 22.3(2). Pour la relation sur les distances, soit Q € Ci n C2. Vu 
que Ci et C2 sont perpendiculaires, la droite (OQ) ne coupe C2 qu’en ce point, et la puissance de 
O par rapport au cercle C2 est |OQ|? = R?. 

La même puissance peut être calculée via la droite £ : 


IOPIIOP|. (22.3) 


Donc |OP||OP'| = R2. 

Soit un cercle C2 passant par P et P'. Notons que P et P’ ne sont pas sur C1 parce qu'ils ne 
pourraient pas être alignés avec O. De plus l’un est à l’intérieur de Ci et l’autre à l'extérieur de 
Cï. Les cercles C; et C2 possèdent donc deux points distincts d’intersections. La puissance de O 
par rapport à C2 est : 

IOPIIOP'| = À? (22.4) 


parce que (OP) est une droite coupant C2 en les points P et P'. 

Soit Q un point d’intersection de C1 et C9, et Q’ l’autre point d’intersection de C2 avec la 
droite (0Q). La puissance de © par rapport à C2 peut également être calculée à partir de cette 
droite (lemme 22.1) et nous avons 


IOQIIOQ"| = F°, (22.5) 


mais Q € C1, donc |OQ| = R et partant |OQ'| = R. Nous en déduisons que Q/ € Ci également. 
Or Q' ne peut pas être l’autre point d’intersection de Ci avec C2 (sinon O,Q,Q/ ne seraient pas 
alignés). Donc Q = Q et nous déduisons que la droite (OQ) est tangente à C2. 

Le rayon de Cï est tangent à C2. Cela signifie que C1 est perpendiculaire à C2. 


22.1.2 Inversion 
PROPDEFooVLIWooQgpLQa 


Proposition-Définition 22.5 ([522]). 
Soit un cercle C de centre O dans R?. Il existe une unique application 


ic: R?\{O} — R?\{O} (22.6) 


telle que 


(1) ic(x) = x pour tout x e C ITEMooXLZCooEGAxHu 


—— nn. 
(2) ic échange l’intérieur et l'extérieur de C. ITEMooCPPUooDJIzSk 


(3) ic laisse invariants les droites et les cercles orthogonales à C. 


Cette application est l’inversion de cercle ©. 


Démonstration. Soit P à l’intérieur de C, mais différent de ©. Nous notons / la droite (OP) et nous 
considérons un cercle C2 passant par P et perpendiculaire à C (existence par la proposition 22.4). 
Nous avons { L C' (parce que £ est un rayon) et C2 L C. Donc ic(£) = £ et ic(C2) = C2 par 
l'exigence (3). Mais comme P € £{ n C2 nous avons aussi 


ic(P) eln C2. (22.7) 


Mais / et C2 se coupent en exactement deux points. Vu que ic(P) doit être hors de C (exigence (2)), 
avoir ic(P) = P est impossible. Nous en concluons que ic(P) doit être l’autre intersection. 

Nous avons prouvé que les conditions (2) et (3) fixent l’image d’un point situé dans l’intérieur 
de C.. 
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Si P est extérieur au cercle C, la même procédure fonctionne : nous considérons la droite 
{ = (OP) et un cercle C2 perpendiculaire à C et passant par P. Encore une fois, ces deux objets 
sont fixés par ic, et vu que ic(P) doit être à l’intérieur de C, il est fixé. 

L’unicité est montrée. 

En ce qui concerne l'existence, si P Z O, la procédure suivante donne P' : 


— Soit la droite { = (OP). 
— Soit un cercle C2 perpendiculaire à C' et passant par P. 
— Le point P' est le point de l’intersection C2 N £ qui n’est pas P. 


Il est aisé de vérifier que poser ic(P) = P' donne une application qui vérifie toutes les propriétés. 


NORMooUBFQooCzXRJ;j 
22.6. 
Nous recopions la construction de l’inversion d’un point par rapport à un cercle. Si Cï est un cercle 
de centre O et P est un point différent de O, alors la procédure suivante construit P’ = ic, (P) : 


— Soit la droite { = (OP). 
— Soit un cercle C2 perpendiculaire à Cï et passant par P. 
— Le point P' est le point de l’intersection C2 N £ qui n’est pas P. 


Que se passe-t-il si { et C2 n’ont qu’une seule intersection ? Alors la droite £ = (OP) est tangente 
à C2. Or de O il n'existent que deux droites tangentes à C2, et ce sont les rayons passant par 
les intersections parce que les cercles sont perpendiculaires. En d’autres mots, cette situation se 
présente lorsque P est sur le cercle Ci. Dans ce cas, ic, (P) = P. 


Remarque 22.7. 
Lorsque nous disons qu’une inversion « conserve les droites passant par © », il y a pour sous- 
entendu que nous considérons la droite privée du point ©, parce que de toutes façons, l’inversion 
n’est pas définie sur ©. 

Nous allons résoudre cet intéressant problème en 23.6.1, en ajoutant le point © à toutes les 
droites. 


Corolaire 22.8. 
L’inversion ic est une involution (i?, = Id). 


Démonstration. Soit un cercle C de centre © et un point P. Si C2 est un cercle perpendiculaire à 
C' passant par P, alors nous avons vu en 22.6 que P' = ic(P) est l’autre intersection entre C2 et 
la droite (OP). 

Pour construire l’image de P’, il faut un cercle perpendiculaire à C’ passant par P'. Le cercle 
C2 déjà utilisé fait l'affaire. Ensuite, la droite (OP') est la même que la droite (OP). Donc l’image 
de P' est P. 


Soit C1 le cercle dans € de centre 0 et de rayon 1. Nous notons a: © — € la dilatation de 
rapport À. 


PROPooYHQVooVFamhr 
Proposition 22.9 ([1]). 
Soit C le cercle de rayon R centré en 0 (C' = a(Ci)). Alors 
la(Cr)° 4 = AOC. (22.8) 
Démonstration. Soit z = re" ; nous devons prouver que 
ic(a(z)) = aic, (2)). (22.9) 
Nous avons : 
i0 2 L Lie Lie 
ic(a(z)) = ic(Rre”) =R Re = R-e° = a(-e") = a(ic(z)). (22.10) 
T F r 
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La définition 23.69 pour l’inversion sur Ô = € U {co} sera basée sur la proposition suivante. 


PROPooEWXNooNshvHq 
Proposition 22.10 ([1]). 
Soit le cercle de rayon R et de centre a € C. Alors 
F? EQooEQEF 
= à QooEQEF OO IS 
Z—a 
De plus sit, est la translation de vecteur a, nous avons la décomposition 
Üa(Cr) = La OiCRr°t-a (22.12) 
où CR est le cercle de rayon R centré en 0. 
Démonstration. Si ze C et z/ est son image par ic, alors non seulement 
la — 2'{la — 2] = RŸ, (22.13) 


mais en plus a — z/ = À(a — z) pour un certain À > 0. Cela est l'expression du fait que z/ est sur 
la demi-droite qui joint a à z. Nous avons donc 


Xla — 2[? = R? (22.14) 
et alors 
PR? 
(a— z)(a— 2) 


En récrivant a — z/ = a(a — z) avec cette valeur de À nous trouvons 


(22.15) 


2 
da, (22.16) 
G—= Z£ 


ce qu'il fallait démontrer. 
nn 

La décomposition demandée est une simple vérification en utilisant ic,(2) = & qui découle 

de la proposition 22.9. 


Avant d’aller plus loin, donnons l’équation d’un cercle dans C. Si C’est un cercle de centre w 
et de rayon r, alors z € C' si et seulement si d(z,w) = r. En développant, et en passant au carré 
sans perte d’information (les deux membres sont positifs), z € C si et seulement si 


(z—w)(7— à) = r°. (2217) 


En développant nous pouvons aussi écrire l’équation du cercle sous la forme 


22 — 24 — Bu = 1? — ww. FREE 


PROPooMIMRooTbQRVI 


Proposition 22.11 ([522]). 
Soit un cercle C de centre O. L'’inversion 


ic: R?\{0} — R?\{0} (22.19) 


transforme ITEMooNOXMooQYNPnv 
(1) les droites passant par O en elles-mêmes ; 


(2) les cercles passant par O en des droites ne passant pas par O ; LTEMooRFPSooGd.JdHD 


(3) les droites ne passant pas par O en des cercles passant par O ; 


(4) les cercles ne passant pas par O en des cercles ne passant pas par ©. 


Démonstration. Point par point. 


22.1. 


(1) 
(2) 
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Une droite passant par © est une droite perpendiculaire à C. Par le point (3) de la défini- 
tion 22.5, elle est invariante. 


Nous construisons successivement : 


— Un cercle Ci de centre O; et passant par ©. Le but est de déterminer l’image de ce 
cercle. 


— Le point P de Ci tel que [OP] en soit un diamètre. 
— Le point P'= ic(P). 
— La droite { perpendiculaire à (OP) et passant par P’. 
Nous montrons maintenant que ic(C1\{0}) = £. Soit Q e Ci\{P,0}. Nous posons 


Q'=(00) "2. (22.20) 


Vu que [OP] est un diamètre de Ci et que Q € C1, le triangle OPQ est rectangle en Q. Et 
étant donné que Q’ est sur £ nous savons que OP'Q' est rectangle en P’. 


De plus les angles en © de ces deux triangles sont identiques (parce que c’est l’angle formé 
par les droites (0Q) et (OP)); les triangles OPQ et QP'Q' sont donc semblables et nous 
pouvons utiliser le théorème de Thalès ! 12.162 : 


OP  OQ' 
0Q = Op (22.21) 
Donc 
IOP|IOP'| = 1OQ|IOQ|, (22.22) 


mais P' est l’image de P par l’inversion du cercle C, c’est-à-dire JO P||OP'| = R?. Nous en 
déduisons que 
10Q|IOQ"'| = À?, (22.23) 


c’est-à-dire que Q/ est l’image de Q par ic, et donc que 


(CO) € £ FooP JBGoopeF gg 


Pour avoir l'inclusion inverse, il faut remarquer que £ est parallèle à la tangente à Ci en 
O. Donc si Q € L, la droite (0Q) intersecte le cercle C1 en un point Q/. En refaisant le 
cheminement du résultat (22.24) à l’envers, il est loisible de prouver que ic(Q') = Q et donc 
que £ est bien inclue à l’image de Ci par ic. 
Nous commençons par prouver que toutes les droites ne passant pas par © sont des images 
de cercles passant par ©. 
Nous considérons : 

— une droite £ ne passant pas par O. 

— la droite d, perpendiculaire à { passant par O 

— Je point P'=£nd, 

— le point P = ic(P), 

— le cercle C1 dont [OP] est un diamètre. 
Par tout ce que nous avons fait jusqu’à présent, la droite £ est l’image du cercle Ci. Or si 
|IOP] = r alors 

RP? 
|OP'| = Fr (22.25) 

Donc quelle que soit la valeur de |OP’| dans 10, !, il existera un point P tel que le cercle 
passant par O et P ait pour image la droite perpendiculaire à (OP) passant par ic(P). 
Étant donné que ic est une involution surjective des cercles passant par © vers les droites 
ne passant pas par O, elle transforme également toutes les droites ne passant pas par © en 
un cercle passant par ©. 


1. Faites bien le dessin : ce n’est pas une situation de Thalès ultra-standard de collège. 
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(4) Pour cette partie, nous allons utiliser un peu de géométrie analytique dans C?. 


(4a) 


(4b) 


Le cas centré Nous supposons que C'est centré en 0 et de rayon, 1, ce telle sorte que 
ic(z) = 1/3 (proposition 22.10). Soit Ci un cercle de centre w et de rayon r, ne passant 
pas par 0, en particulier tel que |w| # r. 

Si ze ic(C1) alors ic(z) € Ci et nous avons 


(ic(z) —w)(ic(z) —w) = r?. (22.26) 
En développant et en multipliant par 2Z nous trouvons 


Dz + WE + 22(r7 — wù) = 1. Fo 0) 


2 


ou, en posant 8 = 7° — ww, 


2w + Zw + 827 = 1. (22.28) 
En comparant avec l’équation (22.18) d’un cercle, nous voyons qu’il y a de l’espoir de 
montrer que z est sur un cercle centré en a = —w/s. En effet, en divisant par s et en 
substituant a comme il faut, nous trouvons 


DES 2 | 
—2 — Za + az = —. (22.29) 
s 


En ce qui concerne le rayon À, il doit vérifier 


il 
= = R? — aa, (22.30) 
S 
ou encore 1 U 
Ce) 
R==+—. 22.31 
he ( ) 


Nous dévons vérifier que À > 0. En multipliant par s?, il s’agit de vérifier que s+ww > 0, 
ce qui est correct parce que 5 + ww = r2. 

En résumé, si z € (C1) alors z est dans le cercle C2 de centre —£ et de rayon R. Nous 
voysons que ce cercle ne passe pas par 0 par exemple directement sur l'équation (22.27) 
qui, pour z = 0 donne 0 = 1. 

Nous avons prouvé que i(C1) € C2. Pour prouver l'inclusion inverse, vu que à est une 
involution, il faut prouver (C2) € C1. Pour cela nous écrivons l’équation qui donne 


i(z) € C2 et en développant nous devons conclure que z € Ci. Nous ne le faisons pas ici. 


Le cas de rayon non unité 


Si C est un cercle quelconque, nous écrivons l’inversion du cercle C' via la formule 
(22.11). Si z e ic(Ci) alors i(z) € C1 et nous pouvons écrire 


(i(z) — a) (ie) — à) = À? (22.32) 


De là il faut déduire que z est sur un cercle ne passant pas par 0. Bons calculs... 


2. Principalement parce que je ne comprends pas le raisonnement fait dans [522]. 


Chapitre 23 


Espaces projectifs 


Sur les espaces projectifs : [586]. 


Définition 23.1. 

Soit E un espace vectoriel de dimension finie sur le corps commutatif K. Nous définissons sur 
E\{0} la relation d'équivalence u — v si et seulement si u = Av pour un certain À € K. Cette 
relation est la relation de colinéarité. L'ensemble des classes d'équivalence de — est l’espace 


projectif de E et sera noté P(E). 
DEFooTPPMooTDxNpg 


Définition 23.2. 
Si dim E = 2, l’ensemble P(E) est la droite projective, et si dim E = 3 nous parlons du plan 
projectif. 


Étant donné que tous les K-espaces vectoriels de dimensions n + 1 sont isomorphes à K”*1, 
; . : n+1 FRNSEEE NETER 
nous noterons P,(K) ou P, l’espace projectif P(K**). 


Exemple 23.3. 

Si n = let K = R, l’espace projectif est l’ensemble des droites vectorielles dans le plan usuel. Il 
y en a une pour chaque point du type (x, 1) avec x € R et ensuite une horizontale, passant par le 
point (1,0). Nous avons donc 


P\(R) = {(1,0)} LU {(x,1) tel que re R}. (23.1) 


Le point (1,0) est dit « point à l'infini ». A 


23.1 Sous espaces projectifs 


Un sous-espace projectif de P(E) est une partie de la forme P(F) où F est un sous-espace 
vectoriel de E. 


PropuqpWVx 
Proposition 23.4. 
Si F et G sont des sous-espaces vectoriels de E, alors 
P(F) nr P(G) = P(FnG) (23.2) 
el nous avons — 
dim P(F) + dim P(G) = dim P(F + G) + dimP(F n G). PESTE) 
Démonstration. Nous avons 
P(F) = {[v] tel que ve F} (23.4) 


où les crochets signifient la classe par rapport à la relation de colinéarité. Nous avons alors 
P(F) n P(G) = {[u] tel queveFnG}=P(FnG). (23.5) 
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Cela prouve le premier point. 
En ce qui concerne l'équation (23.3), en considérant dim P(E) = dim E —1 nous devons prouver 
l'égalité 


dim F + dim G = dim(F + G) + dim(F n G) (23.6) 
concernant les dimensions des espaces vectoriels usuelles. Si nous considérons une base de E telle 
que B1 = {e1,...,eg,} est une base de FN G, B2 = {ex,+1,...,ex,} complète B1 en une base de 
F'et B3 = {ez,+1,...,en} complète B1 LU B2 en une base de G. 


Nous avons alors 


dim F + dim G = 2Card(B1) + Card(B2) + Card(b3) (23.7a) 
dim(F + G) = Card(B1) + Card(b2) + Card(B3) (23.7b) 
dim(F n G) = Card(B:). (23.7c) 


De là la relation (23.3) se déduit immédiatement. 


Théorème 23.5 (incidence). 
Soient F et G deux sous-espaces vectoriels de E tels que 


dim P(F') + dim P(G) > dim P(E). (23.8) 
Alors P(F) n P(G) 4 G. 
Démonstration. En utilisant les hypothèses et la proposition 23.4 nous avons 
dim P(E) + dim P(G) = dim P(F + G) + dim P(F n G) > dim P(E). (23.9) 
En passant aux espaces vectoriels correspondants, 
dim(F + G) + dim(F n G) > dim(E) +1. (23.10) 


Mais nous avons aussi dim(ÆF + G) < dim(Æ) et par conséquent dim(F n G) > 1. Au final, 
dim P(F n G) > 0. Cela prouve que P(F A G) contient au moins un élément (nous rappelons que 
lorsqu'un espace projectif contient un seul élément, sa dimension est zéro). 


Exemple 23.6. 
Soient les plans I; = x = 0 et [2 = y = 0. Nous avons 
FAR 
Ps)= 


[0, y, 1]} L {[0,1,01} (23.11a) 
[x,0,1]} © {[1,0,0]} (23.11b) 


où le crochet signifie la classe pour la colinéarité. Ces deux droites projectives ont comme point 
d’intersection le point [0,0,1]. A 


Définition 23.7. 
Un hyperplan projectif est un sous-espace projectif de P(E) de la forme P(V) où V est un 


hyperplan de E. 
DEFooBBMBooSVgTnn 


Définition 23.8. 
Soit E un espace vectoriel de dimension au moins 3. Nous disons que d € P(E) est une droite 
projective de P(E) si d = P(D) pour un plan vectoriel D € E. 

Nous disons que trois points de P(E) sont alignés lorsqu'il existe une droite projective les 
contenant. 


23.9. 

Dans la définition 23.8 nous voyons P(D) comme inclus dans P(E) dès que D est un sous-espace 
vectoriel de Æ. Cela est possible parce que si la direction de v € D, c’est-à-dire la classe [v] est 
également une direction dans Æ. 
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Le lemme suivant peut paraitre idiot, mais ce qui serait surement idiot est de l’utiliser sans 
s’en rendre compte. 


Lemme 23.10. 
Deux points dans P(E) sont toujours alignés. 


Démonstration. Soient deux points À, B € P(E). Si À = r(a) et B = x(b) alors le plan D passant 
par a, b et O est vectoriel et P(D) contient À et B. 
Note : si a, b et 0 sont trois points alignés, alors À = B. Il suffit de prendre les points a, 


c et O0 où c € E est un point quelconque non aligné avec 0 et a. Nous avons de toutes façons 
A = B = 7(a). 


Lemme 23.11. 
Trois points distincts À, B, C dans P(E) sont alignés si et seulement si il existe trois points non 
alignés a,b,ce E tels que 


(1) le plan passant par a, b et c est vectoriel (c’est-à-dire passe par 0), 
(2) À = (a), B = r(b), et C = r(c). 
Démonstration. Deux implications à montrer. 


(1) Sens direct Soient À, B, C distincts et alignés dans P(E). Alors il existe un plan vectoriel 
D tel que À, B,C'Ee P(D). 
La condition À € P(D) implique qu’il existe a € D tel que À = (A). Idem pour B et C!. 
Les points a, b et c ainsi construits sont distincts parce que À, B et C sont distincts. Si 
par malheur ces trois points étaient alignés, ce n’est pas grave : il suffit de remplacer a par 
Xa avec À £ 0 pour qu’ils ne le soient plus (cette manipulation ne change pas le fait que le 
nouveau choix de point a reste dans D parce que D est vectoriel). Nous avons donc trois 
points non alignés a, b et c tous contenus dans D. Le plan D répond à la question. 


(2) Sens réciproque 


Soient a, b et c non alignés dans Æ tels que À = r(a), B = r(b) et C = r(c). Le plan D les 
contenant tous trois est vectoriel par hypothèse. Nous avons 4, B,C € P(D) et donc À,B et 
C' sont alignés dans P(E). 


Proposition 23.12. 
Soit H = P(V) un hyperplan projectif de P(E) et soit m hors de H. Alors toute droite projective 
passant par m coupe H en un et un seul point. 


Démonstration. Si dim E = n nous avons dim V = n — 1. Soit d = P(D) une droite projective 
passant par m, c’est-à-dire que D est de dimension 2 dans £. Si D € V alors me P(D) € P(V); 
or nous avons demandé que m soit hors de P(V). Par conséquent D n’est pas inclus dans V et en 
particulier dim(D + V) = dim(E). 

Nous recopions la formule (23.3) pour notre cas : 


tee + ae = dim P(D +V)+dimP(DnV). (23.12) 
= FR =n—1 


Nous avons donc dim P(DAV) = 0, ce qui signifie que l’ensemble P(DAV) = P(D) n P(V) = do H 
contient un et un seul point. 
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23.2 Espace projectifs comme « complétés » d’espaces affines 


Soit E un espace vectoriel de dimension 2 et P(E) la droite projective correspondante, et soit 
{e1,e2} une base de Æ. Nous considérons la droite affine d = y = 1. Nous avons la bijection 
D: dU {wo} —+ P(E) 
te vetor Eu fa 
(x, 1) — la droite vectorielle passant par (x, 1) Le si ñ 
++ la droite vectorielle passant par (1,0). 
Lemme 23.13. 


Si nous munissons l’ensemble d Ü {w} de la topologie compactifiée d’Alexandrov!, la bijection 
(23.13) est un homéomorphisme. 


Soient maintenant les plans affines dans l’espace vectoriel E de dimension 3 


I =z=0 (23.14a) 
I =z=-1. (23.14b) 


Une droite (vectorielle) de E coupe Il2 en un et un seul point, sauf si elle est contenue dans Il. 
Nous avons donc une bijection 


g: P(E) — Il L P(Ti) 


d U nd si cette intersection est non vide (23.15) 


sinon. 


La droite projective P(Il:) est la droite à l'infini du plan projectif P(E). Nous voyons que le plan 
projectif P(E) peut être vu comme un plan affine (IL) « complété » par une droite affine P(IL:). 
Cette dernière droite est elle-même une droite affine complétée par un point à l'infini. 

Nous pouvons généraliser cette démarche en considérant un espace affine € de direction Æ sur 
le corps K. Nous construisons F = Æ x IK et nous considérons un repère affine sur F tel que 
E = xh11 = 0. Nous pouvons donc identifier € à l’hyperplan affine d’équation x,:1 = 1 dans F. 

Une droite vectorielle de F non contenue dans Æ coupe € en un unique point ; nous avons donc 


une bijection 
£ELVP(E) — P(F). (23.16) 


Dans ce cadre, P(E) est l’hyperplan à l'infini et nous disons que P(E) est la complétion pro- 
jective de €. 


Exemple 23.14. 
Nous considérons les plans affines 


IL=2=0 (23.17a) 
IL = z = (23.17b) 

et nous avons la bijection 
P(E) = Ib L P(I). (23.18) 


Un plan vectoriel D a deux possibilités : soit il coupe Il2 en une droite, soit il est égal à Il. Si 
D n Ib = d (d est une droite affine), alors nous avons 


PID)=duy tps). (23.19) 
ce qui justifie la terminologie comme quoi P(D) est une droite dans P(E). A 


Soit E un espace vectoriel de dimension 3 et le plan projectif P(E). Nous avons deux types de 
droites projectives : 


1. Définition 7.98. 
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(1) D'abord nous avons la droite à l'infini, donnée ? par P(z = 0). 


(2) Ensuite nous avons toutes les droites affines du plan z = 1. Chacune de ces droites est 
complétée par un point à l'infini. 
ExempMyTmFp 
Exemple 23.15. 
Étudions un peu le second type de droites. D’abord si deux droites sont parallèles, leurs points à 
l'infini sont identiques. Prenons par exemple les droites d = {2 = 1,x = 1} et d' = {z=1,x = 2}. 
Elles décrivent les directions des vecteurs 


1 2 
et [y]. (23.20) 
1 1 
En normalisant, ce sont les vecteurs 
- , t - : (23.21) 
© y} et ————— ||, 
A/ 2 + y? 1 \/ D + y? 1 
et toutes deux tendent vers le vecteur (0,1,0) pour y — 0. A 


Lemme 23.16. 
Deux droites d’un plan projectif ont toujours une intersection. 


Démonstration. Si les deux droites sont des droites affines non parallèles, le résultat est évident. 
Si elles sont parallèles, alors l’intersection est donnée par le point à l'infini comme indiqué dans 
l'exemple 23.15. 

Supposons que d est la droite à l’infini tandis que d’ est une droite affine. Dans notre repré- 
sentation usuelle du plan affine, la droite à l'infini d a contient les vecteurs (1,y,0) et le point à 
l'infini (0,1,0). La droite affine d’ a pour équation paramétriques 


z=at+c (23.22a) 
y=bt+d (23.22b) 
= À. (23.22c) 


Les directions données par la droite d’ sont donc 


1 at +c 
CNET. ” : : 4 


Son point à l'infini est la direction du vecteur (a, b,0), qui est bien un point de la droite à l'infini 
(éventuellement son point à l'infini *). 


La plupart du temps nous considérons le plan projectif comme étant le plan affine z = 1 de 
l’espace affine de dimension 3 complété par la droite affine x = 1,2 = 0, elle-même complétée par le 
point (0,1,0). Ce n’est évidemment pas la seule manière. Tout plan peut être considéré comme le 
plan à l'infini et pour une droite projective, tout point peut être considéré comme point à l'infini. 

Sur la figure 23.1(a), le point à l'infini est la direction (1,0) tandis que la direction (1,1) n’a rien 
de spécial. À l'inverse sur la figure 23.1(b), la direction à l'infini est (1,1) tandis que la direction 
(1,0) est une direction usuelle. 


2. Dans notre représentation usuelle du plan projectif z = 1. 
3. D'accord, aller chercher le point à l'infini de la droite à l'infini, c’est chercher loin, mais n’empêche que ça 
existe. 
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+ 
Le. 9 cf î 9 3 LabelFigChoixTnf ipisstiabelSybFig@noi EBbBlFIGChoi xTnf 
(a) Ici le point à l'infini est la direction (1,0). (b) Ici le point à l'infini est la direction (1,1). 


FIGURE 23.1: Deux façons de voir la droite projective. Étant donné que les points de la droite 
projective doivent être interprétés comme des directions (des classes d’équivallence), en réalité les 
deux dessins représentent les mêmes ensembles. LabelFigChoixInfini 


Remarque 23.17. 
Du point de vue de la topologie, si nous mettons celle de la compactification d’Alexandrov, tous 
les points de la droite projective sont équivalents. 

Du point de vue de la géométrie différentielle, c’est la même chose. En effet nous pouvons 
mettre sur la droite projective un système de deux cartes en pensant aux angles. La première sur 
]-a, al avec par exemple a < x/4. La seconde carte serait |a/2,7|[. Dans ce cas la direction 0 = 0 
semble jouer un rôle spécial, mais il n’en est rien. 

Nous pouvons également considérer les cartes ]7/4 — a,r/4+ al et ]1/4 + a/2,57/4[. Dans ces 
cartes, c’est plutôt le point 0 = x/4 qui semble différent (encore qu'il soit bien centré dans une 
carte). 


23.3 Théorème de Pappus 


Théorème 23.18. 
Soient deux droites d et d' dans un plan affine. Soient A, B,C € d et À',B',C" € d' tels que 
AB' | BA' et BC" || B'C. Alors AC" || A'C. 


Démonstration. Si d et d’ ne sont pas parallèles nous considérons o, le point d’intersection. Les 
relations de parallélisme des hypothèses impliquent qu’il existe À et À2 tels que 


A = ÀB (23.24a) 
{ B' = À 4 (23.24b) 
et 
B' = xC' (23.25a) 
C = À2B. (23.25b) 
En substituant nous trouvons 
C'= A (23.26a) 
42 (23.26b) 
À1 


ce qui implique que 4’C || AC". 
Si les droites d et d’ sont parallèles, alors nous avons les translations 


B=A+7x (23.27a) 
A'=B'+x (23.27b) 
et 
B=C+y (23.28a) 
C'=B'+4y, (23.28b) 
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ce qui montre que 


C=A+z-y (23.29a) 
A =C'+x-7y, (23.29b) 


et donc que 4'C || AC". 
Le théorème suivant est une version projective. 


Théorème 23.19. 
Soient d et d' deux droites projectives d’un plan projectif. Soient À, B,C € d et A',B',C" € d’. 
Alors les points B'C n C'B, C'An A'C'et AB n B'AÀ sont alignés. 


Démonstration. Soient E = B'C'n C'B et E’ = C'A An A'C. Ces deux points existent parce que 
deux droites projectives distinctes ont toujours un unique point d’intersection. Nous allons prendre 
EE! comme droite à l'infini et prouver que le point 4/B n B'A est dessus. Étant donné que le 
point d’intersection de B'C' et C’B est à l'infini nous avons B’C || C'B (cela est un exemple de 
la flexibilité de la notion de parallélisme en géométrie projective). De la même façon nous avons 
C'A || A'C. 

Par le théorème de Pappus affine nous avons alors 4’B || B'A et par conséquent le point 
d’intersection est sur la droite à l'infini, c’est-à-dire sur la droite EE. 


23.4 Homographies 


23.4.1 Homographies 


DEFooKWSMooXvOeEP 
Définition 23.20. 
Soient E et F deux espaces vectoriels avec leurs projections naturelles 
rg: E\{0} — P(E) (23.30a) 
xp: F\{0} — P(F). (23.30b) 


Une application g: P(E) — P(F) est une homographie si il existe un isomorphisme d'espaces 
vectoriels g: E — F' tel que le diagramme 


E\{0} —Ÿ> F\{0} (23.31) 


P(E)—— P(F) 


commute, c’est-à-dire si il existe g: E — F telle que 
La EQooSEFWooRp)j 
rr(g(v)) = g(rz(v)) ER 
pour tout ve E. 


Lemme 23.21. 
Si g: E — F est linéaire et si ker g = {0} alors l’application g définie par 


g(re(v)) = re (g(v) "E38) 
est une homographie. 


Démonstration. Nous devons simplement vérifier que l’équation (23.33) définit bien une applica- 
tion. Soient v,w € E tels que Tpv = TEw ; nous devons montrer que 


TEQV = TFQU. EqgFUs 
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L'équation (23.34) sera vérifiée si et seulement si il existe À € R tel que gu = Àgw, c’est-à- 
dire si et seulement si g(v — ÀAw) = 0. Etant donné que nous supposons que le noyau de g est 
réduit à {0}, l'équation (23.34) sera vérifiée si et seulement si v = Àw, ce qui signifie exactement 


RE(v) = rE(w). 


La proposition suivante donne les premières propriétés des homographies. 
PROPooGVYXooDIilbW 


Proposition 23.22. 
Quelques propriétés des homographies. ITEMooTIONooSK jfny 
(1) Une homographie est bijective. 


(2) Si deux espaces projectifs sont homographes, alors ils ont même dimensiPBmoo1ZAPoONxEi gb 


(3) L'ensemble des homographies P(E) — P(E) est un groupe (pour la composition). 


(4) Une homographie conserve l'alignement des points. 


Démonstration. Nous considérons une homographie g: P(E) — P(F), et g l’isomorphisme d'’es- 
paces vectoriels correspondant. 
(1) Pour l’injectivité, si g([vl) _ g([w]) alors en utilisant la définition d’une homographie, 
TE YU = TFYW, ce qui implique que gv = Àgw, et donc v = Àw, ce qui signifie [v] = [w!]. 
Pour la surjectivité, un élément général de P(F) prend la forme rrgv pour un certain ve E. 
Nous avons g(rev) = rpgv. Par conséquent l'élément rrgv est bien dans l’image de g. 
(2) Une homographie P(E) — P(F) n'existe que si il existe un isomorphisme Æ — F. Les 
dimensions sont donc automatiquement égales. 


(3) Il suffit de vérifier que l’application 


6: P(E) — P(E) 


- (23.35) 
TFQU + TEU 


est bien définie et donne l'inverse de g. 


(4) Soient les points À, B,C' alignés dans P(E) ; ils correspondent à des directions de Æ qui sont 
données par des vecteurs situés sur la même droite affine. Autrement dit, il existe trois points 
a,b,c € E situés sur la même droite affine tels que À, B,C = rg(a,b,c). Les images par g 
sont données par 1rga, Trgb, et Trgc. 

Étant donné qu’un isomorphisme d’espaces vectoriels conserve l'alignement affin, les points 
ga, gb et gc sont alignés dans F. Cela implique que les projections par Tr sont alignés dans 
POP}. 


23.4.2 Le groupe projectif 
DEFooWUSDooSLVKwV 


Définition 23.23. 
Le groupe des homographies de l’espace P(E) est le groupe projectif, noté PGL(E). 


Nous avons une surjection naturelle 


GL(E) — PGL(E) Fapailess, 


gr g 
qui s’avère être un morphisme de groupes. 
Proposition 23.24. 

Nous avons l’isomorphisme de groupes 
GL(E) 


——— = PGL(E,. 23.37 
{homothéties} (E) 
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Démonstration. Nous devons prouver que le noyau de l’application (23.36) est constitué des homo- 
théties. Considérons un automorphisme d'espace vectoriel f: £ — E dont l’homographie associée 
est l’identité, et prouvons que f est une homothétie. Nous avons le diagramme commutatif suivant : 


E\{0} + E\{0} (23.38) 


re fre 


P(E) — P(E). 


Pour tout vecteur v € E nous avons rg(v) = TE ( Î (v)). Cela implique qu’il existe À € R tel que 
f(v) = Av. Tous les vecteurs de Æ sont donc des vecteurs propres de f. Cela n’est possible que si 
toutes les valeurs propres sont identiques, c’est-à-dire que f est une homothétie. 


23.4.3 Repères projectifs 


Définition 23.25 ([587]). 
Des éléments {P;};er sont projectivement independents si en choisissant v; € n° !(P;) nous 


obtenons des vecteurs {v;};er linéairement indépendants. 
DEFooPZKFooDBXtEn 


Définition 23.26. 
Soit E un espace vectoriel de dimension n + 1. Un repère projectif de P(E) est la donnée de 
n +2 points Mo,...,Mn+1 tels que 


(1) les vecteurs m;, à Æ 0, sont les images d’une base {e;} de E 


(2) mo = TE(e1 + €e2 +... +en+1). 


Note que si mx = ng(vx) (k = 0,...,n+1), alors tout choix de n + 1 vecteurs parmi les v4 est 
une base de E. 


Exemple 23.27. 
Un repère projectif de l’espace P(IRŸ) est par exemple les éléments {m;};-1...3 donnés par 


m1 = T(e1) (23.39a) 
ma = T(e2) (23.39b) 
m3 = T(e3) (23.39c) 
MO = r(e1 + € + e3). (23.39d) 
A 
Exemple 23.28. 
Pour P(C?), un repère projectif possible est m1 = [1,0], m2 = [0,1], mo = [1,1]. si 


23.29. 

Pourquoi voulons nous des repères projectifs ? Pourquoi demander un quatrième élément alors que 
trois devraient suffire ? Le fait est que si Æ est de dimension 3, nous voudrions pouvoir identifier 
E et P(R*). 

Plus précisément, si E est de dimension n + 1 et possède une base {fi}i=1..n+1, il existe un 
unique isomorphisme d'espaces vectoriels E — R"*! qui envoie cette base sur la base canonique 
de R"+!, La base de E étant fixée, nous pouvons donner à un point de Æ les coordonnées de son 
image dans R°**1 par cet isomorphisme qui est unique. 

Dans le cas des espaces projectifs, nous voudrions avoir une unique homographie D: P(E) — 
P(R"*1) qui permet de donner à un point À € P(E) les coordonnées de 77! (9(4)). Bien entendu 
ce dernier n’est pas un élément bien défini de R"*! parce qu’il y a toute une droite d'éléments de 
R’” qui se projettent sur O(AÀ). 
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L'idée d'imposer un point de plus est la bonne. Si nous imposons un point de plus, nous pouvons 
dire que les coordonnées de À € P(E) sont celles dans R"*1 de l'élément de 7 !(9(A)) dont la 
dernière coordonnée est par exemple 1. 

Nous allons maintenant mettre ça en musique. 


D'abord nous donnons un exemple de non unicité. 


Exemple 23.30. 
Soit un espace vectoriel E de dimension 2 et une base {b1,b2} de E. Nous considérons également 
l'espace R? muni de sa base canonique {e1, e2}. 

Soit une homographie D: P(E) — P(R?) telle que 


Gr (bi) : r(e;) FASO ARR 


pour à = 1,2. Nous allons facilement construire une autre homographie qui vérifie les mêmes 
conditions. 

L'idée est la suivante. L'espace P(E) peut être vu comme la droite complétée {(x,1)}:eR U 
{(1,0)} et l’espace P(R?) également. Une homographie respectant (23.40) doit envoyer le (1,0) de 
E vers le (1,0) de R? et le (1,1) de E vers le (1,1) de R?. Maïs en ce qui concerne le reste de la 
droite, l’'homographie peut la parcourir à la vitesse qu’elle veut. 

Il faut envoyer 


ñ(b2) T(e2) 


r(b:) . (es) 


Soit donc une homographie p: P(E) — P(IR?), et nous définissons 


d: P(E) — P(R?) 


r(xb1 + yb2) — p(r(xb1 + Ayb2)) (23.41) 


pour un certain À # 1. En ce qui concerne le relèvement, l’application @': E — IR? donnée par 


d'(xb1 + yba2) = (xb + Xybo2) (23.42) 
est bien définie et vérifie : 
TR 0D = DOTE. (23.43) 
Donc @' est une homographie. De plus 
'(r(b1)) = (r(b1)) (23.44) 
D'(r(b2)) = (Tr (Ab2)) = (T(b2)) (23.44b) 
parce que 7(Xb2) = 7(b2). 
Nous n’avons donc pas l’unicité. A 


C’est pour rétablir cette unicité que nous demandons d’avoir un point de plus pour avoir un 
repère projectif. De cette façon nous aurons une unique homographie 6: P(E) — P(R"*1) vérifiant 
P(rp(bi)) = TRnH1(e;) pour tout à =0,...,n +1. 


Lemme 23.31. 
Soit un espace vectoriel E de dimension n + 1 muni de deux bases {ei}i=1..n+1 et {fi}i=1,..n+1- 
Soit un repère projectif {mo, Mi}i=1,..n+1 de P(E). 

Si n(e;) = r(f;) = mi pour tout i = 1,...,n +1 et si 


T(e1 +... + En+1) = fi +... + fn+1) (23.45) 


alors les deux bases sont proportionnelles : il existe À tel que f; = Xe; pour i=1,...,n +1. 
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Démonstration. Nous avons t(e;) = r(f;) pour tout à = 1,...,n + 1. Donc pour chaque à — 
1,...,n+1 il existe À; € K tel que e; = Àf;. Nous devons voir que les À; sont en réalité tous égaux. 
Pour cela nous avons aussi l'égalité pour à = 0 : 


n(e1 +... +en+1) = 1(f1 +... + fn+1), (23.46) 


ce qui donne un y € K tel que e1 +... + en+1 = WU f1 +... + fn+1), c’est-à-dire 


Afi + + Ant fn = Ufi +... + Ufn+1. (23.47) 
Du fait que les f; forment une base, cette égalité impose à tous les À; d’être égal à y. 
THOo0oTXPVooJGigne 
Théorème 23.32 ([588]). 
Soient P(E) et P(F) deux espaces projectifs de dimensions n. ITEMooRSIWooXbEn1T 


(1) Une homographie P(E) — P(F) envoie un repère projectif sur un TPE MBK ooDyTsxsh 


(2) Si(mo,...,Mn+1) est un repère projectif de P(E), si (m6,...,m%11) est un repère projectif 
de P(F) alors il existe une unique homographie g: P(E) — P(F) telle que g(mi) = m£ pour 
touti—=0,1,...,n+l 


Démonstration. Un point à la fois. 


(1) (1) 
Soit une homographie D: P(E) — P(F) et un repère projectif {mo,m1,...,mMn+1} de P(E). 
Nous posons ml = ®(m;) pour tout à = 0,...,n+1. Nous devons prouver que ces m£ forment 
un repère projectif de P(F). 
D'abord pour i = 1,...,n+1 nous avons m! = p(TE(e)) =TF (O(e:)), mais {p(es)}i=1,.m+1 
est une base de F parce que ® est un isomorphisme d’espaces vectoriels. Donc oui : les m 
(i=1,...,n +1) sont les projetés d’une base de F. 


Nous posons au passage f; = @(e;). En ce qui concerne mg nous savons que Mo = Tp(e1 + 
... + En+1) et 


mo = p(re(ei +...+enr1)) = Tr(D(e1 +... +eny1)) = mr(fi +... + fny1), (23.48) 


ce qui termine de montrer que {m/};=0...n+1 est un repère projectif de P(F). 


(2) (2) 
Soient un repère projectif (mo,...,Mn+1) de P(E) et un repère projectif (m6, ...,m/,,1) de 
P(F). Nous choisissons des bases {e;} de E et {f;} de F telles que 


Mi = TE(6i) (23.49a) 
mi = mr(fi) (23.49b) 
pouri=1,...,n+let 
Mo = TE(E1 +... + Ent1) (23.50a) 
mi = Tr(fi +... + fn+1). (23.50b) 


Nous considérons un isomorphisme d'espace vectoriel @: E — F tel que @(e;) = f; pour tout 
i, et nous voulons définir @: P(E) — P(F) par 


é(re(v)) = rr(8(v). FORT EP) 
Cela est bien défini parce que si rg(v) = rg(w) alors w = Àv et 
rr(O(Xv)) = rr(Xb(v)) = rr(p(v)). (23.52) 


L'application définie par (23.51) est une homographie qui envoie m; sur m£ pour tout à — 
0,...,n + 1. Ceci prouve la partie « existence » du point (2). 
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Pour l’unicité, soient des homographies 


gi: P(E) — P(F) (23.53a) 
2: P(E) — P(F) (23.53b) 
telles que D1(m;) = ami) pour tout à = 0,...,n+1. Soit aussi une base {e;};=1..n+1 de E 
adaptée au repère projectif, c’est-à-dire m; = mg(e;) pour à = 1,...,n +1 et ng(ei +...+ 


En+1) = Mo. Nous considérons aussi les isomorphismes d’espaces vectoriels 1 et D2. Avec 
tout ce beau monde nous avons 


Pitm:) = re(pi(e:)) (23.54a) 
Da(mi) = re(do(ei)). (23.54b) 


Mais nous savons que 1(m;) = p2(mi), donc nous savons que Tg CO) : re (pa(ei)), ce 
qui nous fait conclure que 


pi(ei) = Aiba(ei) (23.55) 
pour certaines constantes À; € K. Le même raisonnement appliqué à mo nous donne un y € K 
tel que : : : : 
@i(e1) SR dun 1(en+1) = u(@a(ei) ur Pa(en+1)). (23.56) 
En mettant l’un dans l’autre : 
Ad2(e1) nn An+102(En+1) = u(D(ei) Mat Pa(en+1)). (23.57) 


Sachant que {pa(es)}i=1,..n+1 est une base de F et nous souvenant de l’unicité de la décom- 
position d’un élément dans une base *, nous en déduisons que tous les À; doivent être égaux 
à u. Donc pour tout v € E nous avons @i(v) = Xbo(v). 

Cela a pour conséquence que 1 = 2. 


23.33. 

Si nous avons une droite projective, trois points sont nécessaires pour créer un repère et donc pour 
construire une homographie de la droite sur elle-même. Soit E un espace vectoriel de dimension 
2 et P(E) la droite projective qui lui est associée. Soit une homographie f: P(E) — P(E) et 
f:E — E, l’isomorphisme d’espaces vectoriels associé (par f o np = ng 0 f). Si {e1,e2} est une 
base de E alors l'application f a une matrice 


A = é . e M(2,K) (23.58) 
@21 @22 


avec det À # 0 parce que f est un isomorphisme. 

La plupart des points de P(E) sont représentés par des points de la forme (z, 1). Nous voudrions 
savoir quelle est la direction représentée par le point f(z, 1); c’est-à-dire que nous voudrions savoir 
f({z,1)) sous la forme [2/,1] (si possible). Nous avons 


f(2,1) = (a112 + a12, a212 + a22). (23.59) 


Nous posons À = a212 + a22 et nous avons 


F0 = (est 21) (23.60) 


Il y à plusieurs possibilités suivant les valeurs de À et de z. 


(1) Si À = 0 c’est que nous avons f(z,1) = (a112 + a12,0). L'application f envoie donc le point 
(z : 1) sur le point à l'infini. 


4. Proposition 4.7. 
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(2) Si À £ 0, alors f envoie le point (z : 1) vers un autre point « normal ». 


(3) Si le point de départ est le point à l'infini alors f(1,0) = (a11, ax). Cela peut être le point à 
l'infini ou non selon les valeurs des à;;. 


Dans tous les cas si nous posons 


@112 + @12 
= 23.61 
Ps @212 + Q22 
pito) = 2 (23.61b) 
a21 
alors nous avons L 
F(2,1) = (62,1). (23.62) 


Si nous prenons la convention que - = 0 et que (0,0) est le point à l'infini, alors cette application 
wf donne bien toutes les valeurs de f, y compris les cas à l'infini. 

LEMooXNKOooBKhzyt 
Lemme 23.34 ([589)). 
Trois points distincts d’une droite projective forment un repère projectif. 


Démonstration. Soit une droite projective d = P(E) où E est un espace vectoriel de dimension 
2 sur le corps K. Soient trois points distincts À, B et C de d. Nous avons à, b,c € E tels que 
A = (a), B = r(b) et C = r(c). Vu que À # B, les vecteurs a et b ne sont pas proportionnels et 
la partie {a, b} est libre dans £. Autrement dit, c’est une base °. 

Il existe donc à, 6 € K tels que c = «a + Sb. De plus a et 5 ne sont pas nuls parce que C Æ À 
et C Z B. En prenant a’ = aa, bd = Bb et € = c nous avons : À = r(a'), B = r(b'), C = x(c') en 
même temps que {a/,b'} est une base de E et © = a’ + b'. Donc À, B,C' est un repère projectif de 
d = P(E). 


CORooRFCZooGZiQBJ 
Corolaire 23.35 ([590]). 
Soient E et F des espaces vectoriels de dimension 2. Soient A; (i = 1,2,3) des points distincts sur 
P(E) et B; distincts sur P(F). Alors il existe une unique homographie P(E) — P(F) portant À; 
sur B; pour tout i = 1,2,3. 


Démonstration. Il s’agit de mettre en conjonction le lemme 23.34 qui dit que les À; forment un 
repère projectif de P(E) (idem : les B; forment un repère projectif de P(F)) et le théorème 23.32(2) 
qui dit que l’une va sur l’autre part une unique homographie. 


23.4.4 Identifications P(K?) vers K L {æ} 


Pour rappel, une droite projective est l’espace projectif modelé sur un espace vectoriel de 
dimension deux (définition 23.8). 
NORMooUQRUoo0OMIZzJD 
23.36. 
Nous allons faire un usage assez intense de bijections entre P(K?) et K = K L {co}. Une possible 
est 
po: P(K?) — KL {oo} 


E SIJD 
msi [E 440 pr 
1, 


O0 si ko = (. 


Notons que nous utilisons ici le fait que K soit commutatif, sinon il aurait fallu choisir k1k;, Lou 
k; lk1 au lieu d'écrire gentiment k: 1 

CORooFJSCooNOeAel 
Corolaire 23.37. 
Soit une bijection y: P(K?) — K. Les points {71 (0), w=1(0),çw-1(1)} forment un repère projectif 
de P(K?). 


5. Il convient de citer ici la proposition 4.18. 
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Démonstration. I s’agit seulement d’une application du lemme 23.34. 
Juste pour l’amusement, nous allons le prouver explicitement pour la bijection & = 0 donnée 
en (23.63). Un repère projectif est la définition 23.26. Nous avons 


po (0) = [1,0] = rK2((1,0)) (23.64a) 
5" (0) = [0,1] = rx2((0,1)) (23.64b) 
po (1) = [1,1] = TK2((1,1)) (23.640) 


Les points (1,0) et (0,1) forment un base de IK? et nous avons bien (1,1) = (1,0) + (0,1). Donc le 
tout vérifie bien la définition d’un repère projectif. 


D'autre part, comme il est plus agréable de travailler avec K qu'avec P(K?) nous avons envie de 
voir K comme un espace projectif (qu’il n’est pas). Il y a cependant nombre d’autres identifications 
possibles. En voici un autre : 

ep: P(K?) — K 


k ; 
ble É ES Ce 


ee) si &1 = 0. 


Vous en voulez une plus compliquée ? En voici une pour K = R, basée sur le dessin suivant : 


re 


La bijection associée est : 
pa: P(R?) — À 
FL si Ak2 <0 EQooMTGCoofyxR 
[, ko] 425 si kiko > 0 
si ko = (. 


Pour mettre un peu d’ordre dans toutes ces identifications possibles, nous introduisons une 


classe. 
DEFooMLQUooGwvQMh 


Définition 23.38. 
Pour une bijection w: P(K?) — K nous définissons 


A(g) = { La: P(K?) — K tel que ÿ3! 0 soit une homographie } (23.67) 


Les classes sont assez larges parce que pour toute homographie 9: P(K?) — P(K?), nous avons 
pop le A(). Mieux, nous avons le lemme suivant. 


Lemme 23.39. 
L'application 
ÿ: A(p) — PGL(K?) 


(23.68) 
Pa Pa 09 


est une bijection. 


Démonstration. Pour rappel, PGL(E) est le groupe des homographies de Æ, voir la définition 23.23. 
(1) Surjectif Si 9 e PGL(K?) nous avons d = (pop !). 
(2) Injectif Si Y(ça) = (y) alors 
Pa PP 0P. (23.69) 


d’où nous déduisons 4,1 = ps! parce que est une bijection. 


23.4. HOMOGRAPHIES 1935 


23.4.5 Birapport 


23.40. 

Tout le monde semble définir le birapport en identifiant P(K?) à K = K U {}. Bien entendu, 
personne ne semble s’être attribué la mission d’expliciter la dépendance du birapport en le choix 
de l'identification. Je le fais à la définition 23.41. 

Mais cette définition dépend du choix d'identification w: P(K?) — K, comme le montre 
l'exemple 23.43. J'ai donc défini des classes d’identifications possibles A() en 23.38. Et je dé- 
montre la proposition 23.44 que si w, € A(w) alors les birapports construits à partir de 4 et wa 
sont identiques. 

Question : pourquoi personne ne semble faire ce travail ? En quoi l'identification 40 que tout le 
monde utilise est plus canonique qu’une autre ? Est-ce que l’on peut décrire simplement les classes 
A(@) ? Le groupe qui conserve le birapport associé à @ est-il isomorphe au groupe qui conserve le 
birapport associé à 4’ ? Quels que soient w et w’? 

Suis-je la seule personne au monde à m'être demandé si le birapport était un objet canonique ? 

DEFooBFSKooDwzwmO 
Proposition-Définition 23.41. 
Soit une droite projective d = P(E) et trois points distincts À, B et C' sur cette droite. Soit une 
bijection ç: P(K?) — K. Si X est un point de d alors nous nommons le birapport de X par 
rapport à À, B et C l'élément de K donné par 


[A,B,C,X], = (vo &)(X) (23.70) 
où D: d — P(K?) est l'unique homographie telle que PERS er 
(A) = #7" (00) (23.71a) 
g(B) = 7"(0) (23.71b) 
p(C) = 67"). (23.71c) 


Démonstration. Nous devons prouver qu'il existe effectivement une unique homographie vérifiant 
les conditions (23.71). 


(1) À,B,C' est un repère projectif de P(E) Voir le lemme 23.34. 


(2) w-l(0),w"1(0),"1(1) est un repère projectif de P(K?) Lemme 23.34 ou corolaire 23.37 
au choix. 


(3) Conclusion Le théorème 23.32(2) nous donne existence et unicité d’une homographie 
P(E) — P(K?) envoyant le premier repère sur le second. 


Remarque 23.42. 

La majorité des sources ne parlent pas de la dependence du birapport en le choix de @ parce que 
tout le monde ne semble ne considérer que @ = 40 définie en (23.63). Il est cependant naturel de 
se demander si la définition dépend effectivement du choix de . La réponse est oui : ça dépend 


du choix. 
EXooYCOYooWFSfUv 


Exemple 23.43 (Une autre identification qui ne va pas bien). 
Nous montrons que l'identification 4: P(K?) — K donnée en (23.66) ne donne pas lieu au même 
birapport que celui de 4. 

Nous travaillons le birapport sur la droite projective la plus simple : P(K?) avec K = R. 
Prenons pour la simplicité À = [1,0], B = [0,1] et C = [1,1]. Alors l’homographie demandée dans 
la définition de [.,.,.,.1,, est do = Id. Par conséquent, 


ki 


[A, B, C, Dés ko], — (co © Do)lk1, ko] — polk1, ko] — 1 (23.72) 
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En ce qui concerne le birapport définit par 44 nous avons 


pa" (oo) = [1,0] (23.73a) 
p3"(0) = [0,1] (23.73b) 
we (= |E2) (23.730) 
de telle sorte que nous cherchons une homographie pq: P(K?) — P(K?) telle que 
®al1,0] = [1,0] (23.74a) 
®al0, 1] = [0,1] (23.74b) 
alL, 1] = [1,2] (23.74c) 
L'homographie @a[k1,k2] = [k1,2k2] convient et nous avons 
[4 8,G:2, Le, ko], = (a © Pa)[k1, k2] = palk1, 2k2] = _ (23.75) 
dès que k1k2 < 0. Nous avons donc bien trouvé 
[A4,B,C, Xl # [48,0 X1: (23.76) 


A 


Le birapport n’est pas un objet tout à fait canonique parce qu’il dépend effectivement du choix 


de l'identification entre P(K?) et K. 
PROPo0oTFMQoo!IOQGvs 


Proposition 23.44. 
Soit une bijection ç: P(K?) — K. Si wa € A(w)( alors les birapports construits sur @ et £a 
coincident. 


Démonstration. Soient trois points distincts 4, B,C € P(E), et X € P(E). Nous avons 


[A,B,C,X], = (p 0 4)(X) (23.77) 
où @: P(E) — P(K?) est l'unique homographie telle que 
g(A) = w7"(c0) (23.78a) 
é(B) = 67" (0) (23.78b) 
(C) = gp !(1). (23.78c) 
Et 
[4,B,C,X]4, = (a © Da)(X) (23.79) 
où Pa: P(E) — P(K?) est l’unique homographie telle que 
ba(A) = pa (©) (23.80a) 
Ga(B) = a (0) (23.80b) 
Pa(C) = pa (D). (23.80c) 


Il est facile de voir que D = w,! 046. En effet, cela est une homographie parce que w, € A(4), et 
parce que la composée d’homographies est une homographie. De plus, 


(pa'opod)(4) = (pa 0 p)# "(c) = pas) (23.81a) 
(ga 00 6)(B) = (pa 0 p)87"(0) = va(0) (23.81b) 
(pa opod)(C) = (pa op) (1) = pal1). (23.81c) 
Au final nous avons : 
[A, B, C, X Joe = (Pa O ( 29 ®)(X) = (g O D)(X) D [A, B, (a X]e: (23.82) 


6. A(v) définie en 23.38. 
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Remarque 23.45. 
Tout le monde semble ne considérer que l'identification usuelle 0: P(K?) — K donnée par 
wolk1,k2] = k1/k2. Toute la discussion concernant la dépendance du birapport en le choix de 
l'identification (y compris la définition des classes A(4)) peut être sautée en disant qu’on ne consi- 
déra que @o. 

Et c’est ce que nous allons faire : sauf avis contraire, nous utiliserons le birapport associé à 


l'identification 0. 
LEMooCOFTooVGKdVO 


Lemme 23.46 ([588]). 
Nous avons 
do siet seulement si X = À 


[A,B,C,X], = 40  siet seulement si X = B (23.83) 


1 siet seulement si X = C!. 


Démonstration. Par définition [A,B,C,X], = go b(X). Nous avons donc équivalence entre les 
affirmations suivantes : 


— [4,B,C,X], = 00 
— (po d)(X) = wo 
— p(X) = 7" (o) 
— D(X) = 9(4) 

— A=X 


parce que @ et & sont des bijections. 
Le même raisonnement tient pour les deux autres. 


PROPooKQZRooVCXPLW 
Proposition 23.47. 
Autres petites propriétés faciles ... Soit une droite projective d = P(E) et trois points distincts 
A, B,C'E d. ITEMooUIPZooQFFYIn 


(1) Les points À, B, Cet X sont distincts si et seulement si [A, B,C, X] € Kkf0, Lhproovti 1x 
(2) Pour tout ke K, il existe un unique X € d tel que [A, B,C, X] = k. 


Démonstration. Notons pour le point (1) que l’énoncé demande déjà que À, B et C'soient distincts. 
Sinon le birapport n’est pas défini. 
(@) Q) 
Les points À, B et C sont distincts par hypothèse. Vu le lemme 23.46, pour que X soit 


distincts de À, B et C' il faut et il suffit que le birapport ne soit ni œ© ni 1 ni 0. Donc 
K\{0,1}. 

(2) (2) 
Nous avons [4,B,C,X] = @(X) où 6: P(E) — P(K?) est une homographie et donc une 
bijection par la proposition 23.22(1). Donc oui, pour tout éléments de P(K?) il existe un 
unique élément de P(E) dont le birapport par rapport à À, B et C' soit cet élément. 


Notons encore une fois que nous avons identifié P(K?) à K par la bijection (23.63). 
PROPooMGYDooHqSoJs 


Proposition 23.48 ([588]). 
Nous considérons deux droites projectives d et d' ainsi que 4 points sur chacune. Nous les nommons 
A1, 4), A3, A1 € d et A1,A5,A5, A, € d'. Nous supposons que A1, A2, A3 sont distincts et que 


1,45, 4, également. Alors il y a équivalence entre ITEMooIDKBooXHnNDi 


(1) Il existe une homographie $: d — d' telle que p(A;) = A pour à = 1,2, 8 4rMooCDUAooIckJuT 


(2) égalité des birapports : 
(A1, 4, 43, A4] S [ 1: 9) 3» A4]. (23.84) 


Dans ce cas, l’homographie est unique. 
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Démonstration. Nous divisons la preuve en trois parties évidentes. 
(1) (1) implique (2) 
Nous avons une homographie y/: d' — K telle que y/(A}) = co, w'(4}) = 0 et y/(A4) = 1. 
En composant ” avec l’homographie D: d — d' de l'hypothèse nous avons une homographie 
06: d— K qui vérifie 


(u' o )(A1) = p'(Aï) = co (23.85a) 
(u' o b)(A2) = p'(A5) = 0 (23.85b) 
(u' o p)(A3) = p'(A3) = 1, (23.85c) 


ce qui signifie que y’ o 6 est l’homographie qui définie le birapport sur d. Par conséquent 
[A1, A2, 43, Aa] 2. (u” à p)(A4) ne (44) a. [ 1 2 3 A]. (23.86) 


(2) (2) implique (1) 
La partie { A1, A2, A3} est un repère projectif de d par le lemme 23.34. Idem pour {4!, 45, A}. 
Nous considérons les homographies u: d — K et g': d' — K définissant les birapports par 
rapport à ces repères. Ces homographies vérifient, en utilisant l'hypothèse : 


u(A4) nn [ A1, A2, A3, Aa] . [A1 , 45, 45, 4°] —= u'(A). (23.87) 
Et de plus 
(A1) = A1, 49, 43, A1] = © = p’(A°) (23.88) 
u(A2) = (A1, A9, 43, A2] = 0 = p’(A5) (23.88b) 
u(A43) = [A1, 42, 43, 43] = 1 = y” (A3). (23.88c) 


Autrement dit : p(A;) = (A!) pour tout à = 1,2,3,4. Nous nous inspirons de ce diagramme : 


D - d' (23.89) 
K L {00} 
La composée 9 = 10 y vérifie 
(71 0 y)(A;) = À; (23.90) 


pour tout 4, et est une homographie. 

(3) Unicité 
Le fait qu’une homographie vérifiant 9(4;) = A! pour à = 1,2,3 soit unique découle du fait 
qu'il existe une unique homographie portant un repère projectif sur un autre. À fortiori la 
condition 9(A4) = À ne retire rien à l’unicité. 


Théorème 23.49 ([588]). 
Une bijection entre deux droites projectives est une homographie si et seulement si elle conserve le 
birapport. 


Démonstration. Chacun des deux sens séparément. 


7. Proposition 23.22(3), la composition est encore une homographie. 
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(D) = 


Soit une homographie 6: d — d’ entre deux droites projectives. Nous devons prouver que 
pour tout choix 4 points À, B, C', X dans d (dont À, B et C' sont distincts) nous avons 


[A, B,C, X] = [6(4),6(B), 6(C), é()]. OR) 


Nous nommons u: d — K l’homographie qui donne le birapport sur d par rapport à À, B et 
C', et y’: d' — K celle qui donne le birapport sur d’ par rapport à (A), o(B), o(C). Voici 
un diagramme de la situation : 


D - d' (23.92) 


Nous prouvons maintenant que y! = u 0 -!. En effet : 


(Ho #)(p(A)) = u(A) = co (23.93a) 
(Ho #1) (O(B)) = u(B) = 0 (23.93b) 
(Hop )(#(C)) = H(C) = 1. (23.93c) 


Par conséquent le birapport à droite dans (23.91) peut se calculer à l’aide de wo @ 1: 
[b(4), #(B), #0), (X)] = '((X)) = (Ho DT )(ECX)) = H(X) = [A,B,C,X]. (23.94) 


La première implication est prouvée. 
(2) = 


Soit une bijection f: d — d' conservant le birapport, ainsi que trois points distincts À, B et 

C dans d. Vu que f est une bijection les points f(A), f(B) et f(C') sont distincts dans d/. 

Par le lemme 23.34 et le théorème 23.32(2), il existe une unique homographie @ d— d! telle . 
UBFQSooVCSBooWvQLih 


que D(A) = f(a), d(B) = f(B) et d(C) = f(C). Pour tout X € d nous avons | 


(4), F(B), f(C), FO] = [A, B,C, X] So RE DER) 
= [é(4), (8), 6(C), 6(2)T 7 0 TP RARE) 
= [f(4), f(B), FC), #0]. (23.950) 


Justifications : 
— (23.95a) parce que f conserve le birapport par hypothèse. 
— (23.95b) parce que ® conserve le birapport étant une homographie (c’est le premier sens 
du présent théorème) 


Nous nommons y/: d' — K l’homographie donnant le birapport par rapport aux points f(A), 
f(B), f(C). Alors le résultat (23.95) se lit 


W'(F(X)) = #' (802). (23.96) 


Mais comme y” est une bijection (proposition 23.22(1)) cela implique f(X) = @(X). Vu que 
nous avons fait ce raisonnement pour un À quelconque dans d nous avons f = @, ce qui 
prouve que f est une homographie. 


Lemme 23.50. 
Soient a, b, c distincts sur la droite projective D = P(E). Soient x,y € E tels que mp(x) = à, 
rE(y) = b, ne(x + y) = c. Alors 

d = TE(Xx + uy) (23.97) 


si et seulement si 
[a,b, c, d] = rx2(X, ui). (23.98) 
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Démonstration. Étant donné que a et b sont distincts, les vecteurs x et y forment une base de 
E. Soit f: E — K°? un isomorphisme qui envoie (x,y) sur e1,e2 où e; sont les vecteurs de base 
de K?. Ensuite nous considérons g: P(E) — P(K?), l'homographie associée à f. Par définition 
g(rez) = T2 CE) ): Par f nous avons 


de () des () (23.99) 


Donc par g nous avons 


a © br 0. (23.100) 
Nous avons aussi f(Ax + ay) = (À,u) et 
g(c) = g(re(x + y)) (23.101a) 
= rrf(x + y) (23.101b) 
= mr (f(x) + f(y)) (23.101c) 
=. () (23.101) 
=, (23.101e) 


La dernière égalité est le fait que la direction (1,1) dans IR? est représentée par le point x = 1 
sur la droite y = 1 qui est notre « représentation » de la droite affine. L'application g a donc 
toutes les propriétés qu'il faut pour être l’application qui définit le birapport. Nous avons donc 
bien g(d) = [a,b, c, d]. 

D'une part si d = rg(Xx + y) alors 


g(d) = mye2 f (AT + ny) = Tr2(À, un). (23.102) 


Dans l’autre sens si [a,b,c,d] = nx2(XÀ,u) alors supposons que g(d) = rx2(À,u) avec d = rg(v) 
alors 
gTEv = ng2f(v), (23.103) 


ce qui implique f(v) = a(À,u) pour un certain à € K. Par conséquent v = a(Ax + y) et 
d = rng(Àr + uiy). 


23.5 Coordonnées homogènes 


Soit E un espace vectoriel de dimension n + 1 et une base {eo,... ,e,} de E. Soit M € P(E) et 

u € E un élément engendrant M. Au point M nous voudrions associer les coordonnées (x9,...,4») 

de u dans Æ. Notons que toutes les coordonnées de u ne sont jamais nulles en même temps parce que 

u doit indiquer une direction. Nous savons par ailleurs que les coordonnées (x0,...,æ,) indiquent 
le même point de P(E) que les coordonnées (x%,...,æ!,) si et seulement si x; = Ati. 

DEFooLWMHooMWxAFq 


Définition 23.51. 
La classe d'équivalence de (x0,...,%n) est la coordonnée homogène de M. Nous la notons 
ess 


Si nous avons une base {e;} de R” nous associons à M € P(E) les coordonnées (X : Y : T). 
Mais si on prend la base {2e1,e2,..., en}, les coordonnées du même point deviennent (X/2:Y :T) 
alors que du point de vue de l’espace projectif, rien n’a été changé : la classe de e: est la même 
que celle de 2e1. Les coordonnées homogènes ® ne sont donc pas intrinsèques. 


8. Définition 23.51. 


23.5. COORDONNÉES HOMOGÈNES 1941 


23.5.1 Curiosité : matrice de translation 


Si E est un espace vectoriel, l’espace projectif P(E) est l’ensemble des classes d'équivalence 
dans ÆE pour la relation v — Av pour tout À # 0. 

Il se fait que l’étude de R° peut être fait à partir de R‘ en considérant les coordonnées homo- 
gènes sur P(R*). Plus précisément, nous considérons 


p: R° — P(R‘) 


(ru, 2) + [(æ,9,2,1)]. (23.104) 


Cela est injectif mais pas surjectif parce que les éléments de la forme [(x,y,2,0)] ne sont pas 
atteints. Ces éléments sont alors dits « à l'infini » . 

Nous aurions pu placer R° dans R* de nombreuses autres manières ; chacune aurait donné une 
notion différente de « point à l'infini ». 

Nous allons maintenant montrer une petite curiosité qui à une grande importance en informa- 
tique, lors de la manipulation d'objets 3D. Nous considérons la bijection 


:R°—R 
È (23.105) 
(x,ÿ,2) + (x,y,2,1). 
Soit l'opérateur de translation T, : R° — R°. En considérant la matrice 
1 O0 O0 ax 
OT 02 
h y 
Pre eo bel (23.106) 
Qu 0e À 
nous avons 
Mir Fée (23.107) 


Autrement dit, ce passage de R° à R‘ permet de voir les translations comme des matrices, et c’est 
bien pratique. 
Si R: R° — R° est une rotation, la matrice correspondante sur R* est 


R}* = é ) (23.108) 


Elle se combine assez bien avec une translation parce que le produit donne 


Qx 
T*Rh = Fe : (23.109) 
(O0 0), À 


C'est-à-dire que la translation et la rotation restent assez visible dans la matrice composée. 
Note : pour la composition RTP, c'est beaucoup moins vrai. 


23.5.2 Dualité 


Soit Æ un espace vectoriel de dimension n + 1. Une forme linéaire non nulle est un élément de 
E*, mais aussi un représentant d’un élément de P(E*). 

Le noyau d’une forme linéaire w est un hyperplan. Le noyau de la forme linéaire ÀAw étant le 
même hyperplan, l’hyperplan est donné par toute la classe de w dans P(E*). Nous avons donc une 
bijection 

P(E*) & {hyperplans vectoriels de E}. (23.110) 

Soit un espace vectoriel E de dimension 3 muni d’une base {e1,e2,e3} à partir de laquelle nous 

construisons la base duale {e*, e*, e*} de l’espace dual E*. À un élément m € P(E*) nous associons 


la droite 
Hmn = {(X : Y : T) tel que m(X, Y, T) = 0} (23.111) 
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dans P(E). Si les coordonnées homogènes de m étaient (u : v : w) alors l’équation de la droite H 


est 
UX + 0Y + wT = 0. FeS7EnD) 


En effet si w € E* est un représentant de m alors w = A(uef + ves + weñ) et l’équation (23.112) 
est indépendante de À ainsi que du choix du représentant dans E du point (X : Y : T) dans P(E). 

Si les points m1 et m2 sont distincts dans P(E*), ils donnent deux droites m1(X, Y, T) = 0 et 
ma(X, Y, T) = 0. Les points de la droite qui joint m1 à m2 dans P(E*) sont de la forme Am: + mo 
et ils sont associés à l’équation 


X ma (X, Y, T) + pma(X, Y,T) = 0 (23.113) 


qui sont encore des droites dans P(E). Toutes ces droites passent par le point d’intersection des 
droits associées à m1 et m2. Nous avons donc 


liées vis (23.114) 
À, 


Lemme 23.52. 
L'application 
P(E*) — {droites dans P(E)} 


(23.115) 
me Hn 


est une bijection. 


Démonstration. Une droite dans P(E) est donnée en coordonnées homogènes par une équation 
aX + bY + cT = 0. Cette droite est décrite par le point (a : b : c) dans P(E*). Ce dernier 
correspond à la direction de la forme aef + beÿ + ceï. Cela prouve que l’application est surjective. 

Pour l’injectivité, si m1 Æ m2 dans P(E*), les formes w] et w2 associées dans E* ne sont pas 
multiples l’une de l’autre. Donc les équations 


aiX + bY + TT =0 (23.116) 


et 
a2X + bY + 2T = 0 (24117) 


n’ont pas de solutions communes et décrivent donc des droites distinctes. 


LemjXywjH 
Lemme 23.58. 
Trois points distincts m1, m2 et m3 dans P(E*) sont alignés si et seulement si les droites H»,, 
Ho €t Hz sont distinctes et concourantes. 


Démonstration. Supposons avoir trois points alignés, c’est-à-dire 


M3 = Mi + (Mo — mi). FENTE) 


Soit X : Y : T le point d’intersection de Hh, avec H,. Alors m1(X, Y,T) = ma(X, Y,T) = 0. En 
tenant compte de (23.118) nous avons alors évidemment m3(X, Y,T) = 0. 

Supposons maintenant que les trois droites H,,, soient concourantes. Nous avons donc un point 
(X : Y : T) dans P(E) tel que m;(X, Y,T) = 0. Si m; est la classe de a;eŸ + bjeÿ + cie alors nous 
avons le système 


aX + bY +caT =0 (23.119a) 
aX + bY + cT = 0 (23.119b) 
XL YseT= (23.119c) 
Afin que cela ait une solution non triviale nous devons avoir 
ai b: C1 
det | a2 b2 c2 | =0, (23.120) 
a3 b3 C3 


c’est-à-dire que les points (a;,b;,c;) soient alignés. 
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En tenant compte de ce qui a été dit, une droite dans P(E*) est constituée de points qui 
fournissent des droites concourantes dans P(E). Donc une droite de P(E*) se caractérise par un 
point de P(E) (l'intersection) de la façon suivante. Un point M} € P(E) donne lieu à un faisceau 
de droites passant par My. Chacune de ces droites donne lieu à un point de P(E*) et tous ces 
points sont alignés. Nous avons ainsi construit la droite d dans P(E*) correspondante au point M} 
de P(E). 


23.5.3 Polynômes 


Soit l’espace projectif de dimension n avec ses coordonnées homogènes (X0 : ...: X,). Nous 
considérons l’espace affine H = X, = 1 dans l’espace vectoriel E de dimension n + 1. Nous consi- 
dérons pour H un repère affine ayant pour origine le point (0,...,0,1). Considérons un polynôme 


homogène P sur le corps K. L’équation 
P(X0,..., Xn) = 0 (23.121) 


sur l’espace vectoriel E descend immédiatement à l’espace projectif : étant donné que P est ho- 
mogène nous avons P(u) = 0 si et seulement si P(Au) = 0. 

Nous essayons de décrire l’ensemble À des points de P(E) satisfaisant P(X6,...,Xn) = 0. 
Nous savons que les éléments de P(E) ont chacun un représentant soit dans Æ soit sur la droite à 
l'infini. Ceux de À ayant un représentant dans H sont d’équation 


Q(0,.. ,Tn-1) = 0 (23.122) 


où Q est le polynôme donné par Q(x0,...,%n-1) = P(t0,...,%n-1,1). Les points de À ayant un 
représentant sur la droite à l'infini s’obtiennent par l'équation 


Hits) = 0 (23.123) 


où R est le polynôme donné par R(xo,...,%n-1) = P(t0,...,%n-1,0). 


Exemple 23.54. 
Nous considérons la conique projective 


XP NT 2e =) Fe 492) 


Elle est décomposée en deux parties : une dans l’espace affine « normale » et une à l'infini. La 
première s'obtient en posant T = 1 dans (23.124) : 


M =x-y = 1=0. FaSf#4 34) 


L'autre est obtenue en posant T'= 0 : 
a? — y? = 0. (23.126) 


La partie à l'infini est donc composée de deux points : (1 : 1:0) et (1: —1 : 0). 
Le graphique de l'équation (23.125) est donné à la figure 23.2. Nous y voyons que les asymptotes 
sont effectivement données par les directions (1,1) et (1,—1) dans le plan. 
A 


Nous pouvons tenter de faire l'exercice inverse : considérer une conique dans R?, la voir comme 
une partie d’une conique dans l’espace projectif et trouver les points à l'infini qui la complètent. 


Exemple 23.55. 

La droite projective usuelle est donnée par la droite affine y — 1 = 0. L’homogénéisation donne 
y — z = 0 et par conséquent la partie à l'infini est donnée par y = 0, c’est-à-dire la direction (1,0) 
comme il se doit. VAN 
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= 
© + 
Es 

Cr + 


FIGURE 23.2: Le graphique de x? — x — y? —1— 0. LabelFigProjPoly 
Exemple 23.56. 
Prenons la conique 
a? +zy+ y —2=0. (23.127) 


D'abord nous homogénéisons cette équation pour la voir dans R° : 
2? 2 + ayez + y — 22 = 0. (23.128) 


Les points à l'infini sont ceux qui correspondent à z = 0, c’est-à-dire la droite donnée en coordon- 
nées homogènes par (1 : 0 : 0). A 


23.6 La sphère de Riemann P,(C) 
DEFooSZGNooTzFYbh 
Définition 23.57. 
La sphère de Riemann est l’espace projectif modelé sur €? : en vertu des notations données à 
la page 1921, c’est 
P\(C) = P(C?). (23.129) 


L'ensemble P.(C) est le quotient C?\{(0,0)}/ + où + est la relation d'équivalence de C- 


colinéarité dans C?. 
LEMooKWZDooEIraSJ 


Lemme 23.58. 
L'application 


OO si22 = 0 


: É ses AÙ FQooKTZ00 ia 
4, 21r - 


est une bijection qui respecte la conjugaison complexe : po([z; z2]*) _ go([z; z2])”. 


Démonstration. Notons d’abord que la définition a un sens parce que si un représentant que [21,22] 
est de la forme (z,0) alors ils sont tous de cette forme. L’affirmation « z1 £ 0 dans [21,22] » a donc 
un sens. 


(1) Injectif Supposons v0([z1,22]) = vo([t1. t2]). 
Si les deux membres sont égaux à © alors nous avons 22 = t2 = 0, et alors avec À = z1/t1 
nous avons (21,22) = À(t1,t2), ce qui prouve que [21,22] = [t1,t2]|. 


Si les deux membres sont égaux à zéro alors 21 = t1 = 0 et le même raisonnement tient. 
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Sinon nous avons 21/22 = t1/t2 où tous les nombres sont non nuls. Cela donne 
22 = —21, (23.131) 


et donc 
(21, 22) —, (é1, t2), (23.132) 


qui montre qu'au niveau des classes, [21,22] = [t1,t2]. 
(2) Surjectif 


Nous avons 
œo = w0([1,0]) (23.133) 


et si z £ co nous avons z = po([z,1]). 


23.6.1 Éléments de géométrie dans P,(C) 
SUBSECooQPRLooAjMNqp 


Étant donné que nous sommes partis pour faire de la géométrie dans C et même dans ŸÔ = 
€ LV {wo}, autant nous armer des équations de cercles et de droites dans ©, ainsi que de quelques 
notions adjacentes. 


Remarque 23.59. 

La définition 23.2 parle de plan et de droites projectives. [ci nous ne sommes pas dans ce cadre 
parce que nous travaillons sur P1(C) où C n’est certainement pas un espace de dimension 3. Les 
droites dont nous allons parler ne sont pas des droites projectives avec leur point à l'infini. 


23.6.1.1 Équation complexe d’une droite 


L'équation d’une droite dans R? est d = ax + by = c avec a,b,ce R et a,b non nuls en même 
temps. En posant z = x + iy nous voulons exprimer l’équation en termes de z au lieu de x et y. 
Nous avons|[591] 

r- +, =, (23.134) 
et nous pouvons écrire d = a(z + Z) — ib(z — z) = 2c, ou encore d = (a — bi)z + (a + ib)z = 2c. En 
posant w = a +bie C* et k = 2ce R nous avons l’équation 


, EQooPRCPooVv 
wz+wz = k. * PÉAEE) 
DEFooAQSMooWNOZAT 


Définition 23.60. 
Une droite est une partie de C de la forme 


d(w,k) = {2e C tel que wz + wz = k} L {ow} (23.136) 
avec we C* et keR. 


Dans ©, toutes les droites contiennent le point 0. 
PROBooZHHToo!IFNwxR 


ii Avertissement /question à la lectrice !! 23.61 
La proposition 22.11 montre que toute inversion transforme un cercle-droite en un cercle-droite, 
nonobstant d'accepter de prolonger toute droite par ©. 

Est-ce que l’on peut dire que toutes les droites contiennent le point 00 ? 

En donnant © à toutes les droites et à aucun cercle, la proposition 22.11 fonctionne partout 
en posant ic(O) = © et ic(o) = O. 

De plus en pensant à la projection stéréographique, ce serait logique : quelle que soit la direction 
dans laquelle un point s'éloigne de z = 0, son image par l'inverse de la projection stéréographique 
s'approche du pôle nord. 
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23.6.1.2 Équation complexe d’un cercle 


Un cercle de centre w € © et de rayon r a pour équation |z — w| = r, et nous avons les 
équivalences suivantes : 


l2—w=re zu =r?e (z-w)(z-ù) = 7? e rr — &z — wz = r? — [ul?. (23.137) 


Donc un cercle de centre w € © et de rayon r € R a pour équation 


2 lol? FCO RONA) 


2Z2—Wi-wWZz=T 


DEFooAUDJooVqLDhe 
Définition 23.62. 
Un cercle dans C est une partie de la forme 
C{w,r) = {ze © tel que 22 — wz — wz = r? — |w}?} (23.139) 
avec wECetreR. 
Dans la sphère de Riemann, aucun cercle ne contient le point 0. 
Exemple 23.63. 
Trouvons le centre et le rayon du cercle d’équation 
Wz +wZz = kzz (23.140) 
avec k # 0. En divisant par # et en posant o = w/k nous avons : 
23 — 02 — 03 = 0. (23.141) 
Cela est un cercle de centre © et de rayon |o|. En effet si z € C vérifie cette équation, 
l2— 0 =(2-0)(2—06)=22-02-—02+|0l? = |of?, (23.142) 
=0 


c’est-à-dire que tous les points de € qui vérifient l’équation donnée sont à la distance |o| de o. En 
particulier z = 0 est sur le cercle. AN 


23.6.1.3 Cercle-droite 


Une chose de bien avec les équations complexes, c’est que nous pouvons écrire les droites et les 


cercles avec le même type d'équations. 
LEMooHKHOooHpBuBZ 


Lemme-Définition 23.64 ([591]). 
Un cercle-droite est l’ensemble des points z € © tels que 


az? —ùz-wz=k FRERE) 


avec a, ke R etweC. 
(1) Si a = 0, cela est une droite ; 
(2) si a Æ 0, cela est un cercle. 


(3) Un cercle-droite peut être l’ensemble vide. 


Démonstration. Si a = 0 alors nous tombons tout de suite sur l’équation (23.135). Si a 0 alors 
nous pouvons diviser par a, poser o = w/a et | = k/a pour obtenir 


22-62 02= 1, FROM 


qui est l’équation (23.138) d’un cercle .. .ou pas tout à fait. En effet, (23.144) serait l'équation du 
cercle de centre o et de rayon r donné par ! = r? — |o|?, c'est ) dire 


r?=1+|0f, (23.145) 


alors que rien n’assure que le nombre { + |o|? soit positif. Dans le cas où c’est positif, nous avons 
bien un cercle. Sinon c’est l’ensemble vide. 
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REMooBMAEooHDvNID 
Remarque 23.65. 
Lorsque nous parlons de cercle-droite, nous parlons de partie de © et non de © parce que l'équation 
(23.143) a du mal à traiter le cas z = 00. À cause du fait que nous avons décider de donner le point 
œ à toutes les droites, la fusion des notions de droites et de cercles n’est pas totale; en tout cas 


pas en une seule équation. 
EXooKFBTooUJKjGL 


Exemple 23.66 ([591]). 
Soit le cercle de centre w = ir et de rayon r. Quelle que soit la valeur de r > 0, ce cercle passe par 
le point 0 et l’axe réel lui est tangent. L’équation de ce cercle est : 


2r +irz —irz = 0. (23.146) 
Vu que ir £ 0 nous pouvons diviser et obtenir 


ei) (23.147) 
1 


En faisant tendre r vers © nous obtenons z — Z = 0, c’est-à-dire l'équation de la droite réelle. 
Cela explique pourquoi il est souvent dit qu’une droite est un cercle dont le rayon est à l’infini. 
A 
NORMooCXVJooMTMqEU 
23.67. 
Notons que l’exemple 23.66 est générique : prenez une droite £, un point P sur £, et considérez un 
cercle dont le centre est situé sur la perpendiculaire à / passant par P, et dont le rayon est tel que 
le cercle passe par P. En prenant |w — P| — «, l'équation du cercle devient celle de la droite £. 
Cela est particulièrement pratique lorsque nous travaillons dans Ê parce nous y avons une 
notion précise du point à l'infini. Notons que (peut-être contre-intuitivement), il existe un seul 
point à l'infini dans ©. Et ce point est le centre de tous les cercles que l’on veut transformer en 
droites. Cela pose évidemment la question de savoir comment on définit précisément un cercle dont 
le centre est réellement 00. 


23.6.1.4 Rotation-homothétie 


Définition 23.68. 
Une rotation-homothétie est une application © — € de la forme z — Àz avec À € C. 


Le nom provient du fait que si À est réel, alors z > Àz est une vraie homothétie, et si À = e? 


alors z + eŸz est une vraie rotation. Pour une valeur À € € générique, l'application z > Àz est 
une composée des deux. 
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23.6.1.5 Application linéaire 
SSUBSooRBCWooSCIQEL 


Nous nous en voudrions de ne pas parler d'applications linéaires lorsque nous parlons de géo- 
métrie sur C. Soit « € C* et 5 € C. Lorsque nous parlons de l’application linéaire 


: Ê — È 
Ï (23.148) 
z2+ az + B, 
nous entendons implicitement que f(00) = co. 
23.6.1.6 Inversion 
SSUBSooPOUNooTPilbE 


L'inversion d’un cercle de R? est définie par la proposition 22.5. De nombreuses propriétés y 
sont décrites, y compris son écriture complexe dans la proposition 22.10. Tout cela était du temps 


de R? ou de €, mais maintenant nous sommes dans C et nous voulons plus. 
DEFooIUTZooWRaXts 


Définition 23.69 ([591]). 
SoientweCet Re R*. L'inversion de centre w et de puissance R? est l'application 


iC—C 
2 
2-5 +w size C\{w} (23.149) 
FR À Si Z = W 
W Si z — ©. 


Notons que grâce aux conventions type 1/0 = et 1/00 = 0, nous pouvons nous contenter de 
la première formule pour tout z € C, et nous n’avons en réalité pas besoin de décrire (0) et i(w) 
séparément. 


Exemple 23.70. 
L’inversion de cercle de centre 0 et de rayon 1 est l’application z + 1, que l’on prolonge avec 
0 et or 0. A 


23.6.2 Homographies 


La notion d’homographie est la définition 23.20. Pour une homographie : P,(C) — P.(C) nous 
avons un isomorphisme d’espace vectoriel @: ©? — C?. Vue la bijection (23.130), nous voulons 
plutôt travailler avec © = © LU {oo} qui est un ensemble avec lequel nous sommes plus familier. 
Nous allons donc travailler avec 


(23.150) 


PROPooTZJBooPpowDo 
Proposition 23.71. 
L'application  — Po! o po wo est une homographie de P(C?) si et seulement si l'application 
d: Ÿ — € est de la forme 


= az + b 
ne 


(23.151) 


avec a, b,c,de © tels que ad — bc # 0. L 
Par convention nous posons 2/0 = © dès que z Æ 0 ; en particulier (00) = a/c et p(—d/c) = ©. 


Démonstration. Nous séparons la condition suffisante de la condition nécessaire. 


(1) = La condition 7 o 4 = bo r (de (23.32)) nous dit que 


[b(z1, 22)] = #([1, 22), (23.152) 
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et comme ® est un isomorphisme d’espace vectoriel nous avons à, b, c, de € vérifiant ad— cb 
0 pour lesquels 
_ az1 + bz2 
_ : 23.153 
p(21, 22) e + . ( ) 
Soit z € C. Alors nous avons 


O(z) = (vo © #)[z,1] = eo([é(z )]) = po([az + b,cz + d]) = _ Ponte 3190) 


Il est important de comprendre que cette formule fonctionne pour tout z € C. En effet nous 
pourrions avoir un doute sur z = —d/c. D'abord si c = 0 alors d Æ 0 et ce problème n'existe 
pas : le dénominateur est toujours non nul. Nous avons donc seulement un doute lorsque 
c Z 0. Dans ce cas, 


_ ad +5 
(4/9 = 


Mais c # 0, donc le numérateur est non nul. Or lorsque z # 0 nous avons posé z/0 = 0, 
donc dans notre cas, 


(23.155) 


g(—d/c) = w (23.156) 


automatiquement, et cela est encodé dans la formule (23.154). 
Il nous reste à déterminer @(0). Nous avons : 


a/c sicÆ0 


| (23.157) 
ee sic=0 


p(o0) = (po © #)([1,0]) = vo[(1,1)] = po([a, cl) = 


où la distinction entre les deux cas n’est pas fondamentale parce que si c = 0 alors a 0 et 
djc—= 66: 
= 


En notant Z = [21,22] (pour 1,22 € C) nous avons 


apo(Z) + b 
cpo(Z) + d 


P([z1, 22]) = w 1 ( ) = [apo(Z) + b, cpo(Z) + d]. (23.158) 


Nous définissons @ par son action sur les vecteurs de base : 9(1,0) = (a, c) et 6(0,1) = (b, d). 
Nous avons bien l’isomorphisme d’espace vectoriel 9: €? — €? dont nous avons besoin pour 
la définition 23.20. D'abord le fait que ad — cb soit non nul assure que le 4 ainsi défini est 
bien bijectif”. Et de plus ce @ vérifie la condition 


r(9(21,22)) = r((az, ca) + (b22, d22)) (23.159a) 
= [az + b22,c21 + da2| (23.159b) 
= [ago(Z) + b, cpo(Z) + d] (23.159c) 
= p(r(1,2)). (23.159d) 


Nous avons utilisé la notion de classe pour diviser par z2 et faire apparaitre 0(Z). 


Remarque 23.72. 
En prenant les conventions relativement claires 5 x a = © (pour a Æ 0) et © + a = © (avec 
a £ ©), alors tout est dans la formule 


_ az + b 
= 23.160 
à) = (23.160) 
avec ad — cb Æ 0. Il n’y à pas besoin de traiter séparément le cas z = © ou z = —d/c. 


9. Si vous n’en êtes pas convaincu, écrivez la matrice de l’application qui envoie (1,0) sur (a, c) et (0,1) sur (b,d), 
et demandez-vous sous quelle condition elle est inversible. 
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DEFooAMQHooPFUgla 
Définition 23.73. 
Nous aimons tellement l'identification wo: P(C?) — Ê que nous allons parler d'homographie 
sur Ÿ pour les applications @ de la forme 


- az + b 
6 rare (23.161) 


avec ad — cb Æ 0. 
NORMooCVYKooYvjleE 


23.74. 
La proposition 23.71 nous indique que les homographies de © sont de la forme 6 = Po logo 0 
pour une homographie D: P(C?) — P(C?). 

PROPooSQFOooRgin;jJ 
Proposition 23.75 ([591]). 
L'application h: Ê — À associée à une homographie est soit linéaire, soit de la forme h = lo10ol 
où l; sont linéaires et v est l’application z — 1/2. 


Démonstration. Commençons par une remarque : lorsque nous parlons d’une application linéaire, 
c’est au sens de la note 23.6.1.5 qui explique qu’une application linéaire sur C est automatiquement 
prolongée à © par f(00) = 0. 
Soit donc l’application 
az + b 


RQ) = (23.162) 


Si c = 0, alors c’est une application linéaire et la preuve est terminée. Nous supposons que c Æ 0. 
Nous posons 
l(z) = cz + d, (23.163) 


et ensuite l1(2) = az + B avec a et B à déterminer. Un peu de calcul : 


1 ) __ œ+ Cr + ae (23.164) 


cz + d 


(1\orcol2)(z) = (- 


et en imposant que cela soit égal à 2e? nous trouvons B = a/c et à = b— ad/c. Il est vite vérifié 


que ces choix donnent le bon résultat. 


NORMooMMKOooQ1zjqJ 
23.76. 
Vu que les applications linéaires sont des composées d’une translation et d’une rotation-homothétie, 
et que l’application à est une composée d’une inversion z + 1/z et d’une réflexion 2 + Z, toutes 
les homographies sont des composées des éléments suivants : 


10 2++ 1/7, prolongée par i(oo) = 0 et i(0) = ; 


— inversion 
— réflexion #2; 
— translation z2+ z + a avec a € C; 
— rotation-homothétie z + Àz avec À € C. 
Toutes ces opérations sont prolongées à € par 1/00 = 0, À : 0 = w (si À # O0) et 00 + À = 00. 
Nous ne définissons pas 0 : 00 et 00 — 00. 


Certes nous pouvons construire des homographies à partir d'ingrédients dont la conjugaison 


complexe. Il ne faudrait cependant pas déduire que cette conjugaison est une homographie. 
LEMooGDDJooBpJlUf 


Lemme 23.77. 
La conjugaison complexe n’est pas une homographie. 


10. Oui, c’est l’inversion de la géométrie hyperbolique, voir 23.6.1.6. 


23.6. 
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Démonstration. Si elle l'était nous aurions des nombres a, b, c, d € C tels que ad — bc Æ 0 et 


b EQooJMAZooVc] 
a. RooJMAZONE TEA 
cz + d 


pour tout ze C. 
En posant z = 0 nous avons déjà b/d = 0, c’est-à-dire b = 0. Avec z = 1 nous trouvons alors 
a/(c+ d) = 1, c’est-à-dire 


(1) 


a=c+d. (23.166) 


Sici+dZÆ0 
Dans ce cas nous pouvons évaluer (23.165) en z = à et avoir a = —ci + d. Mais comme nous 
avions déjà a = c + d nous déduisons € = 0. Nous restons donc avec 


a 

d 
pour tout z. En prenant 2 = 1 puis z = 4, il est vite remarqué que cela n’est pas possible. 
Sici+d=0 


z2= 2 (23.167) 


Nous rappelons que ad £ 0. Nous écrivons l’équation avec z = —i pour trouver 
— ai 
© =, 23.168 
—ci + d 


qui donne immédiatement a = ci — d. Nous avons donc les trois équations 


c= id (23.169a) 
a=ci-d (23.169b) 
a=c+d. (23.169c) 


Une tentative de résolution tombe rapidement sur une impossibilité (en substituant la pre- 
mière dans les deux autres et en comparant les deux valeurs de a par exemple). 


La proposition suivante ressemble à s’y méprendre à la proposition 22.11, mais elle diffère en 
deux points. D’abord elle ne traite que de l’inversion par rapport à l’origine, mais surtout, elle 
traite le point z = 00. C’est un avantage de travailler sur C plutôt que sur R?. 


PROPooEAKXooUIqWEv 


Proposition 23.78 (Inversion de cercles et de droites). 
L'inversion dans C envoie 


(1) 
(2) 
(3) 
(4) 


une droite passant par O0 sur elle-même 
une droite ne passant pas par O0 sur un cercle passant par 0. 
un cercle ne passant pas par 0 en un cercle ne passant pas par 0. 


un cercle passant par 0 en une droite ne passant pas par 0. 


Démonstration. Décomposition en tous les cas possibles. 


(1) 


Droite passant par 0 


La façon la plus simple de traiter la droite passant par 0 est de l'écrire sous forme paramé- 
trique : 


z(t) = teit (23.170) 
pour 0 fixé et t € R L {wo}. En appliquant l’inversion : 
1 Le 
(z(t)) (tei®)* rs ( ) 


Notons que les cas particuliers fonctionnent : pour { = 0 nous avons le point 0 et pour t = © 
nous avons (. 
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(2) Droite ne passant pas par 0 


Une droite ne passant par par z = 0 est un ensemble de la forme 
d(w, k) = {2€ C* tel que wz + wz = k} L {oo} (23.172) 


avec k # 0. Étant donné que « est une bijection et même une involution nous avons z € 
e(d(w, k)) si et seulement si r(2) € d(w,k). L’équation est donc, pour 2 # 0 : 


= k. (23.173) 


Et comme z Æ 0 nous pouvons multiplier par zZ pour trouver Zw + zw = kzz. Donc 
u(d(w,k)) = {z € C* tel que 2w + zw = kz2z} U {0}. (23.174) 


Dans l’ensemble, nous pouvons renommer z et Z pour avoir une forme plus symétrique. De 
plus il se fait que z = 0 vérifie l'équation donnée; nous pouvons donc lever la condition 
z € C* et ne plus ajouter {0} à côté : 


u(d(w,k)) = {ze © tel que wz + wZ = kzZ}. (23.175) 


Cela est l’équation d’un cercle passant par l’origine (définition 23.62). 


(3) Cercle ne passant pas par 0 


Nous considérons le cercle C{w, r) avec r? Z |w|?. Il ne contient ni © ni 0 et nous avons alors 


1 1 1 
u(C(w,r)) = {ze C* tel que — — ©= — w- = r° — |wf?}. (23.176) 
22 £ z 


Vu que z n’est jamais nul nous pouvons multiplier l’équation par 2 : 


u(C(w,r)) = {ze © tel que (|wl” — r?)237 — w2 —wz = —-1}. (23.177) 


Le coefficient |w|? — r? est non nul par hypothèse et cet ensemble est un cercle par le 
lemme 23.64. Il ne passe manifestement pas par z = 0. 


(4) Cercle passant par 0 


Le cercle passe par 0, et donc son image par 0. Nous écrivons alors 


L(C(w, lwl)) = &(C(w, [wl)\{0}) Ü {oo}. (23.178) 
Nous avons 
C(w,|w|)\{0} = {ze C* tel que 2 — wz — wz = 0}, (23.179) 
et un calcul usuel donne 
s(C{w, [w|)\{0}) = {ze C* tel que 1 — &z — wz = 0}, (23.180) 
et donc 
(C(w, |w|)) = d(w, 1), (23.181) 


en nous souvenant que le point © est contenu dans d(w, 1). 


PROPooYFJBooAWxFIs 
Proposition 23.79. 
Une homographie conserve l’ensemble des droites et cercles de C. 


Attention : cela ne veut pas dire qu’une homographie transforme une droite en une droite et 
un cercle en un cercle. Ça veut dire qu’une homographie transforme une droite en une droite ou 
un cercle et un cercle en une droite ou un cercle. 


H 


Æ 
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Démonstration. Nous savons par la proposition 22.11 et 23.76 que les homographies se décomposent 
en inversion, réflexion, translation et rotation-homothétie. 

À part pour l’inversion, tout est clair comment ça fonctionne hein. En ce qui concerne l’inver- 
sion, nous avons la proposition 23.78 qui donne déjà toutes les réponses. 


23.80. 
Les homographies préservent les angles, c’est l’objet du théorème suivant. Il ne faudrait cependant 
pas croire que si À, B et C' sont trois points distincts, l’angle entre AC' et BC est le même que 
celui entre f(A)f(C) et f(B)f(C) dès que f est une homographie. Cela serait préserver les angles 
globalement, c’est-à-dire préserver les angles lorsque les points sont déplacés par f. 

Nous allons regarder les angles locaux, c’est-à-dire lorsque les points sont déplacés par df. 


Définition 23.81. 
Nous disons qu'une application f : R? — R? préserve localement les angles non orientés lorsque 


cos (dfa(u), dfa(v)) = cos(u, v) (23.182) 


pour tout a e R? et u,v e R?. Ici il est mieux de penser à u,v € TIR? pour qui sait les espaces 
tangents en géométrie différentielle. 


Voir la définition de l’angle 18.52. 


Théorème 23.82. 
Les homographies de P(C?) préservent localement les angles non orientés. 


Démonstration. En ce qui concerne les translations, dilatations et rotations, les choses sont claires. 
Vérifions pour l’inversion, qu’il faut interpréter dans IR?. Pour z = x + iy nous avons 


1 T y 


(== (23.183) 
Nous devons donc étudier la fonction 
F:R?-—R° 
x y (23.184) 
(æ, y) > (> nn) 


où nous avons posé r? = x? + y? pour simplifier les notations. 


Soient deux vecteurs u, v e R? et un point a € R?. Nous devons prouver que 


u'v _ dFalu) " dF(v) EQooRXSJo 
lallel Tr CoTdR CI BF T8) 


Pour cela, nous pourrions calculer dF, et passer en coordonnées polaires[(588] mais nous préférons 
faire les calculs à la dure parce que nous avons Sage avec nous. 
Nous notons À la matrice de dF en a = (x,y) et nous avons 


Au : Av = A'Au : v (23.186) 


ainsi que |u] = 4/u : u = V AtAu : u, de telle sorte qu’il devienne urgent de calculer AA. Voici 
le calcul : 


var(’y’) 


3l# les fonctions coordonnées 


F1Cx,y)=x/(Cxxx2+yxx2) 


51F2Cx,y)=-y/(Cxx*x2+yxx2) 
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# La matrice différentielle 

A=matrix( [ [F1.diff(x).simplify_ful1(),F1.diff(y).simplify_full 
(11,[CF2.diff(x).simplify full (),r2.diff(y).simpliify full ()] <= 
1 ) 


# Quelqu'un peut expliquer pourquoi ceci ne fonctionne pas ? 
# A=matrix( [ [F1.diff(x),F1.diff(y)l,[F2.diff(x),F2.diff (y)] 1 
).simplify_full() 


3[# ATtA 

1[S=A.transpose ()*A 

5[S=$S.simplify_full() # Mais ça, ça marche !! 
| print (S) 


tex/sage/sageSnip009.sage 


Le résultat est que 
1 


AA _ 1) id (23.187) 
0 7 T 


La vérification de (23.185) est alors immédiate. 


23.6.3 Birapport 


Nous introduisons maintenant quelque chose qui s’appelle le « birapport » et qui n’est à priori 
pas du tout lié au birapport défini en 23.41. 
DEFooQYHVooMZwQMB 


Définition 23.83 (Birapport dans C[522]). 
Soient a,b,c,x € € où a, b et c sont distincts. Le birapport de ces quatre nombres est l’élément 
de € donné par, si a, b,c Æ © : 


ne (a — _ — 0 EQooQJWZongrK al 


(b—c)(a— x) 
el 
bal 1 = ! SUBEQooNSON DE YuzE 
fa, 2, ca] = — (23.189b) 
[a,b, 00, x] = — (23.189c) 
23.84. 


Notons la « logique » des cas particuliers. Pour le premier, si a — © tandis que les autres restent 
dans € alors a — c et a — x deviennent du même ordre de grandeur et se simplifient. Il reste les 
deux autres parties de la fraction. 

C’est cette même logique qui, partant de [a,b,0,x| — b& donne 


[a, b, oo, oo] = 1 (23.190) 
comme il se doit si nous avons l'intention de ressembler au lemme 23.46. 


L'objet « birapport » introduit ici est évidemment lié au birapport sur P(C?) défini plus haut. 
Le lien est la proposition suivante. 
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PROPooLKQQooEUr jwC 
Proposition 23.85. 
Soit l'application po: P(C?) — € définie en 23.36. Si A, B,C, X € P(C?) alors 


E E07ZZ 
[A, B,C, Xe = [vo(4), vo(B), po(C), po(X)]. RE EET) 
Cela est une égalité dans Ê. 


Démonstration. Nous écrivons À = [a1,a2|, B = [b1,b2], C = [c1,c2] avec a1, a2, b2, bo, C1, c2 € C. 


he se ne SL. 2) 2 un: : 

qi SGBRILEET LB GX #0 = (go © &)(X) où p: P(C*) — P(C*) est l'unique homographie telle 
las, ao] = [1,0] (23.192a) 
[b1, b2] = [0,1] (23.192b) 
le, c] = [1,1] (23.192c) 


Une des difficultés de cette preuve va être de calculer ce 9. D'abord nous pouvons introduire 
= Po0P0E ! qui est obligatoirement (proposition 23.71) de la forme 


+ a+ 


_ | 23.193 
= + (23.193) 
Nous allons imposer les relations (23.192) pour déterminer les coefficients a, B, 7 et 6. 
D'abord 
(5° ° 80 po)([ar, a2]) = (p5° © #)(a1/a2) (23.194a) 
a + 
—] a2 
— 23.194b 
Lo ( na ;) ( ) 
= [a + 8,7 + 6]. (23.194) 
a) a2 
Égaler cela à [1,0] donne 
a +840 (23.195a) 
a2 
4e (23.195b) 
a2 
Donc nous avons déjà 
- az + az + 
(z) = no — ; (23.196) 
1G-%)  7(2-v0(4)) 
En y imposant la contrainte (@5 ! 0 @ 0 40)([b1,b2]) = [0,1] nous trouvons les contraintes 
(vo(B) — o(A)) # 0 (23.197a) 
B = —-ayo(B). (23.197b) 


Nous avons décidé d'écrire o(A) au lieu de a1/a2 à la fois pour un soucis de simplification d'écriture 
et dans le but de ressembler à (23.191). En substituant : 


1) — a(z — po(B)) 
(2) aa) (23.198) 
La condition pour [c1,c2] donne 
[a(o(C) — vo(B)),+(o(0) — vo(4))] = [1,1], (23.199) 


ce qui donne 
a(wo(C) — vo(B)) = y(v0o(C) — vo(À)). (23.200) 
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Nous avons alors 


__ po(C) — vo(B) 
7 Tpo(C) — v0(4)’ Pr. 
et les à se simplifient dans la formule pour à : 
— (z — po(B)) (vo(C) — vo(4)) (23.209) 


(z — vo(A)) (vo(C) — vo(B)) 


Par la proposition 23.71, l'application 4 logo wpo est une homographie. Nous pouvons donc 
calmement calculer le birapport [A,B,C, X{,, de la façon suivante : 


[A, BEC XJo0 = (0 0 ue ) (23.203a) 
= (goopÿ' 00 po)(X) (23.203b) 
= p(po(X)) (23.203c) 

_ (o(X) — v0(B)) (p0(C) — 0(4)) 
(0(X) — 0(4)) (v0o(C) — vo(B)) Re0ÈS) 
= [po(4), po(B), vo(C), vo(A)]. (23.203e) 
PROPooQGPFooReNaGq 


Proposition 23.86. 
Les homographies de € conservent le birapport. 


Démonstration. Ici le mot « homographie » réfère à la définition 23.73 et le birapport à 23.83. 

Soient à, b,c,x € © et une homographie 9: € — €. Il existe une homographie ©: P(C?) — P(C?) 
telle que D = 0 © Po !. Alors 

[é(a), d(),8(0), (x)] = [bo 45 )(a), (bo 5 )6), (6045 (0). (pop )(x), 1, (23.204) 

= [vo (a), #0" (b),v o (vo (LI, (23.204b) 

= le, be]. (23.204c) 


Justifications : 
— Identification des birapports sur P(C?) et sur Û, proposition 23.85. 
— Invariance du birapport sour les homographies (dans P(C?)), proposition 23.48. 


PROPooSGCJooLnOLCx 
Proposition 23.87. 
Soient des points a. b, c, x dans © avec a, b, c distincts. Ils sont alignés ou cocycliques si et seulement 
si [a,b,c,x] € Ê. 


Démonstration. Nous allons faire plusieurs cas. Mais dans tous les cas vous pouvez relire la défi- 
nition des angles orientés 18.147 et la partie sur les angles dans les nombres complexes 18.10.12. 


(1) Tous les points sont distincts et dans C 


D'une part, nous savons que le nombre complexe re!° est réel si et seulement si 4 e [0],, et 
d’autre part l'argument du birapport (23.188) est 


[aä, cb] + [rb, rl. (23.205) 
Le birapport est réel si et seulement si 
[cà, cb] — [rà, xb] e [0]. (23.206) 


À gauche nous avons une classe modulo 27 et à droite une classe modulo x. L'égalité signifie 
qu'il y a un représentant du membre de gauche qui appartient au membre de droite. Si vous 
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aimez faire très attention à ce que signifient les notations, voici trois manières d'écrire la 
condition, par ordre croissant de précision : 


[cà, cb] — [rà, xd] = [0x, (23.207a) 
[eà, cb] — [ra rè] € [0}+. (23.207b) 


[cà, ©] — [à rè] € [0x SUBENOOAGT Ag rEEAN 


Nous avons donc que le birapport est réel si et seulement si la condition (23.207c) est vérifiée. 
D'après le théorème 18.155, cette dernière condition est équivalente à dire que les points a, 
b, cet x sont alignés. 


(2) Pas quatre points distincts, dans C 


Nous supposons encore que &, b, c et x sont dans C. Maïs nous supposons que x est un de 
a, b ou c. Vu que par hypothèse a, b et c sont distincts, c’est le seul cas à considérer dans la 
catégorie des 4 points non distincts. 
Trois points sont toujours alignés ou cocycliques !!. Donc nous devons seulement montrer 
que dans ce cas le birapport est toujours dans R. Par définition. 

— Six = a alors [a b,c,x| = 00, 

— Si x = b alors [a,b,c,x] = 0, 

— Si a = c alors [a,b,c,x] = 1. 
Dans tous les cas de figure le birapport est dans R. 

À ce niveau de la preuve nous devons encore vérifier les cas où a, b, c ou x valent 00. Si l’un 
de a, b ou c est et si x l’est aussi, alors, comme © est aligné avec tout, nous avons seulement 
une droite passant par deux points. Il nous faut donc seulement regarder les cas où un seul des 4 
points est 00. 

(1) Sia = Le birapport est alors (par (23.189a)) 


— 


[oo b, c, x] = (23.208) 


? 
a— x 
qui est un nombre à priori complexe dont le dénominateur est supposé non nul parce que le 
cas a = x est déjà traité. L’argument de ce nombre est dans la classe de l’angle orienté 


arg (=) e [r, xl. (23.209) 


Le birapport est réel si et seulement si le membre de gauche est dans [0],. Et cela est 
justement le cas où le membre de droite donne des points alignés. 


Les cas b = ©, c = © et x = © se traitent de la même manière. 


23.6.4 Division harmonique 


Définition 23.88. 
Nous disons que les éléments a, db, c et x de Ü sont en division harmonique lorsque |[a,b, c, x] = 
—1. 


NORMooUWYDooAZTTWu 
23.89. 
Une chose qui sera utile par la suite est de remarquer que {a, b,c, 0] = —1 lorsque c = ae, 


Nous allons maintenant voir comment, pour a,b,ce © donnés nous pouvons construire x tels 
que à, b,c,x soient en division harmonique. Vu que trois points sont soit cocycliques soit alignés 
nous divisons la construction en deux parties. 


Notons que si nous trouvons une construction qui donne un point x vérifiant [a,b,c,x| = —1 
alors nous prouvons au passage que la construction ne dépend pas des choix intermédiaires parce 
que il n’existe qu’un unique x tel que [a,b,c,x] = —1 lorsque à, b, c sont donnés. 


11. Si ils ne sont pas alignés, prendre la médiatrice du segment [a, b] et celle de [b, c], et l'intersection vous donnera 
le centre d’un cercle passant par a, bet c. 
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LEMooAEDTooKsUoPw 
Lemme 23.90 ([592, 593]). 
Soient a, b,c cocycliques dans C. Nous nommons C le cercle contenant a, b et c ainsi que T, et Tr 
les tangentes à C en a et b. Soit m = T, n Ty et la droite L = (mc). Alors le point 


x = (mc) nC (23.210) 


vérifie [a,b,c,x] = —1. 
Sim = © (arrive lorsque T, || Ti) alors en guise de L nous prenons la parallèle à T, passant 
par c. 


Démonstration. Nous séparons les cas suivant que m = © ou non. 
(1) m = 00 

Les tangentes à € en a et en b sont parallèles, c’est-à-dire que ces points sont diamétralement 
opposés sur C. Les homographies préservent le birapport (proposition 23.86), et les rotations, 
dilatations et translations sont des homographies (voir 23.76). 

Nous pouvons donc nous ramener au cas où € est centré en 0 et de rayon 1 avec a = à et 
b= —i. Dans ce cas, c = e, Vu que x est donné par l'intersection entre le cercle et la droite 
horizontale passant par c nous avons x = e(T-6), Le birapport se calcule explicitement : 

(à _ e)(— Fe ee#)) 


tes = cd) = et-0) = —]. (23.211) 


(2) m £ 00 
Nous sommes dans la situation suivante où à une translation près nous supposons x = 0 : 
” q 
m 
C 
b 
Nous allons prouver que dans ce cas, [a, b,c,x| = —1. Pour cela nous considérons l’inversion 


de centre æ (qui est x = 0 par translation). Soit ® cette homographie. Elle conserve a 
birapport, il nous allons voir que calculer [g(a), @(b), @(c), (x)] se révèle être plus facile !? 
Nous nommons À = (am), B = (bm), C = (cm) et C, le cercle. Nous allons maintenant faire 
intensément usage de la proposition 23.78. Nous avons : 

—— (A) est un cercle passant par 0. 

— (B) est un cercle passant par 0. 

— (C) est la droite C. 

—— @(C) est une droite ne passant pas par 0. 
Les droites À et B se coupent en m et en (qui sont des points distincts). Donc les cercles 
@(A) et @(B) se coupent en 0 et @(m), aucun de ces deux points n’est sur la droite @(C). 
Par tangence, la droite A et le cercle C se coupent en un seul point (a). Donc O(A) coupe 
@(C) en un seul point, d(a). Idem pour le cercle ÿ(B). 
Nous avons donc que les cercles g(A) et @(B) sont tangents à la droite @(C) et se coupent 
en exactement deux points distincts (qui sont donc du même côté de la droite). 
Nous nous intéressons à la droite g(C). C’est une droite parce que c’est l’image d’une droite 
passant par 0. Elle passe par 0, par @(c) et d(m). Le fait qu’elle passe par 0 et D(m) fait 


12. Si vous n’avez peur d’aucun calculs, il suffit de poser a = e"°, b = eŸ° et c = eŸ° et vous êtes théoriquement 
capable de calculer les coordonnées de tous les points, y compris de x en termes de 0 et o. Ensuite le calcul du 
birapport est explicite. 
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que c’est la droite passant par les deux intersections des cercles. Vu que ceC AC, le point 
d’intersection d(C) n @(C) est @(c). 

Quelle est la puissance du point ®(c) par rapport au cercle (A)? En la calculant avec la 
droite D(C'), qui intersecte les deux cercles aux points déjà étudiés, la puissance est : 


k = d(g(c),0) x d(g(c), g(m)). (23.212) 


Vu que ces points sont également sur le cercle (B), la puissance de @(c) par rapport à ce 
second point est la même. 


Tout cela justifie le dessin suivant ! : 


gta) 0) g(b) 


Mais la droite passant par (a) et d(c) (qui est tangente au cercle) permet également de 
calculer cette puissance : 


k = d(@(a), (c)). (23.213) 
Idem pour la puissance par rapport à l’autre cercle : 


k = d(@(b), g(c)). (23.214) 


Nous en déduisons que @(c) est le milieu entre @(a) et @(b). 


Du coup 
[é(a), d(b), d(c), 2(x)] = [é(a), #(b), dc), co] = —-1 (23.215) 


en vertu de ce que nous avons raconté en 23.89. 


LEMooYBTHooABWkeo 
Lemme 23.91 ([593]). 
Soit a,b,ce © colinéaires. Soit m un point hors de cette droite. Nous considérons une droite issue 
de c coupant [ma] en p et [mb] en q. 
Nous construisons n = (aq) n (pb) et finalement x = (mn) n (ab). 
À la fin nous avons 


[a, b,c,x] = —1. (23.216) 


Démonstration. Commençons par un dessin de la situation : 


13. Bien que ce ne soit pas strictement nécessaire à la preuve, est-ce que vous savez si les deux cercles ont le même 
rayon ? Et si par hasard la droite ((m)o@(c)) n'arrive pas perpendiculairement à @(C) ? 
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Les points a, b et m ne sont pas alignés, et nous pouvons les utiliser comme repère barycentrique 
(voir 8.51 pour savoir en deux mots ce que c’est). Nous nommons (a, 8,7) les coordonnées de n 
dans ce système, c’est-à-dire que 

an + Bnb + ynmi = 0. (23.217) 


Dans notre contexte, nous pouvons voir le vecteur 8 comme une façon d'écrire le nombre { — s. 
Par la proposition 8.58 nous savons les coordonnées barycentriques de Long et_q.en regardant le 

. os 5 . : SUBÉQSooKKIXo0Zb vHe 
triangle acb. Voici les coordonnées et les relations qu’elles signifient : | 


n = (a,8B,7), anû + Bnb + ynmi = 0 (23.218a) 
p = (a,0,7), apà + ypri = 0 (23.218b) 
g= (0,8,7); Bqb + yami = 0 (23.218c) 
z = (a, 8,0) or + Bb = 0707 000 RTE STE A} 


Nous voudrions maintenant voir les coordonnées de c. Nous posons c = (à, u, a) : 
EQooZKBS 
à + cb + om = 0. sn EZE STE) 


Mais a, b et c sont alignés, donc cà et cb sont colinéaires, alors que ©mi n’est pas aligné avec les 
deux autres. L’annulation (23.219) demande donc l’annulation séparément 


oc = 0 (23.220a) 
Xc + He : pp FEASONTÉROnAENE (23.220b) 


Nous en déduisons que & = 0 et aussi que À et u ne sont pas nuls. Nous posons arbitrairement 
À = 1 parce que les coordonnées barycentriques sont définies à coefficient multiplicatif près. 

Nous imposons à présent le fait que p, q et c sont alignés. Pour cela nous devons faire apparaitre 
les vecteurs pà, pë, pè. Vu le dessin et les relations disponibles (23.218) le mieux est d’utiliser les 
relations de Chasles (proposition 8.5) pour faire cà = ch + pà et cb = cÿ + qb. La relation (23.220b) 
devient : 

D + pà + u(c + qd) = 0. (23.221) 


Les vecteurs cp et cÿ sont alignés, donc nous les écrivons ensemble. Les vecteurs pà et ab se 
transforment en utilisant les relations (23.218) : 


D + AC — Pi ETS (23.222) 


Enfin nous voulons faire la somme du terme pri avec le terme gmi. D'abord on change le signe : 


D + ucù — Vpn + Eu (23.223) 
a 
ensuite nous écrivons UY y Y 7 
= Fe . 23.224 
se ( ) 


et 


cp + pe — pr + md) + (EX 4 2) 9 0 (23.225) 
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Tout cela pour 


À + Hù — à + (2 Fe 2) à 0 (23.226) 


Le dernier terme n’est pas colinéaire aux deux premiers et s’annule donc séparément : 


Aa e (23.227) 


B a 
Cela donne y = —B/a. 
Au final nous avons 


Tà — a = (23.228) 


et donc 


ac — Bcb = 0, DE 0) 


ce qui donne les coordonnées (a, —/53,0) pour le point c. 
Vu que nous somme dans l’espace vectoriel C, ce que nous notons AB n'est rien d’autre que 
la différence B — A dans C l#. La relation (23.229) signifie donc 


a(a — c) = B(b—c). (23.230) 
Nous avons alors : 
= (23.231) 
b—c «à 


Par ailleurs, la relation (23.218d) à propos des coordonnées de x donne 


CR (23.232) 
b—x a 
En égalisant les deux valeurs de B/a nous trouvons : 
a—Cc T—a 
= 23.233 
b—c b—-x 
ce qui donne (via un petit jeu de signes) 
— — b 
06). + (23.234) 


(c—b)(x — a) 


C’est cela que nous voulions. 


23.6.5 Groupe circulaire 


Nous avons vu que les homographies préservent l’ensemble des cercles et droites. Nous pouvons 
nous demander quel est le groupe maximum préservant l’ensemble des cercles et droites. 


Définition 23.92. 

Le groupe circulaire de C est le groupe de transformations de © engendré? par les homogra- 
phies!$ et la conjugaison complexe. Le groupe circulaire de l’espace projectif est l’ensemble des 
applications de la forme Br” o fowo où f est un élément du groupe circulaire de C. 


Vu le lemme 23.77, la conjugaison complexe n’est pas une homographie. Donc cette définition 
n’est pas stupide : le groupe circulaire est strictement plus grand que le groupe des homographies. 


14. Les mauvaise langues diront que tout le chapitre sur les espaces affines, et surtout la partie sur les barycentres 
ne sont rien d’autres que le snobisme d'écrire 7ÿ au lieu de y — x. C’est aussi une facilité d'écriture. 

15. Définition 1.311. 

16. Homographie de Ô : définition 23.73. 
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LEMooUPOMooWZLSeH 
Lemme 23.93. 
Soit une application a: © — € fixant 1 et 0 et préservant les divisions harmoniques (c’est-à-dire 
tel que son prolongement à © donné par a(oo) = oo préserve les divisions harmoniques). Alors à 


est un automorphisme de corps !". 
Démonstration. Nous savons que si a,b,c € © nous avons c = (a + b)/2 si et seulement si 
[a,b,c, 0] = —1. Vu que à préserve les divisions harmoniques nous avons équivalence entre les 


affirmations suivantes : 


se : - (23.235) 

[a, b, c, oo] = —1 (23.235b) 

[a(a), a(b),æ(c), a(oo)] = —1 (23.235c) 
au +e0) = œ(c). (23.235d) 


Donc a préserve les milieux : pour tout a, be € nous avons 


a (£ + :) _ a(a) + a(b) EQooZCHF onu 


2 2 


En particulier, cette relation avec b = 0 donne (parce que a(0) = 0) : a(a/2) = a(a)/2. Nous avons 
au final, en utilisant cela en conjonction avec (23.236) : 


te ue CPE (£ 2 ‘) Can) (23.237) 
2 2 2 
Cela démontre déjà que 
a(a + b) = a(a) + a(b). (23.238) 


En particulier a(—a) = a(0 — a) = a(0) — a(a) = —a(a). 
Nous passons maintenant à la démonstration du fait que a(ab) = a(a)a(b). Pour tout a différent 


de 0 et +1 nous avons ; : 
= Ut LE . ; 2; EQooUPTOopfEtin 


Et en prenant a(a) en guise de a nous avons aussi 
[a(a), —a(a), a(a)?,a(1)] = -1. 0 0 


Vu que a préserve les divisions harmoniques, l'équation (23.239) donne aussi 


[a(a),a(—a), a(a?), a(1)] = —1, (23.241) 


c’est-à-dire 


[a(a), —-a(a), œ(a?), 1] = —1. FQooN HLoR SEE, 


Comparant (23.240) avec (23.242) et en tenant compte de l’unicité du birapport nous avons 
a(a?) = a(a)?. (23.243) 


Avec cela nous pouvons y aller en remarquant que 


GHbN* fa-b\” 
b — : 23.244 
éoe em 
17. Définition 1.42. 


18. C'est-à-dire que si trois éléments du birapport sont donnés, le quatrième est fixé. C’est une variation sur la 
thème de la proposition 23.47(2). 
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Nous appliquons a à cette dernière équations en tenant compte de ce que nous savons déjà 


a(ab) = (ee : co" (Æ : tab). (23.245) 


THOooKMKWooZPIDakK 
Théorème 23.94 (1593, 594]). 
Le groupe circulaire de € est le groupe des bijections © — € préservant l’ensemble des cercles- 
droites. 


Démonstration. L’inclusion dans un sens est facile : les homographies conservent l’ensemble des 
cercles et droites par la proposition 23.79. Et la conjugaison complexe aussi. 
Soit une bijection f: € — € préservant les cercles-droites. Nous supposons dans un premier 
temps que f(0) = 0, f(1) = 1 et f(00) = co. 
(1) Pour f vérifiant f(0,1,00) = 0,1,00 
Si C est un cercle alors f(C) est un cercle ou une droite, mais vu que C ne contient pas 00, 
l’ensemble f(C) ne le contient pas non plus. Donc f transforme un cercle en un cercle et une 
droite en une droite. 


(la) f préserve les divisions harmoniques 


Soient a, b, c, x dans € tels que [a, b,c, x] = —1. Nous allons prouver que [f(a), f(b), f(c), f(x)] = 
—]1. 

Si a, b et c sont colinéaires, nous suivons la construction du lemme 23.91. Soit m hors 

de la droite (ab) et une droite D passant par c et coupant [ma] en p et [mb] en q. Nous 

posons n = (pb) n (ga). Alors x = (mn) n (ac). 

L'application f est une bijection qui respecte les intersectons, les tangences, les cercles 

et les droites). Le point f(m) est hors de la droite (f(a)f(b)). La droite f(D) passe par 

f(c) et coupe les segments [f(m) f(a)] en f(p) et [f(m)f(b)] en f(q). Alors nous avons 


f(n) = (f(p)f(b)) à (F(a)f(a)) (23.246) 


et aussi 
f(æ) = (f(m)f(n)) n (F(a)f(c)) (23.247) 
Donc f(x) se construit à partir de f(a), f(b) et f(c) en suivant la même construction 
que x à partir de a, bet c. Nous en concluons que [f(a), f(b), f(c), f(æ)] = —1. 
Si a, b et c sont cocycliques, le même raisonnement, en suivant le lemme 23.90 nous 
donne le même résultat. 
(1b) f est un automorphisme du corps C 
C'est le lemme 23.93. 
(1c) Et enfin ..…. 
Notre application f est un automorphisme du corps € qui fixe IR parce qu’elle laisse 


invariante les droites dans C. Donc la proposition 6.6 nous dit que f est soit l’identité 
soit la conjugaison complexe. Dans les deux cas, f est dans le groupe circulaire. 


(2) Pour f plus générale 


Nous ne supposons plus que f fixe 0, 1 et co. En tout cas les nombres f !(1), f-!(0) et 
fl (co) sont distincts parce que f est une bijection. Nous pouvons considérer une homogra- 
phie 1 6: ÊÔ — € telle que (1) = f-1(1), #(0) = f-1(0) et p(oo) = f—l(0). Dans ce cas 
l'application 

g=f00 (23.248) 


19. Attention : ici nous parlons d’homographies de Ô, pas de P(C?). L'existence d’une telle application demande 
de composer le corolaire 23.35 avec l'application wo et la définition 23.73 et 23.74. 
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vérifie g(1) = 1, g(0) = 1 et g(c) = tout en continuant à transformer un cercle-droite en un 
cercle-droite. Donc f 06 est soit l’identité soit la conjugaison complexe. Avec ça, l'application 


f=go 1 (23.249) 


est la composée d’une homographie avec soit l’identité soit la conjugaison complexe. Elle est 
donc dans le groupe circulaire. 


23.6.6 Action du groupe modulaire 


Le demi-plan de Poincaré est l’ensemble 


P={2ecC tel que (2) > 0}. (23.250) 
Le groupe modulaire est le quotient de groupes 
L(2,Z 
PSL(2,Z) = _ (23.251) 
2 


Ce sont donc les matrices au signe près de la forme 


(° à (23.252) 


où &, b, cet d sont entiers tels que ad — cb = 1. 
TholtqXxCm 


Théorème 23.95 ([595]). 
Le groupe modulaire agit fidèlement (définition 2.30) sur le demi-plan de Poincaré par 


(° À = %+ b Eayxyuie 


c d cz+d 


L'ensemble D = D; L D, avec 


1 
D: = {2e P tel que |2] > 1, —= < R(z) < 5} (23.254a) 


D2 = {2e P tel que [2] = 1, —= < R(2) < 0} (23.254b) 


est un domaine fondamental (définition 2.37) de cette action. 


De plus si nous notons 
0 —1 1 1 
S = Û 0 ) , T= ( d : (23.255) 


alors pour tout z € P, il existe À € gr(S,T) telle que Ax2€ D. 


Démonstration. Nous divisions la preuve en plusieurs étapes. 
(1) Bien définie 
D'abord il faut remarquer que l’action (23.253) est bien définie par rapport au quotient : 
A * 2 = (—À) x z. La vérification est immédiate. 
(2) Interne 
Montrons que si À € PSL(2,Z) et ze P alors À x z€ P. Nous avons 


az+b  (az+b)(cz+d)  alzlc+ azd+ bez + bd 


À. — 23.256 
"F7 œ+d |cz + d|? [cz + df? ’ 
et donc en décomposant z = R(z) + 1S(2), 
azd + bcz ad — bc Y(2) 
S(A = = I(z) = 23.257 
( [cz + d/? ) Érar [cz + d/? 


où nous avons tenu compte de ad — bc = 1. Donc l’action respecte la (stricte) positivité de 
la partie imaginaire. 


23.6. 


(3) 
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Action 
Nous vérifions maintenant que la formule donne bien une action : À x (B x z) = (AB) x 2. 
Cela est un bon calcul : 


! b! 
Ax(Bxz) = A+ (+) (23.258a) 
a (22%) + b 
= (23.258b) 
c(gte) +d 
a(a’z + b’) + b(c'z + d’) 
_ 23.2 
c(a!’z + b') + d(c'z + d!) (AH RAS) 
(aa + bc’)z + (ab! + bd’) 
_ 23.2 
(ca! + dc!')z + (cb! + dd) PAR 
aa +bc'_ ab! + bd’ 
- (ue + de cb! + pa ne Fee 
— (AB) #2. (23.258f) 
Fidèle 
Soit À € PSL(2,7Z) tel que pour tout z € P nous ayons 
b 
ee =. (23.259) 
Alors nous avons 
c +(d—a)z+b=0. (23.260) 


Cela est donc un polynôme en z qui s’annule sur un ouvert ? (le demi-plan de Poincaré). Il 
doit donc être identiquement nul, donc c = b = a — d = 0. Si vous n’y croyez pas, écrivez 
pour z = ei (avec € > 0) : 


—ce + e(d — a)i +b = 0 (23.261) 
pour tout €. Le fait d’avoir ce? = b pour tout € implique que € = b = 0. Donc À est de la 
forme 

a 0 
À = 23.262 
avec la contrainte supplémentaire que ad = 1, les nombres a et b étant entiers. Nous avons 
donc soit a = d = 1 soit a = d = —1. Etant donné le quotient par Z2, ces deux possibilités 


donnent le même élément de PSL(2,Z). 


Les orbites intersectent D 


Soit zEe P. Nous devons trouver À € PSL(2, Z) tel que À x z € D. Nous savons déjà que 


F2) 


S(A 23.263 
See lez + d|? 

Nous notons ©, l'orbite de z sous le groupe modulaire et nous posons 
I, = {S(u) tel que u € O,} = {S(A * 2) tel que À e PSL(2,Z)}, (23.264) 


l’ensemble des parties imaginaires des éléments de l'orbite de z. Nous allons montrer que cet 
ensemble est borné vers le haut en montrant que la quantité |cz + d] ne peut, à z donné, 
prendre qu’un nombre fini de valeurs plus grandes que S(z)?!. Nous cherchons donc les 
couples (c, d) € Z? tels que [cz + d| < 1. 


20. On ne peut pas dire que b = 0 simplement en justifiant qu’on l’obtient en posant z = 0 parce que z = 0 n’est 
pas dans le demi-plan de Poincaré. 

21. Bien que cela ne soit pas indispensable pour la preuve, remarquons que Z; ne comprend qu’une quantité au 
plus dénombrable de valeurs. Le fait que, à z donné, la quantité [cz + d|? puisse être rendue aussi grande que l’on 
veut est évident. Donc J, est borné vers le bas par zéro (qui n’est pas atteint, mais qui est une valeur d’adhérence). 
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Nous avons S(cz + d) = cI(z), donc |cz + d| > |cY(z)|, mais il n’y a qu’un nombre fini de 
ce Z tels que |[cS(z)| < 1. De la même façon, pour la partie réelle nous avons 


R(cz + d) = cR(z) + d, (23.265) 


et pour chaque c, il n’y a qu’un nombre fini de d € Z qui laissent cette quantité plus petite 
que 1 (en valeur absolue). 

Donc /, possède un maximum. Soit A1 € PSL(2, Z) tel que S(A1 x z) = max Z,. Nous notons 
z1 = A1 * 2, et que nous n’avons à priori pas l’unicité. Nous allons maintenant agir sur 21 


avec l'élément 
1 1 
T = G 1) (23.266) 


pour ramener z, dans le domaine D. Si u € P nous avons T'+x u = u + 1 et donc 


T'xu=u+n. (23.267) 
Vu que D est de largeur 1, il existe un n (éventuellement négatif) tel que 
1 1 
R(T" x 21) € LS 5 (23.268) 


Notons qu'ici le fait d’être ouvert d’un côté et fermé de l’autre joue de façon essentielle (pour 
l’unicité aussi). Nous notons 29 = T° x 21. 
Supposons un instant que |z2| < 1. Nous considérons l'élément 


= é à (23.269) 


RCE SAS (23.270) 


qui fait 


Donc si |22| < 1 alors S(S + 22) > (22), ce qui contredit la maximalité de S(22) dans Z.. 
Nous en déduisons que |22| > 1. 

Si [22] > 1, alors 22 € D et c’est bon. Si |22| = 1, alors il faut encore un peu travailler. Si 
22 + 1 est à l’intérieur du disque, alors en agissant avec T ou T7! nous retrouvons la même 
contradiction que précédemment. En écrivant z2 = e*, nous devons donc avoir 2 cos(0) & 1 
ou encore [R(22)| < +. Donc si R(z2) < 0 alors 22 € Do. 

Le dernier cas à traiter est R(22) € ]0, À], c'est-à-dire 0 € [3,51 Dans ce cas l’action avec S 
ramène l’angle dans la bonne zone parce que S'x z = | et donc S x (pe) = ne 
Unicité 

Nous voulons à présent montrer que si z € D, alors À *2 n’est plus dans D (sauf si À = +1). 
Nous supposons que z € D et À € PSL(2,7Z) soient tels que À x z € D, et nous prouvons 
qu'alors soit nous arrivons à une contradiction soit nous arrivons à À = Î. Pour cela nous 
allons décomposer en de nombreux cas. 


(6a) Nous commençons par S(A x z) > S(z). Dans ce cas nous avons [cz + d| < 1 et en 
particulier |c||$(z)| < 1. Étant donné que le point de D qui a la partie imaginaire la 
plus petite est —} + 5, nous trouvons |c| < 2/V3. Vu que c doit être entier, nous 


| V3 
avons trois cas : € = —1,0,1. 


0 d 
signifie a = d = 1 (la possibilité a = b = —1 est « éliminée » le quotient par Z2 
définissant PSL(2, Z)). La matrice À doit alors être de la forme 


= 5 ) (23.271) 


et Axz = 24+0. Size D, alors le seul z + b à être (peut-être) encore dans D est 
b = 0, mais alors À est l’identité. 


(6a.i) Soit c = 0. Alors À = È . et la condition de déterminant est ad = 1, ce qui 
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(6a.i) Soit c = 1. Alors la condition |cz + d| < 1 nous donne trois possibilités ?? : d = 

4,0 1 

A. Sid = —1, alors nous devons avoir |z2—1| < 1. Il est instructif de faire un dessin, 
mais le point d’intersection entre les cercles |z| = 1 et [2 — 1] = 1 est le point 
à + PET qui n’est pas dans D. Bref, il n’y a pas de points dans D vérifiant 
|z— 1] < 1. 

B. Si d = 1, alors (et c’est maintenant que la dissymétrie de D intervient) nous 
avons le point 

1 43 


qui est dans D et qui vérifie |[z + 1] < 1. Voyons à quoi ressemble la matrice À 
dans ce cas. Son déterminant est a — b = 1. Nous écrivons donc 


b+1 b 
Fo) sas 


et en tenant compte du fait que zz = |z + 1] = 1, nous calculons 


b+1 b 
Cases (23.274a) 
z+1 
b b)(z +1 
US eee) (23.274b) 
|z + 1/2 
= 2+b+1. (23.274c) 
La seule façon de ne pas quitter D est d’avoir b = —1, mais alors nous avons 


À = É Fa (23.275) 


et À x z = z. Donc au final z est quand même le seul de son orbite à être dans 
D. 


Notons au passage cette très intéressante propriété du point 
1 V3 


= —— + —i. 23.276 
20 9 + 9 ul ( ) 


C’est un point de qui vérifie z1 = À * z0 pour un élément non trivial À de 
PSL(2,Z). L'existence d’un tel élément est ce qui va nous coûter un peu de 
sueur pour prouver que PSL(2,Z) est engendré par S et T. 


C. Le cas d = 0 nous fait écrire 1 = det À = —b, donc b = —1 et 
a —1l 
ae =) _—. 
Nous avons alors À x 2 = a — À. De plus la condition [z| < 1 revient à |z = 1|. 


Pour les nombres complexes de module 1, l'opération z — —1/z est la symétrie 
autour de l’axe des imaginaires purs. Le seul à ne pas sortir de D est le fameux 


2 = —1 + 35, qui revient sur lui-même avec a = —1. 
Nous passons à la possibilité c = —1. Dans ce cas la matrice est de la forme 
a  b 
À = 23.2 


et nous revenons au cas € = 1 en prenant —À au lieu de À. 


22. Je ne rigolais pas quand je disais qu’on allait avoir de nombreux cas. 
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(6b) Nous passons au cas S(A x z) < (2). Nous récrivons cette condition avec 


S(A x z) < I(A x (Axz)). (23.279) 


Si nous supposons que z et À sont tels que z et À + z soient tous deux dans D), alors 
z! = A +2 est un élément de D tel que 


S(z/) < S(A TT + 2). (23.280) 


Or nous avons vu qu'aucun élément de D vérifiant cette condition n'existait sans être 
trivial (celui qui ne bouge pas). Pour cela il suffit d'appliquer tout ce que nous venons 
de dire avec A7! au lieu de A. 


(7) Quelques conclusions 


Après avoir passé tous les cas en revue, le fameux point 20 = —i — V3; est l’unique point de 
D à accepter une matrice non triviale À € PSL(2, Z) telle que z0 = À * 20. 

Nous remarquons aussi que tous les points de P sont ramenés dans D par une matrice obtenue 
comme produit de T, S, T-let St. 


CorJQwgNp 
Corolaire 23.96 ([596]). 
Les matrices S et T génèrent le groupe modulaire au sens où toute matrice de PSL(2,7Z) s'écrit 


COMME 
TA SPL. TX GPK (23.281) 


pour un certain k et des nombres m;,p; € Z. Autrement dit, PSL(2,Z) = gr(S,T). 


Démonstration. Soit z, un point de D autre que z0. Alors si À € PSL(2,Z) est non trivial nous 
avons À * z hors de D. Du coup, comme vu dans la démonstration du théorème 23.95, il existe 
B € gr(S, T) tel que Bx(Ax 2) € D. Vu que D ne contient qu’un seul point de chaque orbite, nous 


avons 
BxAx2=—2, (23.282) 


et donc BA = +1, ce qui prouve que * À = B71, c’est-à-dire que A € gr(S, TT). 


23. Dans PSL(2, 7), nous n'avons pas besoin de mettre + parce qu’il est compris dans la définition. 


Chapitre 24 


Analyse vectorielle 


24.1 Le théorème de Green 


Soit un champ de vecteurs 


F(x,y,2) = | Fix, y, 2) (24.1) 


et un chemin a: [a,b] — IR? donné par 


alt) = | y) | (24.2) 
Nous avons défini la circulation de F le long de © par 


[F + do = [r(ot) - o’(t)dt 


(2 


b 
> J A (o(#)}x"(t) + P(o(t))y/(u) + F3 COQ (24.3) 


(2 


= J Fidx + Fidy + F3dz. 


La dernière ligne est juste une notation compacte !. Elle sert à se souvenir qu’on va mettre x/ à 
côté de F1, y’ à côté de F2 et z/ à côté de F3. L'avantage de cette notation est qu’on peut écrire 
d’autres combinaisons. 

Si f et g sont deux fonctions sur IR°, nous pouvons écrire 


[ réu + vd. (244) 


Cela signifie 
b 
J LA (o(6))y/(0) + g(o(0))z(0 |at. (24.5) 


a 
Soit D une région du plan et o, son contour que nous prenons, par convention ?, dans l’orienta- 
tion trigonométrique, comme indiqué sur la figure 24.1. Nous supposons également que le domaine 
D n’a pas de trous intérieurs. 
Nous notons par o = 0D le bord de D, c’est-à-dire le contour dont nous venons de parler. 


1. Il y aurait beaucoup de choses à dire là-dessus, mais la vie est trop courte pour parler de formes différentielles, 
et c’est dommage. 
2. Il y aurait beaucoup de choses à dire sur ça aussi, mais... 
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FIGURE 24.1: Un contour avec son orientation.  LabelFigVDFMooHMmFZr 


Théorème 24.1 (Théorème de Green). 
Soient P,Q: D — R deux fonctions de classe C*. Alors 


: 0Q O0P EqTho 
L. Pdx + Qdy L ( PCT ) drdy. (58) 


Pour rappel, l'intégrale du membre de gauche signifie 


b 
IRÉCOPOET COUT (24.7) 


a 
| : : P 
Ce n’est d’ailleurs rien d’autre que l’intégrale du champ de vecteurs ( d) 


Corolaire 24.2. 
L’aire du domaine D est donnée par 


1 
A=- J (xdy — ydx). (24.8) 
2 Jon 
Démonstration. L'intégrale Fp(xdy—ydx) se traite avec le théorème de Green où l’on pose P = —y 
et Q = x. Nous avons donc 
© o(— 
| —ydx + xdy = Ï (£ C 2) dxdy 
ra nou < (24.9) 
= Ï 2 drdy. 
D 


La dernière ligne est bien le double de la surface. 


Exemple 24.3. 
Calculons (encore une fois) l’aire du disque de rayon À. Il s’agit de calculer l'intégrale 


Fe ; | Gi (24.10) 
où © est le cercle donné par 
_ fax(t)\ _ [Rcos(t) 
10 = (7) = (Gant) ED 
Le calcul est à 
1 T 
I = - R cos(@) R cos(0) — Rsin(0) (—Rsin(0)) dô 
2 D a EE, — 
TL y! y x! 
2 ç2r (24.12) 
es Î do 
2 Jo 
= rR?. 
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Exemple 24.4. 
Calculons l’aire de l’ellipse 


2 
H+tH<i (24.13) 
dont le bord est donné par 
x(t) = acos(t) (24.14a) 
y(t) = bsin(t). (24.14b) 


Le terme xdy devient acos(t)bcos(t) = abcos?(t) et le terme ydr devient bsin(t)(—-asin(t)) = 
—absin?(t). L'intégrale qui donne la surface est donc 


1 1 27 
| (xdy — ydx) = | ab = Tab. (24.15) 
2 Jon 2 Jo 
A 
Le théorème de Green peut être mis sous une autre forme. 
ThoGreenVecto 
Théorème 24.5 (Théorème de Green, forme vectorielle). 
Si G est un champ de vecteurs sur D, nous avons 
EqG V 
G-d= Ï (V x G) : dS re PTE) 
°D D 


où le second membre est le flux de V x G sur la surface D. 


Démonstration. Analysons le membre de droite. Nous savons que D est une surface dans le plan 
R?. Le vecteur normal à la surface est donc simplement le vecteur (constant) e,. Le produit 
scalaire (V x F) - dS'est donc (V x F) - e, et se réduit à la troisième composante du rotationnel, 


c’est-à-dire _ . 
2 1 
+ 24.17 
Ox Oy 


Cela est bien le membre de droite de l’équation (24.6). Le membre de gauche de cette dernière est 
bien le membre de gauche de (24.16). 


ExempleGreenSqL 
Exemple 24.6. 


2 
Soit le champ de vecteurs F(x,y) = É. . et soit à calculer 


] VxF:dS (24.18) 
D 


où D est la région comprise entre les courbes y = x? et y = x pour x > 0 (voir la figure 24.2). 


À 


1+ 


1 


FIGURE 24.2: Le contour d'intégration pour l'exemple 244pe1FigLLVMooWDkvAB 
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Nous pouvons calculer cette intégrale directement en calculant le rotationnel de F : 


0 
VXxF= 0 : (24.19) 
1—27xy 
Par conséquent l’intégrale à effectuer est 
1 œ 1 
TI= | dr | (1—2xy)dy = —. (24.20) 
0 x? 12 


| Sage Version 4.6.1, Release Date: 2011-01-11 | 
| Type notebook() for the GUI, and license() for information. 


sage: f(x,y)=1-2%xx*xy 
sage: f.integrate(y,x**2,x).integrate(x,0,1) 
(x, y) |--> 1/12 


L'autre façon de calculer l’intégrale est d'utiliser le théorème de Green et de calculer la circu- 
lation de F le long de 0D : 


I -| F : 0. (24.21) 
0D 


Le chemin o = @D est composé de la parabole y = x? et du segment de droite x = y. Attention : 
il faut respecter l'orientation. Nous avons 


oi(t) = (t,t?) (24:99) 
et 
dot) = (1—t,1—t). (24.23) 


Notez bien que le second chemin est (1 —+#,1 —t) et non (t,t) parce qu'il faut le parcourir dans le 
bon sens (voir le dessin). 
Commençons par le premier chemin : 


o(t) = (t,t°) 
(te (526) 


(24.24) 
5 
et par conséquent 
F(oi(t)) : of(t) = +28 +26, (24.25) 
et le premier morceau de la circulation vaut 
: 4 
J F + doi = Î +28 +28 — = (24.26) 
O1 0 


Pour le second chemin : 
og(t) =(1—-t,1-—t) 


o(t) = (—-1,-1) (24.27) 


Par conséquent 


F(oa(t)) : oo(t) = —(1—+)* -2(1-#). (24.28) 
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Le second morceau de la circulation est par conséquent 


: 5 
Î (1— +)? — 2(1 — fjdt = . (24.29) 


D 
D ee 24. 
3 4 12 (50) 
Comme prévu, nous obtenons le même résultat. PA 
24.2 Théorème de la divergence dans le plan 
24.2.1 La convention de sens de parcours 
Soient D, un domaine dans le plan et un paramétrage 
o: [a,b] — R? 
” . (24.31) 
y() 7°? 


un paramétrage du bord 0D de D. La normale à © est perpendiculaire à la tangente, donc la 
normale extérieure de norme 1 vaut 


___ (y), -2"(E) L (y/(), —x’(6)) 
nm ou nn < (24.32) 


V0)? + (70)? V0)? + (70)? 


Comment faire le choix ? 


Nous prenons comme convention que le sens du chemin doit être tel que le vecteur normal 
extérieur soit 


 "UUEEO le (24.33) 


V0)" + (y(0)? 


Donc si le chemin © donne lieu à un vecteur n pointant vers l’intérieur, il faut utiliser le chemin 
qui va dans le sens contraire : &(t) = o(1—t). 


Les vecteurs tangents et normaux d’un contour sont dessinés sur la figure 24.3. 


FIGURE 24.3: Le champ de vecteurs tangents est dessiné en rouge tandis qu’en vert nous avons le 
champ de vecteurs normaux extérieurs. LabelFigDDCTooYscVzA 
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24.2.2 Théorème de la divergence 


Théorème 24.7 (Théorème de la divergence). 
Soit F un champ de vecteurs sur R?. Le flux de F à travers le bord de D est égal à l'intégrale de 
la divergence de F sur D. En formule : 


| F -ndo = ] V - Fdxdy. (24.34) 
0D D 


Démonstration. Tant F - n que V : F' sont des fonctions. Le membre de gauche est donc l'intégrale 
d’une fonction sur un chemin et le membre de droite est l'intégrale d’une fonction sur une surface. 
Notre convention de sens de parcours du chemin permet d'écrire le produit scalaire F' + n sous la 


forme suivante : 
1 fF y’ 
no o! (x) (re 
1 


dr (FY — Fr) 
24. 
C1 J-EN (x (24.35) 
_ o! F> y! 
LÉ, à 
( . ) at. 
Par conséquent, la fonction 
Fin (24.36) 
est la même que la fonction 
1 f—EF, 
L'intégrale de cette dernière fonction sur le chemin © est 
= J Fin 
LL. Î=F, P 
= o 
[ lo’ ( Fa ) 
(24.38) 


CF | 
Cette dernière intégrale est la circulation du champ de vecteurs ') sur le chemin ©. Le 


F3 
théorème de Green 24.5 nous enseigne que la circulation le long d’un chemin est égale au flux du 
rotationnel à travers la surface. Par conséquent, 


I = le (v x ee) - dS = Lv - Fdxdy (24.39) 


24.3 Théorème de Stokes 


Nous nous mettons maintenant dans R, et nous y considérons une surface paramétrée $ donc 
le bord est 0$. 
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THOooIRYTooFEyxif 
Théorème 24.8 (Théorème de Stokes). 
Alors le flux du rotationnel de F' à travers S est égal à la circulation de F' le long du bord. En 
formule : 
J VxF :dS = F + do. (24.40) 
S os 
Nous pouvons nous donner une idée du pourquoi ce théorème est vrai. D'abord, si la surface 
est plate, cela est exactement le théorème de Green 24.5. Supposons maintenant que le bord reste 
plat, mais que la surface se déforme un petit peu. Le chemin 


cos(t) 
o(t) = | sin(t) (24.41) 
0 


est tout autant le bord du disque plat de rayon 1 que celui de la demi-sphère 


D(x, y) = y (24.42) 


1/1 — x? — y? 


Le champ de vecteur que nous considérons est G = V x F. Il à un certain flux à travers le disque 
plat, et ce plus est égal à la circulation de F sur ©. Quel est le flux de G à travers la demi-sphère ? 
Étant donné que V : G = V: (V x F) = 0, le champ de vecteurs G est incompressible, de telle 
façon que tout ce qui rentre dans la demi-sphère doit en sortir. Le flux de G à travers la demi-sphère 
doit par conséquent être égal à celui à travers le disque plat. 


Exemple 24.9. 
Soit C l'intersection entre le cylindre x? + y? = 1 et le plan x + y + z = 1. Calculer la circulation 
de 


—U 
F(a,y,2) = | 2° (24.43) 
33 
le long de ©. 
Au lieu de calculer directement 
J Fed (24.44) 
C 
nous allons calculer 
| VxF ds (24.45) 
S 


où S est une surface dont C est le bord. Cette intégrale est à calculer avec la formule (20.264). 

La première chose à faire est de trouver une surface dont le bord est C' et en trouver un 
paramétrage 6. Le plus simple est de prendre le graphe du plan sur le cercle x? + y? + 1. Un 
paramétrage de cette surface est simplement 


DR 
(24.46) 
(x, y) y 
l—x-7 


où D est le disque de rayon 1. Étant donné que cela paramètre le plan x + y+2—1 = 0, le vecteur 
normal est n = ex + ey + z:. Nous pouvons cependant calculer ce vecteur normal en suivant la 
recette usuelle. D'abord les vecteurs tangents sont 


&æ_[s| &_f; 
0x ap 


(24.47) 
=} 
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Et le vecteur normal est donné par le produit vectoriel : 


26, 06 
0x y 
én Cé 
Si per (24.48) 
O 1 —1 
= Ex + y + €. 
Ensuite, le rotationnel de F' est donné par 
VxF = 3(x? +y°)e.. (24.49) 
Par conséquent, 
0 | 09 2,2 
VxF-[— x —}|— . 24. 
x É) 3(x° +y*) (24.50) 
L'intégrale à calculer est donc 
Ô Ô 
J VxF: as = | (V x F)((x, y)) : (£ x æ) dxdy 
Ë : Te (24.51) 


— 3 | (x? + y?)dxdy. 
D 


Cette dernière intégrale est l'intégrale d’une fonction sur le disque de rayon 1. Elle s'effectue en 
passant aux coordonnées polaires : 


27 1 37 
3 | (x? + y?)dxdy = 3 | de | (r?)r dr = —. (24.52) 
D 0 0 2 


24.4 Théorème de Gauss 


Soit V une partie de R° délimitée par une surface S sur laquelle nous considérons la normale 
extérieure. Soit F un champ de vecteurs sur R°. 


Théorème 24.10 (Théorème de la divergence ou de Gauss). 
Le flux d’un champ de vecteur F à travers une surface fermée est égal à l'intégrale de la divergence 
sur le volume correspondant : 


| F - dS = Ï V : Fdxdydz. (24.53) 
OV 14 


Ce théorème signifie que la quantité de fluide qui s’accumule dans le volume (le flux est ce qui 
rentre moins ce qui sort) est égale à l’intégrale de V : F sur le volume, alors que nous savons que, 
localement, la quantité V + F{x,y,z) est la quantité de fluide qui s’accumule au point (x, y, 2). 


Remarque 24.11. 

Ce théorème ne fonctionne qu'avec des surfaces fermées. Essayer de l’appliquer au calcul de flux 
à travers des surfaces ouvertes n’a pas de sens parce qu’une surface ouverte ne délimite pas un 
volume. 


24.12. 
La formule de la divergence peut être utilisée comme intégration par partie. Si u est une fonction 
et Fun champ de vecteurs, V(uF) = V(u) : F+uV : F'et alors 


Lurcn-fvun-fuv.r+ fr. vu (24.54) 
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où n est le champ de vecteurs normal extérieur à V. En remettant les termes dans un ordre qui 
ressemble plus à l'intégration par partie : 


Ï F Vu | uF.n- Ï uVE. FOR PENSER) 
V OV V 


Exemple 24.13. 
Calculer le flux du champ de vecteurs 


F(x,y,2) = | y (24.56) 


à travers la sphère de rayon 1 centrée à l’origine. Nous utilisons le théorème de la divergence 
J F:ndS -| V - Fdxdydz (24.57) 
S B 


où S est la sphère et B est la boule (la sphère pleine). La divergence de F se calcule : 


0F, ÔF, OF. 
-F = == Le 2 29 + 9x + 2y. 24. 
V 2x + 2u + 2 + 2x + 2y (24.58) 


L'intégrale est donc en trois termes : 
1 2 = 2Volume(B) = is 
B 3 
Ï y dxdydz = 0 (24.59) 
B 
Ï z dxdydz = 0. 
B 


A 


Dans certains cas le théorème de Gauss permet de simplifier le calcul de l’intégrale d’une 
fonction sur une surface. 


Exemple 24.14. 
Soit à calculer l'intégrale 


1= | (x? + y + 2)d8, (24.60) 
°B 
c’est-à-dire l'intégrale de la fonction x? + y + z sur la sphère. Le vecteur normal à la sphère est 
n = Ter + Yey + 2ez. (24.61) 


Etant donné que nous sommes sur la sphère de rayon 1, ce vecteur est même normé. La fonction 
; 
que nous regardons n’est rien d’autre que F : n avec 


DA 
F=|1l|. (24.62) 


Nous pouvons donc simplement intégrer V : F' sur toute la boule : 


4 
1 = ] V - Fdxdydz = ] 1 dxdudz = T. (24.63) 
B B 3 
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24.5 Coordonnées curvilignes 


24.5.1 Base locale 


Nous connaissons déjà les coordonnées sphériques et cylindriques sur R°. Ce sont des systèmes 
« un peu courbes ». Il en existe bien entendu de nombreux autres (sinon ce ne serait pas drôle), 
et nous allons faire une étude un peu générale de ces systèmes de coordonnées curvilignes. Des 
coordonnées curvilignes sur IR° est n'importe quel? système qui permet de repérer un point de R° 
à partir de trois nombres. 

Il s’agit donc d’un ensemble de trois applications 


ti: R°—R. (24.64) 
Les coordonnées cylindriques sont 
x1(r,0,z) = rcos 0 (24.65a) 
xa(r,0,z) = rsin0 (24.65b) 
Cr (24.65c) 


Soit donc un système général q = (q1,q2,gq3) et 


æ1(q) 
M(q) = | x2(9) |: (24.66) 


z3(q) 


Si nous fixons q» et g3 et que nous laissons varier g1, nous obtenons une courbe * dont nous pouvons 
considérer le vecteur vitesse, c’est-à-dire le vecteur tangent. En chaque point nous avons ainsi trois 
vecteurs 


0M 
Odi 
Nous disons que le système de coordonnées curviligne est orthogonal si ces trois vecteurs sont 
orthogonaux. Dans la suite nous supposerons que c’est toujours le cas. 
Nous posons 


(g). (24.67) 


(24.68) 


nn Eqpefsiniq 


Les trois vecteurs {e1,e2,e3} forment une base orthonormée dite base locale. Ce sont des vecteurs 
liés ® au point M. 
24.5.2 Importance de l’orthogonalité 


Nous avons dit que nous nous restreignons au cas où les vecteurs e; sont orthogonaux. En 
termes de produits scalaires, cela signifie 


Ei ‘ €j . dj: (24.70) 


Nous en étudions maintenant quelques conséquences. L’équation (24.69) peut s’écrire plus explici- 
tement sous la forme 5 


1 0TKk 
ej = 25 1 om lg. (24.71) 


3. Nous n’entrons pas dans les détails de régularité. 

4. Dans le cas des sphériques, c’est une demi-droite horizontale d’angle q2 et de hauteur q3. 

5. En géométrie différentielle on dira que ce sont des élément de l’espace tangent, mais c’est une toute autre 
histoire. 
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Notez que pour chaque k et à, la quantité he est un simple nombre. Nous allons les mettre 


dans une matrice : 


me (24.72) 


Cela nous donne le changement de base 


= 5 Ale. FqchnBasee tapas 


Le produit e; : e; s'écrit alors 


#l —=ôyi 
= y» AkiAijô 
kl (24.74) 
= >, AkiAk; 
k 
= D (AT) Ar 
k 
Or cela doit valoir 0;;. Par conséquent 
AT = A7. (24.75) 


Le fait que les coordonnées curvilignes considérées soient orthogonales s'exprime donc par la fait 
que la matrice de changement de base est une matrice orthogonale. 

Cette circonstance nous permet d’inverser le changement de base (24.73) en multipliant cette 
équation par (A1); des deux côtés et en faisant la somme sur à : 


DA ae: = Ÿ Ani(A a le, (24.76) 
ï Pe — 


par conséquent 


D (AT )ae: = li, (24.77) 


et 


1; = > Are; = > Des Éachanvarner ei 


Armés de cette importante formule, nous pouvons exprimer les quantités que nous connaissons 
dans la base canonique en termes de la base locale. 
Une autre conséquence du fait que e1, e2 et e3 est une base orthonormée est que, éventuellement 
en réordonnant les vecteurs, on a 
€] X €2 = E3 
€2 X €E3 = €] (24.79) 


€e3 X €] = €2 


Ces trois relations s’écrivent en une seule avec 


Ej X Ej — D eijrer (24.80) 
k 


où 


() si ?,j,k ne sont pas tous différents 
Eijk = À 1 si ijk se ramène à 123 par un nombre pair de transpositions (24.81) 


—1 siijk se ramène à 123 par un nombre impair de transpositions 
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est le symbole de Levi-Civita. La formule du produit vectoriel peut également être utilisée à 
1 Eqekeiti j 
Ep = SD Er Ei X Ej. q bre) 

2 5 


Le symbole de Levi-Civita possède de nombreuses formules. En voici certaines, facilement 
démontrables en considérant tous les cas : 


Eijkeig = Oxiljel. (24.83) 


l'envers sous la forme 


Grâce aux symboles de Levi-Civita, le produit mixte des vecteurs de base a une belle forme : 

EqProdMixteepsilonCiciv 

€] : (e; X 6à) — D eijrer X EE = D cijrôtk = El: GES) 
k k 

24.5.3 Coordonnées polaires 


Les coordonnées curvilignes polaires sont données par 


M(r,0) = e : (24.85) 


et par conséquent 


M | e. OM er) (24.86) 


Ôr. sin(6) 71 r cos(Ô) 
Nous avons les normes h,; = 1 et ho = r, et donc les vecteurs de la base locale en (r,0) sont 
__ fcos(8)\ ; 
= ee) = cos(#)ez + sin(0)ey (24.87) 
ainsi que 
_.f—=#im(@)\ _ …. 
eg = ( cos(8) ) = —sin(0)ez + cos(#)ey. (24.88) 


Ces vecteurs sont représentés à la figure 24.4. Notez qu'il y en à une paire différente en chaque 
point. 


\ _ 


1 Laban Pgo eva EabaNFIpMGP oo sauNE 


(a) Base locale. (b) Base locale. 


FIGURE 24.4: En brun, les lignes que le point suivrait si on ne variait qu’une coordonnées polaires 
à la fois. Les vecteurs rouges sont les vecteurs e, et eg. LabelFigHGQPooKrRtAN 


24.5.4 Coordonnées cylindriques 


Les coordonnées cylindriques sont les mêmes que les coordonnées polaires à part qu’il faut 
écrire 


r cos() 

M(r,0,z) = | rsin(6) |, (24.89) 

# 

et nous avons le vecteur de base supplémentaire 
0 
OM 

ee = —= 10 (24.90) 

©z 1 


parce que h, = 1. 
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24.5.5 Coordonnées sphériques 


Les coordonnées curvilignes sphériques sont données par 


psin(0) cos() 
M(p,0,%) = | psin(d)sin(s) |, (24.91) 
p cos(6) 
dont les dérivées sont données par 
oM sin(@) cos() oM p cos(4) cos() 
Sp = | sin(@)sin(o) |, Fe pcos(0) sin() |, 
cos(6) —psin() 
.. (24.92) 
oM —psin(4) sin(s) 
ep = | psin(@)cos() 
0 


Les normes de ces vecteurs sont h, = 1, ho = pet h,, = psin(#). Les vecteurs de la base locale en 
(p,0,%) sont donc 


sin(@) cos(s) cos(@) cos(ç) 
ep = | sin(8)sin(g) |, ep = | cos(8)sin(s) |, 
PAS sin (0) (24.93) 
— sin() 
ep = | cos(y) 
0 


24.5.6 Gradient en coordonnées curvilignes 


Soit (x,y,z) > f(x, y, 2) une fonction sur R°. Nous pouvons la composer avec les coordonnées 
curvilignes q pour obtenir la fonction 


(ar, q., q3) = f(x1(a), ra(a), xa(a)). (24.94) 


Nous disons que f est l'expression de f dans les coordonnées q. Nous savons déjà comment calculer 
le gradient de f en coordonnées cartésiennes : 


On f(t, y, 2) 
F(x,y,2) 2. Vf(x,y,2) u f(x, y, 2) : (24.95) 
0,f(x,y,2) 


Cela est un vecteur lié au point (x,y,z). Notre objectif de bonheur dans la vie serait d'exprimer 
les coordonnées de ce vecteur dans la base {e,e2,e3}. En d’autres termes, nous voudrions trouver 
les nombres F1, F2 et F3 tels que 


F(x,y,2) = F(x(q),y(a),z(q)) = Fies + neo + Fses. (24.96) 


Ces nombres seront des fonctions de (q1,q2, q3). 
Par définition, 


VIe 973, (24.97) 
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En remplaçant 1, par sa valeur en termes des e; par la formule (24.78), 


of 
NV Le 
0%: * à . 
5 1 of êm (24.98) 


Plus explicitement, 


Vf(x(a). y(a), (a) _ > - (ges nn 


où 


(a)|. (24.100) 


Le plus souvent nous n’allons pas noter explicitement la dépendance de h; en q. 


24.5.6.1 Coordonnées sphériques 


Nous pouvons exprimer le gradient d’une fonction en coordonnées sphériques en utilisant la 
formule (24.99) : 
= Of 10f 1 Of FAST 


Vf(p,0,%) = dp © + D 00 © + in(0) Ag +" 


Cette expression peut paraitre peu pratique parce que les vecteurs e,, e4 et e,, eux-mêmes changent 
en chaque point. Elle est effectivement peu adaptée au dessin, mais elle est très pratique pour des 
fonctions ayant des symétries. 


Exemple 24.15. 
Le potentiel de la gravitation est la fonction 


1 


Vs;y,z) = (24.102) 
\/22 + y? + 22 
En coordonnées sphériques elle s’écrit 
u 1 
V(0,0,ç) = — (24.103) 
P 


En voilà une fonction qu’elle est facile à dériver, contrairement à V ! En suivant la formule (24.101), 
nous avons immédiatement 


u l 
VV = — ee, (24.104) 

P 
Nous voyons immédiatement que cela est un champ de vecteurs dont la norme diminue comme le 
carré de la distance à l’origine et qui est en permanence dirigé vers l’origine. A 


24.5.7 Divergence en coordonnées curvilignes 


Nous savons que 


: ï of 
Vf Lin ag À (24.105) 
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Nous pouvons en particulier considérer la fonction f(q) = qi. De la même manière que nous avions 
noté x; la fonction x + x;, nous notons g; la fonction q + q;. Le gradient de cette fonction est 
donné par 


1 Odi 
di =) —-—e;, (24.106) 
! À h; 0q; / 
mais SE = 0j, donc 
Va . (24.107) 
t 
ou encore 


Cela n’est pas étonnant : la direction dans laquelle la coordonnées g; varie le plus est le vecteur e; 
qui donne la tangente à la courbe obtenue lorsque seul q; varie. 
Commençons par calculer la divergence de e;. En utilisant la formule (24.82), 


1 
— 3 D ici V : (e X ej). (24.109) 


Nous avons, en utilisant les règles de Leïbnitz de la proposition 12.504, 
V:fexe;)=V (Va xh;Va) 
= V(hih;) d (Va X Va) + hih;V ; (Va X Va) 
—= V(hih;) Ê (Va X Vi) 


+ hih;Vq; ë (V X Vi) (24.110) 
=0 
+ hih;Vqi ù (V X Vi) 
=0 
Cela nous fait Vhhs) 
k = Dares - (e; x e;). (24.111) 


parce que Vq = h; le;. Nous pouvons développer le gradient qui intervient : 


oo. 7 Zi (24.112) 


Nous voyons donc arriver le produit mixte e : (e; x e;). En utilisant la formule (24.84), cela 
s'exprime directement sous la forme é;,. 
Nous avons alors 


1 1 Ô 
>: _ hide 
Ek 2 hih jh ï hj)éreijt 
= 15 Ok | le h;) FaFragragp4qn) 
25 
1 lil 
= hih;). 
2 D hih;hy a 5) 
Par exemple, 
1 Ô 
V- hoh 24.114 
or au 2h3). ( ) 


Nous devons maintenant chercher le gradient d’un champ général 


k 
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La première chose à faire est d'utiliser la formule de Leibnitz : 


V-F—- D VF, (Q) © €k +) F(0)V " Ek: FARERORPAIA | 
k k 


Afin d’alléger les notations, nous allons nous concentrer sur le terme numéro k et ne pas écrire la 
somme. Si à et j sont les nombres tels que 6j, = 1, alors ce que la formule (24.113) signifie, c’est 
que 


1 û 
Ve = —(h;h;). 24.117 
FE hhohe Ga! i) ( ) 
Nous savons déjà par la formule (24.99) que 
1 F4 
Fy = — — 24.118 
VS à lu ou 
par conséquent à : 
1 Frs 1 0F% 
__— | 24.119 
D hi qu 5 Rx 0qk ( ) 


Pour obtenir cela nous avons utilisé le fait que e : ex = y. Le terme numéro k de la somme 
(24.116) est donc 


1 CF, F4 O(hih;) _ 1  OFrhih;) (24.190) 
hx Ogre hxhih;  0qk hih;jhx  0qk 
où il est entendu que à et j représentent les nombres tels que é;;x = 1. 
Au final, nous avons 
1 OFrhih; j) 
- F = ——— ik ————<— 24.121 
à hihoh3 À Fe Ok ) 


Ici, la somme sur à et j consiste seulement à sélectionner les termes tels que à et j ne sont pas k. 
En écrivant la somme explicitement, 


1 Ô Q 
VF Et Fih2h3) Te Aa ASE 


Ô 
hihoh3 (Fi) | | (24.122) 


0q3 


24.5.7.1 Coordonnées cylindriques 


En coordonnées cylindriques, nous avons déjà vu que h, = 1, hg = r et h,; = 1. La divergence 
est donc donnée par 


1[a o © EqDivEnC 
vor ren) + SU + LCR)| PAS 
Par exemple si 
F(r,0,z) = rep + e:, (24.124) 
nous avons ia 2 
(Fr Fed 2) = = Ë (r) + 0] = 0: (24.125) 


Cela est logique parce que reg est à peu près le champ dont nous avons parlé dans l’exemple 
(12.501), qui était à divergence nulle. En réalité, le champ dont on parlait dans cet exemple était 
exactement —eg. Le champ e; est également à divergence nulle parce qu’il est constant. 

24.5.7.2 Coordonnées sphériques 


En coordonnées sphériques, nous avons h, = 1, h4 = r et h,, = rsin0, donc 


1 0 He. 0 
V-F= EG sin0F,) + 30 (psin 0F9) + 0] : (24.126) 


r? sin 0 


si F(p,0,6) = Fe, + Foes + Fes. 
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24.5.8 Laplacien en coordonnées curvilignes orthogonales 
Soit une fonction f : R° — R. Le laplacien de f est donné par 
APN VE (24.127) 
En utilisant les formules données, nous avons 
1 © f[hah3 0 © [hih3 © © [hih2 0 
Af = | (dE) + (dE) + (es) (24.128) 
hihoh3 Log | h1 Ôq 0q2 \ h2 0q 0q3 \ h3 0q3 
Dans cette expression, la fonction f est donnée comme fonction de q1, qg2 et q3. 
En coordonnées cylindriques, cela s'écrit 


À Ô AA . 10f 1e AA 
r | Or Or 00 \ r 00 Oz Oz (24.129) 
red, ter | 
Or? rôor r2002 022 


Dans cette expression, f est fonction de r, 4 et z. 
En coordonnées sphériques, cela devient 


_ _—— d of of 1 of EqLaplac 
_ P?sing % G Fn03 )+ 00 S (° mo) + 0p Le )| Cr 


Dans cette expression, f est fonction de p, 8 et @. 


24.5.9 Rotationnel en coordonnées curvilignes orthogonales 


Nous voulons calculer le rotationnel de F(q) = Ÿ 4 F(q)ex. Pour cela nous commençons par 
écrire ex = hxVq et nous utilisons la formule de la proposition 12.504(3) avec F£hx en guise de 
f: 

V x Frey = V x (FrhgV x) 
= Fhg V x (Var) +V(Frhx) X Vk 
Re, —— 


2 (24.131) 
1 
. —V(Frhx) X €k. 
hy 
Nous utilisons à présent la formule (24.99) du gradient et le formule e; x ex = D} ejmer : 
1 à 
V x (Fer) = À png ee X Ep 
(24.132) 
= À h; 7 -(Frhx)er. 
Le rotationnel s'écrit donc - 
VxF=— Ejkl (Frhy)e. (24.133) 
Der à 0qj 
Devant e1 par exemple nous avons seulement les termes j = 2, & = 3 et j = 3, k = 2. Étant donné 
que €9231 = 1 et €321 = —1, le coefficient de e; sera simplement 
1 © Ô 
—— Bh F2ho) |. 24.134 
hoh3 (Ge LD 2 | ) ) 


La formule complète devient 


1 Q Q 
V x D Frer — (En —= A (Ra) €1 
k 


°q 
' (Em) —- A Fihs)) e2 (24.135) 
hih3 \Og3 êqi 
+ : (Et — À (Fi) e3 
hoh1 \ og 9 
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24.5.9.1 Coordonnées cylindriques 


En utilisant h, = 1, hg = r et h, = 1, nous trouvons 


1 F, F. 
V x (Pre, + Fpeo + Fe.) = (£ ak m) Er 


r | CO Oz 
CF. OF, EgRotationn j 
or SF 
O(For) OF, 
+(  — DR) 


24.5.9.2 Coordonnées sphériques 


En utilisant h, = 1, ho = p et h,, = psin 0, nous trouvons 


1 ( =) 
Cp 


V x (Fe, + Foeo + Fe) = 


psin 0 00 0 
1 OF,  O(F,psin 6) 
T ( _ à ee (24.137) 
n 1 CF9p OF, 
p \ Ôp 6 ) 
Note : dans le premier terme, il y a une simplification par p. 
24.6 Les formules 
24.6.1 Coordonnées polaires 
Les vecteurs de base : 
__ fcos(8)\ : 
Er = me = cos(#)ez + sin(0)ey (24.138a) 
eg = MUC — sin(4)e; + cos(#)e (24.138b) 
$ cos() Li LL ‘ 
Le gradient : : : 
> _ Of 10f 
Vf(r,0) = EAU Û)e, + 7 30 O)ee. (24.139) 
La divergence : 
110 0 EggRxJ 
Vupee |A) re Sn) #26) 
Le rotationnel : aie _. 
V x (Fe, + Fos) — ( ane =) . PT 
æ 


Notons que le rotationnel n’existe pas vraiment en deux dimensions. Ici nous avons vu le champ 
F(r,0) comme un champ dans IR° ne dépendant pas de z et n’ayant pas de composante z. Le 
résultat est un rotationnel qui est dirigé selon l’axe z. 


24.6.2 Coordonnées cylindriques 


Les vecteurs de base : idem qu’en coordonnées polaires, et on ajoute e, sans modifications. 
Le gradient : 
of 1 0f 


Vf(r,0,2) = ar (0, 2)er + r 39 (> 0, +)ee + (0, 2e. (24.142) 
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La divergence : 
© Q © 


Le rotationnel : 


00 Oz 
OF,  0F, 

+ ( un )« (24.144) 
O(For) OF, 

h ( dr 0 ) e 


Note : les formules concernant les coordonnées polaires se réduisent de celles-ci en enlevant 
toutes les références à z. 


24.6.3 Coordonnées sphériques 


sin(@) cos(o) cos(@) cos(ç) 
er = | sin(@)sin(ç) |, eg = | cos(@)sin(o) |, 


Les vecteurs de base : 


0) — sin(0 
cos(#) sp) (24.145) 
— sin(o) 
ey = | cos() 
0 
Le gradient : fe Le L 
: of 10f D ©f 
_ | 24.14 
Vf(p,0,%) 06 500 © pain) me ( 6) 
La divergence : 
Pipe a AU CET ORNE ) (24.147) 
_ p?sin® d PTT é 5pŸ “| | 
Le rotationnel : 
1 AF,)sin0  0F 
V x (F560 + Fieo + Fée) — psin 0 ( 00 Ôp ) “ 
1 OF,  O(F,psin6) 
ne ( a Jeu (24.148) 


1 ©F9p 0F, 
TD ( êp  ® ) # 
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Chapitre 25 


Espaces de Hilbert 


25.1 Espaces de Hilbert 

DEFooKSDFooGIBtrG 
Définition 25.1. 
Soit un espace vectoriel E sur le corps K. Son dual topologique, noté E', est l’ensemble des 


formes linéaires continues de E vers K. 
PROPooQFTSooPFfbCc 


Proposition 25.2 ([597]). 
Soient des espaces vectoriels normés X et Y ainsi qu'une forme sesquilinéaire D: X x Y — C. 
L'espace X x Y est muni de la topologie produit\. Il y a équivalence des faits PHÉNODÉFFBoOONPzgP 


(1) ® est continue. ITEMooSFQZooHNchuH 

(2) $ est continue en (0,0) ITEMooWSWQooSYz0o1 

(3) sup{|g(x, y)| tel que fx, [y] < 1} < co. ITEMooRKHQooMVX1YD 
(4) I existe C > 0 telle que 

l(æ, y)| < Clx|lyl (25.1) 

pour tout (x,y) € X x Y. ITEMooLiDCooLIGVDS 


(5) à est bornée 


Dans le cas où @ vérifie ces propriétés, alors nous posons 


A = {|o(x,y)| tel que |(x,y)| < 1} (25.2) 
et 
B = {8 2 0 tel que [(x,y)| < B|x|lyl, Vx, y} (25.3) 
et nous avons 
|] = sup(.4) = min(B). (25.4) 


Démonstration. En plusieurs parties. 
(1) (1) = (2) Une application est continue si et seulement si elle est continue en tout point 
(théorème 7.196). 
(2) (2) = (3) Pour rappel, nous avons mis sur X x YŸ la topologie produit. Le lemme 7.217 
nous indique que cette topologie est la même que la topologie de la norme produit. 
Bref, nous supposons que 6 est continue en (0,0) et nous prouvons que 


sup{|d(æ, y)| tel que ||, |y|| < 1} < 00. (25.5) 


Nous y allons par contradiction. Supposons que pour n dans N il existe (æ»,Yn) € X x Ÿ tels 
que tal, lun < 1 et [b(tn, Yn) > n?|. En posant v, = x,/n et un = yn/n, nous avons 
In 2 1 


< £ —, 25.6 
lon < TE < = (25.6) 


1. Quand on ne précise pas, un produit est toujours muni de la topologie produit 7.15. 
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et la même chose pour |w,|. Nous avons (v, wn) 2 (0,0) et donc, par continuité de @ en 


(0,0) nous avons (un, wn) L; @(0,0) = 0. Mais 


1 1 
|P(Uns Wn)| = 3 1(tn; Un) > LA = À. (25.7) 


Donc nous n'avons pas [p(u,,wn)| — 0. 
(3) (3) = (4) Nous notons 


M = sup{lo(x, y)| tel que x], |y| < 1} < co, (25.8) 


et nous allons prouver que [@(x, y)| < M|x||y|. 


Si x = 0 ou si y = O, c’est évident ; nous supposons donc que x et y sont tous deux non nuls. 
Nous posons v = x/|x| et w = y/|y|. Nous avons alors 


lp(x, y)l = Ixflyllé(v, w)l < Ix|lyllM. (25.9) 
(4) (4) = (5) La norme de & est le nombre 


lol = sup  lé(x,y)h (25.10) 
(x, y)EXxY 


lGæ,y)1=1 


que nous devons prouver être fini. Les éléments (x, y) sur lesquels porte le supremum vérifient 
1 = 1|(x,y)| = max{|x]|| |y|}, (25.11) 


et donc vérifient |x|,|y] < 1. En utilisant (4), nous avons donc 


ll = sup lé(x,y)l< sup Clxllyl < C: (25.12) 
I(ey)l=1 ICæy)1=1 
(5) (5) = (1) I nous reste à prouver que si 6 est bornée, alors elle est ue Soit une suite 


convergente (Z, Un) Eur (x, y). Nous allons prouver que (th, Un) 7 (x, y). Ce sont les 
majorations usuelles : 


1D(Xn; Un) — d(x, y)| < |D(&n; Yn) ni D(Tn: Y)| + |D(Tn; Y) — o(x, y)| (25.13a) 
= (tn; Yn — Y)| + dr — x, y)| (25.13b) 
< [Plltn{lun — y] + léllrn — xl] (25.130) 
— 0. (25.13d) 


Enfin nous supposons que toutes ces conditions équivalentes, et nous prouvons que |g|] — 


sup(A) = min(B). 
() Igl= sup(A) En posant 


C = {ld(x, y)] tel que |(x,y)| = 1}, (25.14) 


nous avons, par définition, |d| = sup(C). Étant donné que € € À, nous avons sup(C) < 
sup(À). Faisons l'inégalité dans l’autre sens. Soit |d(x,y)| € À, c'est-à-dire |(x,y)| < 1. En 
posant v = x/|x| et w = y/|y|] nous avons |d(v,w)| € C et surtout |x|,|y| < 1. Donc 


Ip, w)| = lb, y)1 > px, y)|. (25.15) 


Ix| lu) 


Donc tout élément de C est majoré par un élément de À. Donc sup(A) > sup(C). 
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(2) IgleB Soit (x,y)e X x Y. Étant donné que |x/|x||| = 1 nous avons 


(Ed) < ne OEIL (25.16) 
PE 


En multipliant les deux côtés par |x||y| nous trouvons 


1b(æ, y)l < léllxlyl, (25.17) 


et donc |@| € B. 


(3) |9| minore B 
Nous montrons que pour tout & € À et pour tout B € B, nous avons a < B. En effet si à € À, 
alors à = |@(x,y)| pour un certain (x,y) € X x Ÿ vérifiant |(x,y)| = 1. Mais B € B signifie 
que |(x,y)| < Blx||y]. Nous avons donc 


a = |d(x,y)| < Bxllyl < 8 (25.18) 


parce que |æ||, |y| < 1. 


DefORuBdBN 
Définition 25.3. 
Un espace préhilbertien est 


L n / x ; 52, 9 
— soit un espace vectoriel réel muni d’un produit scalaire *, 
— soit un espace vectoriel complexe muni d’un produit scalaire hermitien®. 


Un espace de Hilbert est un espace préhilbertien qui est complet* pour la norme induite par son 
produit (scalaire ou hermitien), c’est-à-dire tel que 


Ixl = V<x,x) (25.19) 


pour tout élément x. 
Dans les deux cas nous considérons la topologie métrique dérivant du produit. 


Dans les cas de dimension finie, les espaces vectoriels normés sont automatiquement complets 
par la proposition 7.278. 
La différence entre un espace de Hilbert et un espace de Banach est que dans le cas d’un espace 


de Hilbert, nous demandons que la norme dérive d’un produit scalaire. 
PropTdupIG 


Proposition 25.4. 
Si. est un espace de Hilbert réel, alors 


le + y? = fl? + ul + 2x, p). (25.20) 
Si. est un espace de Hilbert complexe alors 
Le + gl? = el? + y? + 2Re(a, y) FBT) 
Dans les deux cas nous avons l'inégalité de Cauchy-Schwarz : 


Ke, gl < lxlflyll. (25.22) 


Dans un espace vectoriel de dimension infinie, tous les opérateurs linéaires ne sont pas continus. 


2. Définition 9.164. 
3. Définition 9.172. 
4. Définition 7.251. 
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Exemple 25.5. 
Soit un espace vectoriel V engendré par la base {eg}xen et l'application linéaire T': V — V donnée 
par 

Tex = kex. (25.23) 


Nous allons montrer que l’image inverse de la boule unité ouverte © n’est pas ouverte. En effet si 
(ex) est une suite de réels strictement positifs tendant vers zéro, les vecteurs 


l 
Ag = G + a) €k (25.24) 
sont hors de T1O parce que 
Tax = (1 + kex)eg. (25.25) 
Mais la suite (az) converge vers 0 qui fait partie de TO. Donc le complémentaire de T1 n’est 
pas fermé, ce qui prouve que TO n’est pas ouvert. PA 
PROPooMSAYooONHLYq 


Proposition 25.6 ([1]). 
Soit un espace de Hilbert °° et un espace vectoriel normé (E,|.]) tel qu'il existe une bijection 
linéaire isométrique D: 37 — E. Alors en posant 


(a, Br = 87" (a), 8 (8))», (25.26) 
l’espace E devient un espace de Hilbert. 


Démonstration. Le fait que €...) soit un produit scalaire (hermitien) lorsque €.,.)4 l’est est une 
conséquence de la linéarité de ®. Il donne la norme parce que 


Va, a) = 448" 1(a), &-1(a)) = [8 "(a)| = [al (25.27) 


parce que ®-l est une isométrie. 

Pour voir que E est complet, soit une suite (ax) de 7-Cauchy dans Æ. Nous devons prouver 
qu’elle converge. Nous posons zx = ® (ay). 

Commençons par voir que (x}) est r-Cauchy dans #7. Soit un voisinage V de 0 dans #7. Nous 
posons U = E(V). Vu que (ax) est r-Cauchy, il existe N > 0 tel que ax — « € U dès que k,1 > N. 
Du coup, si k,1 > N nous avons aussi 24 — 2 = ®-l (ax — œ) € PU) = V. Cela prouve que 
(xx) est r-Cauchy. 


Vu que # est complet, il existe x € #7 tel que x 2, %, Montrons que &y =, (x). 
Soit € > 0 et N > 0 tel que |xx — x| < € dès que k > N. Alors nous avons aussi 


lar — Px)] = 1B(xx) — P(x)] = 1B(xx — x)| = Aux — x < € (25.28) 


où nous avons utilisé le fait que ® était linéaire et une isométrie. 


25.1.1 Sous-espace vectoriel fermé ? ? ? 


Nous verrons que beaucoup de résultats demandent un sous-espace vectoriel fermé. Une ques- 
tion légitime est : est-ce qu'il existe des sous-espaces vectoriels qui ne soient pas fermés? En 
dimension finie, tous les sous-espaces vectoriels sont fermés, mais cela n’est pas vrai en dimension 
infinie. 

Soit en effet une partie libre infinie À = {v;};en dans un espace de Hilbert 47. L'ensemble 
Span(A) des combinaisons linéaires d'éléments de À est un sous-espace vectoriel de 7, mais il 
n’est pas fermé. 

En effet, supposons pour simplifier les notations que |v;| = 1 pour tout i. Alors nous considérons 
la combinaison 


(we) 
a= ÿ ax (25.29) 
k=1 
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où les ay sont suffisamment décroissants pour assurer les convergences °. Le vecteur a n’est pas 


dans Span(A), mais la suite a, = D, axvx est dans Span(A) et converge vers à : an À, à. En 
effet, 


00 00 
lan —al=| > œul< D» le 0. (25.30) 
k=n+1 k=n+1 


Vous voulez des détails sur la dernière limite? Vu que la somme ÿ},|az| converge, la suite des 
sommes de queues de suites ® converge vers zéro : 


Le] 
Jim D, larl =0. (25.31) 
k=n+1 


25.2 Théorème de la projection 


Voir la version plus simple dans 18.103. 
ThoProjOrthuzcYkz 


Théorème 25.7 (Projection sur partie fermée convexe[598, 599]). 
Soit un espace de Hilbert, x € €, et C un sous-ensemble fermé convexe de . 


(1) Les deux conditions suivantes sur y € °° sont équivalentes : ETSfYCSItemi 


(la) (x — y] = inf{|x — z| tel que ze C}, ETsfYCSItemii 


(1b) pour tout ze C, Re&x — y,z — y) < 0. 
(2) Il existe un unique y € À, noté y = projc(x) vérifiant ces conditions. 
Démonstration. Nous commençons par prouver l’existence et l’unicité d’un élément dans C véri- 


fiant la première condition. Ensuite nous verrons l’équivalence. 
Nous nommons d l’infimum en question de la première condition. 


Existence Soit (y,) une suite dans C telle que 
Jim |æ—yn| = inf{|z- y| tel que ze C} = d. (25.32) 


Nous allons montrer que cette suite peut être choisie de Cauchy. Elle convergera donc dans #7 
parce que ce dernier est complet. Mais C étant supposé fermé dans .#, la limite appartiendra 
à C. Soient r,s € N. D'abord nous avons 


Ur — Ysl = Yr Us TL L,Yr — Ys TL TX -J9à 
| PP =< + +x— 7) (25.33a) 
= ur — ef + fus — 2? — Xur — æ, gs — x). (25.33b) 
Ensuite, 
Ur+ys | 
41% ; x) = <yr + Us — 27, Yr — Ys — 22) (25.34a) 
= ur — {+ fus — x? + 2 — æ,ÿs — x). (25.34b) 


Si nous égalisons les valeurs de 2{y, — x, ys — x) nous trouvons 


À 4 Ou — a + Ou — af. FRE) 


Ur + Ys 
2 


ba 


lu — go? = 4 


La distance infimum étant d, nous pouvons choisir y, de telle façon à avoir 


1 
ln 2 <d+. (25.36) 


5. Par exemple ax = 1/ k? si les vx sont orthonormaux. 
6. On se comprend hein. 
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D'autre part étant donné que C'est convexe, (y, + y,)/2 est dans C et nous avons 


En mettant ces majorations dans (25.35) nous trouvons 


> d. (25.37) 


Yr Ts _,, 
2 


1 


1 1 1 
mul < ad +2(d+ <) +2(a+) NL. (25.38) 


La suite (y,) est donc de Cauchy et la limite est un élément de C. Prouvons que cet élément 
y réalise l’infimum. Pour cela nous avons les inégalités 


d< x y < {x — y + ln — y (25.39) 
En prenant le limite n — © nous trouvons 


d<|x—y|< d. (25.40) 


Unicité Même preuve que pour le théorème en dimension finie 12.142. 
(1a)= (1b) Même preuve que pour le théorème en dimension finie 12.142. 


(1b)= (1a) Même preuve que pour le théorème en dimension finie 12.142. 


PropAXJpCe 
Proposition 25.8. 
Soit C' une partie convexe et fermée de l’espace de Hilbert 7. Alors pour tout x1,x2 € nous 
avons 
proje(r) — proje(r2)| < lei — tal (25.41) 


En particulier la projection est une application continue. 


Démonstration. Nous posons y = projc(xi) et y = projc(x2). Par la partie (1b) du théo- 
rème 25.7, nous avons, pour tout z,2/ e C les inégalités 


0 (25.42) 
0. (25.42b) 


Re@r1 — y1,2 — y) 


< 
Retro — y2, 2! — yo) < 


En prenant z = y et z/ = y, et en sommant nous trouvons 
Re(æ1 — y1) + (ya — x), ya — y) & 0. (25.43) 


Nous pouvons maintenant calculer 


|? = Re |y1 — y 


= Rein ut eh 
= ReÇy1 — ya, æ1 — to) + ReÇye — y1, (ta — y1) + (ye — x2)) 


ya — Y2 


(25.44) 
< (y1 — Y2, T1 — Ta) 
< |Qy1 — ya, œ1 — z2)| 
< |y1 — y2lle1 — æ2l: 
En simplifiant par |y1 — |" nous trouvons le résultat 
ya — yo < |x1 — æol. (25.45) 


7. Si c’est nul, alors la preuve est évidente. 
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ThoMXw0 jb 
Théorème 25.9 (Projection orthogonale). 
Soit °° un espace de Hilbert et K, un sous-espace vectoriel fermé non réduit à {0} et x € S°. 
L'élément y = projx(x) est l’unique élément de K tel que 


z-yekt. (25.46) 
De plus l'application x — projk(x) est linéaire, continue et de norme 1. 
L'élément y ainsi défini est la projection orthogonale de x sur K et sera noté projx(f). 


Démonstration. La continuité de la projection est donnée par la proposition 25.8. 
Soit z un élément de K tel que {2 — x, a) = 0 pour tout a € K. Nous avons 


x — al? = |z— x|? + |a — z/? +2<z—x,a— 2) (25.47a) 
—— ———— 
=0 
> |z—x[°. (25.47b) 


Le produit scalaire est nul parce que a — z € K. La distance |z — x| est donc bien la plus petite 
distance entre x et les éléments de X. 

Dans l’autre sens, nous supposons que y € K minimise la distance à x dans K. Par hypothèse 
pour tout a et pour tout À € R, la différence 


NGy + Aa) — x? — |y — x|° (25.48) 
est positive. En développant les produits scalaires nous trouvons la conditions suivante 
Xal? + 2Xça, y — x) > 0 (25.49) 


qui doit être vraie pour tout À € R. En tant que polynôme du second degré en À, cela n’aura pas 
deux racines réelles distinctes uniquement si (a, y — x) = 0. 

Nous montrons maintenant la linéarité de la projection orthogonale. Soient x1,x%9 € 7. L'élé- 
ment y = projx %1 + proj T2 satisfait à la condition d’orthogonalité : pour tout 2e K, 


{t1+%2—projx T1 —projx L2,2) = {t1 —projr T1,2) +x2a —projxr2,z)=0. (25.50) 
Étant donné que X est un sous-espace vectoriel, la condition de minimalité est automatiquement 
vérifiée (seconde partie du théorème 25.7). 

En ce qui concerne la norme opérateur de projx, la décomposition de x e #7 en composantes 
dans K et Kt est 

z=x+(x-projræx). (25.51) 
Étant deux parties orthogonales nous avons 
| 2 2 : 2 
Iprojx x” = Îxl” — (x —projx xl. (25.52) 


En prenant |x| = 1 nous trouvons | projx x|? < 1 et par conséquent | projx | < 1. Mais d’autre 
part en prenant x € K nous avons automatiquement | projx | > 1. 


Proposition 25.10. 
Soit #° = L?(Q,A,u), F une sous tribu de À et K l’ensemble de fonctions F-mesurables dans 
L?(Q,A,u). Si fe L?(Q, A, ju) est positive, alors projx f est positive (presque partout). 


Démonstration. L'ensemble À = {projx f < 0} est dans F. En effet 
A = (projx f) (]-c0,0[) (25.53) 


alors que, par construction, projx f est F-mesurable. La fonction indicatrice 14 est alors F- 
mesurable (c’est-à-dire 14 € X) et nous avons 


o< | fi= | projx f14 < 0. (25.54) 
(o (e 


Étant donné que nous avons supposé f > 0 nous avons alors (A) = 0. D'où le fait que projx f 
est presque partout positive. 
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25.3 Systèmes orthogonaux et bases 


Dans cette partie nous noterons K le corps de base de l’espace 47. Seuls deux cas sont envisagés : 
K = € ou K = R. 
Pour chaque x € .#7 nous considérons l’application 


Gy: À — K EQooMWZA0OZUFKQ 
Tr (x, y). Ë | ) 


Ce sont des applications continues. 


25.3.1 Orthogonal d’une partie 
DEFooXUXQooMmDnhW 


Définition 25.11. 
Soit une partie À de l’espace de Hilbert #°. L'’orthogonal de A est l’ensemble 


At ={ve.# tel que {v,x) = 0Vx e A}. (25.56) 


PropdpaMpH 
Proposition 25.12. 
Si X° est un préhilbert et si A CS, alors l’ensemble AT est un sous-espace fermé de #. 


Démonstration. L'application ®, définie en (25.55) est continue pour chaque x € .Æ° et par consé- 
quent l’ensemble ker ®, = ®;1({0}) est fermé. L'ensemble 


A = [\kerd, (25.57) 
ze À 


est donc fermé. 


ThowZyaiz 
Théorème 25.13. 
Soit À un espace de Hilbert et Fun sous-espace fermé de 3€. Alors 


(1) Nous avons la décomposition 
E 
H=FOFL. PSSES) 
ItemThowZyaizii 
(2) La projection sur F par rapport à la somme directe (25.58) est la projection projr du théo- 
rème de projection. 


(3) La décomposition (25.58) est topologique. 


Proposition 25.14. : 
Si F est un sous-espace de l’espace de Hülbert Z alors on a F1 = F. 


Démonstration. Nous savons par la proposition 25.12 que F+ est fermé, par conséquent le théo- 


rème 25.13 donne la somme directe 
#°= FT @F x. (25.59) 


Mais F étant également fermé nous avons la somme directe 
#° = F@(F).. (25.60) 


Montrons que (F)+ = F4, En effet six e Ft et siye F, alors il existe une suite y, dans F qui 
converge vers y. Pour chaque n nous avons (x, yn> = 0 et donc {x,y) = 0 par continuité du produit 
scalaire. 
Nous avons donc 
H#H=FI@FH=FOr+. (25.61) 


Fit 


Mais Fc F1+ (prendre une suite). Les espaces F et étant tous deux des supplémentaires de 


FT, nous déduisons qu’ils doivent être égaux. 
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PropqiWonByiBmc 
Proposition 25.15. 
Soit. un espace de Hilbert et F un sous-espace vectoriel de 7. Alors F est dense si et seulement 
si F4 = {0}. 


Démonstration. Nous savons que : 
AH =FI@F. (25.62) 


Donc nous avons .#° = F si et seulement si F1 = {0}. 


Pour vérifier si un sous-espace vectoriel d’un espace de Hilbert est dense, il suffit donc de 
montrer que son orthogonal est réduit à zéro. 


25.3.2 Dual, théorème de représentation de Riesz 
LemjYVcHE 


Lemme 25.16. 
L'application linéaire 


D: H — LS ,K) 


(25.63) 
yr d, 


est une isométrie : nous avons |®,| = |y|. 
De plus pour chaque y, l’application ®,, est continue. 


Démonstration. En utilisant la définition de la norme opérateur et l’inégalité de Cauchy-Schwarz, 


1B,] = a 18,(x)1 = sup x, y)l < sup [xl y = |yl. (25.64) 
|| = 


Par conséquent |®,| < |y|. Mais d’autre part le fait que &,(y) = |y|? montre que |®&,| > |yl. 
En ce qui concerne la continuité de #,,, elle est garantie par le fait que c’est une application 
linéaire bornée via la proposition 11.62. 


Définition 25.17. 
Le dual de l’espace de Hilbert € est l’ensemble 


H! = {f: A — K linéaire et continue}. (25.65) 


Notons que dans le contexte des espaces de Hilbert nous demandons la continuité des éléments 
du dual parce qu’elle n’est pas automatique par la linéarité dans les cas de dimension infinie. En 
principe nous devrions préciser dual topologique, mais nous ne le ferons pas systématiquement 
lorsque le contexte parle clairement de topologie (ce qui est le cas lorsqu'on parle d'espaces de 
Hilbert). De temps en temps le dual algébrique d’un espace est noté E* ; dans ce cas la continuité 
n’est pas demandée. 


ThoQgTovL 
Théorème 25.18 (Théorème de représentation de Riesz, thème 21). 
Soit un espace de Hilbert °° sur le corps K (R ou €). L'application 
BH — NH! 
(25.66) 
ye 


est une bijection isométrique. 


Démonstration. Nous savons du lemme 25.16 que ® est une isométrie. Nous devons seulement 
montrer que ® est surjective. L'application nulle est dans l’image de ®. Soit f e .#' non nulle. Par 
continuité nous savons que F = ker(f) est fermé, donc 


H = Ker(f) @ (ker f)! OO 5) 


par le théorème 25.13. 
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(1) Une base adaptée 


Nous considérons une base de .#7 adaptée à la décomposition 25.67, c'est-à-dire 
— (us)ses une base de ker f, 
— (ver une base de (ker f)+. 
(2) (ter f)L n ker(f) = {0} 
Sive (ker f)+ alors pour tout w € ker(f) nous avons {v, w) = 0. En particulier si v lui-même 
est dans ker(f) alors &v,v) = 0 et vu = 0. 


(3) Une base encore plus adaptée Si v est non nul dans (ker f)+, alors f(v) £ O (sinon 
il serait dans l’intersection entre ker(f) et (ker f)+). Mais f(v) Æ 0 dans K implique que 
f(Kv) = K, c’est-à-dire que {f(v)} est une base de Image(f) (l’image de f est K). 

Le théorème du rang (théorème 4.46) assure alors que 


{v} U {us}ses (25.68) 


est une base de # avec w € (ker f)+ et u, € ker f. Nous choisissons v pour avoir |v| — 1. 
(4) Existence 
Nous pouvons maintenant prouver l’existence de y tel que ®, = f. Prouvons qu'en posant 


y = f(v)v nous avons D, = f. Pour cela, un peu de calcul : 


Pylv) = Çu,y) = f(u)Cv,v) = f(v) (25.69) 
PyCus) = us,y) = 0. (25.69b) 


Par conséquent ®, et f coïncident sur une base de #7. 

(5) Unicité 
En ce qui concerne l’unicité, d’abord si ®, = f alors nous devons avoir y € (ker f)+ et par 
conséquent y = Àv pour un certain À € K. Nous avons alors 


By(v) = ÀÇv, v) = À. (25.70) 


Pour que cela soit égal à f(v), nous fixons À = f(v). 


Notons que nous avons réellement utilisé le théorème du rang pour l’unicité. Si nous ne de- 
mandions pas l’unicité, alors nous n’avions pas besoin du fait que dim(ker f)+ = 1, et nous aurons 
donc pu parler de formes plus générales à valeurs dans K”. 


25.3.3 Séparabilité 
DEFooSFOJooGICSbT 


Définition 25.19. 


Un espace topologique est séparable si il possède une partie dénombrable dense. 
DEFooQVPHooJaSWyF 


Définition 25.20 ([600]). 
Si E est un espace vectoriel normé nous disons que À est une partie totale de E si Span(A) est 
dense dans E. Attention : nous rappelons que Span(A) est l’ensemble des combinaisons linéaires 


finies d'éléments de À. 
PROPooZMWHooVwvNBY 


Proposition 25.21. 
Un espace vectoriel normé est séparable si et seulement si il possède une partie totale dénombrable. 


Démonstration. Si À est une partie dénombrable de E, alors le Q-espace vectoriel Spang À est 
dénombrable, et sa fermeture est la même que celle de Spang A. 


Définition 25.22. 
Une famille (u;i)ier d'éléments de 7 indicée par un ensemble quelconque T est un système or- 
thonormé si 
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(1) fu = 1 pour toutiel, 
(2) w L'u; pour tout i Æ j. 


Notons que si (un)nen est un système orthonormé dénombrable alors en utilisant les formules 
de la proposition 25.4, nous avons 


DÉTENTE Expaus 


Exemple 25.23. 
Dans l’ensemble L2(a,b) avec b — a = L l’ensemble des fonctions 


en(t) = — exp(T int) Fonte 


avec n € Z forme un système orthonormé. En effet 


2 2 
lens En} = J exp( int) exp(— Tnt) 1 (25.73) 
à Ja L L 


b— 
et 
1 | 27 (n—m)t 
Lens Em) = ;=— | eZ dt = 0: (25.74) 
b—aJ, 
Dans cette intégrale nous utilisons le fait que b = a + (b — a) pour simplifier les expressions en 
cours de calcul. 


La famille (25.72) est le système trigonométrique de L?(a,b). On en parle aussi dans [601]. 


A 
PROPooMOQRooCPFnPC 


Proposition 25.24. 
Une partie orthonormée est libre. 


Démonstration. Soit (u;);er une famille orthonormée de #7 et une combinaison linéaire finie nulle : 
nm 
S_ axur = 0. (25.75) 
k=1 


Nous développons la somme en utilisant les formules de la proposition 25.4 : 


0=| DE = al” lux]? + 2 D (art, au). (25.76) 
p k ka 


La famille étant orthonormée, les choses se simplifient en 


Ya =0, (25.77) 
k 


ce qui signifie que ax; = 0 pour tout k. 


Avant de continuer nous devons définir comment nous calculons des sommes sur des ensembles 
quelconques. Si 7 est un ensemble et si pour chaque à € I nous avons un nombre réel positif a;, 


alors nous définissons 
D = sup >, Ge (25.78) 


Cela est discuté dans la section 11.8. 
PropHKqVHj 


Proposition 25.25 (Inégalités de Bessel). 
Soit °° un préhilbert. Si (u;)ier est un système orthonormé et si x € , alors 


DK, w)f < |xl?. A SE 


icl 
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Démonstration. Les éléments de la somme étant des réels positifs, la proposition 11.103 fonctionne 
pour décrire les sommes. 
Posons c;(x) = {x,u;). Pour toute partie finie J € T nous avons 


0<fz- cj(æ)u;f* = ||? - 2Re Ÿ (x, c(z}us) + D |c;(x)l°. (25.80) 
jeJ j j 


Mais en tenant compte du fait que 


€, cr)u) = cfa), us) = |c;(æ)f?, (25.81) 


nous restons avec 


PC OTIECNCOE F5) 


jeJ jeJ 
Finalement, 


Dix)? < Ixf?. (25.83) 
jEJ 


Ayant cette inégalité pour toute partie finie de 1, nous l’avons encore pour le supremum. 
PROPooWTOZooYZdlml 


Proposition 25.26. 
Soit À un préhilbert et une famille orthonormée (u;)ier. Si 


= >», Éru RU 


iel 
alors & = (x, wi). 


Démonstration. Nous appliquons l'application ®,, du théorème de représentation de Riesz® à 
l'équation (25.84). 

Si I est dénombrable, alors permuter ®,, avec la somme consiste à invoquer la continuité, et 
permuter la limite des sommes partielles avec ®,, (l'application ®,, est continue parce qu’isomé- 
trique). 

Sinon, il faut utiliser la proposition 11.114. Il faut donc montrer que la famille ®,, (Eu) est 
sommable. Cela est fort vrai parce que cette famille ne contient en réalité qu’en seul élément non 
nul, celui avec à = k, qui vaut 64. Au final nous avons : 


(t, Uk) = >, Pur (Ed) = Ék. (25.85) 


icl 


25.3.4 Base hilbertienne 


Définition 25.27. 
Une base orthonormée est une famille dénombrable orthonormée et totale”. Cela sera souvent 
aussi appelé une base hilbertienne. 


DEFooADQXo0oFoIhTG 


25.28. 
Cette définition demande quelques remarques. 


(1) La notion de base hilbertienne n’est pas la même notion de base qu’en algèbre. En effet pour 
avoir une base algébrique d’un espace vectoriel, nous demandons que les éléments soient des 
combinaisons linéaires finies des éléments de la base, tandis qu'ici en demandant que la partie 
soit totale nous demandons simplement que les combinaisons linéaires finies soient denses. 


(2) Nous allons voir qu’un espace de Hilbert est généré par les sommes infinies de vecteurs d’une 
base hilbertienne avec des coefficients qui forment une suite dans £2. 


8. Théorème 25.18. 
9. Définition 25.20 
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(3) Nous ne demandons pas que la famille soit libre ? La belle affaire. Une famille orthogonale 
est toujours libre, proposition 25.24. 


(4) Nous verrons dans la proposition 25.37 que toute base hilbertienne est maximale (définition 


25.33), c’est-à-dire que si {x,b) = 0 pour tout b dans la base, alors x = 0. 
LEMooHWOBooQJKdTD 


Lemme 25.29 ([602]). 
Si € est une base hübertienne !° de l’espace de Hübert %° et si x € Æ° alors l’ensemble 


{ee € tel que {x,e) 0} (25.86) 


est au plus dénombrable. 
Démonstration. Notons qu'ici, 47 n’est pas supposé séparable. Nous savons par l'inégalité de Bessel 
(25.79) que 

Dia e) < |xl?. (25.87) 


ec£ 


Donc si e > 0 est donné, l’ensemble {e € € tel que |[{x,e)| > €} est fini. Or 


00 
1 
{e € € tel que {x,e) ÆZ 0} = {ee € tel que [éx,e)| > 0} — U {e € € tel que |{x,e)| > A1 (25.88) 
n=1 


Bref, cet ensemble est une union dénombrable d’ensembles finis. Il est donc dénombrable. 


Remarque 25.30. 
Le lemme 25.29 ne signifie pas que la base € doive être dénombrable. Il signifie seulement que pour 


chaque x séparément, seule une partie dénombrable de € est nécessaire. 
CORooFROTooNupAQs 


Corolaire 25.31 ([602]). 
Si un espace de Hilbert possède une base hilbertienne dénombrable, alors toutes ses bases hilber- 
tiennes sont dénombrables. 


Démonstration. Soient € et F des bases hilbertiennes de l’espace de Hilbert 77, en supposant que 
€ soit dénombrable. Pour chaque f € F nous avons ({f,e) Æ 0 pour au moins un e € €, sinon en 
vertu de la décomposition (25.84) de f dans la base €, nous aurions f = 0. Nous avons donc 


Fe Ut e F tel que {f,e) Z 0}, DS 0) 


eec£ 


alors que le lemme 25.29 indique que chacun des ensembles de l’union est au plus dénombrable. 
La partie F est donc une union dénombrable d'ensemble dénombrables. Elle est dénombrable. 


Remarque 25.32. 
En travaillant un peu plus sur la notion de cardinalité, le corolaire 25.31 indique que toutes les 
bases hilbertiennes ont même cardinalité. En effet en laissant tomber l'hypothèse de dénombrabilité 
sur €, l'inclusion (25.89) donne que F est une union de Card(£) ensembles dénombrables et est 
alors de cardinalité Card(£). 

DEFOooRFATooDRKWoJ 
Définition 25.33. 
Une partie orthonormale B est maximale si le seul x € °° vérifiant {x,b) = 0 pour tout be B 


est x = 0. 
LEMooXIECooCAQeJN 


Lemme 25.34 ([1, 603]). 
Tout espace de Hilbert possède une partie orthonormale maximale. 


10. Définition 25.27. 
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Démonstration. Soit 47 un espace de Hilbert et ©, l’ensemble de parties orthonormales de #7, 
ordonné !! par l'inclusion. Cet ensemble est inductif. En effet soit une partie totalement ordonnée 
{A;}ier de © : chaque À; est une partie orthonormale de .#, et de plus pour à,j € T nous avons 
soit À; © À; soit À; € À;. Nous pouvons considérer 


A={J4. (25.90) 


icl 


Cela est encore une partie orthonormée de #7 parce que si æ,y € À, alors il existe 4,7 € I tels 
que æe Ajet ye À;j. Vu que {A;}ier est totalement ordonné nous supposons pour fixer les idées 
que À; € À;. Alors x et y sont dans À; qui est une partie orthonormée; nous en déduisons que 
{æ,y) = 0 et donc que À est une partie orthonormée. C'est-à-dire : À € ©. Par ailleurs, À est un 
majorant de {A;};er pour l'inclusion parce que À; € À pour tout i. 

Nous avons prouvé que © est un ensemble inductif. Le lemme de Zorn 1.23 nous dit alors que 
© possède un élément maximum. Cet élément est une partie orthonormale inclue dans aucune 
autre partie orthonormale. C'est-à-dire qu’il est une partie orthonormale maximale au sens de la 
définition 25.33. 


PROPooENTIooIpIlRAS 
Proposition 25.35 ([603]). 
Si un espace de Hilbert possède une partie orthonormale maximale dénombrable, alors toutes les 
parties orthonormales sont dénombrables (ou finies). 


Démonstration. Soit B une partie orthonormale maximale, et À une partie orthonormale. Pour 
chaque b € B nous notons 


A(b) = {a € À tel que (a, b) £ 0} L {0}. (25.91) 


Un élément de À qui ne serait dans aucun des A(b) serait perpendiculaire à tous les éléments de 
B, et serait donc l’élément nul. Mais l’élément nul est dans tous les A(b) ; donc nous avons 


Ac {JA(). (25.92) 
beB 


Or par l'inégalité de Bessel, l’ensemble A(b) est dénombrable. Par conséquent À est inclus dans 
une union dénombrable d’ensembles dénombrables ; À est dénombrable. 


Le fait que tout espace de Hilbert possède une base hilbertienne est vrai. Nous allons démontrer 
ce résultat d’abord pour les espaces séparables et ensuite, indépendamment, en général. Si vous 


vous la sentez de maîtriser la proposition 25.37, vous pouvez sauter la 25.36. 
PROPooDRFBooWTcunC 


Proposition 25.36. 
Tout espace de Hilbert séparable possède une base hilbertienne. 


Démonstration. Vu que nous supposons avoir un espace de Hilbert séparable, il possède une partie 
totale dénombrable par la proposition 25.21. Soit (v,)ren une telle partie. Quitte à supprimer les 
v; qui sont combinaisons linéaires des précédents, nous pouvons supposer que cette partie est libre. 
Nous considérons l’espace vectoriel 


Fa = SpDantoissss su (25.93) 


Sur F} nous pouvons appliquer un procédé de Gram-Schmidt pour construire une base orthonormée 
{u1,...,un} de F, au sens usuel. En considérant F,}1 et en recommençant, les vecteurs u1,...,u» 
ne changent pas, mais nous obtenons un vecteur un+1. 

Nous construisons ainsi une suite (u,) qui est alors orthonormée au sens des espaces de Hilbert. 
Nous devons encore prouver qu’il s’agit d’un ensemble total. Cela est simplement dû au fait que tout 
élément de Span{v,} est contenu dans Span{u,} parce que Span ne considère que des combinaisons 
linéaires finies. 


11. Définition 1.11. 
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PROPooLDXFooRaxBsI 
Proposition 25.37 ([603]). 


À propos de parties orthonormales maximales. ITEMooVUFXo0DrVwum 


(1) Une partie d’un espace de Hiülbert est orthonormale maximale si et seulement si elle est une 
base hilbertienne. ITEMooZFENooQnS1rv 


(2) Tout espace de Hilbert possède une base hilbertienne. 


Démonstration. Soit une partie orthonormale maximale B et la fermeture de son espace engendré : 
F = Span(B). Pour que B soit une base, nous devons démontrer que F = #7. Pour cela nous 
considérons x € 7 et nous utilisons le théorème de projection orthogonale 25.9 pour mentionner 
le fait que 

z—projpr(x) LF (25.94) 


Cela dit que x — proj#(x) est un vecteur orthogonal en particulier à tous les éléments de B; par 
maximalité nous avons æ — proj#(x) = 0, c’est-à-dire x = proj-(x) ou encore x € F. Cela prouve 
que F =. 

Note : pour être pointilleux, nous aurions dû travailler non avec x — projr(x), mais avec le 
vecteur normalisé à 1. 

En ce qui concerne le second point, nous invoquons le lemme 25.34 pour dire que tout espace de 
Hilbert possède une partie orthonormale maximale. Ensuite la première partie de cette proposition 
nous dit que cette dernière est une base hilbertienne. 


PROPooEYRSooCRP jdK 
Proposition 25.38 (Unicité de la décomposition dans une base hilbertienne|1]). 
Soit un espace de Hilbert °° muni d’une base hilbertienne {ui}ier. Alors : 


(1) Si 
Dai = 0, (25.95) 


iel 
alors a; = 0 pour toutie I. 


(2) Si Der Gui = Der biui, alors a; = b; pour tout i dans I. 


Démonstration. Supposons que Ÿ'; au; = 0. La proposition 25.26 nous dit alors que 
aj = D jai, uj) = (0, uj) = 0. (25.96) 
i 


Pour la même raison, si 


L — > djUüi — > b;u;, (25.97) 


iel iecl 


alors, pour chaque à € I, nous avons a; = (x, u;) et b; = (x, u;), c’est-à-dire a; = b;. 


Voici un petit résumé de ce que nous avons vu en termes de dénombrabilité et séparabilité. 


THO0oOMKNFooVrCNGA 

Théorème 25.39. 

Pour un espace de Hilbert, les choses suivantes sont équivalentes. ITEMooSJKVooFIIbug 
(1) L'espace est séparable !?. ITEMooQTZLooYdtYaF 
(2) L'espace possède au moins une base hilbertienne | dénombrable. ITEMoOHYSXo00ubuUy 
(3) Toutes les bases hilbertiennes sont dénombrables. ITEMooMZICooNBAVum 


(4) Toute partie libre est dénombrable. 


Démonstration. Plein de résultats à citer ..… 


12. Définition 25.19. 
13. Définition 25.27. 
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(1) (1) implique (2) 

est la proposition 25.36. 

(2) implique (3) 

est la proposition 25.31. 

(3) implique (4) 

Le procédé de Gram-Schmidt met en bijection une partie libre avec une partie orthonormale 
(qui engendre le même espace, mais c’est une autre affaire). Or lorsque l’espace de Hilbert 
possède une base dénombrable, toutes les parties orthonormales sont dénombrables par la 
proposition 25.35. 


(2 


— 


RS 
Co 
a 


RS 
Æ 
a 


(4) implique (1) La proposition 25.37(2) dit que tout espace de Hilbert possède des bases 
hilbertiennes. Une telle base est forcément une partie libre parce que toute famille ortho- 
normale est libre (proposition 25.24), et donc dénombrable par hypothèse. À ce point nous 
avons montré que notre espace de Hilbert possédait une base hilbertienne dénombrable. Cela 
implique qu’il est séparable par la proposition 25.21. 


RemfdJcQF 
Remarque 25.40. 
À mon avis il doit exister un théorème de complétion de base hilbertienne disant que si on a 
une famille orthonormée, alors elle se prolonge en base. Utilisant cela, nous trouvons une nouvelle 
démonstration de la proposition 25.25 en disant que la somme sur la « partie de base » est plus 
petite que la somme sur la « base complète ». 


25.41. 

Vu que nous n'avons l'intention de ne travailler qu’avec des espaces de Hilbert séparables et que 
toutes leurs bases sont dénombrables, nous n’allons travailler qu'avec des bases dénombrables, et 
donc des systèmes orthonormés dénombrables. Nous allons conventionnellement les indicer par N. 


La proposition suivante explique que la notion de projection est compatible avec la décompo- 
sition d’un vecteur dans un système orthonormé. 


Proposition 25.42. 
Soit (ux)k>1 un système orthonormé d’un préhilbert 7. Soient 


Le] 
=» Que (25.98) 
k=1 
et 
F = Span{u,..., Un}. (25.99) 
Alors - 
projp(x) = Ÿ, éxuk. (25.100) 
k=1 


Démonstration. Nous allons dans un premier temps montrer que 


nm 
y=z— à épux (25.101) 
k=1 
est dans FT. Pour cela nous calculons 
n (ve) 
{— D Eur us) =< D. Eur, us) = 0 (25.102) 
k=1 k=n+1 


où nous avons utilisé la continuité du produit scalaire pour permuter la somme (infinie) et le 
produit. Étant donné que y € F4 nous avons proj;y = 0 par le point (2) du théorème 25.13. 
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D'autre part proj y peut être calculé selon 


nm 
projry=projpt— ÿÉkprojr un (25.103) 
k=1 
tandis que projrux = ux lorsque 1 < k < n. Par conséquent l’annulation de proj y donne 


nm 
projr? = >, Ep: (25.104) 
k=1 


donc le résultat. 


ThooRArDp 
Théorème 25.43 (Meilleure approximation). 
Soit {u;}ier une famille orthonormée de l’espace de Hilbert °. Alors pour tout x € °° et pour tout 
J fini dans T et pour toute famille de nombres complexes (a;)jez nous avons 


IS upu — xl < | D'açu; — x. (25.105) 


jeJ jeJ 


Ce théorème exprime le fait que les nombres {x,u;) sont les meilleurs coefficients à mettre 
devant les u; pour approximer x. 


Corolaire 25.44. 
Soit {u;}ier une famille orthonormée de °. Pour tout x € °° et pour toutes parties finies J, K de 
T'avec JE K° nous avons 


| D x ujju; — x < | D a, upuy — xl. (25.106) 


jeK jEeJ 


Ce corolaire exprime le fait que plus on prend de termes de la forme , u;yu;, mieux c’est. 
PropzaKXHq 


Proposition 25.45. 
Soit °° un espace de Hilbert et (uh) un système orthonormé dans %°. Si (£n)nen est une suite 
dans €? alors la série 


io (25.107) 
n=1 


converge dans ZX. 
Autrement dit l’application 
SH — 


25.108 
cr ((r, un), | 


est surjective. 


Démonstration. Nous allons montrer que la série 37, &u, est de Cauchy, c’est-à-dire que la 
limite 
n+p 
Jim | D ékux| = 0 (25.109) 
=" 


est uniforme en p. Cela est un corolaire de la formule (25.71) parce que 
n+p 


n+p 
[D ul = 5 lé. (25.110) 
k=n k=n 


Mais si (£a) est dans {?, pour tout €, il existe N tel que si n > N alors le membre de droite est 
inférieur à € indépendamment de p. 
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25.3.5 Décomposition dans une base hilbertienne 


Étant donné une base hilbertienne de .#, nous notons 
ln) = << ü). (25.111) 


Dans le théorème suivant (et d’ailleurs partout), les sommes sur 7 sont prises au sens de la défini- 


tion 11.99. 
ThoyAjoqP 


Théorème 25.46 (Décomposition dans une base orthogonale). 
Soit Æ° un espace de Hilbert séparable {u;};er une base orthonormée (I est un ensemble dénombrable 


quelconque). ItemQGwolxi 


iel 


(1) Pour tout x € 7 nous avons 


où la somme est prise au sens de la définition 11.99. En particulier, la somme converge de 
façon commutative. 


(2) Si£e;}ier est une famille orthonormée qui satisfait la décomposition (25.112) pour tout x € X° 
alors {e;} est une base hilbertienne. 


(3) Nous avons l'identité de Plancherel 
2 2 
FACE (25.113) 
iel 
Le point (5) nous indiquera que cette égalité est en fait suffisante pour dire que nous avons 
une base. 
(4) Nous avons l'identité de Parseval 


a _—__ À E 1 
iel 
ItemQGwolx 
(5) Si {ui} est une famille de vecteurs unitaires vérifiant l'identité de Plancherel, alors c’est une 
base hilbertienne. 


(6) Si {uw}ier est une base hilbertienne, la suite n + |{x,u,)| appartient à P(T). 


Démonstration. (1) Etant donné que le système {u;};er est total, nous pouvons considérer une 
suite de combinaisons linéaires finies des u; qui converge vers x. Nous écrivons 


= ) ou (25.115) 


TE Jn 


et zn — x dans .#. Les ensembles J/, sont des sous-ensembles finis de Z. Nous pouvons les 
choisir de telle sorte que Jh € Jh+1 et [en 9n = 1. Ce choix correspond à éventuellement 
prendre a»,; = 0 pour toutes les valeurs de j « en trop ». 

Soit e > O0 et N tel que |x, — x] < e pour tout n > N. Nous allons montrer que pour tout J 
fini tel que Jv € J nous avons | Xe (x, u;)u; — x| < €. Étant donné que 


” CT, uj)uj = » au; (25.116) 


JEJN jEJ 
avec 
11e 
aj = on EE (25.117) 
0 sinon, 


le théorème de meilleure approximation 25.43 nous enseigne que 


| > up —x| < | >» (x, ujJu; — x| < € (25.118) 


jeJ JEJN 
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par conséquent la somme ÿ,.,(x,u;)u; converge vers x au sens général, et en particulier 
commutativement. 

Les sommes étant commutatives (en particulier x = Ÿ,-,(x, uu;), et les bases hilbertiennes 
étant dénombrables, nous ne perdons aucune généralité en ne considérant que des bases 
indexées par N. 


(2) Nous devons montrer que l’ensemble des combinaisons linéaires finies est dense dans #7. Par 
hypothèse, pour tout €, il existe un ensemble fini J tel que 


NS ua; — x < €. (25.119) 
jEJ 
Cela prouve la densité dont nous avions besoin. 


(3) La norme étant une fonction continue, elle commute avec les sommes infinies, de telle sorte 
que l'égalité de Plancherel donne 


el? = 1 D Xe uw? (25.120) 
iel 
Le système des u; étant orthonormé, 
ll? = (Sr uduf? = SK, uf2. (25.121) 
iel iel 


(4) Au tour de Parseval. Nous commençons par prouver que la somme du membre de droite 
converge. En utilisant l'inégalité |[22/| < [2]? + |2/|? (valable pour z,z € C) et Plancherel, 


Dual < D Kauf2 + (auf 
iel iel (25.122) 


< |el° + ul? 


nous avons 


Nous en déduisons que la famille {x, u; y, u;> est (commutativement) sommable en utilisant 
la proposition 11.110. Par ailleurs nous savons que 


g= ÿ ar) (25.123a) 
iel 

y =) c(yJu, (25.123b) 
icl 


et le produit scalaire étant une forme bilinéaire continue, 


(bg) ” > Katchu, cj(y)u;) (25.124a) 


iel jel 

= >, 2, a(r)c; (és (25.124b) 
iel jeJ 

= > ,a(æ)e(y). (25.124c) 
iel 


(5) Nous utilisons l'égalité de Plancherel avec x = u; : 
ul? = lusl?+ D, Ka, uf. (25.125) 
iel\{5} 
Par conséquent Çu;,u;) = 0 dès que à Æ# j. Cela prouve que le système {u;}ier est orthonormé. 


Nous devons encore prouver que le système est total. Pour cela nous repartons de l’équation 
(25.82) que nous avions déduites dans la démonstration de l'inégalité de Bessel : 


2 2 
le — D c(œ)u;l = le? — D ex). (25.126) 
jEJ jEJ 
Par hypothèse le membre de droite peut être rendu aussi petit que l’on veut en prenant J 
grand (mais fini) dans /. Le membre de gauche indique alors que le système {u;};er est total. 
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(6) L'identité de Plancherel signifie entre autres que si x € # alors >, [(, u;)|? converge. Du 
coup la suite ({x, u;))jer est dans €?(1). 


Remarque 25.47. 

Nous avons décidé d’indexer les bases hilbertiennes par N ; cela est légitime parce que les sommes 
sont commutatives. Il ne faut cependant pas perdre de vue qu’en pratique l’ensemble naturel avec 
lequel on indexe une base est parfois Z. Un tel cas est donné par la base trigonométrique de L?. 
Indexer cette dernière par N plutôt que par Z serait une contorsion inutile. 


Remarque 25.48. 
L'égalité de Parseval est la raison pour laquelle les physiciens écrivent souvent 


(ee) 


Id = Ÿ Jun )(un| (25.127) 


n=1 


dans les livres de mécanique quantique par exemple. Dans certains[604], nous lisons même 


[ rHodes (25.128) 


Notons que ces personnes travaillent avec un espace de Hilbert dont la base n’est pas dénombrable. 
Pour dire que la physique, ça n'utilise pas des mathématiques pour rire! 


Remarque 25.49. 

Par définition une base orthonormée est donc une partie dénombrable dont l’espace vectoriel en- 
gendré est dense. Un espace de Hilbert possédant une base orthonormée est donc séparable. C’est 
ce fait qui nous pousse à ne considérer que des espaces de Hilbert séparables ; nous n’allons donc 
pas étudier ce qu’il se passerait par exemple en considérant l’espace vectoriel librement engendré 
par les éléments de R. 


Exemple 25.50. 
L'identité de Parseval (25.114), dans le cas de l’espace des fonctions continues périodiques de 
période 27 signifie qu’en posant 


1 27 | 
= | (s)e*, (25.129) 
nous avons 
Li = E 
ml OP= lat. dés 
T Jo n=—00 
A 
CorQETwUdF 
Corolaire 25.51. 
Soit À un espace de Hilbert et (un) une base orthonormée. L'application 
CAES 
(25.131) 
mi ((r,un)) ex 
est un isomorphisme d'espaces de Hilbert. 
De plus l’isomorphisme réciproque est 
SE He 
(25.132) 


n=1 
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Démonstration. Nous devons prouver que l’application est bijective et qu’elle vérifie 
S(x) : S{y) = x, y) (25.133) 


où le point dénote le produit dans £2. 

Pour la surjectivité, si (&,) € £? alors nous savons que la somme Dnénün converge par la 
proposition 25.45 et par conséquent (£,) est l’image par S de ce vecteur de #. 

Pour l’injectivité, si S(x) = S(y) alors 


= ne da )le = DXC7 an = Ÿ (25.134) 


en utilisant la décomposition (25.112). 


Le fait que S soit une isométrie est contenu dans Parseval. 


PROPooPVQIooPcEFSe 
Proposition 25.52 ([1]). 
Soit un espace de Hilbert séparable 7, un sous-espace vectoriel fermé V et une base orthonormée 
{bihier de . En posant v; = projy (bi) alors 


C = Span{b; — vi} (25.135) 
est l’orthogonal de V. 


Démonstration. Juste pour rappel, lorsque nous écrivons v; = proj,(b;), nous parlons de la pro- 
jection orthogonale du théorème 25.9. Donc tous les vecteurs b; — v; sont dans V+. En passant aux 
limites, C'E V-. 

Soit x e V- que nous décomposons dans la base {b;};er comme x = ÿ,-,x;b;. Posons c; = 
b; — v; = b; — projy (bi). Alors d’une part 


0 = projy(x) = > projy(b:) = NC — Ci). (25.136) 
i i 
Nous avons utilisé la continuité de proj, pour permuter avec la somme. D'autre part, 


ZT — D mb: = D (bi — Cj + Ci) = Dm (b — Ci) +S mic e C. (25.137) 


mm / 
=0 


Notons que pour la dernière appartenance, il est important de prendre la fermeture pour définir 


C. 


Proposition 25.53 ([1, 605]). 
Toute partie orthonormée d’un espace de Hilbert séparable se prolonge en une base hilbertienne. 


Démonstration. Soit une partie orthonormée {u;};er de l’espace de Hilbert #7. Nous mentionnons 
que cette partie est libre et donc, par le théorème 25.39, dénombrable {#. Montrons pour commencer 
que la partie V = Span{u;};er est un sous-espace vectoriel fermé de #7. 


(1) Vectoriel Soit v,we V et e > 0. Il existe a € Span{u;} tel que [a — v| < € et b € Span{u;} 
tel que |b — w| <e. Dans ce cas, 


fu + w — (a + b)| < 2e. (25.138) 


Cela prouve que v + w € V. Nous procédons de même pour Àv. 


(2) Fermé Par construction. 


14. Avec un peu de mauvaise foi, vous pouvez quand même dire que cela n'implique pas que 7 lui-même soit 
dénombrable, mais vous pouvez le supposer pour fixer les idées. 
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L'orthogonal ! de V est un sous-espace vectoriel de #, et nous pouvons donc en considérer 
une base hilbertienne C = {c,}cA. Nous prétendons que C U U est une base hilbertienne 16 de 


He 


(1) CUU est libre Bing! Il ne faut pas le démontrer : ça ne fait pas partie de la définition 
d’une base hilbertienne. 


(2) C'UU est générateur Bang! Il ne faut pas le démontrer : ça ne fait pas partie de la 
définition d’une base hilbertienne. 


(3) C'UU est orthogonal Ah, voilà quelque chose à démontrer. Nous devons vérifier que les 
produits sont nuls. Soient u, ve U et a, be C. Nous avons : 


— {u,v) = 0 par hypothèse. 
— {u,a) = 0 parce que les éléments de C' sont orthogonaux à V et que u; € V. 
— (a,b) = 0 parce que C' est une base hilbertienne de V+. 

(4) CUU est dénombrable 


L'ensemble C' est dénombrable parce que c’est une base hilbertienne. Quant à {u;};er, nous 
avons déjà mentionné le fait qu’il doive être dénombrable. L'union deux parties dénombrables 


est dénombrable. 


(5) C'UU est total 
Nous devons prouver que Span(C LU) = .# parce qu’il y a bien la fermeture qui intervient 
dans la définition 25.20. Pour cela nous utilisons la proposition 25.15. Si x € 7 alors nous 
avons 


æ = projy(x) + (x—projy(x)) = D + >. LG (25.139) 
icl ac A 
pour des coefficients x; et x,. Notons que I et À sont deux ensembles différents. Aucun des 
ra n’est un des x;, ni inversement. Supposons que x € Span(C' U U)+; alors 


0 = <x,u;) = > Cu) > (Ca Uj) = Tj. (25.140) 


: nn — 
iel , ae À A 


Donc x; = 0. En faisant de même avec 0 = €x,c5) = xg nous déduisons x = 0. 


PROPooZQTAooUENLtg 
Proposition 25.54 ([1]). 
Si ° est un espace de Hilbert séparable de base hilbertienne {e;}ier, alors Æ! est un espace de 
Hilbert séparable dont une base hilbertienne est donnée par les formes 


du: A —C 
(25.141) 
Er dj. 
Démonstration. C’est la proposition 25.6 qui fait tout. 
25.3.6 Digression sur les normes opérateurs 
subsecaeSywF 


Le théorème 25.46 nous indique que si {u;};er est une base hilbertienne, alors pour tout x € # 
nous avons 


proju,(x) = (tr, Wiui, (25.142) 
et donc 
D proj,, = (25.143) 
iel 


15. Voir la définition 25.11 et la proposition 25.52. 
16. Définition 25.27. 


25.3. SYSTÈMES ORTHOGONAUX ET BASES 2011 


Nous ne pouvons cependant pas conclure que 
E N 
> proj,, = Id BAD) 
iel 


au sens de la norme opérateur de la définition 11.51. En effet en prenant 7 = N, l'égalité (25.144) 
demanderait d’avoir 


N 
lim |S proj,,—Id) —0, (25.145) 
— 00 4 
i=1 Le] 
or pour tout N, le vecteur un+1 réalise 
N 
. proj,,(un+1) — UN+I — —UN+1. (25.146) 
i=1 
Par conséquent pour tout N nous avons 
N 
sup Doproj,, rx di (25.147) 
ll=1 fi 
Nous ne pouvons donc pas dire 
00 
Ÿ pro. =1d (25.148) 
n=1 


au sens de la norme opérateur. 
Nous avons cependant la convergence au sens faible. 


Proposition 25.55. 
Soit X° un espace de Hilbert et {u;};en une base hüilbertienne de 7. Au sens de la topologie faible 
sur l’espace des opérateurs nous avons 


O0 
> PTOÿu, = Id. (25.149) 
i=1 


Démonstration. Pour chaque N'EN et xe.#, en vertu de la décomposition (25.112) nous avons 


N 00 

ns proju,(t) — x = » CT, ui JU. (25.150) 
i=1 i=N+1 

Par l’orthonormalité de la base nous avons 


O0 O0 


>, Kaupul = D, Kw), (25.151) 


i=N+1 i=N+1 


dont la limite N — o est zéro étant donné que la suite à > |{x,u;)| est dans {?(R) par le 
théorème 25.46. 


25.3.7 Applications linéaires et continuité 


Nous avons déjà vu dans l'exemple 11.63 que la fonction 


Pr FACE OyE 


ez > kex 


n'était pas continue en zéro alors qu’elle est linéaire. Nous allons maintenant voir qu’elle est un 
contre-exemple à la proposition 12.307. Calculons les dérivées partielles : 


of d 


2 = EG +te;)| 


d , 
PDC 
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où nous avons permuté la somme et la dérivée en considérant la suite de fonctions f£(t) = k(xyx + 

tux)ex. Donc SL (x) existe et est continue sur un voisinage de x = 0 (c'est même constant). Nous 

savons pourtant que la fonction f n’est pas différentiable en zéro parce que non continue. 
L'endroit qui coince dans la preuve de la proposition 12.307 est l'introduction des « contres- 


termes » dans l'équation (12.823). En effet les contre-termes à ajouter seraient 
d 
(x) = =l/(a+s@-0)]. (25.154) 
qui ici serait 
d 
l = | t | = 25.155 
02 trek) a J( Divker) De ( ) 


dont la convergence est plus que douteuse. 
Notons que les dérivées directionnelles n’existent pas toutes, loin s’en faut : si u € H nous avons 


of d 


Le = EU ru], = EDG + ec), = Zn PNR 


La convergence de la dernière somme n’est pas garantie pour tout u. 


Exemple 25.56. 
Soit un espace de Hilbert #7. L'application 


nd D 
9 (25:187) 
ar 1 
n’est pas continue. 
Nous considérons les vecteurs yn = »_, €; et nous posons æ = Yn/|yn|. Nous avons 
nm 
lan? = yn Yn) = D ei e5) = n, (25.158) 
i,3 
donc |yn|| = n, et . 
L'application @ n’est donc pas bornée et pas continue non plus. A 
PROPooWHZKooEXEIrV 


Proposition 25.57. 
Soient deux espaces de Hilbert séparables 4 et #4. Soit une base orthonormée {e;}jer où I est 
dénombrable. Si D: Xi — A est une bijection linéaire continue, alors 


BD me) = D rib(ci). (25.160) 


iel iel 
Démonstration. Soit € > 0. Vu que Ÿ 7e; est une somme convergente 18, il existe une partie 
finie J de I telle que pour tout K fini contenant J, 


ND xse; — x <e. (25.161) 
jeK 


Vu que ® est une isométrie linéaire, nous avons 


| D zd(e;) — S(x)| < 6, (25.162) 
jeK 
et donc bien l'égalité 
Dombes) = B(x). (25.163) 
iel 


17. Donc à base dénombrable, voir 25.39. 
18. Définition 11.99. 


25.4. THÉORÈME DE KOCHEN-SPECKER 2013 


La proposition suivante donne une formule pour l’inverse du ® du théorème de représentation 
de Riesz 25.18 lorsque nous avons une base hilbertienne. 


Proposition 25.58. 
Soit un espace de Hilbert séparable #°. Si pe #/!, alors 


: EQooRLJEo W 
D 1(@) = D 'o(ei)e: BTE 
icl 
dès que {ei}ier est une base hilbertienne de . 
Démonstration. Nous considérons la base des {@;};er de #7”. Remarquez au passage que a; = ®... 


Nous avons = D, do; pour certains D; € C (qui valent D; = d(e;), ça a son importance pour la 
suite). En utilisant la proposition 25.57 pour permuter ® et la somme nous avons le calcul suivant : 


(o] = D dia = D iD(c;) = » P(hie:) = BY ici) = OS d(e;)e;). (25.165) 
iel iel icl iel icl 
En résulté : 


g = (D (ci)e:), (25.166) 


iecl 


et donc la formule (25.164). 


25.4 Théorème de Kochen-Specker 


Le théorème suivant est central en mécanique quantique. La démonstration provient de [606] 
et de Wikipédia. Nous allons démontrer complètement le théorème seulement pour les espaces de 


Hilbert de dimension plus grande ou égale à 4. 
THO00RHHPooQbcDAe 


Théorème 25.59 (Kochen-Specker[606]). 
Soit 7 un espace de Hilbert de dimension plus grande ou égale à 3. Une fonction v sur l’ensemble 
des opérateurs de € ne peut pas satisfaire aux conditions suivantes : 


(1) Si À et B sont compatibles, alors v(A + B) = v(A) + v(B), 

(2) Si À et B sont compatibles, alors v(AB) = v(A)v(B). 
Îci nous disons que deux opérateurs sont compatibles lorsqu'ils possèdent une base hilbertienne 
commune de vecteurs propres. 


Démonstration. Soit {un }nen une base hilbertienne de .#7. Nous notons proj, l’opérateur de pro- 
jection sur l’espace (fermé) engendré par u;. Ce sont des opérateurs compatibles deux à deux parce 
que la base {u,}hen est une base commune de vecteurs propres Fe 

D'abord nous devons avoir v(1) = 1. En effet pour tout opérateur À, nous avons 


v(A) = v(A1) = v(A)u(1). (25.167) 


Pour peu que v(A) # 0, cela nous fait v(1) = 1. 
En vertu du théorème 25.46, un vecteur x e #7 se décompose en x = ÿ,,(t, un)un, et nous 


pro. dt (ru jus LAS, 


En effet le théorème de la projection orthogonale 25.9 nous enseigne que proj,x serait l’unique 
vecteur de la forme Au; tel que Au; — x L u;. Il est facile de vérifier que le vecteur proposé par 
(25.168) vérifie cette propriété. 

Une conséquence est que 


Œ os (5) =. (25.169) 


i=0 


19. Pour les besoins de la physique, nous remarquons que ces opérateurs sont des opérateurs hermitiens qui 
commutent, mais Ça ne joue pas ici. 
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Par conséquent, par hypothèse du théorème nous devons avoir 


Su(proj,) ul} "1 FFT) 


U 


Étant donné que les projections sont idempotentes, 


v(proj;) = v(proj?) — v(proj;)* (25.171) 


et donc v(proj,) doit valoir zéro ou un. Mais la relation (25.170) donne une forte contrainte sur 
le choix de 0 et de 1. En effet, parmi les v(proj,), un et un seul doit valoir 1, les autres doivent 
valoir 0. 

Refaisant le raisonnement pour une autre base orthonormale hilbertienne, nous trouvons que 
les valeurs de v sur les opérateurs de projection sur les différentes directions doivent être choisies 
de telle façon que tout choix de base hilbertienne orthogonale contienne exactement un 1 et le 
reste de zéros. 

Nous voudrions maintenant insister sur un point. Le problème de déterminer de façon cohérente 
les valeurs 0 ou 1 pour tous les v(proj;) revient à attacher 0 ou 1 à tous les rayons de .# de façon 
que toute base orthogonale de 7 contienne exactement un 1. Un rayon est une direction, c’est-à- 
dire une classe d'équivalence x — Àx. Si nous décidons de nommer « blanc » les rayons attachés à 
la valeur 0 et « noirs » ceux attachés à la valeur 1, le problème se réduit à colorer la boule unité 
de façon compatible. 

Soit {u;};jen une base orthogonale de #7 numérotée de telle sorte que v(uo) = 1 et v(ux) = 0 
pour k £ 0. Nous allons maintenant nous particulariser au cas de dimension supérieure ou égale à 
4. Si R est une rotation dans le plan Span{uo, u1, u2, ua}, alors l’ensemble 


{Ruo, Ru, Ru2, Rus, ux}x>4 (25.172) 


est encore une base orthogonale de .# et nous avons encore v(ux) = 0 pour k > 4. Par conséquent 
un et un seul des vecteurs Ruo, Ru1, Ru2 ou Ru3 est colorié en noir ; les trois autres étant blancs. Le 
problème est maintenant complètement réduit à la dimension 4. Note : pour réduire à la dimension 
3, on procède de même, mais pour conclure, il faut travailler plus. 

Nous allons construire 9 bases orthogonales de R* à partir de 18 vecteurs, chacun arrivant dans 
exactement deux des bases. Ils sont donnés dans le tableau suivant : 


0 0 0 0 0 —1 1-1 1 1) 1 1)1 1 
0 0 1 0 0 1 1 1 1 —1 | —1 1 1 1-1 111 —-1 
0 0 O0 I O0 O1 —-1} 1 —-1 1 1 1 1-1 1, 1 1 
O0 I 0 0 1 0 1 —-1| -1 1 1 1 1 1) 1 1-1 1 
1 0 1 0 1 1 1 0 1 1 1 0 1 0 1 O0 | 1 —-1 
1 0 O0 I 0 O0 | —-1 0 0 0 O —I O0 I 1 0 [0 0 
1 O1 O1 —-110 1 0 0 0 1 0 110 1 0 0 
—1 0/0 —-110 0 0 —-I 1 1 —1 0 | —-1 0/0 -I} 1 I 


Chaque case de ce table représente un rayon de R“: il y en a 18 différents, chacun écrit deux 
fois. Une simple vérification montre que chaque colonne est un système orthogonal. La preuve 
du théorème de Kochen-Specker revient à montrer que nous ne pouvons pas colorier ce tableau 
de façon cohérente. En effet, étant donné que chaque vecteur est écrit deux fois, le tableau doit 
contenir un nombre pair de cases blanches et un nombre pair de cases noires. 

Par ailleurs chaque colonne étant un système orthogonal, chaque colonne contient exactement 
une case noire ; il y a donc exactement neuf cases noires dans le tableau, ce qui est impossible. 


25.5 Théorème de Lax-Milgram 

DEFooUNOKooCitMjL 
Définition 25.60. 
Une forme bilinéaire a: V x V — IR sur un espace vectoriel normé V est coercitive si il existe 
a > 0 tel que a(u,u) > alu]? pour tout u € V. 


25.5. 


THÉORÈME DE LAX-MILGRAM 2015 


THOooLLUXooHyqmVL 


Théorème 25.61 (Lax-Milgram{607]). 
Soit un espace de Hilbert réel V muni de différentes choses. 


(1) L'application linéaire L: V — R qui est bornée sur V. Nous notons |L| sa norme. 


(2) La forme bilinéaire continue a sur V x V. 


(3) La forme a est coercitive 0. 


Alors 


(1) Il existe M > 0 tel que |a(u,v)| < Mul|v] pour tout u, ve V. 


(2) Le problème qui consiste à chercher u € V tel que a(u,v) = L(v) pour tout ve V admet une 


unique solution. De plus cette solution vérifie l'inégalité 


le < LE EooUAYSog je y 9EU 


a 


Démonstration. Évacuons deux points faciles avant de commencer les choses sérieuses. D'abord L 
est continue par la proposition 11.62. Ensuite, l’existence du M est donnée par la proposition 25.2. 
Maintenant nous commençons. 


(1) 


Reformulation en équation linéaire La forme L est continue et donc dans le dual V7”; 
le théorème de Riesz 25.18 nous donne donc f € V tel que 


L(v) = (f,v) (25.174) 


pour tout v € V. De plus si w € V est fixé, l'application b,,: vu + a(w, v) est linéaire et bornée 
parce que 

lb] = sup lbv(v)| = sup la(w,v)| < Mfwl|v| = Mwl,. (25.175) 

lvl=1 lvl =1 
Encore une fois, b,, étant continue et linéaire, elle est dans V” et Riesz nous fournit un élément 
A(w) € V tel que 
bw(v) = {A(w),v) (25.176) 

pour tout v € V. 
Le problème variationnel a(u,v) = L(v) est équivalent à {A(u),v) = {f,v). L'ensemble des 
solutions de cette dernière est égal à l’ensemble des solutions de l’équation 


A(u) 27 EAOOPPRP OEM 


A est linéaire 


Soient &, 6 € R et w,z € V. Nous avons pour tout v € V : 
{A(aw + Bz),v) = a(aw + Bz,v) 
= aa(w,v) + Ba(z,v) 
aA(w),v) + BEA(z),v) (25.178c 
{aA(w) + BA(z),v). (25.178d 


Étant donné que nous avons égalité pour tout v € V nous en déduisons que A(aw + Bz) = 
aA(w) + BA(z:), ce qui signifie que À est linéaire. 
|? 


Une autre propriété de À Nous déduisons une majoration de | A(v)|* lorsque ce n’est 


pas nul. Pour ce faire, 


|A(o)]2 = (A(e), A(0)) (25.179) 
= a(v, A(v)) (25.179b) 
< Mlv||A(v)|. (25.179c) 


En simplifiant, | A(v)| < Mlv|. Et donc 


AG? < M? vf. FRooEQ on EE 


20. Définition 25.60. 
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(4) Une contraction 
Nous allons choisir une valeur de p > 0 telle que l’application 


T:wr w— p(A(w) — f) (25.181) 
soit une contraction ?!. Nous avons T(w) — T(w') = w — w' — p(A(w — w’)) et donc 


IT(w) — Tu’)? = [uw — vw? + 0/1 AG — w)[f— 29 A(w — w'),w—w) (25.182) 


= jw — w/|? + p?| A(w — w')|? — 2pa(w — w',w — w’). (25.182b) 


Vu que le dernier terme arrive avec un signe moins, pour majorer l'expression, il faut minorer 
ce terme, c’est-à-dire utiliser a(w — w',w — w’) > alw — w — w/|. Et en même temps nous 
utilisons (25.180) pour le second terme. Au final pour pouvons factoriser |w — w’| et 


IT (uw) — T(w')| < [uw — w/|(1 + p° M? — 2pa). (25.183) 


Pout que T'soit contractante, il faut 0 < P(x) < 1 avec P(x) = M?x?—2ax+1. Le minimum 
de ce polynôme est obtenu en x = re (la formule du Æmin = —b/2a) et vaut 1 — ce < 1. 
Vu que par ailleurs lims_,4 P(x) = +00, et que ce polynôme passe par au moins une valeur 
strictement inférieure à 1, nous savons qu'il existe un x tel que 0 < P(x) < 1. En donnant à 
p cette valeur, l’application Test une contraction. 


(5) Point fixe et conclusion L’ensemble des solutions du problème (25.177) est égal à l’en- 
semble des points fixes de T(v) = v — p(A(v) — f). 
L'application T': V — V est contractante et V est métrique et complet. Ergo le théorème de 
point fixe de Picard 17.37 s'applique et il existe un unique point fixe u € V pour l'application 
T. Ce point fixe est l’unique solution de notre problème initial. 


(6) La majoration 


Nous savons que pour tout v € V, la relation a(u,v) = L(v) est vérifiée. En particulier pour 


U = u nous avons 
a(u,u) = L(u). (25.184) 


D'un côté nous utilisons a(u,u) > alu|? et de l’autre, L(u) < |L||ul : 
aful? < |L||ul (25.185) 


et donc . 
u] < IE (25.186) 
a 


Notons que L(u) et a(u,u) sont positifs. 


EXo0TTBDooUNhBÜc 
Exemple 25.62 ([608]). 
La borne |u| < |Z|/a est optimale au sens où il existe des cas d'égalité. En effet nous pouvons 
considérer 


a(u,v) = su, v) (25.187) 
et 
L(v) = <f,v) (25.188) 


pour un certain s > 0 et f e V. L'application L n’est autre que $; dont nous avons abondamment 
parlé autour du théorème de représentation de Riesz 25.18. Le lemme 25.16 nous apprend que L 
est une application bornée (et donc continue) de norme |L|w = | flv. 

L'application a: V x V — R est continue par la proposition 11.69. Elle est coercive parce que 


a(u,u) = s|ul|?. (25.189) 


21. Définition 17.36. 


25.5. THÉORÈME DE LAX-MILGRAM 2017 


Les hypothèses du théorème de Lax-Milgram 25.61 sont réunies et il existe un unique élément 
u € V tel que a(u,v) = L(v) pour tout v. Cet élément n’est autre que 


u= -f. (25.190) 
5 
Nous avons alors |u| = 1. 
Mais s est la constante de coercivité de a et | f| est la norme de L. Cette dernière affirmation 
est contenue dans le fait que ® est une isométrique dans le lemme 25.16. En reprenant les notations 
du théorème, nous avons l'égalité 


IL] 
ü| = —; 25.191 
lu = © (25.191) 
ce qui signifie que l'inégalité du théorème est dans un certain sens optimale. A 


PROPooFEUZooTNPcBJ 
Proposition 25.63. 
Soit un espace de Hilbert réel V et une application a: V x V — R coercive et continue. 
L'application do: V' — V qui à L fait correspondre l’unique solution u de a(u,v) = L(v) est 


(1) bien définie, 
(2) linéaire, 
(3) continue. 
Démonstration. Le fait que @ soit bien définie est le théorème de Lax-Milgram 25.61. 


L'application d dont nous parlons ici est une application entre deux espaces normés. Soient 
Li, L2 € V'; nous définissons u1 = (Li) et u2 = (L2). Nous avons 


a(u1,v) = Li(v) (25.192a) 
a(u2,v) = La(v) (25.192b) 


pour tout v € V. Par bilinéarité de a nous avons aussi 
a(u1 + u2,v) = (Li + Li)(v). (25.193) 


Vu que Li + L2 est également bornée, u1 + u2 = (L1 + L2). Pour le même type de raisons, si 
ER, 
a(Au,v) = (AL)(v), (25.194) 


c'est-à-dire que D(AL) = Ap(L). 
Donc @ est linéaire. Pour la continuité, il suffit de s’assurer que @ est bornée. Pour cela nous 
utilisons la majoration (25.173) et la définition de la norme d’une application linéaire : 


1 1 
lé] = sup Ié(L)| < sup IL] = — (25.195) 
IZI=1 I2I=1 à 


el 


Donc @ est bornée et par voie de conséquence continue (proposition 11.62). 


Un problème est bien posé au sens de Hadamard si la solution est unique et dépend continument 
des données ; nous ne rentrerons pas plus dans les détails pour l'instant : nous en reparlerons dans 
la définition 33.14 mais sachez qu’il existe en fin de compte autant de Hadamard qu'il y a de 
contextes dans lequel le mot « problème » à un sens. 

Ce que dit la proposition 25.63 est que, a étant donné, le problème qui consiste à résoudre 
a(u,v) = L(v) est bien posé au sens de Hadamard, au moins par rapport à L. 


Théorème 25.64 (Lax-Milgram version symétrique[607]). 
Nous considérons les mêmes hypothèses que celles du théorème de Lax-Milgram, c’est-à-dire un 
espace de Hilbert réel V muni de différentes choses. 


(1) L'application linéaire L: V — R qui est bornée sur V. Nous notons C sa norme. 
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(2) La forme bilinéaire continue a sur V XV. Nous considérons M > 0 tel que la(u, v)| < Mul]|v| 
pour tout u,vEe V. 


(3) La forme a est coercitive. 


Nous supposons de plus que a est symétrique. 
Alors un élément u € V est tel que a(u, w) = l(w) pour tout w € V si et seulement si il minimise 
la fonctionnelle d’énergie 


Vo salu u) hi (25.196) 


Démonstration. Nous séparons les deux sens. 


(1) = Soit u, un élément vérifiant a(u,w) = l(w) pour tout w € V. Soit aussi un élément 
quelconque w € V, et montrons que J{u+w) > J(u) (tout élément de V peut être écrit sous 
la forme u + w). Nous avons : 


J{u + w) = = (au u) + au, w) + a(w,u) + a(w,w)) — lu) — {(w) (25.197a) 
= J(u) + a(u,w) — I(w) +a, w) (25.197b) 

=0 
= Flo à salu u) (25.197c) 


Vu que a est coercive, le second terme est positif et nous avons 
J(u + w) > J(u), (25.198) 


ce qu’il fallait. 
(2) = 
Soit u € V, un élément minimisant la fonctionnelle J. Nous fixons w € V et considérons la 
fonction g: IR — R définie par 
g(e) = J(u + ew). (25.199) 


En développant un peu et en regroupant les termes, 


2 


g(e) = J{u) + e(a(u, w) — l(w)) + alu, w). FooHDDoe ER 


Cela est une fonction éminemment continue et dérivable ; en réalité c’est un bête polynôme 
de degré deux. Vu que u minimise J, pour tout € Æ 0 nous avons g(e) > g(0) ou encore : 
€ = 0 est minimum local (et même global) de g. Le polynôme (25.200) prend son minimum 
en € = 0 si et seulement si 

a(u,w) — (w) = 0. (25.201) 


Vous ne me croyez pas ? Faites g'(e) = 0 ou bien reprenez la formule du —b/2a pour le sommet 
d’une parabole, en tenant compte que a(w,w) Æ 0. Notons qu'ici encore le fait que a soit 
coercive joue parce que c’est cela qui nous permet d’affirmer que la parabole a un minimum 
et non un maximum. 


Chapitre 26 


Analyse complexe 


ChapICHIooXbLccl 
26.1 Fonctions holomorphes 


La dérivée complexe est discutée à la section 12.28, et la définition d’une fonction holomorphe 
est 12.316. 


26.1.1 Équations de Cauchy-Riemann 


Notons que la formule (12.866) donne un développement limité pour les fonctions holo- 
morphes. Si f est holomorphe en 20 alors si z est dans un voisinage de 29, il existe une fonction 
5: R — C telle que lims_,0 s(t)/t = 0 et 


/ E FE 
f(2) = f(&0) + f'(&0)(z — 20) + 512 — 20). 661) 
Nous introduisons les opérateurs 

0 1/0  .0 

A © = 5 (z 3) (26.2a) 

0 - 1/0  .o 

FE = Ô = 5 (Ste) (26.2b) 


Si f est une fonction C-dérivable représentée par la fonction F = P +iQ, les équations de Cauchy- 


Riemann signifient que AP = AQ = 0, c’est-à-dire que les composantes de la fonction f sont 


harmoniques !. 


THOooHXKMooKYKkOjt 
Théorème 26.1. 
Si f € C(Q) alors nous avons équivalence des faits suivants : 
(1) f est holomorphe sur (, 
(2) f vérifie 0,f = 0. 
PropkwlQwug 
Proposition 26.2. 
: . — à : Las : EqmblExI 
Une application f:  — © est C-dérivable sur Q si et seulement si elle est différentiable et | 
Ou Ov 
— = — 26.3 
0x  ©y je 
Ou Ov 
= = 26.3b 
Oy Ox 
où f(x + iy) = u(x,y) + iv(x,y). Ces équations se notent de façon plus compacte 
Of 
— = 0. 26.4 
OZ 


Ces équations sont les équations de Cauchy-Riemann. 


1. Une fonction uw est harmonique si Au = (. 


2019 
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Démonstration. La différentielle de f : IR? — IR? est donnée par la matrice 


_ fOxu(a) Oyu(a) EQw 
Lie En on) ‘ C5 


Cette matrice est une similitude si et seulement si les équations de Cauchy-Riemann sont satisfaites. 
1 | 0 : _— ne : : . 

En effet si 1 = () et à = ( i la matrice T est une similitude (écrivons a +8 son coefficient) si 
T()=a+i8 (26.6a) 

T(i) = —6 +ia, (26.6b) 


c’est-à-dire 


st). (26.7) 


Identifier cette matrice à (26.5) fournit le résultat annoncé. 


PROPooAGGMooIVQFQB 
Proposition 26.3 (Cauchy-Riemann en coordonnées polaires[1, 609]). 
Soit une fonction f: © — © que nous supposons être C-dérivable dans un voisinage de roe"® (ro 
et 0) sont des réels). Nous posons 


f:RxR-C 
: (26.8) 
r,0+ f(re”). 

Alors ITEMOoRTYYooSTgTAQ 
(1) La fonction f admet des dérivées partielles dans les deux directions. ITEMOoDHXTOOB j x jŸ 
(2) Les dérivées partielles de f sont liées par la relation 

of … Of 
ET (ro: 60) = iro SE (ro 6). (26.9) 
ITEMooUUXTooZoDMHI 


(3) La fonction f est de classe C?. 


Démonstration. Nous considérons les fonctions réelles u et v donnant les parties réelles et imagi- 
naires de f : 
FC + ig) = u(æ, y) + iv(æ, y). (26.10) 


Nous avons : ; 
ê © . 
ro, 00) = a (r0 cos(6o), ro sin(6o)) cos(6) 


ou ; i 
+ EAU cos(o), ro sin(00)) sin(00) (26.11) 


+ _. (ro cos(8o), ro sin(8o)) cos(8o) 


+ _ (ro cos(6o), ro sin(6o)) sin(60) 


et 


Ô 
— (ro, 80) =  — (ro cos(6o), ro sin(6o))ro sin(60) 


Es ce (ro cos(bo), To sin(66))ro cos(o) 
: (26.12) 


— e (ro cos(66), ro sin(66))ro sin(60) 


+ _ (ro cos(8o), ro sin(8o)) ro cos(8o). 
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Nous exprimons tout en termes de @,v et 04v en utilisant les équations de Cauchy-Riemann de 
la proposition 26.2 ainsi que la formule cos(0) + isin(0) = e* du lemme 18.11. Pour simplifier les 
notations, nous notons ap = (ro cos(6o), ro sin(6)) e R°. Après quelques calculs : 


(@r.f) (ro, do) = ei (ro cos (#0), ro sin(o)) + 0 2 (ro cos(o), ro sin(6o)) (26.13a) 
= aie (Tao + Tao) (2613b) 
et 
ri i0 .Ov Ov 
(2. f)(ro; do) = roe"”° (5 (ao) - #0) (26.14) 
y z 


En comparant les deux, nous trouvons 


(@.f)(ro; 80) = roi(@-.f)(ro, 80). (26.15) 


PROPooCHUE00YsGcQK 
Proposition 26.4. 
Si f: C — © est holomorphe, alors nous avons 


dfzo = (0:f)(20) (26.16) 


au sens où l'opérateur linéaire df;, : © — € est l’opération de multiplication par le nombre complexe 


(G:F)(20)- 


Démonstration. Soit f(x+iy) = f1(x,y)+ifo(x, y) une fonction holomorphe ?. Les fonctions réelles 
f1 et f2 sont assujetties aux équations de Cauchy-Riemann de la proposition 26.2 : 


Oz f1 = Oyf2 (26.17a) 
Oz f2 = —0yf. (26.17b) 


Nous avons, en recourant à un petit abus de notation entre f;: R? —R et f;: C — R : 


df(u) = 2 (eo + tu)] (26.18a) 
_ SAC + tu) + if2(zo + m)| (26.18b) 
= Or fiui + Oyfiuo + i(0r four + 0yfaus) (26.18c) 
_ {Oxfi fi fu 
= É . 2 (26.184) 
_ { Oxfi  yfi\ fu 
_ (ES O7) fu), 180) 


En utilisant le lemme 12.319 nous reconnaissons la matrice de multiplication par le nombre ©, f1 — 
i0yf1. Or justement, 


1/0 0 1 | | 
Cal — 9 (£ 3) Î — 9 (Or fr + 10» .f2 — i0y fr + yf2), (26.19) 


qui se réduit à ©x.f1 — 404.f1 lorsque nous y appliquons les équations de Cauchy-Riemann. 


2. Définition 12.316. 


2022 CHAPITRE 26. ANALYSE COMPLEXE 


26.1.2 Intégrale sur un chemin dans C 
DEFooBPLJooZwsmxi 


Définition 26.5. 
Si nous avons une application y: [a,b] — © et une fonction f: © — ©, nous définissons 
b 
[re - [ire nor (at (26.20) 
7 a 


pour tous les couples (f,77) pour lesquels le membre de droite a un sens. 


26.6. 

Vous noterez que cette définition n’est pas exactement la même que celle 20.37 d’une intégrale 
curviligne en analyse réelle. Cette dernière demande de prendre la norme de y/, alors qu'ici nous 
la gardons telle quelle. D'ailleurs, gardez en tête que 7 est une fonction à valeurs dans C. Donc 


y/(t) peut très bien être un nombre complexe. 
PROPooCUBTooZDcdHX 


Proposition-Définition 26.7 (Intégrale sur un chemin C1! par morceaux). 
Soit un chemin C1 par morceaux y: [a,b] — €. Nous considérons deux subdivisions a = t1 < t2 < 
tn = b et a = ui < U2 <... < Um = b telles que y soit de classe C? sur les intervalles ll 


et lu, ul Alors 
n—1 m—1 
> Î f= I F (26.21) 
i=1 V7: lit C j=1 y: Juj,uj+11- € 


[s (26.22) 


Cette valeur est notée 


26.1.3 Intégrales sur des chemins fermés 
LemtpEUmi 


Lemme 26.8. 
Si g est une fonction continue dans un ouvert Q € C et si g admet une primitive complexe sur Q 
alors 


Î g(z)dz = 0 (26.23) 
à 
pour tout chemin fermé y de classe C? contenu dans (. 


Démonstration. Nommons G une primitive de g. Par définition, 


[ q= [ G’ (26.24a) 


= [ G'(r())Y (6 dt (26.24b) 
0 

= [e 07)" (E)dt (26.24c) 
0 

= G(7()) - G(7(0)) (26.24d) 

= (26.24e) 


parce que le chemin est fermé : (0) = y(1). 


LemwbwbUR 
Lemme 26.9 (Goursat|515]). 
Soit ® un ouvert dans € et f une fonction continue sur Q, holomorphe sur ® moins éventuellement 
un point (nommé à € Q). Soit T, un triangle* fermé inclus dans Q. Alors nous avons 


| J(z)dz = 0. (26.25) 
oT 


3. Nous considérons ici le triangle « plein ». 
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Démonstration. Nous notons + = ÔT. Dans la suite nous allons définir une suite de triangles T(") 
et nous noterons 4» = 0T(") avec une orientation que nous allons expliquer. Pour commencer nous 
posons T0) = T et 70 = ÊT 0). 

Nous considérons le cas 21 € T, et nous posons 


e= y" | #1 (26.26) 
7 


Notre objectif est de montrer que c = 0. Soit À, B,C les trois sommets du triangle ; nous divisons 
le triangle de la façon suivante. D'abord nous considérons les points 4’, B',C" respectivement 
milieux de BC', AC et AB. En traçant le triangle 4’B'C", nous construisons quatre triangles que 
nous nommons T9, Le théorème de Thalès { assure que le périmètre de chacun des quatre triangles 
est la moitié du périmètre du grand triangle T. 

Sur T nous choisissons l’orientation ABC. De façon à être « compatible », nous choisissons les 
orientations AC”B', BA'C'" et A'C'B'. La somme de ces trois triangles donne T plus le triangle 
A'C'B'. Par conséquent nous choisissons sur le triangle central l'orientation (inverse) 4/B'C" de 


façon à avoir 
4 
= À Fa (26.27) 
[ > T0) 


Cela implique que pour au moins un des quatre triangles (disons T, D) pour fixer les idées) nous 


ayons 
1 
[ f>;] f (26.28) 
TO" 4 Jr 


Nous notons T1) ce triangle. Comme noté précédemment nous avons 
1 
(OT) = 310TO), (26.29) 


et donc 


In) 1 | f= 4Go) 1 | f1> AG) 2 fl= c. (26.30) 
71 71 70 


En répétant le procédé nous construisons une suite de triangles T(*) qui satisfont toujours 
1 
(OT (M) = A IOTO). (26.31) 


Ces triangles forment une suite de fermés emboités dont le diamètre tend vers zéro. Leur intersec- 
tion contient donc exactement un point (lemme 17.128) que nous nommons z9 (et qui appartient 
évidemment à Q). Étant donné que f est holomorphe nous utilisons le développement limité (26.1) 
autour de 29 : 

(2) = f(20) + F0) (x — 20) + (12 — z0l)(z — 20) (26.32) 


avec lims_,0 s(t) = 0. Nous posons g(2) = f(z20) + f'(20)(z — 20) et nous considérons € > 0. Soit 
a > 0 tel que 

[f(z) — g(z)l < «2 — 20l (26.33) 
pour tout |[z2— z0| < a. Le a à choisir pour obtenir cet effet est celui qui donne s(|2— 20|) < €. Soit 
N € N tel que {(}) < a pour tout n > N. D'autre part, deux points dans un triangle sont toujours 
à distance moindre que la longueur d’un côté, donc pour tout z e T(") nous avons |z — 20] < a et 
par conséquent pour tout z dans T(®) nous avons 


[F(z) — g(z)l < 42 — 20|. (26.34) 


Notons que la fonction g est une dérivée : c’est la dérivée de la fonction 


Ge) = 2f(20) + 5P'(co)(e — 2). (26.35) 


4. Théorème 12.162. 
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Par conséquent nous avons 


Î =) (26.36) 
Yn 
par le lemme 26.8. Nous avons donc 
[I ST (9) (26.37a) 
Vn VYn 
< Un) max{|f(z) — g(2)| tel que z e T()} (26.37b) 
< d(yn)?, (26.37c) 
et par conséquent 
BI SE (26.38) 
Yn 


ce qui signifie que c = 0 parce que € est arbitraire. Nous avons donc prouvé le lemme de Goursat 
dans le cas où le point de non holomorphie 21 est en dehors de 7. 

Si z1 est sur un côté, disons sur le côté AB, alors nous considérons un vecteur v € C tel que 
Te. = T + ev ne contienne 2, pour aucun €. Le vecteur v = 2, — C' fait par exemple l'affaire. En 
vertu du point précédent nous avons 

J=0 (26.39) 
Le 

pour tout € > 0. Étant donné que la fonction f est continue (y compris en z1), l'intégrale sur ©T 
est également nulle. 

Si maintenant le point z1 est à l’intérieur de T' nous décomposons T'en trois triangles ayant 
z1 comme sommet commun. Si nous considérons les orientations Az1C, ABz et BC'z1, alors nous 


Ï, Î _ he f : le d EL :. f Sn 


alors que par le point précédent les trois intégrales du membre de droite sont nulles. 


PrpopwQSbJg 
Proposition 26.10 ([515]). 
Soient ( un ouvert étoilé et f une fonction holomorphe sur (À sauf éventuellement en un point 21 
où f est seulement continue. Alors si y est un chemin fermé dans Q, nous avons 


Î f=0. (26.41) 
7 

PropRZCKe0U 
Proposition 26.11. 
Si f(2) = Ÿ, an2° à pour rayon de convergence R, alors f est C-dérivable et nous pouvons dériver 
terme à terme dans la boule ouverte B(0,R). 


Démonstration. Cela est exactement la proposition 15.44. 


26.1.4 Homotopie entre applications 
DEFooPJKLooCvexsu 


Définition 26.12 (homotopie entre applications). 
Soient des espaces topologiques X et Y. Deux applications continues f1, f2: X — Y sont homo- 
topes si il existe une application continue H: [0,1] x X — Y telle que pour tout x € X nous avons 


H(0,x) = f1(x) (26.42a) 
H(1,x) = fr(x). (26.42b) 
LEMooMGFZooG0aGY1 


Lemme 26.13. 
La relation « être homotope à” » est une relation d'équivalence sur C(X, Y). 


5. Définition 26.12. 
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Démonstration. Pour obtenir f — f, il suffit de prendre H(s,x) = f(x). 
Si f + g, nous considérons l’homotopie H: [0,1] x X — Y. Alors l’application 


M:[0,1]xX—Y 


26.43 
(t,xz) > H(1-t,x) ) 
est une homotopie pour g = f. 
Si f get g — f, nous avons les applications continues H et M telles que 
H(0,x) = f(x) H(L,x) = g(x) (26.44) 
M(0, x) = g(x) M(1,2) = hkfx). (26.44b) 


L'application 


, H(2t, x) site [0,35 (26.45) 
GE À ro 15) site[i,1l. 


Nous vérifions que S est continue en vérifiant la valeur en t = 1/2. De plus 


(0,2) = H(0,S)= fs) (26.46) 

et 
S(1,x) = M(2-—1,x) = M(1,x) = h(x). (26.47) 
LEMooMJKEooCaVh;jD 


Lemme 26.14 (|1]). 
Soient des espaces topologiques X et Y. Si Ÿ est connexe par arcs, alors toutes les applications 
constantes X — Y sont homotopes. 


Démonstration. Soient les applications constantes u(x) = uo et v(x) = vo. Étant donné que Ÿ est 
connexe par arcs, il existe une application continue +: [0,1] — Y telle que (0) = wo et y(1) = vo. 
Alors l’application 
H:[0,1]xX—Y 
x)» 7) 


est une homotopie entre les applications u et v. 


(26.48) 


PROPooNABDooFtKuk0O 
Proposition 26.15 ([201]). 
Soit un compact K de R". Deux applications f,g: K — C* sont homotopes dans C* si et seulement 
si f/g est homotope à la fonction 
u:  K—C 


xt 1. 


(26.49) 


Démonstration. Supposons que H: [0,1] x KX — C* est une homotopie entre f et g. Dans ce cas, 
l'application 
M: [0,1] x K — C* 


Ga) g(x) 
est une homotopie entre f/g et u. En effet 
__H(0,x) _ f(x) 
M(0, x) on (26.51) 
et 
HET à 
M(1,x) di) 1 Cr). (26.52) 


Dans l’autre sens, si H est une homotopie entre f/g et u, alors l’application M{t,x) — 
H(t,x)g(x) est une homotopie entre f et g. 
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26.1.5 Intégrale et homotopie 
LEMoo0UFCEoo!ïsuchR 


Lemme 26.16 ([201]). 
Soit un rectangle fermé R € R?. Si l'application H: R — Q est continue, alors pour toute fonction 
continue f: Q — € nous avons 


J=0 (26.53) 
0H 


où OH désigne la frontière de H(R) dans ©, et l'intégrale est celle de la définition 26.7. 


Démonstration. La frontière 0H peut être décomposée en 4 parties de classe C! : 


(1) 
FRS u L . : (26.54) 

(2) 
a: la, : Lu . (26.55) 

(3) 
ass 10, : L … . (26.56) 

(4) 
DÉPARS (26.57) 


t H(0,b+a—t). 


EÉtudions les diverses parties @;. 
(1) Pour a2 Première observation : a2 = 1. 


(2) Pour a4 Nous avons @4 = Y0(b + a —t) et donc 


b b 
J F= J (fo œ)(t)ah(t) = — J (fo 0) + a — ty (6 + à — 6j 00F NT 000 Re 


a 


Nous utilisons le changement de variables © 


p: [a,b] — [a,b] 


26.59 
tent 
Le jacobien |J;| est égal à 1 et donc nous continuons (26.58) de la façon suivante : 

b 

J Le -| (fo %0)(0(t))7 (o(t))dt (26.60a) 
4 a 
b 

_ -| (fo %0)(t)r(t)dt (26.60b) 

|. (26.60c) 
70 


(3) Lien entre à et az Il y a deux possibilités : soit 41 et 2 sont des lacets, soit ce sont des 


chemins normaux. 


6. Théorème 14.290(3). 
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(3a) Si ils sont des lacets Alors pour tout s, l’application 


l,:{a,b| — C 
te H(s,t) 


est un lacet. En particulier H(s,a) = H(s,b). Donc as(t) = H(1—-t,b) = (1 —t). 
Dans ce cas nous avons 


b 
Î Î = J f(ast)a,(t) (26.62a) 
b 


[ fCaû@-9)a 9 (26.62%b) 


_ Le o œ)(t)dt chm. var. p(t) = 1—-t (26.62c) 


—| f (26.624) 


Nous avons alors le calcul 


of ,s=f ref se [is Lr-f: (663) 
ne 


Le lemme est prouvé. 


(3b) Si + et 71 sont des chemins Dans ce cas nous avons une homotopie à extrémités 
fixées. Donc a: et «3 sont des chemins constants, et les intégrales dessus sont nulles et 


nr el Lr-f: f (26.64) 
=0 =0 


Et le lemme est prouvé. 


THOooVTFXooBgvVyD 
Théorème 26.17 (Cauchy, version homotopique[201, 610]). 
Soit un ouvert Q dans C. Soit une fonction holomorphe f: Q — C. 
Supposons que l’une des deux conditions suivantes soit respectée : 
(1) Les chemins 0,1: [a,b] — (À sont homotopes à extrémités fixées. ITEMoOESDVooFgVarr 
(2) Les lacets yo, 7: [a,b] — À sont homotopes. 
Alors 
J fe.) (26.65) 
70 71 


Démonstration. Considérons l’homotopie H : [0,1] x [a,b] — (. Étant donné que [0,1] x [a, b] est 
un rectangle dans IR?, le lemme 26.16 nous indique que 


f=0. (26.66) 
CH 


CorGZXzuzR 
Corolaire 26.18 ([610]). 
Soient a € © ainsi que deux chemins y1 et y2 homotopes dans C\{a}. Alors Ind(-y1, a) = Ind(-2, a). 
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26.1.6 Théorème de Tietze (espace normal) 
LEMooCLVAooTaNGJk 


Lemme 26.19 ([201)). 
Soit un espace topologique normal! X. Soient M e R* et A fermé dans X, et une application 
continue f: A—[-M,M]. 

Il existe une application continue g: X — [-M/3, M/3] telle que pour tout x € À, 


Le) — gta) < +, (26.67) 
Démonstration. Nous divisons À en trois parties : 
A_=f"([-M,-M/3]), (26.68a) 
A+ = f7([M/3,M/3]), (26.68b) 
Ao = fr '([-M/3, M/31). (26.68c) 


Les parties A, et À_ sont fermées parce que f est continue. D'autre part, X est normal, de telle 
sorte que le théorème d'Urysohn 21.113 s'applique. 
Nous considérons donc une application continue g1: X — [0,1] telle que g, !(A_) = {0} et 


gr (A+) = {1}. Nous posons alors 
2M M 
d=|\ = ao. (26.69) 
3 3 
Vérification des propriétés de g. 


(1) g est continue Parce que g1 est continue. 


(2) g prend ses valeurs dans [—-11/3, M/3] Parce que gi prend ses valeurs dans [0, 1] et que 
tr (2M/3)t — M}/3 est croissante. 


(3) | f(x) — g(x)| sur À Sixe A, alors g1(x) = 0 et donc g(x) = —-M/3. Donc 


|f(æ) — g(x)| = | f(x) - M/3| < 2M/3 Te ADR TU) 


parce que f(x) e [-M/3,M/3]. 

Sixe A}, alors g(x) = 1 et donc g(x) = M/3. Même fin de raisonnement qu’en (26.70). 
Si x € A, alors f(x) € [-M/3,M/3] et g(x) e [-M/3, M/3] et donc encore | f(x) — g(x)| < 
2M/3. 


LEMooSKSNooEdgFcR 
Lemme 26.20 ([201)). 
Soient un espace topologique normal X ainsi qu'un fermé À dans X. Nous considérons une fonction 
continue f: A— [-M,M]. 
Il existe une application g: X — [-M, M] continue prolongeant f. 


Démonstration. Nous allons commencer par construire une suite d'applications g;: X — KR telles 
us ITEMooGAIVooQYBCZ)j 
(1) Pour tout x e À et pour tout ne N, 


T 2 nm 
f(x) — D ngi(æ)| < (:) M (26.71) 
i=1 
ITEMooOULNAooEJPdbV 
(2) Pour tout x € X et pour tout 1, | 
2\°M 
PAC2IES () 2: (26.72) 


7. Définition 21.108. 
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Nous commençons par construire g1 à partir du lemme 26.19 appliqué à la fonction f. Nous avons 
donc une application g1: X — [-M/3, M/3] telle que 


If) - aa) < Mc 


pour tout x € À. Vu que g1 prend ses valeurs dans [—-/3, M/3], elle vérifie la condition (2). De 
plus (26.73) montre que la condition (1) est vérifiée pour n = 1. 

Et c’est parti pour la récurrence. Nous supposons avoir des applications g; pour à = 1,...,k 
qui vérifient la condition (2), et telles que la condition (1) est satisfaite pour n = 1,...,k. Nous 
allons maintenant construire gx+1. 


Nous posons 
hy: A—R 


k 26.74 
De f(x) — Y gi(x). ss 
i=1 


Par hypothèse de récurrence, la fonction hyx ne prend pas n’importe quelles valeurs dans IR, mais 


AT CG) (y (26.75) 


Fran [-5 OET (2) »] (26.76) 


vérifiant 
k+1 
DOPACRHONS (26.77) 


La condition (1) est donc maintenant vérifiée jusqu’à n = k + 1. Nous vérifions la condition (2) 
pour à = k + 1. Simple calcul : 


Lors (a)l < 2 ()w : ci " (26.78) 


3 \3 3 2 


Et voilà pour la définition des applications g. 
Vu que 2/3 < 1, la série 372, [gilæ converge normalement (définition 11.82). Notons g la 


somme. Le lemme 11.84 donne alors la convergence uniforme g; mul g, et le théorème 12.380 nous 
assure que g est continue sur X. 
En ce qui concerne la norme de g, nous avons, en utilisant la formule (11.317) avec q = 2/3, 


(2 M 
Iglo < >, (;) Fr <M. (26.79) 
i=1 


Donc |g(x)| < M pour tout x € X. 
Enfin nous vérifions que g prolonge f. Soit x € A. Prenez la limite n — © dans l’inégalité 


nm 2 nm 
x) — (x) <(-) M. 26.80 
te) - Data < (3) (26.80) 


Nous trouvons que | f(x) — g(x)| = 0. 
THOooXKGWooFUYlux 

Théorème 26.21 (Théorème de Tietze). 

Soit une partie fermée À de l’espace normal X. Si la fonction f: À — R est continue, alors elle 

se prolonge en une fonction continue g: X — MR. 
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Démonstration. Nous supposons dans un premier temps que f prenne ses valeurs dans |-M, M. 
À fortiori, elle prend ses valeurs dans [-M, M] et le lemme 26.20 dit qu’il existe un prolongement 
continu g: X — [-M, M]. Nous allons construire à partir de là un prolongement continu h: X — 
]-M, MT de f. 
Nous posons 
B=g'{({-M,M}). (26.81) 


Étant donné que f(A) € |-M, MI , nous avons B n À = G. De plus À est fermé par hypothèse 
et B est fermé en tant qu’image réciproque du fermé {—M, M} par l'application continue g. Nous 
pouvons donc appliquer le théorème d’Urysohn 21.113. 

Nous considérons donc une application g1: X — [0,1] telle que g1 = 0 sur B et gi = 1 sur À. 
Enfin nous posons À = gg1. Cette application prend ses valeurs dans |-M, M{, est continue et si 
x € À nous avons 


h(x) = g(x)gi(x) = f(x) x 1= f(x). (26.82) 


Ceci règle la question si f prend ses valeurs dans |-M, M. 
Nous considérons à présent le cas général f: À — KR. Soit un homéomorphisme 6: R — 
]-M, MT (par exemple via l'exemple 12.181). Nous considérons 


Fi A —]-M, MT 


(Get) Pl 


Nous lui appliquons le premier cas pour avoir une fonction g: X — |-M, M] qui prolonge PA 
suffit maintenant de poser 


Re (26.84) 
ze (97 0ÿ)(x). | 
Cela est une application continue et si x € À, nous avons 
gx) = (#- lo ÿ)(x) = (977 0 f(x) = (#7 0 do f)(x) = f(x). (26.85) 


Corolaire 26.22. 
Soit un fermé À dans un espace normal X. Si f: À — € est continue, alors elle se prolonge en 
une fonction continue g: X — C. 


Démonstration. Les parties réelles et imaginaires de f sont continues. Il suffit de leur appliquer le 
théorème de Tietze 26.21. 


26.2 Logarithme complexe 


26.2.1 La fonction argument 
Nous savons la définition 18.6 de l’exponentielle complexe. 


Définition 26.23. 
Un logarithme de a € © est une solution de l'équation e° = à. 


Notons bien que cela définit un logarithme, et non le logarithme. 
LEMooUMESooJVzeDb 


Lemme 26.24. 
Si z1 et z2 sont des logarithmes de a alors il existe k € Z tel que 21 = 22 + 2ikr. 


Démonstration. Nous commençons par déterminer les logarithmes de & = 1. Nous avons besoin 
de et+bi = 1 (a,be R). Nous avons 
etebi = 1, (26.86) 
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et en prenant la norme nous trouvons [e®| = 1, ce qui donne a = 0. Ensuite et = 1, qui signifie 
b = 2k7. Les logarithmes de 1 sont donc les nombres de la forme 2:47. 

Soient maintenant z et z des logarithmes de a. Alors e! = e2, donc® e17? = 1, ce qui 
signifie que z1 — 22 est un logarithme de 1. Donc il existe un k € Z tel que 21 — 22 = 21k7. 


Remarque 26.25. 
Jusqu'ici nous n’avons pas donné de conditions donnant l’existence d’un logarithme. Nous avons 
seulement supposé des existences et donné des propriétés sur ces hypothétiques objets. 


Définition 26.26 ([611]). 
Si ze C* nous définissons la valeur principale de son argument le nombre 0 E ]—7, x] tel que 


z = |zle (26.87) 


Nous le notons arg(z). 

NORMooUGHNooYriCBH 
26.27. 
Il ne faut pas se ruer sur arg(x + iy) = arctan(y/x). Pour rappel, la fonction arctan a été définie 
dans le théorème 18.38, et elle prend ses valeurs dans |—7/2,7/2[. La formule v(x, y) = arctan(y/x) 
n’est donc valable que pour x > 0. Les valeurs sont : 


arctan(y/x) sie 0 
7m +arctan(y/x) six <0et y >0 


| EQooPJVF 
arg(x + iy) = 4 —r +arctan(y/x) six < 0 et y < 0 si SE RES 
siæ=0ety>0 


me 


si æ = 0 et y < 0. 


Pour x > 0 nous avons arg(x + iy) = arctan(y/x) parce que justement la fonction arctan prend 
ses valeurs en particulier entre —r et 7. Pour x < 0 et y > 0 nous avons arg(x+iy) = n+arctan(y/x) 
(dans ce cas, arctan(y/x) < 0) et si x < 0, y < 0 nous avons arg(x + iy) = —7 + arctan(y/x). 

NORMooMRBEooVtTcIA 
26.28 (Les dérivées partielles de la fonction argument). 
Vu que nous en aurons besoin plusieurs fois, nous calculons maintenant les dérivées partielles de 
la fonction 


2 
Ni (26.89) 
(x, y) + arg(x + iy). 
Nous commençons par la dérivée @,w(x, y). Et il y a de nombreux cas à séparer. 
(1) x>0 
Nous avons à 
(a, = lim arctan(y/(x + D) arctan(y/x) (26.90) 


qui n’est autre que la dérivée de la fonction x + arctan(y/x). Nous pouvons la calculer 
facilement avec le théorème 18.38(2) : 


0 : y 
Ye D (26.91) 
(2) &<0 
Nous avons 
Pa, = lim +7 + arctan(y/(x + D (+7 +arctan(y/x)) (26.02) 


où les signes + dépendent du signe de y. De toutes façons, les termes en 7 se simplifient et 
le calcul est le même que celui du cas x > 0. Encore une fois nous avons 


0p 


L: y 
2x (x, y) 


x? + y? 


8. C’est facile de dire « donc ». Il faut surtout citer la proposition 18.9(2). 


(26.93) 
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(3) 20 
Nous devons calculer _ ess Gi) 
e) _… arg(e+iy) — arg(iy 
2x (0, y) lim , : (26.94) 
Il y à quatre cas d’après les signes de € (séparer limite à gauche et à droite) et y. 
Sie>O0et y > 0 alors nous avons à faire le calcul 
t — T/2 
je, RG er (26.95) 


e—0+ € 


qui se traite par la règle de l’Hospital. Cela donne —1/y. 
Les trois autres cas ne se distinguent que par des constantes au numérateur, lesquelles dis- 
paraissent en appliquant la règle de l'Hospital °. Au final, 


% (0,y) _ nn (26.96) 


Nous avons calculé jusqu'ici : 


0p — y EQooAOJPoony ER 


pour tout (x, y) € R?\{(0,0)}. En particulier vous avez noté que cette dérivée partielle est continue 
sur R?\{(0,0)}. 
Nous calculons à présent la dérivée partielle par rapport à y : 


Ôp .… arg(x + iy + ie) — arg(x + iy) 
à (&,y) = lim : . (26.98) 
CLS 0 
Nous avons à calculer _ y 
t S— tan < 
lim arctan * arctan CS (26.00) 
e— € 


qui n’est autre que la dérivée de la fonction t + arctan 1 en t = y. Résultat : 


0p T 
He 26.100 
y (a) n° 4e 
Q) x<0ety#0 
Le calcul à faire est : Le y 
lim nr ArTctan = (+T + arctan 3) (26.101) 
e— € 


Une chose importante à remarquer est que dans le calcul de la limite nous pouvons supposer 
que y et y+e aient le même signe, quelle que soit la valeur et le signe de € (assez petit). C’est 
pour cela que les deux termes +7 arrivent avec le même signe des deux côtés de la différence, 
et se simplifient. Nous tombons sur une limite déjà faite et 


(ee) x 
dy (y) = TP (26.102) 


(3) x <0 et y=0 
Vu que x < 0 nous avons arg(x) = x et nous devons calculer 


je arg(x + ie) — T 


(26.103) 
e—0 € 


La limite € — OT est classique et donne 1/x. 


9. Nonobstant le fait que ces constantes se mettent bien pour avoir un vrai cas d’indétermination 0/0, sinon la 
règle de l’Hospital ne s’applique pas. 


26.2. LOGARITHME COMPLEXE 2033 


Mais la limite € — 07 n'existe pas : 


—7 + arctan(e/x) — 7 


lim (26.104) 
€—0— € 
n'existe pas. 
Donc 
gp 
0 (26.105) 
n'existe pas pour æ < (. 
(4) x=0et y#0 
Le calcul est immédiat 
lim arg(iy + ie) — arg(iy) 0. (26.106) 
€— È 
donc 
4 V0 (26.107) 
ou ,y) = 0. : 


En ce qui concerne la continuité, nous avons que ©, est continue partout sauf sur la demi-droite 
{(x,0) tel que x < 0} où elle n’existe pas. 


26.2.2 Une définition possible du logarithme 
DEFooWDYNooYIXVMC 


Définition 26.29. 
Nous définissons la fonction logarithme par 


In: C* —C 


ze In(|z|l) +iarg(2) (26.108) 


où le In à droite est le logarithme usuel sur R*. 


Remarque 26.30. 
Cette fonction généralise le logarithme déjà vu sur ]0,%0[ € R. En effet pour des valeurs de z dans 
cette partie nous avons arg(z) = 0 et [2] = z. 


Lemme 26.31. 
Le nombre In(2) est un logarithme de z. 


Démonstration. Nous avons 
en) _ en lléiarg(2) Æ |z1e'2"8 (2) = (26.109) 


Nous avons utilisé le fait que e"() = x pour x € R+ et |z[e'#8(@) = z par définition de la fonction 


arg. 


Notons que si on avait pris d’autres conventions pour définir arg, nous aurions eu d’autres 
définitions possibles de In. 


Exemple 26.32. 
Nous avons 
m(—1) = In(1) +iarg(—-1). (26.110) 


Mais In(1) = 0 et arg(—1) = x (et non —T), donc 
In(—1) = ir. (26.111) 


C’est cette définition du logarithme qui est prise par Sage, et c’est cela qui lui permet de donner 
la primitive de 1/x comme In(x) et non In(|x|), parce que Sage connaît les logarithmes de nombres 
réels négatifs : 


D 
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SageMath version 7.3, Release Date: 2016-08-04 
Type "notebook()" for the browser -based notebook interface. 
Type "help()" for help. 


sage: ln(-1) 


Ixpi 

sage: f(x)=1/x 

sage: f.integrate(x) 
x |--> log(x) 


tex/sage/sageSnip010.sage 
à 
Nous avons jusqu'ici défini une fonction sur C* qui fait correspondre à chaque nombre complexe 
un de ses logarithmes. Il reste quelques questions à régler : 
— Est-ce que cette fonction est continue ? Holomorphe ? (réponses : non et non) 


— Si non, est-ce qu’il y avait moyen de trouver une définition plus efficace ? (réponse : non) 


LEMooMUOIooCnoWwq 
Lemme 26.33. 
La fonction In n’est pas continue sur |—00,0]. 
Démonstration. Attention à bien comprendre l’énoncé. La fonction 
: [—o0,0[ — © 
Es LL (26.112) 
x In(x) 


est continue. D'ailleurs c’est In(x) = In(|x|) + ir. Ce dont il est question dans l'énoncé, c’est de la 
fonction In vue comme fonction sur C*. 
Soit x > 0 dans R; nous avons 


In(—x) = In(x) + ir. (26.113) 


Cependant lim,_,9- In(—x + Ài) va valoir In(|x|) — ir. En effet lorsque À < 0 est petit, l'argument 


E 
de —x + Ài se rapproche de —r (et non de x). 


arg (2) 
= A 
Donc 
Jim In(—x + Xi) = limln(|z + Ài]) + iarg(—zx + Ài) = In(|x|) — ir. (26.114) 
—0— 
ER 


Nous n’avons donc pas continuité de la fonction logarithme comme fonction sur C*. 
THOooWUXOooYKvLbJ 

Théorème 26.34. 

La restriction 


In: C\]-00,0] — € (26.115) 


est holomorphe. 


& 
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Démonstration. Nous allons utiliser la proposition 12.322 et considérer la fonction 


F:S-—R°? 


(æ,y) > (in(|x + iyl), arg(x + iy)) (26.116) 


où $ = R?\{(x,0) tel que x < 0}. Nous devons vérifier que F est différentiable et que sa différen- 
tielle en un point de $ est une similitude. 


u(x, y) = In (V2? + y?) (26.117) 


Nous posons 


et 
v(x, y) = arg(x + iy). (26.118) 


Les dérivées partielles de u ne sont pas très compliquées : 


sage: var(’x,y’) 
(x, y) 


sage: u(x,y)=1n(sqrt(x*xx2+yxx2)) 


sage: u.diff(x) 


5 Cx, y) 1--> x/Cx72 + y72) 


tex/sage/sageSnip011.sage 


c’est-à-dire 


Ou T 
Ou y 
nr. (26.119b) 


Pour celles de v par contre, il faut se poser des questions, par exemples résister à la tentation 
d'écrire v(x,y) = arctan(y/x) et lire 26.27. 

Nous avons déjà calculé les dérivées partielles de v dans 26.28, et nous avons vu qu’elles étaient 
continues sur IR? privé de la demi-droite. 

Vu que les dérivées partielles sont continues, le théorème 12.306 nous dit que Fest différentiable. 
La matrice de la différentielle est alors la matrice des dérivées partielles 


T y 
ee Fa ; (26.120) 


qui a la forme requise (12.859) pour que la proposition 12.322 nous assure que In soit C-dérivable, 
c’est-à-dire holomorphe. 


26.2.3 Pas plus de continuité 


Bon. La fonction logarithme que nous avons définie est holomorphe sur C* privé d’une demi- 
droite 


U = {ze C tel que Im(z) = 0,Re(z) < 0}. FQooPOELoRFRRE SG 


Et elle n’est pas continue sur Ü ; elle y est cependant continue « par le haut ». Pouvons-nous 
faire mieux ? Nous allons maintenant prouver quelques résultats d’impossibilité de faire mieux que 
holomorphe partout sauf une partie pas si petite que ça. 


Proposition 26.35. 
Il n'existe pas de fonctions continues f: C* — € telle que el) = x pour tout z € C*. 


2036 CHAPITRE 26. ANALYSE COMPLEXE 


Démonstration. Pour tout z, le nombre f(z2) est un logarithme de z. Or In(z) en est également un. 
Donc par le lemme 26.24 
(2) = In(z) + 2k(2)x (26.122) 


pour une certaine fonction &: C* — Z. Sur le domaine d’holomorphie de In, les fonctions In et f 
étant continues, la fonction k l’est aussi. Mais une fonction continue à valeurs dans Z est constante 
(son domaine est connexe). 
Il existe donc k € Z tel que 
f(e) = In(2) + 2ikr (26.123) 


au moins pour tout z € C*\U. Une telle fonction ne peut pas être continue sur U parce que In ne 
l’est pas. 


Ok. Pas continue sur tout C. Mais continue sur un peu plus que € privé de toute une demi- 
droite ? La proposition suivante répond que bof. 


Proposition 26.36. 
Soit Q un ouvert de © contenant S(0,r) (le cercle centré en 0 et de rayon r > 0). Il n'existe pas 
de fonction continue f: A — € telle que ef?) = z pour tout z € O1. 


Démonstration. Encore une fois, pour tout z € ( nous avons 
f(2) = In(2) + 2irk(z) (26.124) 


pour une certaine fonction k: Q — Z. Nous considérons la demi-droite U de (26.121). Sur Q\U, 
la fonction In est continue et k doit également l’être. Donc k est constante sur les composantes 
connexes de Q\U. 

Vu que S(0,r) est compact, on peut le recouvrir par un nombre fini de boules centrées en des 
points de S(0,r). En prenant le minimum des rayons de ces boules, nous voyons que Q contient 
une couronne 

{ze CO tel que r — 0 < |z] < r +6}. (26.125) 


Soit le point xzo = —r. C’est un point de ( contenu dans U. Nous allons prouver que B(x0,6)\U 
est dans une seule composante connexe de €. 

Soit un point z1 € B(x0, 0) situé au-dessus de U, et z2 un point de B(x0, à) situé en dessous de 
U. Le cercle S(0,r) coupe B(x0,0) en deux points : un au-dessus et un en-dessous de U. On peut 
lier z1 au point de « sortie » supérieur de S(0,r) en restant dans B(x0, Ô) ; ce point est ensuite relié 
en suivant le cercle au point d’entrée inférieur du cercle dans B(x0,0). Ce dernier point est lié à 
z2 par un chemin restant dans la boule. 

Tout cela pour dire que z1 et z2 sont dans la même composante connexe de Q et que k(z1) = 
k(22). Il existe donc k € Z tel que 

fe) = In(2) + 2ikr (26.126) 


sur B(x0,06)\U. Une telle fonction f ne peut pas être continue. 


26.2.4 Pas d’unicité : autres déterminations de l’argument 
NORMooFCDOooFDzAjp 


26.37. 
Nous avons pris la fonction d’argument arg: © — |[—-x,7|. Il y en a évidemment beaucoup d’autres 
de possibles. Par exemple pour à € R nous pouvons considérer 


arg,+: © — Ja,a+2x| ÉROoNKKDORQ RES, 
ou 
arg,-: C—[a,a+2xrl. (26.128) 
En posant 
In,+(2) = In(|z|) +iarg,+(2) (26.129) 


nous avons une fonction réciproque de l’exponentielle définie sur C* et holomorphe sur C* privé 
d’une demi-droite D, (dépendante de la valeur de «). 
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La différence entre In,,+ et In, est seulement la valeur sur la demi-droite de non-holomorphie. 
L’une sera semicontinue d’un côté et l’autre, de l’autre côté. 


Remarque 26.38. 
La fonction arg,- à déjà été utilisée en 18.5.2 pour écrire un inverse de la fonction 


@: [0,2r[ — S? 


ET R 


(26.130) 


Définition 26.39 ([612]). 
Soit un ouvert Q € C*. Nous disons que la fonction f: à — © est une détermination sur Q si 
elle est continue et vérifie 

el) = (26.131) 
pour tout z € (1. 


Les différents résultats vus jusqu'ici montrent qu’il n’existe pas de détermination du logarithme 
sur C*. 


Définition 26.40. 
La détermination principale du logarithme est la restriction de notre logarithme 26.29 


In: C*— € 
| (26.132) 
2 In(|2|) + iarg(z) 
à l’ouvert C*\U où U est la demi-droite Re(z) < 0, Im(z) = 0 de C. 
REMooFBLLooDnkmjR 


Remarque 26.41. 

Beaucoup de sources[613] ne définissent pas In,+ sur la droite D,. C'est-à-dire qu’ils notent In, 

notre fonction In,+ restreinte à C*\D,,. Dans ce cas, les fonctions In,,+ et In, sont identiques !°. 
Cette remarque est importante parce que certains vont vous dire « le logarithme n’est pas défini 

sur la demi-droite » ; de leur point de vue, la fonction que nous avons définie est une prolongation 

(non continue) à U du logarithme, qui est continu. 


(1) Certaines personnes pourraient vous dire que notre logarithme « n’est pas bien défini parce 
que si on fait le tour dans un sens ou dans l’autre nous n’obtenons pas la même valeur pour 
In(z) lorsque z est sur U ». Et cela avec des arguments aussi forts que « 27 et 0, c’est le 
même point ». 

Nous préférons être bien clairs !! sur ce point : notre fonction In est parfaitement définie sur 

C* et 27 n’est pas la même chose que zéro. En particulier arg(e?T) = 0 et arg(e-T) = x et 


non —7. 


(2) I n’en reste pas moins que Sage donne In(—1) = ir et que nous avons choisi de faire de 
même, parce que le Frido n’est pas un cours d’agrégation, mais un texte qui donne quelques 
éléments de mathématique dans le but d'utiliser Sage efficacement. 


(3) Tout ceci pour dire que si vous utilisez ce livre pour l’agrégation, vous devriez sérieusement 
considérer l’option de ne pas donner du logarithme la définition donnée ici, mais bien sa 
restriction. 


En fait notre logarithme est maximum pour la propriété « être une réciproque de l’exponen- 
tielle » alors que beaucoup de monde préfère avoir une fonction maximale pour la propriété « être 
réciproque de l’exponentielle tout en étant continue ». 


De toutes les fonctions ayant le droit de vouloir être appelée « logarithme », celle que nous 
avons choisie (un peu arbitrairement) pour s’appeler « logarithme » et accaparer de la notation 
« In » est In,+. Elle est d’une certaine manière celle qui arrive le plus naturellement. 


10. Cela n’est pas tout à fait évident ; vous devriez y penser. 
11. Est-ce qu'il faut vraiment un pluriel ici ? 
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En effet si nous pensons au logarithme népérien In: R* — IR que nous voulons prolonger sur 
R, nous devons poser 
In(—x) = In(—1) + In(x) (26.133) 


pour æ > 0. Que peut valoir In(—1) ? Il doit vérifier eM(-1) = 1, La première valeur qui nous tombe 
sous la main est In(—1) = x. Bien entendu, d’autres possibilités existent, comme In(—1) = 20177 
par exemple. 


26.2.5 Pas d’unicité : développement en série 


Pour 29 € C* nous pouvons écrire un développement en série de la réciproque de l’exponentielle 
autour de 20. La fonction ainsi définie est holomorphe sur la boule B(20,|20|) et diverge en dehors 
de cette boule. 

Voilà encore une fonction « logarithme » pour chaque point de C*. Nous nommons In,, la 
fonction 

In,,: B(20,|20l) — € (26.134) 


donnée par la série. 

En général nous n’avons pas In,, = In, sur l'intersection des disques de convergence. Si c'était le 
cas, de proche en proche nous pourrions construire une fonction continue réciproque du logarithme 
sur C*, ce qui est impossible. 


26.2.6 Pas d’unicité : laquelle choisir ? 


Bon. Pour chaque demi-droite D nous avons une détermination du logarithme sur C*\D. Et 
pour tout 29 € C* nous en avons une sur B(20, |20l). 

En pratique, quel logarithme choisir ? Cela dépend du problème. 

Si vous avez besoin ou envie de travailler avec des série entières, le mieux est de choisir une 
détermination donnée par un développement autour d’un point bien choisi par rapport à votre 
problème. 

Si vous avez surtout besoin d’holomorphie, et que vous en avez besoin sur un grand domaine, 
vous devriez choisir une détermination sur un des ensembles C*\D, en choisissant a de telle sorte 
que la demi-droite maudite ne passe pas par la zone sur laquelle vous travaillez. 

Dans tous les cas, vous devez préciser très explicitement la détermination choisie. Dans ce texte, 
sauf mention du contraire, nous utiliserons la détermination principale, et même son extension (non 
continue) à C*. Lorsque nous aurions besoin d’holomorphie, nous préciserons que nous considérons 
la restriction. 


26.2.7 Logarithme comme primitive 


Tout le monde sait l? que le logarithme In: R* — R est une primitive de la fonction x + 1/x. 
Qu'en est-il dans le cas complexe ? Tout d’abord précisons que nous ne comptons pas encore parler 


d’intégrale sur C, mais seulement d’intégrales sur R d’une fonction à valeur complexes. 
PROPooNIJVooKueuYJ 


Proposition 26.42. 
Si ze C alors 


[ ae = nte+ 9 EneoMeERS 


Démonstration. Il est important de comprendre que la formule (26.135) est un abus de notation 
pour dire que si nous considérons la fonction 


p:R—C 


26.136 
ze In(x +2) ) 


12. Proposition 15.83. 
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alors nous avons w/(x) = = Ici la dérivation est une dérivation sur R et l'intégrale est une 
intégrale sur KR, c’est-à-dire «& composante par composantes ». La fonction 4 se décompose en 


partie réelle et imaginaire qui sont à dériver séparément : 
p(x) = In(Ix + z]) + arg(x + 2). (26.137) 


(1) Si z est imaginaire pur 


Nous posons z = Ài avec À € R*. D'abord nous avons 


Le > zx ; À 
+  x2+X x? + X2° 


(26.138) 


La partie réelle de (x) est 
gi(x) = In (x? +), (26.139) 


dont la dérivée est : 


pilx) = ns 2 (26.140) 


qui correspond bien à la partie réelle de x. 
En ce qui concerne la partie imaginaire, w2(x) = arg(x + Xi), et sa dérivée n’est rien d’autre 


que la dérivée partielle par rapport à x de la fonction argument, déjà calculée en (26.97) : 


—} 
! = 
po(x) = RS (26.141) 


5 he à ee 1 
Cela est bien la partie imaginaire de ==>. 

Notons que nous n’avons pas de problèmes sur la demi-droite des réels négatifs parce que 
nous ne considérons au final que la dérivée partielle par rapport à x de la fonction argument, 


laquelle existe et est continue, même sur cette partie. 


(2) Pour z quelconque 


Soit z = s + Ài avec 5, À € R. En posant wo(x) = In(x + Ài) nous avons (x) = wo(x + 5) et 


donc 
LC) = pe + 8) = = (26.149) 
? P0 zx+s+\i x+2 


Tout va bien. 


EXooAKEDooZgjocx 
Exemple 26.43. 
Un petit calcul d’intégrale, que nous avions déjà faite dans l'exemple 20.97 (avec la méthode de 
Rothstein-Trager). En passant par une décomposition en fractions simples : 


[== "ft UE ) (26.143a) 


= In(x) : Im(x — à) : In(x + i) (26.143b) 


= (x) — 3 na? +1). SAT RE re) 


Attention aux justifications. I] n’est pas vrai en général dans le cas de nombres complexes a et b 
que In(ab) = In(a) + In(b). En effet, pour la partie réelle, ça passe parce que lab] = |a||b|. Mais en 
ce qui concerne la partie imaginaire, 


arg(ab) Æ arg(a) + arg(b) (26.144) 


lorsque la somme dépasse les bornes de |—7x,7|. Le passage à (26.143c) fonctionne parce que dans le 
cas particulier des nombres +4 et æ—4, les arguments se somment à zéro : arg(x +4) +arg(x—i) = 
0. 
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26.2.8 Logarithme sur un chemin 
DEFooBBGFooCEdsFR 


Définition 26.44 (logarithme continu). 
Soient un espace topologique X, et une application f: X — C*. Nous disons que g: X — C* est 
un logarithme de f si pour tout x € X nous avons 


f(x) = exp (g(x)). (26.145) 
DEFoo0CDGooGyvvWi 
Définition 26.45 (Détermination du logarithme). 
Soit un chemin!* +: [a,b] — C*. Nous disons qu'une application g: (Ta. b]) — C* est une 
détermination du logarithme sur y si 


exp ((go y)(t)) = (t) (26.146) 


pour tout te [a, b]. 
THOooUPANooMiECqe 


Théorème 26.46. 
Tout chemin dans C* admet une détermination continue du logarithme *, et si l est une détermi- 
nation sur le chemin y, nous avons 


dz 
z 


= 1(y(b)) — 1(7(a)). (26.147) 
, 

Le théorème de Borsuk parle de lien entre logarithme continu et homotopie de fonctions à la 
fonction constante. Il s'applique donc bien de concert avec la proposition 26.15 qui dit que si f et 


g sont homotopes, alors f/g est homotope à une constante. 
THOo0TCUMooEByCKg 


Théorème 26.47 (Théorème de Borsuk[201]). 
Soient un compact K de R” ainsi qu’une application continue f : K — C*. Les propriétés suivantes 


sont équivalentes : ITEMooKZYDooKoEEb1l 
- oo 15 

(1) f admet un logarithme continu ”. TTEMooXVNXooVAEkLr 

(2) f est homotope à l'application constante u: K — C*, u(z) = 1. ITEMooQDHXoo0bjxLA 


(3) f admet une extension continue f : R° — C*. 


Démonstration. En plusieurs points. 


(1) (1) = (3) Soit un logarithme continu g: K — € de f. Vu que K est fermé, le théorème 


de Tietze 26.21 dit que g possède une extension continue ÿ: IR? — €. Nous posons 


(26.148) 


L'application f est continue parce que exp et ÿ le sont. Elle est une extension de f parce que 
si x € K, nous avons 


F(æ) = exp (ÿ(x)) = exp (g(x)) = (x) (26.149) 
parce que g(x) = g(x) et g est un inverse de exp. 
(2) (3) = (2) Soit une extension continue f: IR" — C* de f. Soit ro € R”. Nous posons 


H: [0,1] x K — C* 


(tx) f(( — t)x + tx). 2) 


L'application H est continue, et pour x € K elle vérifie H(0,x) = f(x) = f(x) ainsi que 


H(1,x) = f(x0). 


13. Définition 20.72. 
14. Définition 26.45. 
15. Définition 26.44. 


26.2. LOGARITHME COMPLEXE 2041 


Donc f est homotope à l'application constante f (xo). Vu que C* est connexe par arcs, toutes 
les applications constantes sont homotopes !6. Donc f est homotope à f (to) qui est homotope 
à u. L'homotopie étant une relation d'équivalence !”, f est homotope à u. 

(3) (2) = (1) Nous considérons l’homotopie H : [0,1] x X — C* entre f et u. En particulier 
pour tout x € K nous avons H(0,x) = f(x) et H(1,x) = 1. 
La partie [0,1] x K est compacte l* et |H| y est continue. Donc elle atteint ses bornes. Mais 
elle prend ses valeurs dans C* ; donc 


inf [H(x,t)| > 0. (26.151) 

T, 

Et d’ailleurs cet infimum est un minimum. Nous considérons la norme suivante sur R x R?” : 
I(,æ)|s = max (|tl,|x|). (26.152) 


Toutes les normes étant équivalentes ! sur RxIR”, nous pouvons caractériser la compacité, la 
continuité et tout ça en termes de cette norme. L'application H est uniformément continue ?°. 
Soit € > O, il existe n > 0 tel que si |(t,x) — (s,y)ls < n alors | H(t,x) — H(s,y)|] < e. 


Soient un entier n > : +1,zxeK et ke {0,...,n}. Nous avons 
k k+1 1 1 
1É,9 - ol, 1e 01 = Le (26.159 


k k+1 
ACÈ, x) - H( + al<e (26.154) 
n n 
Nous posons 
F},: K — C* 
| a D (26.155) 
no SUBEQSooLJIJooYkxyMO 
Cette application est continue sur X et pour tout x € K nous avons | M one 
| F,(x) = EQ) = Fi1(e), (26.156a) 
Fr+1(x) Fr4i(x) | 
H(Ë,z) = HE, &) b 
| =. | (26.156b) 
(7 2) 
€ 
26.156c) 
k+1 
JHCE, x)| 


Pour rappel, pour tout € > 0, il existe un 7 > 0 tel qu’en posant n > ! + 1 nous avons 
(26.156). Nous choiïsissons € tel que 0 < € < inf(4) |[H(t,x)|, de telle sorte à avoir 
Fx41(x) 


1] < < 1. (26.157) 


La fonction In: C* — C* est continue sur B(1,1)°!. Donc la fonction 
hx: K — C* 


ln (29) (26.158) 


16. Lemme 26.14. 

17. Lemme 26.13. 

18. Théorème 7.299. 

19. Équivalence de normes, théorème 11.46. 

20. Théorème de Heine 12.81. 

21. Le logarithme est celui défini en 26.29 et sa continuité est le théorème 26.34. 
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est continue. Nous posons 


g= Si In (CE ) (26.159) 


qui est également continue sur X. Cette fonction g est un logarithme continu de f sur K 


parce que ?? 


n—1 
exp (g(x)) = exp E In (D) (26.160a) 


= le (in D) (26.160b) 


2. Fy1(x) 

n—1 
L F}(x) 
10 (26.160c) 
_ (x) 
= £ (26.160d) 
_ H(0,x) 
= AG (26.160e) 
—= Lo) (26.160f) 
= f(x). (26.160g) 

CORooX0O0ZooUJMKxu 


Corolaire 26.48 ([201|). 
Soit un compact convexe K de R”. Toute application continue K — C* admet un logarithme 
continu. 


Démonstration. Soit une application continue f: K — C*. Soit xp € K. Vu que K est convexe, 
f est homotope à la fonction constante f(xo). Par arc-connexité de C*, l’application f est alors 
homotope à la fonction constante 1. 


Le théorème de Borsuk 26.47 nous dit alors que f admet un logarithme continu. 
LEMooJNPTooScfSvA 


Lemme 26.49. 
Si K est compact dans ©, alors la partie C\K possède exactement une composante connexe non 
bornée. 


Démonstration. La partie K° étant compacte, elle est bornée. Il existe donc r > 0 tel que K € 
B(0,r). Soit A = C\B(0,r). Cela est une partie connexe de € et est donc contenue dans une 
composante connexe de C\KX. Il y a donc existence d’une composante connexe non bornée de 
C\K. 

Pour l’unicité, les autres composantes connexes de C\ÆK sont contenues dans B(0,r) et sont 
donc bornées. 


26.2.9 Lacets, indice et homotopie 
DEFooLFBNooGlvJmp 


Proposition-Définition 26.50 ([614]). 
Soit y un chemin fermé”? dans © que nous supposons continu et C? par morceaux *. L'indice de 


22. Dans le calcul suivant, nous utilisons entre autres la formule exp(a + b) = exp(a)exp(b) de la proposition 
18.9(2). 

23. Par abus de langage, nous désignerons par 7 à la fois le chemin et son image. 

24. Définition 20.34 
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la courbe 7 est la fonction 
Ind,: C\7 — Z 
1 du (26.161) 


2m 
Alors : ITEMooHYHMooWcaJxP 
(1) La fonction Ind, prend ses valeurs dans Z. 
(2) Elle est continue sur chaque composante connexe de C\7. 
(3) La fonction indice est constante sur chaque composante connexe? de C\Y. 


(4) Elle est nulle sur les composantes non bornées de C\7 *f. 


Démonstration. Point par point. 


(1) Prend ses valeurs dans Z 


Explicitons l'intégrale sur 7: [a,b] — C : 


1 dz 1 f y(t) 
= = t. 26.162 
Hd; (20) 2ri [ Z — 20 | y(t) nt 6592) 


Note. Comme n’est peut-être pas dérivable en certains points, en réalité nous n’avons pas 
une intégrale entre a et b, mais une somme d’intégrales entre a; et b; avec ao = a et by = b. 
Nous nommons S l’ensemble de ces points. 


Nous allons calculer l’exponentielle de ce qui est dans l’intégrale en posant 


w: [a,b] — © 
f © 7 | (26.163) 


u + EXP 
( a 7(€) — 20 


Nous savons par le lien entre primitive et intégrale (proposition 14.262) que la dérivée de 
zr , j est f elle-même. Nous pouvons donc facilement dériver 4 : 


che 0. ( J "70 at) = Len, EMEA) 


y(u) — 20 a VE) — 2 y(u) 


Cette égalité est vraie pour tout u € [a,b] sauf en un nombre fini de points (les points de S). 
Nous considérons maintenant 


f:lab] — C 
p(t) (26.165) 


et nous dérivons : 


1 = 26.166a 
1 HO - 2) D 
___p(#) p()Y() 
VE) — 20 (+(6) — 2)” ee? 
Nous y injectons l’expression (26.164) de ÿ/ : 
6-70 _ #7 


(xt) — 20)" (16) — 2)” 


25. Définition 7.67. 
26. Elle a une seule telle composante par le lemme 26.49, mais ce n’est pas important ici. 
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Comme f est continue ?7 sur [a,b] et de dérivée nulle partout sauf sur $, elle est constante 


sur |[a,b]. Nous avons donc f(t) = f(a) pour tout t, c’est à dire 


g(t) 1 


= ÿ 26.168 
TEE EOEE US 
Nous pouvons isoler de là une valeur pour w(t) : 
Y(E) — 20 
db) = ————. 26.169 
et) = TE (26.169) 


C’est le moment de calculer 4(b). Dans le calcul suivant, nous utilisons (a) = (b) : 


__ 70) —20 _ 7(b) — 2 
EU 


exp ([ a) = 1. (26.171) 


a 210) — 20 
Pour qu’une exponentielle soit égale à 1, il faut que ce qui se trouve dedans soit égal à 2547 
pour un certain k. Il existe k € Z tel que 


(26.170) 


Nous avons prouvé que 


0 
[ at = 2irk. (26.172) 


Pour cette valeur de k nous avons Ind.(26) = k. 

(2) Une borne pour |y| L'application + est Cl par morceaux ©. La restriction +: [a;,b;] — 
C est continue sur un compact et est donc bornée. Pour chaque à nous avons donc une borne 
M; pour |yj|. En nommant M le maximum des ces bornes M; nous avons y/(t) < M pour 
tout te [a, b]. 


(3) L'indice est ponctuellement continu Nous utilisons le théorème 17.15 avec l’applica- 
tion 


f:fa,b] x C\y — € 

7" () (26.173) 
VC) — 2 
Sauf que non. Il ne va pas être possible de majorer cette fonction uniformément en z, comme 
il le faudrait pour remplir la condition (3). La raison est que quand z s'approche de 7, le 
dénominateur n’est pas contrôlé. 


(2) 


Nous allons donc restreindre le domaine de f. Soit z0 € C\y. Vu que 7 est continue et que 
[a, b] est compact, la fonction { + 1/(y(t) — 20) atteint une borne inférieure. Disons que cette 
borne est atteinte pour t = to. Nous considérons r < d (20, (to)) et nous prenons une borne 
M pour ||. Nous avons alors, pour tout { que 


HO _M 
n® — 2] 7 


(26.174) 


Le 20 étant fixé, la fonction constante M/r majore f uniformément en t. La théorème de 
continuité sous l'intégrale 17.15 dit alors que l’indice est continue en 20. 


(4) Continuité globale La fonction indice étant continue en chaque point de C\+, elle est 
continue sur C\ (théorème 7.196). 


(5) Sur les composantes connexes Soit une composante connexe C' de C\y. L'application 
Ind, est continue et à valeurs entières sur C. La proposition 7.207 dit alors que l’indice est 
constant sur C!. 


27. Fait important : nous utilisons la continuité de f, pas de l'indice. Nous n’avons pas encore démontré que 
l’indice est une fonction continue. 
28. Nous utilisons ici crucialement le fait que les morceaux sont fermés. 
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(6) Nulle sur la non bornée En majorant || par M, nous avons 


| Ind, (20)| «ef TT El (26.175) 
10) — Ye 


Soit € > 0 assez petit pour que EM(b — a)/27r < 1. Vu que 7 est bornée, il existe R > 0 tel 
que y(t) € B(0, R) pour tout t. Nous considérons r assez grand pour que r — R > 1/e. 


Comme nous étudions Ind. sur une composante non bornée, nous considérons |20| > r. Avec 
ça nous avons |y(t) — 20] > r — R et donc 


M f° M(b— 
doi | he C0 he + (26.176) 


La dernière inégalité est un choix de € fait au départ. 
Étant donné que Ind,(20) € Z, nous avons forcément Ind,(20) = 0. Et comme l'indice est 
constant sur les composantes connexe, il est nul partout. 


PROPooXWULooFZgHfL 
Proposition 26.51. 
Soit pe C. Soit un chemin y: [0,1] — C\{p}. Quelques hypothèses : 
(1) Il existe une demi-droite D d'origine p et tel que y (D) est fini. 
(2) Le chemin 7 traverse D en tout point de (D). 
(3) Soit n* le nombre de points de y! (D) où traverse positivement D et n- idem négativement. 
Alors 
Ind(y,p)=nt-n. (26.177) 
PROPooEKFHooUWcIMk 
Proposition 26.52 ([201]). 


Soient p € C ainsi que deux chemins 1,72: [a,b] — C\{p}. Si y et y2 sont homotopes dans 
C\{p}. Alors 


Id(51,p) = Ind(2,p). (26.178) 
Démonstration. Posons 
f: C\{p} — € 
1 (26.179) 
ze , 
Zz2 —p 


La partie C\{p} est ouverte. Le théorème 26.17 d’invariance de l'intégrale par homotopie nous 
indique que 


Ind(",p) = 


| f=— 
2mi de 2Ti 


f = Ind(-, p). (26.180) 


DefECnFJQp 
Définition 26.53. 
Si y et y2 sont deux lacets en x9 € X (un espace topologique), une équivalence d’homotopie 
est une application f : [0,1] x [0,1] — X telle que 
(1) f(0,t) = y1(t) pour tout t ; 
(2) f(,t) = y(t) pour tout t ; 
(3) pour chaque t € [0,1], l'application s + f(s,t) est continue ; 


(4) pour chaque 8 € [0,1], l'application t + f(s,t) est un lacet basé en to. 
LEMooMEICoo00Gzdf 


Lemme 26.54. 
Si y est un cercle de centre z0 € € et de rayon r, alors 


li sizeB 
Ind. (2) = Dr eo (26.181) 


O sinon. 
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Démonstration. La seconde ligne provient directement de la proposition 26.50. Pour la première, 
le cercle 7 se paramètre par | 
(8) = 20 + ref. (26.182) 


Nous commençons par calculer Ind,(20). Il vaut 


1 d APR 
Î = Î ire d0 = 1. (26.183) 
| tJo TE 


27 J,w—20 27m 


Nous considérons maintenant un point p € B(2,r) et nous calculons Ind,(p). D'abord si a est 
le cercle a(t) = y(t) + p — 20 = re" + p de rayon r centré en p, nous avons 


Ind,(p) = 1 (26.184) 


par ce que nous venons de voir. 
Ensuite les chemins © et + sont homotopes dans C\{p}. En effet nous posons 


H{u,t) = (1— u)y(t) + uo(t). (26.185) 


Nous avons 


H(u,t)—p={(1—u)20 + re + (u — 1)p = (1— u)(20 — p) + re. (26.186) 
En termes de modules, nous avons d’une part 
| — u)(20 — p)| < [20 — pl <r (26.187) 


et [re*| = r. Donc la somme des deux ne peut pas faire zéro. Nous avons donc bien H(u,t) # p 
pour tout u € [0,1] et pour tout te [0,27]. 
Les chemins 7 et o étant homotopes dans C\{p}, la proposition 26.52 dit que 


Ind,(p) = Ind,(p) = 1. (26.188) 


PROPooGAOI0oFTOuli 
Proposition 26.55 ([201]). 


Soit un intervalle J € R. Nous considérons l'application 


D: L(J, C*) = Z 


26.189 
7 Ind(7, 0) | 


où L(J, C*) est l’ensemble des lacets J — C* sur lequel nous considérons la loi de groupe multi- 
plicatif tandis que nous considérons la loi additive sur Z. Nous avons : ITEMooKCRI00SEyh1p 


(1) + est effectivement à valeurs dans Z, 


(2) vd est un morphisme de groupes surjectif. 


(3) Le noyau de 1 est 


ITEMooZFXTooDCXTVU 


ker(w) = {lacets homotopes dans C* à un lacet constant}. (26.190) 


Démonstration. Pour (1), c’est la proposition 26.50(1). 

Soient deux lacets 1 et 2 dans C*. Le théorème 26.46 nous permet de considérer des lo- 
garithmes continus /;: [a,b] — € le long de ;. L'application l; + là est une détermination du 
logarithme le long de 7172 parce que ?? 


exp (l1(€) + la(t)) = exp (H(t)) exp (l(t)) = n(t)#(#). (26.191) 


29. Nous ne nous lasserons jamais de citer la proposition 18.9(2). 
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(1) Morphisme Nous avons 


b 
Ind(71792,0) = =] F(Qn12)®)) (2) (6)dt (26.192a) 
1 dz 
D [. _ (26.192b) 
= (1 +2)(b) — (4 + l2)(a) (26.192c) 
= (H(6) — h(a)) + (2(b) — h(a)) (26.192d) 
= Ind(y1,0) + Ind(2, 0). (26.192e) 


Nous avons prouvé que #(y17%2) = Ÿ(y1) + Y(%2), et donc que # est un morphisme. 


(2) Surjection Nous considérons le lacet 


: [a,b] — C* 
vtt (26.193) 
tr exp (2irkt(b — a)), 
et nous montrons que Ÿ(y) = k. D'abord nous remarquons que 
; 2irk 
= y 26.194 
VO 0 (26.194) 
et ensuite nous calculons : 
i (° 4 , 
Vo) =— | ——7y(t)dt (26.195a) 
ri J, 50 
11 2mik 
= t t)dt 26.195b 
gt 000 (26.195b) 
1 [? 2irk 
= J _ (26.195c) 
2mi J, (b— a) 
= k. (26.195d) 
(3) Noyau Notons pour la simplicité 
H = {lacets homotopes dans C* à un lacet constant}. (26.196) 


Nous notons u le chemin constant u(t) = 1. Nous avons Y(u) = 0 parce que, en notant 


FG) = 1/2, 


1 
Ind(u, 0) n_ = | © fG 0. MAGOIIGS = 0 (26.197) 


parce que w/(t) = 0 pour tout t. Nous avons ne u € ker(y). Si y € H, alors, utilisant 
le théorème de Cauchy homotopique 26.17(2), nous avons Ind(+,0) = Ind(u,0) = 0. Donc 
H € ker(y). 


Soient + € ker(w#) et une détermination continue { du logarithme le long de 7. Nous avons 


0 = ÿ(y) = (6) — Ua). (26.198) 


Nous posons 
H:1[0,1] x [a,b] — C* 


(s,t) > exp (sl(a) + (1 — s){(t)). 
Cette application continue vérifie H(0,t) = e{® = (#4) et H(1,4) = e(0) = (a). Donc elle 
est une homotopie entre 7 et le chemin constant (a). Encore par Cauchy homotopique, 
d(y) = 0 parce que Ÿ est nul sur les chemins constants. 


(26.199) 
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LEMooCTIBooNRAyZH 
Lemme 26.56 ([1]). 
Si y est un lacet dans C\{p}, alors 
Ind(,p) = Ind(7 — p,0) (26.200) 
PROPooPRIIooKWCHBZ 
Proposition 26.57 ([201]). 
Soient p € © ainsi que deux lacets 1 et y2 dans C\{p}. Si 
Ind(y1,p) = Ind(52,p), (26.201) 


alors 1 et y2 sont homotopes dans C\{p}. 


Démonstration. Vu que y1 ne passe pas par p, nous pouvons considérer le chemin 


7: [ab] — C* 
NUE (26.202) 
A(E) —p 
En posant o;(t) = y;(t) — p, nous avons 

Ind(,0) = Ind(o00, !,0) (26.203a) 

= Ind(oo,0) + Ind(o; * , 0) prop. 26.55 (26.203b) 

= Ind(oo,0) — Ind(o1,0) (26.203c) 

= Ind(0, p) — Ind(, D) lem. 26.56 (26.203d) 

=) (26.203e) 


Vu que l’indice de 7 est nul, ce chemin est homotope dans C* au chemin constant u par la 
proposition 26.55(3). Soit une homotopie A: [0,1] x [a,b] — C* entre 7 et u. Et nous posons 


S: [0,1] x [a,b] — C* 


(26.204) 
(s,t) + (nt) —»)A(s,t) 
Cette application est une homotopie entre 
be S(0,8) = (x(#) — p)Æ(0,8 = (200) — r)1(0 = n(9 —p (26.205) 
et 
te S(1,t) = (ft) —p)AH(1t) = (ot) — pju(t) = +(t) — p. (26.206) 
Donc $S + p est une homotopie entre 71 et 2 dans C\{p}. 
PROPooCFMFooXj1hfV 


Proposition 26.58 ([201]). 
Soit un espace topologique X localement connexe par arcs. Soit une application continue f: X — 
C*. Il y a équivalence entre 

(1) f admet un logarithme continu. 


(2) Pour tout lacet y dans X, nous avons Ind(f o 7,0) = 0. 


26.2.10 Théorème de Cauchy et analycité 


Cette sous-section veut prouver le théorème de Cauchy. 
ThoUHztQe 


Théorème 26.59 (Formule de Cauchy). 
Soient ouvert dans C, 20 € Q et f une fonction holomorphe sur Q. Soit r > 0 tel que B(20,r) € Q. 
Alors pour tout z € B(z20,r) nous avons 


De OP FES) 


274 JoB(zor) © — 2 
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Démonstration. Soit z € B(20,r). Considérons la fonction 


J@)=f() 
UE Re NÉ (26.208) 
FC) si W = z. 


Cette fonction est holomorphe sur B(2,r)\{z} et continue en z. Elle vérifie donc la proposi- 
tion 26.10 et nous avons 


Î g=0 (26.209) 
’ 
où 7 est le cercle de centre z9 et de rayon r. Nous avons donc 
0 [#00 6 (26.210) 
Luis Jus 


et ayant déjà calculé la seconde intégrale dans l’exemple 26.54 nous en déduisons 


J@) = Irif(2), (26.211) 
UE 


ce qu'il fallait. 


ThomcPÜOdd 
Théorème 26.60. 
Soient Q ouvert dans © et f holomorphe sur Q. Soient encore 20 € À et ro tels que B(20, ro) € ©. 
Alors : ITEMooYWS0ooHJtxGr 
(1) Sur B(20,ro), la fonction f s'écrit 


Flel= 5 an(z — 20)”. (26.212) 
n=0 
(2) Nous avons 
__f(2) _ 1 f(w) 
än, nl Zi [ @ #1 duw (26.213) 


où y = 0B(%,r) avec |z — z0| < r < ro. LtenMRRTooMChmuZ 


(3) En particulier f est infiniment dérivable. 


Démonstration. Soit r > 0 tel que |z — 20| < r < ro. La formule de Cauchy (théorème 26.59) nous 


dit que 
1 f f(w) 
27Ti J, w — z 


(2) = duo (26.214) 


% 


où + = 0B(2,r). Nous pouvons paramétrer ce chemin par w = 2 + re! et 0 e [0,2r]. Nous avons 


1 [27 f(20+ re) 
2ri Jo Zo + re — z 
1 [ f(zo + re“) 


27) 1-e-%(2- 2)/r 


fa) = rie dO (26.215a) 


dO. (26.215b) 


Nous pouvons développer l’intégrante en puissance de (2 — 25) en utilisant la formule 15.455. Ici 
le rôle de x est tenu par 


e (2 — 2)/r (26.216) 


dont le module est bien plus petit que 1, par hypothèse sur r. Nous avons donc 


27 © 
f(2) = S [ > F(20 + re je Pr (2 — 20)" d8. (26.217) 


2050 CHAPITRE 26. ANALYSE COMPLEXE 


L’art est maintenant de permuter la somme et l'intégrale. Pour cela nous remarquons que ce qui 
se trouve dans la somme est majoré en module par 


n 
2 — 20 


0518) 


où M est le maximum de |f| sur +. La borne (26.218) ne dépend pas de 0; par conséquent la 
convergence de la somme est uniforme en @ par le critère de Weierstrass (théorème 12.382). Le 
théorème 15.1 s'applique * et nous pouvons permuter la somme avec l'intégrale. 

Ce que nous trouvons est que 


M 


T 


00 
F2) = D an(z — 2)" (26.219) 
n=0 
où : ) 
0 FIRE CU, = | J(w 
MES , f(zo + re" )e "#7 "40 Zi], @ at (26.220) 


Cette formule est valable pour |2—20| < r. Sur cette boule, la fonction est donc une série entière. Le 
théorème de Taylor 15.135 nous permet donc d’affirmer que f est partout infiniment continument 
dérivable (parce que en chaque point on a un voisinage sur lequel c’est vrai), et d'identifier les 
coefficients (qui, eux, ne sont valables que localement) sous la forme 

f) (20) 


ii Avertissement /question au lecteur !! 26.61 
L'’énoncé du corolaire 26.62 n’est peut-être pas précis. 


CORo0oJ1ISDooFgwOPh 
Corolaire 26.62. 
Si le développement de f autour de 0 est 
HOEDT E (26.222) 
neN 
alors ap = f(0) et ai = f'(0). 
CorwfHtJu 


Corolaire 26.63. 
Soit f une fonction continue sur un ouvert Q telle que pour toute boule B(a,r) contenue dans (, 


nous ayons 
_…, PE 
je) = 2ri Jop(ar) É — à 


dé. (26.223) 


Alors f est holomorphe. 


Démonstration. [1 suffit de recopier la démonstration du théorème 26.60 pour savoir que f se 
développe en série de puissances et est donc en particulier dérivable. 


Le fait qu’une fonction holomorphe soit C°° comme dit dans la proposition 26.60 permet de 


démonter un résultat de dérivation sous l’intégrale, qui dépend de pouvoir majorer la différentielle. 
& K) q P J 
PROPooZCLYooUaSMWA 


Proposition 26.64. 
Soit une fonction continue g: R x C — €. Nous supposons que pour tout t, la fonction z + g(t,2) 
est C-dérivable (définition 12.315) et différentiable. Soit B compact dans R et la fonction 


G(:) = Loc. z)dt. (26.224) 


30. Etant donné que nous savions déjà que la somme était une fonction intégrable, nous sommes loin d’avoir utilisé 
toute la puissance du théorème. 
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que nous supposons exister pour tout z. 
Alors 


G'(2) = Ï g'(t,z)dt (26.225) 
B 
où le prime réfère à la C-dérivée par rapport à la variable z à t firé. 
Démonstration. Nous fixons z € C et nous considérons la suite de fonctions 


gG,2+e) — g(t,2) 
Éi 


gi(t) = (26.226) 


où €; est une suite de nombres complexes tendant vers zéro (é; Re 0). Si la limite existe et ne 
dépend pas de la suite choisie, alors lim;_, gift) = g'(t,z). Et vu que g est supposée dérivable, 


c’est le cas. 
Nous avons aussi, par linéarité de l’intégrale : 


G'(2) = lim | gi(t)dt. (26.227) 


La difficulté est de permuter la limite et l’intégrale. Pour cela nous allons utiliser la convergence 
dominée de Lebesgue (théorème 14.200). Afin de majorer |g;(t)| par une fonction intégrable en t 
(uniformément en i), nous exploitons le théorème des accroissements finis, théorème 11.254. En 
notant dg la différentielle de g par rapport à z à t fixé, pour chaque t et chaque à nous avons 


Ig,z+e)—g(62)< sup |dgellel. (26.228) 


Éelz,z+6] 


Vu que z est fixé et que € est dans le compact [z,z + e;] et que dg est continue (parce que la 
C-dérivabilité implique la continuité de la différentielle parce que nous avons l’analycité par le 
théorème 26.60), nous pouvons majorer |dge| par une constante M;(z) qui dépend à priori de à et 
de z. 

Heureusement, nous pouvons prendre à fortiori le supremum sur B(z,{|6;|) (qui est tout autant 
compact) et supposer que [e;| est strictement décroissante ; de toutes façons, il y a un maximum 
parce que |e;| — 0. Dans ce cas, il suffit de prendre le supremum de }dge| pour € € B(z,[«|) et ça 
contente tout le monde. 

Quoi qu’il en soit nous avons une constante M(2) telle que 


1g(E, 2 + ei) — g(t, 2)] < M(z)leil (26.229) 


et donc |g;(t)| < M(z). La constante (par rapport à t) M(z2) est évidemment intégrable sur le 
compact B et nous pouvons permuter la limite avec l'intégrale : 


G'(z) = lim | g(t)dt = [ Jim gi(t)dt = [ g'(t,2)dt. (26.230) 


1—>00 B 


PropZOkfmO 
Proposition 26.65. 
Une fonction continue f est holomorphe si et seulement si la 1-forme différentielle f(z)dz est 
localement exacte. 


Démonstration. Si f est holomorphe, alors nous avons vu que f était différentiable et que df; — 
f(z)dz par la formule 12.872. 

Dans le sens inverse, supposons que f(z)dz est localement exacte, et soit F telle que dF = 
f(z)dz. Ce que nous allons faire est montrer que la dérivée de F existe et vaut f. En effet, la 
définition de la différentielle nous dit que 


in LEE +h) = F() — dF,(h) 


= (0. 26.231 
ns . 0 (26.231) 
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La limite vaut évidemment encore zéro si nous enlevons les modules : 


nreth=F(G)-FGR 


0=1 (26.232a) 
h—0 h 
= lim ER ” PE), pi (26.232b) 


Donc F" = f. Cela montre que F est C-dérivable et donc holomorphe. En conséquence du théo- 
rème 26.60, la fonction F est infiniment dérivable et f l’est alors aussi. La fonction f est donc 


holomorphe *!. 


26.2.11 Théorème de Brouwer en dimension 2 


Pour d’autres versions du théorème de Brouwer, voir la sous-section 20.5.1. 
ThoLVViheK 


Théorème 26.66 (Brouwer en dimension 2[103]). 
Soit B = B(0, 1) la boule unité fermée de R?. Alors toute application continue de B dans elle-même 
admet un point fixe. 


Démonstration. Supposons que la fonction f € C°(B, B) n’admette pas de points fixes sur B = 
B(0,1). Pour x € B nous notons g(x) l'intersection entre @B et la demi-droite allant de f(x) vers 
x. C’est bien parce que f n’a pas de points fixes que g est bien définie. 

En reprenant le même début de la preuve de la proposition 27.73 nous savons que la fonction 


g: B(0, 1) — 0B(0,1) 


(26.233) 
B = A(a)(x — f(x) + f(x) 
est continue. De plus g(x) = x sur 4B(0,1). Nous allons montrer qu’une telle fonction *? ne peut 
pas exister. 
Pour 8 € [0,1] nous paramétrons le cercle 0B(0,s) par 
: [0,1] — GB(0, 
ol GS) (26.234) 
tr (scos(2rt),ssin(2rt)). 
Ensuite nous considérons les chemins 
: [0,1] — 6B(0,1 
tr go zxs(t). 
L'application +, est continue et +,(0) = 7,(1). Les chemins +, sont des lacets ; nous nous intéressons 
maintenant à l'indice au point 0 de 0 et 71. D'une part +o(t) = g(0) (lacet constant) et y1(4) = e?Tt 
(parce que g(x) = x sur le bord). Nous avons donc, en utilisant l'indice de la définition 26.50, 
1 d NC 
Ind,,(0) = — Î = Î 0 y 2 0, (26.236) 
2mi J,, w  2ri Jo ot) 
alors que 
1 1 Dirne?irTt 
Inde, (0) = [ Dr dt= 1. (26.237) 
Nous considérons l’homotopie 
: [0,1] x [0,1] — B(0,1 
+: [0,1] x [0,1] — F(0,1) _. 


(s,t) x 7s(€) — (g L &s)(t). 


Nous avons g(0) Æ 0 parce que g prend ses valeurs sur le bord. Vu que c’est une équivalence 
d’homotopie * entre 71 et 2, les indices devraient être égaux par le corolaire 26.18. 


31. Dire que la dérivée d’une fonction holomorphe est holomorphe est un raisonnement classique. 
32. Qui est nommée rétraction de la sphère sur elle-même. 
33. Définition 26.53 
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26.2.12 Principe des zéros isolés 
LEMooYYZQooC1m0gG 


Lemme 26.67. 
Si f est une fonction holomorphe** sur le compact K, alors il existe un polynôme PF et une 
fonction holomorphe hf ne s’annulant pas sur K telles que f = hfPr. 


Démonstration. Soit une fonction f vérifiant les conditions. Si f est identiquement nulle, alors il 
suffit de prendre PF = 0 et c’est fait. Nous supposons donc que f n’est pas identiquement nulle. 


(1) Quantité finie de racines 


D'abord f ne peut s’annuler qu’un nombre fini de fois sur K. Sinon, on pourrait considérer 
une suite des racines *” de f dans X. Vu qu’une suite dans un compact contient une sous-suite 
convergente (théorème 7.136), la fonction f aurait un point d’accumulation de racines. Alors 
le principe des zéros isolés (théorème 17.139) nous donne un ouvert sur lequel f est nulle et 
donc le corolaire 17.140 nous dit que f est identiquement nulle. 


(2) Autour d’une racine 


Bref, la fonction f possède un nombre fini de racines sur K. Soit 20 l’une d'elles. 
Par le théorème 26.60(1), nous avons, sur un voisinage de 29 : 


fG@) = D an(z — 20)". (26.239) 
n=0 


En particulier, 0 = f(20) = ao. Donc ao = 0. Soit k, le plus petit naturel pour lequel a; # 0. 
Nous avons 
f(2) = (z — 2)°g(2) (26.240) 


avec g(z) = 50 @k+n(z — 20)". Vu que ax Æ 0 nous avons g(20) # 0. Montrons à présent 
que g est holomorphe sur un voisinage de 29. Vu que la série définissant g est une sous-série 
d’une série convergente sur un voisinage, elle converge sur un voisinage et la proposition 26.11 
nous dit que g est C-dérivable. C'est-à-dire holomorphe par définition. 


(3) Autour de toutes les racines 


Soient (z;) les racines (en nombre fini). Pour chaque à nous avons une boule B(2;,r;) sur 
laquelle f = P;g; où P; est un polynôme de la forme (2 — z;) et g; est holomorphe sur 
B(i,r;). Nous définissons la fonction suivante : 
DEC j Si? À 
R(z) = a. | (26.241) 
Sp. 


[rs Pk(2) 


Cette fonction ne s’annule jamais. Mais est-elle holomorphe ? 


Si z £ z; (sous-entendu : pour tout {), alors sur un voisinage, h = f/] ] P£ qui est un quotient 
de fonctions holomorphes dont le dénominateur ne s’annule pas. Elle est donc holomorphe 
sur ce voisinage par le lemme 12.324. 

Pour les autres notons que pour tout z € B(z;, ri), 


gi 
h= = (26.242) 
[Te Pr 
Cela est encore un quotient dont le dénominateur ne s’annule pas *. 


(4) La réponse 
Nous avons, pour tout z € K : 


fG@) =) [ [A (26.243) 
k 


34. Définition 12.317. 
35. Notez l'utilisation de la proposition 1.117 que je vous invite à ne pas considérer comme une trivialité absolue. 
36. Nous avons choisi les r; de telle sorte que les boules ne s’intersectent pas. 
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Afin de détendre l’atmosphère, nous allons laisser tomber l’analyse quelques instants et prouver 


un résultat d’algèbre. 
PROPooVWRPooGQMenV 


Proposition 26.68 ([1, 615]). 
L'anneau des fonctions holomorphes sur un compact®'" donné de € est principal”. 


Démonstration. Nous nommons À l’ensemble des fonctions holomorphes sur le compact K, et J 
un idéal de À. 


(1) À est un anneau 


Le point délicat de la définition 1.41 est le fait que la somme et le produit d'éléments de À sont 
des éléments de À parce que les résultats type « la somme de deux fonctions holomorphes est 
holomorphes sont valides sur des ouverts alors que nous sommes ici sur un compact. Soient 
f et g dans À; nous nommons (} et Q, des ouverts contenant K tels que f est holomorphe 
sur {); et g sur {),. 

L'ensemble (y À (, est un ouvert (intersection d’ouverts) contenant X et sur lequel f et g 
sont holomorphes. Donc f + g et fg y sont holomorphes. 


(2) Engendré par des polynômes 


Pour chaque f € J nous écrivons f = P;hf en vertu de la décomposition donnée par le 
lemme 26.67. Vu que hf ne s’annule pas, 1/h est encore holomorphe sur X et nous déduisons 
que Pf = f/hf est dans J. La partie 


S = {P}; tel que f e J} (26.244) 


est génératrice de J parce que, par construction, tous les éléments de J/ sont des produits 
d'éléments de S par des fonctions holomorphes sur X (donc, des éléments de A). Mais tous 
les éléments de S sont dans J, donc (S) = J. 
(3) Un polynôme pour tous les engendrer 

Soit M, l'idéal de C[X] engendré par $S. Attention : J est l'idéal de À engendré par S$. 
Mais l’idéal de C[X] engendré par $ est peut-être autre chose. Vu que € est un corps, le 
lemme 3.107 dit que C[X] est principal. Donc M est un idéal principal de C[X] et nous 
avons un polynôme p € C[X| tel que 


M = C[X]p. (26.245) 
Si vous avez compris le chausse trappe, vous saurez pourquoi il faut écrire M = C[X}]p et 
non utiliser l'écriture plus simple «& M = (p) ». 
(4) AC[X] = À 
L'inclusion À € AC[X] est dûe au fait que 1 € C[X], et l’autre inclusion est le fait que 
C[X] € À alors que À est un anneau. 


(5) Suite des opérations 


Nous avons : 
J = AS € ACÏX/]p. (26.246) 


Voilà une inclusion de montrée. Reste à faire l’autre. 
Vu que p € J nous avons aussi Ap € J. Et donc 


AC[X]p = Ap ce J. (26.247) 


Avec ces deux inclusions, J = AC[X]p = Ap. Donc J est engendré par un seul élément et 
est principal. 


37. Être holomorphe sur un compact signifie qu’il existe une extension holomorphe à un ouvert contenant le 
compact. 
38. Définition 1.221 
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26.2.13 Prolongement de fonctions holomorphes 
PropDRnYkKP 


Proposition 26.69. 

Soient Q un ouvert de C et f: Q — © une fonction holomorphe sur Q\{a} (a € Q). Nous supposons 
qu'il existe r > 0 tel que f est bornée sur B(a,r) n Q. Alors f se prolonge en une fonction 
holomorphe sur Q. 


Le théorème de prolongement de Riemann 26.89 donnera plus d'informations. 


Démonstration. Nous définissons la fonction g: Q — € par 


Le oo siz2£a 


| (26.248) 
0 siz = a. 


Sur (Q\{a}, la fonction g est holomorphe (produit de fonctions holomorphes), et elle est continue 
en a. Par conséquent elle est holomorphe sur (. Nous la développons en série entière sur une boule 
B(a,r) : 


gta) = », Cn(z — a)”. (26.249) 
n=0 


Nous avons g(a) = co = 0. Nous posons 
OO 
p(a) = Ÿ Enrifz — a). (26.250) 


nm 
Si z £ a, alors w(z) = f(a) parce que w(z) = g(z)/(z — a). Mais y est continue en a, et donc 
holomorphe en a. 
La fonction @ est par conséquent un prolongement holomorphe de f en a. 


26.2.14 Théorème de Runge 


Le théorème que nous allons prouver n’est en réalité qu’une partie de ce qui est usuellement 


appelle le théorème de Runge. 
ThoMvMCci 


Théorème 26.70 (Théorème de Runge). 
Soit K, un compact de © tel que CK soit connexe. Si a E CK alors la fonction 


Pa(z) = (26.251) 


est limite uniforme de polynômes sur K. 


Démonstration. Nous considérons P(K), l’adhérence des polynômes sur X pour la norme uniforme 
(sur À). Nous devons montrer que pour tout a € CK, la fonction w, est dans P(K). Pour cela nous 


considérons l’ensemble 
A = {aeCK tel que w € P(K)} (26.252) 


et nous allons montrer qu’il est à la fois non vide, ouvert et fermé dans le connexe CK. 
Je répète : nous allons prouver l’ouverture et la fermeture pour la topologie de CK. Nous n’allons 
pas prouver que À est un ouvert de C. Ce qui sera par conséquent prouvé est que À =CK. 


(1) Non vide Soit R = sup.eK |z| et ae CK tel que [a] > R. Nous avons 


1 1 1 IR , ZE 
= = = = | 26.253 
Pa(z) nel GE 20 di ae ( ) 


Ici la convergence de la série et sa limite sont assurées par le fait que |z/a| < 1 par choix de 


R et a. La suite de polynômes 
Le 


A 
AOESS nr (26.254) 
k=0 


converge uniformément sur B(0,R) et en particulier sur K. Donc P; — a. 
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(2) Fermé 
Nous allons montrer que la fermeture de À (dans CK) est inclue dans À, et donc qu’elle 
est égale à À et donc que À est fermé. Par le lemme 7.26, la fermeture de À dans CK est 
l’ensemble À n CX où À est la fermeture de A au sens usuel. 
Bref, soit a e A nNCK, et montrons que w, € P(K). Vu que P(K) est déjà une fermeture, 
nous aurons en fait 4 € P(K) et donc a € À, ce qui signifierait que À n CA = À et donc que 
À est fermé. 
Au travail. 
Soit (a,) € À une suite convergente vers a. Soit aussi d = d(a, K) ; on a d > 0 parce que K 
est compact et a est hors de K alors le complémentaire de K est ouvert. Nous choisissons 
en plus la suite a, pour avoir [an — a| < 3 : au pire on prend la queue de suite. Soit z € K'; 


nous avons En yNQRE 


Vu que an € B(a, À) et que ze K et d = d(a, K) nous avons |a, —z| > Ÿ; et aussi [a—2| > 9. 
Nous pouvons donc majorer (26.255) par 


1 1 


Z—Gn Z2—@ 


An — à 


(z — an)(z — à) 


[Pan (2) — Pa(z)| = 


An — à 
Kean (2) — gate) < 214, (26.256) 


Donc nous avons 
la — PanlK & RE = 0 (26.257) 


où la norme |.|x est la norme supremum sur X. Donc a € P(K) = P(K) et À est fermé. 


(3) Ouvert Vu que K est compact, il est fermé et donc CÆ est ouvert. Par conséquent, ainsi 
que précisé dans l’exemple 7.28, les ouverts de CK sont les ouverts de € contenus dans CK. 
Afin de prouver que À est ouvert, nous prenons a € À et nous cherchons une boule (au sens 
de €) autour de a qui serait incluse dans À. 

Soit donc h € C « petit » dans un sens que nous allons préciser plus tard. Encore une fois 
nous posons d = d(a, K). Nous avons 


path) = ——> = — D. Faq 


z—a—h 


Déjà ici nous demandons h < sup,-x |2 — al. Puisque |2 — a] > d, nous avons alors 


00 h* 
lrarr(a)| & D Ji < D (26.259) 
k=0 


Cela pour dire que la somme à droite de (26.258) converge bien pourvu que À soit bien petit. 
Nous pouvons donc poursuivre : 


ve) 


à > rs -ÿ pa. EqTSSdt ty Ex 


Nous montrons maintenant que la convergence de la somme (26.260) est en réalité uniforme 
en 2. En effet 


N co 
KParn(e) — D hfpa(2) 1] = | JS héoa(2ft] (26.261a) 
k=0 k=N+1 
O0 
< D, Ile). (26.261b) 


k=N+1 
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Étant donné que w, est continue sur le compact X, elle y est majorée en module: on peut 
même être plus précis : 


[pa(z)| B 5 a < : (26.262) 
Nous pouvons donc écrire 
N 1 © k k 
éa+n(2)— D hfe( <> | (26.263) 
k=0 k=N+1 


Étant donné que la somme nn d|F converge, la limite N — © est nulle et nous avons 


N 
dim arr — D hot |x = 0. (26.264) 
k=0 


Pour avoir @ain € P(K), il faut encore savoir si les fonctions 6* sont dans P(K) pour tout 
k. Dans ce cas pour chaque N la somme sera encore dans P(K) et $a+n sera limite uniforme 
d'éléments de P(K). 

Par hypothèse, w, € P(K); soit P, une suite de polynômes qui converge uniformément vers 
£a. Nous allons montrer qu’alors la suite de polynômes PF converge uniformément vers sf. 
Soit n tel que |P, — vx < € et utilisons le produit remarquable 


k—1 
dé (ab) > ab ti (26.265) 
i=0 
pour obtenir 
Pa(z)* — pa(z)f| < Pa(2) — pa(2)l D, Pa(z) alta). (26.266) 
i=0 


Vu que P, et wa sont continues sur le compact X, on peut majorer la somme par une 
constante M, et il restera 


Paz) — pa(z)*| < MIPa(2) — pa(2)l, (26.267) 
ou encore 
IPÉ — LË| < Me. (26.268) 
Cela prouve que w* € P(K) et donc que wu+n est limite uniforme (sur X) d'éléments de 
P(K) et donc fait partie de P(K) lui aussi. 
Ceci achève de prouver que À est ouvert dans CK. 


(4) Conclusion 


L'ensemble À est non vide, ouvert et fermé dans CK, donc il est égal à CK. Le théorème est 
ainsi démontré. 


26.3 Intégrales de fonctions holomorphes 


Nous commençons par le lemme technique. 
LemNAnweA 


Lemme 26.71 ([515]). 
Soit f une fonction holomorphe sur B(20,r0). Pour tout z € B(20,r) (avec r < ro) nous avons 


r 


(é — |2— z0l)” 


ROIS max { f(20 + re}, pe (26.269) 
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Démonstration. Par translation nous pouvons supposer que z0 = 0. Étant donné que f est holo- 
morphe, elle admet un développement en séries entières 


Feb », ne (26.270) 


Le] 
[FC = > ane (26.271a) 
n=1 
| n—1 
<= D r"lan|n (2) (26.271b) 
M [| n—1 
IT 26.271 
Dit ( - ) ( c) 
À ce point nous devons utiliser la série de l'exemple 15.143. Nous avons alors 
M 1 M 
TROIE _ (26.272) 


"G-4) e- 


26.3.1 Holomorphie sous l’intégrale 


26.72. 

Notez une grande différence entre les théorèmes 26.73 et 17.19 : la condition (17.76) demande de 
contrôler l’intégrabilité de la dérivée de f, alors que la condition (26.274) demande de contrôler 
l’intégrabilité de f elle-même. Oh oui, on voudrait faire de l’analyse, mais ces fonctions holomorphes 


tellement déloyal !! 
ThopCLOVN 


Théorème 26.73 (Holomorphie sous l’intégrale[515]). 
Soit un espace mesuré (Q, 4), un ouvert À dans © et une fonction f: À x Q — C. Nous voulons 
étudier la fonction 


Fe [ eut (26.273) 


pour tout z € À. Nous supposons que 
(1) la fonction f(.,w) est holomorphe sur À pour chaque w. 
(2) La fonction f(z,.) est mesurable sur (Q, u). 
(3) Pour tout compact K € À, il existe une fonction gx: (A — R telle que |f(z,w)| < gx(w) et 


telle que 
[ 0 EooYILMopglEgos 


existe. 


Alors la fonction F' est holomorphe et 
/ of 
F2) = | —(z,w)du(w). (26.275) 
Q Oz 


Démonstration. Soient 20 € À et r > 0 tels que K = B(z0,r) € A. Pour chaque w € Q nous 
considérons la fonction 


fo: Br) — © 


 . (26.276) 
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Étant donné que B(20,r) est compacte, la fonction |f,| est majorée par un nombre que nous 
notons fx(w) qui est indépendant de z (pour autant que z € K). Nous désignons par S(20,r) la 
frontière de la boule B(20,r). Étant donné que la majoration est valable sur B (Zo,r), nous avons 
en particulier 


[fu(z)l < fx (w) (26.277) 


pour tout z € $S. En utilisant la lemme 26.71 nous avons 


FMAIES DE max{ f(20 + re) }9eR (26.278a) 


(r—[|2— 20 
rfKk(w) 


2 26.278b 
FA CE 


Cette majoration est valable pour tout z € B(20,r). Si nous supposons de plus que z € B(20,r/2) 
nous avons 
rfKk(w) 


= 
(r—5) 
Étant donné que la boule B (zo,r/2) est convexe, la fonction f, est Lipschitz et pour tout h € C 
tel que [h| < r/2 nous avons 


ROIS AO) (26.279) 


Ju(zo + h) — fu(20) < Afx(w) 


26.2 
À - (26.280) 


Soit maintenant une suite (h,) qui converge vers 0 dans C. Nous considérons la suite de fonctions 


correspondantes 
f(2o ns Rin,w) = f (co, w) 


In(w) = (26.281) 
An 
Cette suite de fonctions vérifie la convergence ponctuelle 
Ô 
ÿn(w) — (zou). (26.282) 


Afk 
T 


De plus g, est une fonction (de w) dominée par qui est intégrable. Par conséquent le théorème 


de la convergence dominée *” nous indique que 


Ô 
L stdute) + [ Horardute), (26.283) 
@ Aa 027 
tandis que 
A le ee ER (26.284) 
n— 00 hn no Jo 
26.74. 


Dans le corolaire suivant, l’intégrale sur 0B(z,r) est une intégrale sur un chemin. 

CorNxTjE; 
Corolaire 26.75. 
Si f est une fonction holomorphe sur un ouvert Q contenant la fermeture de la boule B(20,r), 
alors pour tout z dans B(20,p) (p < r) les dérivées de f s'expriment par la formule suivante : 


pe E[ 10 à EnecBP ICQ 


 2mi onto ( — 251 


Démonstration. Nous faisons par récurrence. 


39. Lebesgue, théorème 14.200. 
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(1) Pour la dérivée première Soit p < r. Nous utilisons le théorème 26.59 pour écrire 


1 1Q) 


 2ri Joston € — 2 


FQ) 


dé. (26.286) 


Ensuite nous dérivons sous l'intégrale en appliquant le théorème 26.73 à la fonction 


g: B(2, p) x 0B(20,r) — © 
7. Fe) (26.287) 


É—2 


Étant donné que f est holomorphe, la fonction g est continue et donc bornée sur tout compact 
K € A par une constante M (qui dépend du compact choisi). D'autre part, nous avons 
toujours |£ — z| > r — p et donc 

M 


r—p 


FIERSIES (26.288) 


La fonction constante gx = — est évidemment intégrable. Le théorème conclut que f est 


holomorphe (cela, nous le savions déjà 4), et 


= | É © &e (26.289) 


2ir — 2)? 
(2) Les dérivées suivantes Pour la récurrence[616] nous supposons que 


k! [ 1Q 
o 


_ 2im B(z0;,r) (£ = Lis 


fO (2) dé, (26.290) 


et nous tentons de calculer FÉES). Pour cela nous paramétrons l'intégrale de façon très 
usuelle : 


k! [ f(reït) 


2ri Jo (reït— 2) 


Nous permettons de permuter la C-dérivation (par rapport à z) et l'intégrale en vertu de la 
proposition 26.64 appliquée à la fonction 


FO(2) = iretdt. (26.291) 


fire), Le 
Pr 2 Re (26.292) 


gt, z) un ( 


Cela donne 


Grp À! su nest + __(&+1)! fFte) 
FH) = din f(re")ire rai dt - [. Er %; (26.293) 


THOo00SULFooHTLRPE 
Théorème 26.76. 
Si f est une fonction holomorphe sur le disque ouvert B(20, R) alors 


D p(n)f, 
a=Yy J . 0), 2)" (26.294) 
n=0 ° 


et cette série converge uniformément sur tout compact. 


40. Et cela fournit une preuve alternative à la réciproque du théorème de Cauchy : une fonction continue qui vérifie 
la formule de Cauchy est holomorphe. 
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Démonstration. Sans perte de généralité nous supposons que 20 = 0. La formule de Cauchy (théo- 
rème 26.59) fournit, pour z € B(0,R), 


_Lif 0, _1/f © 
LE, éme En 


En particulier notons que z € B(0, R) alors que £ est sur le bord de cette boule ouverte. Donc 
l£| > |2| pour tous les £ et z qui interviennent. Nous utilisons la série géométrique 


Ge "2 (à) : Eu? 


n=0 


(1) Permuter une intégrale et une somme En utilisant la mesure de comptage “! sur IN 
(qui est o-finie), nous pouvons écrire 


2. _. le = LS ( fre dt ) de ENoNOLOopHSEEx 


où 
g:0BxN—C 


” 26.298 
COMENT D 


Nous allons permuter les intégrales en utilisant le théorème de Fubini, selon la procédure 
décrite en 14.298. Nous commençons par l'intégrale sur N : 


fear IS ere ro SE 


EN 1—|217R 


Ici nous avons utilisé [£| = À. Notons que z est fixé depuis longtemps à l’intérieur de la boule 
de rayon R de telle sorte que |2/£| est une constante strictement inférieure à 1. 


L'intégrale sur £ € 0B n’a pas à être effectuée explicitement : nous nous contentons de prouver 
qu’elle est finie. La fonction f est continue sur le compact 4B. Cela parce que B est une boule 
fermée dans l’ouvert ( sur lequel f est continue. Au final l’expression à droite de (26.299) 
est bornée sur le compact GB et son intégrale donne un nombre fini. 


Tout ceci pour invoquer le corolaire 14.296 qui nous indique que ge L'(N x 8B). 


Une fois g intégrable sur l’espace produit N x @B, nous pouvons utiliser Fubini 14.297 pour 
permuter les intégrales. 


Une fois la somme et l’intégrale permutées, nous avons 


DU NE dE “sets 


Nous devons maintenant montrer que ce qui se trouve dans la grande parenthèse vaut f(*)(0)/n!. 
Cela est immédiat en comparant avec la formule (26.285). 


ThoRckxes 
Proposition 26.77 (Morera [617]). 
Soit ( ouvert dans C et f continue. Si 


f =0 (26.301) 


pour tout triangle (plein) T contenu dans Q, alors f est holomorphe sur Q. 


41. Définition 14.255. 
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Démonstration. Il est suffisant de prouver que f est holomorphe sur toute boule ouverte B(a,r) 
inclue dans Q. Nous posons, pour tout z € B(a,r), 


F2) = _ a (26.302) 


et nous considérons le chemin triangulaire a — 2 — z2+h— a où h € C est choisi assez petit pour 
que z+he B(a,r). L'intégrale sur le triangle étant nulle, nous avons 


c’est-à-dire 
F(2+h) — F(2) = ] ; (26.304) 
2—2+h 


En paramétrant le chemin par 2 + th avec t € [0,1], et en tenant compte de la remarque 20.41, 


F(z2+h)—F(2) 


/ LD gs 
F(2) lim h (26.305a) 
ir! 
= fm | f(z+th)hdt, 26.305b 
in [Fe +00 (26.305) 


ce qui prouve que F est dérivable et F” = f. Par définition (12.316), F est holomorphe, et donc 
C® par le théorème 26.60. Du coup f est également C'© et donc en particulier holomorphe. 


26.3.2 Mesure de Radon 


Soit un compact X de C. Le lemme 12.370 nous dit que (C(K),|.|+) est complet. Mais cela 


n’est pas vraiment utile pour l'instant. Je dis ça juste pour le garder dans un coin de la tête. 
DEFo0oTLRKooGbKKA; 


Définition 26.78. 
Une mesure de Radon sur un compact K de © est une forme linéaire continue sur (C(K), ||) 
Si u est une mesure de Radon, on définit la transformée de Cauchy de 1 par 


(26.306) 


où, pour tout z € C\K nous avons défini la fonction f, par 


f::K—C 


1 nn 116 
an 


26.79. 
Les fonctions f, sont définies pour z € C\K, et elles sont définies sur K. Donc il n’y a pas de danger 
que € = z dans le dénominateur de (26.307). De plus si f, est définie (c’est à dire si z € C\K), 


alors f,:n est également définie tant que h € € n’est pas trop grand parce que C\Æ est un ouvert 


de C. 
ThoJVNTzn 


Théorème 26.80. 
Si u est une mesure de Radon*? sur K alors à est infiniment C-dérivable* sur Q = C\K et nous 
avons 


AL = n! 1 
BV (2) fe) (26.308) 


42. Définition 26.78. 
43. Définition 12.315. 
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Démonstration. Calculons la dérivée complexe de ÿ. Si la limite existe, nous avons 


He tn 0) 0), (26.309) 
heC 


Nous allons nous concentrer sur ce qui est dans la limite pour montrer qu’elle existe, et pour 
calculer la valeur. Nous avons 


= 7 (te £) u est linéaire (26.310b) 
: : 26.310 
HE) ns. 


où la dernière ligne est un abus de notations pour dire que y est appliquée à la fonction &€ + 


1/(£—2—R)(É— 2). 


Histoire d'éviter de regretables abus de notations, nous introduisons la fonction 


Dan: K — C 
’ 1 (26.311) 
É=seh)t-2) 
ainsi que la famille 
fzn: K—C 
’ 1 (26.312) 
(Een 
Ce que nous avons montré est que 
(z + h) — (z 1 
2 ) LORS: (26.313) 
T 
De plus nous avons la convergence 
(C(K)ILl) 
rh > J22 (26.314) 


lorsque h — 0. Vu que y est continue, nous pouvons permuter la limite avec y et avoir : 


A1 


BCE) = Tim (be) = = u(ea). (26.315) 


Cela prouve le résultat pour n = 1. 
Pour le reste, vous faites un récurrence “*. 


Cette théorie permet de fournir une démonstration plus technologique du corolaire 26.75. 


Lemme 26.81. 
Si f est holomorphe sur ( et si B est une boule fermée dans Q alors pour tout z € Int(B) nous 
avons 


FO EL [ _ : Drrde (26.316) 


2iT 


Démonstration. Appliquer le théorème 26.80 à la mesure de Radon 


u() = [ (EME (6.317) 


44. Je n'ai pas vérifié. Faïtes-le et écrivez-moi pour me dire si c'est bon. 
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Tout ce petit monde à propos de la mesure de Radon permet également de redémontrer que 
1 (6) es 
= O)/n! 26.318 
Ga, ) - on, (26.318) 


comme nous l’avons déjà fait autour de l'équation (26.300). Nous utilisons le théorème de Ra- 
don 26.80 à la mesure 


u(®) = [. p(É)dé. (26.319) 


La transformée de Cauchy est 


A(&) = (= )- — 0) 


7 Jos É—2 


a(n) n' 1 n! [ 1 ——. 
H (2) (Tr) r Jo (E— pnri É ( 6.3 ) 
En comparant la formule (26.320) avec la formule de Cauchy nous voyons que Â(z) = —2if(2). 
Par conséquent 
1 n! 1 
(n) = _=ñ(n) _ 
FC) = TAG) = [. E- PTS LS (26.322) 
et | , 
(n) _ nl 
F0) Ori [. gn+1 dé. (26.323) 


26.4 Conditions équivalentes à l’holomorphie 


Nous nous proposons de lister les conditions que nous avons vues être équivalentes à l’holomor- 
phie. 
THOo00G0CooÙUa1FaG 
Théorème 26.82. 
Soient Q un ouvert de C et f: Q — € une fonction continue. Les conditions suivantes sont 
équivalentes. 


ItemOtPcTb 
(1) f est holomorphe. ItemHWRnxx 
(2) Pour tout triangle (plein) T contenu dans Q, Ÿ, f = 0. ItempBBPVv 
(3) f est C-dérivable. ItemmLhzbB 
(4) f est CT ItemCCrSrL; 
(5) ©:f = 0; ce sont les équations de Cauchy-Riemann. ItenEvxRSn 
(6) La 1-forme différentielle f(z)dz est localement exacte. ItemVSCHtY 
(7) Pour toute boule B(a,r) contenue dans Q nous avons 
fo=2 Je, (26.324) 


2Ti 0B(a,r) Z2 —a 


La fonction f est holomorphe en 20 si et seulement si il existe un voisinage B(20,r) de z et 
des nombres az tels que sur la boule, 


F2) = D an(z — 20)". (26.325) 
n=0 


Dans ce cas, f est holomorphe sur toute la boule. 


26.5. SINGULARITÉS, PÔLES ET MÉROMORPHE 2065 


Démonstration. (1) implique (2) est le lemme de Goursat 26.9. (2) implique (1) est le théorème 
de Morera 26.77. 

(3) est la définition de l’holomorphie, définition 12.316. 

(4) implique (1) est un a fortiori sur la définition. (1) implique (4) est contenu dans le théorème 
de développement en série entière 26.60. 

L'équivalence entre (5) et l’holomorphie est le théorème 26.2. 

L’équivalence entre (6) et (1) est la proposition 26.65. 

L’équivalence entre (1) et (7) est d’une part le théorème 26.60 et d’autre part le corolaire 26.63. 

En ce qui concerne la dernière affirmation, si f est holomorphe en 2, alors le théorème 26.60(1) 
donne la série. Si au contraire nous avons la série, la proposition 26.11 nous donne le résultat. 


26.5 Singularités, pôles et méromorphe 
DEFooKWDUooVPvtpy 
Définition 26.83. 


Si f est holomorphe sur un ouvert (, alors une singularité de f est un point isolé du bord de 
(. 


(1) La singularité est effaçable si la fonction f s’y prolonge en une fonction holomorphe. 


(2) La singularité a est isolée si f est holomorphe sur B(a,r)\{a}. 
DEFoOUIJTooUJPiDG 
Définition 26.84 (pôle d’une fonction[1, 618]). 
Soient un ouvert Q de © ainsi que a € (. La fonction f: Q\{a} — € a un pôle d’ordre n en a 
si il existe r > 0 et une fonction holomorphe g: B(a,r) — © telle que 


(1) g(a) F0 
(2) pour tout ze B(a,r)\{a} nous avons 


g(2) 
= | 26.326 
CE (26.326) 
Lemme 26.85. 
Soit ne N. Nous notons U, l’ensemble des racines n° de l’unité*$ dans C. La fonction 
f: C\Ur — € 
1 (26.327) 
D 27 — 1 


est holomorphe et possède un pôle d’ordre 1 en chaque point de Uh. 


Démonstration. Le fait que f soit holomorphe est simplement le fait que sur le domaine, le déno- 
minateur est un bête polynôme qui ne s’annule pas. 

Nous énumérons Un = {é;}i-1..n. Prouvons que & est un pôle d’ordre 1 de f. La première 
égalité du lemme 19.18 donne 2° — 1 = [[];(2 — &). D'abord nous considérons r > 0 tel que 
B(&k,r) N Un = {x}. 

Nous posons 


gr: B(éx,r)\{Ex} — © 


VA nd 


1 (26.328) 
[Late sé) 


Cela est bien une fonction holomorphe et nous avons 


(2) = PS (26.329) 


45. Définition 12.316. 
46. Voir la définition 19.1 et le lemme 19.2. 
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ii Avertissement /question au lecteur !! 26.86 
Je ne suis pas certain que la proposition suivante soit vraie. Ecrivez-moi si vous avez un avis. 


PROPooKXXSooGzbmeo 
Proposition 26.87. 
La fonction 
sin(z) . 
—T sizZ£0 
Oo : (26.330) 
1 si z=0 
est continue sur un voisinage de zéro dans C. 
PROPooQJDCooYwmkRS 
Proposition 26.88. 
Une singularité de f est un pôle si et seulement si 
lim f(z) = ®. (26.331) 
2—Z 
Le théorème suivant complète la proposition 26.69. 
ThoTLQOEwW 


Théorème 26.89 (Prolongement de Riemann[619]). 
Soient un ouvert A € ©, un point a € À et une fonction holomorphe f: Q\{a} — C. Nous 
supposons que a est une singularité" de f. Les points suivants sont équivalenf£&rmooMLXJooMfuifN 


. 17 48 A 
(1) la singularité a est effaçable” ; ITEMooBWPEooE1tHAa 
(2) f possède un prolongement continu en a ; ITEMooEAUDooIWcxHS 
(3) il existe un voisinage épointé de a sur lequel f est bornée ; ITEMooETRWooDTTpxs 


(4) lim:a(z — a) f(2) = (. 


Démonstration. En plusieurs implications. 


(1) (1) implique (2) La fonction f admet même un prolongement holomorphe. 


(2) (2) implique (3) Soit un prolongement continu f: B(a,r) — © de f. La restriction 


f: B(a,r/2) — © est continue sur un compact et donc bornée tout en étant égale à f 
sur B(a,r/2)\{a}. 

(3) implique (4) Nous supposons que f: B(a,r)\{a} — © est bornée. Disons |f(2)| < À. 
Alors pour tout z€ B(a,r)\{a} nous avons 


I(z— a)f(2)| < Al — al (26.332) 


RS 
Co 
—_—_— 


Or lim,_,4 A(z — a) existe et vaut zéro. Donc lim,_,, [(z — a)f(z)| existe et vaut également 
Zéro. 


TR 
Æ 
nr 


(4) implique (1) si a =0 
Nous commençons par supposer que a = 0, et nous posons D = B(0,r)\{0}. La fonction 
f: D — C est holomorphe et vérifie lim,_,0 zf(z) = 0. 


Nous considérons la fonction suivante : 
g: B(0,r) — € 
0 si z = 0 (26.333) 
_ ee sinon. 


La fonction g est holomorphe sur D parce que f l’est. Voyons que g est dérivable en zéro. 
Pour tout z sur un voisinage, 


= 20e) (26.334) 


2 Z 


47. Singularité et singularité effaçable : définition 26.83. 
48. Définition 26.83. 
49. Théorème 7.138. 
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Or par hypothèse lim,_,0zf(z) = 0 donc g'(0) = 0, et g est holomorphe en 0 (c’est la 
définition 12.316 d’une fonction holomorphe). Bref, g est holomorphe sur B(0,r). 
Nous pouvons donc développer g en série entière °° dans un voisinage B(0, r) : 


(ve) 
= » ane (26.335) 
n=0 
En utilisant le 26.62, ao = g(0) = 0 et ai = g'(0) = 0. Donc en réalité 
O0 
aa)= » at. (26.336) 
n=2 
Considérons la série entière - 
>, bas” (26.337) 
n=0 


avec by = &än+2. Le lemme 15.17 dit que son rayon de convergence est le même que celui de 
g. Donc la fonction 


h: B(0,r) — © 
00 26.338 
2 ; + 
n=2 
est holomorphe. 
Par ailleurs, sur la partie D (qui ne contient pas z = 0) nous pouvons écrire 
g(2) 
= 26.339 
= (26.339) 
et donc 
00 
= ane (26.340) 
n=2 
Autrement dit f = h sur D, et h en est un prolongement holomorphe. 
(5) (3) implique (4) 
Nous posons g(z) = f(z + a). Nous avons 
lim 2g(z) = lim zf(z+ a) = lim(z— a)f(z) = 0. (26.341) 
z—0 z—0 2—@ 


Le changement de variable dans la limite est le lemme 7.168. Donc le premier cas s’applique 
à g et nous avons un prolongement holomorphe ÿ: B(0,r) — € de g. La fonction donnée par 
f(2) = ÿ(z — a) prolonge f. 

C1] 


Définition 26.90 (Fonction méromorphe[620]|). 

Soient U un ouvert de © et {p;} une suite de points dans U sans points d’accumulation (éventuel- 
lement il y a un nombre fini de p;). Si la fonction f est holomorphe sur U\{p;} et si chaque p; est 
un point régulier ou un pôle de f, alors nous disons que f est méromorphe sur U. 


LEMooCSAFooTYasYM 
Lemme 26.91. 
Soient 0 < a < b < 0. Nous considérons l’équation différentielle 
y'(t) = —y(D (26.342a) 
y(a) = Ya (26.342b) 


pour la fonction y: |a,b[ — R. 
L'’unique solution est 


y) _ Yayn FHOOKPY Tone TER, 


a? 
Note : a Æ 0 de toutes façons, donc pas de problèmes. 
50. Théorème 26.60. 
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Démonstration. En termes du théorème de Cauchy-Lipschitz 17.42, nous avons y/(t) = (E, y(t)) 
avec 
f:labxR—R 
n (26.344) 
y) y. 


Cette fonction f est Lipschitz et tout ce qu’on veut parce que { = 0 est hors de son domaine; la 
régularité de f peut être étudiée sur le compact [a/2, b]. 

Un calcul direct vérifie que la solution proposée (26.343) est bien une solution. Le théorème de 
Cauchy-Lipschitz dit qu’elle est unique. 


26.92. 
Vous voulez savoir comment on trouve la solution y(t) = Kt"? Allez, on vous la fait un peu 
détendue, sans trop regarder les détails. D'abord, 


(26.345) 


Nous intégrons des deux côtés : 


J y 0 dt = n[n(#)]° EqooWCQRongai End 


À gauche nous posons u(t) = In (y(t)) et nous avons 


® y(t) 1, RAM la Re : 
Î dt = | u(t)dt = [u(t)]à = In (y(x)) — In (y(a)). (26.347) 


Nous mettons ça à la place du membre de gauche de (26.346), nous mettons toutes les constantes 
dans un Z (en ne nous posant aucune question sur le fait que ce soit positif, nul, que ça peut 
rentrer dans un logarithme ou non) et : 


In (y(x)) = nin(x)+L=Im(Kx"). (26.348) 


où À = el. Et voila. 
PropPUZTQK1 


Proposition 26.93. 
Soient ( un ouvert de € et fn: Q — C une suite de fonctions telles que pour tout compact K de 
Q il existe Nx > 0 tel que 


(1) fn n’a pas de pôle dans K dès que n > NKx ; 

(2) la série ,>n, fn Converge uniformément sur K. 
Alors 

(1) La fonction 


fa) = D, fn(e) (26.349) 


est méromorphe sur Q et ses pôles sont l’union de ceux des fh. 


(2) Nous pouvons permuter la somme et la dérivée : 


fo) (26.350) 
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26.6 Dénombrement des solutions d’une équation diophantienne 


Le théorème 26.99 peut être vu soit comme un dénombrement de solutions d’une certaine 
équation diophantienne, soit comme partition d’un entier en parts fixées. Avant de nous lancer 
dans sa démonstration, nous prouvons un certain nombre de lemmes qui vont traiter des aspects 
combinatoires de la preuve. 

Soit n, N € N. Soit ae N°. Nous considérons les ensembles suivants : 


N 
Va(N) = {ze N\ tel que Ÿ z = n}, (26.351a) 
i=1 
W,(a, N) = {ye NŸ tel que y : a = n}, (26.351b) 
Va(N ja = {tr € VAN) tel que a; | t;Vi=1,...,N}. (26.351c) 
L'ensemble V,(N) avait déjà été rencontré en (15.98). 
LEMooLKCAooCeDnS; 
Lemme 26.94. 
L'application 
: Wa(a, N) = VAN 
A do (26.352) 


(y1, c…. ,YN) FE? (y1a1, . .. ,YNAN) 
(1) est bien définie, c’est-à-dire qu’elle prend effectivement ses valeurs dans Va(N a; 


(2) est une bijection. 


Démonstration. En plusieurs parties. 
(1) Bien définie Soit y e W,(a, N). Nous avons Y(y); = ay. Le nombre a; divise donc bien 
N 
pu): et > dy): = n. 
(2) Injective Si d(y) = (y), alors pour tout à nous avons ya; = ya, et donc y = y. La 
fonction 4 est donc bien injective. 


(3) Surjective Soit x € V,A(N)4. Vu que a; | x;, il existe y; € NN tel que x; = a;y;. On vérifie 
que ye W,(a, N) et que (y) = x. 


LEMooUPXHooHzoHrm 
Lemme 26.95. 
Pour à = 1,...,N, nous posons 
bi: IN — {0,1} 
1 si di | Ti (26.353) 
Lu O0 sinon. 


Nous avons 


N 
> [ I o(x) = Card (W,(a, N)). (26.354) 
zeVA(N) i=1 


Démonstration. Nous décomposons la somme en V,(N), et son complémentaire dans VA (N) : 


N N 


N 
>», [lë@w)= » bi(x) + >, [ [o(x) (26.355a) 
=1 


ze VA (N) i=1 2EVa(N)a i 2EVa(N)\Va(N)a i=1 


L Ÿ 14 ÿ 0 FANS if 


LEVa(N)a tEVa(N)\Va(N)a 
= Card (VA(N)a) (26.355c) 
= Card (W,(N, a)) SUREROO BEC REG) 


Justifications : 
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— Pour (26.355b). Si x € V,(N), alors a; | x; pour tout à, et donc b;(x) = 1 pour tout 1. Si 
au contraire & € V,(N)\VA(N ja, il existe un à tel que a; ne divise pas x; et donc tel que 


— Pour (26.355d). Les deux ensembles sont en bijection par le lemme 26.94. 


LEMooRJOKooPJGVTr 
Lemme 26.96. 
Soit s > 1. La série entière 


(0e) 
ie (26.356) 


a un rayon de convergence égal à 1. Pour z € B(0,1) nous avons 


» ns _ _1 EQooTRAZopfRoZnn 
n=0 


| 1= 


Démonstration. Pour un z € € fixé, nous avons 2" = (2)"5!, Nous appelons donc la proposition 
11.122 avec q = 2“. 

Si |z| < 1, alors [2%] < 1 et la proposition 11.122 nous dit que la série converge. Si au contraire 
|| > 1, alors |2°| > 1 et la série diverge. 

Le corolaire 15.19 conclut que le rayon de convergence est bien 1. 


La valeur (26.357) est également une partie de la proposition 11.122. 


LEMooVMLEooCzPuKy 
Lemme 26.97. 
Sia,beC, sas NENetsipe N avec p < N, nous posons 
N —-1)! 
ou ; ) (26.358) 
n! 
et 
— 1)! 
—__ RE Le (26.359) 
n! 


Nous avons an = An + bn: 


Démonstration. Nous posons a(n) = (an + bh)/an et nous prouvons que lim,_,% a(n) = 1. Pour 


ce faire, 
bn b(n+p—1)! n! 
_ 26.360 
An  Q n! (n+N-1)! à 
b(n+p—1)! 
= 26.360b 
a(n+N-1)! 
b — 1)! 
- G@+p LR (26.360c) 
: (n + P — RL (4 Fes k 
b n+N-—1 1 
=- ]] - (26.360d) 
a k 
k=n+p 
b 1 
< — ; (26.360e) 
an +p 
et nous avons | 
lim " =0, (26.361) 
n— 00 An 


de telle sorte que lim, _,% a(n) = 1. 


51. Vu qu'ici n et s sont entiers, c’est pas profond ça. Il ne faut pas invoquer la proposition générale 12.418. 
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LEMooTGHHooZHZsgE 
Lemme 26.98. 
Si NE, nous avons équivalence des suites 
n+N-—1)! 
rite SRE, (26.362) 
n! 


Démonstration. Sachez que dans [ [?_ sæiyab—a+1 facteurs, et non b — a comme on pourrait 


naïvement le croire. Cela dit, nous avons le calcul 


N-1 
(n+N-1)}) f" i 
aan | Ile (26.363a) 
k=n+1 
n+N—1 Ë 
_ El À (26.363b) 
k=n+1 A 
N-1 
k 
||, (26.363c) 
D 
Donc la limite N-1} 
’ n + — 1)! 
dm Ep = 1. (26.364) 
THOo0QDYWooCOiUMb 
Théorème 26.99 ([1, 112, 416, 621, 103]). 
Soient Ne N etae NV tel que pgcd(a,...,an) = 1. Nous posons 
W,(a, N) = {ye NŸ tel que y : a = n}. (26.365) 
Nous avons alors *? 
1 nN T1 ( 
Card (W,(a, N)) - : 26.366 
(Wa ) LL ax CN — 1) 
Démonstration. Pour chaque à = 1,...,N, nous considérons la série entière 
(0e) 
= yet. (26.367) 
k=0 


dont le rayon de convergence vaut 1 par le lemme 26.96. Nous nous apprêtons à faire le produit de 
Cauchy multiple de la proposition 15.36 ; nous posons donc 


1 sialk 
= * | (26.368) 


O0 sinon, 


et nous écrivons toutes les séries s; sous la forme 
o 
(= ÿ bre. (26.369) 
k=0 


La proposition 15.36 nous assure que si [z| < 1, le produit [| . s,(2) peut être écrit sous la forme 
2 L dÛE o0YÉSHooC ne | | ds: [= si(2) p 
de la série entière | 


N ce N 
_ > | li b, (x) 2 D 

s=0 \xevs(N)i=1 
= Ÿ' Card (W.(a N))2* SUBENOOULECR STAY 


52. Équivalence de suites, définition 10.32. 
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Justifications : 
— Pour (26.370b). Notation b; du lemme 26.95. 
— Pour (26.370c). Utilisation du lemme 26.95 
D'autre part, le lemme 26.96 nous permet d'écrire 


eh 


_ si 
1 Z 


N 
fG) = [ [sta = (26.371) 
i=1 i= 
Notre but sera d'écrire ce produit sous forme de série entière est d'identifier les coefficients avec 
ceux que l’on trouve dans (26.370c). 


(1) m, = N si et seulement si w% = 1 Nous montrons à présent que w est un pôle d’ordre 
N de f si et seulement si w®1 = ...=wN = 1. 


(1a) Un polynôme Nous considérons le polynôme 


P(X) = [Ia X%) = PI] [Læ-0) RER) 


i=1 i=1 weU, 


de ee N 
où, pour la seconde égalité, nous avons utilisé le lemme 19.18. En posant U = UJ;_; Ua, 
nous écrivons encore 


P(X) = (1) ][(X -w)" (26.373) 
weU 
où m, = Card{i tel que w € U,,}. Cela pour dire que, pour |z| < 1, 
1 —1)N 
FC) = = ) (26.374) 


P()  [Leutz - vw)" 
(1b) Sens = Siw est un pôle d'ordre N, alors N = m,, = {i tel que w e U,,}. Donc w € U,, 
pour tout 4, c’est-à-dire que w°% = 1 pour tout 1. 
(1c) Sens = Dans l’autre sens, si w% = 1 pour tout ti, alors m, = N et w est un pôle 
d'ordre N. 
Nous pouvons continuer. 
(2) m, = N si et seulement si w = 1 Nous savons que w = 1 est un pôle d'ordre N parce 
que 1e U;, pour tout ?. Dans l’autre sens, si w est d’ordre N, alors nous venons de voir que 
wi = 1 pour tout 1. 


Vu que les a; sont premiers entre eux, le théorème de Bézout 1.230 nous donne des entiers 
N 
u; tels que ÿ;_, wa; = 1. Nous avons alors 


N 
CE DC SP (26.375) 
i=1 
Donc les pôles de f différents de 1 sont d’ordre strictement inférieur à N. 


(3) Décomposition en éléments simples Décomposons un peu l’expression de f(z) en re- 
partant de (26.372) : 


fG@)=T] = (26.376a) 
: Il : 1 SUBEQooDFKPagBgEAx 


N 
=(-D"II II == = = (26.376c) 
i=1 weUa, 
N 
» = 1) N [I Ÿ des SUBEGoOBVEMeZGEnNE 
i=1 weUa, 


Justifications : 


26.6. 


(4) 
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— Pour (26.376b). Lemme 19.18; vous noterez le signe de différence. 
— Pour (26.376d). Lemme 19.13 pour la décomposition en éléments simples. 


Isoler le terme w =1 Nous notons U = DE 1 Ua;- Chaque U,, contient w = 1. L’expres- 
sion (26.376d) contient donc un terme en a F7. Tous les autres w de U ne sont présents 


que dans au maximum N — 1 des U,,. Nous avons donc 


=D DrES EGooUUEPoRg VAS 


avec By € C. 


Une belle lampée de factorielles Le lemme 15.47(3) permet d'écrire f avec des séries 


entières : 


f(2) = : 
PT (Ni) nn. s' : EQooNHYXoQNCROET 
D NC UE. | 
+ D 4 (p—1)! Er s! ws+p+l 


qui est valable pour z € B(0,1). 
Ce qu’on en fait Pour rappel, l'équation (26.370) nous dit que 


f(z) = ÿ' Card (W(a, N)}25. (26.379) 
s=0 


Nous allons donc identifier le coefficient de 2" dans (26.378) avec Card (W,(a, N)) : 


A (n+N-1)! 


Card (W,(a, N)) = 


(N —1)! n! 
+ S ere (26.380) 
p=1l weU (p s 1)! n! gn+p+1" 


Voici une belle suite (par rapport à n) dont nous devons étudier le comportement asympto- 
tique. 


Des équivalences Le lemme 26.97 nous permet de supprimer tous les termes autres que 
celui qui contient À : 


À (n+N-1)! 


Card (W,(a, N)) + (N 1)! n! 


(26.381) 


Notez que, à gauche, nous avons une suite dans N et à droite, une suite dans € (il n’y a pas 
de raisons à priori que À soit entier ou réel). Cela n’a pas d'importance ; ça n'empêche pas 
les suites d’être équivalentes. 


Le lemme 26.98 donne maintenant 


Card (W,(a, N)) -— Re Le FQooTPKCoR GER on 


Cela est déjà très bien parce que ça donne la vitesse de croissance en fonction de N et n. 
Mais puisque nous sommes perfectionistes, nous allons encore déterminer la valeur de À. 
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(8) La valeur de À Pour déterminer la valeur de À, l’astuce est de considérer la fonction 


2 GG 2): 


fDG-2Y=(-2" Il + (26.383a) 
oies 
| 11 12% (26.383b) 
[rs 
i=1 


Justifications : 
— Pour (26.383c). C’est le lemme 3.133(2). 


La dernière expression montre qu’il n’y à pas de mal à prendre la limite z — 1; elle vaut 
1 
lim f()( — 2) | | (26.384) 
Mais en partant d’autre part de (26.377), nous avons 


(1 — 2) 7 
fDG-2"-=A+ nl » a . (26.385) 


p=1l weU 


Vu que N > p, la limite z — 0 existe et vaut zéro dans tous les éléments de la somme, y 
compris les éléments avec w = 1. Donc 


lim f(2)(1— z)N = À. (26.386) 


Nous savons donc que 


EQooJ MALOR SE RIZ 


be 
I 

= 

IR 


i=1l 


En remettant la valeur (26.387) dans l’équivalence (26.382), nous trouvons le résultat demandé. 


Exemple 26.100. 
Pour p = 1, l'équation est ax = n, qui possède au maximum une solution, quel que soit n. Et de 
plus pour avoir une solution il faut et suffit que a divise n, c’est-à-dire que n soit un multiple de 
a. [ n’y a que un nombre sur « à être multiple de &. D'où le comportement en L. 

Pour p = 2, c’est l’équation (3.58) déjà étudiée. Il y a une famille à un paramètre de solutions 
dont seulement un certain nombre sont positives. À priori, le nombre de solutions positives croît 


linéairement en n. VAN 


26.101. 

Si vous aimez les séries génératrices. Si vous aimez l’idée de mettre toute l’information d’un pro- 
blème dans les coefficients d’une série puis de trouver des réponses en les manipulant, vous pouvez 
regarder introduction à la théorie analytique des nombres|622]. 

Cette vidéo explique comment payer n euros avec des pièces et des billets de valeur données. 
On pourrait croire que cela est exactement le résultat du théorème 26.99. Il n’en est rien parce que 
l'hypothèse de pgcd du théorème n’est pas du tout réalisée par les pièces et billets actuellement en 
circulation. 

Du coup, je ne sais pas si ce théorème est intéressant au sens de la définition 0.2. 
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26.7 Fonctions d’Euler 


ThoZJYooWKfbVz 
Théorème 26.102 (Prolongement méromorphe de la fonction l d’'Euler[103]). 
Nous considérons la formule 
O0 
T(2) = Î LR (26.388) 
0 
Alors 
(1) Cette formule définit une fonction holomorphe sur 
P={2eC tel que R(2) > 0}. (26.389) 


(2) La fonction T': P — € admet un unique prolongement méromorphe sur ©, lequel a des pôles 
sur les entiers négatifs. 


Démonstration. (1) Holomorphie sous l’intégrale 


Pour étudier l’holomorphie de la fonction L' sur P nous utilisons le théorème 26.73. 


Nous considérons la fonction 
g:PxR'—C 


26.390 
(be et 1 ) 


et nous commençons par montrer que c’est holomorphe en z pour chaque t > 0 fixé. Nous 


le vérifions par le critère de 6; f = 0 °° et en nous souvenant que t? = em(®) = eil(f), Nous 
obtenons rapidement que 
0g 
— = 0. 26.391 
FE ( ) 


Le fait que la fonction t + g(z,t) soit mesurable pour tout z est d'accord. 

Et enfin soit K compact dans P. Il faut trouver une fonction gx(t) intégrable sur [0, | telle 
que pour tout z € K et t € [0,00[ nous ayons |g(z,t) < gx(t)|. Pour cela nous majorons 
séparément les parties t € ]0,1[ et t > 1. 

Soit donc X compact dans P ; nous posons M = max,ex R(2) et € = min,ex R(2). 

Site |0,1[ alors nous avons 


ee ge Da (26.392) 
de telle façon à que que 
Let 1] < Jetr-1+i9) mn) (26.393a) 
= |e RD M) (26.393b) 
= [1] (26.393c) 
< HF] (26.393d) 
= — (26.393e) 
Cette dernière fonction est intégrable sur |0, 1{. 
Nous considérons maintenant t > 1. Dans ce cas nous avons 
Es men ss (26.394) 


Cette dernière fonction est un produit d’une exponentielle décroissante avec un polynôme. 
C’est donc intégrable entre 1 et l'infini. 
La fonction gx que nous considérons est donc 


me sit<l 
gx(t) = 4 borné sil<t<b (26.395) 
EU SE 
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Cela est une fonction intégrable sur ]0,[ et qui majore g uniformément en z sur le compact 
K de P. Le théorème 26.73 nous permet donc de conclure que 


00 
Pél= Î g(z,t)dt (26.396) 
0 
est holomorphe en z sur P et que 
00 
(2 = | td. (26.397) 
0 êz 


En deux morceaux Nous passons maintenant à la seconde partie du théorème. Pour z € P 
nous coupons l’intégrale en deux : 


1 00 
T(2) = Î et lat + J nu (26.398) 
0 1 


Première partie Nous commençons par parler de la première partie : fe e-tt*-1dt dans 
laquelle nous voulons utiliser le développement en série de l’exponentielle et. Nous devons 
donc traiter 


[> CU yn+z- dt. (26.399) 


Nous allons permuter la somme avec l'intégrale à l’aide du théorème de Fubini 14.297 en 
posant la fonction 


jy 
g{n, t) = ais 7 Se (26.400) 


et en considérant le produit entre la mesure de Lebesgue sur C et la mesure de comptage 
sur N, c’est-à-dire que nous étudions 


[ [. an indé (26.401) 


Pour permuter il suffit de prouver que |g| est intégrable pour la mesure produit, c’est-à-dire 
que 


Ent Sn. (26.402) 
Nous avons [t’| = #?U), donc 
rz- 1 o0 t 
= TE (26.403) 
n! n! 
n=0 n=0 


Étant donné que nous avons fixé z € P, nous avons R(z) — 1 > —1 et donc 4) 1 est 
intégrable entre 0 et 1 (proposition 14.277). La partie e! se majore sur [0,1] par une constante 
quelconque. Nous avons donc payé le droit d’inverser la somme et l’intégrale : 


1 Le] 
Î Re Die CI" yn+e- dt = . 
0 _—. 


Nous avons donc l’intéressante formule suivante, valable pour tout z € P : 


did . 26.404 
Le . (n + 2) 


oo je ve] 
nn + ee, (26.405) 
n=0 (n à z) 1 
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(4) Prolongation de la première partie Nous voudrions montrer maintenant que la fonc- 


= 


tion 


» (26.406) 
Ænlin— 2) 


est méromorphe sur € avec des pôles en les entiers négatifs. Pour cela nous considérons la 
UT 


Ja) = HE) (26.407) 


suite de fonctions 


et nous allons utiliser la proposition 26.93. Si n > 0, la fonction fn est méromorphe sur © 
avec un pôle simple en z = —n. Soit X compact de € et NXx tel que K € B(0, Nx). Pour 
n > Nx +1, la fonction f, n’a pas de pôle dans K et de plus pour tout z € K nous avons 


lz+n=lz-(-n)>r-ll>n-l\>n-Nx, (26.408) 


et par conséquent 


RAGIES (26.409) 


nl(n—N) 


ou pour le dire de façon plus snob : 


lfnlco,k < ren (26.410) 


dont la série converge. Cela signifie que la série Ÿ,,-1 fn converge normalement Fa N, 
donc la fonction 


Der re (26.411) 
n=0 


est une fonction méromorphe dont les pôles sont ceux des fn, c’est-à-dire les entiers négatifs 
(proposition 26.93). 


La seconde partie 


Nous allons à présent prouver que la fonction 
00 
h(z) = J et (26.412) 
1 


est holomorphe sur C. Pour cela nous considérons la fonction de deux variables f(z,t) = 
et et nous utilisons le théorème d’holomorphie sous l'intégrale 26.73. D'abord pour 20 
fixé dans € nous avons 


ee] O0 
[ Le—t4#0-1) < J et 0) 14, (26.413) 
1 1 


donc l'intégrale converge parce que c’est polynôme contre exponentielle. Par ailleurs pour 
chaque to fixé sur [0,!, la fonction z etage? est holomorphe sur € comme en témoigne 
le calcul suivant : 


- ( + 3) | (26.414) 


Et enfin si K est compact dans € nous avons 


MÉDER RES das (26.415) 


où M = max,ex R(2). Nous en déduisons que la fonction 
O0 
ze J D (26.416) 
1 


est une fonction holomorphe sur C. 


54. Définition 11.82. 
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(6) Conclusion 
Au final nous avons prouvé que la fonction l d’Euler admet le prolongement méromorphe 
sur € donné par 


I (2) = > au +f é 4 dt (26.417) 
nl(z+n) Ji ‘ ‘ 
n=0 
26.7.1 Euler et factorielle 
Proposition 26.103. 
Nous avons la formule T(n) = (n — 1)! pour tout n € N. 
Démonstration. Nous partons de la formule 
we) 
T(n) = Î era (26.418) 
0 


(26.419) 


Les termes au bord s’annulent (ici il y a un passage à la limite qui n’est pas écrit) et nous trouvons 


00 
T(n) = Î (n—1je 7% 2dt = (n—1)T(n—1). (26.420) 
0 
Pour conclure il suffit de remarquer que 
00 
Pre Î gr =sle "el (26.421) 
0 


26.8 Exponentielle et logarithme complexe 


26.8.1 Propriétés de l’exponentielle 


Proposition 26.104. 
Soit z2E C fixé. La fonction 


not: (26.422) 
t = et? : 
est CT, sa dérivée est 
E'(t) = ze. (26.423) 
La fonction E est développable en série entière (voir définition 15.133) sur R ent = 0 et 
t + 
el? = à Li (26.424) 
n= 


Démonstration. Nous fixons z € C. Par définition 18.6, la série suivante est ef : 


D nn 
_ Fun 
fo= » . (26.425) 
Cette série à un rayon de convergence infini et la fonction f est donc C® sur R. Nous pouvons la 
dériver terme à terme : 


n— 


Sa 1 re 1 t 
! —_ = 
FU à ni nt” z » es TH = 2e. (26.426) 
n—= n= 
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THOOONGOI00EECfAv 
Théorème 26.105. 
La fonction exponentielle vérifie les propriétés suivantes. 
(1) exp est holomorphe. 
IRC ET 
(3) L’exponentielle est développable en série entière, 
00 2" 
enr … (26.427) 
n=0 
et la série converge normalement sur tout compact de C. 
Démonstration. En tant que application E: R? — C, la fonction 
E(x, y) = e*(cos y + isin y) (26.428) 
est C®. De plus nous avons 
0E 
3 (x, y) = e°TY = E(x,y) (26.429a) 
x 
0E 
y 


et par conséquent la fonction Æ vérifie les équations de Cauchy-Riemann. 
Si r est fixé, par le critère d’Abel appliqué à la suite r”/n! nous savons que la série > z”/n! 
converge normalement sur le compact B(0,r). 


26.8.2 Intégrale de Fresnel 
Nous allons calculer l’intégrale de Fresnel 
00 
Î et dx = NT e-ir/a (26.430) 
0 


en suivant la démarche présentée par Wikipédia{[623]. Nous commençons par prouver que l'intégrale 
est convergente en nous contentant de justifier la convergence de 


[ sin(x?)dæ. (26.431) 
0 


Pour chaque a > 0 fixé, l'intégrale (a sin(x?)dx ne pose pas de problèmes. Le lemme 20.193 nous 
permet de passer à la limite ; nous devons donc seulement calculer 
b 
lim | sin(x?)dr (26.432) 


b—00 J, 


où a est une constante strictement positive. Nous effectuons une intégration par partie en posant 


1 1 
u = — = —-— (26.433a) 
ÿ x 
1— 2 
v' = xsin(x?) U = ), (26.433b) 


Notons que la primitive v a été choisie pour avoir v(0) = 0. Nous avons 


J “Hoi É — | J Ut, 26295 


” 2% ” 2x2 


55. Définition 12.316. 
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Pour le premier terme nous avons 


1— 2\ 70 1— 2 1— 2 1— 2 
Fe cos(x*) | _ cos(b°*) cos(a*) cos(a j: (26.435) 
b—00 2x b—00 2b 2a 2a 
C’est borné. Pour le second terme de (26.434), la fonction 
cos(x?) — 1 
un 26.436 
2x2 ( 
est majorée par la fonction 1/x? qui est intégrable entre a et 00. 
Nous allons calculer l’intégrale demandée en passant par la fonction 
fa)=e" (26.437) 


définie sur le plan complexe. Nous l’intégrons sur le chemin 7 = 1 +72 —"73 indiqué à la figure 26.1. 


FIGURE 26.1: Chemin d'intégration pour l'intégrale de FregaalrigcheminFresnel 


Ces chemins sont donnés par 


: [0,R|— C 
| (26.438) 
T 
MIE . (26.439) 
tr Re, 

3: [0,R] — C 
Al ne (26.440) 
of 


Tout d’abord la fonction f est bien holomorphe par le critère du théorème 26.2. Le calcul de 32 


se fait simplement en posant f(x,y) = e-(&+i)?, Le calcul est usuel : 


| Sage Version 4.8, Release Date: 2012-01-20 | 
| Type notebook() for the GUI, and license() for information. | 
sage: f(x,y)=exp(-(x+Ixy)*x2) 

sage: A=f.diff(x)+lx*xf.diff(y) 

sage: A.simplify_ful1() 

(x, y) |--> 0 


Nous avons donc 


R 7/4 | : R u E 
0 = Î Î = Î e#at+ | e Re Rieïtdt +| ete rad, Be 
Ÿ 0 0 0 
EE ———_— ————— ———, —— 
T1(R) L(E) 13(R) 
L'intégrale est nulle pour tout À en vertu de la proposition 26.10. L'intégrale 1; est une gaussienne 
et nous avons 


a AU = NT (26.442) 
R—00 2 
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par l'exemple 14.300. Nous montrons maintenant que lim 4 [12(R)| = 0%. D'abord nous majo- 
rons en prenant la norme puis nous effectuons le changement de variables uw = 24 : 


r/4 
|Db(R)| < Î he ee (26.443a) 
0 
7/2 
= . | e7 À? cos(u) y. (26.443b) 
0 


Nous savons que le graphe du cosinus est concave : il reste au dessus de la droite que joint (0,1) à 
(3,0). Du coup cos(u) > 1— £u et par conséquent 


e7 À? cos(u) < e- Ru) — ePCŒu-1) (26.444) 
Nous effectuons l'intégrale 

m/2 2 

I (R) < : Î ePeEugy (26.445a) 
0 
R _R2 T 2R2u/r n/2 
— R?2 

= = =  _ (26.445c) 


et nous avons bien limp_,+ [12(R)| = 0. Nous passons à la troisième intégrale. En tenant compte 
que eT/? = j, nous avons 


R . 
B(R) = - Î en eir/Aqe (26.446a) 
0 
=. ir 26.446b 
3 [ re ) 


Les 
ns D. (26.446c) 
V2 Jo 


En passant à la limite R — 0, de l'équation (26.441) il ne reste que 


= ee dt, (26.447) 


2 V2 


v2 = |: 


0 


ce qui signifie que 


O0 
| en ege = V2 LE VTe-inna, (26.448) 
; 21+Ù 2 


26.9 Théorème de Weierstrass 
ThoArYtQ0 


Théorème 26.106 (Théorème de Weierstrass[625]). 
Soit (fn) une suite de fonctions holomorphes sur un ouvert Q de © que nous supposons converger 
uniformément sur tout compact vers f. Alors f est holomorphe sur ( et pour tout k nous avons 


or) (26.449) 


uniformément sur tout compact. 
Dit en peu de mots, la limite uniforme d’une suite de fonctions holomorphes est holomorphe, 
et on peut permuter la limite avec la dérivation. 


56. Il y a moyen de démontrer cela via le lemme de Jordan{624]. Nous donnons ici une démonstration moins 
technologique. 
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Démonstration. Chacune des fonctions f, étant holomorphes, si a € Q et r est tel que B(a,r) € Q, 
nous avons par la formule de Cauchy 26.59 : 


RQ =] OP? (26.450) 
27 JoB(ar) Ë — Z 

pour tout z dans un boule B(a, p) incluse dans B(a,r). Étant donné que le cercle 4B est compact, 

elle y est majorée par une constante M. Montrons que de plus nous pouvons choisir M de telle façon 

à avoir | fn(£)| < M pour tout n et tout £ en même temps. D'abord nous utilisons la continuité de 

la limite f sur le compact 0B pour poser À = max,e<5p |f(2)|. Ensuite nous considérons un € > 0 

et N tel que | fn — flop < € pour tout n > N. Nous savons maintenant que 


{| fa(8)l tel que n > N,£e 0B} (26.451) 
est majoré par À + e. Nous posons enfin 
Pnbne | fn(2)|, (26.452) 


et alors le nombre M = max{A + €, B} majore |f,(£)| pour tout n et tout £ € OB. 

De plus pour tout £ € 0B et pour tout z dans la petite boule, nous avons [£ — z| > r — p, 
donc la fonction dans l'intégrale est majorée par une constante ne dépendant ni de n ni de €. Nous 
pouvons donc permuter l'intégrale et la limite sur n : 


J(2) = : ] JC) (26.453) 


2in °B Ë —.Z ‘ 
Cela implique que la fonction f est holomorphe par le corolaire 26.63. 
Nous voudrions maintenant parler des dérivées des f, et de f. Pour cela nous voulons permuter 
l'intégrale et les dérivées, ce qui est fait au corolaire 26.75 : 


k 1 J(w) 
fe = . Wide (26.454) 
Nous voulons la convergence sur tout compact contenu dans l’ouvert (. Pour ce faire, nous allons 
considérer un compact K € ( et prouver la convergence uniforme dans toute boule de la forme 
B(2;,r) avec 9 € K et B(20,r) € Q. Pour chaque tel couple (z0,r), nous aurons un N{,,7) € IN 


tel que sin 2 Nr), 


LEE — FO < € (26.455) 


Vu que ces boules B(20,r) forment un recouvrement de K par des ouverts, nous pouvons en retirer 
un sous-recouvrement fini et prendre, comme N, le maximum des N{,,,) correspondants. Pour ce 
N nous aurons 


LA — FOX < €. (26.456) 
Au travail! 
Pour z € B(20,r) nous considérons r” > r tel que B(20,r/) € { et nous avons 
1 Jn(€) — (6) 
FD C2) — FO (2) = | — J CE 26.457a 
Fe MOEEL (26.457) 
1 La) — F(6)1 
£< — = ——— dé. 26.4 
= Lu ETES £ (26.457b) 
Nous avons pris ce r” de telle manière que |£ — z| soit borné par le bas par |r — r’/|; sinon la 


majoration que nous venons de faire ne marche pas. Etant donné que f, — f uniformément, nous 
pouvons considérer n assez grand pour que le numérateur soit plus petit que € indépendamment 
de & et de z. Donc pour un n assez grand, 
27r’ 
Da) = FO (2) ET 26.458 
INC ENCRES SES (26.458) 


, k 
pour tout z € B(20,r). Donc nous avons convergence uniforme ff LE f%) sur cette boule. Par 
l’argument de compacité donné plus haut, nous avons la convergence uniforme sur tout compact. 
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26.10 Analyse complexe en plusieurs variables 


Définition 26.107 ([626]). 
Nous définissons le polydisque centré en a € C" et de « rayons » r € C" par 


D(a,r) = {53e C tel que |; —a;l <r;Nj=1,...,n}. (26.459) 


Définition 26.108. 
Pour une fonction f: ©" — €”, nous notons 


0 if 0 _@ 
a 2 (Æ 3) de (26.460) 


Définition 26.109 ([626]). 
Soit un ouvert®" D dans C”. Nous disons que f: D — © est holomorphe si 

(1) f est continue sur D, 

(2) pour tout ze D et pour tout 1 < j < n, le nombre (2) existe et est fini. 
Définition 26.110 ([627]). 
Soient des ouverts B1 et B2 dans C”. Nous disons que f: B1 — B2 est biholomorphe si 

(1) f est holomorphe, 

(2) f est une bijection entre B1 et B>, 

(3) f-! est holomorphe. 

THOooONBGZooHuGtxW 

Théorème 26.111 (Inversion locale, version holomorphe). 
Soient des ouverts B1 et B2 dans C”. Nous considérons une fonction holomorphe f: B1 — Be. 
Soit z0 € B1 et wo = f(20). 1 y a équivalence entre 


(1) det(df;) # 0 


(2) Il existe un voisinage U de z0 dans B1 et V de wo dans B2 tels que la restriction f: U — V 
est biholomorphe. 


26.10.1 Inverse de fonctions analytiques 
THOooXWCSooLSPzhO 


Théorème 26.112 ([628]). 
Une fonction analytique admet un inverse local analytique. 


57. La topologie sur C” est celle de la norme définie en 10.107. 
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Chapitre 27 


Analyse fonctionnelle 


27.1 Théorème d’isomorphisme de Banach 

ThofQShsw 
Théorème 27.1 (théorème d’isomorphisme de Banach{629]). 
Une application linéaire continue et bijective entre deux espaces de Banach est un homéomor- 


phisme |. 


Démonstration. Soit une application linéaire bijective et continue f : E — F entre deux espaces de 
Banach. En particulier elle est surjective, et le théorème de l’application ouverte 11.148 s'applique : 
f est une application ouverte. 

Vu que f est bijective et ouverte, la proposition 11.144 implique que f—! est continue. L’appli- 
cation f est donc continue d’inverse continue. Elle est donc un homéomorphisme. 


ii Avertissement /question au lecteur !! 27.2 

Il est donné dans /630] un exemple d'application linéaire et bijective dont l'inverse n’est pas conti- 
nue. Si un jour vous le mettez au propre, faites-m'’en profiter en m'’envoyant une photo de votre 
feuille. 


27.2 Théorème d’Ascoli 


PropDGsPtpU 


Proposition-Définition 27.3 (Application compacte[401]). 
Soient E et F deux espaces vectoriels normés sur R ou © et une application f € L(E,F). Les 
propriétés suivantes sont équivalentes. ITEMooAFNXooUCbZsh 


2 ), 4 . 2 
(1) L'image d’un borné de E par f est relativement compacte” dans F. TtenJTkpUbLii 


(2) L'image par f de la boule unité fermée est relativement compacte dans ÊTEMooQKISooBpyyee 


(3) Si (tn) est une suite bornée dans E, alors nous pouvons en extraire une sous-suite (x,,(»)) 
telle que Yn = Fort) converge dans F'. 


Une application vérifiant les conditions équivalentes de la proposition 27.3 est dite compacte. 


Démonstration. En trois parties. 
(1) (1) = (2) La boule unité fermée est bornée, et donc son image est relativement compacte. 


(2) (2) = (3) Soient (x») bornée dans E, et soit M, une borne. Nous avons donc 


mn = f (55) € (80,9) € F(80, 0). (27.1) 


1. Définition 7.37. 
2. Relativement compact, définition 7.80. 


2085 


2086 CHAPITRE 27. ANALYSE FONCTIONNELLE 


Par hypothèse, la partie f(B(0,1)) est compacte; la suite (z,) est contenue dans ce compact. 
Nous en déduisons que (z,) admet une sous-suite convergente. Soit donc w: N — N telle que 


f (2) so: (27.2) 


Vu que f est linéaire, nous avons aussi f Ces) — My. 


(3) (3) = (1) Soit une partie bornée À de F. Nous devons prouver que f(A) est compact. 


Pour cela nous considérons une suite (y,) dans f(A). Soit e; — 0. Pour chaque n, l'élément 
yn est dans la fermeture de f(A), c’est-à-dire qu’il existe un élément de f(A) dont la distance 
à Un est plus petite que e,. Bref, il existe une suite (x,) dans À telle que 


| (@n) — nl < &k. (27.3) 


La suite (x,) est bornée parce qu’elle est contenue dans A. Donc il existe une sous-suite 
w: N — N telle que 


(rot) — y (27.4) 


pour un certain y € f(A). Le fait que y soit dans f(A) est dû au fait que la suite nr f(x») 
est une suite dans f(A) ; donc la limite est dans la fermeture de f(A). 


Nous avons 


+ | f(Gotn)) — vl — 0. (27.5b) 


lon) — Y] 


INA 


Donc la suite (Y(n)) converge vers y € f(A). Nous avons montré que toute dans f(A) 


possédait une sous-suite convergente dans f(A). Le théorème de Bolzano-Weierstrass 7.136 
conclut que f(A) est compact et donc que f(A) est relativement compact. 


ThoKRbtpah 
Théorème 27.4 (Théorème d’Ascoli[631]). 
Soient un espace topologique compact K et un espace métrique (E, d). Nous considérons la topologie 
uniforme sur CU(K,E). Une partie A de C(K,E) est relativement compacte si et seulement si 
les deux conditions suivantes sont remplies : 


(1) À est équicontinu”, 
(2) Vx € K, l’ensemble { f(x) tel que f € A} est relativement compact dans E. 


La version suivante du théorème de Banach-Steinhaus est énoncée de façon ad hoc pour fonc- 
tionner avec l’espace Z(K) des fonctions de classe C'? à support dans le compact K. Un énoncé 


un peu plus fort est donné dans le cadre des espaces de Fréchet dans [230]. 
ThoNBrmGIg 


Théorème 27.5 (Banach-Steinhaus avec des seminormes|1]). 

Soit (E,d) un espace vectoriel métrique complet dont la topologie est également* donnée par une 
famille P = {p;}hier de seminormes. Soit {T,}acA une famille d'applications linéaires continues 
Th: E —R telles que pour tout x € E nous ayons 


sup [Ta(x)| < 00. (27.6) 
oEA 


Alors il existe une constante K° > 0 et un sous-ensemble fini J € 1 tels que pour tout x € E et 


pour tout & € À nous ayons  . 
(Ta(æ)| < K max p;(2). 077) 


3. Définition 7.302. 
4. Au sens où les ouverts sont les mêmes. 
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Démonstration. Pour chaque k € N\{0} nous posons 


Qx={xe E tel que sup |Ta(x)| > k}. (27.8) 
QE A 


Ces ensembles sont des ouverts (pour la même raison que dans la preuve du théorème 11.139) et 
leur union est E en entier parce que par hypothèse sup, 1 ITa(x)| < 0. 


(1) Les (; ne sont pas tous denses Le théorème 7.351 nous dit que (E, d) est un espace de 
Baire. Supposons que les (4 sont tous denses. Dans ce cas, l'intersection des Q} est également 
dense (c’est la définition 7.349 d’un espace de Baire), et en particulier non vide. 


Soit to € (en x. Nous avons 
sup [Ta(xo)| = 0, (27.9) 
aEA 


ce qui contredirait l’hypothèse. Donc les Qz ne sont pas tous denses. 


(2) Un non dense Soit ko € N* tel que (4, n’est pas dense dans E. Il existe donc x0 € E et 
un ouvert © autour de x0 n’intersectant pas (4. 


(3) Topologie 
Parlons de topologie sur E. L’ouvert © est un d-ouvert et donc un P-ouvert, lequel contient 
une P-boule ouverte ?. Cette dernière boule n’est pas spécialement une d-boule, mais c’est 
un d-ouvert. 


(4) Une majoration 


Il existe dont J fini dans Z et p > 0 tels que By(x0,p) € © et donc tels que 
BJy(x0, 0) N Go = D. (27.10) 
Donc pour tout z € By(xo, p) nous avons 


sup [T}(2)| < ko. (27.11) 
QE A 


Si maintenant y € BJ(0,p), nous avons y = (x0 + y) — xo et donc 


Ta(y)| = [Ta (ro + y) — Ta(xo)| (27.12a) 
< |Ta(xo + y)| + [Ta(xo)| (27.12b) 
< ko +C. (27.12c) 


Justifications. 
— 20 +y€ By(xo,p), donc [TA (ro + y)| < ko. 


— nous avons posé C = supue4 |Ta(to)| 


(5) Sur la boule unité En divisant par p, pour y € By(0,1) nous avons 
IT (u)| < p7 "ko + C). don ne 


(6) Un bon élément dans la boule unité Pour n'importe quel x € E nous avons 


T 


a by). DA 
ee à J(0,1) (27.14) 


Nous pouvons donc appliquer (27.13) à cet élément : 


A 
D l<e EC k 27.15 
Re (nel "6 +0) er15 


Utilisant encore la linéarité de 7°, nous trouvons ce que nous devions trouver : 


(Ta(x)| < 


ax p;(æ)p (ko + C) = K max p;(x) (27.16) 
jeJ jeJ 


en posant K = p=1(ko + C). 


5. Définition 7.327. 
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CorPGwLluz 
Corolaire 27.6 ([1, 191]). 
Soit (X, {pi}ier), un espace vectoriel sur C seminormé qui est 


(1) localement compact”, 
(2) métrisable et complet. 


Soit (T;)jen une suite d'application linéaires continues X — C telles que pour tout x € X il existe ' 
ax € © tel que 


T;z © 0%. (27.17) 

Si nous posons T'x = à; alors ItemAEOtOMLi 

(1) L'application T est linéaire et continue. ITEMooEVIXooBpaWOc 
(2) Si xx À, x, alors 

Te) — T(ax)| À 0. on 18) 


ITEMooJYOVooPIkHBo 
(3) Pour tout compact K dans X nous avons 


sup |Trx — Tax] Er. (27.19) 
aeK 
ItemAEOtOMLiii 
(4) sixx — x dans X alors 
Dir Ta. (27.20) 


Démonstration. En plusieurs parties. 


(1) Linéaire Vu que X est seminormé et que € est un corps valué, la proposition 7.332 nous 
indique que X est un espace vectoriel topologique et la proposition 7.193 nous dit que la 
limite de suite est une opération linéaire. Pour x,y € X nous pouvons donc faire 


(27.21a) 
A (27.21b) 
j—0 
= lim T;(x) + lim T;(y) (27.21c) 
700 30 
= T(x) + T(y). (27.214) 
De même nous avons 
(27.22a) 
1 (27.22b) 
j—0 
= À lim T;(x) (27.22c) 
j—c0 
= ÀT (x). (27.224) 


(2) Séquentiellement continue Nous prouvons que T est séquentiellement continue*. Soit 


une suite Ty À, x. Nous voulons utiliser le théorème de Banach-Steinhaus 27.5. L'ensemble 
{Tk}ren est un ensemble d'applications linéaires continues. De plus, si x € X, la suite & 
T,(x) est une suite convergente dans C ; elle est donc bornée : 


sup [T£(x)| < 00. (27.23) 
keN 


6. Définition 7.81. 

7. L’unicité des a; et donc le fait que tout le reste ait un sens provient de l’hypothèse de séparabilité et la 
proposition 7.57. 

8. Définition 7.199 
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Le théorème de Banach-Steinhaus nous dit qu’il existe un € > 0 et J fini dans 1 tels que 
pour tout k et pour tout x nous ayons 


IT (x)| < Casse pif) (27.24) 


Un seul à € J nous suffira. Soient donc © > 0 et i € T tels que |Tz(x)| < Cp;(x) pour tout 
x. Vu que le module est une opération continue sur €, elle commute avec la limite et nous 


pouvons faire le calcul suivant : 


Fil | lim Tk(x)| (27.25a) 
—00 

= lim |7,(x)| (27.25b) 
k— co 

< lim Cpi(x) (27.25c) 
k—00 

= Cp). (27.25d) 


Avec ça nous pouvons prouver que Test séquentiellement continue. Soit xx À, 0, En utilisant 


la proposition 7.329 nous avons : 


IT(ax)| < Opi(xx) À 0 (27.26) 


Donc |T(x4)| — 0 et T est séquentiellement continue en zéro. Vu que T est linéaire, elle est 
séquentiellement continue partout. 


(3) Continue Vu que l’espace X est métrisable, la proposition 7.245 conclut que T est continue. 


(4) Point (2) 


Nous passons à la preuve de (2). Supposons que xx À, ». Voici des majorations avec justi- 


fications juste en-dessous : 


ITk(ax) — Tax) < [Tk(rx) — Ti(x)| + [Tr(x) — T(xx)| 


Justifications : 


(27.27a) 


= [Tex — x)| + |Tk(x) — T(xx)| (27:27b) 


| | SUBEQooQLXIo PTE ) 


< Opi(re — x) + [Te(x) — T(k 

< Ce+ [T(x) — T(æx)] Re PRG 
< Ce+]|Tr(x) — T(x)| + IT (x) — T(xx)| (27.27e) 
tord SUBEQoOHSTLopyp ic 


— Pour (27.27c). C’est le théorème de Banach-Steinhaus 27.5 qui nous assure l’existence 
d'un ie I et d’une CE R* qui donne la majoration. 


— Pour (27.27d). Nous nous sommes fixé un € > 0 et nous avons pris k assez grand. Pour 


la topologie des seminormes, la convergence yy ÆS y implique la limite p;(yr — y) 5 
pour toutes les seminormes, et en particulier pour celle donnée par le théorème de 


Banach-Steinhaus. 


— Pour (27.27f). D'une part, par hypothèse et par définition de T, nous avons 7%(x) #Æ, 


T(x) et d'autre part par continuité séquentielle de T et par convergence de x4 À, % 


nous avons T(xx) se" Te): 


En prenant k encore plus grand, nous avons toutes les majorations en même temps. 


Nous avons donc bien 


Tee) — T(ax)| 0. (27.28) 


(5) Point (3) Nous nous lançons dans la preuve du point (3). En vertu du point (1), l’appli- 


cation 


Sr: K—R 


ie |Ti{e) Ta) TE 
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est continue. Vu que K est un compact, le théorème 7.138, nous indique qu'il existe xx tel 
que 
[Tr (xx) — T(xx)| = un [Tr (x) — T(x)|. (27.30) 
xE 


Nous considérons la suite 
ar = [Tk(tx) — T(xx)| (27.31) 
et nous allons montrer que 
— toutes les sous-suites convergentes de (ax) convergent vers 0. 
— la suite (ax) est contenue dans un compact de R. 
Ensuite le corolaire 7.276 terminera. 


(5a) Toutes les sous-suites convergentes Soit 4: N — N telle que la suite by; = à,,(y) 
soit convergente. Nous allons trouver une sous-suite qui converge vers 0. La suite 4 + 
a (x) est une suite dans le compact K ; elle contient donc une sous-suite convergente. Soit 
donc Ÿ: N — N telle que k + a{,y(x) Soit convergente. Nous étudions la sous-suite 


x = by(x) et nous allons prouver que cx; — 0. 


Pour ne pas mourir sous les notations, nous posons & = 04. Nous avons donc x,}) Æ, 
R À 

x, et donc |T,(4)(to(k)) — T(to(k))| — 0 par le point (2). 

Donc la suite a,,(4) qui est convergente contient une sous-suite qui converge vers 0. La 

suite &,,(x) converge donc vers 0. 


(5b) Dans un compact Nous allons prouver que |7T%(xx) — T(xx)| est bornée. Supposons 
que ce ne soit pas le cas. Pour chaque n € N, il existe un k tel que |Tz(xx) — T(xx)| > n. 
En numérotant bien, il existe une application 6: N — N telle que 


EQooRGVOooXJD 
Te eu) - Trot) > k. P53) 


La suite k+ x,,4) est une suite dans le compact X. Elle admet une sous-suite conver- 

gente. En nommant To(k) Cette sous-suite, nous avons To(k) En zx, et nous nous avons 
R 

encore Tu) (Lotk)) — T(xo(x))| #0 

Ouais mais bon. Une suite qui vérifie (27.32) ne peut pas avoir une sous-suite conver- 

gente. Contradiction. 


Point (4) Nous avons la majoration 
Fm — Tx| < ITrtk — Pre) + Try — 1]: (27.33) 


Par le point (2), le premier terme tend vers zéro. La continuité de T (point (1)) s’occupe du 
deuxième terme. 


27.3 Espaces de Lebesgue 1? 


SecVKiVIQK 


27.3.1 Généralités 


Définition 27.7. 

Soit (Q,F,u) un espace mesuré. Deux fonctions à valeurs complexes f et g sur cet espaces sont 
dites équivalentes et nous notons f — g si elles sont 1-presque partout égales. Nous notons | f| 
la classe de f pour cette relation. 


DEFooKMJQooXeaUtp 


Nous allons souvent noter f indifféremment pour la fonction f et un des représentants de la 
classe de f. Toutefois, lorsque la distinction sera importante, nous essayerons de faire faire l’effort 
de distinguer la fonction f de sa classe | f]. 
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Lemme 27.8. 
Une classe contient au maximum une seule fonction continue. 


Démonstration. Soient deux fonctions continues f1 et f2 avec f1(a) Æ fifa). Si |f1(a) — fa(a)| > Ô 
alors il existe un € tel que |f1(x) — fi(a)| > Ô pour tout x € B(a,e). En particulier f1 Æ# f2 sur 
B(a,e). Cette dernière boule est de mesure de Lebesgue non nulle: ergo f1 et f2 ne sont pas dans 
la même classe. 


DEFooTHIDooWYzBtn 
Définition 27.9. 
Pour p > 1, nous introduisons l’opération 


1/p [eJe] 00 
\fle = ( [ taNraute)) EQcoBDEX oo np 


et nous notons LP(Q, u) l’ensemble des fonctions mesurables sur Q telles que | fl < 2. 


27.10. 
Le fait que f doive être mesurable pour être dans LP est bien dans la définition de LP, et non une 
propriété qui pourrait être déduite de la finitude de l'intégrale (27.34). 

Soit ( — IR muni de ses boréliens ou même de sa tribu de Lebesgue et de la mesure de 
Lebesgue. Si À est une partie bornée non mesurable (exemple 14.153), alors nous considérons un 
borné mesurable K contenant À et la fonction 


1 sire À 
f(x) = 4-1 sire K\A (27.35) 
0 sinon. 


Nous avons alors |f| = 1x. Vu que K est borné, {,, | f| = 1(K) ne présente pas de problèmes. Donc 
f serait un élément de L!(R) sans être mesurable. 


Pour éviter cela, nous incluons la mesurabilité dans la définition de £P. 
LEMooHVZGooRwHXMk 


Lemme 27.11 (|[1]). 
L'ensemble LP est un espace vectoriel sur C. 


Démonstration. Pour rappel, nous ne considérons les choses que pour p > 1. Le fait que si f € LP, 
alors Àf € LP est évident. Ce qui est moins immédiat, c’est le fait que f + g € LP lorsque f et g 
sont dans L?. Cela découle d’une part du fait que la fonction w: x + x? est convexe sur les positifs 
(lemme 17.90), de telle sorte que 


: (ls + A) < PUal) + wUbl) (27.36) 


2 2 ’ 


ou encore 


(lal + 1b)P < 277 1(lalP + (6?) 787) 


Et d'autre part, nous savons que pour z1, 22 € C, |z1+22l < [21] + [22] (proposition 10.97(7)). Donc 


Elo KRMÉooSLHUUc 
[ \f + gldu = [ L(w) + g(w)lPdu(u) (27.38a) 
Q Q 
< | (IF) + Lao) dut (27.38b) 
<a [ (f&)1P + |g(w)l”)du(u) (27.38c) 
= opt (|fIE + gl). (27.384) 


Donc si f et g sont dans £P, alors f + g est dans £P. 
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27.12. 
Il est à noter que nous ne considérons que des valeurs p > 1, précisément parce que la fonction 
xt |x|P n’est pas convexe lorsque p < 1. 

Dans le même ordre d'idées, si p > 1, alors le qe R tel que 


=] (27.39) 


est également q > 1. Cela est important pour un certain nombres de théorèmes qui vont venir, en 
particulier l'inégalité de Hülder (27.81). 
Si vous en voulez à propos de 0 < p < 1, vous pouvez lire [632]. 


27.13. 
L'opération f — | fl, n’est pas une norme sur £P parce que pour f presque partout nulle, nous 
avons |f|, = 0. Il y a donc des fonctions non nulles sur lesquelles |.|, s’annule. 


27.14. 
Soit un espace mesuré non complet” (Q,.4,u). Il existe une partie N de mesure nulle et AC N 
non mesurable. Considérons 


2 site À 
f(x)= 41 sixe N\A (27.40) 
O0 sinon. 


Cette fonction est non nulle exactement sur N. Donc f — 0. Mais f n’est pas mesurable parce que 
f71(2) = À n’est pas mesurable. 

Il est donc possible d’être dans la classe d'équivalence d’une fonction mesurable sans être 
mesurable. Ceci est cependant un détail (presque) sans importance pour deux raisons. 


— La mesure de Lebesgue est complète par définition (définition 14.139) si nous considérons 
bien la tribu de Lebesgue et non seulement les boréliens. 


— Dans le cas des espaces de Lebesgue LP(Q, À, u), il s’agit d’un quotient de £P qui ne contient 
que des fonctions mesurables. Donc dans l’étude de £?, tous les représentants sont mesurables, 
même si ((,4,u) n’est pas complet. 


LemKZVHVAR 
Lemme 27.15. 
Si f € LP(Q) et f — g, alors ge LP(Q) et | fl, = |glp- 
Démonstration. Soit h(x) = |g(x)|? — |f(x)[P; c’est une fonction par hypothèse presque partout 


nulle et donc intégrable sur Q ; son intégrale y vaut zéro. Nous avons 


LircPaut = [ (Fr + n)au(e) = | lt Prau(. (27.41) 
(o a (o 


Cela prouve que la dernière intégrale existe et vaut la même chose que la première. 


Nous pouvons donc considérer la norme |.|, comme une norme sur l’ensemble des classes plutôt 
que sur l’ensemble des fonctions. Nous notons LP? l’ensemble des classes des fonctions de £P. Cet 
espace est muni de la norme 


IA = fs (27.42) 


formule qui ne dépend pas du représentant par le lemme 27.15. 
PROPooTYCYooAKJWOX 


Proposition 27.16. 
Soit un espace mesuré (Q, À, ji). 


(1) L'ensemble des classes LP(Q, À, u) est un espace vectoriel. 


9. Définition 14.65. 
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(2) La formule 
1/p 
IL = ( [ 11270) (27.43) 


définit une norme! sur LP(Q, A, ui). 


Démonstration. En deux parties. 


(1) Espace vectoriel Le lemme 27.11 dit que £P est un espace vectoriel. Une structure d’espace 
vectoriel sur LP(Q, À, ui) est donnée en posant 


[F1 + Lo] = [f + 9] (27.44) 


et 
1 = D] (27.45) 


qui sont deux définitions correctes parce qu’elles ne dépendent pas du choix du représentant. 
De plus le lemme 27.11 dit que f + g € LP dès que f,g € LP. Donc [f + g] € LP dès que 
[FT [9] e EP. 

(2) Norme 
Pour être une norme, il faut vérifier les trois propriétés de la définition 7.149. 
D'abord, si |[f]|n = 0, nous avons 


[ LF(æ)Pdu(x) = 0, (27.46) 


ce qui par le lemme 14.192 implique que |f(x)[P = 0 pour presque tout x. Ou encore f — 0, 
c’est-à-dire | f] = [0] au niveau des classes. 


Ensuite pour À € C et f € LP nous avons 
1/p 
lie = (T 1arcotraute)) (27.ATa) 


1/p 
= ( Î API ()Pdute)) (27.A7b) 
Q 
= |A] flo. (27.470) 


Et enfin, en suivant le calcul (27.38) nous avons 


1F + 91» < flo + 19: (27.48) 


27.17. 
À partir de maintenant (LP(Q, a), |.|,) est un espace métrique avec toute la topologie qui va avec. 
Dans la suite nous n’allons pas toujours écrire [ f] pour la classe de f. Par abus de notations 
nous allons souvent parler de f € LP comme si c'était une fonction. 
De même nous notons LP(Q) ou LP(Q,u) ou LP(Q,A,u) d’après ce sur quoi nous voulons 
insister. Mais seule la dernière notation est parfaitement correcte. 


27.3.2 Un peu de convergence de suites 
PropioywYG 


Proposition 27.18 ([633]). 
Soit 1 < p < © et supposons que la suite | f,] dans LP(Q,F, ju) converge vers [f] au sens LP. Alors 
il existe une sous-suite (h,) qui converge ponctuellement u-presque partout vers f. 


10. Définition 7.149. 


2094 CHAPITRE 27. ANALYSE FONCTIONNELLE 


Démonstration. Si p = © nous sommes en train de parler de la convergence uniforme et il ne faut 
même pas prendre ni de sous-suite ni de « presque partout ». 
Supposons que 1 < p < ©. Nous considérons une sous-suite [h,] de [f,] telle que 


IE] — [flo < 27, (27.49) 


puis nous posons ug(æx) = |[hx(x) — f(x)[?. Notons que ce ux est une vraie fonction, pas une classe. 
Et en plus c’est une fonction positive. Nous avons 


L uxdu = L Vnu(e) — (Pau) = Ve — 18 < 2 (27.50) 
® A 


Vu que u,, est une fonction positive la suite des sommes partielles de Ÿ}, uy est croissante et vérifie 
donc le théorème de la convergence monotone 14.173 : 


[ Ôs 0) du(x) = > [ ux(x)du(x) < > i F2. (27.51) 
Q \K=0 k=0 9 k=0 


Le fait que l'intégrale de la fonction Ÿ', ux est finie implique que cette fonction est finie u-presque 
partout. Donc le terme général tend vers zéro presque partout, c’est-à-dire 


[Rk(æ) — f(x) — 0. (27.52) 


Cela signifie que h; — f presque partout ponctuellement. 


Est-ce qu’on peut faire mieux que la convergence ponctuelle presque partout d’une sous-suite ? 
En tout cas on ne peut pas espérer grand chose comme convergence pour la suite elle-même, comme 


le montre l’exemple suivant. 
ExPOmxICc 


Exemple 27.19 ([634]). 
Nous allons montrer une suite de fonctions qui converge vers zéro dans LP[0, 1] (avec p < ©) mais 
qui ne converge ponctuellement pour aucun point. 

Nous construisons la suite de fonctions par paquets. Le premier paquet est formé de la fonction 
constante 1. 

Le second paquet est formé de deux fonctions. La première est 1,612] et la seconde 11,21]. 

Plus généralement le paquet numéro k est constitué des k fonctions 1j; (571, avec à = 
Sr 

Vu que les fonctions du paquet numéro k ont pour norme |f|, = & nous avons évidemment 
fn — 0 dans ZP. Il est par contre visible que chaque paquet passe en revue tous les points de [0,1]. 
Donc pour tout x et pour tout N, il existe (même une infinité) n > N tel que fh(x) = 1. I n’y a 
donc convergence ponctuelle nulle part. A 


La proposition suivante est une espèce de convergence dominée de Lebesgue pour LP. 
PropBVHXycL 


Proposition 27.20. 
Soit f € LP(Q) avec 1 < p < © et (fn) une suite de fonctions convergeant ponctuellement vers f 


et telle que |fn|l < fl. Alors fn , Ï. 


Démonstration. Nous avons immédiatement |f,(x)|[? < |f(x)|[?, de telle sorte que le théorème de la 
convergence dominée implique que fn € L?. La convergence dominée donne aussi que | fan — | fn: 
mais cela ne nous intéresse pas ici. 

Nous posons h,(x) = |fh(x)— f(x)|. En reprenant la formule de majoration (27.37) et en tenant 
compte du fait que |f,(x)| < |f(x)|, nous avons 


Ra) < 2 (late) IP + |f(x)17) < 21 (x)/P, (27.53) 
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ce qui prouve que |h,| est uniformément (en n) majorée par une fonction intégrable, donc h, est 
intégrable et on peut permuter la limite et l'intégrale (théorème de la convergence dominée 14.200) : 


lim (fn fl8= lim | f(x) - f(x)Par = J Lire He taie =. (27.54) 
700 Rd R 


n—00 d N—00 


PropRERZooYcEchc 
Proposition 27.21 ([1]). 
Soit un espace mesuré (Q, A, ui) et une fonction mesurable f: Q — € telle que 


[ FL 20 (27.55) 
Q 


pour toute partie mesurable À de mesure finie. Alors [f] = 0, c’est-à-dire que f est non nulle 
uniquement sur une partie de mesure nulle. 


Démonstration. Nous rappelons que dire que f est intégrable signifie que Re(f)*, Re(f)=, Im(f)* 


et Im(f)_ sont intégrables. 
Les parties 


{x e A tel que Re(f)*(x) € [k,k + 1[}x21. (27.56) 
et 
{x e Q tel que Re(f)"(x) € > ED. (27.57) 


sont mesurables en tant qu’images inverses de mesurables par la fonction mesurable Re(f)*. 
Nous notons {A;};en une énumération quelconque de ces parties. L'important est que 


U À; = {xe Q tel que Re(f)*(x) Z 0} (27.58) 
ieN 
et que pour chaque à, il existe a; > 0 tel que Re(f)*(x) > «; pour tout x dans À. 
Par hypothèse nous avons ls f1la,du = 0. En particulier, 


0 = | Re(fla)* = [ Re ota cute) (27.59) 
(o o 


Mais pour tout x € À; nous avons Re(f)*(x) > «; > 0, donc 


0 = [ AR) OT DE [ 0 (27.60) 
Q Q 


Vu cet encadrement par zéro, nous avons @;{(A;) = 0 et donc y{(A;) = 0 pour tout 1. 
Nous en déduisons, par union dénombrable de parties de mesures nulles, que Re(f)* est non 
nulle seulement sur une partie de mesure nulle. 
Le même raisonnement pour Re(f), Im(f)* et Im(f)= donne que f est non nulle sur une 
partie de mesure nulle. Donc f = 0 au sens des classes dans ZP. 


27.3.3 L’espace L°” 
SUBSECooYFJTooBqrLXv 


Il n’est pas possible de définir le supremum d’une fonction définie à ensemble de mesure nulle 
près parce que toute classe contient des fonctions qui peuvent être arbitrairement grandes en 
n'importe que point. Nous cherchons alors à définir une notion de supremum qui ne tient pas 


compte des ensembles de mesure nulle. 
DEFoo1Q00ooLpJBqi 


Définition 27.22. 
Soit f:Q — C. Un nombre M est un majorant essentiel de f si 


u(|f(x)| > M) = 0. (27.61) 
Nous posons alors 


No(f) = inf{M tel que | f(x)| < M presque partout}. (27.62) 
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Cela revient à prendre le supremum à ensemble de mesure nulle près. 
DEFooXUKHooXYrlYq 


Définition 27.23. 
Nous définissons alors les espaces de Lebesque correspondants : 


L(Q)={f:Q — C tel que No (f) < }, (27.63) 
et L® en est le quotient usuel. 


27.24. 
Le point sur les notations telles qu’elles devraient être respectées : 


(1) Si f est une fonction, N,(f) est son supremum essentiel. 
(2) Si f est une fonction, | fl est sa norme supremum. Ce n’est pas la même chose que N,(f). 


(3) Si[f] est une classe de fonctions (pour l'égalité presque partout), alors |[f]]|zx est la norme 

de cette classe dans L®, c’est-à-dire |[f]|Le = N,(f) où f est un représentant. 
Le point sur les abus tolérables : 

(1) Si f est une fonction, on peut écrire | f| Lx pour N,(f). Attention toutefois que N,(f) peut 
valoir ©, alors que les éléments de L® sont sélectionnés pour être les classes des fonctions 
telles que N,(f) < co. Donc il est parfois possible, lorsque f est une fonction, de parler de 
|flze alors que | f] n’est pas un élément de L°. 


(2) Si[f] est une classe, on peut écrire N,([f]) pour |[f]lLo. 


(3) Noter f la classe de la fonction f. Attention qu’alors, écrire | fl n’a pas de sens. 
Le point sur les abus intolérables : 

(1) Si f est une fonction, noter |f|. pour MN, (f). 

(2) Si[f] est une classe de fonctions, noter |[f]lX pour |[f]|z. 


27.25. 
Tout ceci pour dire que si fx sont des fonctions et si f est une fonction, nous avons la convergence 


ES (27.64) 


si et seulement si N,(f,— f) — 0. Cette convergence (qui se sert des abus tolérables de notations) 
est équivalente à la convergence 


Le] 2 [f1. (27.65) 


Mais ce n’est pas du tout équivalent à | fx — fx — 0. Tout au plus, il est vrai que si & € L°° (donc 
a est une classe), il existe un représentant f € a tel que | fx = |alze. 


Lemme 27.26 ([1]). 
Si fr est une suite de fonctions telle que | fx — fl — 0, alors 


fe 2 f (27.66) 
où la convergence signifie No (fr — f) — 0. 


Démonstration. Si g est une fonction nous avons toujours N,(g) < |glx. Donc 


No(fr — f) < (fr — flo — 0. (27.67) 


27.27. 
Attention toutefois que ce lemme ne signifie pas que si | fx — fl — 0, alors [fx] , [f] parce que 
nous pourrions avoir N,(f,) = © et alors [fx] n’est pas un élément de L®. 

Cela arrive par exemple pour f(x) = x et f(x) = x. Nous avons | fx — fl = 0 pour tout k, 
alors que ni f, ni f ne donnent lieu à un élément de L®. 
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Exemple 27.28. 
Même si g est bornée, nous n’avons pas spécialement |gl, = N;(g). Par exemple 


gR—R 
1 siz=—0 (27.68) 
CS 
O0 sinon. 
Cette fonction vérifie |glx = 1 mais N,(g) = 0. A 


27.3.4 Quelques identifications 


Il est intuitivement clair que ce qui peut arriver à une fonction en un seul point ne va pas 
influencer la fonction lorsqu'elle est vue dans Z?. En tout cas lorsqu'on considère des mesures pour 
lesquelles les singletons sont de mesure nulle, et c’est bien le cas de la mesure de Lebesgue. Il est 
peut-être intuitivement moins clair que l’on peut non seulement modifier le comportement d’une 
fonction en un point, mais également modifier l’ensemble de base. En voici un exemple. 


Proposition 27.29. 
Nous avons les égalités suivantes d'espaces 


LP(10, 2n[) = LP([0,2x]) = LP(51) (27.69) 


au sens où il existe des bijections isométriques de l’un à l’autre. Ici nous sous-entendons la mesure 
de Lebesgue partout |. 


Démonstration. Voici une application où le crochet dénote la prise de classe : 
D: LP(]0,27x[) — LP([0,2x]) 
f(x) sixe]0,27| (27.70) 


0 si x = 0 ou x = 27. 


[f] - la classe de f.(x) = 


(1) Bien définie Si {f] = [g] dans L?(]0,2r[) alors fe(x) = ge(x) pour tout x € ]0,27[ sauf 
une partie de mesure nulle. L’union de cette partie avec {0,2T} est encore de mesure nulle 
dans [0,27]. Les images par 4 sont donc égales dans LP([0, 2r]). 

(2) Injective Supposons que [f], [9] € L?(]0,2r{) soient tels que #([f]) = #([9]). En particu- 
lier [fe] = [ge] et donc f. = ge presque partout sur [0,27]. Vu que {0} L {27} est de mesure 
nulle, nous avons f. = ge presque partout sur [0,27[. Mais pour x € |[0,27[, nous avons 
fe(x) = f(x) et ge(x) = g(x). Bref nous avons f(x) = g(x) pour presque tout x € ]0,2x|. 

(3) Surjective Un élément de LP? ([0, 2r]) est l’image de sa restriction ... ou plutôt l’image de 
la classe de la restriction d’un quelconque de ses représentants. 

(4) Isométrie L'intégrale qui donne la norme sur LP ne change pas selon que nous ajoutions 
ou non les bornes au domaine d’intégration. 


De la même manière nous avons 
LP([0,2x[) = L?([0,2r]). (27.71) 


En ce qui concerne l'identification avec LP(S1), il faut passer par l’isométrie ©: [0,27[ — S! 
donnée par w(t) = eft, et être heureux que ce soit bien une isométrie parce qu’il faudra l'utiliser 
pour un changement de variables pour montrer que 


27 
f(b)dt = J (ais Dtde (27.72) 
0 St 


11. Vu que la mesure de Lebesgue est définie pour RŸ munie de sa tribu des boréliens (complétée), vous êtes en 
droit de vous demander quelle est la tribu et la mesure que nous considérons sur le cercle S!. 
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27.3.5 Inégalité de Young, Jensen, Hôlder et de Minkowski 


PROPooCQUBooCvtMSi 
Proposition 27.30 (Inégalité de Young[635]). 
Soient a,b > 0 ainsi que p,gq > 0 tels que 
1 1 
== =], (27.73) 
P  gq 
Alors ds a 
he + (27.74) 
P q 
Il y a égalité si et seulement si a? = bi. 
PropXISooBxdaLk 


Proposition 27.31 (Inégalité de Jensen[450]). 
Soit un espace mesuré de probabilité}? (Q, À, 1) ainsi qu’une fonction convexe f: IR — R et une 
application a: Q — R tels que a et f o a soient intégrables sur Q. Alors 


(fou) < Loco (27.75) 


Démonstration. Soient a € R et c,; le nombre donné par la proposition 17.93 : pour tout w € Q 


f(alw)) — Fa) > ca(a(w) — a). Co) 


Cela est en particulier vrai pour a = {, a du. Nous intégrons l'inégalité (27.76) sur ( en nous 
souvenant que [du = 1 : 


Lu o a)dyi — [ f(a)du > ca L a— [ a) (27.77a) 
[Le o a)dp — f(a) > ca(a — à) (27.77) 


f(a) < [Lu o @)dyu. (27.77c) 


Cette dernière inégalité est celle que nous devions prouver. 


Corolaire 27.32. 
Soit un espace mesuré de probabilité (Q, À, u) et une application a € L'(Q, y) et a € LP(Q) avec 
1<p< +0. Alors 


| | a(s)du(s)| < las. (27.78) 
Q 


Démonstration. Il suffit d'utiliser l’inégalité de Jensen sur la fonction convexe f(x) = |x|?. Nous 
avons alors 


| [ a(s)du(s)lP < L la(s)lPau(s). (27.79) 
c’est-à-dire 


IROUOE | [ POI = jaly (27.80) 


où ma norme |.|, est prise au sens de la mesure 1. 


ProptYqspT 
Proposition 27.33 (Inégalité de Hôlder{636]). 
Soit (Q,A,u) un espace mesuré et 1 < p, q < © satisfaisant : + à = 1. Si fe LP(Q), ge L1(Q), 
alors nous avons les choses suivantes : 


12. C'est-à-dire que |, du = 1. 
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ITEMooNDKPooRKdmgs 
(1) Le produit fg est dans L'(Q) et nous avons 
EqLPKoo 
\fgla < 1Flpllole: GrAT) 
ITEMooQHLPooRWWMOP 
(2) Sii+1= 1 alors 
par EqAVZoo 
\fale < flelgla OV83) 
ITEMooBOYJooRkiAqJ 


(3) Nous avons | fgl1 = |flplgla st et seulement si nous sommes dans un des trois cas suivants : 
— f = 0 presque partout, 
— g = 0 presque partout, 
— Il existe À > 0 tel que |f[P = ÀÏg]? presque partout. 


Ce qui est appelé « inégalité de Hôlder » est généralement l’inéquation (27.81). 


Démonstration. En plusieurs points. 
(1) Pour (1) Nous allons le voir comme cas particulier de (2). 


(2) Pour (2) D'abord nous supposons |g|, = 1 et nous posons 
A = {x € ( tel que [g(x)| > 0}. (27.83) 


Hors de À, les intégrales que nous allons écrire sont nulles. Nous avons 


TL OIT— pir 
Loir = | [rat (27.84) 


et le coup tordu est de considérer cette intégrale comme étant une intégrale par rapport à la 
mesure y = |g|{du qui a la propriété d’être une mesure de probabilité par hypothèse sur g. 
Nous pouvons alors utiliser l'inégalité de Jensen !? parce que p/r > 1, ce qui fait de x + |x|?/" 
une fonction convexe. Nous avons alors 


Lai < (air) oi (27.858) 
= [ LAPIgPt-0/ 1 oirau (27.85b) 
A 


: ; : p(r—4) 
La puissance de |g| dans cette expression est : q + en 


avons alors montré que 


= 0 parce que p(q — r) = rq. Nous 


| fale < [. \fPdu < |FI. (27.86) 


La dernière inégalité est le fait que le domaine À n’est pas tout le domaine (7. 
Si maintenant |g|, < 1 alors nous calculons 


9 
1 F9lr = lglalf ir < Iglal fl (27.87) 
1914 
en appliquant la première partie à la fonction EX qui est de norme 1. 


(3) Pour (3) Si f ou g est nulle presque partout, il y a immédiatement égalité. Nous supposons 
donc que f et g ne sont pas nulles presque partout et donc que | f|, et |g|, sont non nuls. 


(3a) Deux fonctions intermédiaires Nous posons 


fl 
1 2 Tole 


(27.88) 


13. Proposition 27.31. 
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(3b) Égalité préliminaire Nous avons 


1 si À Fe 1 + 
FL »J VE lie 


et de même avec g et q au lieu de f et p. Nous avons donc 


1; 1 
sJ#+sfo- 
P q 


(3c) Les équivalences Les choses suivantes sont équivalentes. 
(ci) (1f9l = |flplgla 
(8ciü) { fg =1 


(3c.ii) 
3 1F; 1 
fa- [#4 fo 
P q 
(3c.ii) 
3 JL: 1 
TEE 
D q 
(3c.üi) 
»  l: 1 
of- fluo 
P q 


presque partout. 


(27.89) 


(27.90) 


(27.91) 


(27.92) 


(27.93) 


En effet l'inégalité de Young !* dit que l’intégrante est positive partout. Pour que 
l'intégrale soit nulle, il faut que l’intégrante soit nulle; c’est le lemme 14.192. 


(c.üi) f(x)? = ÿ(x) pour presque tout x. C’est le cas d'égalité dans l'inégalité de Young. 


(3c.iii) 
LFP gl 
lle lgla 
(3c.iii) 
LP = AÏgl 


avec À — PAPAS 


(27.94) 


(27.95) 


(3d) Conclusion En lisant les implications de haut en bas, nous avons la condition néces- 
saire au cas d'égalité. Pour traiter la condition suffisante, nous supposons qu'il existe 


À > 0 tel que [f[P = A|g|7. Alors nous avons 


sie = [ir = à [lait = lg, (27.96) 
ce qui donne immédiatement À = |f|?/|g|4. Nous pouvons donc remonter les équiva- 
lences. 

RemNormuptNird 


Remarque 27.34. 


Dans le cas d’un espace de probabilité, la fonction constante g = 1 appartient à LP(Q). En prenant 


p = q = 2 nous obtenons 


lfla < 1 fl. 


Lemme 27.35. 


Lorsque I est borné nous avons L?(1) € L\(1). Si I n’est pas borné alors L?(1) € L}, (1). 


14. Proposition 27.30. 


(27.97) 


LemTLHwYzD 
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Démonstration. En effet si 1 est borné, alors la fonction constante 1 est dans L?(1) et l'inégalité 

de Hülder 27.33 nous dit que le produit lu est dans L1(1). 
Si Î n’est pas borné, nous refaisons le même raisonnement sur un compact K de 1. 
CORooIIEAooNmbkTo 


Corolaire 27.36 ([637]). 
Soit l’espace L?(1) avec I = ]0,1[ avec la mesure de Lebesgque. Si u, € L? converge vers u dans L? 
alors nous pouvons permuter l'intégrale et la limite : 


lim ] us Ï u. (27.98) 


Démonstration. Nous considérons la forme linéaire 
TL 


R 

f (27.99) 
ur u. 

I 


Elle est bien définie par l'inégalité de Hôlder |fgl1 < |fl2llgl2 appliqué à g(x) = 1 qui vérifie 
|gl2 = 1. Nous avons aussi 


T(u) < Ï bal < lui < ul (27.100) 
I 


L2(I 
où la dernière inégalité est celle de Hôlder 27.33. Bref, Test continue. Cela signifie que si uy a u 


alors T(un) = T(u). Cela est l'égalité demandée. 


ii Avertissement /question à la lectrice !! 27.37 
Dans la proposition suivante, la partie « égalité » est très personnelle. Je n’en n'ai pas trouvé de 
preuve complète. Donc soyez doublement vigilante et écrivez-moi si vous avez quelque chose à dire. 


ProplnegMinkKUpRHg 

Proposition 27.38 (Inégalité de Minkowski[638, 639, 640, 641, 642, 1]). 
Si 1 < p <œ et si f,g € LP(Q, A, u) alors TtenDHukT,Jä 
(1) 1F + 9lp < 1 fl + 19lp ITEMooGRXB0oMLRMun 


(2) Sip= 1, il y a égalité si et seulement si f(x)g(x) > 0 pour presque tout EemooQCSHooNUDytM 


(3) Si p > 1, il y a égalité si et seulement si il existe des réels positifs à, 5 pas tous deux nuls 
tels que 


af(x) = Bg(x) (27.101) 


pour presque tout x. 


Démonstration. En plusieurs points. 


(1) Pour (1) En utilisant l'inégalité |z1 + z2| < |z1| + |[z2| (proposition 10.97(7)) pour chaque 
x dans l'intégrale, de façon à pouvoir majorer 


Le) + 9) = [f(e) + (If) + PT (27.102a) 
< (IF) + lat) If) + 9) (27.102b) 
SUBEQSooGWMTooDBXSgL 


Nous mettons ça dans une intégrale et nous calculons un peu : | 
1 f + 9l5 = Î4 + gldu (27.103a) 

< J (FL + Igl) LS + 9° du SUBEQOOYCTHRO APE GS, 

= [il ge + fai gs SPPERONAEE RER 
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Lorsque p = 1, nous nous arrêtons ici parce que (27.103c) s'écrit 


\f + gl < Ju + [le = | fl + Vol. (27.104) 


Lorsque p > 1, nous devons continuer et utiliser Hôlder. Attardons nous sur le premier terme. 


. _ _ p—1 “Ts 5e 2 14 .. 15 
NE POSE da æ/ (Re 1),a=fetb=|f+g|?"", et nous utilisons l’inégalité de Hülder 


Jus + gl" = abli (27.105a) 
< |lal»|bllg (27.105b) 

1/q 
= | fl» il (|f + go)" (27.105c) 

re 

= | fl» ([u + a) (27.105d) 

(p—1)/p 
= | fl» (fu + g?) (27.105e) 
= | ff + gl (27.105f) 


Nous avons utilisé la règle de produit d’exposants et de somme d’ exposants 
Nous utilisons cette inégalité dans les deux termes de (27.103) cp nee Poe 


1 f + 9/8 < Ju + gl + J gllf + gl? (27.106a) 
< | flpl£ +9 + 1lglolf + gl (27.106b) 


Nous obtenons le résultat en divisant le tout par | f + ae 


Pour (2) Toutes les inégalités de (27.103) sont des égalités. En particulier nous avons 
celle-ci : 


J ie J (11 + lgl)du (27.107) 


Cela donne 


(+9 — |fl —]|gl)du = 0. (27.108) 


Vue l'inégalité de la proposition 10.97(7), la fonction intégrée est toujours négative. Pour que 
l'intégrale soit nulle, il faut que la fonction intégrée soit presque partout nulle : 


[(æ) + g(x)] = |f(æ)1 + 1g(x)| (27.109) 
pour presque tout x. La partie « égalité » de la proposition 10.97(7) donne alors le résultat. 


Cas d'égalité, préliminaire 


Noys SRE mencons par prouver que si f +g = 0 alors f = g = 0. Pour cela nous faisons le 
calcul D. 

ll + lglo = If + gl ee Un) 
< |1f1 + lsl] en) 
< [If], + Hal QoouzFkRaP EG 
= | flo + 1glp- (27.110d) 

Justifications : 


15. Proposition 27.33. 
16. Propositions 12.418 et 12.408(3). 
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— Pour (27.110a). L'hypothèse d'égalité dans l'inégalité de Minkowski. 
— Pour (27.110b). Intégrale de l'inégalité de la proposition 10.97(6). 
— Pour (27.110c). Inégalité de Minkowski. 


Étant donné que le premier et le dernier membre de (27.110) sont égaux, toutes les inégalités sont 
des égalités. En particulier, 


Lf + gl = |lf1 + lai. (27.111) 


En termes d’intégrales, cette égalité donne 
[1 +01 — (11 + lo = 0. ERooRYORoRGAEAL} 


L’inégalité déjà mentionnée [21 + 22[? < (|21|+|z2|)” dit que la fonction à intégrer dans (27.112) est 
partout négative. Pour que l'intégrale soit nulle, il faut donc que la fonction soit presque partout 
nulle. Autrement dit, pour presque tout x nous avons 


Lf(æ) + g(x)l = |F()| + la(a)l. FRoo RRQ ANTE 


Cette égalité nous sera utile dans la suite. En particulier, retenez que si f + g = 0 presque partout, 
alors f = g = 0 presque partout. Dans ce cas, l’égalité a. f + Bg = 0 fonctionne pour tout a et 6. 


Cas d'égalité (2), p = 1. 


() = 
L’inégalité (27.103b) est une égalité : 


J £ + PS + al — [fl lol) = 0. (27.114) 


Par la proposition 10.97(6), la fonction intégrée est presque partout nulle ou positive. Pour 
que l'intégrale soit nulle, il faut que la fonction soit presque partout nulle (lemme 14.192). 
Presque chaque x vérifie sont une des deux conditions suivantes : 


(la) [f(x) + g(x)| = 0 
(Gb) f(x) + g(æ)l — 1f(x)1— 1g(x)l = 0. 


Pour les x vérifiant la première condition, nous avons déjà vu que f = g = 0, juste en dessous 
de (27.113). En particulier, nous avons f(x)g(x) > 0 pour tout x dans ce cas. 

En ce qui concerne les x vérifiant la seconde condition, la proposition 10.97(7) montre qu’ils 
vérifient f(x)g(x) > 0. 


Pour les x dans le second cas, la proposition 10.97(7) donne f(æx)g(x) > 0. 


Bref, dans tous les cas nous avons f(x)g(x) > 0 pour presque tout x. 

(2) = 
Nous supposons que f(x)g(x) > 0 pour presque tout x. La proposition 10.97(7) (utilisée 
dans l’autre sens) dit que | f(x) + g(x)| —|f(x)| — |g(x)| = 0 pour presque tout x. L'inégalité 
(27.103b) est alors une égalité. 


Cas d'égalité (3), p > 1. 


Il y a deux sens. 


(1) =, les inégalités Nous supposons que f,g € LP(Q, A, n) vérifient | f + gl, = [fly + |glp: 
et nous allons voir ce que cela implique. Regroupons les différentes inégalités qui mènent à 


2104 CHAPITRE 27. ANALYSE FONCTIONNELLE 


Minkowski. 
If + gl = Ï 4 + gldu (27.115a) 
BE XPMY 
< Jar + lgl)1f + gl du eq. (27.103 me Brato) 
- _ BEQooUPPAooïlleVb 
< | flbf + 957 + [les + gt eq. (27.100672 00UPPARg IEEE 
< [fl] + gl8 + lalolf + 917 eq. (27.106) (27.115d) 
= (| Flr + lglo)lf + ge (27.115e) 
= |f +4} hyp. égalité. (27.115f) 


La dernière ligne est l’hypothèse d'égalité | f|, + 1gl» = |f + gl). Comme le premier et le 
dernier membre de ces inégalités sont égaux, toutes les inégalités sont des égalités. 

(2) =, première inégalité 
L’inégalité (27.115b) est une égalité : 


IT AUET EEE (27.116) 


Par la proposition 10.97(6), la fonction intégrée est presque partout nulle ou positive. Pour 
que l'intégrale soit nulle, il faut que la fonction soit presque partout nulle (lemme 14.192). 
Presque chaque x vérifie sont une des deux conditions suivantes : 


(2a) | f(x) + g(x)| = 0 

(2b) 1 f(x) + g(x)l — 1f(x)| — 1g()1 = 0. 

Pour les x vérifiant la première condition, nous avons déjà vu que af +Bg = 0 pour n’importe 
quels a et B, juste en dessous de (27.113). 

En ce qui concerne les x vérifiant la seconde condition, la proposition 10.97(7) montre qu’ils 
vérifient f(x)g(x) > 0. 

Nous avons donc déjà montré que si f et g vérifient une égalité, alors pour presque tout x, 


nous avons 


F(æ)g(x) > 0. (27.117) 


(3) =, seconde inégalité (Hülder) 


La seconde inégalité à être une égalité est (27.115c) : 


[LAS + 9P = 1 ALI + a1B (27.118) 


Il s’agit du cas d'égalité de Hôlder avec a = f, b = |f + g[P-! traité dans la proposition 
27.33(3). Nous sommes donc dans un des trois cas suivants : 

— f = 0 presque partout, 

— f + g = 0 presque partout, 

— il existe À > 0 tel que [a[P = À[b|1. 
Dans le premier cas, nous avons af — Bg avec a = 1 et 6 = 0. Le second cas donne f = g =0 
et donc af + Bg = 0 pour n'importe quels a et B (voir autour de (27.113)). 
Nous supposons donc être dans le troisième cas. Étant donné que q = p/(p — 1), nous avons 


jo = (+ gl") = 1 f + gf?, (27.119) 


et donc la contrainte est l'existence de À > 0 tel que |f[P = À|f + g/?. 


(4) =, troisième inégalité (Hôlder) 


La seconde application de Hôlder est avec a = g et b = |f + g[P-!. Nous sommes dans un cas 
d'égalité si nous sommes dans un des trois cas suivants : 
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— f+g=0 
— il existe o > 0 tel que [a[P = o|b|1. 
Encore une fois nous supposons être dans le troisième cas. Il existe donc & > 0 tel que 
[gl = olf + gl. 
(5) Petit résumé 
Nous avons prouvé l’existence de À, ao > 0 tels que 


f(x)g(x) > 0 pour presque tout x (27.120a) 
[fl = Alf + gl? (27.120b) 
IgP = olf + gf? (27.120c) 


(6) Des calculs et des cas En passant à la racine p° : 


f(x)g(x) > 0 pour presque tout x (27.121a) 
fl = s|f + gl (27.121b) 
lgl = t\f + gl. (27.121c) 


Les deux dernières égalités du système permettent d'écrire 
t\f| = stf + gl = sigl. (27.122) 


5 : - UBEQSooLKGDooQouvhili 
Nous considérons donc le système, valide pour presque tout x : P : : 


f(x)g(x) > 0 (27.123a) 
t\f(æ)| = s|g(x)| (27.123b) 


Avec la contrainte (s,t) Æ (0,0). 
Le lemme 10.99 appliqué à chaque couple f(x), g(x) donne l'existence d’une fonction réelle 
a telle que pour chaque x nous ayons un des deux cas suivants : 


— g(x) =0 
— f(x) = a(x)g(x). 
De plus a(x) € R* parce que f(x)g(x) est non seulement réel, mais également positif. 
(6a) s=0 Alors nous avons t|f(x)| = 0 et donc f(x) = 0 pour presque tout x parce que 
t Æ 0. Nous avons alors a f(x) + Bg(x) = 0 avec à = 1 et B = 0. 
(6b) sÆ0 Les points de Q se séparent en deux parties : g(x) = 0 et les autres. 


(6b.ü) g(x) £0 Dans ce cas nous avons le système 


(x) = a(x)g(x) (27.124a) 
t\f(x)| = s|g(x)|. (27.124b) 


Vu que s £ 0 et g(x) Æ O0, la dernière équation donne t|f(x)| Æ 0 et donc t £ 0 et 
f(x) # 0. 
La première équation donne a(x) = f(x)/g(x) que nous pouvons mette dans la 
secondes pour obternir : 

la(x)| = L (27.125) 


Vu que a est à valeurs dans R*, cela donne 


a(x) = (27.126) 


HU 


pour tout x tel que g(x) # 0. 
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(6b.üi) g(x) =0 Dans ce cas, le système (27.123) devient 
fe) =0: (27.127) 


Vu que s Æ 0, nous avons f(x) = 0. Donc n'importe quel choix de «a et B fait 
l’affaire pour ces points. Il n’y a pas de contraintes. 


(6c) = Nous supposons af(x) = Bg(x) pour presque tout x. Pour fixer les idées, nous 
supposons que 5 Æ 0 (sinon, refaire le raisonnement en inversant les rôles de f et g). 

En posant À = a/B nous avons 
g(x) = Af(x) (27.128) 


pour presque tout x. En passant par l’intégrale, 


LF + gl = 1 + À) flo = À + No = flo + Al Fo = Ale + TAF = lo + gl: 
(27.129) 


Le À et (1 + À) rentrent et sortent des normes parce qu’ils sont positifs. 


Dans le cas où nous n’avons pas une somme de deux fonctions mais d’une infinité paramétrée 
par y € Ÿ, nous pouvons convertir la somme de l'inégalité de Minkowski en une intégrale : 


If. (| rent) auto] < [ (f. (Fe Pdu(æ)) av(u). (27.130) 


Ce sera la proposition 27.40. 
LEMooPSBWooGLggTe 


Lemme 27.39 ([638]). 
Si (X,u) est un espace mesuré o-fini non nu 
positive k: X — ]0, 00 telle que 


IT, il existe une fonction mesurable strictement 


] kdu = 1. (27.131) 
X 


PROPooGZJZooXfZdqn 
Proposition 27.40 (Forme intégrale de Minkowski[638]). 
Soient deux espaces o-finis (X,u) et (Y,v). Si f: X x Y — © est mesurable © et si p > 1, alors 


I, (J, na) at] _ |, (| .f (eu) l'du(a)) dv(u) RASE 


De façon plus compacte : 


Tr J f(x, y)dv(y) 
Y 


< J PR 20 (27.133) 
# 


où Jy(x) = f(x, y). 
Démonstration. En plusieurs parties. 


(1) La fonction M Pour toute application mesurable g: X x Y — © nous posons 


= [IF eordnt] d(u). (27.134) 


Cette fonction a une propriété d’homogénéité : M(Ag) = AM(g) pour tout À € [0, cf. 


17. C’est à dire que u n’est pas la mesure identiquement nulle. 
18. Pour l’espace mesuré produit X x Y,u @ v. 
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(2) Si M(g) <1 Nous considérons une fonction mesurable g: X x Y — C telle que M(g) < 1. 
Soit k: Y — 10,00] une fonction donnée par le lemme 27.39, c’est-à-dire telle que fs k= T1: 
Nous posons 


8: Ÿ — [0,œ| 
1/p 27.135 
vo ([istentraute) FE 
ainsi que 
h(y) = sy) + (1 — M(g))k(y). (27.136) 


Vu que Mg) < 1 et que k > 0, nous avons l'inégalité stricte h(y) > s(y) > 0 pour tout 
y € Y. Nous avons de plus 


[ rtwartn - [ + (1 M(9)) J ei. (27.137) 
Y Y Y 
=M(g) ns 


Nous considérons maintenant la mesure p = hr (produite d’une mesure par une  . 


définition 14.205). Nous venons de montrer que c’est une mesure de probablilité. Îe esan 
PB pPzT008EDcr 
a(x) = |x|?, nous pouvons faire quelques calculs avec les justifications en-dessous : 
af latawide()) = a( [RG rte RG) d ()) (27.138) 
= a ([tséwineo dt) (27.138b) 


< [a(iate In Ja) SPRRSPARESPARES 
Y 

= [lt PRG rar) FERRER) 
Y 


(27.138e) 
Justifications. 
— Pour (27.138c). Inégalité de Jensen, proposition 27.31 
— Pour (27.138d). La fonction h est à valeurs positives; donc h = [h| et nous pouvons 


coller le À qui ressort de p avec le [h-1|?. 


Nous continuons en intégrant l'inégalité (27.138) sur X : 


[. CROTCON dyu(x) <[ If \g(æ, y)PA(y) dv (y ] du(x) (27.139a) 


[. Late, PAC) Pau(x)]dv ty) NERF 780D) 
([. tr w)aute)]) h(y)! ?dv(y) (27.139c) 


= [san de(s) (27.139) 

< hy)dé ty) SPA re 
Y 

— 1: (27.139f) 


Justifications. 


— Pour (27.139b). Les intégrales sont permutées grâce au théorème de Fibini-Tonelli 
14.294. 


— Pour (27.139e). Nous savons que h > s > 0, donc s(y}?/h(y}? < 1. 
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Au final nous avons prouvé que si M(g) < 1, alors nous avons 


[(fotewiava) aute <1 FQo0TGDMoRgE ag 


(3) La preuve proprement dite Nous considérons une fonction mesurable f: X x Y — € 
comme dans les hypothèses. Astuce : considérons 0 < t < 1 et appliquons l'inégalité (27.140) 
à g = mp f. Cela est possible parce que 


M(f})=t<i1. (27.141) 


Nous avons : 


p 
[. (Li Rare pi æ,y)lPdv(y ) du(x) < 1, (27.142) 
et donc, vu que M{f) et t sont . 


[. (h aude) dut) < 2 (27.143) 


Cette inégalité est valable pour tout t < 1 et, ô incroyable!, ce t n’est qu’à droite. Nous 
pouvons prendre la limite { — 1 dans cette inégalité !? 


[. 4 euPav() dite < M(f). (27.144) 


Et ça, c’est ce que nous devons démontrer. 


27.3.6 Ni inclusions ni inégalités 


Aucun espace LP(R) n’est inclus dans aucun autre ni aucune norme n’est plus grande qu’une 
autre (sur les intersections). Nous verrons cependant en la proposition 27.41 que de telles inclusions 
et inégalités sont possibles pour LP([0, INDE 

Nous allons un des exemples de tout ça en supposant p < q et en nous appuyant lourdement 
sur les intégrales de étudiées par la proposition 14.277. 


(D æœ rs 
La La fonction 


+ 


fU) = É si0<r<l EqXIEoRgpy0 pu 


æ 
0 sinon 


est dans LP mais pas dans 1. En effet 


1 
1 
He 
fe À er dx < © (27.146) 


parce que p < q et p/q < 1. Par contre 


PE - [2 Fr. (27.147) 
(2) LA & LP 
La fonction 
1 . 
— Sit>l 
f(x) = Ur . (27.148) 


19. Nous ne pouvons pas simplement poursuivre les inégalités en majorant t par 1 parce que le t est au dénomi- 
nateur : l’inégalité irait dans le mauvais sens. 
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est dans Z1 mais pas dans LP. En effet 


0 1 
IB= [2-0 (27.149) 
1 
alors que 
D | 
a — _— 
IIS = L afp LE < ©. (27.150) 
(3) Exemple de |f|, > |f|a 
La fonction 
1 si 0,2 
f(x) = nt [0.2] (27.151) 
0 sinon. 
Nous avons 
flo = 2? (27.152a) 
fl = 274. (27.152b) 


Mais comme p < q donc |f|y > | flo. 


(4) Exemple de |f|, < |f|s 
La fonction 


1 si Ü 
f(x) = ol (27.153) 
O0 sinon 
Alors 
i 
Lo = 57% (27.154a) 
il 
Le = 7x (27.154b) 


et donc | fl} < | flag. 


Ces exemples donnent un exemple de fonction f telle que | f|, < |f|, pour tout espace LP(I) 
et LI(I) avec I € R. Par contre l'exemple |f|, > | fl, ne fonctionne que si la taille de Z est plus 


grande que 1. Et pour cause : il y a des inclusions si Z est borné. 
PropIRDooFSWOR1 


Proposition 27.41 ([10]). 
Inclusions et inégalités dans le cas d’un ensemble de mesure finie. 


(1) Soit (Q, A, u) un espace mesuré fini et 1 < p < +00. Alors L1(Q) € LPO ESP Sri à 
(2) Si1 <p <2 et si f e L?([0,1]) alors | fly < [F2 


Démonstration. Pour la simplicité des notations nous allons noter L? pour LP(Q), et pareillement 
pour LA, Soit f € L4. Nous posons 


A = {re 0 tel que [f(x)| > 1}. (27.155) 


Étant donné que p < q nous avons |f[P < |f|? sur A; par conséquent f41/[? converge parce que 
41/17 converge. 

L'ensemble A° est évidemment borné (complémentaire dans Q) et sur A° nous avons |f(x)| < 1 
et donc |f[P < 1. L'intégrale {,. | f[? converge donc également. 

Au final (,, | fl? converge et f e LP. 

Soit à présent f e L?; par le premier point nous avons immédiatement f € L? n LP. Soit aussi 
re R tel que . L = 1. Nous avons |f[P € L?/P, et vu que nous sommes sur un domaine borné, 
1e L'. Nous écrivons l'inégalité de Hôlder (27.81) avec ces fonctions. D’une part 


La = MAP = 15: (27.156) 


2110 CHAPITRE 27. ANALYSE FONCTIONNELLE 


D'autre part 
: p/2 
NP (Tue) =158 er15n 


Donc |f|5 < ||f|2, ce qui prouve l’assertion (2) parce que p > 1. 


Remarque 27.42. 
Nous n’avons cependant pas L2([0,1]) = L?([0,1]) parce que l’exemple (27.145) fonctionne encore : 


1 
T7 27.158 
ES ( ) 
pour æ € [0,1] donne bien 
1 
1 
| F2 = Î — = (27.159) 
0 € 
et fl» = fo 7 < © parce que 1 < p < 2. 
27.3.7 Complétude 
ThoUYBDWQX 


Théorème 27.43 (1643, 644]). 
Pour 1 < p < ©, l’espace LP(Q, À, u) est complet. 


Démonstration. Soit (fn)nen une suite de Cauchy dans L?. Pour tout i, il existe N; € NN tel que 
fr — filp < 27° pour tout k,! > N;. Nous considérons la sous-suite g; = fn,, de telle sorte qu’en 


particulier _——. 
gi — gi-1lp < 274. PET) 


Pour chaque j nous considérons la somme télescopique 


j 
9j = 90 + DC — ÿi-1) (27.161) 
i=1 
et l’inégalité 
j 
1951 < Igol + D 1gi — gl. (27.162) 
i=1 
Nous allons noter | 
j 
EqSomP 
hj = |gol + D, Igi — gl. aSonr arf 0) 
i=1 


La suite de fonctions (h;) ainsi définie est une suite croissante de fonctions positives qui converge 
donc (ponctuellement) vers une fonction h qui peut éventuellement valoir l’infini en certains points. 
Par continuité de la fonction x + x? nous avons 


lim h? = h, (27.164) 


Jo 


puis par le théorème de la convergence monotone (théorème 14.173) nous avons 


Jo 


lim hFdp = [ h?dy. (27.165) 
a (o 


Utilisant à présent la continuité de la fonction x > æ!/P nous trouvons 


lim (| n?) De (fur) LA (27.166) 
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Nous avons donc déjà montré que 


1/p 
im Vi = (far) (27.167) 
j—0 


où, encore une fois, rien ne garantit à ce stade que l'intégrale à droite soit un nombre fini. En 
utilisant l'inégalité de Minkowski (proposition 27.38) et l’inégalité (27.160) nous trouvons 


J 
lise < Ileole + À lex — g6-ale < vole +1. (27.168) 
i=1 
En passant à la limite, 
1/p 
( 1 nr) = lim lbs < lobe +1 < &. (27.169) 


Par conséquent (|h|? est finie et 


he LP(Q, À, p). Fas Ra, 


En particulier, l’intégrale {A est finie (parce que p > 1) et donc que A(x) < © pour presque tout 
red 
Nous savons que h(x) est la limite des sommes partielles (27.163), en particulier la série 


00 
loi — gi (27.171) 
j=1 


converge ponctuellement. En vertu du corolaire 14.202, la série de terme général g; — g;_1 converge 
ponctuellement. La suite g; converge donc vers une fonction que nous notons g. Par ailleurs la suite 
gi est dominée par h € L?, le théorème de la convergence dominée (théorème 14.200) implique que 


Jim Îgs — glp = 0. (27.172) 


Nous allons maintenant prouver que lim»_,% | fn — 9] = 0. Soit € > 0. Pour tout n et 4 nous avons 


ln — 9lp = ln — fn: + Êni — 9lp < fn — Énilo + VPN: — 9. (27.173) 


Pour rappel, fn, = gi. Si à et n sont suffisamment grands nous pouvons obtenir que chacun des 
deux termes est plus petit que €/2. 

Il nous reste à prouver que g € LP(Q, A, 1). Nous avons déjà vu (équation (27.170)) que h € LP, 
mais |g;| < h?, par conséquent g € LP. 

Nous avons donc montré que la suite de Cauchy (f,) converge vers une fonction de LP, ce qui 
signifie que L? est complet. 


ThoGVmqÜro 
Théorème 27.44 (Riesz-Fischer[103, 645]). 


Soient un espace mesuré (Q, À, u) et pe [1,0]. Alors TtenPDnj0Jzi 


(1) Toute suite convergente dans LP(Q, À, u) admet une sous-suite convergente presque partout 
sur 1. ItemPDnjOJzii 


— ’ en _. ÿ 
(2) La sous-suite donnée en (1) est dominée par un élément de LP(Q, A, n). TtemPDnjOJzi ii 


(3) L'espace LP(Q, À, un) est de Banach. 


Démonstration. Le cas p = © est à séparer des autres valeurs de p parce qu’on y parle de norme 
uniforme, et aucune sous-suite n’est à considérer. 
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Cas p = 00. Nous commençons par prouver dans le cas p = . Soit (f,) une suite de 
Cauchy dans L°(Q), ou plus précisément une suite de représentants d'éléments de LP. Pour 


tout k > 1, il existe N4 > 0 tel que si m,n > Nz,ona 
1 
fm — fn < +: (27.174) 


En particulier, l’ensemble E% sur lequel 


La) ol > (27.175) 


est de mesure nulle. D’après le lemme 14.27, la partie E = UJ,-.N Ex, est encore de mesure 
nulle. En résumé, nous avons un N, tel que si m,n > Ny, alors 


LC) — fn ()l < Z Eggs 


k 


pour tout x hors de Æ. Donc pour chaque x € Q\E, la suite n + f(x) est de Cauchy dans 
R et converge donc. Cela définit donc une fonction 


J:A\E —R 

oc ) (27-177) 
n—>00 

Cela prouve le point (1) : la convergence ponctuelle. 

En passant à la limite n — 0 dans l'équation (27.176) et tenant compte que cette majoration 

tient pour presque tout x dans (, nous trouvons 


1 f — fnlo & - (27.178) 


Donc non seulement f est dans L®, mais en plus la suite (f,) converge vers f au sens L®, 
c’est-à-dire uniformément. Cela prouve le point (3). En ce qui concerne le point (2), la suite 
fn est entièrement (à partir d’un certain point) dominée par la fonction 1 + |f| qui est dans 
EL; 

Cas p < w. 

Toute suite convergente étant de Cauchy, nous considérons une suite de Cauchy (f,) dans 
LP(Q) et ce sera suffisant pour travailler sur le premier point. Pour montrer qu’une suite de 
Cauchy converge, il est suffisant de montrer qu’une sous-suite converge. Soit 6: N — IN une 
fonction strictement croissante telle que pour tout n > 1 nous ayons 


1 
M fo(n+1) — fotnlr < on (27.179) 


Pour créer la fonction 6, il est suffisant de prendre le N4 donné par la condition de Cauchy 
pour e = 1/2Ÿ et de considérer la fonction définie par récurrence ?° par @(1) = M et w(n+1) > 
max{N,,v(n)}. Ensuite nous considérons la fonction 


A3 


Ont) = > four (x) — fou (r)l. (27.180) 


k 


1 


Notons que pour écrire cela nous avons considéré des représentants fL, qui sont alors des 
fonctions à l’ancienne. Etant donné que g, est une somme de fonctions dans LP, c’est une 
fonction LP, comme nous pouvons le constater en calculant sa norme : 


n 


es: À 
9n lo < » ls fo) Ip < 2 9 < 


k=1 


1 
7 © 1 (27.181) 


iLs 


20. Utilisation du théorème 1.47. Vous n’êtes pas obligée de le citer à chaque fois, mais c’est bien de garder en tête 
que la définition de fonctions par récurrence n’est pas quelque chose de complètement trivial. 
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Étant donné que tous les termes de la somme définissant g, sont positifs, la suite (9n) est 
croissante. Mais elle est bornée en norme L? et donc sujette à obéir au théorème de Beppo- 
Levi 14.173 sur la convergence monotone. Il existe donc une fonction g € LP(Q) telle que 
In — g presque partout. 


WTHojC 
Soit un x € Q pour lequel g,(x) — g(x); alors pour tout n > 2 et Vq > 0, 0, F4 Su 


qg—1 qg—1 
Loto) — foto = l'orrp(e) + À fotnp() D fotne(2) — fon)(2)| (27:1822) 
k=1 1 


k= 
——_—_—_—_—_—_—, — 
=) =) 
q q 
= Sfr) — D fotnk-n(r) (27.182b) 
k=1 k=1 
q 
- Lfotns) (x) = latritd (x) (27.182c) 
k=1 
= Qn+qa+1(t) — Jn+1(x) (27.1824) 
< g(t) — n+1(r). (27.182) 
Nous prenons la limite n — %; la dernière expression tend vers zéro et donc 


pour tout q. Donc pour presque tout x € Q, la suite n + f,{(n)(x) est de Cauchy dans R et 
donc y converge vers un nombre que nous nommons f(x). Cela définit une fonction 
J:A\E—R 


(27.184) 


où E est de mesure nulle. Montrons que f est bien dans LP(Q); pour cela nous complétons 
la série d’inégalités (27.182) en 


Lotto (e) — fon) (t)] < 9x) — gn-1(x) < g(x). (27.185) 


En prenant la limite q — © nous avons l’inégalité 


HO OIETO FE 180) 


pour presque tout x € (, c’est-à-dire pour tout x € Q\Æ. Cette inégalité implique deux choses 
valables pour presque tout x dans Q : 


f(x) € B(g(x), fotr(æ)) (27.187a) 
Jen) < 1f(æ)1 + 1g()|. (27.187b) 


La première inégalité assure que |f|P est intégrable sur Q\Æ parce que |f| est majorée par 

gl + nl. Elle prouve par conséquent le point (1) parce que n + fn est une sous-suite 
g(n) g(n) 

convergente presque partout. La seconde montre le point (2). 

Attention : à ce point nous avons prouvé quen > f,{n) est une suite de fonctions qui converge 

ponctuellement presque partout vers une fonction f qui s’avère être dans LP. Nous n’avons 

pas montré que cette suite convergeait au sens de LP vers f. Ce que nous devons montrer est 


que 
1 — folle — 0. Ent 


L’inégalité (27.186) nous donne aussi, toujours pour presque tout x € Q : 


fe) — fon)? < g(x)? (27.189) 
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ce qui signifie que la suite ?! | f — fon |? est dominée par la fonction |g|/? qui est intégrable sur 
Q\E et tout autant sur Q parce que E est négligeable: cela prouve au passage le point (2), 
et le théorème de la convergence dominée de Lebesgue (14.200) nous dit que 


du [A — fade = | im, 14 — fo (o)lde = 0. (27.190) 
Q Q 
Cette dernière suite d’égalités se lit de la façon suivante : 
dm lf— flo = | inf - fol, = 0. (27.191) 


Nous en déduisons que la suite n + f,,(,) est convergente vers f au sens de la norme ZP(Q). Or 
la suite de départ (f,) était de Cauchy (pour la norme Z?) ; donc l’existence d’une sous-suite 
convergente implique la convergence de la suite entière vers f, ce qu’il fallait démontrer. 


Le théorème suivant est souvent cité en disant que L? est un espace de Hilbert si et seulement 
si p = 2. Comme vous le voyez, il faut un peu plus d’hypothèses. 

Je précise que je suis le seul à nommer ce théorème par le nom de Weiïinersmith. Je ne sais pas 
si il a déjà un nom; alors pourquoi pas celui-là plutôt qu’un autre ? La raison de ce choïx est dans 


la constante de Weiner, définition 44.1. 
THOo0oCCMBooGulxkQ 


Théorème 27.45 (Théorème de Weinersmith[646, 647]). 
Nous considérons un espace mesuré (Q, À, u) ainsi qu’un nombre p € [1,0]. Nous supposons 


(1) LP(Q,A,u) est un espace de Hilbert, 


(2) Il existe des parties À, B € IP(Q,A,u) telles que An B = G et 0 < (A) < © et 0 < 
LCD) So 


Alors p = 2. 


Démonstration. Vu que LP est un espace de Hilbert (hypothèse), il vérifie l'identité du parallélo- 
gramme de la proposition 11.17, c’est-à-dire 


L£ + al2 +1 — 9/2 = 21F12 + 21e. FAR RE) 


(1) Pour 1 < p < © 
Soient donc À, B comme dans l'hypothèse. Nous considérons les fonctions 


1 
1 


En ce qui concerne les normes Z? de f et g, c’est un calcul simple : 


= (fire) = (ft) Le (27.194) 


De même pour g : | f|5 = [gl = 1. Donc 
21fl5 + 219l5 = 4 (27.195) 


En ce qui concerne la somme, 


2/p 
If+9t = (T, ne * Î, 18) . CES 


21. À ce point, [103] se contente de majorer |f,(,)(x)| par |f(x)| + |g(x)|, mais je ne comprends pas comment cette 
majoration nous permet d'utiliser la convergence dominée de Lebesgue pour montrer (27.188). 
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Pour la différence, la seule subtilité à voir est que 


[ia-20r = | Aa-1nP+ | Aa-1s = | al | -121= | ia | 18. (27.197) 
( A B A B A B 


Ce n’est pas de la magie que le moins se change en plus. Bref, pour la différence nous avons 


2/p 
2 : ” : 
LES (I, JC) — at jan) (27.198a) 
il 1 2/p 
| (I, ae AU) Ti 8 wPdu) (27.198b) 
1LA(w) ; 1g(w) : 2/p 
: ([, TE ” [, 1 By ) (27.198c) 
_. (27.198d) 


Donc ||f + g[2 + |f — glé = 2 x 2#P. 
Vu que LP est un espace de Hilbert, nous avons finalement 


4=2x22P, (27.199) 


Cela est uniquement valable pour p = 2. 


(2) Pour p=c Il suffit de prendre f = 14 et g = 18. Nous avons alors |f{f = |g{£ = 
1f + 9l£e = 1 gl£e = 1. 
L'égalité (27.192) devient 2 = 4, ce qui est faux. 


Si (0,4, u) est un espace mesuré, est-ce que LP(Q, À, ui) est assuré de n'être pas de Hilbert ? 
Non. 


Exemple 27.46 ([647]). 
Soit la mesure de Dirac sur R, c’est-à-dire 


O0 sinon. 


6(A) = Ü er (27.200) 


Nous allons prouver que pour tout p € [0,w|], l’espace LP(R, Bor(R), 6) est un espace de Hilbert. 
Pour cela nous introduisons le produit hermitien 


(f,g) = f(0)g(0). (27.201) 
Nous avons par ailleurs la norme 
IF = J |f(æ)|Pdô = f(0)?. (27.202) 
R 
Donc oui, | f|h = 4/<f, f). A 


27.3.8 Théorèmes d’approximation 

PROPooUQUBooAWgNhm 
Proposition 27.47 ([135], thème 24). 
Soient 1 < p < © et un espace mesuré (Q, A, u). Alors les fonctions étagées?? dans LP(Q) sont 
denses dans LP(Q). 


22. Définition 14.109. Pour rappel, une fonction est simple lorsqu'elle prend un nombre fini de valeurs, et elle est 
étagée lorsqu'elle est en outre mesurable. 
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Démonstration. Soit f € L!'(Q, A, u). Nous supposons dans un premier temps que f: @ — [0, cf. 
Pour les fonctions à valeurs dans €, nous verrons plus bas. 

Notons que la partie {x € Q tel que f(x) = w} est de mesure nulle, donc nous pouvons vraiment 
choisir un représentant à valeurs dans [0,c0[ et non à valeurs dans [0,00] comme le serait un 
représentant un peu quelconque. 

Par le théorème 14.115, il existe une suite croissante de fonctions étagées d,: Q — [0,001 telles 
que dn — f ponctuellement. Notons que ce théorème fonctionne parce que les fonctions LP (en 
tout cas leurs représentants) sont mesurables parce que c’est dans la définition 27.9. Notre devoir 
est maintenant de prouver que sous l’hypothèse que f est dans LP, alors la convergence 9, — f 
est une convergence dans LP. 


(1) 1<p<o Vu que f et ®, sont à valeurs positives nous avons |f — 6,|? < |f[P. Mais par 
hypothèse |f|P e L!(Q). Donc la suite gn = |f — nl? est majorée (uniformément en n) par 
|f[P qui est dans L!. Le théorème de la convergence dominée permet de permuter 


in [on L Jin on = (. (27.203) 
Cela revient à dire que 
in 17-6018 = jun, [Lu = [ing 17 — ur 0, (27.204) 


LP(Q 
ce qui signifie que y AS fe 
(2) Pour p= Si f e L?(Q), alors nous pouvons prendre un représentant borné. Avec lui, 


Ille 
J. Avec cela nous avons, pour € donné, un n assez grand pour avoir 


No(Pn — f) < |Pn — flo < €. (27.205) 


nous avons Dn —> 


Si f est à valeurs dans C au lieu de [0,!, il suffit de faire valoir le travail que nous venons de 
faire quatre fois, pour les valeurs réelles, imaginaires, positives et négatives. 


27.3.9 Densité des fonctions infiniment dérivables à support compact 


Définition 27.48. 
Une fonction est étagée par rapport à L? si elle est de la forme 


N 
=) &œlr (27.206) 
1 


où les B4 sont des mesurables disjoints et 15, € L? pour tout k. 
LemWHIRdax 


Lemme 27.49. 
Si f est une fonction étagée en même temps qu'être dans LP, alors elle est étagée par rapport à 
LP, 


Démonstration. Nous pouvons écrire 


=) als (27.207) 
k=1 


où les By, sont disjoints. Par hypothèse | f|, existe. Donc chacune des intégrales [, |1,[? doit 
exister parce que les B% étant disjoints, nous pouvons inverser la norme et la somme ainsi que la 
somme et l'intégrale : 


N N N 
Le \fP = [ 5 Pr : J bits CP = » lex? [ Le, (æ)lPdx. (27.208) 


27.3. ESPACES DE LEBESGUE L? 2117 


L'ensemble C?(R4) des fonctions de classe C® et à support compact sur R% est souvent 


également noté Z(R1). 
ThoILGYXhXx 


Théorème 27.50 ([638]). 
Nous avons des densités emboitées. Ici D est un borélien borné de RŸ contenu dans B(0,r) et K 
est un compact contenant B(0,r + 2). 
(1) Les fonctions étagées par rapport à LP sur R4 sont denses dans LP(R‘). À fortiori les fonc- 
tions étagées sont denses dans LP, mais nous n’en aurons pas besoin ici. ItemYVFVrOIii 


(2) Il existe une suite fn dans C(K,C) telle que 
fa + Ip. (27.209) 
ItemYVFVrOIiii 
(3) Si À est un borélien tel que 14 € LP(R‘) *, alors il existe une suite de boréliens bornée 
(Da)nen tels que 


l5, À La: 27.210) 
ItemYVFVrOIiv 


(4) I existe une suîte w, dans D(RŸ) = C2(RŸ) telle que 


Pn © 1p. (27.211) 
ItemYVFVrOIv 


(5) L'ensemble D(R*) = C2(RŸ) est dense dans LP(RŸ) pour tout 1 < p < 0. 


Démonstration. Nous allons montrer les choses point par point. 


(1) Si f e L(R4), nous savons par le théorème 14.115 qu'il existe une suite f, de fonctions 
étagées convergeant ponctuellement vers f telle que |f,| < |f|. La proposition 27.20 nous dit 


qu'alors fn . Ï. 
La fonction f, étant étagée et dans L? en même temps, elle est automatiquement étagée par 
rapport à L? par le lemme 27.49. ItemYVFVrOIi 


(2) C’est le théorème d’approximation 14.235 appliqué au borélien D contenu dans l’espace 
mesuré K. 


(3) En vertu du point (2), il existe f e CU(K, R) telle que 
|f— 1plp & €. (27.219) 


Ensuite, par le théorème de Weierstrass, il existe w € C'°(K, R) telle que | f —w|x < €. Nous 
avons aussi 


le — fr = [. lp(x) — f(x)Pdx < H(X)le — FE < UK). (27.213) 
Quitte à prendre un @ correspondant à un € plus petit, nous avons 
le — FI < €. (27.214) 
En combinant et en passant à €/2 nous avons trouvé une fonction ÿ € C'(K,R) telle que 
lg — 1n| < €. (27.215) 


(4) Nous considérons les boréliens fermés D, = À n B(0,n). Alors 1p, € L? et nous avons pour 
n assez grand : 


J [1 (x) — 1a(x)Pdx = J [La(x)PP < e, (27.216) 
Ré R4B(0,n) 


: LP 
c’est-à-dire que 1p, — 14. 


23. Je pense que cette hypothèse manque dans [638]. En tout cas je vois mal comment je pourrais justifier les différentes 
étapes de la preuve en prenant par exemple À = R‘. 


2118 CHAPITRE 27. ANALYSE FONCTIONNELLE 

(5) Il suffit de remettre tout ensemble. Si f € LP(R4), par le point (2) nous commençons par 
prendre © étagée par rapport à LP telle que 

lo — fr < € (27.217) 


Ensuite nous écrivons © sous la forme 
N 
=) als, (27.218) 
k=1 


et nous appliquons le point (3) à chacune des 18, pour trouver des boréliens bornés D, tels 
que 
ln, — 1mlp < € (27.219) 


Enfin nous appliquons le point (4) pour trouver des fonctions wyx € C?(R4) telles que 


x — 1pilp < €. (27.220) 
Il n’est pas compliqué de calculer que 
N 
| CkOk — fl, < 2eS ch + €. (27.221) 
k=1 k 
CorFZWooYNbtPz 


Corolaire 27.51. 
Si1 < p < © alors la partie”? L?([0,1]) n L?([0,1]) est dense dans LP([0,1]). 


Démonstration. Nous savons du théorème 27.50(5) que C?([0,1]) est dense dans L?. Mais nous 
avons évidemment C® © L? An LP, donc L? n LP est dense dans LP. 


LemCU1JzkA 
Lemme 27.52 ([638, 605]). 
Soit 1<p <o et f € LP(Q). Nous notons 7, l'opérateur de translation par v : 
To: LP(Q) — LP(Q) 
(27.222) 
fees fev). 
Pour chaque f € LP(Q), l'application 
: R4— LP(Q 
TU) 2 (27.223) 
ms vCi) 
est continue en v = Ü, c’est-à-dire 
dim ro(f) — flo = ©. (27.224) 


Démonstration. Nous commençons par supposer que f est dans Z(Q), et nous verrons ensuite 
comment généraliser. 


(1) Si fe Z(Q) 
d 
Soit une suite v; EE 0, et posons f; = m;,(f); le but est de montrer que f; _— J. Pour cela, 


la fonction f — f; est également à support compact, et qui plus est, si supp(f) € B(0;r), 
alors supp(f — f;) € B(0,r + [v|), et l’ensemble 


S = B(0,r + max ||) (27.225) 


24. Nous parlons bien ici de l’ensemble L? parce que nous le considérons sans norme ou topologie particulière. La. 
densité dont nous parlons ici est celle pour la topologique de L?. 
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est un compact contenant les supports de tous les f — f;. Le maximum existe parce que 
v; — 0. Voilà qui « majore » le domaine de f — f; uniformément en 1. 
Majorons maintenant |f — f;|? de façon uniforme en 1. Soit le nombre 


M =2 max f(æ)}- (27.226) 


La fonction qui vaut MP sur $S et zéro ailleurs est une fonction intégrable qui majore |f — f;|?. 
Nous pouvons donc utiliser la convergence dominée de Lebesgue (théorème 14.200) pour écrire 


lim | f — fil = lim [ | f(x) — f(x — w)[Pdx = [ lim |f(x) — f(x — v)|dx = 0. (27.227) 
1—00 1—>00 Q Q 1—00 
(2) Pour f € LP(Q) 
Soit € > 0, f € LP(Q) et w € Z(Q) tel que |f — pl], < €. Cela est possible par la densité 
de Z(Q) dans LP(Q) vue en 27.50(5). Nous choisissons de plus |v| assez petit pour avoir 
ITu(g) — gl» < €, qui est possible en vertu de ce que nous venons de démontrer à propos 
des fonctions à support compact. De plus 7, étant une isométrie de LP nous avons |r, (4) — 
T(f)l = |ç — f| <e. Nous avons tout pour majorer : 


fm SA —e1+ le - r(L)1+ re) — RP < 3e. (27.228) 


Nous avons donc bien lims_,0 | f — r(f)| = 0. 


27.3.10 Approximation 
LempTBaUw 


Lemme 27.53 (Théorème fondamental d’approximation [419]). 
Soit ( un espace mesurable et f: Q — [0,00] une application mesurable. Alors il existe une suite 
croissante d'applications étagées @n: ® — R* dont la limite est f. 


De plus si f est bornée, la convergence est uniforme. 
ThoJsBKir 


Théorème 27.54 ([317]). 
Soit I un intervalle de R. L'espace Q(1) des fonctions continues à support compact sur T est dense 
dans L?(T). 


Ce théorème sera généralisé à tous les LP(R%) par le théorème 27.50. Cependant LP n'étant 
pas un Hilbert, il faudra travailler sans produit scalaire. 


Démonstration. Soit g € L?(I) une fonction telle que g L f pour toute fonction f e C{(1). Nous 
avons donc 


Kf:9)= [1 = 0. (27.229) 


En passant éventuellement aux composantes réelles et imaginaires nous pouvons supposer que les 
fonctions sont toutes réelles. Nous décomposons g en parties positives et négatives : g = g* — g”. 
Notre but est de montrer que g* = g—, c’est-à-dire que g est nulle. La proposition 25.15 conclura 
que C;(1) est dense dans L?(1). 

Soit un intervalle [a,b] € 1 et une suite croissante de fonctions f, € C:(1) qui converge vers 
Lab. Par hypothèse pour chaque n nous avons 


[ fn9° = Li (27.230) 


La suite étant croissante, le théorème de la convergence monotone (théorème 14.173) s’applique et 
nous avons 


b 
im not = | AE (27.231) 
n—>00 I à 
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de telle sorte que nous ayons, pour tout intervalle [a, b] € I l'égalité 
OR Le E EE 
g = | g. 7. 
De plus ces intégrales sont finies parce que 


b b 
Lot < [loi = [aitton = <lgh Han) < lglze V5 à < (27.233) 


par l’inégalité de Cauchy-Schwarz. 

Soit maintenant un ensemble mesurable À € I. La fonction caractéristique 114 est mesurable 
et il existe une suite croissante de fonctions étagées (w,) convergente vers 14 par le lemme 27.53. 
À multiples près, les fonctions w, sont des sommes de fonctions caractéristiques du type Lab], Par 
conséquent, en vertu de (27.232) nous avons 


Ï Png* = ] PnI : (27.234) 
I I 


Une fois de plus nous pouvons utiliser le théorème de la convergence monotone et obtenir 


[. g° = [. g_ (27.235) 


pour tout ensemble mesurable À € I. Si nous notons dx la mesure de Lebesgue, les mesures g*dx 
et g dx sont par conséquent égales et dominées par dx. Par le corolaire 14.229 du théorème de 
Radon Nikodym, les fonctions g* et g_ sont égales. 


27.A Convolution 
DEFooHHCMooHzfStu 


Définition 27.55. 
Pour toutes fonctions f,g: IR" — © et pour tout x e © tels que l'intégrale de droite ait un sens””, 
nous définissons 


(fx g)(x) = J J(y)g(x — y)dy. (27.236) 
R? 
L'éventuelle fonction f + g ainsi définie est le produit de convolution de f et g. 


Le théorème qui permet de dire que le produit de convolution n’est pas tout à fait ridicule est 
le suivant. 


THOooMLNMooQfksn 
Théorème 27.56 ([450, 648]). 
Soient f,g € L'(R‘). 
(1) Pour presque tout x € RA, la fonction 
hs: RC 
u (27.237) 
y g(x — y)f(y) 
est dans L'(R9). 
(2) f+ge L'(RŸ. 
(3) |Lf + gli <|flilgl1. 
Démonstration. Nous considérons l'application 
D: RŸ x R°— Rx R4 
(27.238) 


(z,y) (x — y, y). 


25. Attention divulgâchis : ce sera le cas pour f,g € L'(R") par le théorème 27.56. 
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Cela est un C!-difféomorphisme dont le jacobien vaut 


_ (Gip1)(x,y) (Od1)(x,y)\ | 1 —1\ 
Jé(x, y) = det a = det ( 1 ) =], (27.239) 


C’est une première bonne chose. 
Ensuite nous considérons la fonction 


a:RxR CC 


(x, y) + f(y)g(x). (27.240) 


Par hypothèse, pour chaque y, la fonction x + |a(x,y)| est dans L'(R4). Bref, le calcul suivant a 


[. If. alu dy = J , If. |f ator| dy (27.241a) 


R 
= J ; Lu) le tete | dy (27.241b) 
R 
= |flumolglzme SUBEAO OMR SP ee 
< 60 (27.241d) 


Le corolaire 14.296 nous dit alors que a € L(RE x R‘). Et notons au passage que 
EQooLCWNooHL 
lamens = [4 lamololuns ee) 
X 


parce que le théorème de Fubini 14.297 permet de scinder l'intégrale et de retomber sur (27.241c). 
Vu que à € L'(R4 x R), nous pouvons utiliser le changement de variable 14.290 avec l’appli- 
cation @ ci-dessus. En notant À la mesure de Lebesgue, 


= [. _ el = LE. (lal o #)|Jsldx (27.243) 
— J | lal(x — y,y)dX(x, y) (27.243b) 
Rx Rd 
= [,.,ote — ld(e 0) (272430) 
= LFiraece - wav] dr. (27.243d) 
Rd R4 


Nous avons scindé l'intégrale avec le théorème de Fubini pour la dernière étape. 
Passons à l’intégrabilité de f x g. Nous avons 


(PCIENMIOPCEP 07 te 


Or nous venons de voir que (27.244) était, en tant que fonction de x, intégrable sur IR et que 


IMPR 


Es If. | F(y)g(x — D dx = 1 [a|dA < 00. (27.245) 


Cela prouve que f + ge L'(R‘), mais en nous souvenant de (27.242), cela prouve aussi que 


[Ur otomar < | la =|flnmalelame (27.246) 
Rd RxR4 


c'est-à-dire que | f * g|12(me) < |flzi(Re) 19 Li (Ra). 
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LEMooMRWZooHjrnHD 
Lemme 27.57. 
Le produit de convolution est commutatif : pour tout f,g € L'(R4) nous avons f + g = g+ f. 


Démonstration. Le théorème de Fubini (théorème 14.297) permet d’écrire 


00 


CR ee [ an... | dmftoate - y (27.247) 
R" —00 co 


En effectuant le changement de variable z; = x; — y; dans chacune des intégrales nous obtenons 
(sata) = | (te — sde = (ax (a) (27.248) 


Attention : on pourrait croire qu’un signe apparaît du fait que z = x — y donne dz = —dy. Mais en 
Fais ay +00 ; + — co : 
réalité, l'intégrale [7% devient par le même changement de variables | 4% qui redonne un nouveau 


signe au moment de remettre dans l’ordre. 
LEMooTUMSooSmnlHc 


Lemme 27.58 ([649, 1]). 
Le produit de convolution est associatif sur L\(R4). 


Démonstration. Soient f,g,h € L'(R4). L'existence de (f + g) + h ne fait pas de doute grâce au 
théorème 27.56. Nous avons d’abord 


(CF + g) x h)(u) (fx g)(x)h(u — x)dx (27.249a) 


Rd 


= J . | . fax - du He (27.249b) 


Il 
— 


SUBEQooJ KREEgP AE 


= [. | ” F(y)g(x — y)h(u — dy dx 


Nous permutons les intégrales en suivant la procédure 14.298. Pour cela nous commençons par 
poser 
s: Rx RC 
(x,y) + f(y)g(x — y)h(u — x), 
et nous vérifions que |s| peut être successivement intégrée par rapport à y puis x. D’abord l'intégrale 
par rapport à y est 


(27.250) 


[Late - wav, (27.251) 


qui existe et qui vaut (|f|+|gl)(x) parce que |f| et |g| sont dans L'(R). D’après le théorème 27.56, 
la fonction |f|+|g| est encore dans L'(RŸ). En ce qui concerne l'intégrale du résultat par rapport 
à T, nous avons 


[ui * [gl (x)lh(u — x)|dæ, (27.252) 


qui existe et qui vaut ((|f|*|g|)+|A|)(u). Le corolaire 14.296 nous assure donc que s € L'(RŸx RŸ). 
Nous permutons donc les intégrales dans (27.249c) pour obtenir 


GQroeme= fr fente oar|a. FRS 


Rd 


Attardons-nous un instant sur l’intégrale interne, et utilisons l’invariance par translation de l’in- 
tégrale (lemme 14.250). Nous effectuons la translation x — x + y: 


J g(x — y)h(u — x) = J g(æ)h(u — x — y)dx = J g(x)h((u—y)—-x)dx  (27.254a) 


= (g*xh)(u — y). (27.254b) 
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Nous pouvons reprendre notre calcul en (27.253) : 


Gen +0 = [ren | fiat mnt de] dy (27-2558) 


-| MOTO (27.255b) 
= (fx(gxh))(u). (27.255c) 

C’est ce que nous voulions. 
PROPooNBHNooïnwoar 


Proposition 27.59. 
Le couple (L1 (R‘), x) est une algèbre de Banach*. 


Démonstration. Point par point. 


(1) Algèbre La définition d’une algèbre est 1.340. Les différents points sont dans la linéarité 
de l'intégrale. 


2 
3 


Commutative C’est la proposition 27.57. 


Associative C’est le lemme 27.58. 


(2) 
(3) 
(4) Normé L'espace L! à une norme; c’est la norme ||1. 
(5) 


5) Complet C'est le théorème de Riesz-Fischer 27.44. 


La proposition suivante est une conséquence de l'inégalité de Minkowski sous forme intégrale 
de la proposition 27.40. 


PROPooDMMCooPTuQus 
Proposition 27.60. 
Si1<p<o et si fe LP(R) et ge L\(RŸ) alors 
(1) f+xge LP 
(2) 1F + gl» < Pl. 
PropHNbdMQe 


Proposition 27.61 ([650]). 
Si fe L\(R) et si g est dérivable avec g! € L®, alors f + g est dérivable et (f + g)' = f * g. 


Démonstration. La fonction qu’il faut intégrer pour obtenir f x g est f(t)g(x — t), dont la dérivée 
par rapport à x est f(t)g'(x —t). La norme de cette dernière est majorée (uniformément en x) par 
G(t) = |f(t)/|g/|. La fonction f étant dans L'(R), la fonction G est intégrable et le théorème de 
dérivation sous l'intégrale (théorème 17.19) nous dit que f + g est dérivable et 


Ge = | 70 ge Dar = | row! fn dai= (fs de). (27.256) 


CORooBSPNooFwYQrc 
Corolaire 27.62. 
Si f e L'(Rd) et si g est de classe C®, alors f x g est de classe C© 


Démonstration. I s’agit d’itérer la proposition 27.61. 


26. Algèbre de Banach, définition 7.255. 
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27.4.1 Fonction plateau, lemme d’Urysohn 
PROPooQWNNooHmHRbk 


Proposition 27.63 ([1]). 
Soient deux fonction f et g sur IR" telles que le produit de convolution f + g ait un sens. Si le 
support de f est dans le compact K et le support de g est dans B(0,r), alors 


supp(f x g) € K + B(0,r) (27.257) 
PROPooBOZIooAhKbPs 

Proposition 27.64 (Urysohn, Fonctions plateau[239, 651]). 
Soit un ouvert Q © RŸ ainsi qu'un compact K dans (. Il existe une fonction f € C°(R4) telle que 


(1) supp(f) est compact dans Q, 

(2)0<f<1 

(3) f = 1 sur un voisinage de K. 
Démonstration. Nous posons ÿ = d(K,0°)/3. 


(1) Les applications 6 et & Nous nous souvenons de l’application € de la proposition 15.158. 


Elle est de classe C® à support compact dans B(0, 1). Nous considérons ?? 
(x) 
Pr) = =— > ———, 27.258 
(x) [ Et)de ( ) 
de telle sorte que Le p = 1. Pour chaque € > 0 nous posons également 
P:R'—-R 
(27.259) 


ze b(z/e) 


Par le lemme 15.163, nous avons 
Ï _— J ps. ERooDUOGoeLkqun 
B(0,e) n 


(2) La partie X, Nous posons 
K1 = {re R" tel que o(x, K) < 6}. FAGOR 


La partie K1 est bornée parce que si K € B(0,r), alors K1 € B(0,r +6). 

La partie X1 est fermée. Pour ce voir, nous prouvons que XŸ est ouvert. Soit y e KYŸ, et 
prouvons qu’il existe une boule centrée en y et contenue dans AT. Soit k € K1 réalisant 
d(z, K1) = d(z,k) (d est une fonction continue sur le compact X1, elle atteint ses bornes). 
Soit ze B(y, a) où a va être précisé de telle sorte à avoir B(y,a) € KŸ. Nous avons 


d(z,k) > ld(z, y) — d(y, k)| cf. just 100 RER DRE) 
= d(y,k) — d(z,y) cf. jus PEROOGTK PR ARAIZE 


>Ü+s—-a éÉ juste SETOOGVEF ag TOR 


(27.262) 


Justifications. 
— Pour (27.262a). Lemme 7.108. 
— Pour (27.262b). Nous choisissons a < d(y, k). 
— Pour 27.262c. Vu que d(y,k) > 6, nous posons s > 0 tel que d(y,k) = ô +. 


27. L'intégrale de £ ne pose pas de problèmes parce qu’elle est continue sur le compact de son support, de telle 
sorte qu’elle y soit bornée. 
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Nous avons prouvé qu’il existe s > 0 tel que pour tout « > 0 suffisamment petit, nous ayons 
d(z,k) > Ô +3 — a. Nous en déduisons que d(z,k) > à et donc que z € KA. 

Nous avons prouvé que À — 1 est borné et fermé. Il est donc compact (théorème de Borel- 
Lebesgue 10.24). 


(3) La fonction f Nous posons f = @e * 1x, où 1x, est la fonction indicatrice de A1 et x 
dénote le produit de convolution #. Vu que ®. est de classe CT, la fonction f est également 
de classe C® par le corolaire 27.62. 


(4) À propos de support La proposition 27.63 dit que le support de f est 


supp(f) € K1 + B(0,e). (27.263) 


Vue la définition 27.261, nous avons d(K1,Q°) > 6, de telle sorte que, en prenant € < 0 nous 
avons 


supp(f) € . (27.264) 


Le support de f est également borné parce que contenu dans le borné X1 + B(0,e). Nous en 
déduisons que f est une application C® à support compact dans (1. 


(5) f(x) size K Soit xe K. Nous avons, par définition, 


J(x) = L Pe(y)Lk (x — y)dy (27.265a) 
= po Ée(y) Lx, (x — y)dy cf. justif, SVBENOODKGEGOPERRTE, 
B(0,e) 
— po de(y)dy cv. justif. Fo re) 
B(0,e) 
= 1 par (27.260). (27.265d) 
Justifications. 


— Pour 27.265b. Le support de . est dans B(0,e). 


— Pour 27.265c. Vu que x € K et que |y| < € < 6, nous avons 


et donc æ — y Ee K1. 
(6) 0<f<1 Nous avons 
I < | AOC (27.267) 
< [ lpe(y)|dy (27.267b) 
= 1. (27.267c) 


Note : nous avons majoré Lx, (x — y) par 1. 


27.4.2 Partition de l’unité 
THOooQFCQooSlgLpz 


Théorème 27.65 (Partition de l’unité[239]). 
Soient un compact K & RŸ et des ouverts {Q;hi=1..n recouvrant K. Alors il existe des fonctions 
bi e CU(RŸ) (i = 1,...,n) telles que 

(1)0<h<1 


28. Définition 27.55. 
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(2) supp(gx) € Qx, 
(3) D 5-1 x = 1 sur un voisinage de K. 


Ces fonctions ®; sont une partition de l’unité subordonnée aux ouverts Q,;. 


Démonstration. Nous considérons des compacts {K35}i-1..n Comme dans le lemme 7.292. Pour 
chaque à nous avons K; € (;, de telle sorte que nous pouvions utiliser la proposition 27.64. Nous 
avons donc des fonctions dj € C'°(R4) telles que supp(#;) est compact dans Q;, 4; > 0 et D; =1 
sur V; qui est un voisinage ouvert de K;. 

Nous posons V = Vi LU... V,. C’est un ouvert qui contient K parce que 


KCUJK;e (Ja; eV; (27.268) 
J J J 


Nous faisons de même pour K lui-même. Il existe une fonction 9 € C'°(R1) telle que 
— supp() est compact dans Vn 
— 0 = 1 sur un voisinage de K, 
— DO<4<]I. 
Vu que Ÿ; = 1 sur V;, nous avons Di dj > 0 sur V. 
Nous prouvons à présent que in 
no 0 oecAENongzn y 
k=1 
sur R. 


(1) Size V Alors 1 —-6(x) > 0 et donc 


Yk(x) > 0. (27.270) 


LA 


1—0(x) + D de(x) > 
k=1 


k 


1 


(2) SizgV Vu que le support de 0 est dans V, nous avons 0(x) = 0. Quant aux fonctions V4, 
elles font un peu ce qu’elles veulent, mais elles sont positives ?* et donc 


1 — 8(x) + Ÿ dr(x) > 1 — (x) = 1. (27.271) 
k=1 


Vu que (27.269) est prouvé, nous pouvons poser 


_ Ÿ 
b=— TESTER (27.272) 


sans peur pour le dénominateur. Nous avons @; € CT(R1). Nous savons que 4 = 1 sur un voisinage 
de K. Su ce voisinage nous avons 


7; V(x) 


2#() bio À (27.273) 


De plus 9; z 0 parce que chacun des 4; l’est et parce que nous avons montré que le dénominateur 
était toujours strictement positif. 
En enfin, 


supp(@;) = supp(d;) € Q;. (27.274) 


Donc les fonctions @; sont celles que dont nous avions besoin. 


29. Dans le Frido, « positif » signifie dans [0, |. 
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27.4.3 Approximation de l’unité 


LemDQEKNNf 
Lemme 27.66. 
Soit f € L?(I) telle que 
Ï fp=0 (27.275) 
I 
pour toute fonction ÿ € CE(1). Alors f = 0 presque partout sur I. 
Démonstration. Nous considérons la forme linéaire 
b: LT) + C 
(27.276) 


go | fa 


Par densité * nous pouvons aussi considérer une suite (w,) dans C2(1) convergeant dans L? vers 
J. Alors nous avons pour tout n : 


(F,Pn) = 0. (27.277) 


En passant à la limite, €f, f> = 0, ce qui implique f = 0 dans L? et donc f = 0 presque partout 
en tant que bonne fonction. 


Ce résultat est encore valable dans les espaces LP (proposition 27.174), mais il demande le 


théorème de représentation de Riesz °!. 
DEFO0EFGNooUREmBb 


Définition 27.67 ([1, 638]). 
Nous considérons Q = R4 ou (S!){. Une approximation de l’unité sur Q autour de a € Q est 
une suite (w») de fonctions à valeurs réelles dans L'(Q) telle que 


(2) supz lpkla < ©, ITEMooGVRQooHDbrcf 
(2) pour chaque n nous avons \, @n = 1, 


(3) si V est un voisinage de a, alors 


lim lprl = 0. (27.278) 


En pratique, nous allons, sur R toujours considérer des approximations de l’unité autour de 0, 
même si nous ne le préciserons pas. Vous noterez que dans le cas de S*, le choix du « point de 
base » est plus arbitraire. 


Ce sont des fonctions dont la masse vient s’accumuler autour de zéro. En effet quel que soit le 
voisinage B(0, a), si k est assez grand, il n’y a presque plus rien en dehors. 
Pour le point ((3)), si Q est S1l, la mesure que nous considérons est Œ. 


Exemple 27.68. 
Une façon de construire une approximation de l’unité sur IR est de considérer une fonction 4 € 
L\(Q) telle que fo = 1 puis de poser 


plz) = klp(kz). (27.279) 
Ici, Q peut être R ou 51. A 


Le lemme suivant permet de construire des approximations de l’unité intéressantes. Nous aurons 
une version pour $! dans le lemme 27.105. 


30. Théorème 27.50(5). 
31. Théorème 27.171. 
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LemCNj1Yhv 
Lemme 27.69 ([638]). 
Soit une fonction $ continue et positive à support compact sur Rd telle que (x) > (0) pour tout 
x Æ 0. Si nous posons 


ail 
Pn(x) = (fr) p(x)”, (27.280) 
alors la suite (pn) est une approrimation de l'unité. 


Voici un théorème qui donne les propriétés à propos du produit de convolution avec une ap- 
proximation de l’unité dans R‘. Une version pour $1 sera le théorème 27.106. 


ThoYQbqEez 
Théorème 27.70 ([638]). 
Soit (y) une approrimation de l’unité sur Rd. 
(1) Si g est mesurable et bornée sur R et si g est continue en xo alors 
(px * g)(to) — g(xo). (27.281) 
(2) Si ge LP(RŸ) (1 < p < w) alors 
Pk*g + 9. (27.282) 
(3) Si g est uniformément continue et bornée, alors 
L© 
CET (27.283) 


Démonstration. En plusieurs points. 


(1) Nous notons dy = (ox * g)(x0o) — g(xo) et nous devons prouver que dj — 0. Vu que w4 est 
d’intégrale 1 sur R° nous pouvons écrire 


de = | erQ@atro- mu | atro)er(uds, (27.284) 
Rd Rd 
et donc 
del = | [. (g(xo — y) — g(xo))v(y)dyl < 1e \g(xo — y) — g(xo)|lpk(y)ldy. (27.285) 
Nous notons M = supz |wkl1, et nous considérons a > 0 tel que 


[g(xo — y) — g(xo)| < € (27.286) 


pour tout y € B(0,a). Nous nous restreignons maintenant aux k suffisamment grands pour 
que f, B(0,a) lpx(y)ldy < €. Alors en découpant l'intégrale en B(0, a) et son complémentaire 


dans Rd, 
ai<er+ | 2lalcletldy < en + 2lglre < ec. (27.287) 
C 


,@ 
Donc oui, nous avons |d;| — 0, et donc le premier point du théorème. 
Cette fois ge LP(R4) et nous cherchons à montrer que |d;|, — 0. Encore qu'ici dy soit défini 
à partir d’un représentant dans la classe de g et que d’ailleurs, nous allons travailler avec ce 
représentant. 


SR 
ND 
nr 


D'abord nous développons un peu ce dy : 


lle = |[., 


< If. (f [gx — y) — g(x)| : lextoldy)" a 1/p | (27.288b) 


P 1/p 
dr] (27.288a) 


J (g(x — y) — g(x))vx(y)dy 
Rd 
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À cette dernière expression nous appliquons l'inégalité de Minkowski (théorème 27.38) sous 
la forme (27.132) pour la mesure dr(y) = |px(y)ldy et f(x, y) = g(x — y) — g(x) : 


lé, < P (fee 0 - sean) hextoté = [rio ghrlextoidy. (27.280) 


Par le lemme 27.52 nous pouvons trouver a > 0 tel que |r,g — g|, < € pour tout y e B(0, a). 
Avec cela nous découpons encore le domaine d'intégration : 


Idxp < ] Iry9 — 919 lex (y)ldy + Î Iry9 — gp lpx(y)ldy < EM + 2e]glp. (27.290) 
B(0,a) oo CB(0,a) a 
SE <2|g9|» 


(3) Nous posons dy(x) = (x * g)(x) — g(x) et nous voulons prouver que |dz|]x — 0, c’est-à-dire 
que d;(x) converge vers zéro uniformément en x. Nous posons aussi 


Ty(g): ze g(x — y). (27.291) 


En récrivant le produit de convolution, une petite majoration donne 


DOSMLOE APT (27.292) 


L’uniforme continuité de g signifie que pour tout €, il existe un a tel que pour tout y € B(0, a), 


Iry(9) — gl < €. (27.293) 
Encore une fois nous découpons le domaine d’intégration en B = B(0,«) et son complémen- 
taire : 
Idees < [ {Go — gl en(oldu + À Go) — gl ler) (27-2940) 
BR Bo 
+ <2]|gl\o0 
< EM +2|g|we (27.294b) 


où la seconde ligne est justifiée par le choix d’un k assez grand pour que {,, [wxk(u)|dy < €. 
Nous avons donc bien |dx| — 0. 


Exemple 27.71. 
Une petite remarque en passant : aussi triste que cela en ait l’air, la convergence uniforme n’im- 
plique pas la convergence LP(Q) si Q n’est pas borné. En effet si f € LP, la suite donnée par 


1 
fn(x) = f(x) + = (27.295) 
converge uniformément vers f, mais 
1 
ln — flo = | = (27.296) 
an 
n'existe même pas si le domaine { n’est pas borné. A 


27.5 Intégrale sur des variétés 


27.5.1 Formes différentielles 


Nous allons donner une toute petite introduction aux formes différentielles sur des variétés 
compactes. 
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LemdwLGFG 
Lemme 27.72 ([652]). 
Soit w une k-forme sur R” et f, une fonction C® sur R”. Alors d(f*w) = f*dw. 


Démonstration. Nous effectuons la preuve par récurrence sur le degré de la forme. Soit d’abord 
une 0-forme, c’est-à-dire une fonction g: IR" — R. Nous avons 


d(d*g)X = d(go f)X = (dg o df)X = dg(dfX) = (F*dg)(X). (27.297) 


Supposons maintenant que le résultat soit exact pour toutes les p — 1-formes et montrons qu’il 
reste valable pour les p-formes. Par linéarité de la différentielle nous pouvons nous contenter de 
considérer la forme différentielle 

w = gdx! À ...dxP (27.298) 


où g est une fonction C®°. Pour soulager les notations nous allons noter dx! = dx! À ...dæP"t. 
Nous avons 


dt") = d(f*(gdx’ A dxP)) (27.299a) 
= d(f*(gdx!) À f*dx?) (27.299b) 
= d(f'(gdx!)) À fax? + (1771 f#(gdxl) À (f*daP) (282000) 
= f*(d(gdx!)) À f*dx? (275504 
= f*(d(gdx!) À dx?) (27.299e) 
= f*du (272006) 


Justifications : (27.299c) est la formule de Leibnitz. (27.299d) est parce que le second terme est nul : 
d(f*dx?) = f*(d?2xP) = 0. Nous avons utilisé l'hypothèse de récurrence et le fait que d? = 0. L'étape 
(27.299f) est une utilisation à l'envers de la règle de Leïbnitz en tenant compte que d2xP = 0. 


Soit M une variété de dimension n et w une n-forme différentielle 
= F(p)deri À 22 A den, (27.300) 


Si (U,@) est une carte (U € R” et vw: U — M) alors nous définissons 


J w = Ï fle(r))dé::.: ds. (27.301) 
g(U) U 


Lorsque nous voulons intégrer sur une partie plus grande qu’une carte nous utilisons une partition 
de l’unité du théorème 27.65. 


27.5.2 Brouwer avec Stokes 
PropDRpYwv 


Proposition 27.73 (Brouwer dans R? version C® via Stokes). 
Soit B la boule fermée de centre 0 et de rayon 1 de R" et f: B — B une fonction CC. Alors f 
admet un point fire. 


Démonstration. Supposons que f ne possède pas de points fixes. Alors pour tout x € B nous 
considérons la demi-droite issue de f(x) et passant par x (cette demi-droite existe parce que x et 
f(x) sont supposés distincts). Cette demi-droite intersecte 0B en un point que nous appelons g(x). 
Prouvons que cette fonction est C* dès que f est C* (y compris avec k = ). 

Le point g(x) est la solution du système 


g(x) — f(x) = A(x — f(x) (27.302) 
NF =1 (27.302b) 
À > 0. (27.302c) 
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En substituant nous obtenons l’équation 
PO) = IA (æ — f(æ)) + F@)? —1=0, (27.303) 
ou encore 
Ve — FI + 2A(x — f(x) : f(x) +] f(æ)|? — 1 = 0. (27.304) 


En tenant compte du fait que | f(x)| < 1 (parce que les images de f sont dans B), nous trouvons 
que P,(0) <0 et P,(1) < 0. De même limy_,4 P&;(À) = +00. Par conséquent le polynôme de second 
degré P, a exactement deux racines distinctes À < 0 et À2 > 1. La racine que nous cherchons est 
la seconde. Le discriminant est strictement positif, donc pas besoin d’avoir peur de la racine dans 


(x f(x) : f() + VA 
Ir — f(x)? 


X(x) = (27.305) 


où 
2 
As = A{(2— f{a)) : SG) Ale FIG 1). (27.306) 
Notons que la fonction A(r) est C* dès que f est C"; et en particulier elle est C'? si f l’est. 
En résumé la fonction g ainsi définie vérifie deux propriétés : 
(1) elle est CT; 
(2) elle est l'identité sur dB. 


La suite de la preuve consiste à montrer qu’une telle application g: B — B ne peut pas exister °?. 
Nous considérons une forme de volume w sur 0B : l'intégrale de w sur 0B est l’aire de 0B qui est 
non nulle. Nous avons alors la contradiction suivante : 


ie [+ - [. da [ d(g*w) = [ g“(duo) = 0 (27.307) 


Justifications * : 

— L'intégrale |,,, w est l’aire de 4B et est donc strictement positive. 
— La fonction g est l’identité sur 0B. Nous avons donc w = g*w. 

— Le lemme 27.72. 


— La forme w est de volume, par conséquent de degré maximum et dw = (0. 


Un des points délicats est de se ramener au cas de fonctions C®°. Pour la régularisation par 


convolution, voir [653]; pour celle utilisant le théorème de Weierstrass, voir [601]. 
ThoRGjGd0 


Théorème 27.74 (Brouwer dans R” version continue). 
Toute application continue** B(0,1) — B(0,1) admet un point fire. 


Démonstration. Soit une application continue f: B(0,1) — B(0,1). Nous commençons par définir 
une suite de fonctions f() 
ï 
Jr(x) = 


_1+i 


(27.308) 


Nous avons |fr — flo < ji où la norme est la norme uniforme sur B. Par le théorème de 
Weierstrass 12.429 il existe une suite de fonctions C®°(B,R) que nous nommons g4 telles que 


9x — fklo < (27.309) 


1+k° 


32. Notons qu'il n’existe pas non plus de rétractions continues sur B, mais pour le montrer il faut utiliser d’autres 
méthodes que Stokes, ou alors présenter les choses dans un autre ordre. 

33. Voir 20.28. 

34. Une fonction continue sur un fermé de R” est à comprendre pour la topologie induite. 
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Vérifions que cette fonction g, soit bien une fonction qui prend ses valeurs dans B : 


lg (ml < Age Ce) — fe) + fx) (27.310a) 
1, lf(@æ)l 
= mr Fe ï (27.310b) 
1 1 
< …. JL a I (27.310c) 
=;1. (27.310d) 


Par la version C'” du théorème (proposition 27.73), gx admet un point fixe que l’on nomme #4. 

Etant donné que x4 est dans le compact B, quitte à prendre une sous-suite nous supposons 
que la suite (xx) converge vers un élément x € B. Nous montrons maintenant que x est un point 
fixe de f : 


1 FC) — x] = f(x) — gx (x) + gx() — 2x + zx — x] (27.311a) 
< | f(x) — gk(x)| + gx) — xl +lrx — | (27.311b) 

=0 
< _ + te — x]. (27.311c) 


En prenant le limite k — 0 le membre de droite tend vers zéro et nous obtenons f(x) = x. 


27.5.3 Intégrale d’une fonction sur une sous-variété 


L'exemple typique est l'intégrale sur une surface dans RŸ, ou de volumes. 
Nous supposons à présent que M est une variété compacte de dimension 2 dans R?. La com- 
pacité fait que M possède un atlas contenant un nombre fini de cartes F;: W; — F;(W;). 
Si AC M est tel que pour chaque à, An F;(W;) = F;(V;) pour un ensemble V; mesurable dans 
R?, alors nous considérons 
À: = AN F\(W) = F1(V). (27.912) 


Ensuite, nous construisons A2 en considérant F2(W2) et en lui retranchant Aï : 
A = (An PB(W))\A (Vi). (27.313) 
En continuant de la sorte, nous construisons la décomposition 


A = A1 U...U À, (27.314) 


de À en ouverts disjoints, chacun de ouverts À, étant compris dans une carte. 
Il est possible de prouver que dans ce cas, la définition suivante a un sens et ne dépend pas du 
choix de l’atlas effectué. 


Définition 27.75. 
Si f: A—R est une fonction continue, alors l'intégrale est le nombre 


[. 1 > f, Jdor.. (27.315) 


27.5.4 Densité des polynômes trigonométriques 
DEFooGCZAooFecAHB 


Définition 27.76. 
Le système trigonométrique donné par {en}nez est 


En(t) = cine (27.316) 
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Une bonne partie de la douleur qu’évoque mot « densité » consiste à montrer que ce système 
est total dans L?2(S1) = L?([0,2r]), et donc en est une base hilbertienne. 


Définition 27.77. 
Un polynôme trigonométrique est une fonction de la forme 


Poe E ei (27.317) 


DEFooZDUKooRnYhhF 
Définition 27.78 (Coefficients de Fourier). 
Pour toute fonction pour laquelle ça a un sens (que ce soit des fonctions L? ou non), nous posons 


a) = 2 (jeta. Eapzrqnh 


_ 27 0 
Ces nombres sont les coefficients de Fourier de f. 


Ces trois définitions n’ont à priori aucun rapport entre elles, et rien en particulier ne devrait 
vous faire penser à une égalité du type 


Le] 
ae > aie). (27.319) 
n=—00 
Nous avons toutefois quelques liens. 
LemZVfZlms 
Lemme 27.79. 
Deux petits résultats simples mais utiles à propos des polynômes trigonométriques. 
(1) Si f e L'(S1), alors nous avons la formule 
J# En = Cn(f)en. (27.320) 


(2) Si P est un polynôme trigonométrique et si f € L\(S1) alors f x P est encore un polynôme 
trigonométrique. 


Démonstration. Le premier point est un simple calcul : 


27 


(F * en)(x) = : f(x — tjen(t) (27.321a) 


En ce qui concerne le second point, nous notons P — 5 N Prer, et par linéarité de la 


convolution, 
N 


fxP= > Pkf * ex = >, Pecx(f)er, (27.322) 
k=—N k=—N 


qui est encore un polynôme trigonométrique. 
ExDMnVSWF 


Exemple 27.80. 
Sur S! nous construisons alors l’approximation de l’unité basée sur la fonction 1 + cos(x) et le 
lemme 27.69. Cette fonction est évidemment un polynôme trigonométrique parce que 

eit + e it 


cos(x) = —g + (27.323) 


Ensuite les puissances le sont aussi à cause de la formule du binôme : 


1 + cos(x))" =  (" cos" (x), 27.324 
(1 + cos) ne (a) (27.324) 
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dans laquelle nous pouvons remettre cos(x) comme un polynôme trigonométrique et développer à 
nouveau la puissance avec (encore) la formule du binôme. La chose importante est qu’il existe une 
approximation de l’unité (w,) formée de polynômes trigonométrique. 

Ce qui fait la spécificité des polynômes trigonométriques est qu'ils sont à la fois stables par 
convolution (lemme 27.79) et qu’ils permettent de créer une approximation de l’unité sur [0,27]. 


Ce sont ces deux choses qui permettent de prouver l’important théorème suivant. PA 
ThoQGPSSJq 


Théorème 27.81. 
Les polynômes trigonométriques sont dense dans LP(S1) pour 1 < p < ©. 


Démonstration. : 
pes sf (27.325) 


par le théorème 27.70. Nous avons donc convergence L? d’une suite de polynômes trigonométrique, 


ce qui prouve que l’espace de polynômes trigonométriques est dense dans LP(S1). 


Remarque 27.82. 
Deux remarques. 

— Il n’est pas possible que les polynômes trigonométriques soient dense dans L® parce qu’une 
limite uniforme de fonctions continues est continue (c’est le théorème 12.367). Donc les 
polynômes trigonométriques ne peuvent engendrer que des fonctions continues. 

— Nous donnerons au théorème 28.8 une démonstration indépendante de la densité des poly- 
nômes trigonométriques dans LP(S1). 


27.6 Espaces L”, généralités 
SECooËEVZSooLtLhUm 
L'espace L? est l’espace LP défini en 27.7 avec p = 2. Cependant il possède une propriété 
extraordinaire par rapport aux autres LP, c’est que la norme |.|2 dérive d’un produit scalaire. Il 


sera donc un espace de Hilbert. 
NORMooUEIEooYtl1Fse 


27.83. 
Nous en rappelons la construction. Soit (Q,.14,u) un espace mesuré. Nous considérons l’opération 


to [ f(w)stw)du(w) DetProdscal upEsr 


et la norme associée 
| fle = 4<F, Fr. (27.327) 


Nous considérons l’ensemble 
L?(Q,u) = {f: A — © tel que |f|2 < co} (27.328) 


et la relation d'équivalence f — g si et seulement si f(x) = g(x) pour u-presque tout x. 
Et enfin, nous considérons le quotient 


L?(Q, y) = L(Q,u)/ +. (27.329) 
LemIVWooZyWodb 


Lemme 27.84. 
Soit un espace mesuré (Q, A, pu). 


(1) Pour tout f,g € L?(Q, A, u), le produit 


(9 = [ fdn EooGLVUoeñhEnex 


est bien défini et est un nombre complexe *. 


35. Est-ce qu'il ne faudrait pas un peu plus d'hypothèses, comme o-fini par exemple ? Vérifiez et écrivez-moi quand 
vous avez la réponse. 
36. Par opposition au fait que ce serait l'infini. 
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(2) L'opération (f,g) = {f,g) est un produit hermitien°T. 


(3) Le couple (L?(Q, A, yu),<.,.)) est un espace de Hilbert*. 


Démonstration. Que L?(Q) soit un espace vectoriel est un cas particulier de la proposition 27.16. 
Voyons cette histoire de produit scalaire. 


(1) Pour de vraies fonctions Nous commençons par analyser l'intégrale (27.330) dans le cas 
où f et g sont des fonctions, c’est-à-dire des représentants d'éléments de Z?. 


Dans ce cas, l’inégalité de Hôlder (proposition 27.33) avec p = q = 2 nous indique que le 
produit fg est un élément de L!'. Par conséquent la formule a un sens. 


(2) Passage aux classes 


Ensuite nous montrons que la formule passe au quotient. Pour cela, nous considérons des 
fonctions «a et 5 nulles presque partout et nous regardons le produit de f; = f + & par 


ga =g+8: 
fi, gi) = f 55 + Bf + aÿ + ab. (27.331) 


Les fonctions B f, ag et «B étant nulles presque partout, leur intégrale est nulle et nous avons 
bien € f1,g1> = <f,g). Nous pouvons donc considérer le produit sur l’ensemble des classes. 


(3) Produit hermitien Pour vérifier que la formule est un produit hermitien, le seul point 
non évidement est de prouver que {f, f> = 0 implique f = 0. Cela découle du fait que 


br [ FF. (27.332) 


La fonction x + |f(x)|? vérifie les hypothèses du lemme 14.192. Par conséquent |f(x)|? est 
presque partout nulle. 


(4) Espace de Hilbert En ce qui concerne le fait que L?(Q) soit un espace de Hilbert, il s’agit 
simplement de se remémorer que c’est un espace complet (théorème 27.43) et dont la norme 
dérive d’un produit scalaire ou hermitien. Nous sommes donc bien dans la définition 25.3. 


27.85. 
Ces espaces seront utilisés pour de nombreuses applications. Nous en aurons besoin pour plusieurs 
combinaisons d’ensembles Q et de mesures w. 


— Pour Rd 

— Pour S! 

— Pour [a, b] 
— Pour [0,2x| 
— Pour [-T,TI 


Le premier est non compact et il est raisonnable de penser qu’il sera fondamentalement différent 
des autres. À isomorphismes assez triviaux près, les espaces des fonctions sur les trois autres sont 
identiques. Nous nous attendons donc à ce qu'ils aient les mêmes propriétés. Notons que du point 
de vue de L?, étant donné qu’il y a un quotient par les parties de mesures nulles, prendre ]0,2r[ 
ou [0,27] ou n'importe quelle autre possibilité de ce genre revient au même. 

Afin de pouvoir utiliser ces espaces de façon optimale, et entre autres y définir les séries de 
Fourier, nous avons besoin, pour chacun d’entre eux de définir les éléments suivants : 


—— mesure 


— produit de convolution 


37. Définition 9.172. Pour rappel, nous considérons des fonctions à valeurs complexes. Si au contraire nous avions 
considéré seulement des fonctions à valeurs réelles, nous aurions eu un produit scalaire. 
38. Définition 25.3. 
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— le système trigonométrique (que nous allons montrer être une base hilbertienne) 
— coefficients de Fourier 


Ca fait pas mal de choses à définir. Il n’est pas besoin de définir un produit scalaire parce que le 
lemme 27.84 nous en donne un générique. 

Les définitions qui viennent sont à prendre « tant que les formules ont un sens ». Nous parlons 
donc de fonctions dans Fun(Q, C), l’ensemble de toutes les fonctions sur ( à valeurs dans C. Nous 
verrons plus tard les espaces de fonctions sur lesquels tout a un sens. 


27.7 L'espace L?(R°‘) 


La mesure est celle de Lebesgue. Le produit de convolution est donné, pour f, g € Fun(R4, C), 
par 


Ge a(e) = |, og - du (27.333) 


Certaines de ses propriétés ont déjà été vues dans le théorème 27.56. 
En ce qui concerne le système trigonométrique, pour tout £ € R% nous définirions bien 


ee(z) = ER (27.334) 
genre pour faire que les transformations de Fourier sont des séries continues ...mais bon. Nous 
n’allons pas tenter le diable plus que ça, et nous ne définissons 

— pas de système trigonométrique, 
— pas de coefficients de Fourier non plus, 
—— pas de théorie des séries de Fourier sur R‘. 


Quand je disais que la non-compacité de RS allait un peu changer les choses par rapport aux 
autres, je ne rigolais pas. 


27.8 L’espace L?(S1) 


L'espace 5! sera fait avec forces détails, parce qu’il va servir de base pour les espaces L?([0,27[), 
L?([-T,T[) ainsi que pour l'étude des fonctions périodiques sur R. 
En tant qu'ensemble, 


5° = {e"}ier, (27.335) 


sans garanties que ce paramétrage soit une bijection. 
Il y a essentiellement deux façons de définir une intégrale sur S1. 


(1) Voir S! comme une sous-variété de R? et utiliser la définition 20.9. Cette façon a cependant 
deux inconvénients : 


—— Elle ne donne pas la tribu des mesurables sur S!, c’est-à-dire que cette méthode ne 
donne pas de façon évidente une théorie de la mesure sur S1. 


— Il faut au moins deux cartes pour paramétrer le cercle. La fainéantise nous prévient que 
ça va être technique. 


(2) Rapporter la structure d’espace mesuré de [0,27{ vers S!, de force via le premier difféomor- 


phisme qui nous passe par la tête, à savoir + eï. 


Nous allons choisir la seconde possibilité, en gardant en tête qu'elle fonctionne de façon très simple 
un peu par coup de chance, voir la remarque 14.293(5). 
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27.8.1 Espace mesuré 


Plusieurs choses sont déjà faites. 
—— Les boréliens de S! sont décrits dans la proposition 18.70, 


—— la tribu de Lebesgue de S1 est décrite dans la proposition 18.72. Non, ce n’est pas la tribu 


induite de la tribu de Lebesgue de C. 
PROPooDJERooYirMru 


Proposition 27.86 (Espaces de fonctions sur S1[1]). 
Soit l’espace mesuré (S1, Leb(ST), pi). 


(1) La formule 


= |, fadu PO FE) 


est un produit hermitien*” sur L?(S1, Leb(S1), y). 
(2) L'espace L?(S1) est un espace de Hilbert. 


ITEMooQZAPooKEeQBW 
(3) L'application 

: L?(S1) — L?([0,2r[) 
f 1 f (27.337) 

> ——— f 0 w. 

4/27 1. 

est une bijection isométrique (isomorphisme d'espaces de Hilbert) 
Tout cela se résume par l'égalité 

L?(S?, Leb(S?), y) = L?(]0,2r[, Leb(R), À) (27.338) 


où nous avons fait un minuscule abus de notations : ici Leb(R) est en réalité la tribu induite sur 
10,27. 


Démonstration. Le fait que la formule (27.336) donne bien un produit hermitien est le lemme 
27.84. Ce même lemme assure que le tout donne un espace de Hilbert. 


Il nous reste à prouver le point (3). En ce qui concerne l’isométrie, nous posons {! 


p: L?(S7) — L?([0,2r[) 


1 
aie 


(1) Injection Si @(f) = d(g), alors pour tout x € [0,27[ nous avons f(p(x)) = g(v(x)). Vu 
que @: [0,27[ — S! est une bijection nous avons alors f(s) = g(s) pour tout se S1. 


(27.339) 


(2) Surjection Si f e L? (J0,2x]), nous posons g: 51 —> € par 
g(s) = V2rf(p""(s)). (27.340) 


Nous avons alors bien @(g)(x) = f(x). 


(3) Isométrie Nous montrons que & préserve le produit scalaire : PUPEMSOORTFHoOPCLAHN 
té = f atnteattmaxt) (7.341a) 
— Ut © (x) © PI) d\(a) (27.341b) 
: ['u opdÀ (27.341c) 


39. Définition 9.172. 
40. Ici 4: [0,27[ — S! est la bijection usuelle de la proposition 18.61(1). 
41. Notez que cette définition passe aux classes. Nous le répéterons pas. 
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Pour la suite nous devons invoquer la proposition 14.292 qui nous permet de changer une in- 
tégrale sur ([0, 2x|, Leb([0, 2r|) | À) en une intégrale sur (5, Leb(S1), Li). La première condi- 
tion de cette proposition est que Leb(S?) = @(£eb([0,2r{[)). Cela est la proposition 18.72(2). 
La condition sur la mesure dans la proposition 14.292 n’est vraie ici qu’à un facteur 27 près. 
Nous avons : 


Ï fd) = 2r | (fou ljdu. (27.342) 
[O,2r[ si 
Nous continuons le calcul (27.341) : 
1 (2 
60 = 3e | Do edà = | Fidu = (F9) (27.343) 


27.8.2 Topologie 


Nous considérons sur S! la topologie induite de C. Vu que S! est fermé et borné dans C, il 
en est une partie compacte. Par le lemme 7.78, l’espace S! muni de sa topologie est un espace 
topologique compact. 

Nous pouvons donc sans crainte affirmer que toute fonction continue f: S! — K est bornée et 


atteint ses bornes. 
PROPooEQDBooDfOrTZ 


Proposition-Définition 27.87. 
Soit la formule . 
d(e*,e*) = inf |x — y + 2kx|. (27.344) 
keZ 
(1) Elle est bien définie (ne dépend pas des choix de x et y donnant les mêmes points dans S!) 


(2) L'infimum est en réalité un minimum : il est atteint par un certain k € Z (qui, lui, dépend 
des choix). 


(3) La formule définit une distance*? sur S!. 


Nous considérons sur S\ la topologie Ta découlant de cette distance. 


Démonstration. Point par point. 


(1) Soient x/,y € R tels que e” = ef et e” = eiv, Alors x = x + 2x et y = y + Ur pour 


certains entiers {, l’ € Z (corolaire 18.24). Nous avons alors |2/—y+2k7| = |x—-y+27(k+1—l)] 
et 
inf [x — y +2 = inf |x — 2kT|. 27.34 
inf | y +2kr| inf | y + 2kr| (27.345) 


(2) Quels que soient x et y fixés, nous avons 


lim |[x—y+2kT| = co. (27.346) 
k— +00 


Donc l’infimum est forcément atteint par un k € Z. 
(3) Pour la distance, il y a plusieurs points à prouver. 


— Pour tout z,2 € S1 nous avons d(z,2/) > 0 parce que la distance est donnée par une 
valeur absolue. 

— Si d(z, z') = 0, alors il existe k tel que x = y+2km. Alors eï? = ei(u+2kr) 2 ive2kir 2 Qi, 
C'est-à-dire z = z/. 


— Pour la symétrie, nous avons 


x — y + 2k7] = |y — x — 2k7] = [y — x +2k/7| (27.347) 


en posant k’ = —k. L'infimum étant pris sur k € Z, nous avons al symétrique d(e"*, e%) = 
d(e?,e*). 


42. Définition 7.107. 
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— Pour attaquer l'inégalité triangulaire, nous considérons 21 = e71, 29 = et? et 23 = ets, 
Nous posons également k1,k2,k3 € Z tels que d(21,23) = |x1 — x3 + 2k17|, d(21,22) = 
Îx1 — to + 2konl et d(22,23) = [2 — x3 + 2k3m|. Nous avons alors 


d(z1,23) = inf [T1 — 23 + 2kr| (27.348a) 
= inf [T1 — L9 + T2 — T3 + 2kr| (27.348b) 
keZ 
— inf |Cæ1 — 22 + 2k27) + (to — x3 + 2k3T) + 2kr| (27.348c) 
€ 
< |Cæ1 — 29 + 2k2m) + (to — za + 2k3T)| SUBEROO CAC Ro aGnt 
< | — 92 + 2kox| + [to = L3 + 2kar|. (27.348e) 


Notez que pour (27.348d), en posant k = 0 nous avons bien une inégalité. En y pensant, 
k = 0 réalise effectivement l’infimum, mais ce n’est pas indispensable. 


Le cercle est bien connu pour être symétrique et en particulier avoir une symétrie sous les 
rotations. Nous allons voir quelques résultats qui vont dans le sens de dire que la distance définie 


sur $1 respecte cette symétrie. 
LEMooCQCAooAEctbe 


Lemme 27.88. 
Plusieurs points à propos de l’invariance de la topologie sous les rotations. 


(1) La distance est invariante sous les rotations, c'est-à-dire que si a,be S! et sise R, alors 


d(e®a, eb) = d(a,b). (27.349) 
ITEMooCIPYooTyPQL;j 

(2) Les boules sont préservées sous les rotations, c’est-à-dire que 
eBa(a,r) = Ba(e®a,r). (27.350) 


(3) La topologie est invariante sous les rotations : eŸ°T4 = Ty. 
Démonstration. Point par point. 
(1) Si a = e* et b = eŸ, nous avons 


d(a,b) = inf [x — y + 2k7| = inf [(x — s) — (y — s) + 2kr| = d(eŸa, e#b). (27.351) 


Et de un. 
(2) Il faut une inclusion dans chaque sens. 


(2a) eÏSBa(a,r) € By(eSa,r) Soit b e eBq(a,r). Alors b = eï*b' pour un certain b € 
Ba(a,r). Nous avons alors, en utilisant le premier point, 


d(b, ae) = d(e-"#b, a) = d(b',a) <r. (27.352) 


Donc be Bj(ea,r). 

(2b) Ba(eŸa,r) c eBq(a,r) Soit be Bq(e'*a,r). Nous devons prouver que be e“*By(a,r), 
c’est-à-dire que b = e'*b’ pour un certain be By(a,r) ou encore que e be By(a,r). 
En utilisant encore le premier point, 


d(e” "b, a) = d(b,e®a) < r. (27.353) 


Donc oui, e “be B(a,r). 


43. Pas chaque boule séparément, mais l’ensemble des boules 
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(3) Soit À e 7. Si a € e'5 À, alors a = ea! pour un certain a/ € A. Notre but est de prouver que 
e"A contient un voisinage de a. 
Vu que a’ € À, il existe r > 0 tel que Ba(a’,r) € À. Nous avons alors 
e“aBq(a ,r) & e°A, (27.354) 
is! 


et comme eBq(a!,r) = Ba(ea!,r) = Bq(a,r) nous avons bien 


Ba(a,r) c eïA. (27.355) 


Nous allons voir maintenant quelques résultats à propos de B;(1,r) qui a la bonne figure d’être 
un ouvert qui s'étale symétriquement en partant de 1 (le point le plus à droite du cercle). Par 
rapport à la figure 27.1, il s’agit ni plus ni moins que de voir qu’une boule de rayon r autour de 1 
est bien la partie indiquée (symétrique par rapport à 1 et de longueur d’arc r des deux côtés). De 
plus, ce voisinage n’est autre que la partie du cercle située à droite de la ligne en pointillés. 


FIGURE 27.1: Un voisinage de 1 dans S1. LabelFigJOQVoolPTsYPZK 


Ce lemme-ci montre que B{(1,r) est une partie de S! qui s'étale symétriquement autour de 1. 
LEMooMYNVoolIWWsiV 


Lemme 27.89. 
Soit l’application 
po: R — 5! 


: (27.356) 
ze”. 
Nous avons B(1,r) = e(-r,rl). 


Démonstration. Soit be Bq(1,r) de la forme b = e" avec y choisi de telle sorte que d(1,b) = ||. 
Vu que d(1,b) < r, nous avons |y| < r et donc be p(]-r,rl). 
Dans l’autre sens, si y € [-r,r[, alors 


ACL 6) = nf |y-+ Zn << EnpoRuAS 7 a0e 
E 


Nous avons utilisé le fait que l’infimum sur k € Z est plus petit ou égal à la valeur pour k = 0. Les 
inégalités (27.357) montrent que eŸ € B(1,r). 


Le lemme suivant montre que que les boules autour de 1 sont délimitées par la droite en pointillé 


de la figure 27.1. 
LEMooLINCooH]JmJWx 


Lemme 27.90. 
Soit r E [0,x]. Nous avons 


Ba(i,r) = ST n {x + iy tel que x > cos(r)}. (27.358) 


Démonstration. En deux inclusions. 


27.8. 


(1) 
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Inclusion € 

Sir= 7, alors B(1,r) = S!\{—1}, alors que cos(r) = —1. 

Sir <r, alors nous partons de la formule (18.18) qui dit que eŸ” = cos(r) +isin(r). D’après 
le lemme 27.89, un élément de B;(1,r) est de la forme e"Ÿ avec y € |[—r,r[. Nous voudrions 
donc prouver que cos(y) > cos(r) dès que y € |-r,r{ et r < 7. 

Sur |-r,0[, la fonction cos est croissante , donc si y < 0 alors 


cos(y) > cos(—r) = cos(r). (27.359) 


De la même façon, sur |0,r{, la fonction cos est décroissante, de telle sorte que si y > 0, alors 
cos(y) > cos(r). 
Nous avons prouvé que B4(1,r) & St An {x + iy tel que x > cos(r)}. 


Inclusion inverse 


Soit z = es avec se [—7,r|, et vérifiant cos(s) > cos(r). Nous avons 
d(1,2) = inf |s+2kr| = |s| (27.360) 
keZ 


parce que l’infimum est réalisé par & = 0. Nous avons donc 


cos(s) > cos(r) (27.361a) 
Is e [0,7] (27.361b) 
ref0,x], (27.361c) 


et nous devons en déduire que |s| < r. Si s > 0, alors la décroissance de cosinus (proposition 
18.48(1)) dit que s <r. 


Si s < 0, alors nous savons que cos(s) = cos(—s) et donc, en posant s/ = —s, le cas "s > 0" 
nous dit que s’ < r, et donc que |s| < r. 


Dans les deux cas nous avons d(1,z) = |s| < r. 


Proposition 27.91. 
La topologie Ta sur S Ÿ est la topologique induite depuis C. 


Démonstration. Nous notons 7; la topologie induite (c’est-à-dire l’ensemble des ouverts) et 74 la 
topologie de la distance fraichement définie. Nous allons également noter Bœ(a,r) la boule dans 
C de centre a et de rayon r, et B4(z,r) celle dans S!, de centre z € S! et de rayon r pour notre 
distance d. 


(1) 


Ti CT Un élément général de 7; est de la forme © À St où © est un ouvert de C. Soit 
ae OnS et prouvons qu'il existe un ouvert de 74 contenant a et contenu dans © An S!:; cela 
prouvera que © n S! est ouvert de 74 par le théorème 7.8. 


Soient a = el* et r tel que Ba(a,r) « ©. Nous allons montrer que Bq(a,r) € Bœ(a,r). Un 
élément général de B;(a,r) est b = e"Ÿ tel que 


d(a,b) = inf x —y+2kr| <r. (27.362) 


Quitte à redéfinir x ou y nous pouvons supposer que l’infimum est atteint en k& — 0. En 
utilisant la proposition 21.15 nous majorons : 


la — b| = [e — | < |x — y] = d(a,b) <r. (27.363) 


Donc nous avons bien be Bœ(a,r) dès que be Bq(a,r). 


44. Lemme 18.25. 
45. Définition 27.87. 
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Ta Ti 

Ce sens est plus délicat parce que, si nous voulons suivre les mêmes pas que le premier sens, 
nous devrons nous appuyer sur la continuité de l’application In: C* — ©, laquelle n’est pas 
vraie en —1 (voir par exemple le lemme 26.33). 

Soient Ae raet ae À. Nous devons prouver l'existence d’un ouvert © de € tel que ST An © 
soit inclus dans À et contienne a. Nous allons prouver cela dans le cas a = 1 et ensuite 
propager le résultat en utilisant la symétrie de S!. 


(2a) Sia=1 Vu que À est ouvert pour la topologie de la distance d, et vu que 1 € À, il 
existe r > 0 tel que B;(1,r) € À. Pour ce r le lemme 27.90 donne 
Bi, r) = ST n {x + iy tel que x > cos(r)}. (27.364) 
Nous montrons que © = B«{(1,6) avec 9 < 1 — cos(r) fait l'affaire. Si x + iy € Be (1,6), 
alors + > 1 — à et donc 


1—0>1—(1-—cos(r)) = cos(r), (27.365) 


ce qui prouve que la partie de © qui est dans S! est bien dans B4(1,r). 

(2b) SiaZzl 
Soient un ouvert quelconque À € 74 ainsi que a = e* € A. Nous considérons r > 0 
tel que By(a,r) € A; nous avons e-#By(a,r) € e-®A et donc, en tenant compte du 
lemme 27.88(2) : 


Bi(i,r) ce “A. (27.366) 
Par le premier point, il existe un ouvert © de C tel que 1 e O et 
OnSlce Blr)ce A. (27.367) 


Nous avons évidemment que a € e"O et 
e(OnsS!) ce eEBi(1,r) c& A. (27.368) 


Donc e#O à ST © À. Vu que e*O est un ouvert de ©, l’ensemble e*© A ST est un 
ouvert de 7;. 


LEMooTKFHooJaeMyc 
Lemme 27.92 ([1]). 
Deux résultats de limites dans S*. ITEMooEUDIooDuynRg 
(1) Pour tout ao € S}, nous avons 
lim d(a, as) = 0. (27.369) 
Fe ITEMooXCBUooUxQ1dB 
(2) Si f: St C est continue en a € S}, alors 
lim f(as) = f(a). (27.370) 
S— 
Démonstration. Point par point. 
(1) Soient a,s € Sl. Donnons une formule pour d(a,as). Si a = e* et s — e” nous avons 
as = e®+%) et donc 
d(a, as) = inf {x — (x + y) + 2kr| = inf [y + 2kr|. (27.871) 
keZ keZ 


Voilà pour la formule. Maintenant la preuve de notre point. 
Soit e > 0. Si ô <eet si se B(1,6), alors il existe y € |—6, 6[ tel que s = e" par le lemme 
27.89. Pour un tel s nous avons 


d(a, sa) = inf [y + 2krn| < |yl < d <e. (27.372) 


Nous avons trouvé Ô > 0 tel que s € B(1,6) implique d(a, as) < €. Cela est la limite que nous 
devions prouver. 
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(2) Soit e > 0. Soit r > 0 tel que si be B(a,r), alors |g(b) — g(a)| < e; l'existence d’un tel r est 
la continuité de g en a. Nous considérons Ô > 0 tel que s € B(1,0) implique sa € B(a,r); 
l'existence d’un tel 6 est le point (1) de ce lemme. 

Avec tout cela nous avons |g(as) — g(a)| < € dès que s € B(1,6). Nous avons donc, comme 
nous le voulions, la limite lim,_,1 g(as) = g(a). 


Lemme 27.93. 
Pour s € S!, nous considérons l'application 


as: Fun(S1) — Fun(S!) 


: (27.373) 
as(g)(u) = g(us) — g(u). 
Quelques propriétés avec 1 < p < © : 
(1) Si f e LP(S1), alors as(f) € LP(S1). 
(2) Si f est continue dans LP(S1) nous avons la limite 
lim as(f) = 0 (27.374) 
dans LP(S1). 
Démonstration. D'abord un calcul de norme : 
lg = [LS — rcoPéu< | rare + | 1réoPau = 217p. (7.375) 


Donc oui pour que a,(f)e LP(S1). 
La fonction f étant supposée continue sur le compact S!, elle est majorée. Nous savons qu’en 
posant M = |f|,x nous avons |a,(f)| <2M. Donc la fonction constante 


g: S1—C 


(27.376) 
u > 2M 


est une fonction intégrable sur S! qui majore |a,(f)| uniformément en s. Soit une suite 5; — 1 
dans S!, et posons f; = à,,(f). Alors nous avons 


IIS = [. | fi(u)|Pdu (27.377) 


et aussi |f;[P < (2M)?. Le théorème de la convergence dominée de Lebesgue 14.200 nous permet 
de permuter limite et intégrale : 


lim [12 = Î lim [f(u)[Pdu. (27.378) 
1—>00 S1 1—>00 
Mais 
lim fi(u) = lim a,(f)(u) = lim ((u8;) — f(u)) = 0. (27.379) 


La dernière limite est due au fait que lims_,1 g(us) = g(u) (lemme 27.92(2)). 


27.8.3 Système trigonométrique 


Définition 27.94. 
La famille trigonométrique sur S* est l’ensemble de fonctions {en}nez données par 


En: SC 


ze 


(27.380) 
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avec n € Z. Un polynôme trigonométrique est une application S! — € de la forme 


DT (27.381) 


k=-n 


pour des nombres ax € ©, peut-être pas tous non-nuls (autrement dit, il n’est pas forcé d’avoir 
autant de termes négatifs que positifs). 


Le but de z ++ z" dans cette définition est d’être lu £ > e"{ lorsqu'on considère les fonctions 
sur [0,2x|. 
PROPooUMGFooROFFFr 
Proposition 27.95. 


La famille trigonométrique est une famille orthonormale pour le produit scalaire L?(S*, A, ui). 


Démonstration. En utilisant la proposition 27.86(3) nous avons : 


1 — 
lensén) = Ï Enên = — en(p(x))en(v(x)) (27.382a) 
si 27 [0,2 [ 
1 , 
= — ee ue (27.382b) 
27 [0,27| 
1 27 
= — | jar (27.382c) 
27 0 
= (27.3824) 
Et nous avons également, pour m # n : 
1 1 1 dé 
lensen) =— Ï enr = É | = 0. (27.383) 
27 Jfo,27[ 27 |i(n — mheitr-mz | 


Remarque 27.96. 
Vous aurez noté que le facteur _— qui permet d’avoir <e», en) = 1 ne provient ni de la définition du 
produit scalaire ni de celle de la famille trigonométrique, mais bien de la mesure, voir la définition 


18.193. 
REMooUCANooVyXPx)j 


Remarque 27.97. 
Notez aussi que nous avons bien <e,,e_n) = 0. Il faut donc bien prendre tous les e, avec n € Z et 


non seulement n € N. 
PROPooTGBHooXGhdPR 


Proposition 27.98. 
Les polynômes trigonométriques forment une partie dense dans (C(S', ©), |). 


Démonstration. Pour préciser les notations, C'(S1, C) est l’ensemble des fonctions continues de S1 
vers C, et l’espace topologique que nous considérons est cet ensemble sur lequel nous considérons 
la distance supremum. 

Nous utilisons le théorème de Stone-Weierstrass 12.428. 

Le système contient une fonction constante non nulle, à savoir eo. 

Il sépare les points grâce à la fonction e qui n’est autre que la fonction identité z + z. De plus 
l’ensemble des polynômes trigonométriques est stable par conjugaison parce que si 


P— ) dé (27.384) 


k=-n 


alors P = Y%_ ,axex = D _, axe_x qui est encore un polynôme trigonométrique. 
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Définition 27.99. 
Si nous avons une fonction f: S! — ©, nous définissons ses coefficients de Fourier par 


Cn(f) = (f,En) (27.385) 


pourvu que l'intégrale existe. 


27.8.4 Convolution 


La convolution sur IR” est donnée par la définition 27.55. Nous voyons maintenant comment 


cela s’adapte à S1. 
DEFooSKWOooEdIHoH 


Définition 27.100. 
Si f et g sont des fonctions sur S! à valeurs dans C, nous définissons la convolution de f et g 
comme étant la fonction sur S! définie par 


ent) = |, rOu(an(s). nn | 


Cette définition appelle plusieurs remarques. 
—— Dès que 2,8 € S!, nous avons 28 e S1, de telle sorte qu’au moins l’intégrande ait un sens. 


— Nous ne prétendons pas que l'intégrale (27.386) converge pour toutes les fonctions f et g. 
Cela est une définition « pour tous les couples f,g pour lesquels l’intégrale fonctionne ». 


— Le lemme 27.101 nous dira que L!(S!) est stable par convolution : si f et g sont dans L!, 
alors f * g y est aussi. 


— Dans la formule (27.386), la variable s est vraiment une variable muette. Cette formule aurait 
également pu être écrite 


(fx 9)() = [ [se f(s)(z3)]du. (27.387) 


LEMooTYSSooItOiYE 
Lemme 27.101 ([654]). 
Si f,g € L\(S1), alors pour presque tout z € S1, la fonction s + Ÿ f(s)g(z5) est dans L'(ST). 
Démonstration. Nous considérons la fonction 
HSE ed 
# ; (27.388) 
(2,5) > f(s)g(es). 


(1) ve L\(S1 x Slt) Nous utilisons le corolaire 14.296, et pour cela nous calculons les intégrales 


en chaine  : 
[fuel as- firoff cestae las (27.389) 
a af If(s)ds| (27.389b) 
60: (27.389c) 


Le fait que À < provient directement de l'hypothèse ge L1(.51) 47. 


Par le corolaire sus-cité nous avons bien # € L!(S1 x S1), 


46. Dans les expressions suivantes, les symboles « ds » et « dz » n’ont pas d’autres valeurs que purement de notation 
pour indiquer le nom de la variable d'intégration. 
47. Avec un changement de variables z + 25 que je vous conseille d’être capable de justifier. 
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(2) Et par Fubini Le théorème de Fubini 14.297(1) nous renseigne que pour presque tout 
ze S!, l'application 


sr Y(2,s) (27.390) 


est dans L1(S1). Et la partie 14.297(2) ajoute que l'application 
zm | v(s,z)ds ÉqooPLLBog tea 


est également L(51). 


(3) Conclusion L'application donnée en (27.391) est précisément (f + g). Donc f xge L!(S1). 


Lemme 27.102 ([1]). 
Si f e L'(S1) et si g est continue sur S!, alors f + g existe et est continue sur S!. 


Démonstration. Vu que S! est compact, la continuité de g implique que g est bornée et donc dans 
L1(51). Le lemme 27.101 dit alors que f + g est bien définie sur S!. 

Soit z € S!. Nous montrons que f + g est continue en 2; pour cela nous considérons € > 0 et 
ensuite nous réfléchissons un peu. 

Vu que g est continue sur ST qui est compact, g y est uniformément continue par le théorème de 
Heine12.81. Il existe donc un 6 > 0 tel que pour tout z € S!, si ze B(20,0), alors |[g(z0)—g(z2)| < €. 

Soit se S1. Size B(z0,6), alors 5z € B(520,6) par le lemme 27.88(2). Dans ce cas nous avons 
aussi 


19(820) — g(82)| < €. (27.392) 


Un peu de calcul maintenant. D'une part 


960 - (+90) = |, 609 — 1(-D)ds, (27.393) 
et donc 
(POUCES ANCIEN (27.394) 
< «| fl (27.394b) 
S1 
— Ac (27.394c) 


pour une certaine constante À ne dépendant pas de 20. 
Nous avons prouvé que pour tout € > 0, il existe un Ô tel que z € B(20, a) implique 


ICE # g)(20) — (F x g)(2)1 < 4e, (27.395) 


ce qui signifie que f + g est continue en 2. 


Notez que dans cette démonstration, l’uniforme continuité de g a été utilisée pour effectuer 


d’un seul coup la majoration pour tout s dans l'intégrale. 
PROPooCSRNooDyC1BY 


Proposition 27.103. 
Si fe Li(St), nous avons 


f * En — CAT lé: (27.396) 
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Démonstration. Il s’agit d’un bon calcul. En considérant z = e? nous avons 


(fxen)(z) = | f(s)en(zs)ds (27.397a) 
S1 
_ En ix i(0—x) 
a - or )en(e )dx (27.397b) 
= — Ï f(e)e dr (27.397c) 
[0,27| 
, ie) DNS Toi 
= en(e = [re Jen(e?)dx (27.397d) 
.. J FOrROTE (27.397e) 
S1 
ele) es). (27.397f) 


Donc (f x*eh)(2) = <f,en)en(z), c’est-à-dire que 


f * En — gl le (27.398) 


LEMooDGHJooRAnwpy 
Lemme 27.104. 
Si P est un polynôme trigonométrique et si f € L1(S!), alors f + P est également un polynôme 
trigonométrique. 


Démonstration. Soit P = Y7__, ageg. Par la linéarité du produit de convolution, 


—n 


n 


fxP = > af * Ex = D arcr(fJer (27.399) 
k 


k=-n 


où nous avons également utilisé la proposition 27.103. Nous avons donc un polynôme trigonomé- 
trique dont les coefficients sont azc;(f) au lieu de ag. 


27.8.5 Approximation de l’unité 
LEMooUNFBooRCzwlIn 


Lemme 27.105 ([638]). 
Soient une fonction continue f: S! — [0,00[ et a e S! telle que f(z) < f(a) pour tout z € S!\{a}. 
Alors la suite de fonctions fh: S! — R donnée par 


Al = (f. rr) n° EQooTOYPoRIZRE 


est une approximation de l'unité autour de a. 


Démonstration. En plusieurs points, dont d’abord une série de vérifications pour voir que la formule 
a un sens. 


(1) Strictement positive D'abord, vu que f prend ses valeurs dans [0,00[ et vu que f(z) < 
f(a), nous avons f(a) > 0 (strict). Peut-être que f s’annule à certains endroits de Sl, mais 
pas à. 


(2) f" est intégrable sur S! La fonction f” est dans les hypothèses de la proposition 14.211 
parce que $! est compact, f” y est continue et la mesure sur S! est compatible avec la 
topologie (voir les hypothèses précises). 


48. Définition 27.67. 
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(3) L'intégrale n’est pas nulle Vu que f(a) > 0, il existe un ouvert À contenant a sur lequel 


f > 0. Nous avons alors 


[. J" > [. 70 (27.401) 


Cela pour dire que l'inverse dans (27.400) ne pose pas de problèmes. 


(4) Norme Vu que toutes les fonctions tant f que f, sont positives, les valeurs absolues ne 
jouent aucun rôle et nous avons 


1 
| fnl1 = [ Hdi ([. r) [. |f(2)ldu = 1. (27.402) 


Ce calcul donne d’un seul coup les deux conditions 


— supg [xl = 1 
— Var În = 1 pour tout n. 


Nous passons maintenant au vrai travail. Soit un voisinage V de a dans S!. Soit une suite croissante 
(tx) qui converge vers f(a), c’est-à-dire 0 < tx < f(a). Nous posons 


A = {x e S\V tel que f(x) > ty}. (27.403) 


Cet ensemble est contenu dans S1 et est donc borné (pour la métrique de S!). 


(1) Ag est fermé Attention : ici nous démontrons que A4 est fermé dans S!, et les complé- 
mentaires sont pris dans S1. 
Nous montrons que le complémentaire est ouvert en prenant y € A° et en montrant que y 
admet un voisinage contenu dans A° (le fameux théorème 7.8 que nous ne nous lasserons 
jamais de citer). Si y € À°, il y a deux possibilités (non exclusives) : soit y € V soit f(y) < tx. 
Si y € V, alors le voisinage V lui-même est encore dans A°. Si par contre f(y) < tx, alors par 
continuité, il existe un voisinage de y sur lequel f < ty. 


(2) Az est compact L'espace Sl est compact, par exemple grâce au lemme 7.78. La partie A4 
est fermée dans le compact S!, donc elle est compacte par le lemme 7.91. 

(3) Ap11 € Ar Sixe Agy1, alors fe) > tyr1 > tx. Donc f(x) > tt et re Ag. 

Intersection vide Si xe {en Ak, alors f(x) > tx pour tout 4. En passant à la limite et 


en sachant que limxg_, tx = f(a), nous avons f(x) > f(a). Par hypothèse, cela n’est pas. 
Donc 


TR 
Æ 
nr 


(4 = 2: (27.404) 


keN 


Nous avons, dans un compact, des fermés emboîtés dont l'intersection est vide. Le corolaire 
7.88 nous dit qu’il existe un indice à partir duquel tous les Az sont vides. 


Soit Ô = {4 pour un k tel que A4 est vide. Nous avons 
{x e S\V tel que f(x) > 6} = @, (27.405) 


c’est-à-dire que sur $1\V, nous avons f < à et donc 
J F(sY" < Ï S" = Vol(S!\V)5" (27.406) 
Ss1\V si\y 


où Vol(S1\V) — \suv 1 = w(S1\V) est une constante réelle strictement positive. 
Nous avons aussi Ô < f(a) parce que à est un des {4 (et que cette suite croissante converge vers 
f(a) sans l’atteindre par hypothèse). Soit 61 tel que 6 < 81 < f(a)“?. 


Nous posons 
W = {xe S! tel que f(x) > 1}. (27.407) 


49. Dans [638], il prend 8 < 61 < 1 et je crois qu'il aurait dû écrire w(0) au lieu de 1. 
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Cet ensemble n’est pas vide parce qu’il contient a et est ouvert parce que f est continue. Nous 
avons 


J f(s)"ds > Ï f(s)"ds > 8? Vol(W). (27.408) 
S1 W 
Nous avons donc déjà ces deux inégalités : 
J Fe)" < Vol(S!\V)8" (27.409) 
s1\v 
et 
| fs)" ds > 67 Vol(W). (27.410) 
S1 
En ce qui concerne les fonctions f, que nous voulions étudier, 
1 
B( = ( Jer"as) fa" < (Vol(m)6?) (2, (27Au) 
S 
et donc Vol(S\V) / 5 \" 
n\—1 1 n 0 
n < | l _ ; 27.412 
[or < Caen osier - pr (2) (7.412) 
Étant donné que 6 < 61, nous avons (9/61)* — 0. Donc aussi 
lim fnlz)de = 0. (27.413) 


n® Joy 


Le théorème suivant est une version pour S! du théorème 27.70. Le produit de convolution 


dans S1 est la définition 27.100. 
THOoo1AOPooELSNxq 


Théorème 27.106 (1638, 1]). 
Soient (x) une approzimation de l'unité sur Q = St ainsi qu’une fonction g: S! — C. Si g est 
mesurable et bornée sur ( et si g est continue en ao alors 


(ox * g)(ao) — g(ao). (27.414) 
Démonstration. Pour chaque k € IN nous posons 
dr = pr*g—9g. (27.415) 
Le but de ce théorème est de montrer que dy; — 0 pour diverses notions de convergence. 


Soit ap € S!. Par définition de l’approximation de l'unité, Sa wrx = 1 et donc on peut écrire 
g(ao) = Vs g(ao)pk(s)ds. En ce qui concerne d; (ag) nous avons alors 


dx (ao) = le: k(s)g(aos)ds — [ g(ao)prk(s)ds (27.416a) 

= |, 2469) (a(ao8) — g(ao)). (27.A16b) 

Nous pouvons passer à la norme (et non la valeur absolue parce que dy prend ses valeurs dans ©) : 
(ao) < |, 1ek(®Ila(cos) — gtao)las (27.417) 


La définition d’une approximation de l’unité nous permet de considérer M = sup, |wxl1 < 00. Le 
lemme 27.92(2) nous permet, lui, de considérer a > 0 tel que 


[9(a08) — g(ao)| < € (27.418) 
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dès que s € B(1, a) *. Vu que la suite (w4) est une approximation de l’unité, nous avons 


lim lpr| = 0. (27.419) 
k—00 Js1\B(1,a) 


Soit k suffisamment grand pour avoir jou B(1,o) lyr| < €. Avec tout cela nous avons les majorations 


di(ao)l < [,, lex) — gas (274208) 
nn J lpk(s)||g(aos) — g(ao)| ds + ] lpk(s)||g(aos) — g(ao)| ds  (27.420b) 
S1\B(La) _—_— B(L,0) 2) 
<2|g|co <E 
< 2lolx | leu(olds + € | Ivxto)tds (27.420c) 
S1\B(1,a) s1 
< €(1 + 2 gl). (27.420d) 


Nous avons donc bien limg_,+ [dg(ao)| = 0 et donc la continuité de w4 * g en @o. 


Voici une version un peu forte sous l'hypothèse de continuité. Vu que S! est compact, la 
continuité est en réalité une hypothèse assez forte : ça implique l’uniforme continuité et l’existence 
d’un maximum et d’un minimum. 


Proposition 27.107. 
Soient (x) une approximation de l’unité sur Q = S! ainsi qu’une fonction coque re À OOBDu 


(1) Sige LP(Q) (0 < p < æ) et si g est continue, alors”! 


PATES (27.421) 
ITEMooLOSVooDtaugF 

(2) Si g est continue sur S!, alors 
p*g 9 (27.422) 


Démonstration. En plusieurs points 


(1) lims-,1 |ru(g) — g] = 0 Ceci est un petit point intermédiaire. Pour des besoins de notations, 
nous posons 


Tag): $C 
se (27.423) 
pour u € S1. 


La fonction g est continue sur le compact S!, et y est donc uniformément continue °?. Nous 
allons en déduire que lim,-,1 |Tu(g) — glo = 0. 

Soit € > 0. L'uniforme continuité de g signifie qu’il existe 9 > 0 tel que pour tout a € S! 
si s € B(a,d), alors gs) — g(a)| < €. Si u € B(1,0) nous avons aussi u € B(1,0) et donc 
su € B(s,0); ça c’est le lemme 27.88(2). 

Pour tout a € S! nous avons la chaine 


ue B(1,6) = au e B(a,6) = |g(aü) — g(a)| < €. (27.424) 
Cela étant valable pour tout a, c’est encore valable en passant au supremum ** : 
ue B(1,6) = sup |g(aü) — g(a)| < € (27.425) 
aeSt 


50. Notez que s € B(1, à) si et seulement si 8 € B(1,a). Il n’y a donc pas d’incohérence entre l’hypothèse sur s et 
notre condition sur g(aoS) 

51. Vous noterez les p € ]0,1[ en bonus par rapport au cas de R". 

52. Théorème de Heine 12.81. C’est fondamentalement ce fait qui unifie les parties (1) et (2) de cette preuve. 

53. Notez l'inégalité qui n’est plus stricte. 


27.8. 
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et donc d’accord pour 
din [ra(9) — gl = 0. (27.426) 


del — 0 Nous prouvons la convergence uniforme sur S! de dy vers zéro. Ensuite nous 
verrons que la compacité de S1 permet d’en déduire les points (1) et (2). 


En utilisant la notation 7,, nous pouvons écrire 


ds) = | extog(n)de —g(s = [ext ( g(e7) -a(s))an. (27.427 
=Tu(g)(s) 
et donc 
lde(s)| < J lpatu)lIre(9) — gleodu. (27.498) 
S1 


Nous posons M = supz |w4l1, et nous considérons ô tel que |r,(g) — gl < € pour tout 
u € B(1,6). Ensuite nous subdivisons S! en B(1,6) et B(1,6)° : 


dx < Ï lox(u)| Îru(g) — 9/00 du + ] lpx(u)|Îru(g) — glodu (27.429a) 
B(1ô) e B(1,6)° 
< «M + 2[dls ] balée (27.429b) 
(De 
< E(M + 2|g|>) (27.429c) 


parce que pour chaque s € S! nous avons 7,(g)(s) — g(s) et donc |r,(g) — gl < 2]gloo. 


Tout cela montre que dx Ile 0. 


Convergence LP, 0 < p < © 


Soit € > 0. Nous avons 
ldulg < | lex ne -(o'as (27430) 


Il existe un k à partir duquel |@x + g — g|x < €. Pour de tels k nous avons 
Idx|5 < €. (27.431) 


Ce passage est très possible dans le cas de Sl parce que Va 1 = 1. Dans le cas de R‘, 
c'est pas du tout bon; c’est pour cela que nous avons un résultat un peu plus fort dans 
ST. La croissance de la fonction puissance (proposition 12.413) nous permet de conclure que 
Idkln < €. 

Nous avons donc la convergence L? pour 0 < p < 00. 


Convergence L° 


Non, la convergence L® n’est pas la convergence pour la norme |.].. Voir la sous-section 
27.3.3. Il n’en reste pas moins que si € > 0 et si k est assez grand pour que | fx — fls < €, 
nous aurons 


No(fe — f) < |fk — | < €. (27.432) 


27.8.6 Base hilbertienne (suite des polynômes trigonométriques) 


Voici le plan pour la suite : 


— Construire un polynôme trigonométrique qui vérifie les hypothèse du lemme 27.105. 


— En déduire une approximation de l’unité constituée de polynômes trigonométriques. 


— Dire que si f e L?(S1), alors f + est un polynôme trigonométrique dès que 44 en est un. 
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— Invoquer le théorème 27.106(1) pour déduire que w, * f est une suite de polynômes trigono- 
2 
métriques dans L?(S1) qui converge 4 + f Le, J. 
LEMooQQILooWlhntZ 
Lemme 27.108. 


La fonction P = ei + e_1 est continue à valeurs réelles sur S!. 
Démonstration. Nous avons e1(2) = z et e_1(2) = 271, c’est-à-dire que pour z = e* (x € R), nous 


avons e_1(e*) = e-, de telle sorte que, en utilisant le lemme 18.11 qui donne e** en termes des 
fonctions trigonométriques usuelles : 


(e1 +e_1)(e®) = ef + 6e = cos(x) + isin(x) + cos(x) — isin(r) = 2cos(r). (27.433) 


Nous avons donc la continuité et les valeurs réelles. 


LEMooIDTVooYTpfEm 


Lemme 27.109. 
Il existe un polynôme trigonométrique à valeurs dans [0,o[ et tel que f(a) < f(1) pour tout a Æ 1 
dans S. 


Démonstration. Le lemme 27.108 nous dit déjà que P = ei + e_ est continue à valeurs réelles. Or 
qui est continue sur un compact (ici S!), atteint donc ses bornes. Il est donc facile de considérer °{ 
M > 0 tel que Q = M +e; +e-_1 est à valeurs dans [0,!. 

Une forme explicite de Q est que 


Q(e*) = M +2 cos(r). (27.434) 


Le maximum de cos(x) est obtenu en x = 0 et vaut 1. Le maximum de Q est alors Q(1) = 2+M.II 
n’est atteint qu’une seule fois sur S! parce que pour avoir Q(e“*) = 2+ M, il faut avoir 2 cos(r) = 2, 
c'est-à-dire x = 2km. Mais ef2KT = 1. 

Donc Q(a) < M +2 = Q(1) pour tout a £ 1 dans S1. 


Proposition 27.110. 
Les polynômes trigonométriques {en }nez forment une base hilbertienne de L?(S1). 


Démonstration. Le fait que les e, soient orthonormée est la proposition 27.95. Il reste à prouver 
que ce soit un système total. 
Soit fe L?($1). Soit un polynôme Q vérifiant le lemme 27.109 ; nous posons 


pk(z) = 4e a") L (27: (27.435) 


Cela est une approximation de l’unité par la proposition 27.105. Les 4 sont des polynômes trigo- 
nométriques parce que les Q” le sont et que que fai Q"' est seulement un nombre. 
Le lemme 27.104 nous dit alors que pour tout k, la fonction 


pk*f (27.436) 


est un polynôme trigonométrique. 


Nous nous permettons de confirmer la remarque 27.97 comme quoi il faut bien tous les e, avec 
n € Z, parce que le polynôme trigonométrique Q est bien construit à partir de e1 + e_1. 


54. Par exemple, M est le maximum de |P|. 
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27.8.7 Convolution, bis 
LEMooLUBQooWLMFrN 


Lemme 27.111. 
Nous considérons l'application 
p:R—S! 


des Et. 


(27.437) 


Soient t,u € R tels que g(t) = qu). Alors pour toutes fonctions pour lesquelles les intégrales 
convergent, 


dô 


27 27 d0 
L'upouwot-0-[ voH@ucau-0. (748) 
0 0 


Démonstration. Si ç(u) = w(t), alors u = t+2k7 pour un certain k € Z. Cette condition implique 
que p(t — 0) = pu — 8), et donc l'égalité 


27 d0 27 d0 
L'épbwat-9%-[ GoHbuonu-0. (743) 
Définition 27.112 (Convolution sur S1). 
Le lemme 27.111 permet de définir 
L do 
COS NOCUUEU (27-440) 
0 


pour toutes les paires de fonctions f,g € Fun(S!,C) pour lesquelles l'intégrale converge. 


27.9 L’espace de lebesgue L?([a,b]) 


L'espace L?([a, b]) est l’espace générique sur lequel nous allons construire les espaces L? sur 
[—-T,T] et [0,27]. Pour fixer les idées, nous considérons b > a. 

Si f et g sont dans L?([a, b]), il n’est pas possible de définir f x g par la formule intégrale 
usuelle parce que f(x0 + t) n'existe pas pour tout x et t dans [a,b]. Donc soit nous utilisons un 
truc pas très net comme étendre les fonctions sur [a,b] en fonctions périodiques sur R, soit nous 
intégrons vraiment seulement sur [a, b|. 

Nous n’allons suivre aucune de ces deux voies ou plutôt les deux en même temps. Nous allons 
seulement tout ramener de S! que nous venons de travailler. 


Proposition-Définition 27.113. 

Sur [a,b] nous considérons la mesure de Lebesgue dx usuelle. Si f,g € L?([a, b]). alors 
(1) fge L'([a.b]), 
(2) La formule 


b 
= J f(x) dr. EnooCRSXoQPEQRAn 


définit un produit hermitien °°. 
Démonstration. Pour le premier point, d’abord ÿ € L?, et ensuite l'inégalité de Hülder 27.33(1) dit 
que fg est dans L!. 
Le fait que la formule donne une forme sesquilinéaire découle des propriétés de l'intégrale. Le 
fait que ce soit hermitien découle du fait que [ f = [ f. 
Et enfin, 


b 
CRD - | |f(x)?dx > 0. (27.442) 


55. Définition 9.172. 
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Si il existe une partie de mesure non nulle À sur laquelle f # 0, alors 


b 
2 2 2 
Il F2 = [ui + | a (27.443) 


Le premier terme est strictement positif, alors que le second est positif ou nul. Donc le tout est 
strictement positif. 


27.114. 
Il y a (au moins) deux conventions possibles pour le produit scalaire : 


b 
= J f(&)3(x) de EnookJLHog pere E 


et 


b 
— — | Hate EQooSJJEoe}GanG 


L’argument en faveur de (27.444). Il est plus facile d’être cohérent avec les espaces LP(Q, À, u). En 
effet, pour de telles espaces, on a vite u(Q) = 0 et donc du mal à mettre un coefficient CO) dans 
la définition de la norme. Voir la définition 27.9. 

L’argument en faveur de (27.445). Le facteur dx a les mêmes unités que b— a. En mettant donc 


le facteur b — a, le tout a les unités de fg, comme il se doit pour le produit scalaire. 


PROPooLNALooSVNMfe 
Proposition 27.115. 
Nous considérons 
s: [a,b] — [0,27] 
z—a (27.446) 
T+ 2T 
b— 
ainsi que l’application usuelle 
w: [0,2r[ — S! 
; i (27.447) 
> €. 
L'application 
: L?([a, b]) — L?(51 
( D A (27.448) 


(P)(2) = F((8 7 0 p7")(2)) 
est une bijection isométrique. 


Démonstration. La preuve du fait que @ est isométrique suffira pour prouver qu’elle prend bien 
ses valeurs dans L?(51). 


(1) Isométrique C’est un calcul : 


lb? = of), CF) (27.449a) 
= [ éCPIE (27.449b) 
LUC OR (274490) 

27 
= _ {Tout ow)(u)) Pau (27.449d) 

27 
- _ = L(su)) Pau (27.449e) 


Il est temps de faire le changement de variables y = s-l{u), c’est-à-dire 


y = —u + a. (27.450) 


56. Nous le faisons de façon un peu informelle ; soyez capable de bien justifier. 
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En ce qui concerne la différentielle, 


dy = du (27.451) 


et pour les bornes, si u = 0 alors y = a et si u = 27, y = b. Donc 


LP 2 
PO RCE (27-452) 
b 
= — | If (27.452b) 
= |f{?. (27.452c) 


(2) Injectif Soit f telle que O(f) = 0. Alors pour tout z € S! nous avons 


f((s 7 0p7")(2)) = 0. (27.453) 


Vu que slot: S1 > [a,b[ est une bijection, pour tout u € [a,b[ nous avons f(u) = 0. 
Donc f = 0 dans L?([a, b]) parce que du point de vue de L?, que l’on prenne ou non les 
bornes, ce n’est pas important. 


(3) Surjectif Si ge L?(S1), alors en posant 


f{u) = g((p 0 s)(u)) (27.454) 


nous avons g = (f). 


Définition 27.116. 
En ce qui concerne le produit de convolution, si f et g sont des fonctions sur [a,b] nous définissons 


fx g= 0" (of) + (g)) (27.455) 
tant que les formules ont un sens. 


Définition 27.117. 
Le système trigonométrique sur [a,b] est l’ensemble de fonctions 
eg: [ab] — © 


1 2xiht/(b-0) 
Vb—a 


(27.456) 


tr 


pour k € Z. 


27.118. 
Pour prouver que ce système est une base hilbertienne, il faut prouver que c'est orthonormal et 
total. Pour prouver que le système est total, il y a (au moins) trois moyens. 


(1) Prouver que le système est orthonormal maximal et invoquer la proposition 25.37(1). Cela 
est fait dans [655]. 


(2) Prouver que le système trigonométrique sépare les points pour la densité dans les fonctions 
continues. Ensuite travailler comme dans [656]. 


(3) Adapter le théorème 27.81 pour prouver directement la densité des polynômes trigonomé- 
triques dans Z?([a, b]). 
THOooAVWTooDhnjpN 
Théorème 27.119 ([655]). 
Le système trigonométrique {ez}xez est une base hilbertienne de L?([a, b]). 
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Démonstration. En vertu de la proposition 25.37(1), ils nous suffit de prouver que {ex }zez est une 
famille orthonormale maximale. 


(1) Orthonormale Nous calculons le produit : 


b b 
ee : - _ J Q2rikt/(b—a) —2rilt/(b—a) 4 2 _ J C2rit(E)/(b—a) jy. (27.457) 


Justifications. 


i 


—— Le complexe conjugué de e" est e# par le corolaire 18.13. 


— Les exponentielles sont « fusionnées » avec la proposition 18.9(2). 


Si & = ! nous avons 


1 b 


Si k Z | nous pouvons continuer avec une primitive. Une primitive de e% est Left. Dans notre 
cas, en regroupant toutes les constantes sous le nom C' nous avons : 


en -0 eee 7. Cus E : in ne) (27.459) 
Cela vaut zéro. Vous n’y croyez pas ? Faites un effort, relisez le corolaire 18.24, et remarquez 
que 

27ra(k—{l)  2rb(k—1i) 


= 2n(k — |) € 272. (27.460) 
b—a b—a 


(2) Maximale Nous devons prouver que pour tout f € L?([a,b]) (autre que f = 0), il existe 
k € 7 tel que (eg, f) = 0. Autrement dit, nous supposons que ex, f) = 0 pour tout k, et 
nous allons montrer que f = 0. Nous allons largement confondre f e L? et une fonction f 
qui représente la classe. 


Pour le reste, voir [655]. 


27.10 Sur [0,27| 


Le produit de convolution est un peut subtil parce que f(t — x) n’est pas défini à priori pour 
tout t,æ € [0,2x[, vu que f n’est définie que sur [0,27[. Au moins trois solutions s’offrent à nous : 


— considérer implicitement la fonction prolongée par périodicité. 


— considérer les fonctions sur R/27, et définir un peu toutes les opérations modulo 27 (fasti- 
dieux) 


— utiliser une bijection ayant les bonnes propriétés avec $1 sur lequel tout est déjà fait. 


Nous sélectionnons la troisième voie. Pour cela nous considérons la fonction (attention, elle n’est 
pas tout à fait la même que celle plus haut) 


HOT 8! 
en : (27.461) 
= € 
qui est une bijection par la proposition 18.61(1). Pour le produit de convolution, 
(F x g)(x) = (fo) + (gow")(y(x)) (27.462) 


pour toutes les fonctions f,g: [0,27[ — € pour lesquelles les intégrales en jeu ont un sens. 
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27.11 Sur [-T,T| 


Pour rappel, les éléments de L? sont des classes de fonctions à valeurs dans C. 
PROPooHNJZooGfRCFU 


Proposition 27.120. 
Les fonctions 


(27.463) 


forment une base hilbertienne®T de L?([-T, TT). 


Démonstration. C’est un cas particulier du théorème 27.119. 


27.11.1 Le cas dans [0,27] 


En pratique, nous n’allons pas souvent travailler avec des fonctions sur intervalle symétrique 
[-T,T], mais le plus souvent nous serons sur [0,27]. 

Nous notons ici une conséquence du théorème 27.44 dans le cas de l’espace L?. La proposition 
suivante est une petite partie du corolaire 25.51, qui sera d’ailleurs démontré de façon indépendante. 


Proposition 27.121. 
Si nous avons une suite de réels (ax) telle que DK plax|? < © alors la suite 


alt= > ae (27.464) 
k=0 


converge dans L?(10,2r[). 


Démonstration. Quitte à séparer les parties réelles et imaginaires, nous pouvons faire abstraction 
du fait que nous parlons d’une série de fonctions à valeurs dans € au lieu de R. 
Un simple calcul est : 


27 M m 


fn — fn < | SN larPdr < 27 Ÿ° [arf FF 168) 
0 K=n k 


=n 


Par hypothèse le membre de droite est [sn — s1| où sx dénote la suite des sommes partielles de 
la série des |az|?. Cette dernière est de Cauchy (parce que convergente dans IR) et donc la limite 
n — © (en gardant m > n) est zéro. Donc la suite des f, est de Cauchy dans L? et donc converge 
dans 1? 


27.122. 
Adaptons tout cela pour l’espace L?([0, 2r]). Nous posons 
27 
—— EQooBFKDo C 
9 = |" 1074 PAG) 

Fi 1 EQooKMYO RG 

De ==", de CF. 46 4) 

n(0 = ee CTA0T) 
27.123. 


Attention que e, (x) n’est pas exactement e”? : il y a un coefficient. Lorsque ça a un sens, la théorie 


de Fourier permet d'écrire 


fe = year (27.468) 


57. Définition 25.27. 
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Ici les c,(f) sont les coefficients de Fourier de f. Ce développement n’est pas le même que 


f{æ) = Ÿ an(fhen(x). (27.469) 
nez 
Dans cette dernière égalité, les a,(f) ne sont pas les coefficients de Fourier, mais an = {f,en). Le 
lien entre les deux est fondamentalement l’objet du corolaire 28.18. 


L'importance du système trigonométrique défini en 27.76 est d’être une base de L?([0,2r]), 


comme précisé dans le lemme suivant. 
LEMooBJDQooLVPczR 


Lemme 27.124. 
Le système trigonométrique {e»}nez est une base hilbertienne Ÿ de L?([0, 2r]). 


Démonstration. Cas particulier du théorème 27.119. 


Note : le théorème 28.8 donne aussi la densité, mais sera démontré plus tard, indépendamment. 
Voir aussi les thèmes 33 et 45. 
Pour un élément donné f € L2([0;, 2r]), nous définissons 


Snf = D (fexdex (27.470) 


k=-n 


et nous avons le théorème suivant, qui récompense les efforts consentis à propos de la densité des 
polynômes trigonométriques dans Z?. 

ThoYDKZLyv 
Théorème 27.125. 
Soit f € L?([0,2r]). Nous avons égalité*° 


J = D Cn(F)en EqSP EPA) 


neZ 


dans L?. 
Nous avons aussi la convergence 


AE FAT) 


Démonstration. Le système trigonométrique {e, }nez est total pour l’espace de Hilbert L? ([0, 2r]) 
(sans périodicité particulière). Donc le point (1) du théorème 25.46 nous donne l'égalité demandée. 
La convergence (27.472) est une reformulation de l'égalité (27.471). 


27.126. 

Obtenir la convergence L? ne demande pas d’hypothèses de périodicité : la convergence (27.472) 
est automatique du fait que le système trigonométrique soit total. Ce n’est cependant pas plus 
qu’une convergence L? et elle ne demande pas f(0) = f(27), même si pour chacun des ex nous 
avons ez(0) = ex(2T). 

Si f(2r) # f(0), alors il existe tout de même une suite (f,) convergente vers f au sens L? telle 
que fh(0) = f,(2r). Cela ne contredit en rien le fait que ez(0) = ez(2r) parce que dans L?, la 
valeur d’un point seul n’a pas d'importance. 

Si nous voulons une vraie convergence ponctuelle ou uniforme (S, f)(x) — f(x), alors il faut 
ajouter des hypothèses sur la continuité de f, sa périodicité ou le comportement des coefficients 


Cn. Voir aussi le thème 72. 
EXooQDWUooLtulOm 


Exemple 27.127. 
Sife L?([0, 2r |) est (la classe de) une fonction à valeurs réelles, alors on peut la développer avec 
nettement moins de termes. D’abord nous savons que e_» = €, et donc 


(F,En) = (f,E-n), (27.473) 


58. Définition 25.27. 
59. Notons que la somme sur Z dans (27.471) est commutative ; il n’est donc pas besoin d’être plus précis. 
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ce qui donne 


f = D (f,en)en = D (f,Enden + D (f,En)en + (F,en)eo = D, R((F,enden). (27.474) 


neZ n>0 n<0 neN 


Notez que f étant supposée réelle et eg étant la fonction constante (réelle) 1/27, le terme n = 0 
est bien réel. 
Or 
1 su d a EQooMWJNooSjP 
RC: Enden) = SEE cos(nx) ! f(t) cos(nt)dt — Sue sine) | f(t) sut dE TASER 
Considérons la fonction impaire f € L?([-27, 2r]) créée à partir de f. Elle se développe de 


même et nous avons la même formule (27.475) à part quelques coefficients et le fait que les intégrales 
sont entre —2r et 27. Vu que f est impaire, l'intégrale avec cos(nt) s’annule et 


f(x) = » Cn Sin(nx) (27.476) 
neN 
pour certains coefficients réels c,. Cette égalité est à considérer dans L?, c’est-à-dire presque 
partout et en particulier presque partout sur [0,2x|. 
Donc les fonctions réelles sur [0, 2x] peuvent être écrites sous la forme d’une série de seulement 
des sinus. 
Note : en choisissant f paire, nous aurions eu une série de cosinus. PA 


27.12 Théorème de la projection normale 


27.12.1 Espace uniformément convexe 
DEFooUPQBooBhufew 


Définition 27.128 (Espace uniformément convexe[657]). 
Un espace de Banach B est uniformément convexe si il existe une fonction 8: ]0,0[ — R* 
telle que si 


(A) ll < gl <1, 
(2) Ix—-Y12e, 


alors 
T+Y 


E 


| < y] — ô(e). (27.ATT) 


Lemme 27.129 ([1]). 
Si B est un espace de Banach uniformément convexe, alors pour tout k > 0, il existe une fonction 
ôg: ]0,00[ — R? telle que si 

(1) Ixl < y] < E, 

(2) Ir —vl > €, 


alors 
T+Y 


2 


Démonstration. Nous posons x’ = x/k et y = y/k. Nous avons alors 


| < Au — de): (27.478) 


W-y- Eu, € (27.479) 
L’uniforme convexité de B dit alors que 
x! + y! 
| > Ay1— 8(e/k). (27.480) 
En multipliant cette inégalité par k nous trouvons 
T+Y 
> gl — kÈ(e/k). (27.481) 


Donc en posant ôz(e) = kô(e/k), nous avons le résultat escompté. 
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DEFooMYYLooJyACPL 
Définition 27.130 (Projection normale[657]). 
Soient un espace de Banach B ainsi que V € B. Soit a € B. La fonction 
:V—R 
Ï (27.482) 


ze d(x,a) 


60 


possède un infimum®” m. Six e V est tel que d(x,a) = m, alors x est une projection normale 


de a sur V. 
PROPooDKXVooUoYPgz 


Proposition 27.131 ([657]). 
Soient un espace de Banach B et un sous-espace vectoriel V € B. Si une projection normale de 
a € B sur V existe, alors elle est unique. 


Démonstration. Soient deux projections normales b, b’ de a sur V. 

Si m = 0, alors |a — b] = 0 et [a — b’] = 0, ce qui donne a = b et a = b’. Donc d’accord pour 
b= D. 

Si m > 0 alors nous utilisons l'inégalité |x + y| < |x| + |y| sous la forme 


b+b a—b a—b a—b a—b mm EQooQWJWooVal 
= < = = M. 27.488) 
la + III +5 m0 5 
Mais b+v € V, donc 
b+b/ 
la - | > m. (27.484) 


Nous en déduisons que dans (27.483), toutes les inégalités sont des égalités et en particulier 


b+b! 
| L =. (27.485) 
Nous avons donc les deux égalités suivantes : 
2m = |a — b| + |a — b/| (27.486) 
et 
2m = |b + b' — 2a||. (27.487) 
Cela donne 
la — b] + la — 6] = f(a—b) + (a —#)]. (27.488) 


Vu que B est strictement convexe, cela n’est possible que si a — b = a — b', ce qui signifie que 
Di—<0" 


THOoo00VVooMhzHqd 
Théorème 27.132 ([658, 657]). 
Si B est un espace de Banach uniformément convexe, si V € B est un sous-espace vectoriel fermé 
et siae B, alors a admet une unique projection normale! sur V. 


Démonstration. En deux parties. 


(1) Unicité Soient deux projections normales b et b’ de a sur V. Nous avons |a—b] = |a—b/] = 
m. Si b £ bd’, il existe e > 0 tel que 


lb—bl>e>0. (27.489) 


En posant 
(27.490) 


60. Toute fonction à valeurs positives possède un infimum, c’est la proposition 1.444. 
61. Définition 27.130. 
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nous avons || = |y| = À < 1. L'uniforme convexité de B donne alors 
T+Y 
I I < lyl — &(). (27.491) 
Mais 
1 / 
=(b+0b)—-a 
T+y= DOC (27.492) 
m 
et 
x + yl & 2]yl — 26(e) = 1 — 26(e) < 1. (27.493) 
Nous avons donc prouvé que 
1 
| 5 + D’) — a] < m, (27.494) 
ce qui est impossible parce que cela dirait que Bb est une « meilleure » projection normale 


que b et b!. 


Existence Soient b; dans V tels que |a — b;| — m. Nous supposons (quitte à passer à une 
sous-suite) que 


la — dl < la — de]. (27.495) 


(2a) La suite (b;) converge 


Nous supposons qu’elle ne converge pas. Elle n’est donc pas de Cauchy parce que B est 
de Banach ? et donc complet. Il existe e > 0 tel que pour tout N € Nil existe p,q > N 
tels que 


lb, — dl > €. (27.496) 


Nous effectuons quelque choix. 
(2a.i) nous choisissons q > p de telle sorte que |a — b,| < la — b,|, 


(2a.i) nous choisissons N assez grand pour avoir 


la — 6,| < la — 64] < m. (27.497) 


Nous avons |(a— b,) — (a — b;)| 


= |b, — b,| > €, ce qui avec l’uniforme convexité donne 


I(a — bp) + (a — bg)| 


< |a — b4| — (e). (27.498) 


Donc 


Là EE LC 2 UE ei à 


< 
m< la : 


| < Îla — bq — (e) < m — Ô(e) < m. (27.499) 


Cela signifie que m < m, ce qui est impossible. 


(2b) Conclusion La suite (b;) converge dans B. Vu que V est fermé, la limite est dans VW. 
Cette limite, que nous nommons b, vérifie 


la — b] < la — bx] (27.500) 


pour tout k. Mais comme nous avons m < |a — by] — m, nous avons |a — b| = m, 
c’est-à-dire que b est une projection normale de a sur V. 


62. Définition 7.255. 
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27.12.2 Des inégalités 


Avant d’entrer dans le vif du sujet, nous nous fendons d’une petite étude de fonction. Soit 


o:[0,1| —R 
(L+ 2)" (27.501) 
1+a 


Tr 


Un peu de calcul montre que 


de) __r@- a") 


_ : 27.502 
(x) (1+zx")(1+x) 
LEMooFKKEooDTypUd 
Lemme 27.133. 
Soient a,b > 0 et r > 1. Nous avons les inégalités 
di Sapb) Sa RP). (27.503) 


Démonstration. Pour la première inégalité, nous posons f(x) = a” + x" et g(x) = (a + x)". Nous 
avons f(0) = g(0) = a”, et, en utilisant la fonction f, définite par f,(x) = x, nous avons 


f(x) = ra = rf 1(x) (27.504a) 
gx) =r(a+x) = rfi (a+ x). (27.504b) 


Vu que r > 1, la fonction f,_1 est strictement croissante sur les positifs par la proposition 12.413. 
Donc pour x > 0 nous avons 


f(x) = rfr1(x) < rfr-ai(a + x) = g'(x). (27.505) 


Nous avons donc f(b) < g(b) comme souhaité. 
Nous passons à la seconde inégalité. Le lemme 17.90 nous dit que la fonction f: x + x" est 
convexe. Donc 


dr, b 1 1 
MH | — ; ° 
t(5+3) < 3f)+ 10) An 
De là nous déduisons pr 1 
(a . ) - (a 4"), (27.507) 


c’est-à-dire la seconde inégalité. 


Nous allons démontrer les inégalités de Hanner dans le théorème 27.138. Vu que ce sera un peu 
longuet, nous faisons un lemme. 


LEMooDHRCooQiSpyC 
Lemme 27.134. 
Soient 21,22 € C. Nous avons 
EQooMUXVo 
Lea + 200 + Var — 20 > (ll + [20/) + Île — [21 PSS 
Démonstration. Soient 21,22 € C. Nous posons 
E JKYZ 
d = |21 + 2/? + [21 — 22/7. ue 657 26b) 


Pour |21| et |22| fixés, nous nous demandons quel est le minimum possible de d. 
Si [21] = 0, alors le minimum est 2/2? et si |22| = 0 alors il est 2]z1/P. Pour les autres cas, nous 
posons |2| = a > 0 ainsi quebeR et 0e R tels que °° 


22 = za tbe. (27.510) 


63. Proposition 18.62 
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Nous avons déjà que 21 + 22 = z1(1 + a-lbe) et donc 
[21 + 2| = al1 + a-lbet| = |a + bet| (27.511) 
parce que a > 0. De plus, 


la + beŸ|? = (a + beŸ)(a + be Ÿ) = a? + b? + 2abcos(8) (27.512) 


parce que e* + e—# = cos(0). Nous posons 


d(8) = [a + be“?]P + [a — be“fP. (27.513) 
En développant, 
d(0) = (a? + b? + 2ab cos(0))”/? + (a? + b? — 2ab cos(8))”?. (27.514) 
Trouvons le minimum de cette fonction de 4. D'abord sa dérivée : 
d'(0) = pabsin(0)[ (a? + b°? — 2ab cos(@))?"! — (a? + D? + 2ab cos(8))”?"] (27.515a) 
= pabsin(0)s(0). (27.515b) 


Nous avons s(0) = 0 pour 0 = x/2 et 0 = 37/2. Il faut surtout remarquer que 1 < p < 2, ce qui 
donne £ — 1 < 0. La fonction x — xP/2-T est donc décroissante. Cela pour dire que 


8(0) = (la — 62} 2 (Ja + 22 > 0. (27.516) 


De la même façon, s(x) = —s(0) < 0. Cela permet d'écrire un petit tableau de signe de d’, et de 
conclure que d() a un minimum en 0 et en +. Calcul fait, nous avons 


d(0) = d(x) = la + b[? + |a — bf?. (27.517) 
En reliant à (27.509) nous avons l'inégalité 


Len + 20/P + [1 — [7 > (a + b}P — la — bp. ERooVHRCOR IE RQCE 


Nous rappelons que a = |z1| et que 2 = za tbe, Notons au passage que |z| = b, donc que ce 
que nous dit l’équation (27.518) est que 


[21 + z2|P + [21 — z2[P > (|al + 221)” + [lz1| — 21/7. (27.519) 


Encore dans la catégorie des lemmes pour les inégalités de Hanner, nous avons celui-ci. 
LEMooTCNEooADpNaïi 
Lemme 27.135 ([1, 659]). 
La fonction 
m: ]0, cf — R 
1/ 1/ (27.520) 
ar (a /P+1)P +]a/?P—1}? 


est strictement convexe. 


Démonstration. La fonction 7 est une fonction de classe C'? sur ]0,œ[\{1}. Quelle est sa régularité 
en a = 1? À cause de la valeur absolue, il n’est pas clair qu’elle y soit dérivable. En tout cas, la 
fonction x + |x — 1] n’est pas dérivable en x = 1, mais peut-être que les exposants aident à lisser. 
Nous y reviendrons. 

Afin de suivre les calculs nous introduisons quelques fonctions : 


so(x) = 1+xl/P (27.521a) 
di(x) = 1 — xl/P (27.521b) 
dj(æ) = æ/P 21 (27.521c) 
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Pour les dérivées, nous avons 


so/(x) = = (27.522a) 
di(x) = —50'(x) (27.522b) 
djÿ' (x) = s0/(x). (27.522c) 


Nous divisons les cas selon a < 1 ou a > 1. 


(1) Pour a <1 Nous avons 
n(a) = so(a)? + di(a}?, (27.523) 


et la première dérivée donne : 
n'(a) = p s0'(a) (so(a)?—! — di(a)?7?). ÉROoCLAZOR EEE qUA 


Pour la seconde dérivée nous trouvons d’abord 


(27.525) 
LP 8 *(so(a)? 2 + di(a}?"?). 
p 
À partir de là, le truc est de substituer les expressions suivantes : 
so(a)}?—1 = so(a)?-?so(a) = so(a)?—? + so(a)?—2at/P (27.526a) 
di(a}7? = di(a}P? = a /Pdi(a)? 2. (27.526b) 
Plein de trucs se simplifient et nous obtenons 
— 1 12 
n'(a) = ne *(di(a)P-t — so(a}?—?). (27.527) 
P 
(2) Pour a > 1 Les calculs sont essentiellement les mêmes, en partant de 
n(a) = so(a)? + dj(a}”?. (27.528) 


Les résultats sont : 


n'{a) = pso’(a)(so(a)?? + dj(a)?7?), ÉdooRJLHoegY Et 
et 


= 2 or 2 (dj(a)?-2 — so(a)?). (27.530) 


(3) Résumé pour a £ 1 


Au final, nous avons pour tout a # 1 : 


m'a) = Las 2( — a/PP-2 2 (1 + app?) (27.531) 
p 


Ce qu'il se passe en a = 1 est encore une question ouverte que nous traitons maintenant. 
(4) Pour a = 1 
Les limites des expressions (27.524) et (27.529) en a = 1 sont vite calculées et c’est 271 dans 
les deux cas. Donc la dérivée admet une prolongation continue en a = 1. Nous allons prouver 
que la fonction n est en réalité dérivable en a = 1 et que la dérivée vaut 277. 
Nous nous concentrons sur la partie difficile donnée par f(x) = |xl/? — 1[P. Elle est donnée 
par 
di(x}P six <1 
f(x) = < dj(x} sir >1 (27.532) 


0 six = 1. 
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Si f’(1) existe, alors elle est égale à la limite 


1) — f(1 -— 
FO) = lim 2 ut 2 (27.533) 
e— € 
Les deux limites à calculer sont : 
1 1/p _ 1 p 
lim (CRE ) (27.534) 
E— (Si 
“h 1/p\P 
1—(1 p 
lim ACL Es (27.535) 
€e—0— € 


La première se traite par la règle de l’Hospital 4, et le résultat est zéro. Pour la seconde, il 
faut juste transformer 
(G+e#P-1) (1-(1-h)7) 


ï = ] 27.536 
e0+ € h20+ = (27.536) 


qui se traite également par la règle de l'Hospital. Le résultat est également zéro. 
Donc n est dérivable en a = 1 et la dérivée vaut 7/(1) = 2-1. 
En récapitulant, nous avons 7” > 0 sur [0,œ[\{1}, donc 7/ est croissante sur cette partie (propo- 
sition 12.188). Vu que 1’ est continue sur [0,{, elle est même croissante (strictement) sur tout 
10, cf. 
La proposition 17.86 conclut que n est strictement convexe sur 0, |. 


Toujours dans la catégorie des lemmes pour les inégalités de Hanner, nous avons celui-ci. 


Lemme 27.136 ([659]). 
Soit 1 < p < 2. La fonction 


É:R'xR'—R 


(ab) (al + bU/P)P + jal/p _ gi/rp (27.537) 
est convere. 
Pour rappel, les conventions de données en 1./12 donnent R* = [0,[. 
Démonstration. La fonction € vérifie facilement les conditions suivante : 
— £(a,b) = (b, a), 
E(O, 0) = 0, 
— E(ta,tb) = té(a,b) pour tout t > 0. 
Nous posons 
:R'—R 
L (27.538) 
a+ É(a, 1). 
Le lemme 27.135 dit que 7 est strictement convexe, et le lemme 17.96 conclut que £ est convexe. 
LEMooWIPYooMZqjbn 
Lemme 27.137 ([660]). 
Soit 1 < p < 2. Nous considérons les fonctions 
a: [0,1] — R 
. i (27.539) 
ze (l+z) +(1—zx) 
el 
: [0,1l—R 
Piel : i , (27.540) 
ex P((1+zx)  — (1x). 
Soient ÀA,BER. Nous avons 
a(x)| AP + B(x)|B[P < |A + BP +]|A — BF. (27.541) 


64. Proposition 12.197 


2166 CHAPITRE 27. ANALYSE FONCTIONNELLE 


Démonstration. Plusieurs étapes. 


(1) B(x) < a(x) Nous avons a(1) = (1) = 2P-!. Pour les autres valeurs de x, nous allons 
raisonner avec la dérivée. La valeur de «/(x) est facile à calculer 


Œ'(x) = (p—1)(x +1) 2 (p—1)(1— x} 2. (27.542) 


Pour B’(x) c’est un peu plus lourd. En substituant (1+x)-1 = (1+x)?-2(1+x) et (1-x)P-1 = 
(1— x)P—2(1 — x) nous pouvons regrouper les termes en (1 + x)?-? et (1 — x)?-?. Après un 
peu de travail, 


8x) = ? _ (A 222 (1422). (27.543) 
Cela nous permet de calculer a — B' : 
al(e)— 8e) = (p—D(1+ 5) +2) 2 (1-2) 2). (27.544) 


Vu que 1 < p < 2, le nombre p—2 est strictement négatif ; afin de travailler avec des exposants 
positifs, nous écrivons 


D 1 1 1 
a/(æ) — #'(x) erntts, 1-7) (27.545) 
7 <0 


Nous avons &d'(x) — B'(x) < 0 pour tout x € 0,1]. Du fait qu’en plus nous ayons a(1) = 3(1), 
nous déduisons que a(x) > B(x). 


(2) Une petite étude de fonction Soit RE [0,1]. Nous considérons la fonction 


F:[0,1]—-R 


ze a(x) + RPB(x). GS 


Nous montrons maintenant que cette fonction à un maximum global pour x = R. D'abord 
sa dérivée : 
R P 
F'{&) = (p=1) (a pl fé -) mi (i - (5) ) (27.547) 
6 SR —————_—_—_—_— — 


T 


>0 <0 


Nous avons 

— F'(x) = 0 pour z=R, 
— F'(x) <0pourz >, 
— F'(x) > 0 pour x < R. 


Donc x = R est bien un maximum global. 


RS 
Co 
a 


Pause Nous avons les petits résultats utiles pour commencer à prouver. Petite pause avant 
de commencer ; pas de panique, ça ne va pas être trop violent. 


(4) Pour 0 < B < A Nous devons prouver que 


a(æ) AP + B(x)B? < (A+ Bÿ+(A- BY. FGOOËPKROQ ET SR 
En divisant par 4? et en posant R = B/AÀ, l’inéquation (27.548) est équivalente à 
a(x) + B(x)R? < (1+R}P +(1-R}) (27.549) 


où R € |0 


,1] parce que nous avons supposé 0 < B < A. Nous avons (il y a un petit calcul 
pour F(R)) 


A+R)P+(1-R) = F(R) > F(x) = a(x) + B(x)RF. (27.550) 
ok. 
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(5) Pour 0 < A <B Lorsque 0 < À < B nous avons 


a(x)|AfP + B(x)|B|? = a(x) AP + B(x)B? (27.551a) 
< a(x)BP + B(x) AP surER RÉ AMNER 
<(B+AP+(B- Ay  SUBEGooBPIagPaAinq 
= |A + B[P +14 — Bf?. (27.551d) 


Justification : 


— Pour (27.551b), c’est parce que a(x) > B(x); alors en mettant le plus grand de À et B 
devant le à au lieu du B, nous majorons. 


— Pour (27.551c), c’est l'inégalité dans le cas 0 < B < À, mais en inversant les noms de 
A et B. 


(6) Pour 0 < A = B Toutes les expressions sont continues par rapport à B (fixons x et À). 
Nous avons prouvé pour B < À et pour B > A. Par continuité, l'inégalité est encore valide 
pour À = B. 


(7) Pour A<0, B>0 En posant 4’ = —A nous avons 4’ > 0 et nous pouvons écrire 


|[A+BP+|A-BP=|-4"+BP+|-A4 BP =|B-4P+|B+4'1P > a(x)| AP +8(x) BP. 


(27.552) 
Nous avons utilisé, avec À’ et B le cas déjà prouvé 4',B > 0. 
(8) Pour A>0, B<0 Celui-là, je vous le laisse. 
(9) Pour A <0, B<0 Posez 4 = —Aet B' = —B et hop. 
THOooZRRY00BTBQKW 
Théorème 27.138 (Inégalités de Hanner[659, 660]). 
Soit un espace mesuré (Q, A, u). Soit 1 < p <2 et f,gE LP(Q, A, ji) ; nous avons 
(Lo + 1h)" + Île — el < 1 + 918 + 1 — 91 (27.553) 


Il y a égalité si et seulement si f(t) et g(t) sont colinéaires pour presque tout t. 


Démonstration. Nous supposons que | f|, > |g|, pour fixer les idées. De toutes façons, la symétrie 
des formules nous fait passer de ce cas à l’autre sans difficulté. 
Soit x € [0,1]. Nous écrivons l'inégalité du lemme 27.137 pour À = |f(w)| et B = |g(w)| : 


a(x)|f(w)l? + 8(x)|g(w)P < |f(w) + g(w)f + |f(w) — g(w)f?. (27.554) 
Nous intégrons cela par rapport à w sur Q : 
a()|f1S + 8) < 1f + 915 + 1f — gl. (27.555) 


Et là vient l’idée qu’on se demande ce qui est passé par l’esprit du mec qui a tout combiné : nous 


évaluons cela pour x = ge , ce qui est permis parce que nous avons supposé | fl, > |g|». Faites le 


calcul, collectez les termes identiques, vous obtiendrez 


(Fe + 1glo) + (Pl — lgle) US + 918 + f — gl8. (27.556) 


Et vu que | fl, > |g|», nous pouvons gratuitement faire 


lle — Age = Fl — lgllol: (27.557) 


Fini pour Hanner. 
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27.12.3 Inégalités de Clarkson 
LEMooWEODooLHeVrP 


Lemme 27.139 ([661]). 
Sip>2etsia,be ©, alors 


P P 


a —b 
2 


a + b 
2 


1 
(lal? + |b[?). (27.558) 


Démonstration. Nous prouvons l’inégalité en montant petit à petit en généralité. 


(1) Avec x >0 Soit x > 0. Nous montrons dans cette partie l'inégalité 
EQooDJBN 
x +1<(x+1)72. RoopJENoR EE RES 


Pour cela nous considérons la fonction 


f:[0,0[—R 
tes (PE DER, Ge 


5 nous trouvons vite 


Nous avons f(0) = 0, mais aussi, en utilisant les règle de dérivation ° 
#'G) = p(e? +124 2 ppt, (27.561) 


Vu que (#? + 1)7/2-1 > #2, Je signe de f/(t) est toujours strictement positif pour t{ > 0. La 
proposition 12.188 fait que f est strictement croissante et que f(t) > 0 pour tout t > 0. 


(2) Avec x,y >0 Soient x,y > 0 dans R. Nous prouvons dans cette partie que 
EQooGFGM j 
(a? + PP > a? + y. + 260) 


Il s’agit d'appliquer l'inégalité (27.559) à x/y : 


(CBS deu 


En multipliant par y? et en simplifiant un peu, nous trouvons le résultat (27.562). 


(3) Avec a,be C Nous appliquons l'inégalité (27.562) à x = |%?| et y = [S?]. Cela donne : 


p _pIP 2 _ HN DA 
__ _ [= _ | (27.564) 
2 2\ p/2 
= (2e i20 ) (27.564b) 
1 1 
< ;lalP+ lb. (27.564c) 


La dernière ligne est la convexité de la fonction t — #?/? (lemme 17.90). 


LEMooFGKXooZCHNIn 
Lemme 27.140. 
Si 1 < p < 2, alors l’exposant conjugué q vérifie q > 2. 


Démonstration. Nous considérons q en fonction de p, sur le domaine 1 < p < 2: 


Qi (27.565) 


65. Par exemple celle de la proposition 14.271. 
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Donc % q(1) = 0 et q(2) = 2. Nous étudions ensuite la dérivée : 


1 
! 
g(p)=-— ; <0. (27.566) 
(p= 1 
C’est donc une fonction strictement décroissante. Vues les valeurs aux bornes, nous voyons que 
g(p) > 2 sur tout son domaine. 


LEMooMKIXooVOYaxI 
Lemme 27.141 ([658]). 
Soit 1 < p <2. Pour x,y€e IR nous avons 


Le + gl + fe — y < 2([xfP + lyP)T. (27.567) 


Démonstration. Nous considérons l’exposant conjugué q et p, c’est-à-dire q tel que : + : = 1. Nous 
considérons la fonction 


f:Rx[0,1]—R 


(a,z)r (1 + al-4z)(1 + az)1”! a al-4z)(1 : a). (27.568) 


Cette fonction vérifie EQooRFZQ 
f(L2)=(1+2)9+(1- 299, 657806) 
. FRARTSBROGENCERE 
ainsi que 
CPL 2) = (1 + 200) (1 2 2m) (1 20 D-D)) (14 PTT (27.570) 
= 2(1+ #7) 1, (27.570b) 


Nous montrons maintenant que (2,f)(a,z) < 0 pour tout à € ]0,1[ et pour tout z € ]0,1|. 
C'est du calcul : 
Ô 
LL (a, 2 — (ga (+az)-(1+al2)(1+a2) lat (1-az) + (1-al 2)(1-az) À]. 

a 
(27.571) 

Maintenant nous factorisons (1+a2)% ? grâce à la décomposition (1+az2)9 1 = (1+az)(1+az)9?. 
Notez que le lemme 27.140 donne q > 2, et donc pas de problèmes avec la puissance q — 2. Nous 
continuons le calcul 


Co. z) = (1— q)z(1 + az)? [a 4(1 + az) — (1 + al-1z)] (27.572a) 
+ (1 g)2(1 - a) TT - a (1 — az) + (1— a %2)] 
= (1—g)20 + az) [at + a71tlz 1 - al] (27.572b) 
+ (1 g)2(1 — a) PT - a71 + at #1 — al 12] 
= (1— g)201 + 2) [at — 1] + (1 — g)2(1 — az) ?[1 — à 1] (27.572c) 
= (1—g)z(a 1 —1)[(1 + a2)72 — (1 — az)? 1]. (27.572d) 


Vu que q > 2, la fonction x > 71? est strictement croissante sur les positifs 7, Et vu que az < 1, 
le crochet est strictement positif. Par ailleurs, z > 0, (1— q) < 0 et (a71—1) > 0 donc nous avons 
prouvé que (daf)(@, z) < 0. 

Donc f est décroissante par rapport à a. Vu que z € [0,1] et que p > 1, nous avons #71 < 1 
et donc f(1,z) < f(2- 1,2). Nous y substituons les valeurs calculées en (27.569) et (27.570) : 


(L+ 297 + (1 299 < 21 + PL. Due 2 


Nous pouvons maintenant facilement prouver notre inégalité. 


66. Dire que qg(1) = © est un abus de notations pour parler de la limite p — 1 avec p > 1. 
67. Proposition 12.413. 
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(1) Pour 0<x<y Si0<x< y, nous avons x/yE€ [0,1] et nous pouvons appliquer l'inégalité 
(27.573) à z = x/y. Nous avons successivement : 


(1 + =) + (: - =) < (: + =) (27.574a) 
y y yP 
q _ q P p\ 91 
(° T 4) + (=) < 2 (£ Æ ) (27.574b) 
y y li 
y +) + y y — x) < 2y PA (UP + ap) (27.574c) 
(a + y) + (y x) < 2y PO DT + ap), (27.574d) 


Nous avons utilisé la proposition 12.418 sur la composition de puissances. Maintenant il suffit 
de remarquer que q = p(q — 1) pour avoir le résultat. 


(2) x <0 et y>0 En posant à = —x nous avons 
Rules leur lesr y (27.575a) 
= fx — y + {x + y (27.575b) 
< 2(|x'[P + |yl?) (27.575c) 
< 2(|x[P + [y|P). (27.575d) 


(3) Les autres cas Je vous prie de faire la liste, et d'adapter. 


Pour d’autres preuves du lemme suivant, voir [662]. 
LEMooLTROooVusGte 


Lemme 27.142 ([663]). 
Soient a, be C ainsi que 1 < p < 2. Nous notons q l’exposant conjugué de p. Nous avons l'inégalité 


La + Df9 + Ja — b[? < 2(Jal? + [bP)TT. (27.576) 


Démonstration. Commençons doucement avec le cas b = 0. À gauche nous gardons 2|a|?, et pour 
le membre de droite nous remarquons que 


1 


de telle sorte que 
(la) = JafPE D = aff. (27.578) 


Gardez en tête que, par le lemme 27.140, q > 2; ce sera utile. 
Nous commençons le vrai combat. Vu que |a —b] = |b— a| nous pouvons supposer |a| > |b| pour 
fixer les idées. En utilisant le lemme 18.63, il existe {0 € [0, 5] tel que 


la + b? = lal? + lb|? + 2|a||b] cos(to) 


lab = [al + [2 — 2Jalll cos(éo) Sie 
Nous considérons la fonction 
f:[0,21|—R 
te (la? + lof? + 21allè cos(#))"” + (lal? + lb? — 21allà cos(#))". is. 
Elle vérifie 
F(éo) = (la + bP)%? + (la — bP)92. (27.581) 


Vu que |a+ b| et |a — b] sont positifs, nous pouvons « simplifier » le carré et la racine carré, de telle 
sorte que 
f(to) = la + b[* + la — b]T. (27.582) 
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T 


Nous cherchons un maximum pour f sur [0,7]. Pour cela, nous prenons d’abord la dérivée : 


JD = —glallélsin(e)] (al? + lb? + 2Jallbl cos(#)) "7" — (lal? + lb? — 2jallbl cos(#)) 7]. (27.583) 


Notez que q > 2, donc la fonction x — x%/2-1 est croissante. 

Pour t € [0,7/2], nous avons cos(f) > — cos(t) ainsi que sin(t) > 0. Donc f’(t) < 0. De la même 
manière, nous avons f’(t) > 0 pour te [x/2,7]. 

Par le lien entre dérivée et croissance (proposition 12.189), nous savons que le maximum de f 
sur [0,7] est atteint en O0 ou en x. 

Nous avons, en utilisant la supposition |a| > |b| : 


f(0) = f(x) = (lal? + 1/2 + 2lallb})}2? + (al? + [b2 — 21a/lb|)? (27.584a) 
= (|lal +16)97 + (llal — tell) (27.584b) 
= |lal + 1ef" + [lai — 1If*: (27.584c) 


En particulier f(to) < f(0) et donc 


La + [2 + Ja — d < [la] + 8" + [al — JO < 2 (af + 162) (27.585) 


La dernière inégalité est le lemme 27.141 appliqué aux réels |al et lb]. 


PROPooJDOQooWsG1lkr 
Proposition 27.143 (Inégalité de Clarkson[658]). 
Soient f,g € LP(Q, A, un). 
(1) Si p > 2, alors 
F0 Îf—-39 1 EQooBWDJo 
IE + UE < 3 (IAE + Val) 7.880 
(2) Si1 < p <2 et si q est l’exposant conjugué de p, alors 
g—1 EQooXMWBo 
+8 +1f- 918 < 218 + lal8)" PT) 
ou 
Î +39 = - i EQooZCWDopBn 
UE UE < 2 IE + ge) a) 


Démonstration. En deux parties. 


(1) Pour p>2 Soient f,ge LP(Q, A, y): ce sont des fonctions à valeurs dans C. Pour chaque 
w € ( nous considérons les nombres complexes f(w) et g(w) ; nous pouvons écrire l’inégalité 
du lemme 27.139 : 


2 


DS UCI St 


Nous avons les substitutions évidentes f(w) + g(w) = (f +g)(w) et f(w) — g(w) = (f — g)(w). 
En intégrant alors (27.589) sur ( nous trouvons l'inégalité demandée. 


(2) Pour 1<p<2 Ils’agit de faire la même chose, en utilisant l'inégalité de Clarkson du 
lemme 27.142. 


Pour obtenir (27.588), il s’agit simplement de multiplier et diviser le member de gauche de 
(27.587) par 21. 


2172 CHAPITRE 27. ANALYSE FONCTIONNELLE 


27.12.4 Uniforme convexité des espaces de Lebesgue 
PROPooFNLJooD1yIKV 


Proposition 27.144 ([664]). 


Si 1 < p < wo, l’espace LP(Q, À, u) est uniformément convexe À. 


Démonstration. En deux parties. 


(1) 1<p<2 Nous montrons que la fonction ô(e) = 27% fonctionne. 


Soient f,g € LP telles que fl, < gl» < 1 et |f — gl, > €. Nous commençons par écrire 
l'inégalité de Clarkson (27.587) : 


di _ _ = EQooOWVE 
Sp + fs < 2-68 + par) FRPOON VER ER 


Par hypothèse, | f|, et |g|, sont plus petites que 1. Vu que p > 1, nous avons 


IF + gl <1+1 = 2. (27.591) 


En remplaçant dans le membre de droite de (27.590) nous avons 


J u CICR 1 ; Ta & 21-2991 2 1, (27.592) 


et donc 
| Hors 1 
2 p 


<1-| f ; Jha. ERooKARVoRRE IT 


Par ailleurs nous avons supposé | f — g|, > €. Donc aussi (° 


É ES yg > 2-06. ERoocGPDone Ris 
Et par un autre ailleurs, 
mi F5 1 1 EQooOFWYo 
le = 5 + gle < 3 (Flo + lol) < 1. ) 
Vu que nous avons q > 2, cela donne aussi 


| [+9 LS a +9) je. EtooGMPRonGi LAS 


Avec les inégalités (27.594) et 27.596 nous finissons l'inégalité (27.593) : 


mer 


pis 


<1-—27%1 < |gl» — 6(e). (27.597) 


Ip <| 


Okay, c’est bon. 


(2) 2<p<o Ils’agit de faire la même chose en partant de Clarkson (27.586). Le résultat est 
que la fonction Ô(e) = (e/2)P, ça fonctionne. 


27.12.5 Théorème de la projection normale 
PROPooTZMRooCvQtGg 


Proposition 27.145. 
Si 1 < p < ©, et si V est un sous-espace vectoriel fermé de LP(Q,A,u), alors la projection 
normale ® de a e LP sur V existe et est unique. 


68. Définition 27.128. 
69. Ici j'ai un coefficient un peu différent que celui de [664]. Écrivez-moi pour confirmer ou infirmer mes calculs. 
70. Définition 27.130. 
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Démonstration. La proposition 27.144 nous indique que l’espace LP(Q, A, u) est uniformément 
convexe. Or le théorème 27.132 nous indique que les espaces uniformément convexes vérifient la 
présente proposition. 


Nous pouvons donner une preuve directe, sans passer par l’uniforme convexité, dans les cas 
p > 2. 
THOo00RJFUooQivDKm 
Théorème 27.146 (Théorème de la projection normale[665]). 
Nous considérons p > 2. Soit un sous-espace vectoriel fermé W € LP(Q, A, un) et uo € LP. Nous 
notons 


d(uo, W) = inf, d(uo, W). (27.598) 
WE 
Alors il existe wo € W tel que |uo — wol = d(uo, W). 


Démonstration. Nous allons séparer trois cas : p = 2 et p > 2. 


(1) p=2 Pour p = 2, nous savons que L? est un espace de Hilbert ‘!, et nous avons déjà le 
théorème de la projection 25.7. 


(2) p>2 Pour chaque x € Q nous avons f(x), g(x) € C et donc l'identité du parallélogramme ?? : 


L FC) — ge) + [f(e) + gl? = 217 (0)? + 2/g(o) 2. FOREST ES 


Vu que p > 2, la fonction s: x > x?/? est convexe (lemme 17.90). Calcul : 


fe) — g(x)P + |f() + 9) = (1f(æ) — g(x) 2)? + (|f(æ) + g(x)?)”?  (27.600a) 
s(|...[?) +s(1...? (27.600b) 


< (1f(x) — g(e)P + |f(e) + g(0) 2) PERF 60e) 
= (21 f(x) + 219(x) 2)? SUBEROONES 9 6864) 


= 2/2 (|f(x)[? + |g(x)[2)? (27.600e) 
< 2/22 (| f(œ)P + [g(a)P) SERRE EU 
= 2 (|f(x)P + |g(x)|?) (27.600g) 


Justifications : 

— Pour (27.600c) : la convexité de s. 

— Pour (27.600d) : la relation (27.599). 

— Pour (27.600f) : la seconde inégalité du lemme 27.600f. 
Nous isolons | f(x) — g(x)[? : 


HO OM AtOIETOMEMOET OL SEA) 
E” (re ù \g(x)|P te) ù \g(x) ) (27.601) 


Cette inégalité étant valable pour tout x, nous pouvons intégrer sur ( et découper l'intégrale 


en petits morceaux : 
» + Iglr EQooVNHSo9PX ; 


2 


Voilà une bonne chose de prouvée. Nous pouvons maintenant passer au vif du sujet. 


Soit une suite w; dans W telle que |uo — w;| — d(uo, W). Trois choses à savoir sur cette 
suite : 


(2a) Une telle suite existe parce que d{uo, W) est défini comme un infimum. 


71. Lemme 27.84. 
72. Théorème 11.1 en remarquant que (21,22) + 2122 est un produit scalaire hermitien sur C. 
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(2b) Rien ne garantit qu’elle converge. 
(2c) Même si elle convergeait, rien ne garantirait que la limite soit encore dans W. 


Le troisième point est facile à régler : vu que W est fermé par hypothèse, une suite convergente 
contenue dans W a sa limite dans W. Nous allons régler la convergence de w; en prouvant 
qu'elle est de Cauchy. 


Remarquons que W est vectoriel, donc (w; + wx)/2 est dans W pour tout j et k; donc 


VW + Uk 


5 + — ol > d(uo, W). (27.603) 


| 
En tenant compte de cela, nous écrivons l'inégalité (27.602) avec f = w;—uo et g = wyx—üo : 


lw; — ul? + [lwx — uo|P 
2 


1f — 9l5 = lus — url? < 2? ( d(uo, w)) (27.604) 


Soit € > O0 et O0 < €e1,e2 < € tels que € + €e2 < €. Il existe un N tel que si j,k > N alors 
uw; — wo? < duo, W}P +e1 et fwx — wo? < d(uo, W}P + e2. Pour de telles valeurs de j et k, 
nous avons 


lu, — wxln < 2 (se) 0e, (27.605) 


Donc la suite (w;) est de Cauchy. 
L'espace LP étant complet par le théorème 27.43, nous en déduisons que (w;) converge dans 
LP. Mais comme W est fermé, nous avons w; EL, we W. 


En termes de normes, nous avons 


[uw — uo| = lim uw; — uol = d(W, uo). (27.606) 


27.13 Théorèmes de Hahn-Banach 


27.13.1 Applications R-linéaires et C-linéaires 


LEMooBZHIooSQJSnM 
Lemme 27.147 ([666, 667]). 
Soit un espace vectoriel X sur C. Nous considérons * l'application 
: LR(A,R) — Le(X, C 
V: Lr( ) c( ) n EooLYYGogJfKtEn 
fre fx) —if(ix)]. 
(1) Cette application est bien définie. 
(2) Elle est une bijection. ITEMooNVKBooIChzWM 
(3) Elle vérifie [Y(F)lLecx,©) = ler (XR)- PR 


(4) Si g Ee Lo(X, ©) se décompose en g(x) = u(x) + iv(x) où u et v sont à valeurs réelles, alors 


g = Yu). 
Démonstration. En plusieurs parties. 


(1) Bien définie Nous devons avant tout prouver que (27.607) a un sens : si f € LR(X,R), 
alors nous devons prouver que #(f) € La(X,C), c’est-à-dire que Ÿ(f) est C-linéaire. Soient 
donc x,ye X et a, BE R de telle sorte que « + Bi soit un élément générique de €. Prouver 
que 


DP)Cx + y) = Y(F)(x) + d(P)(y) (27.608) 


73. Voir la définition 4.28 pour les notations. 
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est un simple calcul. Ensuite 


Y(F)((a +iB)x) = f((a+iB)x) — if(i(a + iB)x) (27.609a) 
= af(x) + Bf(ix) — iaf(ix) — i(—8)f(x) (27.609b) 
= (a +i8)(f(x) — if(ix)) (27.609c) 
= (a + iB)p(f)(x). (27.6094) 


(2) Ÿ est injective Soient f,g € Lr(X, R) telles que Y(f) = #(g). Nous avons l'égalité 
(a) — if(ix) = g(e) — iglia), PO TE) 
qui est une égalité dans C. En sachant que les nombres f(x), f(ix), g(x) et g(ix) sont des réels, 


nous séparons les parties réelles et imaginaires dans (27.610) et nous trouvons f(x) = g(x) 
et f(ix) = g(ix). Chacune de ces deux égalités nous assurent que f = g. 


(3) d est surjective Soit g € La(X, C). Nous séparons ses parties réelles et imaginaires : 
g(x) = gi(x) + ige(x). (27.611) 


Avec g1,g2 € £Lr(X,R). Nous allons prouver que g = #(g1). 


Ensuite, utilisant la C-linéarité de g pour calculer g(ix) de deux façon différentes. D'une part 
; - | ; EQooRMJAoo(1 
gx) = gi(ix) + igo(ix), rat) 
et d’autre part EooCJQHo 
g(ix) = i(gi(x) + igo(x)). 701) 
En égalisant les parties réelles et imaginaires de (27.612) et de (27.613), 


gi(x) = g2(ix) (27.614a) 
g2(x) = —gi(ix), (27.614b) 


et en particulier g1(ix) = g2(—x). 
Nous pouvons maintenant calculer 
d(g)(x) = gx) — igi(ix) 
= gi(x) 7 t) 
ne (27.615c 
= ÿ(r): (27.615d 


(4) Norme Nous prouvons maintenant le point (3) qui prétend que |#(f)|zcx,c) = lfll£r (x R)- 
Nous allons montrer les inégalités dans les deux sens. 


(4a) [FT < Ié(F)] 
D'abord nous prouvons que |f| < |4#(f)|. Pour cela, nous considérons x € X, et nous 
écrivons 
LF(x)! <If(x) — ifGx)| = IY(P)xl (27.616) 
dont la première inégalité est vraie parce que f(x) et f(ix) sont réels. Avec cette inégalité 


nous avons tout de suite 
sup |f(x)| < sup [Y(f)xl. (27.617) 


(ab) F1 2 (PI 


Nous passons maintenant à l’autre sens. Soit x € X. Nous commençons par trouver 
ae S1 (c'est-à-dire |a| = 1) tel que f(air) = 0. Si f(ix) = 0, alors a = 1 fait l'affaire. 
Sinon, supposons f(ix) £ 0, et considérons l’application 


s: ]0,2r| —R 


f(p(ia). (27.618) 
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où w est la bijection continue de la proposition 18.61(1). D'une part, pour t{ = x, nous 
avons 


s(x) = f(p(r)ix) = f(—ix) = —f(ix), (27.619) 


et d’autre part, pour t = 0 nous avons 
s(0) = f(w(0)ir) = f{ix) = f(ix). (27.620) 


Comme nous avons supposé que f(ix) Æ 0 le théorème des valeurs intermédiaires 10.89 
appliqué à s donne un t{ € |0,r| tel que s(to) = 0. En posant a = w(t0) nous avons le «a 
qu'il nous fallait. 


Armés de ce a, nous montrons que |#(f)| < | f|. Nous avons 


lb(P}zl = lallu(f)xl (27.621a) 
= |Y(f)(ax)| #(f) est C-linéaire (27.621b) 
= |f(ax) — if(iax)| (27.621c) 
= |f(ax)|. (27.6214) 


Nous avons prouvé que pour tout x € X tel que |x| = 1, il existe y € X tel que [y] = 1 
et [Y(f)x| = |f(y)l. En l'occurrence, y = ax. Notez que a est une fonction de x. Nous 
avons donc 


sup |f(y)| > sup [V(f)x|, (27.622) 
Iyl=1 lel=1 


autrement dit |f| > |w(P)I. 


(5) Décomposition Nous prouvons le point (4). Supposons g(x) = u(x) + iv(x). Nous avons 
glix) = ig(x) par C-linéarité de g. Donc 


u(ix) + iv(ix) = i(u(x) + iv(x)), (27.623) 


c’est-à-dire u(ix) +iv(ix) = iu(x) — v(x). En égalisant les partie imaginaires, v(x) = —u(ix). 
En remettant dans l’expression de g, 


g(x) = u(x) + iv(x) = u(x) + i( — u(ix)) = u(x) — iu(ix) = p(u)r, (27.624) 


ce qu'il fallait démontrer. 


LEMooUFMFooEXecXE 
Lemme 27.148 ([666]). 
Soient un espace vectoriel X sur € ainsi qu'une seminorme * p. Soit f € Lr(X,R). Nous avons 


IH(P)(x)| < p(x) VreX (27.625) 


si et seulement si 


(f(x) <p(x) Vre X (27.626) 


Démonstration. En deux parties. 


(1) = Nous supposons que f € LR(X,R) vérifie [d(f)(x)| < p(x) pour tout x. L'observation à 
faire est f(x) = Re (#(f)(x)). Nous avons alors © 


f(x) = Re ((F)())1< Té(P)(æ)l < px). (27.627) 


74. Définition 7.311. 
75. Dans [666], l'auteur sépare le calcul en deux parties : une majoration pour f(x) et une pour — f(x). Je ne vois pas 
où est le mal à la faire d'un seul coup. 
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(2) = Nous supposons que |f(x)| < p(x) pour tout x. Soit x € X. Si d(f)(x) = 0, alors nous 
avons bien [d(f)(x)| < p(x) parce qu’une seminorme est toujours positive. Nous supposons 
donc que d(f)(x) # 0. 

La décomposition polaire (proposition 18.62) du nombre complexe 4(f)x donne un 0 € R tel 


que (f}r = eihw(f}r|. Donc 
POOE A OOET UC) or 76 0S 


Ces égalités montrent entre autres que Y(f)(e—Ÿx) € R*; et en particulier, il est égal à sa 
partie réelle. Vu la définition (27.607), ça nous dit que 


B(F(e x) = f(e x). (27.629) 
Nous pouvons alors continuer les égalités (27.628) en mettant des normes partout : 


CP) = lb(P(e x) = fe x)l < p(e x) = le Ÿp(x) = p(x). (27.630) 


27.13.2 Hahn-Banach, théorème d’extension dominée 
THOooXALCooFrkvDo 


Théorème 27.149 (Hahn-Banach, extension dominée cas réel[668, 230]). 
Soit E, un espace vectoriel réel et une application p: E — R satisfaisant 


(1) p(Ax) = Ap(x) pour tout x € E et pour tout À > 0, 
(2) p(x + y) < p(x) + p(y) pour tout x,ye E. 


Soit de plus M © E un sous-espace vectoriel muni d’une application g: M — R vérifiant g(m) < 
p(m) pour tout m € M. Alors il existe f € L(E,R) telle que 


(1) L'application f étend g : f(m) = g(m) pour toutme M, 
(2) L'application f reste dominée par p : f(x) < p(x) pour tout x e E. 


Démonstration. Si À est une application linéaire définie sur un sous-espace de Æ, nous notons D} 
ledit sous-espace. 


(1) Un ensemble inductif 


Nous considérons P, l’ensemble des fonctions linéaires suivant 


M € Dy 
P= {n: D} — R tel que 4 h(m) = g(m) VmeM } (27.631) 
h(x) < p(x)  Vre Dh 


Cet ensemble est non vide parce que g est dedans. Nous le munissons de la relation d’ordre 
h1 < h2 si et seulement si Dy, € Dp, et h2 prolonge h1. Nous montrons à présent que P est 
un ensemble inductif. Soit un sous-ensemble totalement ordonné Q € P; nous définissons 
une fonction À de la façon suivante. D'abord D} = supxo D} et ensuite 


h: D —R 


27.632 
zx l(x) sixeD, ) 


Cela est bien défini parce que si x € D; n Dy alors, vu que Q est totalement ordonné (i.e. 
t < lou l’ < 1), on a obligatoirement D, € Dy et l’ qui prolonge { (ou le contraire). Donc 
k est un majorant de Q dans P parce que h > { pour tout ! € Q. Cela montre que P est 
inductif (définition 1.22). Le lemme de Zorn 1.23 nous dit alors que P possède un élément 
maximal f qui va être la réponse à notre théorème. 


76. Ce n’est pas tout à fait une seminorme (définition 7.311) à cause de la valeur absolue. Le théorème 27.151 
parlera pour les vraies seminormes, et pour les espaces sur C. 
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Le support de f 


La fonction f est dans P; donc f(x) < p(x) pour tout x € D} et f(m) = g(m) pour tout 
m € M. Pour terminer nous devons montrer que D} = E. Supposons donc que D} Z E et 
prenons z0 # D. Nous allons contredire la maximalité de f en considérant la fonction À 
donnée par D} = D} + Rxo et 


h(x + txo) = f(x) +ta (27.633) 


où « est une constante que nous allons fixer plus tard. 
Nous commençons par prouver que h est dans P. Nous devons prouver que 


h(x + tro) = f(x) + ta < p(x + txo) ETES 
Pour cela nous allons commencer par fixer & pour avoir les relations suivantes : Nes 
f(x) + a < p(x +  Dcssdns (27.635a) 
f(x) — a < p(x — to) (27.635b) 
pour tout x e D. Ces relations sont équivalentes à demander a tel que 
a < p(x + xo) — f(x) (27.636a) 
a > f(x) — p(x — xo) (27.636b) 
Nous nous demandons donc si il existe un a qui satisfasse 
ne (F (y) — p{y — xo)) < à < 4 (p(z + zo) — f(2)). (27.637) 
Ou encore nous devons prouver que pour tout y,z € D}, 
p(z + to) — f(x) > f(y) — p(y — xo) > 0. (27.638) 
Par les propriétés de p et de f, 
p(z + 0) + p(y — to) — f(z) — f(y) > p(z + y) — F(z + y) > 0. (27.639) 


La dernière inégalité est le fait que f € P. Un choix de a donnant les inéquations (27.635) 
est donc possible. 


À partir des inéquations (27.635) nous obtenons la relation (27.634) de la façon suivante. Si 
t > 0 nous multiplions l'équation (27.635a) par t : 


Lf(x) + ta < tp(x + to). (27.640) 


Et nous écrivons cette relation avec x/t au lieu de x en tenant compte de la linéarité de f : 
z 
f(x) + ta < pe + 20) = p(x + tx). (27.641) 


Avec t < 0, c’est similaire, en faisant attention au sens des inégalités. 


Nous avons donc construit h: Dn — R avec h € P, Dr € Dy et h(x) = f(x) pour tout 
x € D}. Cela pour dire que h > f, ce qui contredit la maximalité de f. Le domaine de f est 
donc E tout entier. 

La fonction f est donc une fonction qui remplit les conditions. 


Lemme 27.150 ([247|). 
Soient un espace vectoriel complexe X, et une application linéaire f: X — C. Il existe une appli- 
cation u € Lr(X, R) telle que 
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(1) Pour tout x € X, nous avons 
f(x) = u(x) — iu(ix) (27.642) 


(2) Nous avons égalité des normes? 


lflcocx,o = lulzr (AR) (27.643) 


Démonstration. Nous décomposons, pour chaque x € X, l'élément f(x) en parties réelles et ima- 


ginaires : 
f(x) = u(x) + iv(x). FAoozJZTongnite 


Il ne reste plus qu’à trouver le lien entre u et v. Pour cela, nous écrions f(ix) = f(x) en substituant 
f(x) et f(ix) par leurs valeurs en termes de u et v : 


u(ix) + iv(ix) = iu(x) — v(x). (27.645) 
En égalisant les parties réelles, nous avons u(ix) = —v(x) et donc bien 
f(x) = u(x) + iv(x) = u(x) — iu(ix). RE DFE) 


Nous prouvons maintenant que w est R-linéaire. Il suffit de considérer À € R et d'écrire f(Ax) = 
Af(x) en substituant (27.644) pour f(Ax) et f(x) : 


u(Xx) + iv(Ax) = A(u(x) + iv(x)). (27.647) 


En égalisant encore les parties réelles, nous avons u(Ax) = Au(x). Nous faisons de même pour 
prouver que u(x + y) = u(x) + u(y). 


THOo0VQLJooWuBMoz 
Théorème 27.151 (Hahn-Banach complexe[247]|). 
Soient un espace vectoriel X sur K (qui est R ou C), et une seminorme p: X — R. Soient un 
sous-espace vectoriel M de X ainsi qu’une application linéaire LE L(M,K) telle que 


lé(m)| < p(m) Vm € M. (27.648) 


Alors il existe une extension linéaire f € L(X,K) telle que 
(1) f(m) = {(m) pour tout me M, 
(2) |f(x)| < p(x) pour tout x € X. 


Démonstration. Nous considérons X comme espace vectoriel réel (de dimension double de celle de 
X comme espace vectoriel réel). Là-dedans, l'application p vérifie p(Ax) = Àp(x) pour tout À > 0. 
D'autre part nous décomposons l’application £: M — € en parties réelles et imaginaires : 


l(x) = u(x) + iv(x), (27.649) 
où u: M — R est une application vérifiant, pour tout m € M, 
u(m) < [u(m)| < |£(m)| < p(m). (27.650) 


Donc le théorème en version réelle 27.149 s’applique et il existe une extension R: X — KR de uw qui 
vérifie R < p sur X. Nous posons alors 


f(x) = R(x) — iR(ix). (27.651) 


En vertu du lemme 27.147, cela est une application C-linéaire sur X, et nous avons f = { sur M 
parce que leurs parties réelles sont égales. 
De plus nous avons R < p et donc |f| < p par le lemme 7.315. 


77. Pas encore démontrée... 
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27.13.3 Hyperplan séparateur 


Définition 27.152 (Hyperplan qui sépare). 
Soit E un espace vectoriel topologique ainsi que À, B des sous-ensembles de E. Nous disons que 
l’hyperplan d’équation f = a sépare au sens large les parties À et B si f(x) < a pour tout 
ze Aet f(x) > a pour tout x e B. 

La séparation est au sens strict si il existe € > 0 tel que 


f(x) <a—e pour tout x € À (27.652a) 
f(x)>za+e pour tout x € B. (27.652b) 
ThoSAJ jdZc 


Théorème 27.153 (Hahn-Banach, première forme géométrique[230]). 
Soit E un espace vectoriel topologique et À, B deux convexes non vides disjoints de E. Si À est 


ouvert, il existe un hyperplan fermé qui sépare À et B au sens large. 
ThoACuKgtW 


Théorème 27.154 (Hahn-Banach, seconde forme géométrique). 
Soient un espace vectoriel topologique localement convexe ® E ainsi que des parties A, B qui sont 
(1) des converes 
(2) non vides 
(3) disjoints 
(4) A compact et B soit fermé. 


Alors il existe un hyperplan fermé qui sépare strictement À et B. 


Démonstration. Vu que B est fermé, À est dans l’ouvert E\B. Donc si a € À, il existe un voisinage 
ouvert convexe de a inclus dans E\B. Soit U, un voisinage ouvert et convexe de 0 tel que (a + 
Lin =. 

Vu que la fonction (x,y) + x + y est continue, nous pouvons trouver un ouvert convexe V, tel 
que V5 + Va € Ua. L'ensemble a + V, est alors un voisinage ouvert de a et bien entendu [J,(a + Va) 
recouvre À qui est compact. Nous en extrayons un sous-recouvrement fini, c’est-à-dire que nous 
considérons &a1,...,an € À tels que 


AC | J{ai + Va). (27.653) 
i=1 
Nous posons alors 
Vente (27.654) 
i=1l 


Cet ensemble est non vide parce et il contient un voisinage de zéro parce que c’est une intersection 
finie de voisinages de zéro. Soit x € À + V. Il existe 2 tel que 


TE di + Ua +V CE &+ Ve + Va € & + Ua, € E\B. (27.655) 


Donc (A +V)nB = @. L'ensemble À + V est alors un ouvert convexe disjoint de B. Par la 
première forme géométrique du théorème de Hahn-Banach 27.153 nous avons un hyperplan qui 
sépare À + V de B au sens large : il existe f € E’\{0} tel que f(a) + f(v) < f(b) pour tout a € À, 
veVetbe B. 

Il suffit donc de trouver un v € V tel que f(v) £ 0 pour avoir la séparation au sens strict. Cela 
est facile : V étant un voisinage de zéro et f étant linéaire, si elle était nulle sur V, elle serait nulle 
sur E. 


CORo0oHTZVooFhgrSN 
Corolaire 27.155 ([230]). 
Soit un espace vectoriel localement convexe. Soit un sous-espace vectoriel F tel que F Z E. Alors 
il existe une application f € E’\{0} telle que f = 0 sur F. 


78. Définition 7.188. 
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Démonstration. Soit a € E avec a # F. Vu que le singleton {a} est compact et que F est fermé, 
le théorème de Hahn-Banach 27.154 dit qu’il existe f € E\{0} et à Z 0 tel que f < a sur F et 
f(a) > a. 

Étant donné que F est vectoriel et que f est linéaire, avoir f (x) < a pour tout x dans F 
implique d’avoir f(x) = 0 pour tout x € F. En effet si f(x) 0, il existe un À tel que f(Xx) > a 
(R est archimédien, théorème 1.423). 


27.13.4 Prolongement de fonctionnelles (dimension finie) 


Nous allons prouver quelques lemmes qui permettent de prolonger des fonctionnelles d’un sous- 


espace vers un sous-espace contenant un nombre fini de dimensions en plus. 
LEMooHWSJooGVmIPV 


Lemme 27.156 ([669]). 
Soient un espace vectoriel réel normé X aïnsi qu’un sous-espace M. Soient L{ € L(M,R) de norme 
finie, et x1 € X\M. On pose Mi = Span{M, x1}. Alors il existe L € L(Mi,R) tel que 


(1) lifx) = (x) pour tout x € M, 

(2) lülcanr = llcour) 
Démonstration. Si £ = 0, alors c’est facile : on prend { = 0. Nous commençons par supposer que 
|£] = 1; nous ferons le cas général ensuite. 


(1) Deux fonctions Nous considérons les fonctions 


:M—R 
à (27.656) 
2% [mi +2] — {(2) 
et 
_: MR 
i (27.657) 
2 —|21 + 2] — 4(2). 
Pour tout 21,22 € M nous avons 
f+ Ce) — f-(e2) = ei + 4] — E(e1) + ra + 22] + 422) (27.658a) 
= |lt1 + 4] + |x1 + 22] — (41 — 22) (27.658b) 
> (æ1 + 21) — (1 + 22)| — (21 — 22) (27.658c) 
= [21 — 22] — {(z1 — 22) (27.658d) 
> 0 (27.658e) 


parce que |£| = 1. Nous en déduisons que f,(21) > f_(22). 


(2) Un entre les deux 


En posant 
c_ = sup (— |x1 + 2] — 4(2)) (27.659a) 
zeM 
+= inf (|x1 + 21 — 4(2)), (27.659b) 
nous avons c_ < c+. Nous choisissons c1 € [c_,c}]. 
(3) La définition Sixe M; = Span M, x1, alors il existe y € M et ÀE R tels que 


x = ÀT1 +. (27.660) 


U(æ) = da + (y). oo Tor EE) 


Voilà qui définit notre {1. Nous devons prouver qu’elle satisfait |{| = 1 et {1(x) = (x) pour 
tout x € M. La seconde condition est facile : si x € M, alors À = 0 dans (27.661) et nous 
avons bien (x) = {(x). 


Nous posons alors 


Pour la condition sur la norme, nous allons devoir un peu travailler. 
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(4) [A(x)| < [x] pour tout re M Soit x e Mi. Nous avons x = Àr; +y avec ER et ye M. 
i 


(4a) SiA=0 Alorsxe M et [{(x)| = [£(x)| < [x] parce que |£] = 1. 


(4b) SiAÆO0 Soient 21,22 € M. Par définition de «1, c} et c_ nous avons les inégalités 
—|x1 + 21 — la) <e_ <a < c4 < ]r1 + 20] — (22). (27.662) 
Nous écrivons ces inégalités pour 21 = 22 = y/): 


le + 1 — Eu/ >). ÉAooGYRSoQ Tr Ezon 


— er + TI LU/ < a < 


(4c) SiA>0 Nous multiplions (27.663) par À et nous profitons de la linéarité de 4 : 


— | Ati + y] — L(y) < Ac < JA + y] + E(y), (27.664) 
donc EQooYRULo 
ha + y] < a + (y) < [Ami + vl BA), 
7 
= (Xx1 +y) 


Nous en déduisons que 
HA: + y)1 < JAxi + y], (27.666) 
ce qu'il fallait. 


(4d) Si À <O0 Le calcul est le même, mais il faut faire attention à bien reverser les inégalités 
au bon moment, et en manipulant bien les valeur absolues. Nous avons par exemple 


À 
eù = —| Am y] = -|Am + vl. (27.667) 


Aer + © = |} + 
En multipliant encore (27.663) par À, nous trouvons 
Aer + TI (0) > Aa > Ale + SI (9). (27.668) 


qui devient 
Ax1 + y] > Ac + E(y) > —] Ari + v|, (27.669) 


qui revient au même que (27.665). 


(5) Première conclusion Nous avons prouvé que [4(x)| < |x| pour tout x dans Mi. Cela 
signifie que || m! < 1. Pour prouver que 411] = 1 nous prouvons l'inégalité inverse : 


= ele. 60). Role... (27.670) 
l seM [Xl  zeM Xl zem |x| 


Nous en déduisons que |{1| = 1 et cela termine la preuve dans le cas où |£| = 1. 


Maintenant, si |{] = a £ 1, nous considérons la forme linéaire f = {/a qui satisfait | f| = 1. Par la 
partie déjà prouvée, nous définissons une extension f1: M — R telle que | f1| = 1. 
Il suffit alors de poser {1 = af1, et nous avons le résultat. 


Ce lemme est également valable pour les complexes. 
LEMooBYEGooRswAmh 


Lemme 27.157 (|1]). 
Soit un espace vectoriel normé X sur C. Soit LE Lo(X,C) de norme finie. Soient un sous-espace 
M de X ainsi qu’un élément a € X\M. Il existe l1 € Le(Spanc(M, a), C) tel que 

(1) Li(x) = (x) pour tout x e M, 


(2) Wal = 1: 
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Démonstration. Nous considérons l'application 4 du lemme 27.147. En posant f = #-!(£), nous 
avons f € £Lr(M,R) vérifiant |£| = | f|. 
L'espace X peut être vu comme vectoriel sur R. Le lemme 27.156 permet de prolonger f à 


fi € Lr(Spanr (M, a), R) (27.671) 


vérifiant || = |f} = fi. 
Vu que M est déjà un espace vectoriel sur ©, l’espace Span& (M, a) qui nous intéresse est donné 
par 
Spanc (M, a) = Spanr(M, a, ia). (27.672) 


Nous pouvons donc utiliser une deuxième fois le lemme 27.156 avec le vecteur ia, et définir une 
extension 


f2 € Lr(Spanr(M, a, ia), R) = £Lr(Spanc(M, a), R) (27.673) 
vérifiant |€| = | fl] = |A = |f2ll. 


En utilisant à nouveau le lemme 27.147, nous avons encore une extension 
d(f2) € Lo ( Spanc (M, a), C) (27.674) 
vérifiant |€| = |f| = |A = 1/21 = 1(f2)1 


Et voilà! La fonctionnelle 4(f2) est celle que nous voulions. 


27.13.5 Prolongement de fonctionnelles (dimension infinie) 


Les lemmes 27.156 et 27.157 permettent de prolonger une forme linéaire une dimension réelle 
ou complexe à la fois. Rien ne nous permet de prolonger d’une infinité de dimensions d’un seul 
coup. Le théorème de Hahn-Banach va nous permettre de faire une infinité de dimension d’un coup 


à l’aide du lemme de Zorn. 
THOo00TZSSooBKfxXE 


Théorème 27.158 (Hahn-Banach{669]). 
Soit X, un espace vectoriel normé sur K (= R ou C). Soient un sous-espace vectoriel M, et une 
fonctionnelle linéaire LE Lx(M,K) de norme finie. Il existe f € Lx(X,K) telle que 


(1) f(x) = (x) pour tout x € M, 
(2) Iflcexx) = lle): 


Démonstration. Nous considérons l’ensemble € des paires (N, f) telles que 


(1) N est un sous-espace de X contenant M, 


(2) fe L(N,K) 
(3) If] = 16 
(4) f(x) = £(x) pour tout x e M. 


Cet ensemble n’est pas vide parce que (M, £) € €. Nous mettons un ordre partiel sur € en posant 
(N, f) < (N’, f') si et seulement si N € N’'et f'|n = f. 


(1) £ est inductif Nous commençons par prouver que (£,<) est un ensemble inductif ”. Soit 
une partie F totalement ordonnée dans €. 


(la) L’espace vectoriel 


Nous commençons par poser 
Y= |J w. (27.675) 
(N,f)EF 
Et nous prouvons que c’est un espace vectoriel. Soient x,y € Y. Supposons x € Ni et 
y € No. Vu que F est totalement ordonné, nous avons MN € N2 (ou le contraire). Donc 
xæ+ye Nc 7Y. De même pour Àx avec }e Ket xe Y. 


79. Définition 1.22. 
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(1b) La fonctionnelle Nous devons trouver une fonctionnelle g sur Y. Soit y € Y. Com- 


mençons par prouver que l’ensemble 
{f(y) tel que (N, fe F,ye N} (27.676) 


est un singleton. Soient (N1, f1), (No, f2) € F avec y € Ni n No. Nous supposons que 
(Ni, f1) < (No, f2) (sinon c’est le contraire). Alors fo(y) = faln, (y) = fi(y). Nous 
pouvons donc définir 

g Y —K 


ner (27.677) 


où (N,f)eF est tel que ye N. 


(1c) g est linéaire Soient x,y € Y. Nous supposons que x € M; et y € N2 avec Ni € N2. 
Donc x,y,x + y € N2 et nous avons g(x) = fa(x), g(y) = fa(y) et g(x + y) = fa(x + y). 
La linéarité de f2 fait alors le boulot. Même raisonnement pour g(Ax) = Ag(x). 

(1d) g se restreint à { Soit x € M. Nous avons g(x) = f(x) pour un couple (N, f) e F 
vérifiant x € N. Vu que f prolonge £ nous avons g(x) = f(x) = (x). 


(1e) Norme de g Nous devons voir que |g|z(y.R) = lc). L'inégalité dans un sens est 
facile pour qui comprend la norme opérateur ®. Étant donné que M & Y nous avons 
HOIEar10)] Eu) 


lalcvx) = SUP ——— > — SUP 
veY NY ven |Yl veu |yl 


= cou. (27.678) 


L’inégalité dans l’autre sens n’est pas trop compliquée non plus. Prenons x € Y vérifiant 
x] = 1. Nous considérons (N, f) € € tel que x € N. Alors 


lgGe)l = 1f(x) < NF] = EN: (27.679) 


Donc |g| < |£|. 


(1f) Conclusion pour le moment Nous avons prouvé que (Ÿ,g) est un majorant de F. 


Donc (£,<) est un ensemble inductif. 


(2) Lemme de Zorn Vu que (£,<) est un ensemble inductif non vide, il possède un élément 
maximal par lemme de Zorn 1.23. Nous nommons (Y, f) un tel élément maximal. 


(3) Fin de la preuve Nous devons prouver que Y = X, de telle sorte que f € £(Y, K) soit 
définie sur X. Supposons que Ÿ Æ X. Dans ce cas nous considérons 1 € X\Y. Suivant que 
K est R ou ©, nous utilisons le lemme 27.156 ou 27.157 pour construire la paire 


(Spang(Y, 1), fi) (27.680) 


qui majore (Y, f). Contradiction avec la maximalité de (Y, f). Donc Y = X. 


PROPooFJPXooWr jbuH 
Proposition 27.159 ([1]). 
Soit un espace de Banach E sur K(= R ou ©). Soit a € E. Nous avons 
la] = max [o(a)|. (27.681) 
geE 
lel=1 
Démonstration. Soit 6 € E” tel que [y] = 1. Si [y(a)| > |a| alors 
lol = sup FE , PU), ; (27.682) 


80. Si ce n’est pas votre cas, vous ne devriez franchement pas être en train de lire ces lignes. Ce n’est que mon 
avis ; après tout, vous faites comme vous le sentez. 
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Nous en déduisons que pour tout 6 € Bp(0,1), [v(a)| < Jal. 
Maintenant nous construisons une application linéaire 4 € E” telle que [y(a)| = Ja| et |w|] = 1. 
Pour cela nous considérons le sous-espace M = Span{a} et l'application 


f:M—K 
(27.683) 
ar XJa|. 
Cette application vérifie f(a) = al et | f| = 1 parce que 
FE] [F(Aa)| _ TAlal 
|f| = sup = sup = = (27.684) 
aeM Ut xek Aa]  lAllal 


Le théorème de Hahn-Banach 27.158 prolonge f en un élément v € E vérifiant ||] = | f|] = 1. 
Cette fonctionnelle vérifie donc aussi w(a) = f(a) = |a||. 


CORooOBDHooJpiBrs 
Corolaire 27.160 (|[1]). 
Voici trois façons différentes de dire la même chose, par ordre décroissant de frime. 


(1) Le dual d’un espace vectoriel normé sépare les points. 

(2) Les fonctionnelles bornées d’un espace vectoriel normé séparent les points. 

(3) Si X est un espace vectoriel normé sur K (= R ou ©), et si x,y € X, alors il existe une 
application f € L(X, K) telle que f(x) Æ f(y). 


Démonstration. Le théorème de la base incomplète 4.24 nous permet de considérer une base {e;}jer 
de X telle que eo = x et ei = y. 
Evacuons quelque objections. 


— Si x et y sont colinéaires, on complète seulement {x} et ça ne changera rien pour la suite °!. 
— En écrivant & eg » et « ei » ne prétends pas que Z soit un ensemble de nombres. C’est juste 
une facilité d'écriture pour éviter de dire « il existe a, 8 € IT tels que x = e, et y = eg ». 
Nous considérons l'application linéaire 
L: Spanx(eo, e1) — K 


(27.685) 
ae + Pet a. 


Cette application est parfaitement bornée. Le théorème de Hahn-Banach 27.158 nous permet de 

considérer une extension f sur X. Cette extension a la même norme et est donc bornée (donc 

continue par la proposition 11.62). C’est donc un élément du dual de X. 
Comme f = £ sur Span(eo, e1), nous avons f(x) Æ f(y). 


27.14 Théorème de Tietze 


Définition 27.161. 

Si E et F sont des espaces normés, une application f: E — Fest presque surjective si il existe 

ae ]0,1[ et C'> 0 tels que pour tout y € Br(0,1), dl existe x € Br(0, 0) tel que |y — f(x)| < a. 
LemBQLooRXhJzK 

Lemme 27.162 ([103]). 


Soient E et F des espaces de Banach et f e L(E,F)°?. Si f est presque surjec tue HATS YrxvBui 


(1) ‘ est surjective ItemTSOooYkxvBuii 


(2) pour tout y € Br(0,1), il existe x € Bx(0, 1) tel que y = f(x). 


Le point (2) est une précision du point (1) : il dit quelle est la taille de la boule de Æ nécessaire 
à obtenir la boule unité dans F. 


81. Soyez quand même attentifs à ne pas vous laisser enfumer. 
82. L'ensemble des applications linéaires continues 
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Démonstration. Soit y € Br(0,1). Nous allons construire x € B(0, 1) qui donne f(x) = y. Ce 


x sera la limite d’une série que nous allons construire par récurrence. Pour n = 1 nous utilisons 
la presque surjectivité pour considérer x1 € Bg(0,C') tel que |y — f(x1)| < a. Ensuite nous 
considérons la récurrence 


Tn € BEe(0,C) (27.686) 
tel que 
Le . 
lu — D at f(x;)| < a” (27.687) 
i=1 
Pour montrer que cela existe nous supposons que la série est déjà construite jusqu’à n > 1 : 
Î .. EE 
mr (y = D al f(x) € Br(0,1) (27.688) 
i= 


À partir de là, par presque surjectivité il existe un 2,41 € Bg(0, C) tel que 


| YU — Dr ol f(x) 


a 


en <c (27.689) 


En multipliant par a”, le terme a” f(x,+1) s'intègre bien dans la somme : 


n+1 


\y — » a f(xi)| A Le (27.690) 
i=l 


Nous nous intéressons à une éventuelle limite à la somme des a”*-lx,. D'abord nous avons la 
majoration |a"-lx,| < a"-1C, et vu que par la définition de la presque surjectivité 0 < à < 1, la 
série » 
D, O7 (27.691) 
n=1l 
converge absolument ** parce que la suite des normes est une suite géométrique de raison a. Vu 
que E est de Banach, la convergence absolue implique la convergence simple (la suite des sommes 
partielles est de Cauchy et Banach est complet). Nous posons 


Le] 
=) a meE, (27.692) 
n=1 
et en termes de normes, ça vérifie 
n—1 n—1 
lei < a nl < € Ya = (27.693) 
n=1 n=1 
Donc c’est bon pour avoir x € B (0, 1). Nous devons encore vérifier que y = f(x). Pour cela nous 
remarquons que 
N 
|y — f( > a" lan) | <a. (27.694) 
n=1l 


Nous pouvons prendre la limite N — © et permuter f avec la limite (par continuité de f). Vu que 
0 < a < 1 nous avons 
ly — f(æ)] = 0. (27.695) 


ThoFFQooGvcLzJ 
Théorème 27.163 (Tietze[103, 473, 670]). 
Soit un espace métrique (X,d) et un fermé Y © X. Soit go € C(Y,R). Alors go admet un 
prolongement continu sur X. 


83. Définition 11.81. 


27.14. THÉORÈME DE TIETZE 2187 


Démonstration. Soit l'opération de restriction 


Ti (CO (X,R), [.lco) — (CE (FR), |.) 


. (27.696) 


L'application Test évidemment linéaire. Elle est de plus bornée pour la norme opérateur usuelle 
donnée par la proposition 11.51 parce que |T(f)| < |f| < 0. L'application T est alors continue 
par la proposition 11.62. 


(1) 


Presque surjection 


Soit ge CP(Y,R) avec |glx < 1. Nous posons 


1 
YŸ={xe Y tel que 3 < g(e) < 1} (27.697a) 
1 
Y_ ={xeY tel que —1< g(x) < a} (27.697b) 
Nous considérons alors 

f X—R 

1d(x,Y=)-d(x,Y*) (27.698) 
77 3d@,Y)+d@,Y+) 


Vu qu’en valeur absolue le dénominateur est plus grand que le numérateur nous avons | fl < 
L. Notons que 


— SixeY* alors f(x) = À et g(x) e[4,1]; 
— SixeY® alors f(x) = —} et g(x) e [-1,-à]: 
— Si x n’est ni dans Y+ ni dans Ÿ — alors nous avons °* g(x) € [-5, 1] et donc |f(x) — 
g(x)| < |f(x)| + |g()| < 3: 
Dans les trois cas nous avons | f(x) — g(x)| € [0, $] pour tout x € X. Cela prouve que 


IT(F) — 9 


(27.699) 


Y,00 < 


© | D 


En résumé nous avons pris g dans la boule B(0, 1) de (CŸ(Y,R), |.|%) et nous avons construit 
une fonction f dans la boule B(0, à) de (CY(X,R), |.) telle que [T(f) — gx < 2. L’ap- 
1 


plication Test donc une presque surjection avec a = 3 ct C'= 


8° 
ITEMooSTXMooldockk 
Extension avec |.|, < 1 Nous Montrons que si g e CO(Y,R) vérifie [gl < 1, alors il 


existe une extension f € CU(X,R) vérifiant | fl < 1. 

La proposition 12.369 nous assure que les espaces CP(X,R) et CP(Y,R) sont de Banach 
(complets), et le lemme 27.162 nous dit alors que T est surjective et que pour tout g € B(0,1), 
il existe 


1/3 
feB C : / , = B(0,1). (27.700) 
73 

telle que g = T(f). 
Pour le redire avec des mots plus simples, nous avons prouvé que si g: Y — R vérifie |gls < 1, 


il existe une extension f: X — R telle que | fl < 1. 


: ITEMooZBGTooKbyuch Vu | . 
Extension avec |.| < 1 Nous montrons que si g € CUY,R) vérifie |g| < 1, alors il existe 


une extension f € CU(X,R) vérifiant |f| < 1. 
Soit 9€ Bco(y) (0,1) et son prolongement h € Bco(x)(0, 1) du point (2). Si |h| < 1 alors nous 
avons le résultat en posant f = g. 


Si au contraire il existe z € X tel que |h(z)| = 1, nous posons 


Z={xe X tel que |h(x)| = 1}. FOTO GAZ I 


84. Nous rappelons que |g] = 1, donc g(x) est forcément ente —1 et 1. 


2188 CHAPITRE 27. ANALYSE FONCTIONNELLE 


Nous avons Ÿ n Z = @ parce que nous avons À = g sur Ÿ et nous avons choisi |g|sx < 1. Par 
ailleurs Ÿ est fermé par hypothèse et Z est fermé parce que À est continue; par conséquent 
Y n Z est fermé, donc °° 
FAZ=Y AZ. (27.702) 
Nous posons 
u: X —R* 
d(x, Z) (27.703) 
Tr 
d(x, Ÿ) + d(x, 2) 


Le dénominateur n’est pas nul parce qu’il faudrait d(x, Y) = d(x, Z) = 0, ce qui demanderait 
zxeYŸnZ, ce qui n’est pas possible. Nous posons f = uh. Si x € Y alors u(r) = 1, donc 
f est encore un prolongement de g. De plus f est encore continue, et donc encore un bon 
candidat. Enfin si x est hors de Ÿ alors d(x, Y) > 0 (strictement parce que Y est fermé) et 
donc 0 < u(x) < 1, ce qui donne |f(x)| < [h(x)| < 1. 

Et voila. 


(4) Démonstration du théorème 


Nous sommes maintenant prêts à prouver le théorème. Soit go € C°(Y, R). Nous allons nous 
ramener au cas de la boule unité ouverte en utilisant un homéomorphisme 6 6: IR — ]-1,1[. 
L'application g = @ 0 go vérifie [g(y)| < 1 pour tout y € Y. Par le point (3), il existe une 
extension f € C°(X,R) vérifiant |f(x)| < 1 pour tout x € X. Attention : cette application f 
prolonge g et non go. 

Nous posons finalement fo = 4! 0 f. Cela est encore une application dans C°(X,R), mais 
cette fois elle prolonge go. En effet si y € Y, en tenant compte de f(y) = g(y), nous avons 


fo(y) = (do F}(y) = ET (F(u)) = # (ay) = (bo go)(v)) = go(y). (27.704) 


27.14.1 Pas de bicontinues entre dimensions différentes 
THOooLGJMooIYzOBD 


Théorème 27.164 ([671]). 
Soit une application continue et injective f: B(0,1) — R”. Alors 


f(0) € Int EC D)). (27.705) 


Démonstration. Soit une application continue et injective fo: B(0,1) — R”. Soit € < 0. Si nous 
supposons que fo(0) n’est pas à l’intérieur de fo (B(0,1)), alors il existe un c € R" hors de 


fo(B(0,1)) et tel que |c— fo(0)| < €. 
Nous posons maintenant f(x) = fo(x) — c. Nous avons 


MOIS (27.706) 
{ 0 # f(B(0,1)). (27.706b) 


Vu que f est continue et que B(0,1) est compact, la partie f (B(0; 1)) est compacte (théo- 


rème 7.211). L'application restreinte f: (B(0,1)) — fo(B(0,1)) est une bijection continue entre 
compacts. Son inverse est alors également continue (lemme 7.213). 


Mais comme f(B(0, 1)) est un fermé de R”, le théorème de Tietze (27.163) prolonge son inverse 
en une application continue 


CHR (27.707) 


85. Si vous avez l’intention de direqueY nZ=YnZ=YnZ = (@, allez d'abord voir l'exemple 7.125. Ici c’est 
correct parce que Ÿ et Z sont fermés. 
86. Existence dans le lemme 18.40. 
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Nous avons G{(f(0)) = 0. Nous choisissons € assez petit pour que |G{y)| < 0.1 dès que |y— f(0)| < 
2e. Comme | f(0)| < €, nous avons aussi 


lyl <e= ]y— FO) < 2e = |G(y)| < 0.1. (27.708) 


Autrement dit, 


— l 
G(BG,9) C B(0,=). (27.709) 
Nous posons 
E1 = {y e f(B(0,1)) tel que |y| > €, (27.710) 
ainsi que 
Z2 = {ye R" tel que |y| = €}, (27.711) 


et D = > LU >. 


(1) La partie X2 est compacte en tant que fermée et bornée°?. La partie Z1 est compacte en tant 
que intersection entre le compact f(B(0,1)) et le fermé |y| > € (corolaire 7.92). Finalement 
la partie X est également compacte ** 


(2) La partie Y ne contient pas f(0) parce que | f(0) < €] tandis que les éléments y € Y vérifient 
lyl > €. 
(3) La partie Z1 ne contient pas 0. En effet, vu que G étend f_!, si x € G(Y1), nous avons 
f(x) € 1 et en particulier | f(x)|] > €. Vu que | f(0)| < €, nous avons x £ 0. 
(4) La partie Z1 est compacte, G est continue dessus et ne prend pas la valeur 0. Il existe donc 
ô > 0 tel que 
G(E1) > 6. (27.712) 


Nous considérons un tel à qui vérifie de plus Ô < 1/10. 


Nous introduisons l’application 


p: f(B(0,1)) — x 


(27.713) 
y max (e/|y|,1)y. 


Prouvons que @ prend effectivement ses valeurs dans Y. Il y a deux possibilités : soit |y| < €, soit 
lyl > € Si y] < €, alors O(y) = pyry, ce qui donne |g(y)| = €, et donc @(y) € Lo. Si |y| > €, 
alors le max est 1 et nous avons @(y) = y. Dans ce cas, nous avons d’une part |d(y)| = |y| > € et 
d'autre part (y) = y€ f(B(0, 1)) : donc (y) € X1. 

Le théorème de Stone-Weierstrass 12.431 nous permet de considérer un polynôme (à n variables) 
P:R?- MR? vérifiant 


IP — Ge < 6. (27.714) 


Un tel polynôme ne s’annule pas sur Z1 parce que |G|s, > 6. 

Le polynôme P est de classe CC (proposition 12.363). Vu que X2 est de mesure nulle, la 
proposition 14.288 dit que P(X2) est de mesure nulle dans R”. 

À l’aide de la proposition 14.289, nous choisissons s e R” tel que P2(x) = P(x + 5) ne s’annule 
ni sur 4 ni sur Z2. Vu que P est uniformément continue sur Y (théorème de Heine 12.81), il existe 
M (majorant de la norme de la dérivée sur Y) tel que 


|P(x) — Pi(x)| = | P(x +5) — P(x)]s < sM. (27.715) 


En choisissant s < e/M, nous avons 
|P — Ps < é. (27.716) 


87. Borel-Lebesgue 10.24. 
88. Union de compacts, lemme 7.93. 
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En prenant €’ assez petit e, nous avons encore 


le 262) ÉdooIVALon Tige 


Nous introduisons maintenant 


(27.718) 
G — Ps O (o] 
Nous allons prouver que |G{y) — G{y)| < 0.3 pour tout y e f(B(0,1)). 
() Silyl>e 
Si |y| > € et y e b(B(0,1)), alors 
G(y) = (P2 0 6)(y) = P(min(e/|yl, 1)y). (27.719) 


Vu que |y| > €, le max est 1 et nous avons G{(y) = P(y), et donc, en utilisant (27.717), 
1G(y) — E(y)l = 1) — Pay] < à. (27.720) 


Quitte à choisir 6 plus petit, nous pouvons supposer à < 0.3. 
(2) Si |y| <e Nous considérons maintenant le cas |y| < e et y € b(B(0,1)). 


Montrons que |G(y) — G(y)| < 6 pour tout ye (B(0, 1)) tel que |y| > €. Nous avons 


IG) — El = IG) — P(d(y))| (27.721a) 
< |G{y) — G(y))| + 1G(6(y)) — P2(6(y))| (27.721b) 
< GI +1G(é(y))1 + 1(G— P2) (6). (27.721c) 


Vu que |y| < €, nous avons d(y) = mr ct donc ld(y)| = €. De ce fait, d(y) € X2 et nous 
avons |(G— P2)(g(y))| < à 


Si nous choisissons 0 < 0.1 nous avons donc encore 


|IG{y) — É(y)| < 2 x 0.1 + 6 < 0.3. (27.722) 


Bref, pour tout y € f(B(0,1)) nous avons 


|G(y) — E(y)| < 0.3. ÉQooMVF on yE En 


Ca va être le moment de demander au théorème de Brouwer d'intervenir. 
(1) Définition de g 


Vu que G est définie sur f (B (0, ne nous pouvons considérer l’application 


g: B(0,1) — R” 


0) (27.724) 


Notons pour æ € B(0,1), nous avons x = G{(f(x)), et donc nous pouvons aussi écrire 
= E JWNR 
g(æ) = (Go f(x) — (Go f(x). OT) 


(2) g(x) € B(0,1) 
Nous avons déjà vu en (27.723) que |G — Gl;( 
que g(x) € B(0,1). 


FG:1)) < 0.3 < 1. L’équation (27.725) dit alors 


89. Plus petit que la différence entre 6 et | P — G|s. 
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(3) Brouwer Nous pouvons appliquer le théorème de Brouwer (27.74) à la fonction g. Il existe 


xo € B(0, 1)) tel que g(xo) = to, c’est-à-dire xo — G(f(xo)) = 0. Nous en déduisons que 


G(f(xo)) = 0. (27.726) 


(4) La contradiction Rappel : G = P> 0 @. Si ye B(0, 1), alors (y) e X, et nous avons tout 
fait pour que P; ne s’annule pas sur Y. 


Et voila la contradiction. 


Remarque 27.165. 
Il n'existe pas de bijection bicontinues d’un ouvert de R””? vers un ouvert de R'" si m £ n. Il n’y a 
donc pas de notion de difféomorphismes entre ouverts de dimensions différentes. 

Je crois que c’est une conséquence facile de 27.164. Écrivez-moi si vous pouvez rédiger une 
preuve. 


27.15 Dualité, réflexivité et théorème de représentation de Riesz 


Dans la suite E’ est le dual topologique, c’est-à-dire l’espace des formes linéaires et continues 
sur Æ. Nous notons également V” le dual de (V7,|.|). Certes en tant qu’ensembles, (V”,*) et 
(V”,|.]) sont identiques, mais comme ils n’ont pas la même topologie, les duaux ne sont pas les 
mêmes. 

Bref, V” est l’ensemble des applications linéaires continues (V”,|.|) — C. Et lorsque nous 
disons € ici, ça peut aussi bien être R selon le contexte. 

De plus nous considérons que V” la norme opérateur qui dérive de la norme de V”, laquelle 
dérive de la norme vectorielle sur V. 


PROPooMAQSooCGFBBM 
Proposition-Définition 27.166 (Espace réflexif). 
Soit un espace vectoriel normé V sur R ou C. Nous considérons l’application 
J:V—Vv” 
(27.727) 
J(x)p = p(x). 

ITEMooNVVSooNFXgnE 
(1) L'application J est bien définie : J(x): V' — © est continue. ITEMOOKURHooZZWpbu 
(2) L'application J est continue. ITEMooTFYVooKhMO jp 


(3) Elle est injective. 
Lorsque J est bijective, l’espace V est dit réflexif. 


Démonstration. Point par point. 
(1) (1) Nous commençons par montrer que J(x): (V”, ||.) — € est continue pour chaque x € V. 


Soit une suite ox HI, 0. Nous avons : 


J(x)pr = prlx) < Ipkllxl — 0 (27.728) 


où vous aurez noté l’utilisation du lemme 11.59. Cela prouve que J(x) est continue et donc 
que J est bien à valeurs dans V”. 


(2) (2) 


; : V ve 
Soit une suite zx, — 0, et étudions |J(x4)| pour la norme dans V”. Nous posons 27 = 
xx/|xx| et nous calculons (encore une fois, nous écrivons « € », mais ça pourrait être R) 


1x)| = sup Jar)elo = sup lo(ex)| = Izxl sup lp(xr)| < Izxl — 0. (27.729) 
lel=1 lel=1 lel=1 
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La dernière inégalité pourrait être sans doute une égalité , mais nous n’en avons pas besoin 
ici. 

(3) (3) Soient x £ y dans V. Le corolaire 27.160 nous permet de considérer un élément € V” 
tel que w(x) £ y(y). Nous avons alors 


J(x)p # J(y)e, (27.730) 


et donc J(x) Æ# J(y). Cela prouve que J est injective. 


LEMooWEMFooEHTaxY 
Lemme 27.167 ([1]). 
Soient des espaces de Banach V et W. Si a: V — W est une bijection linéaire et isométrique, 


alors l'application définie par 
B: V'—-Ww' ERooTSVHonENGAN y 
B(e)y = p(a (y) 


pour tout we V'etye W est une bijection linéaire isométrique. 
p 


Démonstration. En plusieurs points. 


(1) a_! est continue Le théorème d’isomorphisme de Banach 27.1 implique que &_! est conti- 
nue parce que @ est bijective, continue et linéaire entre deux espaces de Banach. 


(2) 5 prend ses valeurs dans W7 Nous devons prouver que, si @ € V”, alors B(4) est bien 
un élément de W’. Autrement dit, nous devons prouver que B(@): W — © est continue. 


_—. : wW . v— V 
Considérons une suite y; — 0. Alors, vu que a est continue, nous avons aussi @7! (yx) — 0, 
et donc 


p(a l{u)) © 0 (27.732) 


parce que w est continue. Donc B(Y) est continue. 


RS 
Co 
nr 


B est linéaire Parce que a l’est. 


TR 
Æ 
nr 


B est isométrique Nous devons prouver que la norme de l’application linéaire B(ç@): W — 
C est la même que celle de @. Vu que a: V — W est une bijection isométrique, nous avons 


{a !(y) tel que |y| = 1,ye W} = {x e V tel que |x| = 1}. (27.733) 


Donc nous pouvons faire le calcul suivant : 


18@)1 = sup 18(6)yl = sup lo(a "(y))1 = sup lo(x)l = [ll (27.734) 
yeW yEeW xeV 
lui lue lee 


La proposition suivante dit que la notion d’être réflexif passe aux isomorphismes d'espaces 


vectoriels normés. 
PROPooVRQKooLdmajh 


Proposition 27.168 (|[1]). 
Soient des espaces vectoriels normés V et W ainsi qu'une bijection linéaire isométrique a: V — W. 
L'espace W est réflexif”! si et seulement si V l’est. 


Démonstration. Nous allons prouver que si W est réflexif, alors V est réflexif. Pour l'implication 
inverse, il suffira de noter que al: W — V est une bijection linéaire isométrique. 
En plusieurs points. 


90. Écrivez-moi si vous en êtes certain. 
91. Définition 27.166. 
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(1) Quelques applications Nous notons Jy l’application de la proposition 27.166 : 


Jy: V — V" 
Jv(v)e = p(v), 
et Jw l'application correspondante pour W. Notre hypothèse est que J/w est bijective. 


(27.735) 


Nous posons 


FR (27.736) 
B(g)w = p(a"(w)), | 
et 
7: v” — wW” 
(27.737) 


1(o)e = a(8 7" ()). 
L'application 5 est une bijection linéaire isométrique par le lemme 27.167; l’application 7 
l’est aussi, par le même lemme appliqué à 5: V' — W”. 


(2) Le S Nous posons 


nue (27.738) 
S(v)e = Jw(a(v))8(e). | 
Nous allons montrer que $ = J5 et que S'est bijectif. 
(3) S = Jy Cela est un calcul : 

Jw (a(v))8() = 8()(a(v)) (27.739a) 
= pla ! (a(v))) (27.739b) 
= q(v) (27.739c) 
= Jy(v)@. (27.739d) 


(4) S est injective L'application Jy est toujours injective par la proposition 27.166. 


(5) S est surjective Soi o € V”. Nous devons prouver l'existence de v € V tel que S{v) = o. 
Vu que Jwy : W — W” est surjective et que (ao) € W”, il existe w € W tel que 


Jw(w) = y(o). (27.740) 


Un simple calcul montre alors que S(a-l{(w)) = 0 : 


S(a-l(w))p = Jw(w)B(e) (27.741a) 
= (0) (8(&)) (27.741b) 
= c (87 ((&))) (27.741c) 
= o(p). (27.741d) 


Nous avons donc bien que S{(v) = o en posant v = al (w). 


(6) Conclusion L'application $ = Jy est surjective; l’espace V est donc réflexif par la propo- 
sition 27.166. 


Voici déjà un bel énoncé. Pour des espaces mesurés (Q,.4, 41) plus généraux, voir l’arme totale 
en le théorème 27.171. 


PropOAVooYZSodR 
Proposition 27.169 ([370], thème 21). 
Soit 1 < p <2 et q tel que - + : = 1. L'application 
d: L1([0,1]) — Z?([0,1]) 
_ (27.742) 
BJ(F) = F9. 
[0,1] 


est une isométrie linéaire surjective. 
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Démonstration. Pour la simplicité des notations nous allons noter L? pour L?([0, 1] }: et pareille- 


ment pour LP. 


(1) ®, est un élément de (1?) 


— 


Si fe LP et ge LA nous devons prouver que ®,(f) est bien définie. Pour cela nous utilisons 
l'inégalité de Hôlder ”? qui dit que fg e L!; par conséquent la fonction fg est également dans 
L' et nous avons 


E7162] <] , Lfal = [ali < 1 flplgla: (27.743) 


Ü 


En ce qui concerne la norme de l’application $, nous avons tout de suite 


1 Sol = ne |Sy()| < |glla- (27.744) 
sa 


Cela signifie que l’application ®, est bornée et donc continue par la proposition 11.62. Nous 
avons donc bien ®, € (LP). 


Isométrie 
Afin de prouver que |®,| = |g|, nous allons trouver une fonction f e LP telle que _— = 
gl. De cette façon nous aurons prouvé que |#,| > |g|4, ce qui conclurait que |®,| = |g|4. 


Nous posons f = g|g|1—?, de telle sorte que |f| = |g[27! et 


1/p 1/p 
ie (fire) = (fiat) = taie (27.745) 


où nous avons utilisé le fait que p(q — 1) = q. La fonction f est donc bien dans L?. D'autre 


part, 

8,0) = | r3= | oloi-25 = [loi = lo (27.746) 
Donc 

É7162] (a 
LA = [ga * = 1gla (27.747) 
p 

où nous avons encore utilisé le fait que q — : : it = 1. 
Surjectif 


Soit { e (LP); c’est une application £: LP — € dont nous pouvons prendre la restriction à 
L? parce que la proposition 27.41 nous indique que L? & LP. Nous nommons @: L? — € 
cette restriction. 


(3a) pe (L?)' 
Nous devons montrer que ® est continue pour la norme sur L?. Pour cela nous montrons 
que sa norme opérateur (subordonnée à la norme de Z? et non de LP) est finie : 


\é(f)| le(f)| 
MES A 


(27.748) 


Nous avons utilisé l'inégalité de norme |f|, < |fl2 de la proposition 27.41(2). 


(3b) Utilisation du dual de 1? 


Étant donné que L? est un espace de Hilbert (lemme 27.84) et que 6 € (L?)', le théo- 
rème 25.18 nous donne un élément g € L? tel que g(f) = ®,(f) pour tout f e L?. 


Nous devons prouver que ge LA et que pour tout f € LP nous avons {(f) = D, (f). 


92. Proposition 27.33. 
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(3c) ge LA 


(34 


— 


Nous posons fn = gg Len Nous avons d’une part 


1 Ë 
Po(fn) = [ Ing = [a |g1?. FAFBUoR RAS), 


Et d’autre part comme f, € L? nous avons aussi (fn) = (fn) et donc 


0 < (fa) = (fn) < (rl (27.750) 


1/p 
= lé | J pi) (27.750b) 
gl<n 


1/p 
7 | ur) (27.750c) 
gl<n 


où nous avons à nouveau tenu compte du fait que p(q — 1) = q. En combinant avec 


(27.749) nous trouvons 
1/p 
[<a | ut) | (7-75) 
lgl<n lgl<n 


1—1 
p 
| | ur) < ||£|, (27.752) 
gI<n 


1/q 
( | e) <W (27.753) 
gl<n 


et donc 


c’est-à-dire 


Si ce n’était pas encore fait nous nous fixons un représentant de la classe g (qui est dans 
L?), et nous nommons également g ce représentant. Nous posons alors 


In = 19/1 gen (27.754) 


qui est une suite croissante de fonctions convergeant ponctuellement vers |g|1. Le théo- 
rème de Beppo-Levi 14.173 nous permet alors d’écrire 


n—00 


1 
lim 1g|? = Î lg|*. (27.755) 
lal<n 0 


Mais comme pour chaque n nous avons mn en 191 < |£], nous conservons l'inégalité à 
la limite et 


1 
[ Lol < Ve. (27.756) 


Cela prouve que g € LP. 


CF) = B,(F) 
Soit f e LP. En vertu de la densité de L? dans L? prouvée dans le corolaire 27.51 nous 
pouvons considérer une suite (f,) dans Z? telle que fy Eur J. Pour tout n nous avons 


Un) = Pain) (27.757) 


Mais £ et ®, étant continues sur LP nous pouvons prendre la limite et obtenir 


CF) = BF). (27.758) 
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LemHNPEooHtMOGY 
Lemme 27.170 ([10]). 
Soit (0, A,u) un espace mesuré fini. Soit ge L!(Q) et S fermé dans C. Si pour tout E € A nous 
avons 


1 


alors g(x) € S pour presque tout x € (1. 


Démonstration. Soit D = B(a,r) un disque fermé dans le complémentaire de S (ce dernier étant 

fermé, le complémentaire est ouvert). Posons E = g-!(D). Prouvons que 1(E) = 0 parce que cela 

prouverait que g(x) € D pour seulement un ensemble de mesure nulle. Mais S° pouvant être écrit 

comme une union dénombrable de disques fermés **, nous aurions g(x) € S° presque nulle part. 
Vu que M] [ja = a nous avons 


l 1 1 l 
Po a = œ Le a)| < ol |g — al < or = 7. (27.760a) 


Donc 


[ gdu € D, (27.761) 


ce qui est une contradiction avec le fait que D € S*. 


Dans toute la partie d'analyse fonctionnelle, sauf mention du contraire, nous considérons dans 
LP des fonctions à valeurs complexes, et donc les éléments du dual sont des applications linéaires 
continues à valeurs dans C. La raison est que nous allons utiliser les résultats concernant L? dans 
la partie sur les transformations de Fourier, tandis que les transformations de Fourier demandent 


naturellement de travailler sur les complexes. 
ThoLPQPooPWBXuv 


Théorème 27.171 (Théorème de représentation de Riesz, thème 21, [10, 448, 672, 435]). 
Soit un espace mesuré (Q, A, u). Soit q tel que à + . = 1 avec la convention que q = © si p= 1. 
Alors l’application 


D:L1— (IP) 
- (27.762) 
BCP) = | fgdu 
Q 
est une bijection isométrique ”* dans les cas suivants : ITEMooSQQBooWSFBnX 
(1) sil <p<o et (Q,A,u) est un espace mesuré quelconque, ITEMooCQG JooOWzioV 


(2) sip=1et(Q,A,u) est o-fini. 


Démonstration. Par petits bouts. 


(1) ® est injective Nous commençons par prouver que ® est injectif. Soient g, gg’ € LA tels que 
P, = ®,y. Alors pour tout f e L? nous avons 


L f(g — 3')du = 0. (27.763) 


Soient des parties À; de mesures finies telles que Q = [J?, 4;. Étant donné que u(A;) est 
fini, nous avons 114, € LP(Q) et donc 


] (G- g)du = | 14,(2)(G — #)(æ)du(æ) = 0. (27.764) 
À; Q 


93. Tout ouvert peut être écrit comme union dénombrable d'éléments d’une base de topologie par la proposition 7.2 
et C a une base dénombrable de topologie par la proposition 7.130. 
94. Pour rappel, la norme sur le dual est la norme opérateur 11.51. 
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La proposition 27.21 nous dit alors que g — g = 0 dans LZ4(4;). Pour chaque 1, la partie 
N; = {x € À; tel que (g — g')(x) # 0} est de mesure nulle. 

Vu que ( est l’union de tous les À;, la partie de Q sur laquelle g— g’ est non nulle est l’union 
des N; et donc de mesure nulle parce que une réunion dénombrable de parties de mesure 
nulle est de mesure nulle. Donc g — g' = 0 presque partout dans (, ce qui signifie g — g = 0 
dans L1(Q). 

La suite 

La partie difficile est de montrer que ® est surjective. 


Soit o € LP(Q). Si o = 0, c’est bien dans l’image de ®; nous supposons donc que non. 
Nous allons commencer par prouver qu’il existe une (classe de) fonction g € L!(Q) telle que 
P,(f) = d(f) pour tout f e L?(Q, y) ; nous montrerons ensuite que g € LA et que le tout est 
une isométrie. 


Une mesure complexe 


Si E € À nous notons v(E) = @(1g). Nous prouvons maintenant que v est une mesure 
complexe * sur (Q,.4). Le seul point pas facile est de démontrer est l’additivité dénombrable. 
Il est déjà facile de voir que À et B sont disjoints, v(A L B) = v(A) + v(B). Soient ensuite 
des ensembles 4, deux à deux disjoints et posons Ex = [4 A; pour avoir [, 4x = U), Ex 
avec l’avantage que les Ex soient emboîtés. Cela donne 


(Le — 18, |» = H(E\EX) PF, (27.765) 


mais vu que 1 & p < 00, avoir zx — 0 implique d’avoir zi/P — 0. Prouvons que u(E\Ex) — 0. 
En vertu du lemme 14.22 nous avons pour chaque # : 


U(E\Er) = u(E) — u(Er), (27.766) 


et vu que Ex — E est une suite croissante, le lemme 14.23(1), sachant que y est une mesure 
« normale », donne 


Jim A(Ex) = a([]JÆ). (27.767) 
k 
Donc effectivement {(E%) — u(E) et donc oui : u(E\Æ%) — 0. Jusqu'à présent nous avons 


din [Le — Le,|p = 0, (27.768) 


c'est-à-dire Îp, Æ,f g. La continuité de @ sur LP donne alors 
lim v(Ez) = lim 9(1g,) = d(lim 1p,) = p(1g) = v(E). (27.769) 
k— 00 k— 00 k—00 

Par additivité finie de nous avons 


v(Ex) = ÿ v(A;) (27.770) 


et en passant à la limite, 52, v(4;) = (|) 
plexe. 


; Ai). L'application v est donc une mesure com- 


Mesure absolument continue 


En prime, si u(E) = 0 alors v(E) = 0 parce que 


u(E) =0= |1g], = 0 = 1g = 0 (dans L?) = (1g) = 0 (27.771) 


95. Définition 14.232. 
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(5) Utilisation de Radon-Nikodym 
Nous sommes donc dans un cas où v & y et nous utilisons le théorème de Radon-Nikodym 14.233 
sous la forme de la remarque 14.234 : il existe une fonction intégrable g: (0 — C ® telle que 
pour tout À € A, 


y(A) = J Go (27.772) 
A 
C'est-à-dire que 
®(LA) = ] gdu = [ glady. (27.773) 
À (eo 
Nous avons donc exprimé ® comme une intégrale pour les fonctions caractéristiques d’en- 


sembles. 


(6) Pour les fonctions étagées 


Par linéarité si f est mesurable et étagée nous avons aussi 


O(F) = Fa = D, (f). (27.774) 


TS 
—] 
LE 


Pour f € L°(Q) 

Une fonction f € L® est une fonction presque partout bornée. Nous supposons que f est 
presque partout bornée par M. Par ailleurs cette f est limite uniforme de fonctions étagées : 
fx — flo — 0 en posant f, = f1|r<x. Pour chaque k nous avons l'égalité 


Py(fe) = (x). EqPDGJog} juan 


Par ailleurs la fonction f,g est majorée par la fonction intégrable M3 et le théorème de la 
convergence dominée 14.200 nous donne 


jun 8,0) = din [A5 = | 5 - 8,69). (27.776) 


Et la continuité de @ sur L? couplée à la convergence fx — f donne limx-_,0 (fx) = ®(f). 
Bref prendre la limite dans (27.775) donne 


BJ(F) = E(F) (27.777) 


pour tout f € L°(Q). 
(8) La suite ... 
Voici les prochaines étapes. 


— Nous avons ( fg = @(f) tant que f € L®. Nous allons étendre cette formule à f € LP 
par densité. Cela terminera de prouver que notre application est une bijection. 


— Ensuite nous allons prouver que |d| = |®,|, c’est-à-dire que la bijection est une isomé- 
trie. 


(9) De L®° à LP 


Soit f € LP. Si nous avions une suite (f,) dans L® telle que f, Le f alors lim @( fn) = ®(f) 
par continuité de @. La difficulté est de trouver une telle suite de façon à pouvoir permuter 
l'intégrale et la limite : 


ju [no [in no | 75-869. FAR oEAEN 
o A Q 


Nous allons donc maintenant nous atteler à la tâche de trouver f, € L®° avec fn — f et 
telle que (27.778) soit valide. 


96. On peut écrire, pour utiliser de la notation compacte que ge L'(Q,C). 
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(10) 


(11 


— 


(12) 


Nous allons d’abord supposer que f € L? est positive à valeurs réelles. Nous avons alors par 
le théorème 14.115 qu'il existe une suite croissante de fonction étagées (et donc L®) telles 
que fn — f ponctuellement. De plus étant donné que |f,| < |f|, la proposition 27.20 nous 


dit que fn 2; f. Pour chaque n nous avons 
[ În9 = P(fn). (27.779) 


Soit g* la partie réelle positive de g. Alors nous avons la limite croissante ponctuelle fg* — 
fg* et le théorème de la convergence monotone 14.173 nous permet d'écrire 


dim J pate J fo” (27.780) 


Faisant cela pour les trois autres parties de g nous avons prouvé que si f € LP est réelle et 
positive, 


[5 = p(F), (27.781) 


c’est-à-dire que ®,(f) = o(f). 
Refaisant le tout pour les trois autres parties de f nous montrons que 


PCF) = D(F) (27.782) 


pour tout f € LP(Q). Nous avons donc égalité de @ et &, dans (Z?) et donc bijection entre 
(LP) et LA. 


Isométrie : mise en place 


Nous devons prouver que cette bijection est isométrique. Soit © € (LP) et g € LA telle que 
®, = @. Il faut prouver que 


lgla = lblczey- (27.783) 
lgl < 1gla 
Nous savons que @(f) = ( fg, et nous allons écrire la définition de la norme dans (LP)' : 
lblezry = sup |é(f)| (27.784a) 
1flp=1 

6 J fül (27.784b) 
J al. (27.784c) 

= — 

=|fgl1 


Il s’agit maintenant d'utiliser l’inégalité de Hôlder 27.33 : 


If1< sup 1lelgla = lgla- (27.785) 


|flle= 


L’inégalité dans l’autre sens sera démontrée en séparant les cas p = 1 et 1 < p < 00. 


Si p = 1, une formule Si E est un ensemble mesurable de mesure finie, alors 


| [ gdul = |[é(1z)|. (27.786) 


Mais le fait que y(E) < © donne que 1g € L!(Q). Donc 1g € L® n L!; nous pouvons alors 
écrire @(1#) = (, 1#gdpu et donc 


| [ 15du) = | Ï gdul = lé(L2)] < IAleylislh = élue. FPT 
Q E 


2200 


(13) 


(14) 
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Nous écrivons cela dans l’autre sens : 


1 1 
Z —— 1egdul =|—— | gdu|. 27.788 
be Larsdu = [sd (27.788) 


Si nous prenons S = {te © tel que [t| < |@|}, c'est un fermé vérifiant que 
1 EQooMRLGooŸPE] 
_— Ï jdn e S. RooNR EG EL, 
U(E) J 


\ 


Voilà une petite formule qui va nous aider à utiliser le lemme 27.170. Nous ne pouvons 
cependant pas l'utiliser immédiatement parce que l’appartenance (27.789) n’est vraie que 
pour les parties de mesure finie. 


Si p = 1, conclusion|1]| 


Pour utiliser le lemme 27.170, nous utilisons l’hypothèse que { est o-fini. Soient des mesu- 
rables À; de mesure fine tels que (J,ex Ai = ©. 
Pour chaque à nous considérons la restriction g;: À; — © de g à À;. Par le point précédent, 


1 : 1 : 


En appliquant le lemme 27.170 à l’espace restreint (A;, 4;, 5), nous concluons g; € $ presque 
partout, ce qui signifie que |g;|X € S. Nous en concluons que 


elle vérifie 


Igiloo < |] (27.791) 


où, dans ce contexte, |g;l. signifie sup, 4, [gi(x)|. 
Nous avons alors 
lle = suplg(x)| = sup Igilo < |pl: (27.792) 
xeQ ieN 


Une petite justification pour cela ? Prenons une suite x4 telle que [g(xx)| — |gl. Vu que les 
Ai recouvrent Q, existe un naturel 4(k) tel que xx € 4,4). Nous avons alors 


Ig(xx)l < Igillo < lol. (27.793) 


Cela pour conclure que g € L®. 


Notons que cet argument ne tient pas avec p > 1 parce que l’équation (27.787) terminerait sur 
|b|u(E)/?. Du coup l’ensemble S à prendre serait S = {te © tel que |t| < |p|u(E)/P-1} et 
nous sommes en dehors des hypothèses du lemme parce qu’il n’y a pas d'ensemble indépendant 
de Æ dans lequel l'intégrale M] fs gdu prend ses valeurs. 


1 <p < © 
La fonction 


g(t)  «; 
 sig(x) #0 
(a) = ge SAT (27.704) 
a la propriété de faire ag = |g| en même temps que |a(x)| = 1 pour tout x. Nous définissons 
E, = {x tel que |g(x)| < n} (27.795) 


et 
fn = 18,197 la. (27.796) 


Ce qui est bien avec ces fonctions c'est que ?? 


fe = 1928 D la? = |gl? (27.797) 


97. C’est ici que nous utilisons le lien entre p et q. En l’occurrence, de 1/p + 1/q = 1 nous déduisons q(p — 1) = p. 
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sur En. Dans E, nous avons |[f,| = |[g%-!| < nl et dans E, nous avons f, = 0. Au final, 
În € L?. Par ce que nous avons vu plus haut, nous avons alors 
D(n) = Po(fn). (27.798) 
Par ailleurs, 
În9 = 2e, gt LT (27.799) 
donc 
[ an = [ fngdl (27.800a) 
En Q 
= (fn) (27.800b) 
< |2| fn ll (27.800c) 


1/p 
pl ([ sl) (27.800d) 


1/p 
= | ( [ a) | (27.800c) 


Nous avons de ce fait une inégalité de la forme A < || A1/ et donc aussi A1/P < |o|!/PA1/P?, 
2 | un ee A 

et donc À < |@||p|!/PA1/P", Continuant ainsi à injecter l'inégalité dans elle-même, pour tout 

k E N nous avons : 


Lg ep 1/p} 


Nous pouvons passer à la limite & — 00. Sachant que p > 1 nous savons Al/F -; 1 et 


1 1 p 
p ph pl 
Nous avons alors 
 toivau < lé. (27.803) 


L'intégrale s'écrit tout aussi bien sous la forme {,, |9[11x,,. La fonction dans l'intégrale est une 
suite croissante de fonctions mesurables à valeurs dans [0,0]. Nous pouvons alors permuter 
l'intégrale et la limite n — © en utilisant la convergence monotone (théorème 14.173) qui 
donne alors {, |g[? < |@|? ou encore 


lgla < ll. (27.804) 


Ceci achève de prouver que l'application © > ®, est une isométrie, et donc le théorème. 


THOooXMVTooBAbyvr 
Théorème 27.172. 
Soit un espace mesuré (Q, A, u). Pour f,g € Fun(Q,C), nous écrivons 
PF) = [ F9 (27.805) 
pour toutes les combinaisons de f et g pour lesquelles l’intégrale a un sens. ITEMooNCVE00TyNsoJ 


(1) Si1 < p < , alors LP(Q, À, u) est réflexif”. 


98. Dans [10], cette équation arrive sans modules, ce qui me laisse entendre que o(f.) est réel et positif pour pouvoir 
écrire que (fn) < |D|| fn, mais je ne comprends pas pourquoi. 
99. Définition 27.166. 
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ITEMooTQDJooFShTiA 
(2) Si (Q, A, u) est o-finie, alors ITEMoOHMMZooMQxNgB 
(2a) L'application ®: L°(Q, A, u) — L\(Q, A, u) est une bijection ISOMÉEQULREFZOONXOHER 
(2b) L'application D: L'(Q, À, u) — L°(Q,A,u) est une injection isométrique. 
Note : nous verrons dans 27.176 que l'application ®: L'(R) — L°(R4) n’est pas surjective. 


Démonstration. En plusieurs parties, en notant toujours p et q les exposants conjugués, c’est-à-dire 
di 1 = 
L+1=1. 
(1) Pour (1) 
Nous considérons les applications 
a: LP (11) 


27.806 
at = [ fo EE 
Q 
et 
tr) 


of = [ ai PES 


Ce sont des bijections linéaires par le théorème de représentation de Riesz 27.171 10, L'espace 
LP est de Banach par le théorème de Riesz-Fischer 27.44 ; le lemme 27.167 s’applique donc. 
Nous considérons alors les applications correspondantes 


Bi: (LP) = (Lay (27.808) 


et 
Ba: (E*Y — (27}", (27.809) 


qui sont également des bijections linéaires. Nous allons montrer que la bijection 
Bo G 4j: LP — (LP) (27.810) 


est l’application J de la définition 27.166. 
Soient f € LP et we (LP). Il existe g € L1 tel que w = a2(g). Nous pouvons donc calculer 
d’une part, en développant S2 par sa définition (27.731), 


(82 0 e)(f)e = Ba(oatf))e = an(f)(ar!(6)) = œtf}(e) = L of. (27.811) 


et d'autre part 


J(P)e = p(f) = an(g)f = [ af. (27.812) 


TS 
ND 
nr 


Pour (2a) Ils’agit du théorème 27.171(2). 


Pour (2b)[1] Il nous reste à couvrir le cas de (L®). Pour g € L! nous prouvons que 
PE (L®). 


RS 
Co 
nr 


(3a) ®,(f) est bien définie Nous prouvons d’abord que si f € L”, alors l'intégrale 5 9 


est bien définie. Par définition du supremum essentiel 101, il existe M > 0 tel que | f(x)| < 
M pour tout x hors d’une partie À de mesure nulle. Nous avons alors 


RE fn al < M [a fui (27.813) 


100. Notez que la conjugaison complexe dans a2 n’est pas à la même place que dans a1. L'application a1 est 
exactement la même que le ® de représentation de Riesz alors que a2 est un tout petit peu modifiée. La raison de 
ce changement n’est pas très profonde : c’est seulement pour que les choses tombent juste à la fin. 

101. Voir les définitions 27.22 et 27.23. 
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(3b) ®, est continue Soit une suite fy D f ainsi que g e L\. Pour chaque k, il existe une 
partie de mesure nulle A; et un nombre My = | fre tel que |fx(x)| < |fkLe pour 
tout x hors de Az. Nous avons alors 


lPo(fx)| < [ [fkgldu < file | 19! < | fklze gli. (27.814) 
Q\Ak Q\A 


k 


Vu que par hypothèse f, — 0 dans L®, nous avons | fx] Lo — 0, et donc aussi 


lPo(k)| — 0. (27.815) 


27.173. 
Les gens qui n’ont peur d'aucun abus de notations écrivent le théorème 27.172(2a) en disant 
simplement que Li = L® et le démontrent de la façon suivante. Le théorème 27.171(1) nous 


indique que 
CP) = ra. EooJVDEoR}FYEte 


Vu que 1 < p < ©, nous avons aussi 1 < g < © et donc (11) = IP. En prenant le dual des deux 
côtés de (27.816), 
(LP = (IE) = IP, (27.817) 


À ce moment, un second abus vient en aide et nous disons qu’un espace V est réflexif quand 
V = V/. Et voilà. 


PropUKLZZZh 
Proposition 27.174. 
Soit f € LP(Q) telle que 
[ fo=0 (27.818) 
Q 
pour tout $ÿ € D(Q). Alors f = 0 presque partout. 
Démonstration. Nous considérons la forme linéaire ®; e (L1)' donnée par 
Er: PC 
(27.819) 
ur | fu 
Q 


Par hypothèse cette forme est nulle sur la partie dense C?(Q). Si (A) est une suite dans C?(Q) 
convergente vers u dans LP, nous avons pour tout n que 


0 = D,(y2) (27.820) 


En passant à la limite, nous voyons que ®; est la forme nulle. Elle est donc égale à Po. La partie 
« unicité » du théorème de représentation de Riesz 27.171 nous indique alors que f = 0 dans LP 
et donc f = 0 presque partout. 


PropLGoLtcs 
Proposition 27.175. 
Si fe Li (1) est telle que 


loc 


Ï jp = (27.821) 
I 


pour tout ÿ € CE(T), alors il existe une constante C telle que f = C presque partout. 


Démonstration. Soit 4 € C?(1) une fonction d’intégrale 1 sur Z. Si w € CY(I) alors nous considé- 
rons la fonction 


h = w — vf (27.822) 
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qui est dans C®(1) et dont l'intégrale sur Z est nulle. Par la proposition 17.2, la fonction h admet 
une primitive dans C?°(1) ; et nous notons w cette primitive. L'hypothèse appliquée à w donne 


o-fr-[rfe-vfe)- fre (Troc) (fetes) = fou-0 


——— — 
C 


(27.823) 
L’annulation de la dernière intégrale implique par la proposition 27.174 que f — C = 0 dans Z?, 
c’est-à-dire f = C presque partout. 


PROPooXNRRooUdgFPr 
Proposition 27.176 ([191]). 
L'application 
&: L'(R1) — L°(R‘) 


&,(/) = [ fu) (27.824) 


n’est pas surjective. 


Démonstration. Nous allons construire un élément de (L®°)’ qui n’est pas dans l’image de L\. 


(1) Mise en place du décor Nous considérons l’espace vectoriel normé (L®(R), N+) défini 
en 27.22 et 27.23. Dedans, nous considérons le sous-espace D des classes des fonctions dans 
D(R‘) ; nous aurions très envie de le noter (Z(R1), N;), mais nous allons le noter (D, Nc) 
parce que Ÿ est un espace de fonctions tandis que nous considérons un espace de classes de 
fonctions. 


Si f e D, alors f est une classe de fonctions contenant un unique représentant continu |? ; 


nous le notons f. 


(2) Une première fonctionnelle 
103 


Avec Ça nous posons 
Po: D — © 


fr f(0). 


(3) do est linéaire Ça ne devrait pas poser de problèmes. 


(27.825) 


(4) do est continue Soit fk V2 0. Nous devons prouver que fk(0) 6, Supposons le 


contraire et considérons € > 0 ainsi que k tels que f£(0) > €. 
Par continuité de f4, il existe un 6 > 0 tel que f£(x) > €/2 pour tout x e B(0,6). Avec cela 
nous avons No(fr) > €/2, et une impossibilité d’avoir 104 fy 2, 

(5) do est de norme finie C’est parce qu’elle est continue. 


(6) Utilisation de Hahn-Banach Le théorème de Hahn-Banach 27.158 donne une extension 
continue 


D: L(RŸ) — C. (27.826) 
Cela est un élément de (L®) et nous allons montrer qu’il n’est pas dans E(L!). 


(7) Par l’absurde Supposons qu'il existe u € L'(R9) telle que 9 = 4. Pour tout f e L®, 
nous avons 


EF) = BA(F) = ” fu. (27.827) 


Si f est la classe d’une fonction de Z(R4) s’annulant en 0, alors 6(f) = 0. De telles fonctions 
non identiquement nulles existent par le lemme 15.155 1%, 


102. Existence parce que les éléments de D sont des classes d'éléments de % qui sont C®. Unicité par la proposition 
20.150. 

103. Dans [191], l’auteur ne définit pas L®° comme un espace de classes de fonctions, et ces complications dispa- 
raissent. 

104. Je vous laisse emballer ce raisonnement dans « si pour tout N, il existe k > N tel que ». 

105. Ce lemme donne un exemple f sur R. Si vous voulez vraiment un exemple dans R°, prenez g(x) = f(|x|). 
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Soient © € Z(RŸ), un compact K ne contenant pas 0 et xx sa fonction indicatrice. Nous 
avons Xxÿ € L(R1), et (xxw)(0) = 0. En passant aux classes, p([xx f]) = 0. Nous avons : 


0 = le Red = [. P(uXR). (27.828) 


Vu que cela est valable pour tout w € Z(R4), la proposition 27.174 dit que uxx = 0 presque 
partout. 


(8) Le coup du compact 


Soit une suite de compacts K, recouvrant R\{0}. Par exemple 


Kn = B(0,n)\B(0, 2). (27.829) 


Pour chacun des K,, nous avons uxx, = 0 presque partout. Il existe donc une partie de 
mesure nulle N, telle que uxK, est nulle à part sur N,. Au total, u est non nulle seulement 
sur [J, Ny et peut-être en 0. 
Bref, u est non nulle sur une partie de mesure nulle par le lemme 14.27. 

(9) Conclusion 
La fonction u est nulle presque partout. Donc 4 = &, = 0. Nous savons pourtant que @ n’est 
pas nulle parce qu'il existe des fonctions dans Z(R) qui ne s’annulent pas en 0. 
Cela est une contradiction. Donc 4 n’est pas dans l’image de $ tout en étant dans L°(R4). 


Dans [673], il est dit que « la preuve [du lemme suivant], un peu fastidieuse mais en rien 
ingénieuse, est laissée en exercice ». La preuve est donc de moï; elle est un tout petit peu ingénieuse 
mais en rien fastidieuse. J'espère ne pas m'être trompé et me demande bien ce que l’auteur avait 
en tête. Ma preuve s'appuie sur la proposition 17.104 dont la preuve ne me paraît pas non plus 


« fastidieuse maïs en rien ingénieuse ». 
LEMooLDQRooEGWD1m 


Lemme 27.177 (673, 1]). 
Soit r > 0. Il existe Ô > 0 tel que pour tout s,t € © vérifiant |s| < 1, |[t| < 1 et |s —t| > r nous 
ayons 


au P+|ifP 
Se SOU, (27.830) 
2 2 
Démonstration. Soit r > 0. La partie de C? donnée par 
D = {(s,t) e C? tel que |s| < 1,[t| <1,[s—t| > r} (27.831) 


est compacte. En effet elle est bornée (par la sphère de rayon 42) et fermée comme intersection 
de fermés 1%, Nous considérons la fonction A: D — R donnée par 


+lP p +? 
hr At ER (27.832) 
2 2 
Si vous voulez une expression explicite, 
2P-1|s + 4[P 
Aer le (27.833) 
|s|P + lé[P 


Cela est bien défini et continu sur D parce que le complémentaire D° (qui est ouvert) contient 
(0,0) et donc aussi un voisinage de (0,0). 

La proposition 17.104 nous dit que la fonction z + |z[P est strictement convexe. En prenant la 
définition 17.97 de la stricte convexité avec 0 — i, nous trouvons que 


A(s,t)<1 (27.834) 


106. Lemme 7.6 suivit du théorème de Borel-Lebesgue 10.24. 
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pour tout (s,t) € D. Vu que par ailleurs À est une fonction continue sur le compact D, elle atteint 
un minimum dans D. Soit Ag ce minimum qui vérifie forcément A < 1. 
En posant 1 — d = A5 nous avons le résultat. 


27.15.1 Le théorème de Jordan 


Les définitions de chemins, de lacets et de courbes de Jordan sont dans 20.72. 


LEMooZPRLooJPvrOE 
Lemme-Définition 27.178 ([201]). 
Soit un lacet y: [a,b] — X. Nous considérons l'application 
g: [a,b] — S° 
a  . (27.835) 


Il existe une unique application continue 3: $! — Image() telle que y = 30 q. 
Cette application 7 est l’application quotient associée à 7. 


Démonstration. La proposition 18.61(1) dit que q est une bijection continue. Donc l'existence et 
l'unicité d’une application 4 = 70 q_!. Cette application est continue comme composée d’applica- 
tions continues. 


LEMooCGVOooVP1SRD 
Lemme 27.179 ([201]). 
Soit y: [a,b] — X un chemin d'image T. ITEMoOWKVAooCQDvpL. 


(1) Si est un chemin de Jordan, alors y: [a,b] — T est un isomorphisme d'espaces topolo- 


giques. ITEMooVYMXooEtgPJT 


(2) Si est un lacet de Jordan, alors le quotient} ® 4%: S1 > T est un homéomorphisme 


Démonstration. En deux parties. 


(1) Pour (1) Un chemin de Jordan est injectif, et donc bijectif sur son image. Il est donc une 
bijection continue depuis [a, b] qui est compact. Il est donc un homéomorphisme par le lemme 
7.212; 


(2) Pour (2) L'application 7: [a, b] — T est une bijection continue parce que 7 est un lacet de 


Jordan. Son quotient 4: S! — T est donc une bijection continue depuis le compact $!. Le 
lemme 7.212 conclut que c’est un homéomorphisme. 


CORooPGFLooUTVZMi 
Corolaire 27.180. 
À propos de courbes simples et de Jordan. 
(1) Toute courbe simple est homéomorphe à [0,1]. ITEMooIUAXo00fvNov 


(2) Toute courbe de Jordan est homéomorphe à S. 


Démonstration. Une courbe simple est l’image d’un lacet de Jordan. Donc 7: [a,b] — T est un 
homéomorphisme par le lemme 27.179(1). Le lemme 11.235 fournit un homéomorphisme entre [a, b] 
et [0,1]. Une composition d’homéomorphismes est un homéomorphisme. 

Une courbe de Jordan est l’image d’un lacet de Jordan y: [a,b] — T. Le lemme 27.179(2) dit 
alors que L est homéomorphe à S1. 


DEFooURFMooXIaRkl 
Définition 27.181 ([201]). 
Soit un compact K dans C. Nous notons 


(1) G(K) le groupe multiplicatif des fonctions continues f: K — C*. 


107. Définition 20.72. 
108. Définition 27.178. 
109. Bijection continue d’inverse continu. 


27.15. DUALITÉ, RÉFLEXIVITÉ ET THÉORÈME DE REPRÉSENTATION DE RIESZ 2207 


(2) E(K) le sous-groupe des fonctions admettant un logarithme continu 11. 


(3) G(K) le quotient 11 G(K) = G(K)/E(K). 
LEMooHEOWooHTtHsJ 
Lemme 27.182 ([201]). 
Si K1 et Ka sont des compacts homéomorphes, alors les groupes G(K1) et G(K2) sont isomorphes. 


Démonstration. Soit un homéomorphisme 0: K; — K2. Nous posons 


Y: G(K1) — G(Ko) 


(27.836) 


(1) Injective Suppose Y(f) = #(g). Vu que 0 est une bijection, l'égalité f o 97! = go 07! 
implique f = g. Donc Ÿ est injective. 


(2) Surjective Soit f € G(K2). Nous avons f 0 0 E G(K3), et évidemment #(f © 0) = f. 


(3) Morphisme Nous avons 


p(fg) = fg0 8 = (f00 7 )(g0 077) = Y(F)#(g). (27.837) 


Nous avons prouvé que + est un isomorphisme. Nous devons maintenant voir qu’il passe au quotient, 
c'est-à-dire que Y(E(K1)) € E(K)). Soit f € E(K1), soit un logarithme continu g de f, c’est-à-dire 
exp (g(x)) = f(x). Pour y € K, il existe x € K1 tel que y = 0(x). Dans ce cas nous avons 


exp (90077 )(y)) = exp (g(x)) = f(x) = (fo 077)(y). (27.838) 
Autrement dit, 
exp (#(9)(y)) = Y(f). (27.839) 
Donc #(g) est un logarithme continu de 4 (f). 
DEFooKXHUooTsKuDe 
Définition 27.183. 
Petite notation. Si un compact K est donné, pour p € C\K, nous notons 
: K — C* 
fo (27.840) 
ZE 2—D. 
LEMooSULYooWiEoyf 
Lemme 27.184. 
Nous considérons l'application 
:C—C 
(27.841) 
x Àr+a 
avec À Z 0 (ÂEC)etaecC. 
Soit qe C. Nous avons !!? 
fa(o(x)) = Afo-1(9 (€). (27.842) 


Démonstration. En ce qui concerne la multiplication nous avons f,(Ax) = Àx — q, et donc 


1 q 
x Ja(ax) ne Jan). (27.843) 
Nous retenons : f{(Ax) = Af,/\(x). En ce qui concerne la translation, c’est plus facile : 


f{z+a)=r+a-g= fo a(x). (27.844) 


110. Logarithme continu, définition 26.44. 
111. Le groupe G(K) est commutatif; donc pas de problèmes pour que €(K) soit normal. 
112. L'application f, est celle de la définition 27.183. 
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Lorsque nous faisons les deux en même temps, 


fa(o(x)) = fa-a (At) = Af(q-ay/A(&). (27.845) 
Il suffit maintenant de remarquer que -1(q) = TT, ce qui est facilement vérifié : 
qg— a g—a 
= = q. 27.84 
1 A(IE) + q (27.846) 
LEMooBZUCooHWfo1f 


Lemme 27.185 ([201|). 
Soit un lacet de Jordan! y: [a,b] — C. Nous notons T' son image. 


(1) T est compact. 
(2) L'application |" 
L:G(T)—7Z 
fr Ind(f 07,0) 


est un morphisme surjectif de noyau E(T). 


(27.847) 


Démonstration. Nous notons £L(J, C*) le groupe multiplicatif des lacets J — C*. Le fait que 
soit compact est parce qu’il est l’image du compact [a, b] par l’application continue 7 (théorème 
7.211). 
Nous considérons l'application 
£: G(T) — L(J, C*) 


27.848 
Je fo ) 


(1) € est un morphisme Nous avons 


E(fg) = (fg) ° 7 = (fo y)(g0 7) = E(F)E (9). (27.849) 


(2) £ est injective Nous nous souvenons de l'application quotient 4: S! — l', qui est un 
homéomorphisme par le lemme 27.179(1). Nous nous souvenons également de l’application 


: [a,b] — C 
el (27.850) 
tr exp (2int/(b — a)) 
qui vérifie y = Ÿ o g. Nous montrons que ceci est l’inverse de 6 : 
0: L(J, C*) — GT 
CS sé Le | (27.851) 
À io 
Soit o € L(J, C*). Nous avons 
E(8(o)) = Ho)oy=&0oÿ loy=60ÿ lofog=50g=0. (27.852) 


(3) Conclusion 1 La proposition 26.55 donne un morphisme surjectif D: £L(J, C*) — Z. L'ap- 
plication Z, dont nous parlons ici est exactement 1, = 4 © £&. Donc J, est un morphisme 
surjectif. 


(4) Noyau Nous devons encore montrer que le noyau de Z, est E(T'). 


113. Définition 20.72. 
114. Rappel définitions 27.181 pour G(T) et E(T). 
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(4a) 


(4b) 


Dans un sens Soit k € ker(1,). Alors (4 o £)(k) = 0, c'est-à-dire d(k o y) = 0. La 

proposition 26.55(3) dit qu’alors ko est un lacet homotope dans C* à un lacet constant. 
Donc il existe une application continue A: [0,1] x [a,b] — C* telle que 

H(0,t) = (ko y)(t) (27.853a) 

HU = 1 (27.853b) 


pour tout t. Vu que l’application 7: [a,b[ — C* est injective, nous pouvons considérer 
son inverse ; pour la suite, quand nous écrirons + !, c’est bien de + !: L — [a,b[ que 
nous parlerons. C’est une application continue par le lemme 7.214. Nous pouvons donc 
considérer 


LUXE SC 


: (27.854) 
(u,2) > H(u,y (2). 
Cela est une application continue parce que H et 7 le sont. Nous avons 
L(0,2) = H(0,% "(2)) = (ko y)(r (2) = k(2), (27.855) 
et 
(Le) = 1; (27.856) 


Donc k est homotope à une application constante sur l. Le théorème de Borsuk 26.47 
dit alors que k admet un logarithme continu sur ’, c'est-à-dire que k € E(T°). 

Dans l’autre sens C’est le même raisonnement que le premier, mais un peu plus 
simple parce qu’il n’y a pas de débats sur la continuité. Soit k € E(T). Le théorème de 
Boruk indique que k est homotope dans C* à une application constante. Il existe une 
application continue A: [0,1] x F — C* telle que 


H(0,2) = k(2) (27.857a) 
HAS (27.857b) 


pour tout z € [”. Le chemin ko est homotope à un lacet constant. En effet nous avons 


l'application continue 
L: [0,1] x [a,b] — C* 


(27.858) 
(ut) Hu, (+) 
qui vérifie L(0,t) = (ko y)(t) et L(1,t) = 1. Nous avons donc 
0 = Y(ko y) = L(k). (27.859) 
Nous avons prouvé que k € ker(J.,). 
LEMooUDIPooBZJPAW 


Lemme 27.186 ([201]). 
Soit un lacet de Jordan y dont l’image est T. Des fonctions fo, f1 € G(T) sont homotopes dans C* 
si et seulement si les lacets fo o y et f1 0 y le sont. 


Démonstration. Dans les deux sens. 


(1) = Nous supposons que fo et f1 sont homotopes : il existe une application continue A: [0,1]x 
T — C* telle que 


H(0, +) = fo(z) (27.860a) 
H(1,2) = fe) (27.860b) 


pour tout z € l'. L’homotopie entre fo o y et f1 0 y est donnée par l’application continue 


L: [0,1] x [a,b] — C* 


ae Fi 1). (27.861) 


Elle vérifie L(0,t) = (fo o y)(t) et L(1,t) = (f10 y)(#). 
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(2) = Nous supposons l’existence d’une application continue Æ: [0,1] x [a,b] — C* telle que 
H(0,t) = (fo o 7)() et H(1,t) = (fi o 7)(e). 
L'application y: [a,b[ — T est continue et bijective. Sa réciproque + est donc également 
continue (lemme 7.214). Nous pouvons donc considérer l’application continue 


1 


Le WIRD + 0 


_ (27.862) 
(2) Hu"). 
Elle vérifie 
L(0,z) = H(0,% (2) = (foo (77 (2) = fo() (27.863) 
et L(1,z) = f1(7). Donc L est une homotopie dans C* entre fo et f1. 
CORooDOMAooHtKPTe 


Corolaire 27.187 ([201]). 
SiT est une courbe de Jordan, alors}! G(T) = Z. 


Démonstration. Nous allons utiliser le premier théorème d’isomorphisme 2.6. Si y est un lacet de 
Jordan dont la courbe est l, le lemme 27.185 dit que Z,: G(T) — Z est un morphisme surjectif tel 
que ker(J,) = E(T). Le théorème d'isomorphisme dit alors que 


es = 1, (G(T)) = Z. (27.864) 


Rappel, si X est compact dans ©, et si p € ©, nous considérons la fonction f, € G(K) par 
(2) = 2 —p. 


LEMooAKVFooFMHaOZ 
Lemme 27.188 (|1]). 
Soient une courbe de Jordan y ainsi que p € C. Nous avons 
Ind(f, © 7,0) = Ind(y,p). (27.865) 
PROPooUPPE00oEQ0O0Kkh 


Proposition 27.189 ([201]). 
Soit pe C. Si V est un disque ou un rectangle de centre p, alors G(OV) est engendré par E(OV) et 
par fp. 


Démonstration. Ici OV peut être vu comme un chemin que nous allons noter aussi y. Utilisant le 
lemme 27.188, nous avons 


Iov(fs) = Ind(f, o 6V,0) = Ind(ôV, p). EQooRSARoR ROUE 


(1) Si V est un disque Alors OV est le chemin 


7: [0,27] — © 


. 27.867 
te p+Reï. ) 
Nous avons alors le calcul suivant : 
1 FF y) 
Ind(7,p) = | dt 27.868a 
GE 56 > Fo 
1 27 Rieït 
_ - 27. 
Zi], Ret dt (27.868b) 
1 27 
= — idt (27.868c) 
271 Jo 
= 1. (27.868d) 


115. Rappel : G(T) est défini en 27.181. 
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(2) Si V est un rectangle Supposons que V ait une hauteur de h et une largeur de ! tout en 
étant centré en p. Le chemin ©V se décompose en quatre partie dont la première est 


hi I (27.869) 


Je vous laisse voir les autres parties et calculer les intégrales 16 


Dans les deux cas nous avons Ind(ôV, p) = 1 et donc, en continuant (27.866), 
BEC) (27.870) 
Nous savons par le lemme 27.185 que 


Tov: G(OV) — Z 


27.871 
fr Ind(f o 7,0) ) 


est un morphisme surjectif de noyau €(T). Le fait que ce soit un morphisme implique que 


Lov(fr) = nlov(fp) = n. (27.872) 


Mais G(0V) = G(0V)/E(0V). Donc nous avons déjà prouvé que {ff}xen contient un élément de 
chaque classe dans G(0V)/E(OV). 
Soit f € G(0V). En notant [.] la classe par rapport à E(OV), il existe k € NN tel que 


fe [av(fs)]: (27.873) 


Autrement dit, en posant à = 1 ( FE il existe h € E(OV) tel que f = ah. Nous avons donc bien 
prouvé que {f»,£(0V)} engendre G(OV). 


PROPooJNZQooLWDKrwv 
Proposition 27.190 ([201]). 
Soit un compact K de © ainsi que p,q deux points dans la même composante connexe de C\K. 
Alors ITEMooQMKOooQHhUGn 


(1) fp/ fa € E(K). ITEMooUJLPooApgXIF 
(2) Si p est dans la composante non bornée 7 de C\K, alors f, € E(K). 


Démonstration. Soient p et q dans la même composante connexe de C\K. La proposition 10.64 
nous autorise à considérer un chemin 7: [0,1] — C\Æ tel que (0) = p et y(1) = q. Nous posons 


F: [0,1] x K — C* 


(2) fe) = 2-70. (27.874) 


C’est une application continue vérifiant F(0,z) = f,(2) et F(1,z) = f,(z). Donc les applications 
fn et f4 sont homotopes dans C*. La proposition 26.15 nous indique qu’alors l’application f,/fa 
est homotope à 1. Le théorème de Borsuk 26.47 conclut que f,/f4 € E(K). 

Soit p dans la composante non bornée de C\X. Vu que X est borné, nous pouvons prendre 
r > 0 tel que K € B(0,r). Soit po # B(0, r) ; ce point est également dans la composante non bornée 
de K. Par le point (1), nous avons fr/fn0 € E(K). 

Nous allons prouver que f,, € £(K). Pour cela nous posons 


F: [0,1] x K — C* 


27.875 
(£, 2) + {2 — Po. ) 


116. Je n'ai pas vérifié; si ça pose un problème, écrivez-moi. 
117. Il y en a une seule, c’est le lemme 26.49. 
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Vu que te [0,1] et que ze K © B(0,r), nous avons toujours #z € B(0,r). Étant donné que po 
n’est pas dans B(0,r), l'application F prend bien ses valeurs dans C*. 

L'application F vérifie également F(0,z) = —po et F(1,2) = 2 — po = f»(2). Donc fn, est 
homotope dans C* à l'application constante —p9. Nous en déduisons que fn, € £(K). Au final, 


J 
fn = fn + € E(K) (27.876) 
Îpo 
parce que fr €t fn/fn Sont dans E(K). 
LEMooUTMGooZeUoCy 
Lemme 27.191 ([201]). 
Soient des composantes connexes bornées O1, ..., On de C\K que nous supposons deux à deux 
disjointes. Soient p; € O;. Si n1,...,nn € Z sont des entiers non tous nuls, alors 
Il fé E(K (27.877) 


Démonstration. En plusieurs points. 


(1) Par l’absurde Nous notons f — LE 1 7 et nous supposons par l’absurde que f € E(K). 


Par le théorème de Borsuk 26.47, nous avons une extension continue f: © — C*. 
(2) 00; € K C’est le lemme 7.72. 


(3) p; n’est pas dans O; Nous savons que p; € O;. Mais 00; € K et KnO; = G. Donc p; 
n’est pas dans 0O;. Comme les O; sont disjoints, nous avons aussi p; # O;. Bref, 


pj € Où. (27.878) 
(4) Quelques fonctions Nous posons 
C0; C0 
2 [[G-p)%. (27.879) 
JA 


Le fait que G; prenne ses valeurs dans C* est parce que p; O; pour tout à  j. 
Nous reprenons notre extension continue F : C — C* et nous posons 


F0 0" 
: ÎQ) (27.880) 
G;(2) 


Vu que G; ne s’annule pas sur O;, cette fonction F; est bien définie et continue. 
Nous nous fixons i, et nous allons prouver que n; = 0. Nous posons D = B (0,R) avec R 


assez grand pour contenir ©;. Posons 
Hi: BO,R) — C* 
. F;(2) size OO; (27.881) 
(z— mp)" sinon. 
(5) H; est continue L'application F; est continue sur ©;. L'application 2 + (2 — p;)" est 


continue sur C. 
Soit z e 00. Nous avons z € 00; c K et donc f(z) = f(z). Donc 
ÏQ) 


F (0 = ES = ft) (27.882) 


Les deux applications F; et z2 + (2 — p;)" sont égales sur le bord 00;. Donc H; est continue 
sur B(0,R). 
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(6) Logarithme continu La partie B(0,R) est convexe et compacte. Le corolaire 26.48 dit 
que H; admet un logarithme continu. La proposition 26.58 nous affirme que pour tout lacet 
7: [0,1] — B(0,R), nous avons Ind(H; o +,0) = 0. En particulier le chemin 0B(0,R) est 
dans B(0,R). Avant de calculer Ind(H; o ,0), remarquons que y(t) € B(0,R) et reste donc 
en-dehors de ©. Donc 


Hi(y@)) = (6) — ni)" (27.883) 
et 


(Hi 0) (#) = m7 (8) (70 pi)". 


De plus si vous voulez une forme explicite de +, c’est pas compliqué : c’est un cercle de rayon 
R. Nous avons un calcul : 


(27.884) 


1 dz 
= Ind(H; 0,0) = — = 27. 
0 = Ind(H; o ,0) ri Ju = (27.885a) 
1 f(Ho7)( 
27.885b 
x | Got CI 
1 finy Oo) -p)"" 
| A )(n( ) pi) (27.885c) 
2m Jo (y(E) — pi) 
Lo my 
Î LRAURE (27.885d) 
27i Jo 7(t) — pi 
1 
ee Î de (27.885e) 
2m J, z — pi 
= n; Ind(y, pi). (27.885f) 
Vu que p; € B(0, À) et que 7 est un cercle autour, nous avons Ind(,p;) = 1. Donc 
Ü= dif; 6%, 0) = n; (27.886) 
LEMooEJRMooNJhMov 


Lemme 27.192 ([201, 1]). 
Nous notons (O;);er les composantes connetes bornées de C\K. Pour chaque à € T nous considérons 
pi € O;. Alors 

G(K) = gr (E(K), {fn hier). (27.887) 


Démonstration. Nous commençons par prouver que si q € C\K, alors 
fa € gr (E(K), {fpiier)- (27.888) 


Il y a deux possibilités : soit q est dans la composante non bornée, soit il est dans un des O;. 


(1) Si q est dans la composante non bornée Alors la proposition 27.190(2) dit que f, € 


E(K). 
(2) SigeO; Alors la proposition 27.190(1) dit que f4/fn, € E(K). Dans ce cas nous avons 
au De € gr (fn, E(K)). (27.889) 
Pi 


Soit f € G(K). Nous devons prouver l'existence de g € E(K), q,...,q € C\K et m1,...,mu eZ 
tels que 


l 
f=o[ [ie (27.890) 


Nous commençons par supposer que K € Q = [0,1] x [0,1]. 
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Les petits carrés Soit n € N. Nous subdivisons le carré Q en carrés fermés de taille 1/n ; 
il y a n°? tels carrés. Nous notons Q1,...,Q1 ceux qui n’ont pas d’intersection avec K, et nous 
notons À l’union des autres. 


Grâce au lemme 11.24, nous savons que pour tout z € À, nous avons d(z, K) < V2/n. 


Prolongement La partie K est fermée, f est continue dessus. Le théorème de Tietze 27.163 
donne un prolongement continu F': © — €. Nous avons 


KCS=f{2e C tel que F(z) 4 0}. (27.891) 


Vu que Fest continue, S est ouverte. 


Grand n Nous prouvons que n peut être choisi assez grand pour que F' ne s’annule pas sur 
À. La fonction F est continue et ne s’annule pas sur l’ouvert $ qui contient K. Si S = ©, 
alors n’importe quel n convient. 
Sinon nous considérons 

p: K — [0,0 


27.892 
2e d(z, 8°). ) 


L'application & est continue sur le compact K. Elle a donc un minimum global que nous 
nommons s. Pour tout z € K nous avons d(z,$°) > s. Donc pour tout z € K nous avons 
B(z,s/2) € S. Nous prenons n assez grand pour avoir 


v2 . EnooEWQYoeNYS In 


Avec ça nous avons À © $. En effet, soit z € À. Nous avons d(2, K) < V2/n < 5/2. Donc il 


existe k € K tel que 
8 
5) (27.894) 


Comme k € K, nous avons d(k, S°) = o(k) > s et donc B(k,s/2) € $S. Nous avons prouvé 
que z € S. 


ze B(k, 


Bref, nous prenons n assez grand pour vérifier (27.893), et nous avons alors 


AcfzeC tel que F(z) # 0}. (27.895) 


Une propriété à prouver Notes one DroUver l'énoncé suivant. Soit k = 0,...,{1, soit 
une application continue h: K — C* admettant un prolongement continu F: AU(Q10...Ù 
Qx) — C*. Alors il existe m € IN tel que l’application h/ Ja, admette un prolongement 
continu F: À U (Qu U ... U Qur1) — C*. 


Note pour f 


Jusqu'ici, nous avons prouvé que f vérifie les hypothèses de la récurrence pour # = 0. 
De plus, cette propriété à prouver n’est pas à prouver par récurrence sur k. Le k est fixé, et 
nous prouvons la propriété de façon directe. Une récurrence va venir un peu plus loin. 


Preuve de la propriété Soit h: K — C* continue et admettant un prolongement continu 
F: AU(Q:0...Qx) — C*. Notons Bx = A LU (Q1 L...U Q+x) et posons 


g: OQrr1 — C* 
F2) size Qxr11n Be (27.896) 
AE 
s(z) sinon. 


Voyons ce que s peut être pour que g soit continue. La partie 0Q4.,1 est le bord d’un carré 
et est donc constitué de 4 côtés. La valeur de g sur certains de ces côtés (ceux qui sont 
aussi dans B;) est prescrite par F. Sur les autres côtés, nous pouvons mettre n'importe quoi 
pourvu que ce soit égal à F sur les coins et que s(z) # 0. Étant donné que les valeurs de F 
sur les coins est non nulle et que C* est connexe par arcs, c’est possible. 
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Nous notons 4,1 le centre de Qz,1. La proposition 27.189 s'applique au compact 0Q%:1. 


g € G(0Qk+1) = gr (E(OQx+1), far): (27.897) 


Il existe donc £ € E(0Qx+1) et m € Z tels que 
ge) = EC) fa. Ce). (27.898) 
Prouvons que Q%11 n B4 est une union de côtés de Qx:1. Nous avons 


De (0. duo. 2001200. A0) 0 PTE) 


Nous nous souvenons que À = [J}_; R; où R; sont les carrés qui intersectent K. Donc R;nQ; 
est au maximum les côtés de Q;. Bref, chacun des termes de l’union à droite de (27.899) est 
une union de côtés de Qz+1. 

L'application £ € €(0Q%+1) admet un logarithme continu et admet donc une extension conti- 
nue € — C* (théorème de Borsuk 26.47). Nous considérons cette extension seulement sur 
Qz21 et nous l’appelons G: Qzx:1 — C*. Nous posons 


F: AU (QU... U Qrr1) — C* 


G(2) si z € QK+1 (27.900) 
2 ; | 
Cr si z € À LU (Qi LU... LU Qx). 


Voyons que cette fonction est continue en montrant que les deux morceaux ont les mêmes 
valeurs sur l’intersection. Soit z € Qz41 N (À LU Qi LU... L Qÿ). Alors z € 0Qz11 parce que 
nous avons dit que (27.899) est dans le bord dans Qz%41. Dans ce cas nous avons 


G(2) = (a = (27.9012) 
qk+1 
__FG) 

L fr. © (27.901b) 

(27.901c) 


et donc bien la continuité de F. 


Si z € K, étant donné que K € A nous avons 


0) 0 
FO EE uns JR © 


(27.902) 


donc F prolonge bien h/ Pr 


(7) Récurrence En appliquant la propriété (4) { fois, nous construisons une suite d’entiers 
(mi)i=1,.….1 et une application continue F1: À L (Q1 L ... Ü Qr) = Q — C* qui prolonge 

L Pre 

f/ Ii: di ” 


Sur À nous avons alors 


l 
= (27.903) 
i=1 


C’est une application continue sur le convexe Q. Donc F} € E(Q) et donc Fe E(K). 


Maintenant vous croyez avoir fini mais non. Vous devez encore vérifier que tout est encore valable 
si À n’est pas contenu dans [0,1] x [0,1]. 

Soit un compact général K € C. Pour À > 0 et à € ©, nous posons d(x) = Àx + à. Il existe 
forcément un choix de À et de a tels que O(K) € [0,1] x i[0,1]. 
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Soit f e G(K). Nous appliquons le résultat déjà prouvé à l'application fo! e G (O(K )). Nous 
avons g € E(o(K)), d,...,qe C\o(K) et m1,...,mu € Z tels que, pour tout y € b(K), 


l 


(fo !)(y) = g(y) 11 CE (27.904) 
Pour x € K nous avons donc : 
f(x) = (go @)(x) [La ((x)). (27.905) 
C’est le moment de sortir le lemme 27.184 : : 
f&) = Go da) Il ma (ba) = (go dx) Il ip (a). (27.906) 


En posant 


l 
ÿ(x) = (Il #) (go @)(x) (27.907a) 


Gi = DT" (&), (27.907c) 


nous avons 4; € C\K,gÿEeE(K)et f = al à Je 


LEMooBHOGooXxBYGA 
Lemme 27.198. 
Une partie ouverte de € a au plus un nombre dénombrable de composantes connexes. 


Démonstration. Soit un ouvert À de C. Nous notons B une base dénombrable d’ouverts de € 
(proposition 7.130). Une composante connexe de À est ouverte !15. Les composantes connexes de 
A sont disjointes, et chacune est l’union d’une quantité (au plus) dénombrable d'éléments de B. 
Si il y avait une quantité non dénombrable de composantes connexes, cela ferait une quantité non 
dénombrable d'éléments différents de B. Donc non. 


THOo00DGXS0oMMHTds 
Théorème 27.194. 
Soit un compact K dans C. Alors 


(1) Le nombre de composantes connexes bornées de C\K est fini où dénombghlé urcpoozcoRrP 


(2) En notant N le nombre de composantes connexes bornées de C\K, nous avons 
G(K) = G(K)/E(K) = 7" (27.908) 
où, si N est infini, Z\ désigne l’ensemble des suites finies dans Z. 


Démonstration. Le fait que le nombre de composantes connexes bornées de C\Æ est au maximum 
dénombrable est le lemme 27.193. 

Soient {O;};-0...,n les composantes connexe bornées de C\Æ (avec à € IN dans le cas où N il 
y à une infinité dénombrable de composants connexes). Pour chaque à nous prenons un élément 
pi € Oi. Nous notons aussi tr: G(K) — G(K) le morphisme canonique. Nous posons 


p: ZN = G(K) 
me (27.909) 
ne | [r()". 


Notez que le produit a toujours un sens parce que n € ZV est toujours une suite finie (de taille N 
ou arbitraire) d’entiers. Pas de soucis de convergence. 


118. Proposition 7.71 et le fait que € est localement convexe. 


27.15. DUALITÉ, RÉFLEXIVITÉ ET THÉORÈME DE REPRÉSENTATION DE RIESZ 2217 


(1) $ est un morphisme Sur Z”, nous mettons l’addition (a + b); = a; + b;. Si N = w et si 
a et b ont des longueurs différentes, on prend pour N le maximum des deux longueurs. Nous 


aVONS : 
N N 
(a)6(b) = | [r(,)° 1 (fo, )*: (27.910a) 
i=1 j=1 
N 
= le (27.910b) 
=1 
= p(a + b). (27.910c) 


(2) p est injective Soit a e ZN. Si a Z 0, alors le lemme 27.191 nous dit que LÉ Ji € E(K). 


Vu que dans G(K), le zéro est €(K), nous avons ne A( fn)" # 0 dès qu’un des a; est non 
nul. 


(3) d est surjective Soit F € G(K). Vu que x est surjective, il existe f € G(K) tel que 
r(f) = F. Le lemme 27.192 nous dit qu'il existe ge E(K) et a € ZN tels que 


N 
[1 (27.911) 
i=1 
Nous avons alors 


N N 
F=n(f) = n(9)r (Il x) - L Ir)" = 6(a). (27.912) 


DEFooWQSAooDQYaip 

Définition 27.195 ([201, 1]). 
Si(G,+) est un groupe abélien, la pseudo-dimension de G est le cardinal maximum des familles 
Z-indépendantes de G. 

Dans ce contexte, une famille Z-indépendante est une partie {ai}ier de G telle que si Ÿ,; ai = 0 
avec z; € Z, alors z; = 0 pour tout i. 

Si il existe une partie libre idempotente à un ensemble À, mais pas de parties libres surpo- 
tentes 1? à À, nous disons que la pseudo-dimension de G est « la cardialité de À ». 


Dans tous les cas, nous notons pdim(G) la pseudo-dimension de G. 
LEMooPASKooFGJgBz 


Lemme 27.196 ([201, 1]). 
À propos de pseudo-dimension. 
(1) La pseudo-dimension de 7” est n. 


(2) La pseudo-dimension de Z° !? est la cardinalité de N. 


Démonstration. Nous commençons par le cas de Z" et nous ferons Z° après. 


(1) Zn Prenons la base canonique (e;);-1...n de Z”. C’est une partie Z-indépendante de Z. 
Donc la pseudo-dimension de Z” est plus grande ou égale à n. 


(2) <n Dans l’autre sens, supposons que {a;};e soit Z-indépendant dans Z". Pour rappel, la 
définition 4.1 de partie libre ne parle que de sommes finies. 
Prouvons que {a;};er est Q-libre dans Q”. Soient une partie finie J de Î ainsi que des 
rationnels {q;}jez que » jeJ djaj = 0. Nous pouvons utiliser le lemme 1.384 pour considérer 
ke N\{0} tel que kg; € Z pour tout j (ici il est crucial que J soit fini, sinon on ne peut pas 
prendre un maximum). Dans ce cas nous avons ÿ: je kgjaj = 0, ce qui montre que {a;} n’est 
pas Z-indépendante. 


119. Définition 1.111. 
120. Pour rappel, Z° est l’ensemble des suites finies d'éléments de Z. 
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L'intérêt de Q est d’être un corps (alors que Z ne l’est pas). Nous savons que Q” est un 
Q-espace vectoriel de dimension n. Il ne contient donc pas de parties Q-libres de cardinal 
plus grand que n. 


Nous passons maintenant à la preuve pour Z°[1]. L'existence d’une partie dénombrable et 
Z-libre dans Z® est facile : il faut juste prendre e; étant la suite nulle partout sauf en 4. La partie 
{e;}ien est Z-libre dans Z®. 

Nous devons maintenant montrer que toute partie libre de Z° est au maximum dénombrable. 
Soit une telle partie À. En posant 


An = {x € À tel que tn Z0et xx =0sik > n}. (27.913) 


Étant donné que À ne contient que des suites finies, À = Uen An: 
D'abord 4, est Z-libre dans Z”. En effet considérons une partie finie {a;};er de À, ainsi que 
des entiers {}ier tels que D;-7 ai = 0. Vu que {ai}ier est également une partie finie de À, nous 
en déduisons que z; = 0 pour tout 1. 
La partie À, étant libre dans Z”, elle est finie (de cardinal au maximum n). La partie A étant 
une union dénombrable de parties finies, elle est au maximum dénombrable. 


LEMooEYDNooEUKUpn 
Lemme 27.197. 
Deux groupes abéliens isomorphes ont même pseudo-dimension. 


Démonstration. Soient des groupes abéliens G et H ainsi qu’un isomorphisme 4: G — H. Soit une 
partie Z-indépendante {a;};er dans G. Nous montrons que {@(a;)}ier est Z-indépendante dans H. 
En effet si Dr d(&) = 0, alors 0 = D, d(za) = p(>;; su), et donc D, za; = 0, ce qui 
entraine 2; = (0. 
Cela prouve que pdim(H) > pdim(G). En inversant les rôles de G et H (et en utilisant @ 1), 
nous prouvons que pdim(G) > pdim(H). 
Si une des pseudo-dimensions est infinie, le raisonnement donné doit être récrit en disant que 
G possède une partie Z-libre de telle cardinalité si et seulement si H en possède une. 
CORooQNUIooKLtWVD 


Corolaire 27.198 ([201]). 
Soient des compacts K1 et Ka homéomorphes dans C. Alors les parties C\K1 et C\K2 ont le 
même nombre de composantes connexes. 


Démonstration. Vu que K; est homéomorphe à X°2, les groupes G(K1) et G(K2) sont isomorphes 
par le lemme 27.182. Le théorème 27.194(2) nous enseigne que, si on désigne par N; le nombre de 
composantes connexes de C\X;, alors G(K;) = ZM. Le fait que G(K1) soit isomorphe à G(K°2) 
implique 

ZM = ZM, (27.914) 


Le lemme 27.197 indique alors que pdim(ZM1) = pdim(Z 2). Et enfin le lemme 27.196 conclut que 
Ni = MN. 


Dans le lemme suivant, Sl(a,r) est la sphère centrée en a et de rayon r : Sl{a,r) = {2€ 
C tel que la — z| = r}. 
LEMooUSJZooFVAlTa 
Lemme 27.199. 
La partie C\S1(0,1) a exactement 2 composantes connexes. 


Démonstration. Posons À = {2 € © tel que |z] < 1} et B = {z tel que [2] > 1}. Nous avons 
AU B = C\Sf. La partie À est connexe et même convexe. En ce qui concerne la connexité de B, 
c’est le corolaire 18.64. 

De plus À et B sont des ouverts disjoints. 

Supposons que C' soit une composante connexe de C\S1(0,1) contenant un point de À et un 
point de B. Soit ae C'n À. Par définition 7.67(1) d’une composante connexe, C contient tous les 
connexes contenant a. En particulier À € C. De même si be CN B, alors BEC. 
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Dans ce cas nous aurions C = À U B = C\S1(0,1). Mais cela est impossible parce que À et B 
forment un recouvrement de C\S! par deux ouverts disjoints. 

Donc À et B sont des composantes connexes de C\S1. Et ce sont les deux seules parce que 
AU B = C\si. 


27.15.2 Théorème de Jordan 


ThoHSPWBuh 

Théorème 27.200 (Théorème de Jordan[201, 674]). 
Soit une courbe de Jordan T' fermée dans C. ITEMooOAKXooMirWiD 
(1) La partie C\T a exactement deux composantes connetes. ITEMooICBCooXHMALK 


(2) Une composante connexe est bornée, l’autre non. 


(3) Les deux composantes connexes ont T comme frontière. 


Démonstration. En plusieurs parties. 

(1) Pour (1) Nous savons par le corolaire 27.180(2) que l'est homéomorphe à S!. Le corolaire 
27.198 nous dit alors que C\F a le même nombre de composantes connexes que C\$S1, c’est- 
à-dire deux par le lemme 27.199. 

(2) Pour (2) Le lemme 26.49 dit que C\T a exactement une composante connexe non bornée. 


Vu que nous venons de voir qu’elle a exactement deux composants connexes, c’est que l’autre 
est bornée. 


27.16 Topologie faible 

DEFooZGLDooRRarR)j 
Définition 27.201 ([191, 1]). 
Soit un espace de Banach!?! sur le corps F (= R ou C) E, et son dual E’. La topologie faible 
sur E, est la plus petite topologie T pour laquelle 


(E, |) = (Er (27.915) 


Autrement dit, c’est la topologie de la proposition 7.39 rendant continues toutes les applications de 
E. 
Elle sera notée Ty ou o(E,E). 


Vu que, pour rendre continue une application, il suffit que toutes les images inverses des ouverts 
de F soient des ouverts, la topologie faible sur E est également la topologie engendrée !?? par les 
parties w—1(V) avec ve E' et V E Tr. 


Remarque 27.202. 
Il faut noter que la topologie faible n’est pas une topologie métrique. Cela même si la condition 
A;x — Ax, elle, est métrique vu qu’elle est écrite dans Æ. 

Dans le cas où E est de dimension infinie, la topologie faible est réellement différente de la 
topologie forte. Nous verrons à la sous-section 25.3.6 que dans le cas des projections sur un espace 
de Hilbert, l'égalité 


00 
Sproj,, = Id (27.916) 
i=1 

est vraie pour la topologie faible, mais pas pour la topologie forte. 


Lemme 27.203 ([191]). 


La topologie faible est Hausdorff "°°. 


121. Définition 7.255. 
122. Proposition 7.12. 
123. Espace topologique Hausdorff, définition 7.55. 
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Démonstration. Soient un espace de Banach E ainsi que +1 # x2 dans Æ. Les parties {x1} et {x2} 
vérifient les hypothèses de Hahn-Banach (seconde forme géométrique, 27.154). Il existe donc une 
fonctionnelle 6: E — F telle que w(x1) Æ w(x2). Avec un peu de bonne volonté, nous supposons 
que Re (y(x1)) # Re (y(x2)). Soit a € R tel que 


Re (p(x1)) < a < Re (y(x2)). (27.917) 
Posons 
O\={xeE tel que Re (y(x)) < a}, (27.918a) 
OL2={xeE tel que Re (p(x)) > a}. (27.918b) 
Nous avons ©; = w71(V;) avec !?4 
Vi = ]-00, a[ + iR (27.919) 


et quelque chose du même genre pour V2. Vu que Vi et V2 sont ouverts dans F, et que vw est 
continue pour la topologie faible, les parties ©; sont ouvertes dans (E, Ty). 

Nous avons de plus O1 n O = @ et x; € O;, de telle sorte que x1 et æ2 sont correctement 
séparés. 


Lemme 27.204 ([191]). 
Soit un espace de Banach E. Soient x0 € E, w1,...,wx € E". La partie 


V(y1,...,wr,9 = {xeE tel que |wi(x — xo)| < €} (27.920) 
est faiblement ouverte. 


Démonstration. Remarquez que 


k 
Vi... pue) = R p; {ze C tel que |z — g:(xo)| < €}. (27.921) 


e 
Il 
En 


Vu que 0 Fi transforme un ouvert en un ouvert, V(w1,...,wk,€) est une intersection d’ouverts, et 
donc un ouvert. De plus x9 est dedans parce que 4;(x0 — to) = (0) =0 <e. 


Lemme 27.205 ([191]). 
Soît xo € E. Les ensembles 


V(y1,...,vr,e) = {re E tel que |wi(x — xo)l < eVi} (27.922) 
forment une base de topologie en x. 


Démonstration. Soit un ouvert faible U contenant x0. Nous devons prouver que ÜU contient une 
partie de la forme V(41,...,4wx,e). C’est le moment d’avoir bien en tête la construction de la 
topologie engendrée donnée en la proposition 7.12. 

La topologie faible est engendrée par les parties de la forme -1(V) avec we E’ et V € rp. La 
partie U est une union de parties de la forme 


ñ 7 (V;) FQooKEPoRR} Sur 


où V; est ouvert dans F et w; € E". Vu que x0 € U, il existe une partie de la forme (27.923) 
contenant x0. Nous la notons W : 


k 
zEeW=[(\y; {(V;) eu. (27.924) 
j=1 


124. Adaptez si F = R au lieu de C. 
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Vu que V; est un ouvert de F contenant 4;(xo), il existe 0; > 0 tel que B(v;(x0),6;) € V;. En 
prenant € = minj=1,..#(0;), nous avons B(v;(xo), €) € V; pour tout j. En particulier, 


k 
R 67 (B(e;(&o), 9) cW. (27.925) 
j=1 
Nous montrons à présent que V(41,...,wx,e) € W. Pour cela nous considérons x € V(1,...,wk,€) 
et nous montrons que x € Cri (8 (o5(xo); 9) pour tout j = 1,...,k. Nous avons 
lp;(x) — p;(xo)l = |p;(x — to)| < €, (27.926) 


et donc bien p;(x) € B(yx(x0),€). Au final nous avons 


k 
V(p1,...,yR,€) € N P;” (B(e5(x0),0)) cWeU. (27.927) 
j=1 
PROPooFJBBooKKkRwIp 
Proposition 27.206 ([191, 675]). 
Soient un espace de Banach E aïnsi qu'une suite (x») dans E. ITEMooDMMTo0SBINKN 
(1) Zn — x si et seulement si p(xn) — @(x) pour tout we E. ITEMooFZKXoONaFGUb 
n FR ORPRANENRS Lu ITEMooXPTS00YPwNgU 
(3) Sixn — x alors {|xAl} est borné et 
x] < liminf |x, |. (27.928) 
ITEMooAFRFoo0UXdsBy 
: E' 
(4) Si tn — x et pn — alors Pn(tn) — p(x). 
Démonstration. Point par point. 
(1) Pour (1) C'est le lemme 7.42. 
(2) Pour (2) Nous prouvons que (x) — (x) pour tout we E’ : 
lpn) — px) = learn — 2) < lolrlan — 2|s — 0 (27.929) 


parce que par hypothèse |x, — x] — 0. 
(3) Pour (3) 


Vu que Y(tn) en (x), l’ensemble {(x,)} est borné dans F. Considérons les opérateur 


suivants : 
Tn: E'—F 
(27.930) 
pr P(tn). 
Cet opérateur a la propriété que |T;(pry = |x.|#:; en effet, en utilisant la proposition 
27.159, 
= sup [p(&n)| = |tnl. (27.931) 


IT, = sup (T,() 
lel=1 lel=1 

Chacun des T, est donc un opérateur linéaire borné. Nous vérifions que la famille {7} }nen 

satisfait aux hypothèses du théorème de Banach-Steinhaus 11.138. D'abord E’ est un Banach 

par la proposition 7.257. Ensuite nous venons de voir que chacun de T,, est borné dans E. 

Et enfin, pour chaque w € E’ nous avons 


sup |Tn(p)| = sup [p(æn)| < 00. (27.932) 
neN neN 
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Le théorème de Banach-Steinhaus nous assure donc que 


sup |z,| = sup |Th| < 0. (27.933) 
neN neN 


Donc l’ensemble {|x,|} est borné. 


Pour chaque Ÿ € E tel que || < 1 nous avons 


pGn)lr < lvl tre < |tnl (27.934) 


Étant donnée l'inégalité |g(x,)| < |x,| pour tout n et étant donnée la convergence |[w(x,)| — 
[y(x)|, nous avons pour tout n : 


lp(x)| < tal. (27.935) 


Cette inégalité valable pour tout n donne la conclusion : 


lp(x)| < liminf |za||. (27.936) 
(4) Pour (4) 
en PUFEOseRENESeauiqEn 
Nous avons 
lPn(tn) — p(x)| < lpn(tn) — P(tn)| + lp(tn) — p(x)| (27.937a) 
< |tnllon — | + lp(tn — x)| (27.937b) 


Mais par hypothèse |, — |] — 0, par le point (3), |x,| est borné, et par le point (1), nous 
avons [o(æn) — w(x)| — 0. Tout ça mis ensemble nous permet de prendre la limite dans 
(27.937) et de voir que |@n(tn) — w(x)| — 0. 


Proposition 27.207. 
Si E est un espace de Banach de dimension finie, alors sa topologie normée est la même que sa 
topologie faible : Ty = 7. 


Démonstration. Vu que E’ est défini comme étant l’ensemble des formes continues pour la topologie 
|.|, et que 7, est la plus petite topologie pour laquelle tous les éléments de E” sont continus, nous 
aVONS Ty € 7]: 

Pour prouver l'inclusion inverse, nous considérons U € 7|.] et nous prouvons que U est également 
un ouvert faible en montrant que tout élément de U est inclus dans un ouvert faible contenu dans 
U. 

Soit 0 € U ainsi que r > 0 tel que B(xo,r) € U. Nous considérons une base {e;};=1..n de E 
telle que |e;| = 1 pour tout i. Vu que tout élément de E peut être décomposé de façon unique en 
x = ),,me;, nous considérons les fonctionnelles linéaires 


: EF 
Fi (27.938) 
TH T;. 
C'est le moment de ressortir notre ouvert préféré !?° autour de x : 
nm 
Vpn... Pme) = (5 ({lz € € tel que [2 — wi(xo)|| < €). (27.939) 
i=1 


125. Nous avons un ...faible pour lui! 


27.16. TOPOLOGIE FAIBLE 2223 


Supposons que x € V(x0,#1,...,n,€). Il vérifie |p;(x) — ;(xo)| < € et donc 
Îz — xl = | D (x — ro)e| (27.940a) 
j=1 
< D lp;(x — o)||e; (27.940b) 
j 
= D lv;(x — xo)| (27.940c) 
j 
< D l65(x) — p;(xo)| < ne. (27.940) 
j 


En choisissant € < T, nous avons x € B(x0,r) et donc 


Vos, ) € Bar). (27.941) 


LEMooMCYAooGMzbbs 
Lemme 27.208. 
Soit un espace de Banach E sur le corps F. Nous notons Fun(E,F) l’ensemble de toutes les 
applications de E vers F. Pour chaque x € E nous considérons l’application 


: Fun(E,F) — EF 
fe EE (27.942) 
w + w(x). 
Nous considérons sur Fun(E, F) la plus petite topologie telle que tous les fx soient continues. 
La suite (w,) dans Fun(ÆE,F) converge vers w € Fun(E,F) si et seulement si wn(x) — w(x) 


pour tout x € E. 
LEMooWXBVooSjafZr 


Lemme 27.209. 
Soit un espace de Banach E sur le corps F (= R ou C). Nous considérons l’ensemble Fun(E, F) 
sur lequel nous mettons la topologie minimale qui rend continue les applications 


: Fun(E,F) — F 
LÉ ne (27.943) 
w + w(x). 
Nous notons I = {f; tel que x e E} et Tr la topologie de Fun(E, F). 
Si (wn) est une suite dans Fun(E,F) nous avons wy —L w si et seulement si uw, (x) — w(x) 
pour tout x € E. 


THOooRECTooEVLHSq 
Théorème 27.210 (Banach-Alaogly-Bourbaki[191]). 
Soit un espace de Banach E. La boule unité 
B={peE tel que |y| = 1} (27.944) 


est compacte pour la topologie faible. 


Démonstration. Nous considérons à nouveau Fun(ÆE,F) muni de la topologie du lemme 27.209. 
Nous considérons l'inclusion 


&:(E",|.|) — (Fun(E,F),7) 


WU + WW. 


(27.945) 


En particulier nous notons $ = ®(F) et nous allons prouver que ®: E’ — S bijective et continue 
et que Pl: S —> E' est également continue. 


PROPooYARHooOUpmztY 
Proposition 27.211 ([191]). 
Un convexe dans un espace de Banach est fermé si et seulement si il est faiblement fermé. 
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27.16.1 Espace de Banach réflexif 
PROPooPVVYooMZjQSq 


Proposition 27.212 ([191]). 
Une suite bornée dans un espace de Banach réflexif" contient une sous-suite faiblement conver- 


gente. 
THOo0TFIHooPQjVAr 


Théorème 27.213 (Kakutami[191]). 
Un espace de Banach est réflexif si et seulement si la boule fermée B(0,1) est compacte pour la 
topologie faible 27. 


PROPooBBNBooGcXDRH 
Proposition 27.214 ([191]). 
Un espace de Banach est réflexif si et seulement si son dual est réfiexif. 
27.16.2 Espaces L° 
LEMooMSYAooGEMgoc 


Lemme 27.215 ([191]). 

Si (Q, A, u) est un espace mesuré o-fini, l’espace L'(Q, A, u) n’est pas réflerif. 
LEMooUSXTooFvpsVd 

Lemme 27.216 ([191]). 


Si (A, A, u) est un espace mesuré o-fini, alors L°(Q, A, u) n’est pas réflexif l#. 


Démonstration. Supposons que L°(Q, À, u) est réflexif. Le théorème de représentation de Riesz 

27.171(2) dit que (L!)/ est en bijection linéaire isométrique avec L® ; le lemme 27.168 dit alors que 

(L1)' est réflexif 2°. La proposition 27.214 dit alors que L! est réflexif. 
Or le lemme 27.215 dit que L! n’est pas réflexif. 


La proposition suivante est souvent présentée en disant que l'inclusion L! € (L®)/ est stricte, 
ou, pire, en disant que (L®)' est strictement plus grand que L!. Cette façon de dire est un gros 
abus de langage. D'abord L! n’est même pas inclus dans L® ; ce sont deux ensembles qui n’ont rien 
à voir. Ensuite, ce que signifie réellement cette proposition est seulement que la première injection 
Li = (L®) qui nous tombe sous la main (celle du théorème de représentation de Riesz) n’est pas 


surjective 10, 
PROPooXXRQooNSBZ0Oi 
Proposition 27.217. 
Soit ge L'(R). L'application 
8: L(R1) — C 
: (27.946) 
pe [5 
Rd 
est linéaire et bien définie. 
L'application 
&: L'(R°) — L°(R°) 
E 6) (27.947) 


gr, 


n’est pas surjective. 


Démonstration. Prouvons d’abord que ®, est bien définie. Vu que f € L®, il existe M € R tel 
que |f(x)| < M sur R4\ A où À est de mesure nulle dans R°. La fonction x + |f(æ)g(x)| est donc 
majorée par la fonction intégrable x + M|g(x)| qui est intégrable (sur R\A). L'intégrabilité de 
fg n’est donc pas un problème. 

Le fait que ® prenne ses valeurs dans (L®°) est le théorème 27.172(2b). 


Le fait qu’elle ne soit pas surjective est la proposition 27.176. 


126. Définition 27.166. 

127. Définition 27.201. 

128. Définition 27.166. 

129. Dans de nombreuses références, par exemple[191], il est simplement dit que (L')' = L®. C’est un abus de 
notation qui permet de se passer du lemme 27.168. 

130. Si vous savez comment prouver qu'il n'existe pas de surject de L! vers (L?)', écrivez-moi. 
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27.17 Espace de Schwartz 


Pour un multiindice à = (a1,...,ag) € N°, nous notons 
Op = 07... 0rap (27.948) 


pour peu que la fonction w soit [a] = 1 + -::+ aa fois dérivable. 

DefHHyQookK 
Définition 27.218. 
Soit A € R‘. L'espace de Schwartz .7(Q) est le sous-ensemble de C?(Q) des fonctions dont 
toutes les dérivées décroissent plus vite que tout polynôme : 


P(Q) = {y € CV(Q) tel que Va, B € N°, pa,s(p) < ©} (27.949) 
où nous avons considéré 
pa.a(e) = sup (nf (2% p)(x)| = la #0 lee. “780 
Pour simplifier les notations (surtout du côté de Fourier), nous allons parfois écrire M; pour 
la fonction x + x;y(x). 


Exemple 27.219. 
La fonction e—** est une fonction à décroissance rapide sur KR. PA 


Définition 27.220. 


Une fonction f: R? — C est dite à décroissance rapide si elle décroît plus vite que n'importe 


quel polynôme. Plus précisément, si pour tout polynôme Q, il existe un r > 0 tel que | f(x)| < ot) 


pour tout |x| > r. 


PropCSmzwGv 
Proposition 27.221. 
Une fonction Schwartz est à décroissance rapide. 
Démonstration. Nous commençons par considérer un polynôme P donné par 
PEN Gr (27.951) 
k 


où les fx sont des multiindices, les c; sont des constantes et la somme est finie. Nous avons la 
majoration 


sup [p(x)P(x)| < D 'suplexp(x)r | < Ÿ°|cxpo,s, (ee) < 00. (27.952) 
xeRd KE © : 
Nous allons noter Mp la constante 3, |cx|po,3,(), de sorte que pour tout x € R% nous ayons 
lp(x)P(x)| < Mp et donc 
MP 1 
LCI = 
IP) PP) 


(27.953) 


Notons que cette inégalité est a fortiori correcte pour les x sur lesquels P s’annule. 

Soit maintenant un polynôme Q. Nous considérons le polynôme P(x) = |x|Q(x). Étant de 
plus haut degré, pour toute constante C il existe un rayon rc tel que |P(x)| > C|Q(x)| pour tout 
Ix| > rc. En particulier pour |x| > rw, nous avons 


IP(x)| > Mp|Q(x)] (27.954) 


et donc, pour ces x, 
1 1 


< | 
Li, P(x)l IQ (x) 


La première inégalité est valable pour tout x, et la seconde pour |x| > rw. 


lp(x)| < (27.955) 
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CORooZFPSooHCFUSH 
Corolaire 27.222 ([1|). 
Soit une fonction Schwartz sur Rx IR”. Alors la fonction 


y sup [p(x, y)| (27.956) 


xeR? 
est intégrable. 


Démonstration. Soit un polynôme Q en la variable y. Par la proposition 27.221, il existe r > 0 tel 
que 


1 
QT, y) < —— 27.957 
Ier, y)| OU) ( ) 
pour tout |(x,y)| > r. A fortiori l'inégalité tient pour tout [y] > r. Donc 
[sup lete.lay = | supletewidy + | suple(e wldv: (27.958) 
R" xeR" FISE Iyl>r 


La première intégrale est bornée par Vol (B(0,r))|glx tandis que la seconde est bornée par l’in- 
tégrale de au En prenant Q de degré suffisamment élevé en toutes les composantes de y nous 


avons intégrabilité. 


27.17.1 Topologie 
LEMDEFooZEFVooMMmiBr 


Lemme-Définition 27.223. 
Les pa,g donnés par l’équation (27.950) ci-dessus sont des seminormes 
sur .Z'(R4) est celle des seminormes pag. 


IT) La topologie considérée 
NORMooVQESooRwJSh1l 
27.224. 
Nous avons un enchainement de résultats qui nous aident à prouver la continuité d’une application 
T': SRI) — X. 
(1) La topologie de .7(R4) est donnée par une famille dénombrable de seminormes. Donc la 
proposition 7.335 nous dit que .7/(R) est métrisable. 


(2) La proposition 7.282 nous dit alors que si X est métrique, toute application séquentiellement 
continue T': .7(RŸ) — X est continue. 


d 
(3) Donc si X est métrique, il suffit de prouver que pour fn 0 nous avons T(f,) À, 0 où 
fn: 7 (RŸ) — X. Dans les cas usuels, T sera une distribution et X = C. 


R°) 


S d 
(4) En vertu de la proposition 7.329, la convergence f, ais 
multiindice à et 8, Pa, g(fn) — 0, c'est-à-dire 


Ir 0% full — 0. ÉQooPUJPoRNpENES 


(5) Et enfin, la technique pour montrer que T:.7(R%) — € est continue est de montrer que 


sous l'hypothèse d’avoir (27.959) pour tout choix de a et B, nous avons T(f,) — 0 dans C. 
LemRJhCbKkO 


0 signifie que pour tout choix de 


Lemme 27.225 ([676]). 
La topologie sur S(RŸ) est donnée aussi par les seminormes 


An,m = Max sup (1 + Ix|)" 10 w(x)|. (27.960) 


lal<n 3eR4 


; : 7 (R4 : : 
Autrement dit, une suite On 5 ) 0 si et seulement si arte) — 0 pour tout n et m. 


131. Définition 7.311. 
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Le fait que les qnm(w) restent bornés est la proposition 27.221. Cependant ce lemme est plus 
précis parce qu’en disant seulement que 4 est majoré par des polynôme, nous ne disons pas que 
les polynômes correspondants aux w, tendent vers zéro si on %, 0. Et d’ailleurs on ne sait pas très 


bien ce que signifierait P, — 0 pour une suite de polynômes. 
PropGNXBeME 


Proposition 27.226. 
Pour pe [1,w], l’espace (R) s’injecte continument dans LP(R‘). 


Démonstration. L’injection dont nous parlons est l’identité ou plus précisément l'identité suivie 
de la prise de classe. Il faut vérifier que cela est correct et continu, c’est-à-dire d’abord qu’une 


fonction à décroissance rapide est bien dans LP et ensuite que si fh # 0, alors fh 0. 
Commençons par p = ©. Alors | fl = poo(fn) — 0 parce que si fh CA 0, alors en particulier 


po,0(fn) — 0. 
Au tour de p < © maintenant. Nous savons qu’en dimension d, la fonction 


1 
D _— (27.961) 
(+ |x|) 


est intégrable dès que s > d. Pour toute valeur de m nous avons 


OI dm(e) 
a [letras = re < [or 


En choisissant m de telle sorte que mp > d, nous avons convergence de l'intégrale et donc |g|,, < 00. 


Nous retenons que 
lle < Caom(e) EYES 


pour une certaine constante C' et un bon choix de m. 
Ceci prouve que .7(R) & LP(R4). Nous devons encore vérifier que l'inclusion est continue. 


(27.962) 


Si On < 0, alors en particulier nous avons Gom(#n) — 0 par le lemme 27.225. Par conséquent la 
majoration (27.963) nous dit que gn|) — 0 également. 


3. 0) LP 
En résumé, si &n — "4 alors @n — . 
ThoRWEoqY 
Théorème 27.227 ([450]). 
Soit y une mesure sur les boréliens de R” finie sur les compacts. Alors D(R”) est dense dans 


L'(R", Bor(R"), 1). 


PROPooJNQZoo!IRbJei 
Proposition 27.228 ([677]). 
La partie Z(R4) est dense dans .7(R4). 


Démonstration. Soit f € .7(R4), et @, une fonction de Z(R°) telle que p(x) = 1 pour |x| < 1 
(l'existence de telles fonctions est discutée en 15.14.1). Soit aussi d;(x) = d(x/k). Nous posons 


fk(æ) = pk(x) f(x), (27.964) 
et nous allons prouver que pour tout multiindice «& et , 
Pa(fr — f) = |r0%(fr — f)lo — 0. (27.965) 


Pour cela nous allons noter 6 < a lorsque B est un multiindice contenu dans @. En utilisant la 
dérivée du produit nous avons 


(CO fr)(x) = D (0 Éd) (x) f(x) (27.966a) 
B<a 

= Y kle- #1 (Ge-8G)(x/k)(08 f)(x) (27.966b) 
B<a 

= DR (GP G)(x/k) (05 F)(x) + é(x/k)(0%F) (x). (27.966c) 


B<a 
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Nous devons donc étudier et majorer 


sup (270%(fx — f)| < supfe* D ke AI(o É)(x/K)(0P F)(x)| 
zeRd B<a (27.967) 
+ sup fa” (p(x/k) — 1) (0° f)(x)] 
En ce qui concerne le second terme, soit e > 0, vu que f est Schwartz, il existe À tel que 


[x (0*F)(x)| < € (27.968) 


dès que |x| > À. En prenant k > R, 


La (02 f)(æ) e on. d (27.969) 
En ce qui concerne le premier terme, 
sup F2 kole-#l(90-84)(x/k)(08 Pa) (27.970a) 
< sup 2 Crée)" 2 ne) (27.970b) 
= sup 2 G* érte/rs () (27.970c) 


La somme ne contient qu’un nombre fini de B différents, donc nous pouvons considérer un nombre 
K qui majore tous les ps,,(f) en même temps. La partie avec @ peut être majorée par 10-810 
(qui est fini) dont nous pouvons prendre le maximum sur 8 < @. Toute l'expression dans la somme 
est donc majorée par un nombre qui ne dépend ni de x ni de 6. Vu que la somme est finie, elle est 
majorée par ce nombre multiplié par le nombre de termes dans la somme et au final 


K"! 


sup fe D, KT AI(O 66 )(x/k) (05 F)(æ)| < a 


xeRd B<a 


(27.971) 


La limite £ — © ne fait alors plus de doutes. 


Remarque 27.229. 


d 
Vu la topologie de .7(R4) (définition 27.223), la convergence f} se f peut être exprimée par le 
fait que pour tout k, |, 


Def Se 5 O, (27.972) 


C'est-à-dire convergence uniforme de toutes les dérivées multipliées par n'importe quel polynôme. 


27.17.2 Produit de convolution 


PROPooUNFYooYdbSbJ 
Proposition 27.230 (Stabilité de Schwartz par convolution !*? [650]). 
Si ve L'(R) et Ye S(R), alors p+v EF (RA). 
Démonstration. Nous devons prouver que 
Pas(g * d) = sup [r/(0%(4 + 4))(x)| (27.973) 


xeRd 


132. Définition 27.55. 


27.18. THÉORÈME DE MONTEL 2229 


est borné pour tout multiindices a et 8. En appliquant |a| fois la proposition 27.61, nous mettons 
toutes les dérivées sur 4 : 0%(4 x 4) = (4 x 0%). Cela étant fait, nous majorons 


Par conséquent, pa.g(g * d) < |p|L1Pa,g(Ÿ) < 2. 


lo ee) < al À eu [(C" ae — w)] du (27.974) 
Ra —, — 
<|2%#| 
<a" [1er (27.974b) 
< ras (0) els (27.9740) 


27.18 Théorème de Montel 


ThoXLyCzol 


Théorème 27.231 (Montel[103]). 

Soient ( un ouvert de € et F une famille de fonctions holomorphes sur (À, uniformément bornée sur 
tout compact de (. Alors de toute suite dans F nous pouvons extraire une sous-suite convergeant 
uniformément sur tout compact de Q. 


Démonstration. (1) Un ensemble équicontinu 


Nous commençons par prendre une suite de compacts dans ® comme dans le lemme 7.291, 
et une suite 0, de réels strictement positifs tels que 


B(2, 26h) € Kn+1 (27.975) 


pour tout z € K,. Soient x,y € K, tels que [x — y| < 6, ; nous notons 0B(x,20,) le cercle 
de rayon 20, autour de x, parcouru dans le sens positif. La formule de Cauchy 26.207 nous 
donne 


1 F6) _ FO) Ty f(6) 
10 = | (2 Je) « - | E-oté-n% (796) 


Nous majorons ça par 


| f(E) x — y| 
, 2 ES 5 Mr (27.977) 


[x — yl 
fol < EE | 


Justifications : 
— |£— x| = 26, et |[£ — y] > 0x parce que £ est au mieux sur le rayon passant par x et y. 
— |f(| < M, où M, est la borne uniforme de F sur le compact Kh. 


— Nous avons aussi fini par calculer l'intégrale dans laquelle il ne restait plus rien, ça a 
donné la circonférence du cercle de rayon 26. 


Jusqu'à présent nous avons prouvé que l’ensemble 
Fn = {flk, tel que fe F} (27.978) 


est équicontinu. Il est aussi équiborné par hypothèse. 


Application du théorème d’Ascoli 


L'ensemble F, vérifie les hypothèses du théorème d’Ascoli 27.4. Donc l’ensemble F, est re- 
lativement compact dans C(K,,C) pour la norme uniforme. Autrement dit l'ensemble F est 
compact et si nous avons une suite de fonctions dans F,, il existe une sous-suite convergeant 
dans 7h, c’est-à-dire uniformément. Autrement dit il existe une fonction strictement crois- 
sante : N — N telle que la suite k+ f,,(4) converge uniformément sur K,. La limite n’est 
cependant pas spécialement dans F,. 
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(3) L’argument diagonal 


La suite ke fio.p,(k) converge uniformément sur tous les K,. Si X est un compact de {, 
alors les petites propriétés sympas du lemme 7.291 nous disent que K € Int(K,,) pour un 
certain m. Ladite suite convergeant uniformément sur K}, elle converge uniformément sur 
K et nous avons montré la convergence uniforme sur tout compact de Q. 


Corolaire 27.232 ([103]). 
Soient ® un ouvert connexe borné de © et a € (. Soit f holomorphe sur Q telle que f(a) = a et 
[f(a)l < 1. 

Alors de (f") on peut extraire une sous-suite convergeant uniformément sur tout compact de 
Q vers la fonction constante a. 


Démonstration. Nous considérons un voisinage de a inclus dans Q ; sachant que |f(a)| < 1, nous 
trouvons un voisinage encore plus petit de a sur lequel |f’(z)| < 1. Soit donc r tel que B(a,r) € Q 
et tel que |f/(z)| < 1 sur B(a,r). Étant donné que f/(z) est continue sur le compact B{a,r), nous 
en prenons le maximum À (qui est strictement inférieur à 1) et nous avons au final 


LPC SAS 1 (27.979) 
pour tout 2€ B(a,r). Le théorème des accroissements finis 12.325 nous dit que 
[f(z) — al < Az — al (27.980) 
pour tout z € B(a,r). C’est ici que nous utilisons l’hypothèse de convexité de Q. Nous montrons 
alors par récurrence que - 
|f" (2) — al < ÀX"z- al <Xr<r. 137585 


L'ensemble À = {f" tel que n > 1} est donc uniformément borné sur B(a,r) par a + r. Autre 
manière de le dire : pour tout z € B(a,r) nous avons 


J"(2) € B(asr). (27.982) 


La suite (f"*) est donc uniformément bornée sur tout compact de B(a,r). Le théorème de Mon- 
tel 27.231 nous indique que l’on peut extraire une sous-suite convergente uniformément sur tout 
compact. Au vu de (27.981) cette convergence ne peut avoir lieu que vers une fonction g qui vaut 
la constante a sur B(a,r). 

D'autre part la fonction g est holomorphe en tant que limite uniforme de fonctions holomorphes, 
théorème 26.106. Or une fonction holomorphe constante sur un ouvert est constante sur tout son 
domaine d’holomorphie (principe d’extension analytique, théorème 17.141). 


27.19 Espaces de Bergman 


Source : [473]. 
Soit ( un borné dans C et D le disque unité ouvert de C. 


Définition 27.233. 
L'espace de Bergman sur Q, noté A?(Q) est l’espace des fonctions holomorphes sur Q qui sont 
en même temps dans L?(Q). 


Nous mettons sur 42(Q) le produit scalaire usuel hérité de L? : 


og) [ f(2)g(z)dz. (27.983) 
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LemIZxKfB 
Lemme 27.234. 
Soient un compact K € Q et une fonction f € A?(Q). Alors 
1 
< 27.984 
mal) < (27.984) 


Démonstration. Soient a € Q et r > 0 tels que B(a,r) € Q. Nous considérons aussi p < r. La 
formule de Cauchy (26.207) nous donne 


1 HO à 


24 Joçan E— 0 27 Jo 


f(a) = 


f(a + pe!?)d8 (27.985) 


où nous avons utilisé le chemin (9) = a + peŸ, y/(0) = ipeŸ et p = |£ — a|. Maintenant une astuce 
est d'écrire 


= [ravir (27.986) 
0 
et d’y substituer la valeur de f(a) que nous venons de calculer : 
r? r 27 | 
f(a) = Î Î f(a + peŸ)dôpdp (27.987a) 
2 0 27 0 
1 
= — f(z)de passage aux polaires (27.987b) 
27 B(a,r) 
l 
= PE De produit scalaire sur B(a, r) (27.987c) 
T 


< VO Ds0 Ds (27.987) 


Nous avons donc 


#$(a) < = VA DEQ, D, (27.988) 


et donc 
nr? f(a) < Var?|f|2, (27.989) 
parce que {f, f>g < || f|2. En effet le produit scalaire |.|2 est donné par une intégrale sur Q alors 


que B(a,r) & { et que la fonction qu’on y intègre est positive (c’est |f(z)|?). En simplifiant, 


(a) < lb (27.900) 


Mais r à été choisi pour avoir B(a,r) € Q, donc r < d(a,0Q) et 


[f(a)| < | fl2. (27.991) 


1 
d(a, 0Q)4/7 
Maintenant si nous prenons a € K, nous avons encore la minoration d(a, OK) < d(a,0Q) et 


donc 
1 


[f(a)| < da Re 


| f1l2- (27.992) 


Théorème 27.235. 
Soit (Q un ouvert de C. 


(1) L'espace A?(Q) est un espace de Hilbert. 


(2) Si D est la boule unité dans ©, une base hilbertienne de A?(D) est donnée par les fonctions 


n +l 
27 
T 


En(z) = (27.993) 


pour n > 0. 
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Démonstration. Nous commençons par montrer que 4?(Q) est complet. Pour cela nous considérons 
une suite de Cauchy (f,) dans 4?2(Q) et un compact K © Q. Nous savons par le lemme 27.234 que 


1 


Donc f, converge uniformément sur K. Par le théorème de Weierstrass 26.106, la fonction f est 
holomorphe. Il existe donc une fonction holomorphe f qui est limite uniforme sur tout compact de 
Q de la suite (f,). 

Mais L?(Q) étant complet, la suite (f,) a une limite g e L?(Q). Ce que nous voudrions faire 
est prouver que f = g. Notons que tel quel, ce n’est pas vrai parce que f est une vraie fonction 
alors que g est une classe. Ce que nous enseigne la proposition 27.18 est qu’il existe une sous-suite 
(qu’on note (g,)) qui converge vers g presque partout. Dans cette dernière phrase, g, et g sont de 
vraies fonctions, des représentants des classes dans L?. 

Nous déduisons que f = g presque partout (ici f et g sont les fonctions) parce que la sous-suite 
converge uniformément vers f en même temps que presque partout vers g. Donc f = g dans L?(Q) 
(ici f et g sont les classes). Donc f € L?(Q) et l’espace A4?(Q) est de Hilbert. 

Il nous faut encore prouver que (e»)1>0 est une base orthonormale. En ce qui concerne les 
produits scalaires, 


1 __ 
(m + 1)(n +1) [ de (27.995a) 
T D 
I 1 1 27 à 
T 0 0 
1 1 1 27 
: Je + M +1) Î ei0(n—m) Jp (27.995c) 
T mm +n + 2 0 
27 0mn 
(n+1)}? 1 
_ 27. 
D 5270 (27.995d) 
.. (27.995e) 


Donc les fonctions données sont bien orthonormales. Nous devons montrer qu’elles sont denses 
dans 4?(D). Soit f e A?(D) et c(f) = <f,en); nous allons montrer que 


Lf12 = D. Kfendf?, (27.996) 
n=0 


parce que le point (5) du théorème 25.46 nous indique que ce sera suffisant pour avoir une base 
hilbertienne. 
Etant donné que f est holomorphe sur D, le théorème 26.59 nous développe f en série entière : 


f(z) = D a. FPE 07) 


En permutant la somme avec le produit scalaire, 


Cn(f) = L FD En(z) = J= 1h f(2)7"dz. (27.998) 


Afin de profiter de la convergence uniforme de la série (27.997) à l’intérieur de D, nous allons 
exprimer l’intégrale sur D comme une intégrale sur |2| < r en faisant tendre r vers 1 (par le bas). 
Pour ce faire nous considérons les fonctions 


= 7 si [2] <1—1/k 


(27.999) 


0 sinon. 
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Ces fonctions sont intégrables sur D et dominées par f(2)z" qui est intégrable sans dépendre de 
k. Mais nous avons évidemment g£(z) — f(2)z". Le théorème de la convergence dominée permet 
alors de permuter l’intégrale et la limite k — 0. Cela nous permet d'écrire 


1 1 = 
= À ]— L im [ fodz = 1/2 Re. J > ee (27.1000) 
ee | FA To T1 Ji<r k=0 


Par la convergence uniforme de la série entière à l’intérieur du disque D nous pouvons permuter 
l'intégrale et la somme (proposition 15.49) : 


1 
Cn(f) = Pr s Lu] | 2f a dz. (27.1001) 
ZI<T 


HW r—1— 


L'intégrale proprement dite est vite calculée et vaut 


. nr2r+2 
2x" de = Ob (27.1002) 
lel<1 n +1 


Nous pouvons donc continuer le calcul de c, (f) en effectuant la somme sur k qui se réduit à changer 
k en n puis en effectuant la limite : 


n+l r2n+2 T 
Cn(f) = A im Da SR PES (27.1003) 


Nous effectuons le même genre de calculs pour évaluer || f|2 : 


IAB = | 1#)Pde (27.1004a) 
O0 

= lim f(2) 2e k2dz (27.1004b) 
1 Jiuer = 

= lim > ju] )2*dz permuter . et J (27.1004c) 
ri [z|<r 


intégrale déjà faite. (27.1004d) 


Mais nous savons déjà que c,(f) = 4/7/(n + 1), donc ce qui est dans la somme est razax/(n+1) = 
lcx(f)l2. Nous avons donc 


2 = lim > PAC RE (27.1005) 


La fonction (de r) constante |cy(f)|? domine |cy(f}r?*+2| tout en ayant une somme (sur k) qui 
converge ; en effet la proposition 25.25 nous indique que >, [c(f)l? < |f|3. Le théorème de la 


convergence dominée nous permet d’inverser la limite et la somme pour obtenir le résultat attendu : 


HEC (27.1006) 
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Chapitre 28 


Séries de Fourier 


28.1 Densité des polynômes trigonométriques 


28.1.1 Convergence pour les fonctions continues (via Weierstrass) 


Le résultat fondamental qui nous permet d'utiliser les polynômes trigonométriques comme base 
pour les fonctions continues périodiques est le suivant. Notons que pour les fonctions non continues, 


il y à encore du travail. 
LemXGYaR1C 


Lemme 28.1. 
Si f: IR — © est une fonction continue 27-périodique et si e > 0, alors il existe un polynôme 
trigonométrique P tel que | f — Ps < €. 


Démonstration. Nous allons utiliser le théorème de Stone-Weierstrass 12.428. Soit le compact de 
Hausdorff ! 


S1= {ze C tel que [| = 1}, (28.1) 


et C(S!,C) l'algèbre des fonctions continues de S! vers C. Il suffit de vérifier que les polynômes 
trigonométriques vérifient les hypothèses du théorème de Stone-Weierstrass. Un polynôme trigo- 
nométrique est un polynôme en z et z défini sur S!. 


(1) Le polynôme constant est dans l’algèbre, ok. 
(2) Pour la séparation des points, considérons le polynôme trigonométrique x + ef?. 
(3) Si P est un polynôme en z et Z, alors P l’est aussi. 


Donc sie>0et feC (51, C) sont donnés, il existe un polynôme trigonométrique P tel que 


D IF(E#) — P(t)| < €. (28.2) 


Soit f:R — C une fonction continue 2r7-périodique. Nous considérons f € C (S1,C) donnée par 
f(e) = f(#). Alors sup, [f(t) — P(#)| < €. 


28.1.2 Convergence pour les fonctions continues (via Fejér) 


Si nous ne voulons pas passer par le gros théorème de Stone-Weierstrass pour prouver la densité 
des polynômes trigonométriques dans (Chr; [.Îlco), nous pouvons passer par le gros théorème de 
Fejér. C’est ce que nous faisons maintenant. 

Si vous vous intéressez seulement au théorème sur les séries de Fourier, vous cherchez proba- 


blement le théorème 28.17. 
PROPooUOKAooGzGZWc 


1. Définition 7.55. 
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Proposition-Définition 28.2. 
Pour chaque n € N, la fonction 


1 Ÿ dr (28.3) 


est bien définie. Elle s'appelle noyau de Dirichlet. 


Définition 28.8. 
Le noyau de Fejér est la moyenne de Cesàro? des noyaux de Dirichlet : 


1 n—1 
Fn(t) = > D Dé(t). (28.4) 
k=0 
LemHPolkwu 
Lemme 28.4. 
Le noyau de Dirichlet s'exprime sous la forme 
_ : sin (2224) 
HR —ikt 2 28.5 
n(e) DS sin(t/2) Ge 
Démonstration. Nous commençons par mettre en facteur le premier terme : 
n | ; 2n | 
A RC ES (28.6) 
k=-n k=0 
En utilisant la formule de la somme géométrique, 
nl (eity2n+1 
D,(t) = ev% —_. (28.7a) 
1 — et2n+1)é 
—int 
me (28.7b) 
_etr+nit/2 e-(n+1it/2 _ (2n+1)it/2 . 
eià e—it/2  pit/2 ° 
95) sin (22414 
en (28.74) 


(—2i) sin (À) 


Théorème 28.5 (Théorème de Dirichlet). 
Soit f une fonction 2r-périodique et C! par morceaux. Pour tout x € R nous posons 


nm 


ste) = > c(fers. (28.8) 


Alors nous avons 


Jim st) = 5 (28.9) 
LemtCA;jJz 
Lemme 28.6. 
Le noyau de Fejér s'exprime sous la forme 
1 fsin . * EqLOt Ç 
Baez (2), ERA) 
n \sin; 


2. Définition 11.128. 
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Note : ce noyau est positif. C’est important parce qu’on s’en sert dans la preuve du théorème 
de Fejér. 


Démonstration. L'astuce est de noter sin(x) = S(e*) et de repartir du résultat à propos du noyau 
de Dirichlet. En utilisant encore la formule de la série géométrique partielle *, 


1 n—1 | 
ED = "7 G (2k+1)it/2 28.11 
n(#) co à . 
1 A, 
RS hit lem. 1.470 28.11b 
nsin(t/2) 2° ) 
1 w [1— er 
D nn © 28.11 
nsin(t/2) °° ( 1—eï ) 
nit int nit 
1 ane? Fe) 
— "Get | 28.11d 
nsin(t/2) 0 à (e-it/2 — eit/2) ) 
| (rt 
EE Ga Se, 27 Le. (28.11e) 
n sin  . sin(s 
1 : nt 2 
= (Æ 2 ) | (28.11f) 
n \sins 


Le théorème de Fejér donne la convergence au sens de Cesàro * de la série de Fourier dans le cas 
continu et périodique. Pour avoir une convergence plus forte que Cesàro, il faut plus d’hypothèses, 
comme le montre le contre-exemple de la proposition 28.21. Voir la discussion 28.22. 


ThoJFqczow 
Théorème 28.7 (Fejér). 
Soit f: R— © une fonction continue et 27-périodique. Pour tout k € Z nous notons 
eg: R—C 
D gite (28.12) 
Pour chaque n € N nous posons 
nm mn 
Die y; Sn(f)= D, œlf}er (28.13a) 
k=-n k=-n 
Dis De e — 
= me Fr = On(S()) = = D Sk(f), (28.13b) 
n ie 
où | 
= it 
ck(f) f(tje "dt (28.14) 
27 J_, 
Alors 
(1) E, Fatt)dt = 1. 
(2) Pour tout a € ]0,7[, F, converge uniformément vers O sur [—-x,7|\[-a, a]. 
(3) La suite Ê, converge uniformément sur R vers f. TtemUNQSPmyiv 


(4) Le système trigonométrique {ex}rez est total pour l’espace (CS, (R), |.|+) des fonctions conti- 
nues 27-périodiques. 


3. Proposition 11.122. 
4. Convergence au sens de Cesàro, définition 11.128. 
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Démonstration. Un calcul usuel montre que 


dl 0 sitÆ£0 
t)dt = 28.15 
il a(®) L sil=0 


Nous avons alors 
1 T 11 n—1 Ek T 1 n—1l 
— Fh(t)dt = —— t)dt = — 1" 1: 28.16 
K[ Fot- SEX  ata-2 5 (28.16) 
k=0 1=—k 
2rô1.0 
Cela prouve déjà le premier point. 
Pour le second point, en partant de l’expression (28.10) et en considérant x € [—7,r,|\[-a, al 
(ce qui nous évite l’annulation du dénominateur), 
1 
(n + 1)sin?(a/2)’ 


et donc FE} — 0 uniformément sur l’ensemble considéré. 


HEn(x)| < 


(28.17) 


Nous passons maintenant à cette histoire de convergence uniforme de la moyenne de Cesàro 
vers f. Pour tout ne N nous avons 


1 . d —ikt ikx 
(x) = — t t 
Sn() = >= D ( r f(tje—{*ta ) e (28.18a) 
LOT . 
= = —t)dt ; 
le (#) 2 ex(x — td (28.18b) 
1 T 
. f()Di(x — tjdt. (28.18c) 
T TT 
Par conséquent, en effectuant le changement de variable u = x — t et en utilisant la périodicité, oué Li 
Fa) = | f(t)Fi(x — tjdt (28.19a) 
= Î (28.19b) 
T+T 
_ (x — u)Fh(u)du. (28.19c) 


TT 
Nous prouvons à présent l’uniforme convergence. Soit € > 0; étant donné que f est continue et 27- 
périodique, elle est uniformément continue et nous considérons Ô > 0 tel que [x — y] < Ô implique 
f(x) — f(y)| < €. Soit M un majorant de |f| sur R. L'équation (28.19) nous donne 
1 ( G 
Ï (Fe — à - f(x))F(bdt EDS 
27 J_, 
1 


ee — 
27 6<|t|<T 


22 Fh(t)dt + € 28266 


= = 
27 6<|t|<r 


f(x) — Fn(x)| = | 


1 ô 
PME, (Di + à Î d FE (dt (28.20b) 
—6 


Pour obtenir (28.20a) nous avons pu rentrer f(x) dans l'intégrale en utilisant le premier point. 
Pour obtenir (28.20c) nous avons d’abord utilisé la positivité de F, (lemme 28.6) pour enlever les 
valeurs absolues, et nous avons ensuite utilisé le fait que son intégrale valait 27. 

Étant donné que F, — 0 uniformément sur [-7,r,]\[-a, a, il existe un N tel que 


| Faftjdt < € (28.21) 
6<|t|<r 


dès que n > N. Le résultat en découle. 
Pour le point (4), il suffit de remarquer que chacun des F, est une combinaison finie d'éléments 
du système trigonométrique. 
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28.1.3 Densité dans /? 


Nous venons de voir (de deux façons différentes) que les polynômes trigonométriques étaient 
dense dans (C$,(R), |.|x). Nous avons aussi déjà vu par le théorème 27.81 que ces polynômes 
trigonométriques étaient denses dans LP(S1). Nous présentons à présent une autre façon de prouver 


cette dernière densité. 
ThoDPTwimlI 


Théorème 28.8. 
Les polynômes trigonométriques sont denses dans LP(ST) pour 1 < p < 0. 


Démonstration. Par les théorèmes 28.1 ou 28.7 (au choix), nous savons que les polynômes trigo- 
nométriques sont denses dans (C%,(S7),|.|). Comme ST est compact, la densité est également 
au sens LP. En effet si | fn — fl < €, alors 


27 27 
lfn — F5 = [ [fn — JP < [ P = 27e. (28.22) 


Donc les polynômes trigonométriques sont denses dans (C3,(57),||.],). Mais nous savons par le 
théorème 27.50(5) que les fonctions continues sont denses dans LP(ST). 
Par composition de densités, les polynômes trigonométriques sont denses dans LP(S1). 


28.1.4 Suite équirépartie, critère de Weyl 


Définition 28.9. 
Soit u une suite dans [0,1]. Pour 0 < a < b < 1 nous posons 


X,(a,b) = Card{ke {1,...,n} tel que ux € [a.b]}. (28.23) 
Nous disons que la suite u est équirépartie si pour tout 0 <a <b<1,ona 


X,(a,b 
im Ar(@b) 


Pr 00 n 


= ba. (28.24) 


Voir aussi la remarque 36.167 sur les nombres normaux. 


PropDMvPDc 

Proposition 28.10 (Critère de Wey1[173, 103]). 
Soit (x) une suite dans [0,1[. Les conditions suivantes sont équivalentes. ItenKWcZTHai 
(1) La suite (xh) est équirépartie. TtemKWeZTHqii 


(2) Pour toute fonction continue à valeurs réelles sur [0,1], 


n À 
lim - >» Jlaii= Î f(x)dzx. FaE HS IR 
k=1 L 


no n 
ItemKWcZTHqiii 
(3) Pour tout p € N\{0} nous avons 
1 nm 
: es 2inptrx _ 

lim = D (28.26) 

k=1 

Démonstration. On pose 

1 n 

Sn(f) = = D, f(x). (28.27) 


(1) Une espèce de lemme 
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Supposons connaitre un ensemble de fonctions À dense dans C°([0,1]) pour toutes les fonc- 
tions desquelles nous avons la limite (28.25). Alors la limite a lieu pour toute fonction de 
C°([0,1]). En effet, soit f e CU([0,1]) et g € À tel que | f — gl < €. Alors 


D f(x) - fr0 at “Here (28.28) 
k=1 

Fèe )- g(t)dt (28.28b) 

t)dt — [ f(b)dt|. (28.28c) 


Le premier terme est majoré par €. Le troisième a la même majoration : ie (ft) — g(t))dt < 
If — glo = €. Par hypothèse sur l’espace À, le second terme se majore par € lorsque n est 
grand. 


RS 
ND 
nr 


(1)=(2) Nous supposons que la suite est équirépartie et nous commençons par montrer 
le résultat pour les fonctions en escalier. Soit donc la fonction en escalier 7(x) = c; sur 
aj1 < x < à. Sur le point a; lui-même, la fonction n vaut soit c; soit c;,1. Nous avons 


n 


n 
Dm (xx) x GX ns rt) o GX na; di) 2e a(es a) |: Fe) 
k=1 


À la limite n — co, les deux derniers termes tombent © et il reste 
1 nm 
lim — Es n(xx) = >, Gaia). (28.30) 


Or par construction, pour une fonction en escalier, 


n 1 


Ci (aÿ_1 —= a) _—. Î 7]. (28.31) 


Etant donné que les fonctions en escalier sont denses dans les fonctions continues, l’espèce 
de lemme plus haut conclut. 


RS 
Co 
nr 


(2)=(1) Nous prouvons maintenant le sens inverse. C'est-à-dire que pour toute fonction 
continue sur [0,1], nous avons 


JL n 
Î f(x)dx = lim . > JG). (28.32) 
0 no n ce 


Nous devons en déduire que (x,) est équirépartie. Pour ce faire, soit x € [0,1[ et e > 0 tel 
que x + € < 1. Nous considérons 4 = 1j, 17 et 


0 site [0,x| 
pe(t)= 4 sitelx,r+el (28.33) 
1 sit>xv+e. 


C’est une fonction continue, donc 


lim Sn(get)) = | pe(t)dt - | dt + | 1dt=1-x-— 5 (28.34) 
n— 0 € 


x x+E 


5. J'en profite pour mentionner que mon équation (28.29) n'est pas la même que celle de [473] dans laquelle il me 
semble voir une faute ; quoi qu'il en soit, les termes litigieux tombent. 


28.1. 
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Mais we < y, donc Sh(ye) < Sh(y) et donc 
lim inf Sale) > 1— x. (28.35) 


Notons que nous ne savons pas si la vraie limite de gauche existe ; c’est pourquoi nous prenons 
la limite inférieure, qui existe toujours. 


Nous définissons aussi 


0 site[0,x—el 
pe(t) = EL sitelx—e, x (28.36) 
1 sit > x. 


C’est encore une fonction continue et nous trouvons © 


1 
Î dbe(t)dt = 1-x+ 5 (28.37) 
0 


Puisque Ÿ. > 4, nous avons S, (We) > S,(w) et donc 


limsup Ste) < 1— x. (28.38) 

Nous avons déjà obtenu que 
1—x<liminf Sa(y) < limsup Sh(p) < 1 — +, (28.39) 

donc la limite existe et vaut 
Jim Sante) = 1-— x. (28.40) 


Le résultat est maintenant démontré dans le cas très particulier de la fonction caractéristique 
@= jar: 

Si nous prenons une fonction caractéristique 1,,,,], nous avons le même genre de preuve parce 
que jo est une combinaisons linéaire de fonctions du type Li 1[. 


Nous avons donc 
Jim Sn(Lab]) = bd — a, (28.41) 


alors que le membre de gauche n’est autre que 


Sir 


. | 
Sn(Uaë) = + 2 Hat(rk) = = Xn(a,b). (28.49) 
k=1 


(2)=(3) Vu que! e2TP%x = cos(2rprz) + isin(2rpr4). est une fonction périodique, c’est 
immédiat. 


(3)=(2) Par linéarité, le point (2) montre que si f est un polynôme trigonométrique, alors 


Le ; 
lim = D f(xx) = Î f(t)dt. (28.43) 
k=1 0 


n—0 nm 


Densité des polynômes trigonométriques Il nous reste à prouver que les polynômes 


trigonométriques sont denses dans les fonctions continues sur [0,1]. Soit une fonction conti- 
nue sur [0,1] avec f(0) = f(1). Alors le théorème de Stone-Weierstrass dans sa version 
trigonométrique (lemme 28.1) nous donne la densité. 

Si f(1) < f(0) c'est pas très grave : on peut trouver une fonction g vérifiant g(0) = g(1) et 
| f — gl < €. Ensuite un polynôme trigonométrique approxime très bien g. 


6. Je recommande chaudement de dessiner les fonctions we et w% pour avoir une idée de la situation. 
7. Lemme 18.11. 


2242 CHAPITRE 28. SÉRIES DE FOURIER 


28.2 Fonctions de Dirichlet 


Définition 28.11. 
Une fonction f : R — € est une fonction de Dirichlet si 


(1) elle est 27-périodique, 
(2) elle est continue par morceaux, 


(3) pour tout x € R nous avons 


(28.44) 


Nous notons D l’ensemble des fonctions de Dirichlet. 
LemVIwMsTC 


Lemme 28.12 ([678]). 
L'ensemble C°(ST) est dense dans l’ensemble des fonctions de Dirichlet (D, |.|2). 


Démonstration. Nous commençons par supposer que f € D n’a qu’un seul point de discontinuité, 
zo. Alors nous considérons la fonction 


ixe S1\B(xo, À 
FC Re À “ol n) (28.45) 
d(x) sixe B(xo,:) 
où d est la droite joignant f(xo — À) et f(xo + À). La fonction f, est continue et vérifie 
[fn(x)| < || flo (28.46) 


pour tout x. En effet si x est en dehors de B(xo, À) c'est évident, et si x € B(xo, +), alors |f,(x)| 
est majoré soit par f(x0 — 1) soit par f(xo + 1) suivant que d soit croissant ou décroissant. Avec 
Ça nous avons 


A flo = 


” 8] flo (28.47) 
n 


zo+l/n 
la — F2 = J POBFOL 


æo—1/n to—1l/n 


Et nous voyons que | f, — f|2 — 0. 

Si f contient plusieurs points de discontinuité, on fait le même coup autour de chaque point, 
en prenant n assez grand pour que si x0 est un point de discontinuité, B(xo, 1) n’en contienne pas 
d’autres. 


Notons que la densité de C°(S1) dans (D, |.|+) est impossible, parce qu’une limite uniforme 
de fonctions continues est continue. 


Théorème 28.13. 
Le système trigonométrique {en}nez est total® dans (D, ||.|2). 


Démonstration. Soit f € D. Si elle est continue, le théorème de Fejér 28.7 nous donne convergence 
uniforme sur S! d’une suite de polynômes trigonométriques vers f. Cette convergence est également 
une convergence L? parce que S! est compact. 
Prenons donc f € D non continue et € > 0°. Par le lemme 28.12, il existe une fonction 
g e C(S1) telle que 
lg — fl2 < €: (28.48) 
Le théorème de Fejér donne aussi un polynôme trigonométrique P tel que | P — g}2 < €; nous 


avons alors 
IP — fle < IP — ga + Îg — flla < 2e. (28.49) 


8. Définition 25.20. 
9. Par exemple € = 0.4, mais ce n’est qu’un exemple hein. Si vous en voulez un autre, prenez p, un nombre 
premier puis calculez € = 1/p. 
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Notons que cette histoire de fonctions de Dirichlet n’a pas attaqué le vrai fond du problème de la 
densité des polynômes trigonométriques dans L?($1) parce que nous restons avec une hypothèse de 
continuité, alors que les représentants des éléments de L?($1) n’ont strictement aucune régularité 
à priori. 


28.3 Coeflficients et série de Fourier 
DEFooJUUIooNMdCtN 


Définition 28.14. 
Pour toutes les fonctions f définie sur [0,27[ ou périodique de période 27, pour lesquelles les 
expressions ont un sens, nous définissons 


et = 2 [7 ftpe état FER E0) 


"2j 


et nous nommons série de Fourier associée à f la série 


S(F)(a)= D (fer. (28.51) 


(FN) = D fe”. (28.52) 
Si la fonction f est de période T, nous définissons 


T 
COR CE FooRDFSo0EE TA 


Le sport de la théorie des séries de Fourier est de donner des conditions sous lesquelles : 
— les coefficients de Fourier et la série de Fourier ont un sens, 
— la série de f est égale à f. 
PropmrLfGt 
Proposition 28.15 ([679]). 
Soit f une fonction continue et 27-périodique telle que sa série de Fourier converge uniformément. 
Alors la convergence est vers f. 


Démonstration. Notons d’abord que f étant continue sur [0,2], elle y est bornée et L?. Par 
conséquent Parseval nous enseigne que 


ISn(F) — lie — 0. (28.54) 


Cela signifie que 
1 27 
lim | Lf() — Sn(t)l?dt = 0. (28.55) 
0 
L'hypothèse de convergence uniforme nous dit que la fonction |f(t) — Sw(t)l? converge uniformé- 
ment vers la fonction |f(t) — S(t)[? où nous avons écrit S la limite de Sy. En permutant la limite 
et l'intégrale, 


1 27 


= | 1/6) — Sat = 0, (28.56) 
27 Jo 


ce qui signifie que la fonction t + |f(t) — S(t)|? est la fonction nulle. Nous en déduisons que 


f=S. 
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PropSgvPab 


Proposition 28.16. 
Soit f une fonction 27-périodique. Si Ÿ.,,47 |Cn(f)| < ©, alors pour tout x € R nous avons 


Fer ati. (28.57) 


De plus, la suite (S,(f)) converge uniformément vers f. 


Démonstration. Nous posons 


gfa)= D étfjent. (28.58) 


neZ 


Étant donné les hypothèses, la série de droite converge absolument, la fonction g est continue sur 
R. Nous avons 


g(e) — (SP) < À IP) (28.59) 


lkl>n 


mais le terme de droite tend vers zéro lorsque n — 0 parce que c’est le reste d’une série convergente. 
Cela signifie que S,(f) converge uniformément vers g. 

Par ailleurs nous savons que dans L? nous avons la convergence S,(f) — f (parce que f est 
continue sur le compact [0,2+] et donc y est bornée et L?), ce qui signifie que g = f presque 
partout. Ces deux fonctions étant continues, elles sont égales partout. 


ThozHXraQ 
Théorème 28.17 ([1]). 
Soit f: R — C, une fonction C! et 2r-périodique. Pour n € Z nous posons 
1 27 | 
Cn(fj=—| f(tje ‘dt. (28.60) 
27 0 
Alors ITEMooIDVEoo JdMEmU 
(1) Les coefficients de Fourier sont sommables : (c,) € L(Z) ITEMooGTEUOOKLyXe j 
(2) Pour tout x € R nous avons 
ape (nent (28.61) 
neZ 
ITEMooAUCTooTgJEPv 
(3) La convergence est uniforme. C’est à dire que si nous posons 
N . 
Sn(a)= D, aœ(fekr, (28.62) 
k=—N 
alors 
1Sx — flo — 0. (28.63) 
Démonstration. Point par point. 
(1) Pour (1) Soit ne Z. Nous posons g(t) = f(t)e Ÿ"!. Nous avons 
27 27 | | 
0 = g(2r) — g(0) = Î g'(bjdt = Î LPDe" — inf(de "at. (28.64) 
0 0 


Du coup, cn(f') = incn(f). La fonction f’ étant bornée (parce que continue sur [0,2x|), 
elle est de carré intégrable sur [0,2T] et par les inégalités de Parseval (théorème 25.46) nous 
avons 


> IAU)P ES. (28.65) 


neZ 


28.3. 
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Par conséquent (c,(f')}) € {2(Z) et a fortiori (c,(f')}nen € L2(N). L’inégalité de Cauchy- 
Schwarz nous indique alors 


co 1 1 1/2 1/2 
>=» =len (PI < ù à) (Einur) es (28.66) 
Nous procédons de même pour n < 0. Cela prouve que 


D len(P)1 = Ico(f)1 + D Len + D len(PI < 00. (28.67) 


neZ n<0 n>0 
(2) Pour (2) 
(3) Pour (3) 
CordgtX1C 
Corolaire 28.18 (Unicité des coefficients de Fourier{[1]). 
Soient f,g deux fonctions continues et 27n-périodiques. ITEMoOPLTTo0SDykYF 
(1) Si cn(F) = cn(g) alors f — 9. ITEMooQMMSo0EpIFbt 


(=. mett, alors di ef). 


Démonstration. En deux points. 


(1) 


Pour (1) Dans le cas de fonctions continues, le théorème de Fejér 28.7 nous enseigne que 
si nous posons 


Sa(F)(æ) = D, (fer (28.68) 
k=-n 
alors nous avons la convergence 
1 N 
EE à Sn(F)(x) — f(x). (28.69) 


Donc en supposant que c(f) = c(g), nous avons $,(f)(x) = S,(g)(x) et 


1 


, : | iù 
f@)= in y à Sa) = Jin à Sn(g)(x) = g(x). (28.70) 


Pour (2) Nous considérons la restriction 


f: [0,27] — © 


no . CET) 


C’est une fonction bornée parce qu’elle est la restriction de f qui est continue sur, disons, le 
compact [—6, 27 + ô]. Elle est donc dans l’espace de Hilbert L?([0,2x[). 


En utilisant la base trigonométrique (27.467) (qui est une base par le lemme 27.124), nous 
écrivons l’hypothèse sous la forme 


(x) = Ÿ, V?ranen(z). (28.72) 


neZ 


Autrement dit, f — D ncz V2Tümen. La proposition 25.26 permet d'identifier les coefficients : 


V2rar = (f,en). (28.73) 
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Nous avons donc 


1 27 0 
On = = [ HOMO (28.74a) 
1 AE 1 —int 
—— [ 10e "dt (28.74b) 
. be de 28.74 
= | joe (28.740) 
1 —in 
D [ f(tje "dt (28.74d) 
= cn(f), (28.74e) 


ce qu’il fallait démontrer. 


28.19. 

La proposition 28.21 dit que les hypothèses de continuité et de périodicité ne sont pas suffisantes 
pour assurer la convergence de la série de Fourier. En particulier, pour 28.18(2), l'hypothèse de la 
convergence de la série est une vraie hypothèse. 


Exemple 28.20. 


Considérons la fonction : 
z 


x) = 1 - — 28.75 

fa=1-% (28.75) 
sur [—7,r]. Nous la développons en série trigonométrique, et étant paire il n’y a pas de sinus. Un 
calcul montre que 


4 
a0 = 3 (28.76) 
et 4 
Gr = (TS (28.77) 
de telle sorte que 
RS n coS(nx) 
joe D (—1) = + (28.78) 
n=1l 


Nous avons f(r) = 0, mais avec le développement, 


DL A 
fo=i- à L (28.79) 
donc 
ER | T2 
… RE (28.80) 
n=1l 


28.3.1 Le contre-exemple que nous attendions tous 


Nous montrons maintenant que la continuité et la périodicité ne sont pas suffisantes pour avoir 


convergence de la série de Fourier. 
PropREkHdol 


Proposition 28.21 ([103]). 
Soit C9 (R) l’ensemble des fonctions périodiques continues muni de la norme uniforme. Nous 


définissons 
nm 


Sa(F)(e) = D, (fer. (28.81) 


k=-n 
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Alors il existe f € CŸ. tel que la suite n + S,(f)(0) soit divergente. En particulier f n’est pas la 
somme de sa série de Fourier. 


Démonstration. Nous considérons la forme linéaire 
LC st 
L (28.82) 
fe Sa(f)0) = D, cf). 


(1) La forme est continue Nous montrons d’abord que l, est continue en montrant que 
ln] < 0 et en utilisant la proposition 11.62. Pour cela nous calculons un peu : 


n 


De D [row Le D ea 2 [_ro2,04"8585 


k=-n k=-n 


où D,(t) est le noyau de Dirichlet dont nous connaissons une formule par le lemme 28.4. 
Nous avons donc 


1 T 
BONE | Pr IFedt (28:84) 


En prenant |f|x = 1 nous avons la borne suivante pour la norme de {, : 
1 [7 EoB : 
DÉS ROTEE dBARTUED 


Notons que la convergence de l'intégrale vient de la continuité de la fonction 


; 2n+1 
a 
ne) (28.86) 
sin (4) 
qui, elle même, se prouve avec une règle de l’Hospital : 
Î t t 
lim SCOR lim dent = a. (28.87) 


1-0 sin(t) +—-0 cos(t) 
Donc D,(t) a une limite bien définie pour t — 0 et est alors une fonction continue sur le 
compact [—7,7|. 
(2) La norme de {, (début) 


Nous avons prouvé que || < [7 |D,(t)|dt. Nous allons à présent prouver que ceci est 
effectivement la norme de {,. Pour € > 0 nous considérons la fonction 


fe: R—C 
D, (x) (28.88) 


LR ——————. 
[D, (x)| + € 


C’est une fonction continue et 27-périodique satisfaisant | f.| < 1 parce que le dénominateur 
est toujours plus grand que le numérateur. Nous nous proposons de calculer 


7h : : f(be ta. (28.89) 


k=-n 


Puisque f.(t)e-**t vaut en norme |f.(t)|, qui est une fonction intégrable (ne dépendant pas 
de k) sur [—7,7], le théorème de la convergence dominée 14.200 nous permet de permuter 
la somme et l'intégrale : 


In(fe) = | [ D, (#) ÿ et ge = [ IDn(9 


27 JDE, 27 J, |Ditl+e 


k 


dt. (28.90) 


=-n 


=DA(t) 
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Nous avons donc : 


1 
ln) = 3e | DAC (28.91) 


= 


Mais vue l'inégalité (28.85) nous avons 


1 T 
= 3 [Paie (28.02 


Notre tâche est maintenant de donner une valeur à cette intégrale. 


Norme de /, tend vers © D'abord nous écrivons 


__ 1 ff fsin (4) 
DES a) (28.93) 


ensuite nous nous souvenons que |sin(x)| < |[x| pour tout x, ce qui nous permet de changer 


le dénominateur : _— 
2 (T sin (54 
T Jo él 


Nous y effectuons le changement de variable u — 2; qui donne 


(n+ dr : 
| MOIS (28.95) 


ln > — 
T ul 


Nous y reconnaissons l'intégrale (18.95) du sinus cardinal que nous savons diverger. Cela 
donne 
lim |l,| = 00. (28.96) 
n—00 


La conclusion 


L'espace (C3, ||.]lL) est complet !°, donc le théorème de Banach-Steinhaus 11.139 s'applique. 


Par rapport aux notations de l’énoncé de Banch-Steinhaus, nous posons 


E = (C$: ||.) (28.97a) 
F=R (28.97b) 
He: (28.97c) 


Comme la suite (|/,|) n’est pas bornée, il existe f € C9. tel que 


sup fn (f)| = 00. (28.98) 
nm 
Pour cette fonction nous avons 
sup Sn(f)(0) = co, (28.99) 
nZ0 


et donc la série de Fourier de f ne converge pas en zéro. 


NORMooGKKWooFmOBeE 


28.22. 

La proposition 28.21 ne contredit pas Fejér 28.7(4). Alors là c’est subtil, donc soyez bien attentive. 
Le système trigonométrique est total dans l’espace des fonctions continues périodiques sur R : 

(CICR), |.l0). Cela signifie que si f € CI, (R), il existe une suite de polynômes trigonométriques 


P, tels que Px cat 
Cela ne signifie pas que cette suite soit la suite des sommes partielles de la série de Fourier. 
Et en effet, le théorème de Fejér ne donne pas la convergence de la suite des sommes partielles de 


10. Parce qu’une limite uniforme de fonctions continues est continue, théorème 12.367. 
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Fourier, mais la convergence au sens de Cesàro de la somme des c;(f)ex. Ce n’est pas la même 
chose. 

Notez que le coefficient de e1 dans F2 est c1(f)/2 alors que dans F3, il est 2c1(f)/3. 

Il y a donc bien une suite de polynômes trigonométriques qui converge vers f, mais ce n’est 
pas la suite des sommes partielles de la série de Fourier. 

De plus, CŸ_(R) n’est pas contenu dans L?(R), donc nous ne pouvons pas invoquer la théorie 
de Hilbert pour dire que le système trigonométrique serait quelque chose comme une base. Si 
fe CE(R), il n’est pas garanti qu’il existe des nombres (a;);ez tels que f(x) = Ye ane". 

Enfin, me diriez-vous, les fonctions continues et périodiques sur IR sont les mêmes que les 
fonctions définies sur [0,27[ avec une petite condition de lim;_,27 f(x) = f(0). Les fonctions 
qui vérifient cela sont une partie de L?([0,2x1), qui est un espace de Hilbert, lui. Or le système 
trigonométrique est une base hilbertienne (lemme 27.124). Alors oui, la série de Fourier de f 
converge vers f lorsque f est continue sur [0,27[. Cela n’est cependant pas un contre-argument 
pour deux raisons : 


— La convergence S,(f) — f qu’on a dans L?([0,2x|[) est seulement une convergence pour la 
norme L?, et non une convergence uniforme. 


— Une convergence L? sur [0,2r| ne se prolonge pas spécialement en une convergence L? sur 
R, et encore moins en une convergence uniforme sur R. 


28.3.2 Inégalité isopérimétrique 


Le théorème suivant dit que parmi les courbes C, le cercle a la plus grande surface possible à 
périmètre donné. 
TholXyctPo 


Théorème 28.23 (Inégalité isopérimétrique[103]). 
Soit f: S! — € une courbe de Jordan! de classe C}. Nous notons L sa longueur et S l'aire 
contenue de la surface délimitée !? par f. Alors 


(1) Nous avons l'inégalité isopérimétrique : L? > 4rsS. 


(2) Nous avons l'égalité L? = 4rS si et seulement si la courbe donnée par f est un cercle. 


Démonstration. Nous commençons par considérer un chemin dont la longueur est 27 et nous en 
considérons son paramétrage normal. Nous allons exprimer l'aire $ en utilisant le théorème de 
Green, et plus particulièrement la formule de surface (20.242). 

Si f(s) = x(s) + iy(s), nous devons intégrer yx — x'y, qui n’est rien d’autre que la partie 


imaginaire de f’(s)f(s). Donc 
= 1 f'(s)f(s)ds EE O 0 | 


Nous considérons les coefficients de Fourier de f donnés par la formule (28.50) : 
1 27 | 
Cn(f)= (s)e "ds. (28.101) 
27 0 


Ceux de f’ (qui est aussi continue sur le compact S! et donc tout autant L?) sont donnés par 


el) sine) (28.102) 


D'autre part en vertu du théorème 21.9, la longueur de 7 s'exprime en termes de l’intégrale de 
la norme de sa dérivée : 


27 27 
= = [ PO = [ HO: (28.103) 


11. Définition 20.72 
12. C’est la partie connexe bornée de C\+ dont l’existence est donnée par le théorème de Jordan 27.200. 
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parce que nous avons choisi un paramétrage normal qui vérifie automatiquement |f/(s)| = 1 pour 
tout s. L'identité de Parseval sous sa forme (25.130) appliquée à f” nous enseigne que 


Dean | (Pas = 2 D len(P 2 = 27 Sr (PP, ESA) 


n=—00 neZ 


et donc que 


D rlea(f)P = 1. ER) 


neZ 


Par ailleurs le système trigonométrique étant une base hilbertienne, et les fonctions f et f” étant 
dans L?([0, 2r]) (parce que continues sur un compact), elles sont égales à leurs séries de Fourier 
(au sens L?), c’est-à-dire que nous avons l'égalité (27.471). Nous avons alors 


CF’, Pie = D cn(f')en: "a Cm(f)em) (28.106a) 


nez meZ 
= à den Cn(f P) {En €m) Em} (28.106b) 
rs ,m 
= 5, au) (28.106c) 
nez 
= > tn (28.106d) 


où nous avons utilisé la continuité du produit scalaire pour sortir les sommes. Avec cela nous 
pouvons exprimer l’aire (28.100) en termes de coefficients de Fourier : 


S = - “Im nf, PDT > nlen(f) ff. FE 07) 


nez 


En utilisant les expressions (28.104) et (28.107) pour Let S, et en écrivant L = 27, nous avons 


L? … A4rS En Ar? o n?|cn(f) ) _ Ar? nlen(f CHE SUBEQooJTEW ERP 


neZ neZ 
BE 
> 472 V nl (PP — 472 S'nlen(f SAS 108b) 
neZ neZ 
= 47° D [cn(f)l(n? — n) (28.108c) 
nez 
> 0. (28.108d) 


Justifications. 
— Pour (28.108a). Expression (28.104) pour L et (28.107) pour S. 


— Pour (28.108b). La somme dans le premier terme valant 1 par (28.105), nous pouvons sup- 
primer le carré. 
Cela prouve l'inégalité demandée dans le cas où L = 27. 

Si n’est pas de longueur 27 mais L, alors nous considérons le chemin o(t) = 0, Sa longueur 
est 27 et son aire, au vu de la formule de Green (28.100), est de Ar? L’inégalité isopérimétrique 
appliquée au chemin o donne alors L? > 4msS. 

Le cas d'égalité s'obtient uniquement si €, = 0 pour tout n différent de 0 ou 1. Dans ce cas 
nous avons 


f(s) = co(f) + a(fJe”, (28.109) 


qui est un cercle de centre co(f) et de rayon |c1(f)|. 
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28.3.3 À propos des coefficients 


Pour la suite, nous avons besoin d’une notation pour désigner l’ensemble des suites dans € à 
index dans Z, c’est-à-dire l’ensemble Fun(Z, C). Pour alléger les notations, nous allons l'écrire C7, 
conformément à des notations déjà introduites par exemple en 1.328. 

Nous considérons l’application 


Ci (Lam (41) — (C7, 1) 
JR (en(f))}nez 


qui à une fonction 27-périodique fait correspondre la suite (bornée) de ses coefficients de Fourier. 
Nous rappelons la définition 


(28.110) 


1 27 
Cn(f) = d : 


Nous allons montrer que cette application est linéaire, continue, injective et non surjective. Pour 
la continuité, par la linéarité il suffit de la montrer en 0. Nous devons donc montrer que si nous 
avons une suite de fonctions f, qui tend vers 0 au sens L!, alors c(f,) — 0 au sens de la norme 
|.lx sur l’ensemble des suites. 

Si nous posons rx = 4 [fk(t)|dt, alors rx = |fl1 et nous avons rx; — 0. Mais par définition 


CAUIESTT (28.112) 


fe Tia (28.111) 


et donc |c(fx)lx < rx. L'application c est donc continue. L’injectivité est donnée par le coro- 
laire 28.18. 

Si nous supposons que l’application c est continue, alors le théorème d’isomorphisme de Banach 
(27.1) nous dit que cela devrait être un homéomorphisme, c’est-à-dire que c_! serait également 
continue. Nous allons montrer qu’il n’en est rien. 

Nous considérons la suite de suite 


0 sin <0 
(en) = {1 sik<n AE) 
0 sinon. 


Ici (c:)x est le terme numéro k de la suite (c,). Par exemple co = (0,0,...) et c2 = (1,1,0,...). 
Par injectivité de l’application qui à une fonction fait correspondre la suite de ses coefficients 
de Fourier, l’unique fonction qui possède ces coefficients est 


=) ee (28.114) 
keN 


En ce qui concerne la norme de f,, nous avons 
M fnl1 = sl Cn)kle*t|dt = D (Cn)r = n. (28.115) 
À keN 


Étant donné que |f,|1 = n, la suite (| f,|1) n’est pas bornée alors que la suite de suites (28.113) 
est bornée dans l’ensemble des suites parce que lc, = 1. 


LEMooPUJDooKRBTaU 
Lemme 28.24. 
Soit une fonction f: IR — C qui est T-périodique et de classe C'. Alors 
27n . 
Cn(F) = 7 icn(f). (28.116) 


Démonstration. Nous rappelons la définition (28.53) des coefficients de Fourier : 


T 
Cn(f) = 7 [ DE Fr ge (28.117) 
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Le coefficient pour f’ ne pose pas de problème d’existence parce que f’ est continue sur le compact 
[0,7]. Il vaut 


T 
Cn(f) = | Perd (28.118a) 
0 
oh enle _ À Î d —2imn \  _ojxnt/T , SUBEQOOXYOVo0G 
—. | (De L r |, OT }e dt RATE) 
T 
L 2imn 1 Î f (be 2imtiT dé PO) 
Tor h 
= te) (28.118d) 
T 
Justifications. 


—— Pour (28.118b). C’est une intégration par partie avec u/ = fl et u = e-2iTm#/T, 


— Pour (28.118c). Comme f(T) = f(0), et que & > e-2i7"t/T est périodique de période T,, le 
terme au bord est nul : f(T)e-2i7 — f(0)ei0 = 0. 


LEMooYJQWooDVvSy)j 
Lemme 28.25 ([609]). 
Soit une fonction f: R — € de classe C? et T-périodique. Alors 
T 2 {24 
CAES (>) If le. (28.119) 
27 n 
Démonstration. En utilisant la définition (28.53) des coefficients de Fourier, 
LÉ 1 F 
(PI & | Id < lle [168 = Ile (28.120) 
0 0 
En appliquant le lemme 28.24 à f’ nous avons 
ñ 2irn \? 
(2) = (TT) D (28.121) 
Donc 
“A . 4 T . 1! 
pe es | 28.122 
ee (ln (E) le (28.122) 
28.4 Série de Laurent 
THOooMKJ0o0oVghZyG 
Théorème 28.26 (Série de Laurent|[609]). 
Soient la couronne 
C(r1,r2) = {ze C tel que r1 <|z| < r2} (28.123) 
et une fonction holomorphe f: C(r1,r2) — C. Alors : 
(1) Il existe une suite (an) dans © telle que 
Fe > et (28.124) 
neZ 
ITEMooUOPHooSJRGKs 
(2) Cette suite est unique : si 
a= par) D (28.125) 
neZ neZ 


alors an = bn, pour tout n. 
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ITEMooDGGZooJkDSxC 
(3) Si on pose, pour r € [r1, rl, 
fr: RC 
" . (28.126) 
Or f(re”), 
les valeurs a, sont liés aux coefficients de Fourier de f,. par 
Cn(fr) 

ITEMooUYCPooZZAyKs 


(4) Cette série converge uniformément sur tout compact contenu dans C(r1,72). 


(5) Pour tout r1 < s < ro, les coefficients sont donnés par !* 


1 (z) 
. 2mi C; 27 1 ( 


où C, est un cercle centré en 0, et de rayon s. 


La série ainsi définie est la série de Laurent de la fonction f. 


Démonstration. Pour r € |r1,r2[ nous posons 


fr: R—C 


Nr) (28.129) 


(1) Coefficients de Fourier La fonction f, est de classe C1 et périodique. Le théorème 28.17 
sur les séries de Fourier nous indique que 


Jr) — cn(r)et FQo0THARoR qu, 


neZ 
avec Le 
de [ 
Enr) = — | fre dt. (28.131) 
27 Jo 


La fonction c,: [r1,r2[ — © est une fonction définie par une intégrale que nous voudrions 
dériver en ro. 


(2) Digression Deux voies s'offrent à nous. 


— Le plus immédiatement disponible est le théorème 17.19, mais il demande de travailler 
avec la dérivée (réelle) de r > f(re) et de se poser des questions quant à son lien avec 
la dérivée (complexe) de f. 


— Une façon plus indirecte est de considérer une extension 


h: B(ro, 0) x [0,27] — € 

agree 0 (28.132) 
2,0 f(ze")e 

où Ô est assez petit pour que le tout reste dans le domaine de f. Alors nous pouvons 
utiliser le théorème 26.73 qui a l’avantage de ne pas devoir majorer la dérivée. Mais cette 
voie demande de réellement faire le lien entre la dérivée complexe de h et la dérivée réelle 
der f(re). 

Nous choisissons la première voie parce qu’en réalité, elle évite complètement de parler de 

dérivée complexe. 


13. Pour le dire clairement, ces a, ne dépendent pas de s, même si s entre dans le membre de droite. 
14. Oui, on devrait écrire c,(f-) pour suivre scrupuleusement les notation introduites plus haut. Mais comme 
toute la suite de la démonstration sera de voir le tout comme fonction de r, je vous laisse juger. 
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(3) Permuter dérivée et intégrale Nous allons essayer de la dériver en ro € ]r1,r2[ en utili- 
sant le théorème 17.19. Pour y voir plus clair, ce qui joue le rôle de f dans l’énoncé de 17.19 
est l’application 


h: ]r1,r0[ x [0,27[ — € 
(r,0) + f,(0)e 7. 


Nous considérons un intervalle ? = B(ro,ô) assez petit pour être dans [r1,r2[. Passons en 
revue les conditions. 


(3a) Pour (1) 
Nous introduisons la fonction 


(28.133) 


f:R x [0,27] — € 


28.134 
(r,0) > f{re"?) | 

Pour tout r € I, la fonction 8 + f(re)e”{"? est dans L1([0,27[) parce que 
Lf(re)e 0 = |f(re)| = | f(r,0)1: (28.135) 


La fonction f étant continue, elle est bornée sur le compact I x [0,27]. 

(3b) Pour (2) Pour chaque 0, la fonction r + f(re")e-#"® est dérivable par la proposition 
26.3(1). 

(3c) Pour (3) En utilisant la proposition 26.3(3), nous savons que la fonction 


TL (r,9 = Cr, 0-6 (28.136) 


est continue et done bornée sur le compact 7 x [0,2x]. Une fonction constante majorant 
de ,h est intégrable sur le compact [0,27]. 


En permutant nous avons donc 


(ro) = — 


27 
- Î (ôr (ro, 09e "# de. (28.137) 


0 


TR 
Æ 
_—_— 


Cauchy-Riemann C’est le moment d'utiliser Cauchy-Riemann en coordonnées polaires 
sous la forme de la proposition 26.3(2). Et tant que nous y sommes, nous notons g(0) = 


f(ro, 0) pour avoir moins de choses à écrire : 


dre) = | (8 F(ro, 0e "48 (28.138a) 
in 
= rs (Oo f)(ro,6)e "48 (28.138b) 
1 _. ! —in0 
= | g(0)e "dé. (28.138c) 


La dernière expression a manifestement envie de se soumettre à une intégration par partie. 


i EQSooSRDJooXLHhgh 
(5) Une intégration par partie Nous posons u(@) = e-"® et v = g, de telle sorte que | QS0o 00 £ 
1 nom (# ” 
dr) = are (Lee — [ie /a(0)de (28.130a) 
2Tiro 0 0 
27 
i BE KVZ 
= 2 [atoe ar. SUBEGookVZMagU cp 
270 Jo 
= —cn(ro). (28.139c) 
To 


Justification pour (28.139b). Pour rappel, g(8) = f(ro,0) = f(roe"?) : donc g(0) = g(2x) et 
le « terme au bord » est nul. 


28.4. 


(6) 
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Équation différentielle L’équation (28.139) dit que c, satisfait à l'équation différentielle 


, n 


étre cn(r) (28.140) 


pour tout r € [r1,r2[. La fonction c, est une fonction à valeurs complexes dont les parties 
réelles et imaginaires vérifient toutes deux l'équation du lemme 26.91. Il existe donc a, € © 
tel que 

A CARE (28.141) 
Cela prouve au passage le point (3) parce que r n’est jamais nul. 


La valeur de a, Nous avons 


EU) 


1 27 : | 
D | f(reP)e-#"6r 1 d0 
0 


1 27 f(re) 
d 
27 Jo (er) 


An — 


FQooFNURoR GER ET, 


Une justification pour l'intégrale curviligne s'impose. La définition est 26.5. Dans le cas du 
cercle, nous considérons 


Cr: [0,27[ — C 
D (28.143) 
et donc ” ; L, 3 —. 
= LE 6 10 _ ; | Jr 
o. #1 dz op (Creifyn+i7t6 dÿ=i o (reôÿn de. (28.144) 


Le fait que le tout soit égal à a, prouve que l'intégrale est en réalité indépendante de r !. 
Conclusion Reprenons la formule (28.130) : 


ftre®) = f,(0) = > En(r)er® = >, anr er” = y antre ty (28.145) 


nm 


Autrement dit, 


ea (28.146) 


avec les a, donnés par la formule (28.142), comme nous devions le prouver. 


Point (2) (unicité) Supposons que f(2) = D ,,27 4n2", fixons r € |r1,r2{, et posons 


fr: RC 
. (28.147) 
0 f(re”). 
C’est une fonction continue et périodique. Elle peut s’écrire sous la forme 
Fer) are Te Yan ere (28.148) 


neZ neZ 


Le corolaire 28.18(2) à propos de l’unicité des coefficients de Fourier implique que a,r" = 


Cn(f) et donc que 
C E BNSM B 
0 RocBNEMog gr Faq 
= 
Donc les coefficients a, sont déterminés par f. Si nous avions fait le calcul en partant de 


FC) = Yuez bn2”, nous aurions eu b, = ses ) et donc bien an = bn. 


15. Voir ma question 28.27. 


2256 


CHAPITRE 28. SÉRIES DE FOURIER 


(10) Point (4) La fonction 


fr: RC 


ne (28.150) 


est continue et périodique de période 27. Le lemme 28.25 nous indique que, pour tout r € 
Jr1,r2[, nous avons 


(10a) 


(10b) 


tn < LEE, Fos DS 


2 
Sur une couronne Soient deux rayons intermédiaires r1 < 81 < 82 < r9. La couronne 
fermée C(s1, 82) est compacte. Nous considérons la fonction 


g: [s1, 52] x [0,27] — © 


(u,0) > (0) (28.152) 


Nous notons g, l'application 0 + g(u,0); c'est une application définie sur [s1, 82]. Par 
le lemme 12.82, l'application u + |g,|x est continue et donc majorée : nous pouvons 
considérer M € R tel que |gulo < M pour tout u € [s1, 52]. 

Puisque, pour r € [51,52] nous avons g, = f}, en combinant avec (28.151), nous voyons 


qu'il existe M tel que 
tas - | ERooAIPEogYdf Que, 


En prenant les notations de la définition 11.82 de la convergence normale, nous posons 


Un : C(51, 52) — € 


: (28.154) 
24 AnZ 
En ce qui concerne sa norme 16 nous avons 
lunloo = [anl sup |z"| (28.155a) 
z€eC(s1,52) 
= |an|s2 (28.155b) 
BE K P 
= Ent la) 2 SUBEQooR rasFRenS 
sn 
< [cn(Fs)] n (28.155) 
S 
2 
M SUBEQooZJFJ 
<= PRESS) 


Justifications : 
— Pour (28.155c). Prendre n'importe quel s € [51,2] et c’est bon par (28.149). 
— Pour (28.155e). Équation (28.153). 


Comme la somme ÿ: 
sur C(s1, 82). 


2 n 
nez M/n° converge, nous avons la convergence normale de Ÿ 47 AnZ 


Sur un compact quelconque Soit K, un compact dans C(r1,r2). La fonction z + 
|z| est continue sur X ; donc elle a un minimum et un maximum. Nous posons s1 = 
min,ex |z| et s2 = max.ex [z|. 


Ah ah! non. En fait nous ne définissons pas 51 et 52 de cette manière parce qu’il y a 
un risque que 81 = 82 et qu'alors C(s1, 82) soit vide et ne contienne donc pas À — pour 
rappel, C(s1,52) est la couronne ouverte. 

Nous choisissons donc 51 et 52 de telle sorte que 


T1 < 81 < min|z| < max|z| < 52 < r2. (28.156) 
zeK zeK 


16. Faites bien attention que dans cette partie, |. est la norme uniforme sur C(s1,s2) et non sur C(r1,r2) ou 


sur C. 
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Tout ça pour dire que K € C{(s1, 52). La convergence normale sur C(s1, 82) déjà prouvée 
implique la convergence normale sur K. 


PROPBooYWDNooMXVPLJ 
ii Avertissement /question à la lectrice !! 28.27 
Sur Wikipédia/609], le fait que an ne dépende pas de r est prouvé en disant que a, (s) = c(s)/s" 


et an(t) = Cn(t)/t” et que 
é(s) _s FRoeGPOTe Apr E 


cn) + 

En mettant tout cela bout à bout, 
an(s) _ y (28.158) 
an(t) 


Je ne comprends pas très bien pourquoi cette justification est nécessaire. À mon avis, la rédactrice de 
la démonstration sur Wikipédia parvient à déduire la relation (28.157) directement depuis l’équation 
différentielle, sans réellement avoir besoin de la résoudre. 

Si vous comprenez n'hésitez pas à m'écrire, parce que j'ai l'impression d’avoir manqué quelque 
chose. 


ii Avertissement /question au lecteur !! 28.28 
L'’énoncé de la proposition 28.29 n’est peut-être pas précis. Si vous avez un énoncé correct sous le 
coude, écrivez-moi. 


PROPooBMZGooLoaGLK 
Proposition 28.29. 
Si f est holomorphe sur B(a,r), alors sa série de Laurent est de la forme 
00 
fQ@) = D an(z a). (28.159) 
n=0 
avec : /G) 
Zz 
_ dz. 28.160 
MT mi [ = airs d 
où 
: [0,27] — € 
Liu (28.161) 


est le cercle de centre a et de rayon r. 
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Chapitre 29 


Transformation de Fourier 


DEFooRIXGooECoIbx 
Définition 29.1. 
Soit une fonction f sur R4, dont nous ne précisons pas la régularité. Sa transformée de fourier 
est la fonction Î définie par 


À = | (er “ax D: 
Ra 


si elle existe. 


29.2. 
Ce qui est bien avec cette définition est que si la formule (29.1) ne définit pas Î (parce que l'intégrale 
n'existe pas, par exemple), nous nous réservons le droit de définir tout de même f par d’autres 
biais. Ce sera d’ailleurs l’objet du théorème 29.32 qui définira f pour tout f € L?(R) alors que la 
formule (29.1) ne fonctionne pas sur toutes ces fonctions. 

Une bonne partie de ce qui va suivre aura pour objet de déterminer des espaces de fonctions 
sur lesquels la transformée est bien définie, et sur lesquels elle a de bonnes propriétés. 

Nous allons par ailleurs utiliser indifféremment les notations F(f) ou f pour la transformée de 
Fourier de f. La notation F est pratique pour les transformées de loooooongues expressions ainsi 
que pour parler de l’application « transformée de Fourier » d’un espace de fonction vers un autre. 


29.8. 
Nous verrons dans le théorème 29.32 que la transformée de Fourier n’est pas une isométrie de L?. 
Pour avoir une isométrie, il aurait fallu choisir des coefficients moins simples. 


Proposition 29.4. 
La transformée de Fourier est C-linéaire au sens suivant. Soient des fonctions f,g: RT— © telles 
que F(f) et F(g) existent. Alors 


(1) La transformée de Fourier de f + g existe et vaut F(f + g) = F(f) + F(9) 


(2) Pour tout € ©, la transformée de Fourier de Àf existe et vaut F(Xf) = AF(f). 


Démonstration. C’est la proposition 14.186 qui nous permet de séparer l'intégrale dans le calcul 
suivant : 


FE +00 = [4 + me ET Fe (29.2) 
= J f(x)e dx +| g(x)e € dx (29.2b) 

Rd Rd 
= F(F)(E) + F(9)(E). (29.20) 


En ce qui concerne F(\f), c’est la même chose, en utilisant la linéarité de l’intégrale. 
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29.1 Transformée de Fourier sur L'(R‘) 


Nous rappelons que les espaces LP sont des ensembles de classes de fonctions, définition 27.7. 
La transformée de Fourier, comme presque tout ce qui à trait aux intégrales, passe aux classes. 


Lemme 29.5. 
Soit une fonction f : R4 — C telle que F(f) existe. Alors pour toute fonction g € [f] la transformée 
F(g) existe et ÿ = f. 


Démonstration. Par définition des classes, il existe une fonction s: IR — € presque partout nulle 
telle que g = f +5. Soit £ € R fixé. La fonction x + s(x)e-"£? est presque partout nulle et 
donc intégrable d’intégrale nulle. La proposition 14.186 nous permet alors d'affirmer que f + s est 
intégrable et que 


F(f + s)(£) = [Le + s)(x)e dx = le f(x)e ax + [ s(x)e dx = F(f)(£). (29.3) 


À partir de maintenant, lorsque nous parlons de transformée de Fourier d’une fonction dans 
LP, nous parlons indifféremment d’une vraie fonction ou d’une classe. 


Lemme 29.6. | 
Si f € L'(RŸ), alors f existe. 


Démonstration. Par définition, si f € L'(R{), alors l'intégrale \Ra |f| existe et est finie. Alors la 
fonction qui arrive dans la transformée de Fourier en é, la fonction s: x — f(x)e"#? est également 
dans L'(RŸ) parce que |s| = |f|. 


29.7. 

Si f e L'(R), la transformée de Fourier f existe, mais il n’est pas garanti qu’elle soit elle-même 
dans L!, même si il est vrai que f est continue (proposition 29.11) et bornée (proposition 29.14). 
Nous allons immédiatement montrer un exemple de fonction L! dont la transformée de Fourier 
n’est pas dans L!. 


LEMooROPHooOSguhN 
Lemme 29.8. 
La transformée de Fourier de 
J:R—-R 
1 sirel[-;,;l (29.4) 
TT 
O0 sinon 
est 
3 in(£/2 
J(E) = see) (29.5) 


6/2 


La fonction f n’est pas dans L(R). 


Démonstration. Pour £ € R fixé, la fonction x + f(æ)eéf est continue à support compact, donc 
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nous n’avons aucun problèmes avec l'intégrale 


f@ = | r(œe dr (29.6) 
R 
= Ï e (29.6b) 
[—-1/2,1/2] 
1 —i£r12=1/2 
= FE (29.6c) 
- _ (e—ig/2 — Qié/2) (29.64) 
i 
__ 2isin(é/2) 
er (29.6e) 
sin(é/2) 
= ——., 29.6f 
Ep? ER 
Le fait que cette fonction ne soit pas dans L!(R) est le lemme 20.208. 
LEMooKGDKooVXSMCn 
Lemme 29.9. 
Si fe L'(Rd) et si g(x) = f(Xx) alors 
Q(E) = ATTF(E/N. (29.7) 


Démonstration. 1 s’agit de faire le changement de variable y = Àx dans l'intégrale 


46 = J fÜr)e Ed. (29.8) 
Rd 
Dans le changement de variables, vient le coefficient dx = À dy. 
PropfqvLOl 
Proposition 29.10. 
La transformée de Fourier est un morphisme vis-à-vis de la convolution sur L'(R") : 
fa fs (29.9) 
Démonstration. Nous devons étudier l’intégrale 
Fra = | |f Feat - au] e-ear (29.10) 


Ici nous avons choisi des représentants f et g dans les classes de L!. Montrons que f est borélienne. 
D'abord f(x) = f}(x) — f-(x) où f; et f- sont des fonctions positives. Afin d’alléger les notations 
nous supposons un instant que f est positive et nous posons 


n 


2" 
k 
Jatd) = y, n Les (29.11) 
k=1 


Le fait que f soit dans L! implique que chacune des fonctions f, est borélienne ! et donc que f 
l'est aussi en tant que limite ponctuelle de fonctions boréliennes ?. 


Nous allons appliquer le théorème de Fubini 14.296 à la fonction 


(x, y) = F(x)g(yje +) (29.12) 


1. Ceci demanderait plus de justification. Dites moi si vous savez comment justifier que les f, soient boréliennes. 
2. Le fait que f soit borélienne est une conséquence du théorème 27.227. 
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qui est borélienne en tant que produit et composée de fonctions boréliennes. Nous avons 


Leone as) ar = f (irc [iotoiéu) ax (29.138) 


-| -Lto)lah (9.13b) 
= | fl1lgl1 < oc. (29.13c) 


Le théorème est donc applicable. D’abord nous avons : 
foa(e = ([ rene ar) ([ atne as) (29.14a) 
R R 
- | (| fat Eva) dx (29.14b) 
R (JR 
= ] (| f(æ)g(t — etat) dx. (29.14c) 
R \JR 


Jusqu'ici nous n’avons pas utilisé Fubini. Nous avons seulement introduit le nombre Fe g(y)e dy 
dans l'intégrale par rapport à x et effectué le changement de variables y + t = x + y. Maintenant 
nous appliquons le théorème de Fubini pour inverser l’ordre des intégrales : 


fade = [ (fe remote - me ét) ax (29.15a) 
, J as ( [l Perte vd) dt (29.15b) 


= J ef x g)(t)dt (29.15c) 
R 

= fx g(6). (29.154) 

PropJvNf; 


Proposition 29.11. 
Soit une fonction f € L'(R‘). Alors sa transformée de Fourier est continue. 


Démonstration. Nous considérons une fonction f définie sur R et à valeurs dans KR ou C. Sa 
transformée de Fourier est donnée par 


Î(E) = IE et f(x)dx. (29.16) 


Pour montrer que cette fonction f est continue en £g nous considérons une suite (£») — £o et nous 
voulons montrer que f(£n) — f(£o). Pour cela nous considérons les fonctions 


In(x) = ere f(x) (29.17) 
qui convergent simplement vers g(x) = e-"#0% f(x). Étant donné que 


Ign(æ)| < 1 f(x), (29.18) 


le théorème de la convergence dominée donne alors 


ju, fonte) = | in on, (29.19) 


c’est-à-dire limn_ f(Ën) = f(é0). La fonction f est donc continue. 
LEMooCBPTooYlcbrR 


Lemme 29.12. 
Pour tout f € L'(R") nous avons | flo < |f|1. 


29.1. TRANSFORMÉE DE FOURIER SUR L!(R?) 2263 


Démonstration. Cela est une simple vérification : 
Î(E) = (x)e "dx, (29.20) 
R? 
nous avons, pour tout &, 


FOI < [ \(x)ldx, (29.21) 


ce qui signifie exactement | fl < |f|1. 


LesmRLaxXkQV 
Lemme 29.13 (Lemme de Riemann-Lebesgue[680]). 
Si f est une fonction L\(R) alors limg_,10 f(£) = 0. 


Démonstration. Nous commençons par prouver le résultat dans le cas d’une fonction g en escalier, 
et plus précisément par une fonction caractéristique d’un compact K = [a,b]. Au niveau de la 
transformée de Fourier nous avons 


b 
h 1 , 
Lx(é) = J erdr = ——(e" 6 — ei), (29.22) 
a ié 
Par conséquent 5 
x (E)| < E (29.23) 
Plus généralement si g = y 1: G1k,, alors 
o N 
BOI< D lat, (29.24) 
i=1 


et donc nous avons effectivement lime_,+4 |9(£)| = 0. 

Nous passons maintenant au cas général f € L!(R). Étant donné que les fonctions L! en escalier 
sont denses dans L!, nous considérons une fonction g € L!(R) en escalier telle que | f — gl1 < €. 
Nous avons donc 


LÂ— 8le < If — gli < €. (29.25) 
Donc dans 
HOIESHOETIOIEAEQI (29.26) 
le premier terme est plus petit que €. Il nous reste à voir que 
LLOIEC (29.27) 


mais cela est le résultat de la première partie de la preuve. 


CORooHSNYo0Z1ZoyV 
Corolaire 29.14. 
La transformée de Fourier d’une fonction L'(R) est bornée. 


Démonstration. Par le corolaire 29.11, la transformée de Fourier d’une fonction L! est continue. 
Le lemme de Riemann-Lebesgue 29.13 impliquant qu’elle tend vers zéro en +, elle doit être 
bornée. 


29.1.1 Formule sommatoire de Poisson 


ProprPbkoQ 
Proposition 29.15 (Formule sommatoire de Poisson). 
Soit f: R— © une fonction continue et L\(R). Nous supposons que 
(1) il existe M > 0 et a > 1 tels que 
M 
[f(x)| < (29.28) 


+lz)e 
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(2) Duo lF(27R)| < oo. 


Alors nous avons 


D f(n)= ÿ (mn). (29.29) 


n=—00 


Démonstration. (1) Convergence normale 


Nous commençons par montrer qu’il y a convergence normale sur tout compact séparément 
des séries sur les n > 0 et sur les n < 0. 


Soit K un compact de R contenu dans [— A, A] et n € Z tel que |n] > 2A. Pour x € K nous 
avons 


[x +n| > |n] — |x| > |n| — À > 6 (29.30) 


Du coup nous avons un «a > 1 tel que 


M M 
[f(æ + n)| < ES z-. (29.31) 
(1+1/z+n)) (+11) 
Lorsque n est grand, cela a le comportement de M/|n|* et donc la série 
ee) 
D f(&+n) (29.32) 
n=0 
est une série convergeant normalement. Les deux séries (usuelles) 
ay = ÿ f(z+n) (29.33a) 
nZ0 
a_= ÿ f(z+n) (29.33b) 
n<0 
convergent normalement. 
(2) Convergence commutative Au sens de la définition 11.99 nous avons 
» f(x +n) = a} +a-. (29.34) 


neZ 


En effet si nous prenons J € N fini tel que ins, f(x+n)—a;|<eet Ji € —N tel que 
| Dne-N\J! f(x +n)—a_|<e, et si nous posons Jo = J6 L Ji alors si K est un ensemble fini 
de Z contenant Jj nous avons 


LE f(n+a)—(as+a-<| D f(n+a)—al+| D f(n+a)—a-|<2e (29.35) 


ne K neK+ neK— 


où K* sont les éléments positifs de K et K7 sont les strictement négatifs. Maintenant que 
la famille { f(n +x)}hez est une famille sommable, nous savons qu’elle est commutativement 
sommable et que la proposition 11.113 nous permet de sommer dans l’ordre que l’on veut. 
Nous pouvons donc écrire sans ambigüité l'expression >, f(x +n) ou >, f(r+n). 


(3) re-convergence normale 


Nous posons donc sans complexes la série 


F(x) = ÿ f(z+n) (29.36) 


nez 


qui converge tant commutativement que normalement. Notons que nous pouvons maintenant 
dire que la série sur Z converge normalement ; pas seulement les deux séries séparément. 
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(4) Continuité, périodicité Etant donné que chacune des fonctions f(x +n) est continue, la 
convergence normale nous assure que Fest continue. 


De plus F est périodique de période 1 parce que 


we) 


00 
F(z+1)= NO f{z+1+n)= Ÿ f(x+p) = F(x) (29.37) 
n—=—00 p=—0 
où nous avons posé p = 1 +n. 
Notons que nous n’avons pas spécialement prouvé que F' n’était pas périodique avec des 
périodes plus petites que 1. Mais cela n’a pas d'importance ici. 
(5) Coefficients de Fourier 

En vertu de la définition (27.318) et de la périodicité de F, 


1/2 | 
cn(F) = Î F(tje- "td (29.38a) 
—1/2 
1 = 
= [ F(tje ?rTidt (29.38b) 
-{ D fG+ne ar (29.38c) 
nez 
n+1 à 
=}, Î fhde et (29.38d) 
neZ °N 
00 n 
- | f{u)e Tu (29.38e) 
—00 
= f(27n). (29.38f) 


Justifications : 
— Changement de variables u = t + n. 
— permuté l'intégrale et la somme en vertu du fait que la somme converge normalement. 


5 . _ =: . 25 . 2 E . 
2ri(u—n)n er2riun —2rin = L-2miun 


— Égalité e 
(6) Conclusion 


Étant donné l'hypothèse 5.» |f(n)| < o la proposition 28.16 nous dit que 


D id (29.39) 


nez 


c’est-à-dire que 
00 


Le] 
D f(æ+n)- D D 1) (29.40) 


n=—00 
En écrivant cette égalité en x = 0 nous trouvons le résultat : 


> fin)= » jGrn). (29.41) 


nez nez 


ExDLjesf 
Exemple 29.16. 
La formule sommatoire de Poisson peut être utilisée pour calculer des sommes dans l’espace de 
Fourier plutôt que dans l’espace direct. Nous allons montrer dans cet exemple l'égalité 


O0 oo 
Dr) VE ai (29.42) 
= —00 n—=—0 
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Si «a est grand, alors la somme de gauche est plus rapide, tandis que si a est petit, c’est le contraire. 
Nous appliquons la formule sommatoire de Poisson à la fonction 


MEET: (29.43) 
Nous avons Vi pes 
f _ —at?2—irt 
Jr) = |..É dt (29.44a) 
R 

= a eat) (29.44b) 

R 

1 
— | e% du. (29.44c) 

va JR+ir 


Pour traiter cette intégrale nous utilisons la proposition 26.10 en considérant le chemin rectangu- 
laire fermé qui joint les points —R, R, R + ai, —R + ai et f(z) = e-*. Calculons l'intégrale sur 
les deux côtés verticaux. Nous posons 


yr(t) = R+tia (29.45) 
avec t: 0 — 1. Nous avons 
1 
RARTOrCC (29.46a) 
VR 0 
1 
= qe Î APP dE (29.46b) 
0 
donc en module nous avons 
1 
|| fI< ae À Î eŸdt< Me, (29.47) 
7R (à) 


où M est une constante ne dépendant pas de À. Lorsque À — co, la contribution des chemins 
verticaux s’annule et nous trouvons que 


[ = L Pie Fad 8) 


que nous pouvons utiliser pour continuer le calcul (29.44). Nous avons 


L —x2/4a 
j(e) = - 7. Le du = à “hi (29.49) 


où nous avons utilisé la formule (14.974). Par conséquent ce qui rentre dans la formule sommatoire 


de Poisson est 
f(2rn) = JE. (29.50) 


A 
29.2 Suite régularisante 
DEFooRIFYooUUUoha 
Définition 29.17. 
Une suite régularisante est une suite (ph) dans L'(R4) telle que ITEMooEYXYooAkKeXX 
(1) pour tout n, Pn > 0 et La Pn = 1; 
(2) pour tout à > 0, 
lim Pn = 0. (29.51) 
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Une telle suite est régularisante parce que souvent p, € Z(R1), ce qui donne f + p, € C'© par 


le corolaire 27.62. 
PROPooYUVUooMiOktf 


Proposition 29.18 ([681, 682]). 


; ue - 1(md - 
Soit une suite régularisante pn € L'(R°). Alors : ITEMooLWMTooFFamdf 


(1) Si f est continue à support compact, nous avons la convergence uniforme sur R° : 


unif 


f* On — f. (29.52) 
ITEMooEJKKooChcgyM 
(2) Sige LP (1< p < ©) alors 
L 
J* Pn + ÿ. (29.53) 


Démonstration. Si f est continue à support compact, elle est uniformément continue ”, et elle est 
bornée. Soit e > 0 et à > 0 tel que pour tout x, y tels que |x —y| < a nous ayons | f(x) — f(y)| < €. 
Nous prenons de plus n suffisamment grand pour avoir | B(0aye Pn < €: Nous avons alors 


HORDE MUC E 0) CET" (29.54) 
<[ V@-rw)mte-pars | Um -nd0 
B(x,a) nc B(x,a)° a — 
(29.54b) 
< e(1 + 2]/fle). (29.540) 


Nous avons prouvé que pour tout € > 0, il existe N tel que n > N implique | f(x) —(f+pn)(æ)| < €. 
Cela prouve l’uniforme convergence sur R de f + ph vers f. 
Pour le point (2) nous considérons g € LP(Rd) et pe Z(R4). Nous avons la majoration 


19 + On — 9» < 19 * Pn —  * Pnlp + | * Pn — Plp + 1 — Il» (29.55) 
En ce qui concerne le premier terme ; 


1(g — d) * Pnllp < 19 — Pl» (29.56) 


par la proposition 27.60. Donc 
EQooXWZYooVt 
19 + pn — gly < 219 — de + 1 + Pa — dl. EST) 


Par la densité de Z dans L? (théorème 27.50(5)) nous pouvons considérer une suite ®; L, ; dans 
D(R1). L'inégalité (29.57) est valable pour chaque à : 


19 * Pn — 9|p < 219 — Bip + Â Di * Pn — Dillp- (29.58) 


Nous effectuons la limite sur n — © : 


lim [lg * Pa — 9ln < 219 — il + Tim [bi + pn — dl (29.59) 
———_—  —] 
=0 


parce que le point (1) s’applique à @;. Nous effectuons ensuite la limite sur à — © dans 


lim [lg * pn — gl < 2lg — dil — 0. (29.60) 


3. Théorème de Heine 12.79. 
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29.3 Transformée de Fourier dans l’espace de Schwartz 


La définition de la transformée de Fourier de y € .7(R1) est 


p( = J p(z)e "fax. (29.61) 
Si « est un multiindice de taille m, nous notons 


(False TUE) (29.62) 
LemQPVQjCx 
Lemme 29.19 (Lemme de transfert). 
Sive.S(R‘) et si a est un multindice, alors 


2 = (-lMe. (29.63) 
et ne 
GRp(E) = (—) ll G(E). (29.64) 


Démonstration. Nous considérons la fonction A(x,£) = (x)e-#? * £ dont la dérivée par rapport à 


é; est donnée par —i(M;p)(x)e* ‘ £. Cette fonction est majorée en norme par 
G(&) = Miy(a), (29.65) 


qui est encore une fonction à décroissance rapide et donc parfaitement intégrable sur R%. Le 
théorème 17.19 nous dit donc que la dérivée de @ par rapport à &; existe et vaut 


dE  — 
3e © L if zjp(r)e = —iMjp(é). (29.66) 


En appliquant ce résultat en chaine, nous trouvons la première formule annoncée. 
Nous passons à la seconde formule annoncée. Etant donné que 4 € .S, ses dérivées le sont aussi 
et par conséquent, il n’y a pas de problèmes pour écrire 


EP) - [ PP (rjete Er. Es 


d ÔTk 


Étant donné que 


D (toe re 9 = Line EL igptae t"# Eh 


Ok OTk 


notre tâche sera de prouver que 
© Le EqVGyY 
[. Er (etat *} dx = 0. L 900) 


Autrement dit, nous voulons montrer que le terme au bord d’une intégration par partie s’annule. 
D'abord le fait que w soit à décroissance rapide nous assure que l'intégrale (29.69) converge. Pour 
chaque é, la fonction 


fe,9 = (etes) (29.70) 


0Tk 


est intégrable par rapport à x. De plus, f est dans .Z(R) pour chacune de ses variables (les autres 
étant fixées). Le théorème de Fubini 14.297 nous permet alors de décomposer l'intégrale en 


J fa Ode = | | Jr tale dm (29.71) 
Rd R R 
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De plus nous pouvons intégrer dans l’ordre de notre choix et nous choisissons évidemment d’intégrer 
d’abord par rapport à x4. Etudions donc l'intégrale 


Ô xs) * à EF 
— x)e dx = lim — ( x)e "*) dx 29.72 
Lx (e00 ju [2 (#0 (29.72) 
dans laquelle nous avons un peu allégé les notations. Une primitive de ce qui est intégré est toute 
trouvée : c'est w(x)eŸ"%, et nous pouvons utiliser le théorème fondamental du calcul intégral pour 
écrire que 


[ COR = Lotae-e]"* : (29.73) 


_A z=—A 


Vu que G est dans .Ÿ, la limite À — © donne zéro. 
En substituant maintenant (29.68) dans (29.67) et en tenant compte du terme que nous venons 
de montrer s’annuler, nous avons 


p(€) = —i£g [. pre TE = ie, p(#). (29.74) 


En recommençant la procédure |a| fois nous trouvons la seconde formule annoncée. 
PropKPsjyzT 
Proposition 29.20 ([150]). 
À propos de transformée de Fourier dans l’espace de Schwartz. 
(1) L'espace de Schwartz est stable par transformée de Fourier, c'est-à-dire que F(S(R‘)) = 
Ai ES 
(2) L'application F: .S(R°) — .7(RŸ) est continue. 


Démonstration. La linéarité découle de celle de l'intégrale. La difficulté est de prouver que pour 


we .S(RŸ) nous avons bien que $ € .7(RŸ) et que cette association est continue. 


(1) Première inclusion : F(.7(R1)) c.7(IR*) Nous devons prouver que pour tout multiin- 


dices à et 5, nous avons pa,g(@) < 00. Nous avons 
EPDp(E) = (D) Map(e) = (5) EM (E). (29.75) 


Ensuite nous nous souvenons que | fl < |fl1 parce que 


LÂ(E) | [fier "# - | [f(æ)ldx = | fl. (29.76) 
R4 R4 
Donc 
Pa, B(®) = | Magplo < | Mal. (29.77) 


Du fait que ç soit dans ., la dernière expression est finie. Cela prouve déjà que 
F(7(R) c .F(R1. (29.78) 


(2) Continuité 


: | S x on A 

Nous supposons avoir une suite @, — 4, et nous devons PE que n — . Pour alléger 
: su sSGsGGi 

les notations, nous posons fn = @n — w. Nous avons | 


\Â GB — I EF0® Flo (29.79a) 
_ | Ma flo lemme 29.19. (29.79b) 
< |9Mafl (29.79c) 


4. Définition 27.218, avec rappel que pas(p) = [x + x (0%@)(æ)|lco. 
5. Nous verrons, avec la formule d’inversion dans la proposition 29.26 que c’est même une bijection. 
6. Pour rappel, en dimension infinie, il n’est pas garanti qu’une application linéaire soit continue. 
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La convergence f} 7, 0 nous dit entre autres que M, fn # 0; en particulier la proposi- 


1 
tion 27.226 nous dit que 00M, fn 2 0, ce qui signifie, par les majorations (29.79) que 


A 


8 < 18 Mafnl1 — 0, (29.80) 


ce qui prouve la continuité de transformée de Fourier dans .7(R°). 


(3) Bijection Une preuve peut être trouvée dans [683]. 


PROPooMVQMooGYAZzSX 
Proposition 29.21 ([1]). 
Soit yE S(R" x R"') et la transformée de Fourier partielle 


o(x, k) = J e M (x, y)dy. (29.81) 


Alors ÿe.S(R" x R”?). 


Démonstration. Il s’agit de reprendre les étapes de la partie correspondante de la preuve de la 
proposition 29.20. Soient des multiindices à, «/, B et B” où a et B se réfèrent à la variable x tandis 
que a” et B’ se réfèrent à la variable k. 

Vu que la multiplication par k°' commute avec 4* nous avons 


BR 00% (x, k) = 2e 0) lMoro(x, k) = (DH lx 800 O8 Morp(x, k). (29.82) 
D'autre part nous avons 0°G — op parce que la fonction ©,4 étant Schwartz, la fonction 


G(y) = sup |(0:9)(x, y)| (29.83) 


zeR" 


est dans L!(R’”?) par le corolaire 27.222. Par conséquent le théorème 17.19 permet de permuter la 
dérivée et l’intégrale dans 


Q = _ 0 —iky 
an PU, k) 5 [. e ""Vo(x, y)dy. (29.84) 


Dans le même ordre d’esprit des difficultés de permutation de limites nous avons M3G = Mg. 
D'autre part nous avons encore ||, < © parce que 


Bebe [ letenidu <sup | letenlar < [lanta <e (20.5 


parce que & est Schwartz et le corolaire 27.222 donne l’intégrabilité. 
Donc nous avons  _ 
P(aa’),(88)(P) = | Ma Mp0%plo < 00. (29.86) 


Cela prouve que G est Schwartz. 


29.3.1 Quelques transformées de Fourier 


LEMooPAAJooCsoÿAJ 
Lemme 29.22 (Transformée de Fourier de la Gaussienne [684]). 
La transformée de Fourier de 
g:R°—R 
. (29.87) 
x elel 
est donnée par 
se =(T) ex (29.88) 
€ 


Démonstration. Nous commençons par la fonction g(x) = e-l*l°/2 et nous prouvons que sa trans- 
formée de Fourier est ÿ(£) = (2r)Ÿ?g(£). 
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(1) Réduction à la dimension 1 La fonction g est dans l’espace de Schwartz. Par le théorème 
de Fubini, 


d d d 
90 = [ TTe te ar = JT f e-#e-srat = TT HAS 
R°& k=1ŸR k=1 


=1 


où f est la fonction d’une variable 
Fo 22/2 FQooFKSPooRglgnrt 


Notons que f € Z(R). 


(2) Une équation différentielle 


Voyons l’équation différentielle satisfaite par la transformée de Fourier “à de la fonction 
(29.90). Grâce au lemme 29.19 nous trouvons l'équation différentielle 


A 


Ef(E) + (P)'(9 = 0. (29.91) 


C’est le moment d’utiliser le théorème de Cauchy-Lipschitz (17.42) appli ué à la fonction 
à à à : k UBEQSooWZZKooNEKnME 
(ty) = —ty qui est Lipschitz et continue au problème F 


y +ty=0 (29.92a) 
y(0) = yo (29.92b) 


: : . : 2 , 
possède une unique solution maximale, en l’occurrence y(x) = yoe * /2, En ce qui concerne 
la condition initiale nous avons 


f(0) = | e%"/24x = V2r. (29.93) 
R 
par l’exemple 14.300. Donc 
Î(E) = Vore Ÿ/2. (29.94) 


En reformant le produit (29.89) nous concluons. 


Nous passons maintenant à la fonction g.. Nous pouvons écrire ge sous la forme 
ge(x) = g(V2ex). (29.95) 


Utilisant successivement la transformée de Fourier de g que nous venons de calculer et 29.9 (facteur 
d'échelle) nous trouvons 


9(€) = (27)? 9(€) (29.96a) 
9e(E) = (2e)? 9(£/V2e) (29.96b) 


L us d/2 D lél?/4e , PHBENOOFNEReRGIQEES 


€ 


Nous voyons que ÿ € .7(R) (c'était gagné d'avance par la proposition 29.20). 


LEMooTDWSooSBJXdv 
Lemme 29.28. 
Si getr) = el? alors la suite 


LL EQooWQWZooZIY 
Pn — End" 7.4 


est une suite régularisante (définition 29.17). 


7. Une façon alternative, plus directe de déduire cette équation différentielle sera donnée dans l’exemple 29.25. 
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Démonstration. Nous savons déjà la transformée de Fourier de ge par le lemme 29.22. Nous mon- 
trons que la suite p, est régularisante. Nous avons ÿ. € L'(R4) et ÿ. > 0 ainsi que lim. _,9 | B(0,0) D 
0 pour tout @. Il y a seulement un couac avec la norme. Nous calculons na 9-(£)d£ avec la forme 
(29.96c). En utilisant sauvagement Fubini® pour séparer les intégrales et en effectuant le change- 
ment de variable u = t/(24/€) nous calculons : 


—éP Ace J 77 (29.98a) 
€ € .J0à 
l. IT, 


= [[2ve k ec“ du (29.98b) 


k=1 
d 
= [[2vevr (29.98c) 
k=1 
= 2d(re)Ÿ2. (29.984) 


Nous avons utilisé l'exemple 14.300 pour le calcul de l’intégrale gaussienne. Avec tout cela nous 
avons 


J ÿe = (2r)°. (29.99) 


Donc ana din est une suite régularisante. 


Le corolaire suivant regroupe les résultats à propos des suites régularisantes, leur utilité et leur 


existence. 
CORooQLELooUjzToM 


Corolaire 29.24. 
Si la suite réqularisante p, est dans L'(RŸ) A C?°(R) alors pour f € LP(R4) en posant fn = Pn * f 
nous avons 


(1) fn € C(RŸ) n LP(R*) 
L 
(2) fn = f 
De plus, de telles suites existent. 


Démonstration. Le fait que f, soit de classe C® est le corolaire 27.62, et la convergence est la 
proposition 29.18(2). 


De telles suites existent, par exemple celle donnée par le lemme 29.23. 


EXooLMXKooFcAZGR 
Exemple 29.25 ([103]). 
Soit la fonction g(x) = € *. Sa transformée de Fourier a été vue dans le lemme 29.22 en 
utilisant le lemme de transfert 29.19. Nous nous proposons ici de déduire de façon directe l’équation 
différentielle vérifiée par la transformée de Fourier de g. 


— EX 


Nous posons 


I(k) = J e hte ee gr. (29.100) 
R 


et nous considérons la fonction 
2 


f(,z)=e re, (29.101) 
Elle est de classe C1 par rapport à k, et intégrable en x pour chaque k. De plus sa dérivée 


2 


(f)(k,x) = —ire Are (29.102) 


8. Le pauvre! 
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vérifie |. f| < re” æ*, La dérivée est donc majorée (uniformément en k) par une fonction intégrable. 
Le théorème 17.19 permet de permuter la dérivée et l’intégrale : 


I(Ri= J ire re x (29.103a) 
R 
Le 
4 J hi - ee) dx (29.103b) 
R € AT 
no e#) e dx r parti (29.103c) 
re par partie .103c 
+ 
= — ere y (29.103d) 
R 
—k 
D'où l'équation différentielle L'(k) = —£1I(k). A 
29.3.2 Formule d’inversion SR 
[oJe) oone a 
Proposition 29.26 (Formule d’inversion[450, 103]). 
À propos d’inversion de la transformée de Fourier. ITEMooLVOTOOUD JSWt 
(1) Si fe S(R), alors nous avons la formule d’inversion 
1 — 
fa) = >= J ce f(k)dk. FooHTD AO 
R 
ITEMooWINLooJWcDIX 
(2) Nous avons, pour f € F(R), 
1 x 
fl) = 7 U)C-x). (29.105) 
ITEMooCZYMooRvKTfS 
(3) L'application 
F:.S(R) — .7(R) (29.106) 


est une bijection continue. 


(4) Cette formule peut d'écrire de plusieurs autres façons : pour tout f € .7(RŸ) nous avons 


fe) = LFÂ0). EnooWBZTegPqRNen 


2x 


Démonstration. Le fait que la transformée de Fourier sur .7(R‘) prenne ses valeurs dans .7(R‘) 
est déjà prouvé dans 29.20. Nous commençons maintenant la preuve de (1). 
Soit fe .7(R‘). Pour € > 0 nous posons 


LR) = € Feke f(p). (29.108) 
Nous allons calculer 

lim er eikt P(k)dk (29.109) 

E—+ R 


de deux façons ; d’abord avec la convergence dominée, et ensuite avec Fubini. 


(1) Premier calcul : convergence dominée D'abord en utilisant directement le théorème 


de la convergence dominée 14.200. La fonction f est dans .7/(IR) (théorème 29.20) et par 
conséquent f. € L(R) parce que le facteur e-*? ne va certainement pas empêcher de conver- 
ger. De plus |f.| <|f| et f € L!. Le théorème est de la convergence dominée est applicable 


et 
lim er eikt P(k)dk _ J eike (k)dk. 0/60 D) 


e—0 R R 
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(2) Deuxième calcul : Fubini 


Pour le deuxième calcul nous allons faire appel à Fubini° pour la fonction 


u RXR—R 


ag) > FE -De-d pu) (29.111) 


D'abord nous nous assurons que u € L!(R x IR) par le corolaire 14.296, et ensuite nous 
utilisons le théorème de Fubini 14.297 pour manipuler les intégrales (et en particulier les 
permuter). 


(a) ue LI(R x IR) Dans un premier temps nous avons : 


Il J Rene f(1)|dy dk < J ui | J \f(u)ldy]dk < co (29.112) 
R JR R R 


parce que f étant dans .Z(R)), l'intégrale intérieure se réduit à un nombre. Nous savons 
maintenant que u € L'(R x R) grâce au corolaire 14.296. 


(2b) Calcul 
Nous pouvons alors calculer un peu ... 


J ere f(k)dk = J J ere iKU f (a) dy dk (29.113a) 

R R JR 

_ J | [ Gien) ÿ(y)d] dy SUPEROOY IATo pd 595 
R JR 

f(y)[ [ ken eq] dy (29.113c) 

F(u)e(y — x)dy SUBEQooRE MONTE 
R 

_ JT Faye 24e FAO 
E JR 

Lol : he 2e SUBEROOONHGRgN ai 

= NET + 2VEet)e dt ÉLNRES 


= 2vr | f(x + 2Vet)e Ÿ dt (29.113g) 
R 
(29.113h) 


CE - 


Justifications : 
— Pour (29.113b), c'est Fubini 14.297. 


— Pour (29.113d), nous avons reconnu dans le crochet la transformée de Fourier de la 
fonction g:zr+e * 


— Pour (29.113e), nous utilisons la transformée de Fourier de ge donnée dans le lemme 
29:22. 


— Pour (29.113f), nous avons effectué le changement de variables & = (y — x)/(24/€) 
qui donne dt = dy/24/€. 


(3) Second passage à la limite 


Nous avons obtenu l'égalité 
l tee f(k)dk = 2/7 J f(æ+2Vetje at,  FAooUCSTooNqqu 
R R 


et nous voudrions passer à la limite € — 0. Le membre de gauche est déjà fait en (29.110). 


9. Parce qu’il est toujours plus simple de refiler le boulot aux autres que de le faire soi-même. . .pauvre Fubini! 


29.3. 
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Pour le membre de droite, la fonction f étant Schwartz (en particulier bornée), nous pouvons 


effectuer la majoration 
2 


f(x +2Vet}e © < |floe *, (29.115) 


qui est une fonction intégrable de t. Nous avons donc le droit de permuter la limite € — 0 et 
l'intégrale dans le calcul suivant : 


lim [re +2Vet)e " = free dt. (29.116) 


e—0 


Fin 
Nous avons maintenant les limites des deux membres de (29.114). Récrivons : 


lim ehreh P(k)dk = lim 2Vx | f(x + 2Vet)e Ÿ dt, (29.117) 
E—> R E—> R 


À gauche nous avons déjà la limite depuis (29.110), et à droite nous obtenons 
e—0 


lim Ve | fx + 2Vet)e Ÿ dt = 2Vr | (ae at = 2/7 f(x) V7 = 2rf(x) (29.118) 


où nous avons utilisé l'intégrale gaussienne faite dans l’exemple 14.300. 
En remettant tout ensemble, 


2 f (a) = lim L eee f(k)dk = 1h ee f(k)dk, (29.119) 


ce qu'il fallait prouver. 


Le plus gros est fait ; nous avons prouvé 


7 27 


ee [ eike f(k)dk. FRoo NZ tqs 


Pour (2), c’est simplement une reformulation de cela. 
Nous prouvons maintenant (3). 


(1) 


(2) 


La transformée de Fourier est injective Vu qu'elle est linéaire, il suffit de démontrer 
que si F(f) = 0, alors f = 0. Si f = 0, alors la formule (29.120) donne immédiatement f = 0. 
La transformée de Fourier est surjective Soit f € .7(R). Nous devons trouver g € 


(MR) tel que ÿ = f. La formule F(f)(—x) = 27 f(x) nous incite à essayer 


QE) = NS (29.121) 
Calculons F(9) : 

F(g)(E) = [ érg(e)dé (29.122a) 

: - | ee f(_0)dé (29.122b) 

R 27 
— 2 À cite f(s)at (29.122c) 
27 JR 
= F2) (29.122d) 
= f(x). (29.122e) 


Pour la dernière ligne, nous avons utilisé F(f)(—x) = 27 f(x). 
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CORooAZLZooSviTej 
Corolaire 29.27. 
Nous avons la formule 


J J e 4e f{x)dx dk = 2x f(0). ÉQoORKROQ EI RMAS 
R JR 


Démonstration. Poser x = 0 dans l’équation (29.104). 


29.28. 
Les physiciens qui n’ont que rarement peur écrivent souvent la formule (29.123) sous la forme 


J e FE dk = 6(x) (29.124) 
R 


où 6 serait la fonction de Dirac qui vaut zéro partout sauf en z = 0 où elle vaudrait l'infini, mais 


pas n'importe quel infini; juste celui qu’il faut pour que sont intégrale vaille 1. 
LemYYjFZSa 


Lemme 29.29. 
SipeS(R x R’), alors 
do = do (29.125) 


où le chapeau dénote la transformée de Fourier par rapport à la variable dans IR” et non par rapport 
à celle dans R. Le t par contre est la variable dans R. 


Démonstration. Par définition de la transformée de Fourier nous avons 
” Q _. 
(GD)(E,6) = 2] p(t,ze “dx. (29.126) 
R? 


Notre but est de permuter l'intégrale et la dérivée en utilisant le théorème 17.19. [Il nous faut une 
fonction G: IR”? — R qui soit intégrable sur R” et telle que 


olte) < G(x) (29.127) 


ot 


pour tout t € B(to, 6). Étant donné que la fonction @&6 est tout autant Schwartz que d elle-même 
nous pouvons alléger les notations et chercher une fonction G qui convient pour toute fonction 
pE.S(R x R?). Soit la fonction 


G(x) = sup ly(t,x)|. (29.128) 
te B(to,6) 


Pour tout multiindice æ nous avons alors 


sup (x*G(x)|< sup frv(t,x) <M ER. (29.129) 
xeR? (tx)eRxR" 


Grâce à la proposition 27.221, cela signifie que y décrofît plus vite que n’importe quel polynôme ; 
Gest donc intégrable sur R?. 


29.4 Transformée de Fourier sur L?(R‘) 


La théorie des transformées de Fourier est intéressante sur L?(R‘) parce qu’elle y donne une 
isométrie. Nous allons la donner avec des fonctions à valeurs dans C. 


Remarque 29.30. 
Une remarque qui vaut ce qu’elle vaut, mais si u est une classe de fonction pour la relation u — v 
si et seulement si u(x) = v(x) pour presque tout v alors l'intégrale 


à(£) = [. u(x)e "dx (29.130) 


ne dépend pas du choix du représentant. Nous pouvons donc parfaitement parler de transformée 
de Fourier d’une classe de fonctions. 
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29.4.1 Le problème 


Nous avons défini en général la transformée de Fourier d’une fonction f: IR — © par la formule 
Ê ; E PL 
f@ = [ er f(adr RocUPLJopR GG 
R 


tant que cette intégrale existe. 
Il se fait que cette intégrale n'existe pas toujours pour des fonctions dans L?(R). Donc nous 


devons faire mieux pour définir la transformée de Fourier sur L?. 
EXooSWCHooTdHTs1 


Exemple 29.31 ([1]). 
Prenons la fonction 


1 


0 sit <l1 
f(x) = (29.132) 
= sit>l. 


Vu que l'intégrale re dx existe et est finie (proposition 14.277(2)), la fonction f est dans L?(R). 

Cependant l'intégrale (29.131) n’existe pas. Pour nous convaincre de cela, nous pouvons sim- 
plement nous souvenir de la définition d’une intégrale à valeurs dans un espace vectoriel (défini- 
tion 14.190). Nous fixons £ € R et nous posons g(r) = f(x)e'i. 

Bien évidemment, |g(x)| = l sur J1,00[. Donc (,, |g| = co, et la fonction g n’est pas intégrable. 
Fin de l’histoire. 

Nous pouvons toujours essayer de comprendre mieux. Vu que Ve |g| = ©, la proposition 14.191 
nous dit qu’au moins une des intégrales parmi 


Joie J'ai for Jon, (29.133) 
est égale à +00. 


Note qu’en travaillant un peu, on se convainc qu’en réalité, elles divergent toutes les quatre. A 


29.4.2 Extension de L! A 1? vers L? 
THOooJLCDooAÿTvJf 


Théorème 29.32 (Extention de la transformée de Fourier vers L?(R4)[684]). 
Soit f e L'(RŸ) n L?(R4). Alors 
(1) Nous avons F(f) e L? et | f|z2 = (2r)%| F2. 
(2) L'application F: L' n L? — L? peut être étendue en une application F: L?(R1) — L?(R4) 


vérifiant 
Âlze = (27) fz2 (29.134) 


pour tout f € L?(R4). 


Démonstration. Le fait que f € L! implique |F(f)|x < ||f|1 (c'est le lemme 29.12). En particulier, 
|F(f)(8)l? est majoré et l'intégrale 


«| Le dE (29.135) 
Rd 


existe et est finie. 


(1) Découper l'intégrale Dans un premier temps nous développons les intégrales. Dans les 


égalités suivantes, xé est le produit scalaire x : £ dans Ré. 


CE Le ( J : Faeaz) ( [. fev) el dE (29.136a) 


- [. | J HO) Fee Vardy el de. (29.136b) 


RdxRd 
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Nous avons utilisé le théorème de Fubini pour regrouper les intégrales !. Vu que f € L'(R9), 
la fonction (x,y,£) + f(æ)f(y}e- est dans L'(RŸ x RŸ x IR) et le théorème de Fu- 
bini 14.297 avec Q; = R4 x Rd et 2 = IR nous permet de permuter les intégrales pour 
avoir 


; YW F 
CE f(x) f(y) jl gene al dxdy. SU 137) 
RIxR4 Rd 
(2) Discuter de cette gaussienne En posant 
g(x)=e 1/2 (29.138a) 
ge(x) = g(V2ex) = el (29.138b) 


nous avons ge € .7(R4) et le lemme 29.23 nous autorise à écrire 


9(€) = (27) °9(€) (29.139a) 


d/2 
dE) = (©) er lél?/4e (29.139b) 

€ 
Nous voyons que ge € .7(R1) (c'était gagné d’avance par la proposition 29.20) et que ge 
est une fonction paire (encore une fois, c'était gagné d'avance parce que la transformée de 
Fourier d’une fonction paire est paire). 


Tout cela pour dire que l'intégrale entre crochet dans (29.137) est ÿe(y — x) = ÿ.(x — y), et 
donc 


+ - TG) f(y)âe(x — y)dxdy. (29.140) 
RdxRd 


Encore une fois le théorème de Fubini permet de séparer les intégrales et de calculer l’intégrale 
sur y en premier. Vu que f € L! et que ÿe € .7(R1), le produit de convolution f + ge est un 
élément de .7(R4) par la proposition 27.230. Nous avons donc 


&- [. HOMO (29.141) 
Là, nous reconnaissons un produit scalaire dans L?(R4), et donc 
Ê|2 —€ n EQooWIHN 
[ire éd = (PF game. PoNTEN on SA 


Notons que tout a un sens : f e L'(Rd) et f + ÿ € .7(RŸ) & L?(R4). 


(3) Suite régularisante 


Nous prenons la suite régularisante du lemme 29.23 donnée par 


1 


Dn = Gad (29.143) 
(4) Première conclusion Nous reprenons (29.142) 
Le ElMde = fs idea = CAES pu (29.14) 
En prenant la limite n — © nous trouvons 
da, | Fe Ed = GISI (29.145) 


Pour effectuer la limite du membre de gauche nous devons remarquer qu’en posant 


gn(&) = |F(E)le F7, (29.146) 


10. Dans la suite nous allons encore utiliser Fubini quelques fois pour regrouper et dégrouper des intégrales. 
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nous avons une suite décroissante de fonctions (c’est-à-dire que à € fixé, g,(£) est décroissant 
en n). Par ailleurs ces fonctions sont toujours à valeurs dans [0,0] et nous pouvons utiliser 
le théorème de la convergence monotone 14.173 pour permuter la limite et l’intégrale. Au 
final : 


Île = (nf Iz. (29.147) 


2 
En ce qui concerne l'extension, soit f € L2(R4) et une suite (f,) dans L' A L? telle que f, LE, J. 
(1) Existence d’une telle suite Si f € L?(R‘), alors nous pouvons poser 


fn(a) = f(ae- Fr, oo AR 
Par l'inégalité de Hôlder (27.81) nous avons f, € L'(Rd): de plus f, € L?(RŸ) parce que 


2 
pour tout x nous avons |f,(x)| < |f(x)|. Montrons que f, LE, f. Nous avons 


Le fe = [1 — et) Par. (29.149) 


Nous voulons prendre la limite n — 00. Pour ce faire à droite nous remarquons que e-lrl?/n? 
est majoré par 1; ce qui se trouve dans l'intégrale est donc majoré (uniformément en n) 
par |f(x)l?, qui est une fonction L! parce que f est L?. Le théorème de la convergence 
dominée 14.200 nous permet alors de permuter la limite et l'intégrale, ce qui donne 


lim ||, — f|2 = J lim |f(x)(1— en) 2x = 0. (29.150) 
n—> 00 Rd n—>00 


(2) Définition de F: L? — 1? 
La suite (f,) est une suite convergence dans L?, et elle est donc de Cauchy. De plus pour 
chaque n,m nous avons 


Fr = (2x) | fn — fl. (29.151) 
Nous voyons donc que la suite ( F) est également de Cauchy, dans l’espace L?(R) qui est 
complet (lemme 27.84). Nous posons 


f= lim fn. (29.152) 


(3) Indépendance aux choix Nous devons montrer que la définition de f ne dépend pas de 


2 2 
la suite approximant f dans L! A L?. Soient dans deux suites f, f et 9n ee f telles que 
A 2 2 
fa LS F et n > G. Alors 
na — On = 27) fn — nl < 2) fn — F1 + Cr) an — FI — 0. (29.153) 


Par conséquent (f} — ÿn)n est une suite qui converge vers zéro. Par unicité de la limite, 
F = G. 


Remarque 29.33. 
Une autre suite possible, à la place de (29.148), est 


fn(x) = f(&)Licjen- (29.154) 


C'est-à-dire la fonction f limitée à une boule de rayon n autour de 0. 


29.4.3 Une formule de Leibnitz 
PROPooBTXLooFhuYSs 


ii Avertissement /question au lecteur !! 29.34 
Si f et g sont des fonctions comme il faut et si P est un polynôme, je suis quasiment certain que 
nous avons la formule 
P x(fg) = (Pf) x g+ f*+(Pg). (29.155) 
La raison est que, à travers la transformée de Fourier, P est seulement constituée de dérivation. 
Cela est donc une formule de Leibnitz. 
Si vous avez un énoncé exact et une preuve, je suis preneur. 
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Chapitre 30 


Distributions 


Nous donnons ici une partie de la théorie sur les distributions. L'utilisation des distributions 
dans le cadre des équations différentielles est mise dans le chapitre sur les équations différentielles, 


section 32.11. 
PropAAjSURG 


Proposition 30.1 ([685]). 
Soient un ouvert Q de R et une fonction intégrable f : (Q, Bor(Q), À) — C telle que 


Ï Jo =0 (30.1) 
(o 


pour toute fonction ÿ € D(Q). Alors f = 0 presque partout sur (1. 


Démonstration. Nous commençons par prouver que f est nulle sur tout compact de (. Soit un 
compact À de Q. Le lemme d’Urysohn 15.161 nous donne une fonction 0 à support compact qui 
vaut 1 sur K. 

Nous considérons une suite régularisante (9x) de fonctions toujours strictement positives (par 
exemple celle du lemme 29.23). Vu que f0 est à support compact, elle est dans LP(Q) et le corolaire 
29.24 s'applique : 


Pr * (Of) — 0 f. (30.2) 


Mais, x et k étant fixés, nous avons 
Gén» @N)(a) = [ dv(e 980 Ddt MES) 


La fonction 
te (x — t)0(t) (30.4) 
étant à support compact, l'hypothèse à propos de f fait que l'intégrale (30.3) est nulle : 
Pr * (Of) = 0 (30.5) 
pour tout k. En prenant la limite k — co, 


of =0. (30.6) 


Vu que 0(x) = 1 pour tout x € K, nous avons f(x) = 0 pour tout x € K. 
Nous avons démontré que f était nulle sur tout compact de (. 


Nous considérons maintenant une suite exhaustive (K,,) de compacts (lemme 7.291). La fonction 
f est nulle sur chaque K,, et comme Q — LÉ K», la fonction f est nulle sur Q. 
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30.1 Dérivée faible 


30.1.1 Dérivée partielle au sens faible 
DEFo0oIRJQooMVNopl 


Lemme-Définition 30.2. 
Soit f € LP(I) où I est l’intervalle ouvert ]a, b[. Il existe au maximum 


[ fo" = - [sv (30.7) 


pour tout $ € D(I). Lorsqu'une telle fonction existe, nous la nommons dérivée faible de f. 


l'une fonction g telle que 


Démonstration. Soient g, he L? tels que 


Lu=-[ue-- [fe (30.8) 


pour tout ÿ € C?(1). Nous avons alors 


Le-me-0 (30.9) 


Cela implique que g — h = 0 presque partout par la proposition 27.174 °. 


Exemple 30.3 (Dérivée faible de 1Q). 
Vu que À est de mesure nulle dans R, nous avons 


[ 109 -0 (30.10) 
R 


pour tout 6 € Z(R). Pour g = 0 nous avons aussi Fe gy = 0. Donc g = 0 est la dérivée faible de 
la. 

Cela n’est pas étonnant du fait qu’en théorie de l'intégration, les parties de mesure nulle ne 
comptent pas. De ce point de vue, 1Q = 0. D'ailleurs cette égalité est vraie dans L? (les classes et 
tout ça). A 

EXooRVGHooTWOCtF 
Exemple 30.4 (La fonction de Heaveside n’a pas de dérivée faible). 
Nous montrons que la fonction 
H(x) = È . ° (30.11) 
1 six 20 
n’a pas dérivée faible. Nous nommons g une hypothétique fonction vérifiant les conditions pour 
être la dérivée faible de H. 

Soit une fonction w € Z(R), dont le support est contenu dans [0,00{. Sur le support de w, et 

donc aussi de 4’, nous avons H(x) = 1 et donc 


[ p'= -[ ge. (30.12) 


Vu que est à support compact, Ve g! = 0. En effet, si le support de 4 est contenu dans [—- M, M|, 
/ 


alors en utilisant le théorème fondamental de l’analyse 14.263, nous trouvons Îr £ = ss gp = 
E(M) — p(-M) =0-0=0. 
Donc g doit satisfaire 


J g(x)p(x) = 0 (30.13) 
R 


pour tout w € Z(x > 0). La proposition 30.1 nous dit que g = 0 presque partout sur ]0, |. 


1. En réalité, c’est une classe au sens de l’égalité presque partout. 
2. Ou alors par le lemme 27.66 qui est moins général mais tout aussi bien pour ici. 
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Le même raisonnement dit que g = 0 presque partout sur les négatifs. Que g soit maintenant 
nulle ou non en x = 0 ne change pas le fait que g = 0 presque partout sur R. 
Par conséquent, a gg = 0 pour toute ÿ € Z(R). Hélas, nous avons d’autre part 


00 
J H(x)s'(x)dx - | w'(x)dx, (30.14) 
R 0 
qui n’est pas forcément nul. Notons que pour avoir un exemple de qui donne \ Ho Æ 0, il faut 
chercher des fonctions dont le support contient des négatifs et des positifs. 
La fonction H n’a donc pas de dérivée faible. Notons cependant que cela ne présume en rien 
la possibilité d'accepter une dérivée au sens des distributions. PA 


30.5. 
Nous verrons dans la proposition 30.40 que la dérivée de Heaveside au sens des distributions est le 
delta de Dirac. 


Exemple 30.6 (Dérivée faible de la valeur absolue). 
L'exemple de base de fonction continue qui n’est pas dérivable est la valeur absolue f(x) = |x| 
prise en x = 0. Nous allons montrer ici que la fonction 


—1 six <0 


H(x) = (30.15) 


1 si æ > 0 
est la dérivée faible de f. 
Commençons par noter que H peut valoir la valeur qu’on veut en zéro; de toutes façons la 
dérivée faible n’est définie qu’à partie de mesure nulle près. 


Soit y € Z(R) et M > 0 tel que le support de 4 soit contenu dans [—-M, M]. Nous avons d’une 
part 


0 M 
l Ixlw'(x)dx = — Î. xp (x)dx + [ xp (x)dx (30.16a) 
0 | M 
= eut | + [70 (80.16) 
_M 0 


où nous avons utilisé l’intégration par partie de la proposition 20.130 en posant 


WE vd =p (30.17a) 
il U = 4 (30.17b) 
Tout cela pour dire que 
0 M 
J Ixlp'(x)dr = Î p— Î p (30.18) 
M 0 


D'autre part, l'égalité 
0 M 
J H(x)yp(x)dx = -| p + Î p (30.19) 
R _M 0 


est immédiate. 
Nous en déduisons que A est bien la dérivée faible de x + [x|. A 
REMooBGJFooPBkFqm 
Remarque 30.7. 
La dérivée faible ne doit pas être confondue avec la dérivée au sens des distributions qui sera définie 
en 30.38. Nous avons donc trois notions distinctes de dérivation pour une fonction : 


— la dérivée usuelle, 
— la dérivée au sens des distributions, 


— la dérivée faible. 
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La dérivée faible d’une fonction reste une fonction, tandis que la dérivée distributionnelle d’une 
fonction est une distribution. 

Je vous mets en garde contre l’idée que l’existence de l’une impliquerait trop facilement l’exis- 
tence d’une autre. 


30.1.2 Dérivée faible partielle 


La notion de dérivée partielle faible est la même que l’autre. Histoire de nous mettre dans le 
bain, nous écrivons la définition avec les notation du produit scalaire au lieu de l’intégrale. 


DEFooBRFCooPncSCE 
Définition 30.8. 
Si i = 1,...,n, la dérivée faible de v dans la direction e; est l'application notée ô;v définie par 
EQooMRZUoo P 
dos ERA) 


pour tout pe CT (Q). 


Lemme 30.9. 
Si ve L? admet une dérivée faible, alors cette dernière est unique. 


Démonstration. Supposons f,g telles que {g, o) et {f,d) soient tous deux égaux à —{v, 0,0). En 
particulier pour tout 9 € Z(Q) nous avons ((f — g), d) = 0. 
Cela donne f — g = 0 par la proposition 27.174. 


Soit Q un ouvert de Rd. Le but de notre histoire est de définir une distribution comme étant 
un élément de l’espace dual (topologique, voir définition 25.1) de l’espace Z(Q) des fonctions C® à 
support compact dans (. Pour ce faire nous devons voir un peu de topologie sur différents espaces 
de fonctions. Notons que l’espace Z(Q) n’est pas réduit à la fonction nulle comme en témoigne 
l'exemple donné par l'équation (15.561). 


PROPooVZFHooKfSpf0 
Proposition-Définition 30.10. 
Pour chaque K° compact dans ( et chaque entier m, l’application 
pKm: O7) > R EQooZSQU E 
O0 [o1e) 
fe D I flro GO 


lul<m 


est une seminorme. 


Démonstration. Nous devons vérifier les trois conditions de la définition 7.311. Soient f, g € C°(Q). 
Nous avons d’abord px m(f) > 0 parce qu'une norme est toujours positive. Ensuite px m(Af) = 


[\PKm(f) parce que |Af] = [A] f|. Pour la troisième condition, 
prm(f +9)= D 10 + gx (30.22a) 
ul<m 
= D} sup (ICO Fe) + (6*a)(x)|) (30.22b) 
ulem € 
ss» "D (IGO" PC) + IG@#g)()|) (30.22c) 
[em %€ 
< sup |(2 f)(æ)| + sup |(0*g)(x)| (30.224) 
em Tee xeK 
= pKkim(f) + PK,m(9). (30.22e) 


3. Wikipédia cite l'exemple de la fonction de Cantor qui est dérivable presque partout au sens usuel, mais qui n'est 
pas faiblement dérivable. Ecrivez-moi si vous connaissez des théorèmes qui lient les trois notions de dérivée. 
4. En fait c’est une classe au sens de l’égalité presque partout. 
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En particulier, 
pko(f) = sup|f(x)| = |flo,x: (30.23) 
aeK 


30.1.3 Formules de Leibnitz 


Proposition 30.11 ([686]). 
Soient des fonctions f,g:1R — IR” chacune n fois dérivable. Alors nous avons la formule 


(F9) = > () (30.24) 


Démonstration. Nous faisons par récurrence sur n. Le premier pas étant la règle de Leibnitz usuelle 
de la proposition 12.174(3). Nous avons 


Fr) UE D () fn (30.25a) 


PROPooTEACOoKXUXK1 


k=0 
LS (M) yn+1-h (P) PR 4(n-k) (k+1) 
= À fe) 4 À (E) en (80.251) 
k=0 k=0 
n L nm 
=; ( ) SOS) ( ) fÜrti-R (E) (30.250) 
Eu Ne ii Fe 


n n n n nil— Fin 
jte (are (D (rer mt 
ET 


n+l\ mu n +1 _ L n n ne go 
: ) na bu 1)rd ES 1(:) ” a ) fti-N JE cf. justif. 


HORS e 
n+1l 
L ( : ) Fri lem. 3.41. 
k=0 
(30.25f) 
Justifications. 


(1) Pour (30.254). Nous avons séparé le termes k = 0 de la première somme et le terme k = n+1 
de la seconde. 


(2) Pour (30.25e). Quelque cas particuliers de la définition (3.73) : 


G)-Ca)-0- Ci) eus 


DEFooCQPRooFelWeUS 
Définition 30.12. 
Un multiindice pour IR” est un élément de IN”. Sa taille est définie par 
lol = Ÿ a. (30.27) 
i 
Nous disons que B < a lorsque 5; < a; pour tout i. 
Nous définissons sa factorielle par 
nm 
al = [ [(ax!) = a! x... x al. (30.28) 
k=1 


En ce qui concerne les coefficients binomiaux, nous posons 


(:) A Il o EQOoKBUROOKFR nt, 


87  (a—p)8! 
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LEMooOLQTooEHJuBc 
Lemme 30.13 (Formule de Leibnitz[3, 687]). 
Soient des fonctions f,g chacune dérivable p fois sur R. Alors pour tout multiindices® à de taille 
plus petite ou égale à p, nous avons 


(Ja)= } o PO" PQ. (30.30) 


B<a 


Démonstration. Nous faisons une récurrence sur la taille de &. Nous supposons que la formule est 
valable lorsque |a| < k, et nous prouvons la formule avec à = (a1,,a,) avec [al = k +1. 

Soit j tel que à; Æ 0. Nous définissons & par à = aje; + à. 

Si & = 0, alors a contient seulement une composant selon e;. Dans ce cas, le résultat se réduit 
au cas à une dimension de la proposition 30.11. Si & Æ 0, alors les multiindices a;e; et à sont tout 
deux de longueur au maximum &. Il reste à calculer : 


9(fg) = 05% (F9) (30.31a) 
= 0% Y () CHIC) (30.31b) 
B<ä 
= () Se (F)crse ICS REC LE) prop. 30.11. (30.31c) 
B<& 7=0 


Maintenant nous faisons quelque manipulations. Remarquons que dans la somme 6; < à; = 0. 
Donc nous avons égalité des ensembles 


{B tel que B < à} = {B tel que 8 < a, B; = 0}. (30.32) 
Et comme il n’y a pas de composantes j dans 5, la définition 30.29 des coefficients binomiaux 


donne | | 
&\faje;\ __f@+a;e; 


Enfin, pour y voir plus clair nous posons 


OA OC) (30.34) 
Nous pouvons continuer le calcul : 
fé Sr Nil © Bives p(ga-(6+res) 
Of) D à (, * " (PF: F)(0 9) (30.35a) 
<a Y= 
Bj=0 
= D, >,u(B+e;) (30.35b) 
B<a y7=0 
Bj=0 
= Sp) (30.35c) 
ô<a 


ce qu'il fallait. 


30.2 Topologie et convergence sur des espaces de fonctions 


30.2.1 Limite inductive 


Définition 30.14 (limite inductive[230]). 
Soit un espace vectoriel E ainsi que des sous-espaces vectoriels (Ei)ser] tels que E = );-7 Ei. Nous 


DEFooFCLUooSGJIKJ 


supposons avoir les seminormes DO} sur E;. La topologie limite inductive sur E est celle 
définie par l’ensemble des seminormes p sur E telles que p|r, soit continue pour tout 1e I. 


5. Voir -2.1. 
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30.2.2 Les espaces classiques 


30.15. 
Ici, ( est un ouvert de Rd, et K est un compact de R%. Toutes les fonctions sont sur IR à 
valeurs dans C. Nous rappelons que les seminormes px sont définies en 30.10 et que la topologie 
engendrée par une seminorme est définie en 7.327. 

En tant qu’ensemble, Z(Q) est l’ensemble des fonctions de classe C'?© sur R4 et dont le support 
est un compact dans (. L'ensemble Z(K) est l’ensemble des fonctions de classe C® sur R et dont 


le support est un compact dans K. 
DefFGGCooTYgmYf 


Définition 30.16 (Topologie sur C?(Q)). 
Sur C°(Q), la topologie des seminormes pKm de la définition 30.10 où K° parcourt les compacts 
de Q et m parcourt N. 


30.17. 
Pour l’ensemble des fonctions C'? à support compact dans À, la notation devrait être C?(A), et 
non (A). Hélas je ne suis pas consistant dans les notations. 


DEFooJJJYooïrekSp 
Définition 30.18 (Toplogie sur C?(K)). 
Soient un ouvert Q dans R”, ainsi qu’un compact K € Q. Nous notons 
CT(K) = {fe C(Q) tel que supp(f) € K}. (30.36) 
La topologie dessus est celle des seminormes (pK m)meN 
EQooXGINoo 
prm(f) = max 18° fl C7) 


30.19. 
Quelque remarques. 


(1) I n’est dit que les fonctions dans C®°(K) ont un support égal à K. 


2) L'espace C'°(K) est égal à C°(K) parce que si f a un support compact dans K, elle a un 
C 


support compact (un fermé dans un compact est compact). 
LEMooFKWMooSoqgITJ 


Lemme 30.20. 
Si K est compact dans l’ouvert Q dans R”, l’espace C©(K) est métrisable. 


Démonstration. C’est la proposition 7.335 : la topologie sur C(K) est donnée par la famille 
dénombrable de seminormes (30.37). 


DEFooVSCRooLyYBzT 
Définition 30.21 (Bonne seminorme, topologie sur C?(Q)). 
Soit un ouvert Q dans R". Une seminorme® p sur C2 (Q) est bonne si pour tout compact K € A, 
la restriction Ploo(k) est continue. 
Sur C?(Q), nous considérons la topologie des bonnes seminormes. 


Cela n’est pas très explicite, mais heureusement nous n’aurons souvent pas besoin de plus que 
de la notion de convergence dans Ÿ’(Q). Rappelons que la topologie d’un espace donne la notion 


de convergence par la définition 7.13. 
PROPooRAZSooDttIbK 


Proposition 30.22 ([688, 1]). 
Nous avons 


co(a 
Ok se ® (30.38) 


si et seulement si il existe un compact K € Q tel que 


6. Seminorme, définition 7.311. 
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(1) supp(@x) € K pour tout k. 
(2) supp() € K. 
(3) de ES 6. 


Autrement dit nous avons convergence dans C®(Q) si et seulement si il existe un compact dans 
lequel tout se passe y compris la convergence. 


Démonstration. En deux parties. 


Sens direct, =. 


Ce (Q) 


Nous supposons que x <> . Nous supposons, par l’absurde qu’il n'existe pas de compacts 
K dans Q tel que supp(@x) € K et supp(@) € K. 


(1) Une sous-suite exhaustive 
Soit (K;) une suite exhaustive de compacts pour Q (lemme 7.291). La partie supp() est 
un compact dans Q, et le lemme 7.291(2) dit qu’il existe un n tel que supp(@) € K,. Nous 
considérons une nouvelle suite exhaustive K! = K;,,. Autrement dit, supp(@) € KŸ pour 
tout 1. 
Nous oublions la suite (K;) et nous ne travaillons plus qu'avec (K7) que nous allons écrire 
(K;) en oubliant le prime. 


(2) Les k; 


Par hypothèse d’absurdité, nous avons alors qu’il n’existe aucun à contenant tous les supp(@) : 
pour tout k, il existe k; € N tel que supp(®,) n’est pas inclus dans X;. 


(3) {ki} n’est pas borné Nous prouvons que l’ensemble des X; n’est pas borné. Par l’absurde, 
nous supposons que k; < n pour tout i. Nous posons alors 


A = U supp(x). (30.39) 


k<n 


La partie À est un compact en tant que union finie de compacts /. Elle est donc contenue 
dans X, pour un certain s € N. De plus supp(@x,) € À pour tout à. Nous avons donc, pour 
tout 2 : 

supp(hr,) c AC Ki. (30.40) 


En posant i = s, nous trouvons que supp(@x.) € K, ce qui est faux. Nous en déduisons que 


(ki)ien n’est pas bornée*. 


(4) Sous-suite des 4 


Vu que (k;) est non bornée, nous pouvons en extraire une sous-suite (k!);en telle que k! — 00. 
Nous considérons alors la sous-suite des x donnée par 


Di = Pr. (30.41) 


Et nous oublions immédiatement la suite initiale ainsi que le tilde. Donc pour tout 5, nous 
avons 


supp(@:) & Ki. (30.42) 
Pour tout n, il existe x, € K, tel que ph(tn) # 0. 


(5) Une nouvelle seminorme 


Si f € C(Q), nous avons supp(f) € K, pour un certain r. Sin > r, nous avons K, € K, 
et Zn € Kn, donc x, € K,. Bref, nous avons alors f(x,) = 0 pour tout n > r. 


7. Lemme 7.93. 
8. À mon avis, et à l'avis de [688], il y a moyen d'adapter pour prouver que non seulement (k;) est non bornée, mais 
en plus k; — 0. Prouver cela permettrait d'éviter la sous-suite ci-dessous. Ecrivez-moi si vous savez prouver que k; — 00. 
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Tout cela pour dire que f(x,) Æ 0 pour seulement un nombre fini de n. Il nous est donc 
loisible de poser 


p: Ce (A) —R 
1 (30.43) 
Fm TN arr ll 


Il s’agit bien d’un max parce qu’il n’y à qu’un nombre fini de termes non nuls. Vérifions que 
c’est une seminorme en vérifiant les conditions de la définition 7.311. 


(5a) En tant que maximum de choses dans des valeurs absolues, nous avons p(f) > 0. 


(5b) SileR, 

PAP) = max] (AP) )| = IAmax |... | = IND(N. (80.44) 
(5c) Nous avons 
p(f + g) = max UE) + g(xn))| (30.45a) 
1 1 

ax [| en) + fn) |] (3045b) 
< max |...|+max|...| (30.45c) 
= p(f) + g(f). (30.454) 


Donc oui, p est une seminorme. 


(6) p est une bonne seminorme Soit un compact X. Nous devons prouver que pl on est 
S00TBSDooEx1zP( 
continue. Soit N € N tel que x, € K pour tout n > N.Si f e C?(K), nous avons sé Édsoo Pr 


p(f) = max| (en) (30.46a) 
— max a) = sn) (30.46b) 

- max | nn fl (30.46c) 

= lens a 3! (30.46d) 

= cK|f|x: (30.46e) 


où cx est une ue qui dépend de K. 


Supposons que fx —> ea 
p(fx) — 0. Nous avons 


)f. Pour prouver la continuité de p, nous devons prouver que p(f) — 


lb(P) — p(fr)l < p(f — fx) lem. 7.313 (30.47a) 
< cfe— fx eq. (30.46). (30.47b) 


La définition 30.18 donne la topologie sur C?(X) par les seminormes 


PKm(f — fx) = sup [OF — fk)|x. (30.48) 


[a|<m 


La proposition 7.329 nous dit que pK m(f — fx) — 0 pour tout m. En particulier pour m = 0 
nous avons px;o(f — fx) = | f — fklk — 0. 
Au final nous avons 


(PCF) — p(fx)l < cKk|f — xx — 0, (30.49) 


et donc la continuité de p en f. 
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(7) La contradiction 


Nous avons prouvé que p était une bonne seminorme. Nous devrions donc avoir p(px—@) — 0. 


Vérifions ça … Nous avons 
x — à) = max| TE (d(a) — dan))| (80.50) 

= a 

> (mo) (30.50c) 

= (30.504) 


Justification. Pour (30.50b). Nous avons fait plein de choix pour avoir @(x,) = 0 pour tout 
n. 


Cela contredit la possibilité d’avoir p(ôx — D) — 0. 

(8) Précision 
Nous avons trouvé une sous-suite non convergente des @% originaux. Donc les dx de départ 
ne convergent pas. 


(9) Première conclusion 


Nous avons prouvé par l’absurde qu’il existe un compact K € Q tel que supp(o) € K et 
a c K pour tout k. 
CE(K) 


(or 
(10) dx ec 4 Nous devons encore prouver que dx “+ @. Par la proposition 7.329, nous 
devons prouver que q(dx — D) — 0 pour toutes les seminormes px» de la définition 30.18. 


. C2(Q 
Par hypothèse nous avons @4 eQ et donc convergence p(dx — d) — 0 pour toute bonne 


seminorme sur (. Oh, mais justement pour tout m, l’application px est continue, et donc 
est une bonne seminorme. Nous avons donc bien 


PK:m(Ÿk — ®) — 0. (30.51) 


Sens réciproque, =. 
Nous supposons qu'il existe un compact K € tel que 

(1) supp(@x) € K pour tout k, 

(2) supp(é) € K, 

(3) de ES 6, 


Cr(A à ; 
et nous devons prouver que LT) ®, c’est à dire que g(x — D) — 0 pour toute bonne seminorme 
q sur (1. 
Soit une bonne seminorme q sur (. En particulier, sa restriction à C°(K) est continue. Par 


. CE(K 5... S 
hypothèse, dx e GO) ®; par continuité de q, nous avons q(@x) — q(@). 


THOooDFNAooPnDSNN 
Théorème 30.23 ([688]). 
Soit T, une application linéaire sur C2(Q), c’est à dire T e L(C2(Q),C). Elle est continue si et 
seulement si pour tout compact K € Q, il existe c > 0 etne N tels que 


IT()| < ce 12" px. (30.52) 


pour tout pe C(K). 
Démonstration. En deux parties 


Sens direct, =. 
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Nous supposons que T est continue sur C?(Q). Nous utilisons le corolaire 7.339 qui dit qu’il 
existe une seminorme p (parmi celles qui définissent la topologie de C?(Q), c’est à dire une bonne 
seminorme) et M > 0 tels que 


IT(@)| < Mp(d) (30.53) 


pour tout o € C?(Q). Soit un compact K. Étant donné que p est bonne, elle est continue sur 
CE(K) ; nous pouvons donc appliquer le théorème 7.337 à la seminorme continue q = plox(x). Il 
existe une seminorme de C?(K) (c’est à dire un pxm) et c > 0 tels que q(d) < cpkm(). 

Pour tout ® € C?(K) nous avons donc 


IT(@)| < Mp(d) (30.54a) 
= Mq() (30.54b) 
< McpKkm($) (30.54c) 
<Me (30.544) 


Mc max |0°" |. 
al<m 


La constante recherchée est donc Mc. 


Sens réciproque, =. 


Soit une application linéaire T sur C?(Q). Nous supposons que pour tout compact K, il existe 
cx > 0et nx tels que [T(@)| < cx maxkaenx 10° D|K. 
Soit une suite exhaustive de compacts (X;) dans (. Nous avons des c; et n; tels que 


IT) < ci max 10%é1k, Foro TES 


al 


pour tout 1. 
Pour chaque à nous considérons 6; € CY(K;) tel que @; = 1 sur K;_1. Cela existe par le lemme 
d’Urysohn * parce que X;_1 est inclus dans l’ouvert Int(K;). 


(1) Les fonctions 6; et W; Le lemme d’Urysohn !?, appliqué à K;_1 inclus dans l’ouvert Int(K;) 
nous permet de considérer des fonctions @; vérifiant : 


(la) supp(di) € Int(K;) 

bi e< 1 

(lé) dt sur Kr. 

Nous posons aussi do = 0 et di; = ®; — p;_1. 


(2) D, Yn(x) = 1 Soit x € (. Soit io = min{i € NN tel que x € K;}. Nous n'avons pas de 
garanties sur la valeur de #;,(x). Par contre, si à < io, alors supp(@;) € K; et par minimalité 
de io, nous avons @;(x) = 0. 


Si par contre à > io, alors x € K;_1, mais nous savons que @; = 1) sur K5_1. Donc pour à > to 
nous avons d;(x) = 1. 
Nous avons donc : 


(2a) Vis-k(r) = Pio-k(x) — Pio-k-1(x) = 0 — 0 = 0. 
(2b) vi(r) = pi(x) — Pio-1(t) = Pix) — 0 = bi(x) 
(2c) Vio+1(t) = Pio+1(t) — Pio(x) = 1 — Pi (x) 

(2d) Vio+k(T) =l-1=-0sik> 1. 


Tout ça pour dire que ootaoe 
(oJe] 00 
D Dn(x) = Vio(t) + Vis+1(t) = 1. #20) 


Il y a seulement deux termes non nuls dans la somme. 


9. Proposition 27.64. 
10. Proposition 27.64. 
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CFEYooJySTb : 
(3) supp(v;) € K;\K;-2 Dans un DÈ a temps nous prouvons que supp(w;) € K;. Si x est 


hors de X;, alors il est également hors de K;_1. Du coup#;(x) = 0 et @;-1(x) = 0. Nous 
avons alors #;(x) = 0. 


Si par contre x € K;_», alors x € K;_2 € K;_1. Vu que @; = 1 sur K;_1 et p;_1 = 1 sur K;_», 
nous avons Y(æx) = 0. 
(4) Quelques majorations Un peu de calcul. Soit do € C?(Q). Nous avons 


IT(p) = 13 T(pn)| Test lin. et (30.56) 

(30.57) 
< D ,IT(bn)| (30.57b) 
< ) Cn max |0*(pyYn)| hyp. (30.55) (30.57c) 

mi  lal<kn 
a = 
< Xe max X (JO FD, lem. 30.13 
n AS B<a 
(30.574) 
a ne | 
= Zen max X (SO ADI à point (3) (80.370) 
n AS B<a 
a a 
< ) ,Cn max CAP AT ns AT (30.57) 
lal<k B 
n TT B<a 
(5) Une bonne seminorme Nous considérons l’application 
p: C?(Q) —R 
a 30.58 
DT HOUSE 


Pour vérifier que ce p est une seminorme, il suffit de vérifier les conditions de la définition 
7.311, et c’est facile. Pour prouver que c’est une bonne !! seminorme, c’est un peu plus chaud, 
et il nous faudra utiliser le théorème 7.337(2). 

Soit un compact À dans Q, et considérons la restriction p: C?(K) — R. Il existe un no € N 
tel que K € K,,. Pour 4 € C(K), nous avons alors supp(®) € K € Kh,, et donc 


NF bxornkng = 0: (30.59) 
Nous avons donc 
a _ 

po= Ze max D (5 )lo ul, le él (30.60) 

néno+2 ll pe 
< max | Cn Max o 0% Pa 30.60b 
ge leo À cn max XD (3)10 uni (30.60b) 
max |do|x (30.60c) 

1BI<kng+2 

= CPK,kng+2(0) eq. (30.37) (30.604) 


où 
d= ON c max () lo Ep, ||. (30.61) 
lal<kn 5 
n<no+2 B<a 
Par le théorème 7.337(2), nous déduisons que p est continue. 


(6) Conclusion Nous avons montré que |T(@)| < p($) pour une bonne seminorme sur (. Le 
corolaire 7.339 conclut que Test continue. 


11. Bonne seminorme, définition 30.21 
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30.2.3 Espaces de fonctions et topologie inductive 
PROBooQXUDooJwnzpn 


ii Avertissement /question à la lectrice !! 30.24 
Je ne suis pas tout à fait sûr que la proposition suivante 30.25 soit vraie. Il y a peut-être une 


preuve dans [230]. 
PROPooUFJJooCoïdol 


Proposition 30.25. 
La topologie sur Z(Q) est la limite inductive!? des Z(K;) où (K;) est une suite exhaustive de 
compacts dans (2. 


30.2.4 Convergence dans les fonctions test 


LemXXwDjui 
Lemme 30.26 (Convergence dans Z(K)). 
: sa lg .  Z(K) 
Si a est un multiindice et si on —— 4, alors nous avons 
Don TT 0e. (30.62) 
| . ee à | DK) 
Démonstration. Quitte à considérer la suite 4, — w nous pouvons supposer 4, —— 0. Nous avons 
pal < D, 1 nÎlx,00- (30.63) 
u<a 
Vu que le membre de droite tend vers zéro, nous avons 
Lim 10" pallxs — 0, (30.64) 
ce qui revient à dire que 0%, converge uniformément sur K vers 0%. 
LemWEGpemo 


Lemme 30.27. 
Si une fonction f: Z(Q) — R est continue sur chacun des Z(K) pour tout K compact dans Q 
alors est continue sur D(Q). 


Démonstration. Soit 1 ouvert dans R; nous devons trouver un ouvert © dans C®(Q) tel que 
f (D) = %(Q) n O. Vu que f est continue sur chacun des Z(K) avec K compact dans (, pour 
tout tel compact nous avons un ouvert Ox dans Z(K) tel que f-!(1) n Z(K) = Ox. En tant 
qu’union d’ouverts l, l'ensemble 
O = Li) OK (30.65) 
K compact de Q 
est ouvert dans C®°(Q). Si be f-!(I), nous avons 6 € Z(K) pour un certain X compact de A, 
donc f-!(1) c ©. À fortiori nous avons f-1(1) c O n Z(Q). 
Dans l’autre sens, si 4 € O, alors @ est dans un des Ox et donc dans f-!(7). Nous avons donc 
bien f-1(1) = Z(Q) n O. 


ThoXYADBZr 
Théorème 30.28 (Convergence dans %(()[230]). 


D(Q 
Soit (Pn)nen une suite dans D(Q) et y € Z(Q). Nous avons En Le # si et seulement si il existe 


DK 
K compact dans Q tel que on € D(K) pour tout n et on 708) D. 


; ; 2(Q) ; . 
Démonstration. Supposons que w, —— w et qu’il n'existe pas de compacts contenant tous les 
supports des w,. Alors pour tout compact de Q il existe un n tel que le support de w, ne soit pas 
dans X. Nous considérons une suite de compacts (K;) tels que Int(Kh) € Kh41 et Q =), Kn. Une 
telle suite existe par le lemme 7.291. Ensuite nous construisons des sous-suites de la façon suivante. 
D'abord Li = K1 et n1 € NN est choisi de telle sorte que w»n, ait un support non contenu dans Li. 
Ensuite L; est un compact de la suite (K,) choisi plus loin que L;_1 et tel que w,, , € Z(L;). Le 


12. Définition 30.14. 
13. Voir définition 7.1. 
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nombre n; est alors choisi plus grand que n;_1 de telle sorte que n, # Z(L;). Ce faisant, en posant 
Pi = Pn, NOUS avons 
et Int(Ln) € Lny1 et Q =), Ln. Étant donné que (#) et une sous-suite de (4;) nous avons encore 
DA 
pi 2 
Soit à € N. Nous allons utiliser le corolaire 27.155 de la seconde forme géométrique du théorème 


de Hahn-Banach pour séparer les parties {d;} (compact) et Z(L;) (sous-espace vectoriel fermé de 
D(Q)) dans Z(Q). Nous avons f; € Ÿ'(Q) telle que 


fifi) > a (30.67a) 
F(S(E)) =0. (30.67b) 


Nous introduisons la fonction définie sur Z(Q) par 


_ ç ; F6) EqJ À 
PI D RACDIE CAFE) 


Si pe Z(Lz), alors fx(9) = 0 et même f1(d) = 0 pour tout { > k. Donc pour chaque k, la somme 
définissant p est finie sur Z(L;z). Nous en déduisons que p est continue sur chacun des Z(L;) et 
donc sur Z(Q) par le lemme 30.27. 


L'image de la suite convergente @x 2 Y par p doit être bornée parce que p est continue. Mais 
dans la somme (30.68), tous les termes sont positifs et en particulier le terme à = k vaut k, donc 
p(dr) > k, ce qui contredit le fait que l’image de la suite soit bornée. Nous en déduisons donc 
l'existence d’un compact K tel que w, € Z(K) pour tout n. 


DK aa 
Nous devons encore prouver que On 1 Y pour ce choix de K. Vu que on 2 ®, le lemme 7.53 
00 


nous dit que nous avons aussi Gén —> 4%, ce qui signifie que pour tout Æ et m nous avons 


PKim(Pn — #) — 0. (30.69) 


Vo DK 
En particulier pour le K fixé plus haut nous avons pm(4n — w) — 0, c’est-à-dire que w, A) D. 


PropQAEVcTi 
Proposition 30.29. 
Soit un compact K de (1. 


(1) L'espace D(K) est complet. 
(2) L'espace D(K) est métrique. 


Démonstration. Nous allons d’abord montrer que Z(K) est complet. Ensuite nous allons montrer 
que sa topologie peut être donnée par une distance. 


(1) Complet Nous considérons une suite de Cauchy (w,) dans Z(K) au sens de la défini- 
tion 7.250. Soient € > 0 ete N;sik et ! sont assez grands nous avons 


pr — pie Bi(0,e). (30.70) 
En particulier pour à = 0 nous avons l’inégalité 
|px — Pile €; (30.71) 


La suite (An) est donc de Cauchy dans (C(K),|.|x) et y converge donc par complétude, 
proposition 12.369. Il existe donc une fonction $ € C'(K) telle que 


DA (30.72) 


Notre jeu à présent est de prouver que w € Z(K), c’est-à-dire qu’elle est de classe C®. 
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Soit un multiindice à = u1,...,f4n,t. Si k et | sont assez grands nous avons 
10 (x — pr)llo € €, (30.73) 
c’est-à-dire que 
NO vx) — GO") lo < €. (30.74) 
Si nous notons x = 044, cela signifie que (6;4,) est une suite de Cauchy dans (C(K), ||.|). 
Elle y converge donc et il existe une fonction g; € C(K) telle que 


unif 


Ùn TS . (30.75) 
Dans ce cas le théorème 12.387 nous indique que g; est de classe C”, c’est-à-dire que & € 
cri ( K). 
(2) Métrique 
La proposition 7.336 nous dit que la topologie donnée par l'écart 


si 
d(p1,p2) = sup min{=, px-1(91 — p2)} (30.76) 
k>1 k 


est la même que celle de Z(K). Il reste à montrer que cette formule est bien une distance au 
sens de la définition 7.107. 


(2a) Nous avons bien d(w1,w2) > 0 parce que tous les éléments du supremum et du minimum 
sont positifs. 


(2b) Si d(y1,w2) = 0 alors pour tout # nous devons avoir px_1(41 — 2) = 0; en particulier 
pour k = 1 cela donne @1 = 4». 


(2c) Nous avons 


pri — 2) = px(— (2 — w1)) = pk(y2 — vi) (30.77) 
en utilisant la propriété (1) de la définition 7.311 de seminorme. 


(24) Nous avons 


Pa(çe1 — 2) = pa(gwri — 3 + 3 — 2) < pk(p1 — 3) + px(w3 — 2) (30.78) 


en utilisant la propriété (2) de la définition 7.311. 


Notons que la proposition 7.336 nous dit que Z(K) est complet tout autant pour la topologie 
des seminormes que pour celle de la distance que nous venons de décrire. Ces deux topologies sont 
les mêmes. Étant métrique et complet, l’espace D(Q) et donc de Baire par le théorème 7.351. Ce 
qui est bien avec ces deux topologies identiques c’est qu’on peut utiliser la propriété de Baire même 
en ne parlant que des seminormes. 


30.3 Distributions 


Si ( est un ouvert de R4, alors l’ensemble Z(() est contenu dans C©°(Q). Nous allons com- 
mencer par définir une topologie sur C®°(Q) et ensuite donner à Z(Q) la topologie induite l*. 
DefPZDtWVP 
Définition 30.30 (Distribution). 
Une distribution sur un ouvert Q de RŸ est une forme linéaire continue sur Z(Q) = C?2(Q). 
C’est donc un élément de D'(Q). 


Le théorème suivant donne quelques façons de vérifier qu’une forme linéaire soit continue. En 
particulier il nous dit que pour prouver qu’une forme linéaire est une distribution il suffit de prouver 
la continuité séquentielle. 


14. Définition 7.24. 
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ThoVDDBnVn 

Théorème 30.31 ([230, 689]). 

Soit T une forme linéaire sur C?(Q). Nous avons équivalence entre les points SUD AHSrDooD1eaQD 
(1) T est continue. ITMooMDODooPULDz 
(2) Pour tout compact K € Q, il existe cx > 0 et nx € N tels que 

IT(e)l< ex max |d*v1|x. (30.79) 
lal<nx 
pour tout p € CE (K). ItemSPvoijoii 


(3) Pour tout compact K € Q ü existe mx € N et Cx > 0 tels que pour tout ÿ € C?(K) nous 
ayons 


IT(e)|< Ckprkme(e) = CKk D |loFelx (30.80) 


lul<mx 


voir la définition de la la seminorme donnée en (30.21). 


ITEMooBXFSooYtAXjy 

; | | _ 
(4) T est séquentiellement continue sur C?(Q). ITEMooXZ.JPooYyQQod 
(5) T est séquentiellement continue en 0. RS 


(6) Pour tout compact K € (, la restriction de T à C?(K) est continue. 


Un certain nombre d'ouvrages prennent le point (3) comme la définition d’une distribution. 


Démonstration. En plusieurs parties. 


(1) (1) si et seulement si (2) C’est le théorème 30.23. 


(2) (2) = (3) Notons s le nombre de termes dans la somme [y] < nx. Nous avons 


IT(&)1 < os CAF (30.81a) 
< cs |" olx (30.81b) 
=cx À ( max léplx) (30.81c) 

lalSnr 
lul<nx 
<cx D, ll. (30.814) 
lul<nx 


(3) (3) = (2) Même principe : chaque terme de la somme est majoré par le max. On adapte 
la constante en multipliant par le nombre de termes. 


(Q) 


CP 
(4) (3) = (4) Nous considérons une suite convergente 6x — 


30.22, nous avons un compact X dans Q tel que w4 4) w. Pour un tel compact nous avons 


w. En vertu de la proposition 


IT (x) — T()1 = IT(ex — p)l (30.82) 
< cu max 10°C — v)lx peq. (3)=(2). (30.82b) 
= CKPnx (x — 6) (30.82c) 


OÙ Pnx est une des seminormes (30.37) définissant la topologie sur C?(K). Par la propositon 
7.329, nous avons alors p», (4x — 4) — 0. 


(5) (4)= (5) À fortiori. 
(6) (5)}= (6) Soit un compact X dans Q(. Nous faisons plusieurs étapes. 
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(6a) Tlox(x) est séquentiellement continue Soient 4 et dans CE (K) tels que vx ES 


SA CE (A : : : 
w. Par la proposition 30.22, nous avons 4 RQ w. Par hypothèse sur la séquentielle 


continuité de T !? nous avons alors 


T(vx) — T(v), (30.83) 


ce qui prouve que la restriction de T à C?(K) est séquentiellement continue. 
(6b) Topologie sur C?(K) Elle est métrisable par le lemme 30.20. 
(6c) Conclusion Vu que C?(K) est métrisable, la proposition 7.245 dit que continuité 


séquentielle y est équivalente à la continuité. L'application T' étant séquentiellement 
continue, elle est continue. 


(7) (6)= (1) C'est le lemme 30.27. 


DefASmjVaT 
Définition 30.32 (Topologie sur Z'(Q)). 
Nous munissons l’espace D'(Q) de la topologie +x-faible, c’est-à-dire celle de la famille de semi- 
normes 
Poe: D'(Q)—R 


T = IT() (30.84) 


avec p € D(Q). 


Oui, c’est bien une famille de seminormes indicée par l’ensemble Z(Q). Il n’y en a donc à priori 


pas du tout une quantité dénombrable. 
PropEUIsNhD 


Proposition 30.33 (Convergence au sens des distributions). 


Nous avons Th PO T si et seulement si Tn(e) — T(@) pour tout y € Z(Q). 


Démonstration. La convergence T}, A T signifie que l’on ait p,(Th —T) — 0 pour tout y e Z(Q), 
ce qui en retour signifie que 
[Ta — T)(g)| — 0. (30.85) 


Cette proposition suppose que l’on ait une distribution T qui vérifie T,(@) — T() et conclut 
qu'on a une convergence dans les distributions. Le théorème suivant est plus fort : il va seulement 
supposer que 7, (4) converge dans € et va conclure que T': @ + lim», 1h (4) est une distribution. 


Définition 30.34. 
Si f est une fonction sur R telle que fw € L'(RŸ) pour tout ç@ € D(R*), alors nous définissons 
la distribution Te D'(RŸ) par 


CTr,@p) = [. f(x)v(x)dz. (30.86) 


Théorème 30.35 ([690]). 
Soit (Th) une suite dans D'(Q) et nous supposons que pour tout $ € D(Q) la suite (Th(p)) converge 


dans ©. Alors il existe T € D'(Q) telle que Th 20% 
PROPooYAJSooMSwVOm 
Proposition 30.36. 
L'application | 
: ! 
i: L(Q) — g'(Q) (30.87) 
DATE 


est une injection continue. 


15. L'hypothèse est juste en 0, mais comme Test linéaire, elle est séquentiellement continue partout. 
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Démonstration. Le fait que ce soit une injection est le fait que si T; = T, alors pour tout o e Z(Q) 
nous avons € f — g,d) = 0, et cela implique que f — g est nulle presque partout en tant que fonction 
et est simplement nulle en tant que classe de fonction dans L?. 


2 
En ce qui concerne la continuité, il suffit de la prouver en zéro (par linéarité). Soit donc fn 5 


p'(A 14 5... Je : 
et montrons que T#, A To. Pour prouver cela, la proposition 30.33 nous indique qu’il est suffisant 


de tester 7,(9) — 0 pour tout € Z(Q). 
Notons que si De % a fortiori  e L?. Nous avons 


Ti, (®) = L In < |fndl13 < | fnl2léle — 0 (30.88) 


où nous avons utilisé l'inégalité de Hôlder de la proposition 27.33. [1 


Cette proposition permet de donner un sens à des phrases du type « Soit une distribution T'. 
SiT e L?, alors ... ». Cela signifie qu'il existe u € L? tel que T = T,,. Notons que dans ce cas, la 
distribution est définie sur L? et non seulement sur 2. 


30.3.1 Multiplication d’une distribution par une fonction 
DefZVRNooDXAoTU 


Définition 30.37. 
SiTe D'(Q) et si f € C?(Q) nous définissons la distribution fT par 


(TY(e) = Te). Def TRES, 


Souvent écrit sous la forme plus compacte fu, do) = <u, fo). 


Cela à un sens parce que si w € Z(Q) alors fy est aussi dans Z(Q). 
Cette définition est motivée par ce que l’on ferait pour une distribution à densité. Si Test une 
distribution de densité notée également T', nous avons T(4) = [T(x)p(x) et donc 


(T)(@) = J (Tax) = J T(x)f(x)6(x) = J T(x)(fé)(x) = T(fd). (30.90) 


En ce qui concerne les distributions tempérées, nous pouvons définir le produit avec une fonction 
fE.S(Q) par la même formule : si f,w € 7(Q) alors le produit f est encore Schwartz. Notons 
toutefois que nous ne pouvons pas définir fT dans .7/(Q) si f est seulement dans C?°(Q). 


30.3.2 Dérivée de distribution 
PropKJLrfsx 


Proposition-Définition 30.38. 
Soit T une distribution sur et à € N4. Alors la formule 


(GT)(p) = (-DRIT(E) (30.91) 


définit une distribution O°T. 
Cette distribution OT sera la dérivée distributionnelle de T. Notons que le même résultat 
est encore valide pour des distributions tempérées, et la démonstration est la même. 


Démonstration. La forme linéaire O°T sera continue si elle est séquentiellement continue par le 


pe nie : 2(Q D 
théorème 30.31. Nous considérons donc une suite wn 2e, © et nous vérifions que 


Jin (O®T)(n) = (O°T)(&) (30.92) 
D'abord T étant une distribution (et donc continue) nous pouvons la permuter avec la limite : 


Jim (OT) (on) = im (—-DIT(G en) = (1) AIT (Tim 0%n). (30.93) 
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Notons qu’à gauche la limite est une limite dans R tandis qu’à droite c’est une limite dans Z(Q). 


Ensuite le lemme 30.26 nous dit que l'hypothèse w, ae) Y signifie en particulier que nous avons 
un compact K € Q contenant tous les supports des w, et que 0*%, converge uniformément (sur 
K et donc sur Q) vers 0°. Donc 


im (OT) (on) = (DIT ( dim on) = (-DIIT(0%%) = (@T)(e), (30.94) 


ce qui est la relation demandée. 


Le lemme suivant montre une compatibilité entre la dérivée des distributions, la dérivée faible 


et l'injection de L? dans l’espace des distributions. 
LEMooQRUDooWVjCAV 


Lemme 30.39. 
Soit Q un ouvert bornée de R" et f e L?(Q). Alors nous avons 
Tr) = Tof (30.95) 


où la dérivée à droite est la dérivée faible définie en 30.8. 


Démonstration. En utilisant la définition de la dérivation de distribution, pour tout o € Z nous 
avons 


Tr)p = —Tr(Gp) = —<f, dd) = if, p) = Tiré). (30.96) 


Nous avons utilisé la définition (30.20) de la dérivée faible. 


Nous avons déjà vu dans l’exemple 30.4 que la fonction de Heaveside n’a pas de dérivée faible. 
Nous allons à présent voir que cette fonction a une dérivée au sens des distributions. Intuitivement, 
la fonction de Heaveside a une dérivée nulle partout sauf en x = 0 où sa dérivée serait infinie ; nous 
nous attendons à un delta de Dirac. 


PROPooVUDVooAlwZzB 
Proposition 30.40. 
La dérivée de la fonction de Heaveside 
H:R—R* 
0 six <0 (30.97) 
TT 
1 six>0 


est le delta de Dirac. 


Démonstration. Par définition, la dérivée de H au sens des distributions est la distribution H” qui 
fait 


H'(p) = -(H,) (30.98) 
pour tout élément ÿ € Z(R). Un petit calcul : 

(4,9) = -— | H(t}v'(tidt (30.99a) 

R 

00 
= Î w/(#)dt SUBEQooMRMBo Bt 

0 
__ lim L'(t)dt RO) 

x 0 | 

” — lim (ç(x) : e(0)) SUBEQOoSUAHoNQN gr 
= (0) (30.99e) 


Justifications : 
— Pour (30.99b), c’est que H(t) = 0 pour t € |—, 0. 
— Pour (30.99c), c’est le lemme 14.253. 
— Pour (30.994), c’est le corolaire 14.276. 
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30.3.3 Ordre et support d’une distribution 
DefVILMooBIYer0O 


Définition 30.41 (support d’une distribution[676]). 
Soit T une distribution. Le support de T est le complémentaire de l’union des ouverts © tels que 
T(@) = 0 pour tout $ à support dans ©. 


DefXAHIooFeiRMB 
Définition 30.42. 
Si Test une distribution sur Q, nous disons que T est d’ordre inférieur ou égal à p € N si pour 
tout compact K de Q, il existe Cx € R tel que pour tout 6 € D(K), 


KT,6) < CK Le ax 10° Ilco- (30.100) 


Ici à est un multiindice. 
La distribution Test d’ordre p si elle est d'ordre inférieur ou égal à p mais pas à p — 1. 


Pour la proposition suivante, on peut se remémorer la définition 30.16 de la topologie sur 
C?(Q). 
PROPooSQPHooDPOrqak 
Proposition 30.43 ([691]). 
Restriction entre CT et 3. 


(1) ST eC®(Q), alors la restriction de T à D(Q) est une distribution à support !$ compact. 


(2) SiT est une distribution à support compact alors elle se prolonge de façon unique en une 


forme linéaire continue sur C?(Q). 
PropZLUEooHcVxQ; 


Proposition 30.44 ([230]). 


Une distribution à support compact est d’ordre fini. 
LemYHRDooUdSnnK 


Lemme 30.45 ([370]). 
Soit u € Ÿ'(R) et dE D(R) tels que supp(u) n supp() = @. Alors &u,p) = 0. 


Démonstration. Soit x # supp(u). Alors il existe un voisinage V, de x tel que {u, >) = 0 pour tout 
d € D(Vz). En particulier, si x € supp(@), alors x n’est pas dans le support de u et les ensembles 
{V, tel que x € supp()} recouvrent supp(@). Cependant 6 est à support compact et nous pouvons 


extraire un sous-recouvrement fini de supp(d) : il existe 21,...,x, tels que 
p 
supp(®) € U Ve (30.101) 
i=1 


Nous prenons une partition de l’unité | subordonnée à ce recouvrement. C’est-à-dire des fonctions 
Xi € D(Vr,) telles que pour tout x € supp(@), 


> xi(x) = 1. (30.102) 
i=1 


En particulier nous avons Ÿ,; x:(x)p(x) = d(x), et donc 


Qu, 8) = Qu, D x:19) = D Lu, x16) = 0 (30.103) 


parce que supp(x:0) € Vr.. 


Lemme 30.46 ([370]). 
Si u est une distribution d'ordre fini N sur R, si supp(u) = {xo} et si 


b(xo) =. = EN) (xo) = 0 (30.104) 


alors {u, ®) = 0. 


16. Définition 30.41. 
17. Théorème 27.65. 
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Démonstration. Les fonctions plateaux dont nous avons parlé dans la section 15.14.1 nous per- 
mettent de considérer une fonction x € Z(R) vérifiant 


1 sie BI 
Rd (30.105) 
O0 sifz| > 2 


Ensuite nous posons xA(x) = x(n(x—x0)). Par conséquent x,(x0) = x(0) = 1 et même y,(x0+€) = 
X(E) = 1 tant que € est plus petit que disons ;- pour être sûr. Nous en déduisons que la fonction 
1— YA s’annule sur un voisinage de x9 et que donc x9 n’est pas dans le support de 1 — y,. Donc 


supp(1 — x,) n supp(u) = @ et le lemme 30.45 est utilisable : {u, (1 — x,)) = 0, ou encore : 


Cu, D) = Cu, XnD} (30.106) 
pour tout n. Vu que le but est de prouver que {u, o) = 0, nous allons prouver que 
Qu, Xn D) "+ 0. (30.107) 
Dans ce dessein nous posons 
lfln = sup |f(x)| (30.108) 
x€B(0,2) 
et | 
| fl) = SUP | Flo (30.109) 
1<p 


La distribution u est d'ordre fini N, et nous en écrivons la définition 30.42 en prenant supp(xn®) 
en tant que K : 
(Cu, Xn®)| < Cmax | (xnd) Il: (30.110) 


En remplaçant le maximum par une somme de nel = 0 à k = N, nous majorons. De plus le support 
de Yn étant contenu dans B, = B(x0,2/n) nous ne changeons rien en utilisant |.|, au lieu de |... 
Donc 


Lu xd) < C ù lé (xad)In < C D » CP lexahte té. (30111) 


=0 i—0 
Notons que la seconde inégalité est une inégalité du type || fg| < | f|]gl. En dérivant un petit peu 
nous trouvons que 
(S'xn)(x) = n'(d*x)(n(x — xo)). (30.112) 


Donc là 


1x ln = sup n'|(d'x)(n(x — xo))| = n°! sup |(A'x) (y)| = n°||d xl ÉAFRHTon ra qEn 
2EBn yel[—2.,2] 
Nous pouvons donc remplacer |dx,|\ par n°|0'yloo. 

D'autre part nous voulons majorer |@*-‘@|, par quelque chose ne dépendant ni de k ni de 1. 
Nous faisons le théorème des accroissements finis 11.254 : |d!6|, < 2] 16]. Ce n au dénomi- 
nateur est salutaire parce que nous avions un n° apparu à cause du remplacement (30.113). Nous 
faisons donc à + 1 fois le théorème des accroissements finis : 


| 9 i+1l 
jap. < (2) toto. (80.114) 
Toutes ces majorations donnent 
N Ok Fe | 9 i+1 
mbl<cSS (re 10 xl (?) PTE (30.115) 
k=0 i=0 t =, — n ———, —— 
<|xl(v) <|dl(v+1) 
es 
lulélarne à 2 ()2 (80.115b) 
k=0 i=0 
C' 
= — (30.115c) 
nm 


18. Dans [370], la dernière égalité vient avec une inégalité, et je comprends pas pourquoi. 
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où C’ est une constante qui dépend de x, de ® et de N, mais pas de n. Vu que : — 0 nous avons 
bien 
Cu, PXn) = 0, (30.116) 


ce qu'il fallait démontrer. 


PropXXPLooSkgxOz 
Proposition 30.47 ([370]). 
Soit ue D(R)' avec supp(u) = {xo}. Alors u =  . ai 0x où N est l’ordre de u. 


Démonstration. D'abord il faut préciser que l’ordre de w est fini parce que son support est compact 
(proposition 30.44) ; nous notons N cet ordre. 
Soit de Z(R). Nous considérons x € Z(R) telle que 


1 si B l 
ele (30.117) 
O0 six — xo| > 2. 
Encore une fois, 1 — y s’annule sur un voisinage autour de x0, ce qui fait que 
supp(u) n supp ((1— x)#) = Z, (30.118) 
et donc {u, (1 — x) = 0. Au final, 
u,@) = Cu, XP). (30.119) 
C’est le moment de poser 
ui 
dx) = x(m)[8() — 3, 3,(0°6)(xo)(x — 20)" (30.120) 
k=1 


La fonction Ÿ ayant un support disjoint de celui de u, nous avons aussi {u, > = 0, ce qui donne 
+ 
Cu, 8) = Çu, xd) = (u,x À. 7 (0*6)(x0)(x — 20)". (30.121) 
k=0 


En posant a, = Qu, X(x)(x — x0)"*) nous avons alors 


N 


(a,8) = D ar(@"6)(xo) = (1) ax (0 62) (d). (30.122) 


k=0 k 


30.4 L’espace C°(R, ?'(R‘{)) 


SecTEgDVWO 
D'abord parlons un peu de continuité en recopiant la proposition 7.347 dans notre contexte. 
PropIP1KQBa 
Proposition 30.48. 
: . . } d : : 
Soient I un intervalle ouvert de R et u: I — D'(R*) une fonction continue. Alors ItemYAhnNhBi 
(1) Pour tout ÿ € Z(R°), l'application t — w(y) est continue. 
(2) Pour tout ÿ € D(RŸ), nous avons la limite 
lim u(p) = u(v). (30.123) 
(3) Nous avons la limite dans Z'(R) 
lim us = Up. (30.124) 


t—to 
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En ce qui concerne la définition de l’espace C?(1, Z'(R4)), c’est la définition 7.348. Grâce au 
point (1) de la proposition 30.48, nous retenons que la propriété fondamentale d’une application 
rer (7, D'(Q)) est que pour tout $ € Z(Q), l'application 


I—C 


ts To) (30.125) 


est de classe CÀ. 
PropOTIWzog 


Proposition 30.49. 
Soit I, un intervalle ouvert de R. Soit T e C°(1, 2'(Q)) et y e D(I x Q). Alors l'application 


tr Ti((t,.)) (30.126) 
est continue sur I. 


Démonstration. La fonction dont nous voulons prouver la continuité est une fonction IR — R; il 
est donc loisible de se contenter de la continuité séquentielle. Soient {9 € Z et (t;) une suite dans 7 
convergeant vers to. Nous posons U; = T;, et db; = Dé, ). Par hypothèse de continuité de (T}) nous 


ZA 5 
avons U; AU T4. D'autre part le support de 4 étant compact nous avons supp(#) € [c, d] x K 
où [c,d] € T'et K est compact dans (2. Par conséquent nous avons aussi supp(d;) € K. 
Afin d’alléger les notations notons (x) = Y(to,x). Pour tout multiindice & et pour tout j nous 
avons 


Pa(di — D) = |0"D(,x) — b(to,&)| < [tj — tol ne [GO (E, x)| — 0. (30.127) 
telc, 
zeK 


Nous avons donc la convergence 
DK 
Ÿj 78) to.) (30.128) 


: | g'(Q 2) - . 
Etant donné que U; dt To et Ÿ; Ab, w, le corolaire 27.6(4) nous donne la convergence 


U(d5) © Tio(Ÿ) (30.129) 


Cela est bien la continuité de la fonction # > T}(4(t,.)). 
PropLKtBsVi 

Proposition 30.50 ([690]). 

Soit (T}) e C(1, D'(Q)). Nous définissons l'application T: Z(Q) —+ € par la formule 


T{4) = [r (U(4..)) dt (30.130) 
pour tout 1 € D(I x Q). Alors TE D'(I x Q). 


Démonstration. La proposition 30.49 nous indique que la fonction { + T, UIU )) est continue. 
Étant donné qu’elle est seulement non nulle sur un compact, l'intégrale 


Ï Ti(u(t,.))dt (30.131) 
A 


a un sens et est finie. L'application T': Z(I x Q) —+ C ainsi définie est linéaire. Il reste à voir qu’elle 
est continue. Pour cela nous allons utiliser le théorème 30.31(3) qui nous dit que nous pouvons 
nous fixer un compact [c, d] x K € I x { et considérer ÿ € Z([c, d] x K). 

Soit, pour commencer, donnée une application $ € Z(K). L'application t + T(@) est continue 
et non nulle sur le compact [c, d] et il existe donc C,, > 0 tel que 


Tip) < Ce (30.132) 
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pour tout te [c, d]. 
Nous voulons utiliser le théorème de Banach-Steinhaus dans sa version 27.5 sur la famille 
d'applications paramétrée par u € [c, d] : 


Un: D([c,d] x* K)—R E 


Commençons par prouver que cela est une application continue pour chaque u. Ce sera le cas si la 
projection 
proj: Z([c,d] x K) — Z(K) 


(30.134) 
pr y(u,.) 
est continue. Pour cela nous notons P4 la seminorme sur Z([c, d] x K) donnée par 
Phitd) = D, D sup [a y(t,x)|. (30.135) 


<k <l telc,d] 
n<k |a|< ak 


Nous montrons que proj est séquentiellement continue ; étant donné que les topologies sur Z(K) 
et 2 (fe, d| x K ) sont données par des métriques (proposition 30.29), cela suffit pour assurer la 


de - . .…_. 2(lcdixK) DK) 
continuité grâce à la proposition 7.245. Montrons que si — 0, alors proj(ds) —— 0. 
Pour cela nous remarquons que 
p(proj(u)) = D, suplé*p(u, x) (30.136a) 
la[<j xeK 
< Y sup sup|0"y(#, x)| (30.136b) 
lal<j te[c,d] axeK 
= Po,;(d). (30.136c) 
Par conséquent 
p;(proj(n)) < Po,5(Un) — 0 (30.137) 


où nous avons utilisé la proposition 7.329. Utilisant cette même proposition à l’envers, nous dédui- 


D 
sons que proj(Ÿ») pass 0. Les applications Ü,, sont donc continues ; elles sont également bornées 
parce que si Ÿ € Z (ec. d] x K ) nous avons 


ne [Uau()| = sup Tu (u(u.))|, (30.138) 


et la continuité déjà évoquée, sur le compact [c, d], nous dit que cette quantité est finie. Le théorème 
de Banach-Steinhaus peut maintenant être appliqué et il existe © > 0 et k,1 € IN tels que pour 
tout de Z([c, d] x K), 


[Ua(g)| < CPatd) = C >, D sup [07 Ob(t,x)| < C > sup [0 0%, x)|. (30.139) 


l<kn<i PT lal+n<k+t 7 


Quelques remarques 


— Nous n’avons pas mis de maximum devant le supremum (alors que la conclusion (27.7) en 
demande) parce que dans le cas des seminormes Py, c’est toujours celle avec k et { le plus 
grand possible qui sont les plus grandes parce qu’elles sont des sommes emboitées les unes 
les autres. 


— La fusion de deux sommes est bien une majoration parce qu’il y a plus de termes dans la 
seconde que dans la première. 


— La quantité la plus à droite est (à part le C') ce que nous pouvons noter P+1(4d) : c’est bien 
une des seminormes associées à l’espace de dimension d + 1. 
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Nous majorons maintenant T(4#) par 


d d 
IT (w))| <| ITi((,.))|dt - | JU: (w)|dt < Cld — cd Pru(). (30.140) 


Maintenant le théorème 30.31(3) appliqué à l’ouvert 7 x Q et avec 4% au lieu de 4 nous informe 
que TE (I x K). 


30.4.1 Dérivation 


Quelques propriétés de dérivation des fonctions 1 — %(Q) seront directement énoncées et 
démontrées dans le cas des distributions tempérées. Les résultats 30.85 et 30.86 seront a fortiori 
valables si nous remplaçons .S par Z. 


30.5 Une équation de distribution 


Nous allons étudier l’équation 
EqLLTPooJHUV 
(x — xo)*u = 0 Las 0 ANS) 


pour u € Ÿ'(R) et à € NN est donné fixé. Notons tout de suite que (30.141) est un petit abus 
de notation pour dire qu’en vertu de la définition 30.37 du produit d’une distribution par une 


fonction, pour tout € Z(R), nous avons u(x (x — 10) 0, 


LemWIGKooQpGXoI 
Lemme 30.51 ([370]). 
Soit a E N. Une solution à l’équation 


(x — xp) u = 0 EaKVNEoR its) 


est une distribution à support dans {xo} et d’ordre fini. 


Démonstration. Nous commençons par prouver que u est une solution de (30.142) si et seulement 
sil (u,@} = 0 pour tout € Z telle que 


ro) = … = 8-19 (æ0) = 0. FaYLTPoR AE 


(1) Condition nécéssaire Supposons que « soit une solution. Alors le corolaire 17.31 du 
théorème de Hadamard donne € Z(R)) telle que @(x) = (x — x0)*Y(x). Dans ce cas, si u 
est solution de (30.142), alors 


0 =((æ—x0)"u,ÿ) = Cu, (x — ro)" Y(x)) = Cu, 6). (30.144) 


Nous avons vu que si u est solution, alors {u,) = 0 pour tout @ satisfaisant la condition 
(30.143). 


(2) Condition suffisante Supposons maintenant l'inverse : u est une distribution s’annulant 
sur toute fonction o € Ÿ' satisfaisant (30.143). Nous allons alors prouver que u est une 
solution. Soit donc # € % et calculons 


(x — tou, Ÿ) = Cu, (x — xo)w) = 0 (30.145) 


parce que la fonction (x — xo)Y(x) vérifie la condition (30.143). 


Nous passons maintenant au cœur de la preuve : nous supposons que u est une solution. Si le 
support de @ est contenu dans R\{x0} alors est nulle dans un voisinage de x9 (et donc 46 = 0 
pour tout k) et {u,p) = 0. Autrement dit, pour tout 4 € D(R\{0}) nous avons (u, D) = 0, ce qui 
signifie que supp(u) n (R\{xo}) = & ou encore que supp(u) = {0}. 

Maintenant que u a un support compact, la proposition 30.44 nous indique qu’elle est d’ordre 
fini. 


19. En réalité nous n’aurons besoin que de la condition nécessaire, en particulier pour le théorème 30.52. 
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ThoRDUXo0oQB1LNb 
Théorème 30.52 ([370]). 
Soit a € N et l'équation 


(x — o)*u = 0 FPT 126) 


pour u € Ÿ'(R). Les solutions sont les combinaisons linéaires des dérivées de ôx) jusqu'à la 
a‘exclue. 


Démonstration. D'abord montrons que les 4/6,, sont des solutions. Avec les définition 30.37 et 30.38 


des dérivées de distributions et de leur produits avec des fonctions 2°, 


(x — 20) 0 620 (8) = 820 (o'((æ - 20)°6(x))) (30.147) 


Si à < a alors dans chaque terme de Leïbnitz?!, il y aura un facteur (x — x0), et la prise de 64, 
annulera. Si par contre à > @ alors il y aura le terme 


() 0% ((x — xo)*) 2 (x) = () al(9%@)(xo) (30.148) 


qui est le seul terme contenant (0%%)(x0). Il suffit alors de choisir € Z(R) de sorte que 


(2*@)(xo) = (30.149) 


0 sik£i-a 

1 sk=i-a 
et alors on est certain que le tout n’est pas nul, et donc que (x — x0)*(0'63,) # 0. 
Jusqu'ici nous avons prouvé que 0'6,, est solution si et seulement si 0 < i < a. 
Il faut encore prouver que les solutions sont toutes des combinaisons linéaires de dérivées de 
delta de Dirac centrées en x0. Pour cela nous invoquons d’abord le lemme 30.51 qui nous assure 
que u est d'ordre fini et de support {x0}. Ensuite la proposition 30.47 nous indique que u doit alors 
être une combinaisons linéaire de dérivées de Dirac. 


30.6 Localisation, principe de recollement 

PROPooNCHIooNOPfBt 
Proposition-Définition 30.53 ([239, 1]). 
Soient un ouvert ® de R‘, un ouvert À dans (, et T e D'(Q). Nous définissons 


AAA, (30.150) 
gr T(@) 
où D: A — C est définie par 
o(x) = Lu (30.151) 
0 sinon. 


Alors T|4 € 9'(A). 
Cette distribution T|A est la restriction de T à A. Elle sera aussi souvent notée r A(T). 


Démonstration. Nous allons prouver la séquentielle continuité de T|4. Ce sera suffisant par le 


théorème 30.31(4). Soit donc une suite @» 2@ 0, 


(1) Débroussailler Nous devons prouver que T|4(@») EL 0, c’est-à-dire que 


Tab (30.152) 


20. Comme souvent, dans l'expression suivante, il y a un abus de notation parce que x est une variable muette : 
il faudrait écrire « x + » au début de la grande parenthèse. 
21. Lemme 30.13. 
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(2) Notations La topologie sur Z(A) est celle de la définition 30.21. Fixons un peu de nota- 
tions. Si À est compact dans À et si m € N, nous posons 


Res CPE EQooYZWHopVREn 1) 
fu D létfl. (50.73) 
lul<m 
De même, si K est compact dans ( et si m € IN nous posons 
De CE EQooCNPTopei qAz 
fe Y léflk. (60.14) 
lul<m 
Les familles de seminormes (px m) et (4K,m) ne sont pas indexées par les mêmes ensembles et 


n’ont pas le même domaine. Bien que les formules (30.153) et (30.154) se ressemblent, elles 
n’ont rien à voir l’une avec l’autre. 


(3) La notion de convergence 


D(A : É 
La proposition 30.22 dit que ?? f, 22 0 si et seulement si pKom(fn) — 0 pour tout m pour 


un certain compact 9 contenant tous les supports de fà. 
D(Q) 0 


| D(A) à à 
Nous utilisons le théorème 30.28 dans les deux sens. D’abord, vu que 4» di 0, il existe un 


D(Ko) 
compact X9 tel que D, € Z(K5o) pour tout n et bn —+ 


PKo.m(@n) — 0 nn 


0, c’est-à-dire tel que 


pour tout m € N. 


Le compact A9 vérifie également 9, € Z(Ko) pour tout n, vu que le support de On est le 
même que celui de #,. De plus sur X9 nous avons On = @n, donc 


gKkom(On) = D; 10“ Onlko = D, lake = PKom(n). (30.156) 
lul<m lul<m 
wa ; S A: + (Ko) 
En vertu de (30.155) nous avons donc qKi5m(®n) — 0, c’est-à-dire que 1 —— 0. Donc le 


: 2 à  D(Q 
théorème 30.28 (dans l’autre sens, cette fois) nous indique que 6, 20) 0. 


(5) Conclusion 
Vu que Te Z'(Q), nous avons T(hh) —T, 0. Donc 


T\A(dn) = T(Gn) + 0. (30.157) 


Cela prouve que T|4 € Ÿ'(A) parce que ®, est une suite quelconque tendant vers 0 dans 
D(A). 


LEMooCXIZooAbeMpF 
Lemme 30.54 ([1]). 
Quelques propriétés de la restriction d’une distribution. Nous considérons un ouvert à dans R4 
ainsi qu'un ouvert À € (1. 


(1) L'application de restriction ra: D'(Q) — '(A) est linéaire. 
(2) Si be C(RA) vérifie supp(d) € À, alors 


ITEMooGXSKooYomqpg 


T(®) = rA(T)@. (30.158) 


22. Pour rappel, signifie C©. 
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PROPooDVYNooKquEUl 
Proposition 30.55 (Principe de recollement[239, 1]). 
Soient un ouvert Q de RŸ ainsi que des ouverts {A;};er de R° tels que ll 4=0: 
Pour chaque i € T nous supposons avoir un élément T; € D'(A;) tel que 


rAnA; (Ti) = TA;nA,(T;) (30.159) 
pour tout i,j e I tels que An À; # Q. 
Alors il existe une unique distribution T € D'(Q) telle que rA,(T) = T; pour tout à dans I. 
Démonstration. Nous prouvons l’unicité et l'existence séparément ?. 


(1) Unicité Soient T'et U des distributions qui satisfont à la demande. Nous posons $ = T-U 
et nous allons prouver que $ = 0. Grâce à la linéarité de r4, (lemme 30.54), 


r,(S) = 0 (30.160) 


pour tout ? dans 1. 

Soit € Z(Q); nous notons K = supp(®) € (. Vu que les À; recouvrent Q, ils recouvrent 
K. Il existe dont une partie finie J de Z telle que KX € {J,-, A;. Et si nous prenions une 
partition de l'unité? subordonnée à ces A;? 


je 


Soit {d;}jey une telle partition de l’unité. Vu que le support de @ est borné, le support de 
#9 est également borné. Et comme un support est toujours fermé, l'application #9 est 
dans Z(A,). En utilisant consciencieusement le lemme 30.54(2) nous avons 


58) = SD vrd) = D S(brd) = D (ra S)(Uxd) = 0 (30.161) 
k=1 k k=1 


parce que r4,(8S) = 0. 


(2) Existence, début La preuve de l'existence va se faire en plusieurs étapes. 


(3) Définition de Tx Soit un compact X dans Q. Vu que les À; forment un recouvrement de 
K, il existe une partie finie J dans J telle que K € [J,-, A;. Nous considérons une partition 


jEeJ 
de l'unité {4;};ey sur K subordonnée au recouvrement {A;}jey. 


Nous définissons alors 
TK: D(K) — © 


br DTi(did). 67 
jEJ 
Nous supposons avoir fait, pour chaque compact K de Q, un choix de sous-recouvrement fini 
(c’est-à-dire de partie J) et un choix de partition de l’unité. 


(4) Tx = TK, sur les intersection Soient deux compacts X, M dans Q. Nous prouvons que 
si dE D(K) n DM), alors Tx(d) = Tm(). Nous avons donc en main les objets suivants : 


(K, J, {A;j}jes; {Xihjes) 
(M, L, {Aihez, {gihez). 


(30.163) 


Nous considérons D € Z(K) n Z(M). Vu que {@r}ez est une partition de l’unité sur M et 
que @ a son support contenu dans M, nous avons = Ÿ, 19, et nous pouvons écrire 


To) = YTGué) = SV T(xp1d). Ho E TRE 


jeJ jeJ leL 


23. Ce genre phrase semble ne servir à rien, mais elle sert à éviter qu’en l’environnement description qui suit ne 
soit tout moche. 

24. Théorème 27.65. 

25. Théorème 27.65. 
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Nous savons que supp(x;g16) est dans A; n A, donc 


Ti(xjw1d) = ra, AT) (xjw1d). (30.165) 


Mais l’hypothèse sur les T; est que r4,:4,(1;) = rA,nA, (Ti). Cela nous permet de continuer 
le calcul de (30.164) : 


= D Drana(T)Oued) = DranA(T)(xy16) = D Ti(xseib)  (80.166a) 
jl 


jeJ leL il 


= D Tir > x50) = D Tiwid) = Tu(d). (30.166b) 


lEL jEJ leL 
Bien. 


(5) Ce qu’on pose Si ® € Z(Q), la valeur de Tx(@) ne dépend pas du choix du compact K 
dans ( contenant le support de 6. Nous pouvons donc poser 


T: Z(Q) — C 
pr TK(é) 


où K est un compact quelconque de Q contenant le support de @. 


(30.167) 


(6) T est une distribution Nous devons prouver que T: 3(Q) — © est une distribution, 
c’est-à-dire qu’elle est linéaire et continue. Pour la linéarité nous disons que c’est bon, et 
nous nous concentrons sur la continuité. Pour cela nous allons nous baser sur le critère du 
théorème 30.31(3). 

Soit un compact X dans Q. Nous devons trouver des constantes m et C telles que [T(6)| < 
CPm,Kk(®) pour tout de Z(K). 

Vu que $ € D(K) nous avons T(9) = TKk($) = De Ti(x5d). Étant donné que T; est 
continue sur (A;) et que x; est une fonction de classe C® à support dans A;, en posant 
M; = supp(x;), il existe des constantes m; € N et C; > 0 telles que 


IT;(x59)| < CiPm, M, (xd). (30.168) 
Donc 
T6) < D Cilpn Gb) = DC D (xd), (30.169) 
jEeJ jeJ [a|<m ; 


Nous utilisons la formule de Leibnitz? pour décomposer 0%(x;6) : 


TI<EG X IX (3)e- x ol (30.170a) 


jEJ lal&m;  B<a 


2 Re 6 Jles Pxjla ll (30.170b) 


[al<m; B<a 


Pour chaque j, il y à un nombre fini de multiindices & en jeu, et pour chacun d’entre eux, un 
nombre fini de 5. Donc le coefficient (3) se majore par une constante dépendante de j ; nous 


l'incluons dans C;. De même pour le coefficient 1-8 x; | ; il se majore et s’absorbe dans C;. 
Nous avons donc 
pI<2,C » 2,106: (30.171) 
JET la[£&m; B<a 


Dans ces sommes, chaque nombre de la forme |@@| um, avec |[u] < m; est pris un certain 


nombre de fois. On majore ce « certain nombre ?? » et on l’inclut dans la constante Gé. Cela 
donne 
TN < DCS D lé*élm,. (30.172) 
JEJ  |a[<m; 


26. Lemme 30.13. 
27. Il n’est pas nécessaire de savoir exactement combien, mais si vous y tenez vous pouvez vous embarquer dans 
un petit peu de combinatoire. 
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L'ensemble M = |). , M; est un compact dans Q et bien entendu |@%@| mu, < |0*d| mu. Nous 
avons donc encore plein de majorations : 


TH) < DC D, loola (30.173a) 


je]  lal<m) 


2 cY 5 él 4 SUBEQOOUALT RQ TT HSE 


jEJ [a|<m; 


< ay » lo pla RPÉARORENANAURE) 


ÏeJ lafem 
lal<m 
= C’PmM(®). (30.173) 


Justifications : 
— Pour 30.173b. On définit C = maxjey CŸ. 
— Pour 30.173c. On définit m = maxjey m;. 


— Pour 30.173d. Comme ce qui est dans la somme ne dépend plus de j, nous supprimons 
la somme sur j et nous incluons le nombre de termes de la somme dans le changement 
CC". 

Et maintenant on admire le fait qu’en ayant fait autant de majorations dans tous les sens, 
nous obtenons encore une inégalité qui ait un sens. Bref, nous avons trouvé un compact M, 
un nombre m ainsi qu’une constante C” tels que 


IT()| < C'pum() (30.174) 


pour tout o € Z(K). Notons que M, m et C” dépendent fortement de K, mais pas de d@. 
Cela prouve que T est continue par 30.31(3). 

(7) T répond à la question Il nous reste à prouver que T est bien la distribution recollée, 
c’est-à-dire que r4,(T) = T; pour tout à € I. Le domaine de T; et de r4,(T) est Z(A;). Pour 
être clair, les fonctions dans Z(4;) sont des fonctions définies sur IR, mais dont le support 
est compact dans À;. 

Utilisant la définition de la restriction, pour ® € Z(A;), 


rA(T)6 = T() (30.175) 
Q(x) = U do (30.176) 


Mais vu que de Z(A;) nous avons @ = @ et donc pas de pièges de ce côté. 
Nous posons M = supp(@) et nous avons 
rA(T)(6) = T($) = T($) = Tu(é). (30.177) 


Nous nommons (Z, {ie L) les choix faits pour le compact M dans la construction de Ty. 
Nous avons alors 


Tu(g) = D Ti(ep0). (30.178) 


teL 
Mais le support de w46 est dans À; n À, de telle sorte que l’hypothèse faite sur les T; aux 
intersections donne T(w10) = Ti(w1®), et donc que 


Tu(g) = D Tin) = T(S vid) = Ti(d). (30.179) 
leL leL 


La dernière égalité vient du fait que {wy}#r est une partition de l’unité sur (au moins) 
supp(). 
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30.7 Permuter distributions, dérivées et intégrales 
PROPooCNYTooWCKHpV 
Proposition 30.56 ([239]). 
Soient un ouvert A & R‘, une distribution T € D'(Q) ainsi qu’une fonction D e C?(Q x R”,C) à 
support dans K x R" où K est compact dans (1. 
Alors ITEMooBIVOooHwGg1M 
(1) La fonction 
y T(é(.,y) (30.180) 


est de classe C© sur R?. 


(2) Pour toute liste d'indices à et pour tout yo € R”, nous avons 


(T2 — dy), = Ter (d°9)(x, 20). PRES 


Y=Yo y 


Démonstration. Nous y allons par récurrence sur les dérivations, en commençant par @& = (à). 
Pourvu que le membre de gauche de (30.181) existe, il est donné par 


ITU) ] 2, = in PEL + 160) = TAG: 1) FRooPHsso Et 


Y= Yo +0 t 


Vu que T'est linéaire, nous allons travailler sur 


T (x : (x, yo + te;) — (x, Yo) À EQooXEFAoe}I-HEZx 


t 


(1) Un développement Nous commençons par fixer yo, x et t et écrire un développement de 
Taylor à l’ordre 1 avec reste intégral ? pour la fonction v(y) = @(x,y) autour de y = yo et 
dans la direction À = te; : 


o(x, Yo + te;) ES gr, yo) air +0) (x, yo) cr FE Yo; te;) CR Er: | 


où 
1 
EQoo0WQZo 
r(x, Yo, te) = Î (1 — u)(d?v)yo+ute, (tei) du. PReN 
0 
(2) Écrire proprement le reste Nous allons maintenant dérouler les notations compliquées 
de différentielle seconde de l’expression (30.185). C’est la proposition 12.359 qui nous dit 
comment faire. Le lemme 12.233 est également à utiliser. D’abord 


2y 


2Gepètte) + ute;) = t(62v)(yo + ute;). (30.186) 


(du) yprutes (te;)? _ 


Avec cela, 


r(x, yo, te) = À a — u)(0 0) @)(x, yo + ute;)du. D oo 30 1871 
, y 


Pour rappel, la notation CNP signifie dériver deux fois selon la i*’composante de la variable 
y de @. 

Régularité du reste Si vous avez peur d'étudier la régularité en x du reste à partir de 
l'intégrale (30.187), vous pouvez simplement regarder le développement (30.184) et dire que, 
t et yo sont fixés. Les fonctions 


RS 
Co 
nr 


Te @(x, yo + Lei) (30.188a) 
tr D(x, yo) (30.188b) 
ze (00@)(x, yo) (30.188c) 


28. Donc m = 2 dans la proposition 20.147. 
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sont de classe C'? à support compact dans K. Donc x + r(x,yo,te;) est également C® à 
support dans K. 
Nous allons d’ailleurs tellement fixer y et t que nous allons définir 


s: RC 
1 . (30.189) 
ge 8 | (1 u(2fé)(es vo + utes)du 
0 


et voir s€ Z(K). Nous pouvons donc parler de T(s) sans peurs. 


(4) Beaucoup de majorations Vu que K est un compact dans ( et que T est dans Ÿ'(Q), le 
as a : 
théorème 30.31(3) dit qu il existe des c patates pret Gfsles que |T(s)| < Cpm,Kk(s). Nous 
avons alors les majorations suivantes : 


IT(s)| < CPm,K(s) (30.190a) 
=C Ÿ, sx (30.190b) 
lul<m 
1 
D Î (1 u)(040 6) (x, yo + tue;)du 7 TEE AUS) 
lul<m  *0 
: . SUBEQooDY JCoo 
< D [0-0 Lorende dau 
lu|<m 
Ce Fe SUBEQooULTU 
2. CAP ÉSU-1000) 
ul<m 
SC es lo pl ÉxEGo D SUBEROOQEN TO otE tn 
LH <m ; 


Justifications : 

— Pour (30.190c). Pour évaluer ©/#s, nous utilisons la proposition 17.21 pour permuter 
l'intégrale sur u avec la dérivée sur x. 

— Pour (30.1904). Nous supposons que |t| < 1, de telle sorte que [ut] < 1 et que yo + tue; 
reste dans B(yo, 1). Notez au passage qu’il n’est pas nécessaire de prendre la fermeture : 
c’est juste pour le plaisir de rester sur un compact. 

— Pour (30.190e). Évaluer l'intégrale : fat — u)du = 1/2. 

— Pour (30.190f). Le changement de constante C' — C" intègre le nombre de termes dans 
la somme qui a été remplacée par son maximum et le 1/2. 

(5) La dérivée (enfin) Nous reprenons le calcul de la dérivée laissé en (30.182) et (30.183). 
Nous avons 


> (z (x, yo + tei) — SW) : (in Le 4) (30.191a) 


t t 


s(x) 


_ Es  (0D6)(x, vo) LT (2) ._ (30.191b) 


Le premier terme n’a plus de dépendance en t. La limite t — 0 est donc sans problèmes. 
Pour le second terme, en prenant la majoration de (30.190) nous avons 
LP), € C't max ag]. (30.192) 
PIE CE max 22 91m | 


La limite t — 0 de cela est zéro. 


(6) Conclusion La limite du membre de droite de (30.182) existe et vaut 


T|a > (CÜ6)(x, vo) | (30.193) 
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Nous avons prouvé que 


A) IT (æ + px. y))| = T| > (00) 6)(x, vo)|: (30.194) 


y=yo 
Une récurrence permet de passer de la liste d'indices (1) à une liste générale pour terminer la 
preuve du résultat (30.181). 


Théorème 30.57 (Permuter distribution et intégrale[239]). 
Soit un ouvert Q dans R”. Soient T Ee D'(Q) et be D(Q x R”). Alors 


Lrt@tun)ay=r([ étend. (30.195) 


Démonstration. Nous faisons une récurrence sur la valeur de n en partant de ... 
(1) na =1 Vu que le support de @ est compact dans Q x R, la proposition 7.96 dit qu’il existe 
un compact À dans Q et R > 0 tel que le support de @ soit dans K x B(0,R). 
Nous introduisons plein de fonctions intermédiaires. 
(la) La fonction 0 
Considérons une seconde la fonction 


0:Q—C 
“4 - | (x, z)dz. 
R 


(30.196) 


Son support est dans X. Est-elle de classe C® ? Oui. En effet, la proposition 17.21 dit 
que l’on peut permuter les dérivées partielles et l’intégrale. Donc toutes les dérivées 
partielles de 0 existent (et sont donc continues). Le théorème 12.341 nous indique alors 
que 0 est de classe C?. 


(1b) La fonction £ Le corolaire 15.159 nous permet de considérer £ € 9(B (0, R)) telle que 


J E(x)dz = 1. (30.197) 
R 
(1c) La fonction Y Nous posons alors 
Y:RixR—C 
(30.198) 
(an) + dan) —(o) [ét 2342 
C’est une fonction 4 € Z(Q x R) telle que 
supp(#) c K x B(0,R). (30.199) 
Prouvons que pour tout x € ( nous avons 
R 
Lécods- [ve may 0. (30.200) 


La première égalité est simplement le fait que (x, y) = 0 lorsque y # B(0,R). Pour le 
fait que ce soit nul, 


Léna = [étmnay- | 'eay | étre = 0. (30.201) 
R R R R 
(1d) La fonction o Nous posons enfin 
o:QOxR—-C 
y 
au) [| ut 24e 


Nous avons o € C?(Q x R) et supp(o) € K x B(0,R). 


(30.202) 
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Nous pouvons maintenant entrer dans le dur. 


(la) 


Une première égalité Nous montrons que 


T(a(.,#)) = 1 T(y(., 2))dz. FooPRISOO ETES, 


En voyant les deux côtés de cette égalité à prouver comme des fonctions de y, nous 
allons montrer qu’elles sont dérivables, de même dérivée et égale en y < —R. 


À gauche nous permutons T avec la dérivée par la proposition 30.56 : 
A(T(o(:9))), 0 = T((dyo)(., yo)) = T(Y(., yo)) (30.204) 


parce que (0,0)(x, yo) = #(+, yo). 
À droite, la proposition 17.26 donne la première dérivée : 


a ( [_ T(U(2))d2), = (UC wo). (30.205) 


Notez que la proposition 30.56(1) dit alors que les deux membres de (30.203) sont de 
classe CT. 

Pour y < —R, d’une part o(.,y) = 0 et d’autre part, Fo T(U(.,2))dz = 0 parce que 
l'intégrale est entièrement sur un domaine où Ÿ(.,y) = 0. 

Donc l'égalité (30.203) est établie. 


Une seconde égalité Nous prouvons maintenant que 


[réa 0 FOOT o ep 


Nous nous souvenons que Ÿ(.,r) = 0 sir > R. Donc 


J T(y(.,2))dz = [ T(y(., 2))dz (30.207a) 
R — 00 
R 

- | T(y(.,2))dz (30.207b) 

= T(o(.,R)). (30.207c) 


La dernière égalité est (30.203). 


On ressort la définition de 4 C'est le moment de nous souvenir la définition de # 
et de la substituer dans (30.206) en tenant compte de la linéarité de T. Nous avons : 


= J T(Y(.,2))dz (30.208a) 


J T(é(.2))dz — | (et | é(.,s)ds) dz (30.208b) 
R R R 
UBEQooXSQM tu 
[rer z))dz — [ec e [ o(., s)ds) PS0 2080) 
-| T(éCs2))ds -T( | b(..s)ds). (30.208d) 
R R 


Justifications : 


— Pour (30.208c). Le nombre £(z) sort de T. Et T({k ô(., s)ds) sort de l'intégrale en 
2 


Le cas n = 1 est prouvé. 
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(2) La récurrence Nous supposons que le théorème est prouvé jusqu’à n et nous le prouvons 
pour n + 1. 


Soit donc De Z(Q x R"*1). La fonction y + Ta. y)) est continue et à support compact. 
Donc Fubini 14.294 s'applique et nous allons permuter les intégrales une à une avec T. Avant 
cela nous définissons quelques fonctions intermédiaires. 


D'abord, pour t € R nous posons 


HA xR'-—R 


(30.209) 
(w, y) + plu, (y,t)). 
Ensuite, nous posons 
pAOxR—-R 
; (30.210) 
(w,t) à Pt, Y1, ..., Yn)dy1 . . dUn. 
Maintenant nous calculons 
J T(é(.,y))dy = J If T(é (ai)din … dun | den 0 DT Ta) 
R+1 R LJR? 
-| If : Tomate ee) «ed | dYn+1 (30.211b) 
R nm 
UBEQooROIEo0oVMbfii 
-| Ir 1 ds aa eee th))di «dr NE LE IR c) 
R 
=[ T((., Yn+1))dUn+1 (30.211d) 
= T([ cwdn) SUBERooPFO RAS 


_T( J b( u)du) SUBPNooRYOPR OR VAN 


Rr+1 


Justifications : 
— Pour (30.211a). Théorème de Fubini 14.294. 
— Pour (30.211c). Hypothèse de récurrence. 
— Pour (30.211e). Encore la récurrence, avec n = 1. 
( 


— Pour (30.211f). Encore Fubini, mais dans l’autre sens. 


30.8 Distributions tempérées 


L'espace de Schwartz ?” .7(Q) est défini dans la définition 27.218 ; sa topologie y est discutée. 


Définition 30.58. 

Une distribution tempérée est une forme linéaire continue sur Z/(R°). L'ensemble des distri- 
butions tempérées est noté .S'(R‘). Si T est une telle distribution, nous notons (T,) l’image de 
& par T.. 


30.59. 
Deux rappels. 


(1) La topologique sur .7(R1) est celle de la définition 27.223. 


29. Attention : ce Schwartz (avec un t) est le Schwartz des distributions dont le prénom est Laurent. À ne pas 
confondre avec Schwarz (sans t) dont le prénom est Cauchy. 
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(2) La topologie sur Z(R1) est donnée par la définition 30.16. 
DEFooUSTNooYEZfPN 


Lemme-Définition 30.60. 
L'application 
6: Fun(R) — € 
(30.212) 
pr (0). 
est 
(1) une distribution, 
(2) une distribution tempérée. 
Cette distribution est nommée distribution de Dirac. 
Démonstration. Juste pour rappel, Fun(X) est l’ensemble de toutes les fonctions sur X. Pour 
prouver que Ô est une distribution, nous devons démontrer que 0: Z(R) — © est continue. Et 
pour qu’elle soit une distribution tempérée, il faut démontrer que 0: .S(R) — € est continue. 


Nous utilisons le théorème 30.31(3) pour démontrer la continuité de 0 sur Z(R). Soit un 
compact K CR et wE Z(K). En prenant m = 0 nous devons avons la majoration 


I(p)1 = &(0) < lol, = po,x(e). (30.213) 


Pour la continuité de 6 sur .7(R4), nous utilisons les résultats de 27.224. Soit une suite @y AU) 
En particulier, po,o(£n) = Sup |[gn(x)| — 0. Donc w,(0) — 0 comme il le faut. 


Exemple 30.61. 
La valeur principale de la fonction x + : est la distribution 


T:.S(R)—R 
— (x) (30.214) 
0 Jix>e 
e>0 


Montrons que cela définit bien une distribution tempérée. 

D'abord l'intégrale existe pour tout €, par exemple parce que pour les grands |x| nous avons 
par exemple |[p(x)| < À et donc 4(x)/x < 1/x? dont l'intégrale converge. Nous devons maintenant 
regarder la limite. 

Nous considérons une suite €, — 0 et la suite 


de J ee (30.215) 
l2l>en 


TX 


Nous montrons que cette suite converge dans R en montrant qu’elle est de Cauchy. Pour cela nous 
travaillons un peu la forme de v : 


g(x) = w(0) + [ p'(t}dt = @(0) + Î xp’ (x0)d6. (30.216) 


Ce qui est dans l’intégrale est borné par K = |M,v/|, qui est parfaitement fini parce que 4 est à 
décroissance rapide. Lorsque nous calculons |a, — a,|, le terme w(0)/x donne une intégrale nulle 
parce que le domaine d'intégration € < |x| < €, est symétrique alors que la fonction 1/x est 
impaire. 
an Ed K| = 2|en — em K (30.217) 
Em <|T|<En 

Tout cela nous dit que T'est bien définie. Nous devons encore étudier sa continuité. 

Soit y une fonction dans C?(R) valant 1 sur [—1,1|, paire et à valeurs dans [0,1]. Pour tout 
€ > 0 nous avons je X@) y = (. 
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Nous avons aussi $ = y + (1 — x), et donc 


| ar = | (Our + | Fr). (30.218a) 
bl>e Ÿ le[>0 T |e>0 T 
L n RATIO? 
= ef AE AS (1 x) Ed (30.218b) 
<|g’|c0 
< lé |. xd + els (80.218c) 
= C|g/|o + (pli (30.218d) 


: : : S(R 
Cela est valable pour toute fonction 4 € .S(R). Mais nous savons que si On 1) 0, alors |phlo — 0, 


S(R 
ph lo — 0 et nl1 — 0; donc si ue 0, alors 


| x 

Ton) = din | O) < Che + leu +0 (30.219) 
0 bæl>e Ÿ 

A 


30.8.1 Topologie 


La topologie que nous mettons sur l’espace .7/(R4) est le même type que celle que nous mettons 
sur Y'(R). 
DEFooNLIKooYfafLuw 
Proposition-Définition 30.62 (Topologie sur Z(R4)). 
Si y € S(R4), alors l'application 
De: S'(RT) —R 


Te [T(e) (30.220) 


est une seminorme. 
Nous considérons sur .7(R4) la topologie donnée par ces seminormes. 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


La définition 30.32 et la proposition 30.33 restent. 
PropQAuJstI 


Proposition 30.63. 
21 d 
Nous avons Th FEI D à et seulement si pour tout € F(RŸ) nous avons Tn(w) — T(p). 


Démonstration. Il s’agit encore de la proposition 7.329. Nous avons 


ET e vye S(Rp, (Ta — T) — 0 (30.221a) 
& Vp e S(R°)|(Tn — T)(p)| — 0 (30.221b) 
& Vope S(RŸ)IT,(e) — T(o)| — 0 (30.221c) 
& Vo e S(RÔT,() — T(o) (30.221d) 


30.8.2 Distributions associées à des fonctions 


Si fe Li,(RŸ) alors nous lui associons une distribution T} € '(R4) définie par la formule 


Ty(e) = [. f(x) (r)de. (30.222) 
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Proposition 30.64. 
L'application ainsi définie 

Lio(R”) + 7'(R°) (30.223) 
JTE | 


est injective. 


Démonstration. Si T}; = 0 alors pour tout ÿ € Ÿ nous avons TRa fg = 0. En vertu de la proposi- 
tion 27.175 cela implique f = 0 presque partout. 


30.8.3 Composition avec une fonction 


PropBQUOcyw 
Proposition 30.65 ([690], page 113 et 32). 
Soit Te.S'(Q) et fe CF(A x Q) où À est ouvert dans R. Nous posons 
F:A—R 
(30.224) 
Xe T(f(X,.)). 


Alors Fe C*(A). 


30.8.4 Transformée de Fourier d’une distribution tempérée 


Définition 30.66. 
La transformée de Fourier de la distribution tempérée T € .S'(R) est la distribution T définie 
par 


A 


À(e) = T(@) (30.225) 
pour tout ÿ € .S(R£). 

Lemme 30.67. 

Si fe (IR), nous avons T; = T}. 


Démonstration. En utilisant les définitions, 


= 7 [,, fétode = [00 [fete van dx (80.226) 


où nous avons noté æy le produit scalaire x + y. Nous permutons les intégrales en utilisant le 
théorème de Fubini 14.297 avec la fonction 


(æ,y) = f(x)p(y)e (30.227) 


qui est parfaitement dans L!(R4 x R4). Nous écrivons alors 


= [soc varla- | etrfcas - je) (80.228) 


30.8.5 Convolution d’une distribution par une fonction 


Nous savons que si # € .7(R1) et si x € RŸ alors la fonction y > #(x — y) est encore une 
fonction dans .7(R4). Donc si T e .7'(R4) nous pouvons considérer la fonction T + #9 = 4 +T 


définie par 
P Fab T(y  . n). EQooQUXKoRgEpSgT. 


Notons que T' + 4 est bien une fonction et non une distribution. 
Le but de la définition est d’avoir 


Tixv= fx. (30.230) 
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En effet 


(Ty + d)(x) = Ty d(x — y)) = : F(y)d(x — y)dy = (F x D)(x). (30.231) 


Exemple 30.68. 
La distribution de Dirac est le neutre pour le produit de convolution. En effet 


(8 x D)(x) = (y dx — y)) = Y(x), (30.232) 


c'est-à-dire Ô + Ÿ = Ÿ. A 
PropZMKYMKI 


Proposition 30.69 ([676]). 
SiT ee. S'(Rd) et pe .S(RŸ), alors la distribution associée à la fonction T + est tempérée. 


Démonstration. En agissant sur ÿ € Z(RŸ) nous avons 


Fra) = le Tu (d)(u))(x)dr (30.233) 
_ [. Ty p(x)b(x — y))dx (30.233b) 
=T (e > [. p(x)d(x — ar) SUPEASTRAUES, 
= T(y (px d)(v)) (30.233d) 
= T(p +). (30.233e) 


Attention : 


ii Avertissement /question au lecteur !! 30.70 
Le passage à la ligne (30.233c) n’est pas justifié. 


30.8.6 Approximation de la distribution de Dirac 
LEMooHEEOooFtKgfz 


Lemme 30.71 ([1]). 
Soient des fonctions jn: R — R* de classe C® telles que 


(1) Pour chaque n, la fonction x + in (||) est strictement décroissante et converge ponctuelle- 
ment vers zéro. 


(2) Pour chaque x, la suite nr jn(x) est décroissante et converge vers 0. ITEMooFQYXo0EkUAIb 
(3) Pour tout M > 0, la suite jn converge vers zéro uniformément sur B(0, MtooFYCRooFeRRjE 
(4) Pour tout à et e, il existe un N € N tel que | S200,5 n(t)dz — 1] < €. 

(5) Pour tout n, nous avons [D ÿn = 1. 


Alors si u € .S(R) nous avons 


lim | u(x)in(x)dx = u(0). (30.234) 
n—00 R 
Démonstration. Nous posons 
In = J Înü (30.235a) 
R 
Tin = Ï Înu (30.235b) 
B(0,6) 


= J at) (30.235c) 
B(0,6) 
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Nous allons progressivement montrer qu’en prenant Ô assez petit et n assez grand, les quantités 
Mn — Lôn|l, 5m — Zsnl et |Z5n — u(0)| peuvent être simultanément majorées par €. 

Soient 8 > Oet e > 0; vu que ue .S(R), il existe M tel que dau [ul <e. Soit N € NN tel que 
pour tout n > N; nous avons |[7,(x)| < 1 dès que |x| > M (hypothèse (3)). Alors 


| MCE (30.236) 


De plus en posant s = max{|u(x)| tel que 0 < |x| < M} (qui existe parce que w est continue et 
prise sur un compact) nous pouvons considérer N2 tel que j,(x) < e/s pour tout [x] > 6. 
Avec n > max{Ni, N} nous avons 


] nu -| nul = il nul (30.237) 
B(0,6) R B(0,6)° 
< | Mnul + J [nu (30.237b) 
ô<|x|<M xl>M 
< e(1+|M — 6|). (30.237c) 


En redéfinissant le € nous avons donc montré que pour tout € et 6, il existe un N € N tel que 
[Lin — nl < € (30.238) 


dès que n > N. 

La fonction u est uniformément continue sur tout B(0,6), et nous pouvons donc choisir Ô tel 
que |u(0) — u(x)| < € pour tout x € B(0,0). Pour ce 6, nous avons déjà trouvé un N tel que 
in — In| < € dès que n > N. Nous avons : 


Ton — Zanl < J tuto toide (30.239a) 
B(0,6) 
<e ] În (30.239b) 
B(0,6) 
<e. (30.239) 


Nous avons donc prouvé que pour tout € > O, il existe un Ô et un N tels que 
Hin — nl < € (30.240) 
Mon — Zônl < € (30.240b) 


dès que n > N. 
Enfin nous avons 


|Zan — u(0)| = (0) | Le À ) | (30.241) 


et par l'hypothèse (4) nous pouvons choisir n assez grand pour que la parenthèse soit plus petite 
que €. 
Pour € donné, nous avons donc trouvé un Ô et un N tels que 


Lin — u(0)| < [ln — Zn] + [sn — Zôn] + |Zin — U(0)| < 3e. (30.242) 


En passant à la limite nous avons bien 1, — u(0) dans R. 


Il va sans dire que nous connaissons de telles fonctions. Nous en donnons une maintenant. 


Exemple 30.72 ([692]). 
Nous introduisons la fonction f. (e > 0) donnée par 


Fame nl (30.243) 
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Nous calculons la transformée de Fourier de f. en divisant le domaine d’intégration : 


Ji J er tkre-dlqy = Î ee ‘de | “D du (30.244) 
R — 0 0 


En décomposant les parties imaginaires et réelles, et avec un peu de changement de variables, nous 
pouvons utiliser les intégrales (18.99) et (18.100) pour obtenir 


à 2€ 


Je(k) = Bac (30.245) 


Sachant que arctan(x) est une primitive de = et avec encore un peu de changement de variables, 


nous avons ” 


à ® de 
Hu = 2[arct Pa = OT. 30.246 
Léo - [7 = Alarctan(r/oJ = 27 (80.246) 
Cela montre que si nous introduisons la fonction 0. donnée par 
1 € 
Ok) = ————, .24 
) mn € + k? (FOUES 
alors nous avons une fonction qui tout en même temps ressemble à f. et vérifie 
J 6(k)dk = 1 (30.248) 
R 


pour tout €. 
Jusqu'ici nous avons montré que 


J ere dldx = 27ô.(H). nee 11) 
R 


Pour chaque € > 0 nous avons 6. € L!'(R). A 


Proposition 30.73 ([1]). 
Soit gE S(R). Alors nous avons 


J J g(x)e “dx dy = 2rg(0). FAooBDIUoR GAS 
RY/R 


Démonstration. Soit u € .7(R) ; nous multiplions l'équation (30.249) par u(k) et nous intégrons 


Dar apporta 
[ u(E) | [ etre “kids dk = 27 1 u(hé()dk.  MOOTGREEET 


Il s’agit de passer à la limite dans l’équation (30.251). Les intégrales à gauche peuvent être effectuées 
séparément parce qu’elles respectent le théorème de Fubini. En effet soit la fonction 


fx) = u(kje re del (30.252) 


qui est dans LI(R x IR) en vertu du critère du corolaire 14.296 et du fait que à la fois & + [u(k)| 
et x e-‘#l sont dans L'(R). 

Nous pouvons donc grouper et dégrouper les intégrales et en particulier les inverser. Si nous 
effectuons d’abord l'intégrale sur k nous trouvons 


[ u(k) | [ ere dla | dk = [ el [ue rar dx = [ ele (x)dx. (30.253) 


La fonction x — |e-‘#l@(x)| est majorée (uniformément en €) par x + @(x) qui est intégrable 
parce que la transformée de Fourier d’une fonction de . est dans .7 par la proposition 29.20. Le 


30. Et en écrivant correctement l'intégrale sur R comme une limite, etc. 
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théorème de la convergence dominée de Lebesgue 14.200 nous permet de permuter la limite € — 0 
avec l’intégrale et obtenir 


€—0 


lim | u(k) J ere ldr dk = J à(x)dx = J | u(k)e dk dx. (30.254) 
R R R R Y/R 


Notons qu’en passant à la limite nous avons perdu le droit de permuter les intégrales. 
Nous devons encore prouver que 


lim | u(k)ô.(k)dk = u(0). (30.255) 
0 JR 


Cela n’est rien d’autre que le lemme 30.71 appliqué à la suite de fonctions ÿ} = Ô1/n. 


30.74. 

Notons que les intégrales dans (30.250) ne peuvent pas être permutées parce que Re e dy n'existe 
pas. Il faut avouer que, malgré tous les conseils du type « attention : permuter des intégrales doit 
être fait avec prudence », ce n’est pas tous les jours que nous trouvons des intégrales qui ne peuvent 
pas être permutées, autrement que dans des exemples fait exprès. 


30.8.7 Peigne de Dirac 


Proposition 30.75. 
La formule 


À Do Fa 50 256 


keZ 
définit un élément de D'(R). 


La forme linéaire À, est le peigne de Dirac de pas a. 


Démonstration. Nous utilisons le critère de continuité séquentielle en zéro du théorème 30.31. Soit 
une suite wn — 0 dans Z(R). Par le théorème 30.28 il existe un compact KX de R pour lequel 
Vn € P(K) pour tout n et wn — 0 dans Z(K). La somme 30.256 est donc finie et nous pouvons 
la permuter avec une limite : 


Jim Aa(pn) = ÿ, lim pn(ka). (30.257) 
keZ 


La limite w, — 0 dans Z(K) signifie que nous avons convergence uniforme de la fonction et de 
toutes ses dérivées vers 0. En particulier |w,|x — 0; disons que la somme (qui est finie) fasse s 
termes : 


D Pn(ka) < sn. (30.258) 
keZ 


Le terme de droite tend vers zéro lorsque n tend vers l'infini. 


Donc À, est bien une distribution au sens de la définition 30.30. 


Lemme 30.76 ([650]). 
Le peigne de Dirac vérifie la relation 


À, = AD. (30.259) 
a 


(Daf)(x) = af(ax). (30.260) 
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Démonstration. Pour @ € Z(R) nous avons 


Au(e) = Delta) = = D (Day) = = A1(Dap). (30.261) 


keZ keZ 


Proposition 30.77. 
Le peigne de Dirac est une distribution tempérée. 


Notez qu’il y a plus de fonctions dans .7(R) que dans Z(R) ; il est donc plus difficile de rentrer 
dans .7’(R) que dans Ÿ'(R) : il est plus compliqué d’avoir existence de T(@) pour tout y € .7(R) 
que pour tout we Z(R). 


Démonstration. Soit 6 € .7(R). Nous avons 


(1 + a?k?)o(ak) 
QI = 1eta) LE re 


La somme Le est une somme convergente, et le supremum est borné par la proposi- 
tion 27.221 en prenant Q(xr) = 1 + x?. En effet sur B(0,r) la fonction x + (1 + x?)w(x) est 
bornée par ce que c’est une fonction continue sur un compact, et à l’extérieur de B(0,r) cette 
fonction est alors bornée par 1. 


1 
< L+2 a 30.262 
sup | x (12, ue ( ) 


Si aucune ambigüité n’est à craindre, nous noterons f la distribution T}. 


Exemple 30.78. 
La transformée de Fourier de la distribution de Dirac est la fonction constante : Ô = 1. En effet si 
nous agissons sur une fonction test, 


ô(e) = 8(2) = 800) = | ete (80.263) 


A 


30.9 L'espace C°(R,.7/(R1)) 


Dans cette section nous notons 1 un ouvert de R et Q un ouvert de Rd; si 4 est une fonction 
sur Z x Q nous allons noter #4: Q — R la fonction #4(x) = Y(t,x). C’est une notation plus légère 


que w(t,.). 


30.9.1 Propriétés générales 


La définition de l’espace C©(1,.7/(Q)) est encore la définition 7.348 et les propriétés énoncées 
dans la proposition 30.48 sont encore bonnes ici. 
D'abord parlons un peu de continuité en recopiant la proposition 7.347 dans notre contexte. 


PropBXFmvPs 
Proposition 30.79. 
Soient I un intervalle ouvert de R et u: 1 — .S'(RŸ) une fonction continue. Alors LtenFTvVUEW 
(1) Pour tout we S(R1), l'application t — w(w) est continue. 
(2) Pour tout w € .S(R1), nous avons la limite 
dim u(p) = u(e). (30.264) 
(3) Nous avons la limite dans .7'(R°4) 
lim uw = wo. (30.265) 


t—to 
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Lemme 30.80. 
Nous avons CT(1,.7/(Q)) € CT(I, Z'(Q)). 


Démonstration. Soit (7,) € C?(1,.7'(Q)). Pour chaque t nous avons 
Te. S'(Q) € '(Q). (30.266) 
Ensuite il suffit de dire que pour tout w € (Q) la fonction 
tr Ti(o) (30.267) 


est de classe C'® parce que c’est le cas pour toute fonction dans .3/(Q). La proposition 30.48 (en 
changeant % en .7) conclut que (7;) € C?(1, Z'(Q)). 


ProplliAcyDq 
Proposition 30.81. 
L'espace S(Q) est complet et métrisable. 


Démonstration. En ce qui concerne le métrisable nous reprenons la formule de l’écart (7.429). 
Dans notre cas pour l'écrire explicitement il faudrait une énumération de IN? à partir de 1 (et non 
de zéro). Cette formule donne bien une distance parce que si d(1 — 42) = 0 alors en particulier 
poo(p1 — 2) = |1 — 2x = 0 et donc w1 = po. 

Nous montrons maintenant que .3(Q) est complet en y considérant une suite de Cauchy (w,). 
Soite> 0et a,Be N ainsi que k,l assez grands pour que @x — w1 € Bag(0,e). En particulier pour 
a = B = 0 nous avons | — ls < €, ce qui signifie que nous avons une suite vérifiant le critère 
de Cauchy uniforme 12.366. Elle converge donc uniformément vers une certaine fonction @ que la 
proposition 12.367 nous assure être continue. Il existe donc w € C(Q) telle que 


unif 


Dh —+ D. (30.268) 


Nous devons montrer que w € .7(Q). Le fait que 4 soit de classe C® s’obtient en utilisant les 
seminormes poa(o) = |0*ylx de la même façon que dans la preuve que Z(Q) était complet 
(proposition 30.29). Nous obtenons en particulier que 


pr TS 8 DEP) 


pour tout multiindice a. Montrons encore que 4 est à décroissance rapide : nous devons montrer 
que pour tout a et 5 nous avons 


Pag(g) = au [x/ (0%) (x)| < 00. (30.270) 


Étant donné que (w) est de Cauchy dans .7(Q) nous avons (pour € fixé et k,1 assez grands) : 
FACE — D'p)(x)| < € (30.271) 


pour tout x € (. En considérant ! fixé et en prenant la limite k — © et en utilisant la convergence 
uniforme (30.269) nous trouvons que 


[x (0% — p)(x)| < € (30.272) 
Du coup nous pouvons faire la majoration 


a IxP (0%) (x)| < sup IrÉ (0% — oe)(x)| + sup [(O%yxr) (x) < € + Pag(pi) < © (30.273) 
TE FA “A 


du fait que pag(qgr) < © parce que € .7(Q). 
Donc we .#(Q) et ce dernier est alors complet. 
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Proposition 30.82. 
Soit (T;) e C°(1,.7/(Q)) et pe .S(I x Q). Alors la fonction 


te T\(h) Fan 


est continue sur I. 


Démonstration. Soient to € Z et une suite convergente vers to : tj — to dans R. Vu que (7;) est 
continue en t, elle est en particulier séquentiellement continue et nous avons 


SR) 


D 4, (30.275) 


; (A 1e 8 Jp 
Montrons que nous avons aussi V4, 7 V4. Pour cela nous utilisons les seminormes *! Pas définies 
en (27.950) : 


Paslbe, — Vo) = D fr (0%0(6, 2) — Oro, 1))| (30.276a) 
zen 
< sup PAT —t;| sup |0%#(4, o)]| (30.276b) 
zen te[to;t;] 
< |to — t;| sup sup [ro 0 pt, z)| (30.276c) 
zen tel 
< [to — tj Pan (D). (30.276d) 


Pour la première majoration nous avons utilisé le théorème des accroissements finie 12.325. Pour 
la dernière ligne nous avons noté P,8 les seminormes de .7(1 x Q) et (at) est le multiindice a à 
qui on à ajouté la variable t à la fin. Etant donné que PF) g() < 0 nous avons bien 


PaB(Ÿt; — Vo) — 0 (30.277) 


et donc ##, _) to: 


Étant donné que .7 (Q) est métrisable et complet, le corolaire 27.6 nous dit que 


C 
T4, (Ye) nu T;; (Lo): (30.278) 
ce qui est bien le critère de continuité séquentielle de la fonction (30.274). 
RemZYVKHRT 
Remarque 30.83. 
La proposition 30.50 nous dit, a fortiori, que si (74) e C?(1,.7/(Q)) alors la formule 
T(p) = Ï Tu) (30.279) 
À 


donne un élément Te Z'(I x Q). Au cas où aucune confusion n’est à craindre, nous pourrons noter 
également T l'élément de Z'(I x () déduit de Te C(1,.7/(Q)). 


Notons que ce T ne sera pas toujours une distribution tempérée comme le montre l’exemple 
suivant. 


Exemple 30.84. 
En posant T}(£) = et"w(0) avec J = R, l'intégrale 


T(#) = [ T(ue) = [ ef w(E, 0)dt (30.280) 


ne converge pas pour tout € .S(R x Q). En effet par rapport à t, la fonction #(t,0) décroît 
L 2 
rapidement mais pas spécialement assez rapidement pour compenser ef . PA 


31. Pas parce que nous en avons envie, mais bien parce qu’elles font partie de la définition de la convergence et de 
tous ces trucs. 
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30.9.2 Dérivation 


Proposition 30.85 ([690]). 
Soit Te C*(I,."(Q)) et 0 <1< k. Pour tout to € I l’application 


PropGKoPbko 


TO: F(0) > © 


pr (Ent) (to) F4868813 


est bien définie, est une distribution et de plus 
(2) k—l ! 
te T'eC(I,.7/(Q)). (30.282) 


Attention que la formule (30.281) est bonne si 6 € .7(Q). Si par contre # € .S/(I x Q) et qu’on 
veut regarder u(D (a) alors il faut regarder la proposition 30.86 et utiliser la formule (30.287) dans 
laquelle se trouve u(n) (y). 


Démonstration. Pour k = 0 nous avons D = T, et c’est bon. Pour le cas k = 1 et ! = 0 c’est 


encore “Ho = T} qui fonctionne. 
Le premier cas non trivial à traiter est & = 1 et ! = 1. Nous considérons to € 1; par définition 
de la dérivée, pour tout w € .7(Q), nous avons (pour peu que les limites existent) : 


TD (co) - C[nte)] _ Jim Liste, (P) — To(p) : im U;(p) EacnAfXS 


dt t=to  j—0 €; 
où 
1 
= AU — Tr). (30.284) 


j 
et (e;) est une suite de réels tendant vers zéro. 
Vu que (T;) e C*(I1,.7'(Q)), l'application t > T(o) est de classe CF et en particulier l’ex- 


pression (30.283) a une limite lorsque j — 0. Donc TO (e) est bien définie. Le point (1) du 
(eo) 


corolaire 27.6 nous dit que limj_,œ U;(@) = U 
nue). 


(@) et me est une distribution (linéaire et conti- 


Nous devons encore voir que t + DIS est une application C° (I 7" (Q)). Cela est une consé- 
quence du fait que (T;) soit de classe C', ce qui se traduit par le fait que l'application 


trs AO) (30.285) 


est continue (définition de la dérivée et point (1) de la proposition 30.79 appliquée à la dérivée). 
Les cas k > 1 se traitent par récurrence. 


PropUDkgksG 
Proposition 30.86 ([690]). 
Soit (1;) e CY(1,.7/(Q)) et de .S(I x Q). Alors la fonction 


te Ti(y(t,.)) (30.286) 


est de classe C? sur I et 


d 


2 (ne) = 0) +7 (Le) Est 


Démonstration. Soient to € I et e; — 0 une suite réelle. Le membre de gauche de (30.287), écrit 
en to, donne 


a Im Pts (Y(éo + €5,.)) — To (#(to, )) B0.288 


i 
j—00 €j 
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Afin d’alléger les notations nous allons écrire d4 = w(t,.). Dans le numérateur de (30.288) nous 
ajoutons et soustrayons la quantité 73,44, (14) et nous découpons la limite en deux morceaux : 


(Lies = Tio)(Lto) 


Tine. _— 
à = lim 7 :(ote; © Vo) | lim (30.289) 
j— €j j—0 €j 
Le second terme vaut à 
1 
ee 6107) = si (dis) (30.290) 
dt t=to 
par la proposition 30.85. Occupons nous de l’autre morceau de &. Nous posons U; = Ti,+e, et 
1 
Pi = (Vote; — to): (30.291) 


J 


Nous voulons utiliser le corolaire 27.6(4) pour obtenir 
Op 
Î (D) = — .) J's .292 
ro Citer) Tio (5, (to, )) (30.292) 


(Q) 


(A 
D'une part (7;) est de classe C® en t et nous avons donc la convergence U; —> 
prouver que 


Ta. Reste à 


I(N) 0 

Pj — EAU ) 
Cela en remarquant bien que la variable de dérivation n’est pas celle par rapport à laquelle nous 
voulons la convergence Schwartz. Soient a et 8 des naturels et calculons un peu : 


Pas (P; — (to )) = sup 290% (2 (w(60 + 65,2) — Y(to, x)) — 100) FT 80) 


æen j 


(30.293) 


Il est à présent l’heure d'utiliser un développement de Taylor avec le reste de la proposition 12.466 : 


Ô €? O2 
blto + ej,2) = bo, &) + 5 (fn, 2) + DOVE, 2) (30.295) 
ot 2 Ôt 
pour un certain £ € [to, to + ej]. En mettant ça dans le calcul (30.294) nous restons avec 
Ô 2% ,- 
Pas(2; = (to) = sup ae" (ec D É(E,2))| < cjPaao() (30.206) 
ôt se ot 


où Pak: Sont les seminormes de .7(1 x Q) avec la notation plus ou moins évidente de prendre a 
dérivations sur æ, k sur { puis de multiplier par x°t!. Au final nous avons bien 


Oÿ 
Jin Pas (p5— 35 (to,.)) = 0 (30.297) 
et donc la convergence v; a 2 (to, je 
LemWRoRPIX 
Lemme 30.87. 
Soit (T,) € CY(1,.7/(Q)) alors si F dénote la transformée de Fourier nous avons 
FT) = (FDP (30.298) 
où (FT) est la famille de distributions (FT); = FT. 
Démonstration. Pour la preuve il suffit de tester l’égalité sur une fonction w € .7(Q) : 
d d 
FR0)Q) = TU(Fe) = ERFe) = (FD) = FDP (0). (30.299) 


32. Je ne sais pas si je me suis bien fait comprendre là. 
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Chapitre 31 


Espaces de Sobolev, équations 
elliptiques 


CHAPooVTIIooGOEvXT 
31.1 Espaces de Sobolev 


Rappel : la définition de la dérivée faible est 30.2. 


31.1.1 Sur un intervalle de R 


Sauf mention du contraire dans cette section J est un intervalle borné ouvert 1 = ]a,b[ de R. 


Définition 31.1. 
Soit I = ]a,b[ un ouvert borné de R. L'espace de Sobolev H!(1) est l’ensemble 


HY(I) = {u e L?(I) tel que 3g € L?(T) tel que Vv € ce(D, | up! = - | gp}. (31.1) 
I I 


L’unique élément g de L?(1) vérifiant ( up = —, gp est noté u/ et est nommé dérivée ; nous 
verrons dans les prochaines pages pourquoi. 
L'espace H! accepte le produit scalaire suivant : 


Lu, 0} = ] uv + Ï u'v!, (31.2) 
I I 
et nous notons |.| 71 la norme correspondante qui n’est autre que 
lun = u,u) = [ul£e + ul. (313) 


Nous introduisons l’espace L}.(1) des fonctions étant Li sur tout compact de I. 
CorEVJYihj 
Corolaire 31.2. 
Siue H'(I) et si uw = 0 alors il existe une constante C telle que u = C' presque partout. 


Démonstration. L'hypothèse uw’ = 0 signifie que pour toute fonction w € C?(1), 


] up! = ] up = 0. (31.4) 
F4 I 


La proposition 27.175 nous dit alors qu’il existe une constante C' telle que u = C' presque partout. 


LemMPkbZxX 
Lemme 31.3. 
Tout élément de H!(1) admet un unique représentant continu. 


Nous verrons dans le corolaire 31.5 que ce représentant pourra être prolongé par continuité sur 


JL. 
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Démonstration. Soient yo € 1 et ue H!(1). Nous considérons la fonction 
A 
au(x) = J u’(t)dt. (31.5) 
yo 


Notons que par définition, u’ e L? donc l'intégrale ne pose pas de problèmes. Montrons que à est 
continue sur 1. Pour cela nous considérons x € I et h tel que x + h € TI. Alors 


CORDECCIEN u<f Lu’. (31.6) 


Mais la fonction [u/| est dans L},.(1) par le lemme 27.35; elle est en particulier intégrable sur un 
ouvert contenant x et par conséquent la dernière intégrale tend vers zéro lorsque h tend vers 0. 

Nous prouvons à présent que à est dans H!(1) et que sa dérivée est égale à u/ ; pour cela nous 
allons montrer que pour tout w € C(1), 


Ï up = - | up. (517) 
I I 
Nous avons 


Li = [ ([ “(bat) p'(x)dx = [ CF (bat) on. [ 


Pour faire plus court, nous notons f(t,x) = w(t)w'(x). La première intégrale vaut 


Fe ([ “(Oe(e) = [ ( . Fta)lres(ta)dt) dx (31.9a) 


yo a yo 


L J SR FPS DE) 
Yo va 


J | 1107) '(x)dr. (31.8) 


0) 


= J Lt mdrdt (31.90) 
Yo va 


-- | " [co ua (31.94) 


La permutation d’intégrales pour obtenir (31.9b) est due au théorème de Fubini 14.297(3). Par le 
même petit jeu, la seconde intégrale vaut 


[ [vo x)dx dt. (31.10) 
Yo 

1 u! ([ 107) dt + [ u(t) ([ 207) dt (31.11a) 
J - 


(t) 
0 
(e) e(a))dt + J (D (EE) — e(6) (31.11b) 


En refaisant la somme, 


[ü 
up 
I 


! 


= u'(t)(o(t) 

a Yo 

b 
= J up (81116) 
= — [ up. (31.114) 


Notons que w(a) = w(b) = 0 parce que Y est à support compact dans |a,b[. Nous avons donc 
prouvé que ü est dans H!(1) et que à’ = w/. Par le corolaire 31.2, nous avons une constante C telle 
que à = u + C presque partout, c’est-à-dire u = ü + C' dans H!(1). 

En résumé, à = ü + C'est un représentant continu de u dans L?(1). 

L'unicité du représentant continu est simplement le fait que deux fonctions continues égales 
presque partout sont égales (proposition 20.150). 
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PropGWOIoDg 
Proposition 31.4. 
Si ue H!(1), alors 


A 
u(x) — u(y) = Î uw (31.12) 

pour tout x,ye I. 
Démonstration. Pour fixer les idées, nous supposons x < y. Nous considérons une suite wn € C?°(1) 
convergeant uniformément sur 1 vers 1j,,]. Nous exigeons de plus que 

— w!, est positive sur [a, x + À] 

— p,, est négative sur [y — À, b] 

— Pn = 1sur [x +À,y— 1. 

— Pn = 0 sur [a,x — 1/n] et sur [y + 1/n,b]. 


Pour chaque n, nous découpons l’intégrale comme 


æ—1/n xæ+1l/n y—1l/n y+1/n b R 
= ] U'On = ] up}, = J up}, + J up, + J up}, + Î up}, + J we CFERYS 
I I y+l/n 


a æ—1/n x+1l/n y—1l/n 


Par construction de w,, de ces 5 morceaux, il n’en reste que deux de non nulles : 


æ+1l/n y+l/n 
J _— J u(é)e!, (hat + J u(t)e!, (dt (31.14) 
I æ—1l/n y—1l/n 


À B 


Soit € > 0 et n suffisamment grand pour avoir u(t) € B(u(x),e) pour tout te B(x,À) et (en 
même temps) u(t) € B(u(y),e) pour tout t € B(y, À). C’est la continuité de u qui permet de 
trouver un tel n. Pour cette valeur de n, en tenant compte des hypothèses sur la positivité de w!, 
nous avons 


æ+1/n æ+1l/n x+1l/n 
[ose [ua < [7 (ut)+9  (@a5) 
x—1/n æ—1/n æ—1/n 
mais par hypothèse sur &, nous trouvons 
æ+1l/n 1 1 
Î pa(t)dt = En(x + —) — px + —) = 1. (31.16) 
x—1/n nm n 


donc 


u(x)—e< J Con u(t}p!, (dt < u(x) + €. FaLArpig 


æ—1l/n 


Pour encadrer la seconde, il faut être plus prudent avec les signes parce que Y/, y est négative. En 
posant Yy = —{n nous avons 


y+1/n 
=R= J u(t)Yh(t)dt, (31.18) 
y—1/n 
et donc 
u(y)—e< —B <u(y) +e (31.19) 
ou encore 
—€e — u(y) < B < € — u(y). (31.20) 


En additionnant avec (31.17) nous voyons que pour tout € > 0 il existe un Ne) tel que nous ayons 


u(x) — u(y) — 2e < [ue < u(x) — u(y) + 2€ FEU 
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pour tout n > N. Nous voulons évidemment prendre la limite € — 0, c’est-à-dire n — 00. Étant 
donné que @n(t) < 1 pour tout t et pour tout n, la fonction t + w’(t)n(t) est dominée par w/, 
qui est dans L1(1) par le lemme 27.35. Le théorème de la convergence dominée nous permet donc 
d'affirmer que 
y 
lim | up = Ï We] = Î u’, (31.22) 
Î 


n— 00 I z 


et donc les inégalités (31.21) donnent le résultat, grâce au signe dans (31.13). 


CorCEPJGAu 
Corolaire 31.5. 
Si [u] € H!(1), le représentant continu u € C(I) peut être prolongé par continuité en u € C(I). 


Démonstration. Soit (x,) une suite strictement croissante dans |a,b| convergeant vers b. Nous 

voulons montrer que la suite (u(xn)) est de Cauchy dans R, ce qui nous permettra de définir 
u(b) = Jim (En). (31.23) 

qui sera évidemment continue. Cette construction ne dépendra pas du choix de la suite (Xn) parce 


que deux fonctions continues sur 1 et égales sur 1 sont égales sur 1. 
En notant uw’ la dérivée de u dans H!, nous avons par construction du représentant continu : 


u(E) = je u’(t)dt. Et donc 
Ln Tn+p Tn+p 
! ! ! 
vo Yo Tn 


Vu que la suite (x,) est de Cauchy et que w/ est intégrable (même sur J), la limite n — © de 
cela est zéro, quelle que soit la valeur de p. Donc (u(xn)) est de Cauchy dans R et est donc 
convergente. 


[u(tn) — U(tn+p)| = (31.24) 


ThoESIyxfU 
Proposition 31.6 ([103, 1]). 
Quelques propriétés de l’espace de Sobolev H'(1) où I = ]a,b[ est un ouvert berne Rvookinatuu 


(1) HI) est un espace de Hilbert. 
(2) HY(1) s’injecte de façon compacte dans CUT). 
(3) H!(T) s’injecte de façon continue dans L?(1). 


Démonstration. Nous prouvons point par point. 


(1) Le seul critère à vérifier est la complétude. Pour cela nous considérons une suite de Cauchy 
(un) dans H!(I). Si e > 0, alors il existe N > 0 tel que pour tout p > 0 nous ayons 
lun+p — Unf?n < €, c’est-à-dire 


lénp —unf2e + uns — un lee < €. (31.25) 


En particulier les suites (u,) et (u’,) sont de Cauchy dans L? qui est complet par le théorème 
de Fischer-Riesz 27.44. Nous notons donc 


L?2 

Un + U (31.26a) 
2 

u, L v. (31.26b) 


Nous allons maintenant montrer quelques limites. 
2 
(la) ung LE, up Si M est une constante qui majore y alors fungw—uspla < Mur —ul2 — 0. 


2 
1b) u/,ç Le vg C’est la même chose avec [u/,ç — vyl2 < Mu, — vl2 — 0. 
nm nm nm 
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— 


(ic) ue H!(1) avec w = v Attendu le corolaire 27.36 qui permet de permuter intégrale et 


limite dans L?(1) et les limites que nous venons de prouver, 


Ï ug' = lim | ung'=— lim | uw, = - | UP. (31.27) 
I I à I 


n—>00 


Cela signifie que v est la dérivée faible de u : uw! = vw. 


(Id) u Es 


Nous pouvons alors prouver que u, — u dans H!(I) : 
fun — ufr = un — ul£e + ur — 152. (31.28) 


Mais nous savons déjà que un — u dans L? (d’ailleurs c’est la définition de u) et que 
u! = v alors que par définition de v, nous avons u/, — v dans L?. 


Tout cela donne que u, — u dans H!(1) et donc que H!(T) est un espace complet. 


L'application que nous allons prouver être compacte entre H!(1) et C(T) est 


. rl OF 

PARC) (31.29) 
[u] = à 

où [u] désigne une classe de fonction dans H!(1) et à est son représentant continu prolongé 
par continuité à J !, qui existe par le lemme 31.3 et le corolaire 31.5. Cette application est une 
injection par l’unicité du représentant continu. Nous allons prouver que c’est une application 
compacte en utilisant le critère (2) de la proposition 27.3. Pour cela nous allons commencer 
par utiliser le théorème d’Ascoli sur l’ensemble B des représentants continus des éléments de 
B, prolongés par continuité sur L: c’est-à-dire B & CET): 
Soit u e B; par la proposition 31.4, nous avons 


lu(æ) — u(y)| =| if d'(Dat (31.308) 
-|[x Le] bu(oat (31.30b) 

< |[Le,ylz2 lu" |L2 (31.30c) 

< {2 — yllu| ri (31.304) 

[x — 1. (31.306) 


où nous insistons sur le fait que la continuité n’impliquant pas la dérivabilité, le uw’ ici est 
la dérivé au sens de H!, et non la dérivée usuelle. Quoi qu'il en soit, l’ensemble B est 
équicontinu ?. Nous montrons à présent qu’il est également borné pour la norme uniforme. 
Soit u e B; vu la construction du représentant continu au lemme 31.3, nous avons 


lu(x)| = = [ao (31.31a) 
_ me W u/(t ee à (31.31b) 
= (é)dtdy = —— [uw à (31.31c) 


IA 


iF f fu” (E) dé dy + —— [ lu(y)ldy. FT 


1. Encore que par souci d’économie d’encre nous n’allons pas écrire toujours les tildes et noter u le représentant 
continu prolongé à 1 par le corolaire 31.5. 
2. Définition 7.302. 
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À ce niveau, il faut remarquer que dans la première intégrale, le passage de la valeur absolue 
à l’intérieur de l’intégrale en même temps que l'élargissement des bornes n’a rien d’innocent. 
Si æ < y, les bornes ne sont pas « dans le bon ordre » et nous ne pouvons pas faire la 
majoration usuelle en entrant simplement la valeur absolue. Ici nous tenons compte de cela 
en élargissant les bornes, et en les mettant dans le bon ordre. Le passage exact est le suivant : 
si æ,y € |a,b[, nous avons 


[ Fat = [ | f(#)Idt. (31.32) 


[ro < 


[ | Fat < 


Notons en particulier que dans le cas du passage vers l’équation (31.31d), le nombre x est 
fixé alors que y est une variable d'intégration. Donc l’ordre des deux est certainement de 
temps en temps le « mauvais ». 

Quoi qu'il en soit, la première intégrale se réduit à une multiplication par b — a et le calcul 


continue : 
lu(æ)| < Lio + L ll (31.33a) 
< Vo alle + ll (31.33b) 
< (VE G+ 2) (lu'lie + Valse) (31.330) 
< (VE a+) dl (31.334) 
= Vb= a+ 7 (31.33e) 


Donc B est borné pour la norme L®. Et c’est même borné par un nombre facilement calculable 
connaissant 1. En particulier l’ensemble 


{u(x) tel que ue H!} (31.34) 


est, pour tout x, contenu dans la boule de rayon 4b — a + - et donc est relativement 
Vb—a 


compact dans KR. Par conséquent le théorème d’Ascoli 27.4 nous dit que l’ensemble B est 
relativement compact dans C(J). 

Par conséquent nous avons montré que l’image par 4 de la boule unité fermée B de H!(1) 
est relativement compacte dans C(J), ce qui signifie que 4 est une application compacte. 


Les éléments de H!(1) sont des éléments de L?(1); donc l'identité est une injection. Nous 


devons seulement étudier la continuité. Si (u,) est une suite dans H! convergeant dans H! 
vers ü, alors 


RS 
Co 
nr 


lun — ur < fun — ur + [us — w’|ze = [un — ua — 0. (31.35) 


Donc la suite des images (par l'identité) converge dans L?. L'identité est donc continue. 


31.1.2 Sur un ouvert de R’ 


Soit Q, un ouvert de R" et v € L?(Q) (voir 27.83). Les fonctions considérées sont à valeurs 
réelles. 


31.1.2.1 Définition 


Définition 31.7 (Espace de Sobolev H1(Q)). 
Soit Q une partie de R". L'espace de Sobolev H!(Q) est : 


H'(N) = {ue L?(Q) tel que Vi = 1,...,n, due L?(Q)}. (31.36) 
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Nous munissons cet espace d’un produit scalaire 


E K 
(u,v)pn = <u,v}re + KVu, Vu)r, D CORRE, 
où Vu =», due L?. 


L'existence des intégrales dans le produit scalaire est assurée par le fait que u, v, Vu et Vv 
sont dans L?(Q). La définition du produit scalaire dans L? est la définition 27.326 (mais sans la 
conjugaison complexe). 

Pour la même raison, (u,u)pn1 = 0 demande que chacun des deux termes est séparément nul, 
et nous avons u = 0 dans L?, et donc aussi dans H!. 


Théorème 31.8 ([693]). 
L'espace H!(Q) est un espace de Hilbert*. 


Démonstration. Nous devons nous assurer que l’espace H! est complet. Pour cela nous considérons 
une suite de Cauchy (u,) dans AH. Soit e > 0; il existe N > 0 tel que si n,m > N alors 
un — Umln < €. Or en déballant la définition de la norme et du produit scalaire, 


tm — Unèn = (me — Un; Um — Un) (31.38a) 
= um — Un Um — Un) + SV(Um — Un); V(Um — Un)) (31.38b) 
= [Un — Un [52 + IV (um — Un)||£2. (31.38c) 


En particulier les suites (u,) et (Vu,) sont de Cauchy dans L?. Vu que L?, lui, est complet 
(théorème 27.43), il existe u € L? et v; € L? tels que 


L?2 
Un — (31.39a) 
L2 
dun > vi. (31.39b) 


Nous savons que l'injection 4: L? — %' est continue par la proposition 30.36. Nous avons donc 
aussi les limites 


D. 91 (31.40) 
Tu. #, T. La 


La dérivée étant une opération continue sur Ÿ’ nous avons de plus 


! 


Tu) — Gi(Tu) (31.41) 
En utilisant le lemme 30.39 nous avons alors 
Tour = Turn) — (Tu) = Tou- (31.42) 


En comparant avec (31.40b) et par l’unicité de la limite, nous avons T,, = Ts. Cela implique 
UV — Ou. 
Vu que v; € L? nous avons aussi Œœu € L?. Par conséquent u € H!(Q) parce que ses dérivées 
sont dans L?. 
. Hi 
Nous devons maintenant prouver que u, — u. Nous avons 


lun — ul2n = [un — u|22 + [Vus — Vul?: (31.43) 


: L2 LE? 
Le premier terme tend vers zéro parce que u, —— u et le second parce que dun —— du. 


3. Définition 25.3. 
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31.1.3 Espace de Sobolev fractionnaire 


Définition 31.9. 
Pour me N et un ouvert de RŸ nous définissons l’espace de Sobolev 


H"(Q) = {ue L?(Q) tel que du € L?(Q) Vla| < m}. (31.44) 
Nous définissons également un produit scalaire sur H"* par 
(u,v)pm = D, (ou, Ov)r2. (31.45) 
lal<m 


En particulier la topologie est celle de la norme dérivée du produit scalaire : 


” EQooMCWM 
lul2men = D lo ul2ç. Roca 


|[a|<m 


Le lemme suivant montre que la proposition 29.19 fonctionne encore avec L? au lieu de 7. 


LEMooAGBZooWCbPDd 
Lemme 31.10 (Lemme de transfert[694], thème 75). 
Soit f e H"(R4). Alors pour tout multiindice & avec |a| < m nous avons 
F(ONS) = [EE]. (31:47) 
Lemme 31.11. 
Il existe des constantes c1 et c2 telles que pour tout x e RA, 
a(1+lafy" < À, (x) < o(1+ rl). (31:48) 
lal<m 
Lemme 31.12. 
Soit ue L?(R4). Nous avons u € H"(RA) si et seulement si l'application 
Er (1+ 16/7?) °à (31.49) 


est dans L?(RŸ) pour tout k < m. Ici |é| est la norme euclidienne de £ dans R‘. 


Démonstration. Vu le lemme 31.10, il suffit de montrer que 
E IJXT GN 
(+142) "?a oo Top 


est dans L? pour tout # < m si et seulement si 
E ILP Uyi 
Eû QooTLPooAGEr IT 
l’est pour tout a avec [a] < m. 
L'expression (31.50) est une somme d’expressions du type (31.51). Donc l’implication dans un 
sens est montrée. Pour l’autre sens, nous savons que 


(31.52) 
et donc 
En ES Se (31.53) 
Or féfll = [épi = jé... [él et [é] > |é| pour tout à, donc 
je*] < [é]lel. (31.54) 


D'autre part pour tout x e R* et tout k positif nous avons 
(Las m (31.55) 


qui est facile à vérifier en prenant le carré des deux membres. 
En remettant tout ensemble, 


jEval < él < 1elleljal < (1 + 12) Par. (31.56) 


Donc si le membre de droite est de carré intégrable, celui de gauche l’est également. 
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DEFooWEAQooAIWBwx 
Définition 31.13 (Espace de Sobolev H°[695]). 
Pour s > 0 nous définissons l’espace de Sobolev H°(RŸ) par 
H#(R4) = {ue L'(R%) tel que (1 + |é|?) à € L2(R°)}. (31.57) 
Nous y mettons le produit scalaire 
Gao) = [AE + IEP)" dE. (81.58) 


31.14. 
Vu que Z(R4) est dense dans L?(R4) (théorème 27.50), on pourrait croire à la densité a fortiori 
dans H*(R4). Mais attention : Z(RŸ) est dense dans L? pour la norme L?. Nous n'avons encore 


rien dit pour la norme H°(R). 


PROPooMKAFooKDNTbO 
Proposition 31.15 ([696]). 
La partie S(RŸ) est dense dans H°(R°). 
Démonstration. Soit u € H*(R4). Par définition l'application 
€ (+14) a (31.59) 


est dans L?(R{). Elle peut donc être approximée au sens L? par des fonctions dans Z(R1) (théo- 
rème 27.50(5)), c'est-à-dire qu’il existe des fonctions Dh € Z(R°) telles que 


L?(R4 5/22 
On (1+ |E 2) à. (31.60) 
Nous posons 
On 
ne 1.61 
MT DL 


Cela est encore une fonction de Z(R£), et donc de .7(R%). Vu que la transformée de Fourier est 


une bijection de Z(R4) (proposition 29.26), nous pouvons considérer une suite 41 € Z(R1) telle 
u HS(R°) 
que Dn = Ÿn, et nous allons montrer que © ——"u. 
Nous avons : 


ken ue = [ ,1ôn GP + era (81.622) 
= [. G Fo a(E) (1 + €2)°dé (31.62b) 
= [be -a(@Q + Pa (81.620) 
= |ôn — (1 + 2)%2/22. (31.624) 


Par définition de la suite d, nous avons donc bien 


lon — ulfrs = |ôn — (+8) /@£2 — 0. (31.63) 


x : À HS 
Notons que même si , est dans (Rd), nous n'avons pas prouvé la convergence 9, —— u, 


mais bien @n H°, %. Or les fonctions En sont dans .7(R4), et rien n’assure qu’elles soient à support 
compact. Nous avons donc bien prouvé la densité de .S et non celle de Z. 


Remarque 31.16. 
Pour qui a tout compris, cela peut sembler une évidence, mais nous précisions que nous parlons 
de densité de .7(R4) dans HS(R4), à aucun moment la topologie de .7(R4) n'entre en compte. 
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Un peu moins évident : ce que nous avons réellement montré est la densité de (Z(R*)) dans 
H*(R1) où & est l'application « prise de classe ». Nous n'avons pas insisté là-dessus, mais il faut 
dire que dans la preuve de la proposition 31.15, u est un représentant d’un élément choisi dans 
He CR) 

Nous avons ensuite prouvé la convergence |9n — u|ysçm4) — 0 qui est une convergence d’une 
suite dans R, et dans laquelle l'opération |.| #7: est définie sur un espace de fonctions et n’est pas 


une norme (c’est pour que cela devienne une norme que l’on prend les classes). 

, . 8 Rd 

Nous en avons déduit la convergence w» M ) 
H“(RÔ). 


u où maintenant w, et u sont des classes dans 


PROPooLIQJooKpWtnV 
Proposition 31.17. 
La partie (R°) est dense dans (H°(R°), |. era) 


Démonstration. Nous savons déjà que .7(R) est dense dans H*(RŸ) par la proposition 31.15. 
Nous devons seulement prouver que Z(R) est dense dans (.7(R9), |.| Hs(me) Pour cela nous 
utilisons la densité de Z(R‘) dans .7(R°) de la proposition 27.228. Soit donc f € .7(R°) et une 
suite f, dans Z(R4) telle que 


S(R4 
pb (31.64) 
Vu que la transformée de Fourier est continue sur .7(R‘) (proposition 29.20) nous avons aussi 
» SR) 
rs (31.65) 


et en particulier pour tout polynôme P nous avons la convergence uniforme 
a j A E DTMU 
Pi, “ Pf. ne OP0b) 


D'autre part la fonction £ + |fL(£) — f(8)|2(1 + 225 est Schwartz et en tout point décroissante 
en k. Soientt € > O0 et r > 0 choisis de telle sorte à avoir 


[LA — fol + er < « (31.67) 
l>r 
pour tout k. La convergence uniforme (31.66) permet de considérer ko tel que pour tout k > ko, 
€ 
— |A + ÉY < ———— 31.68 
dans B(0,r). Avec tout cela, dès que k > ko nous avons 
bee J A fla+eyæ- ft +| 2e (3160) 
R B(0:r) (HES 
Donc nous avons bien | fr — f|xsma) — 0 et convergence de f} vers f dans H*(R°). 
31.2 Trace 
Définition 31.18 (|695]). 
Nous définissons la trace d’une fonction par 
: D(R°) —+ Z(R! 
vo: 2(R°) (RT ) (31.70) 
fon): Me) lobe. a 0) 
THOo0oXEJZooBKtXBW 


Théorème 31.19 (1697, 695]). 
Si s > à, alors yo accepte une unique extension en opérateur linéaire borné 


Jo: H°(RS) — H5-2 (RS). (31.71) 
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Démonstration. Nous subdivisons la preuve en plusieurs pas. 


(1) Une inégalité pour we Z(R) Nous commençons par considérer w € Z(R4) (fonction 
CT à support compact). Nous allons alors prouver que 


hobly-3 me < Kleleq (31.72) 


pour une certaine constante X (qui ne dépend en particulier pas de ). 
Nous avons 


Mobl,- Le) — (0 V0) yes (31.73a) 
= [tie + 1e ae (31.73b) 
= J AIM (me ae (1 + je 

(31.734) 


Nous appliquons la trace en appliquant la formule du corolaire 29.27, 


(og)(x) = p(x,0) = : [ L eV (x, y)dy dk (31.74) 


En remplaçant dans (31.73c) nous avons 


di D. dy dk dx|” (1 S—2d 
hole = x balles Lee trot, spy de dxl(t + 1e?) 
. 
Nous voudrions permuter les intégrales en k et en x. Pour cela nous étudions la fonction 


u: R x Rd! = C donnée par 


u(k;æ) = e#e | e Er (x, y)dy (31.76) 
R 

Effectuer l'intégrale par rapport à y revient à calculer la transformée de Fourier partielle dont 

nous parlons dans la proposition 29.21 *. Elle est donc une fonction Schwartz de k et de x 

(conjointement et non seulement séparément) et est donc dans L!(R x R41). Les intégrales 

sur kÆ et sur x peuvent donc être réunies et permutées par le théorème de Fubini 14.297 

(n'oubliez tout de même pas de vous convaincre que la condition (2) est remplie). 


Nous avons donc 


het qe = 97 Lt fa fee iéro(e pay de dkP( + 1e P)-êdé 
(31.77) 
Étant donné que w est à support compact, les intégrales sur x et sur y peuvent se réunir en 
utilisant encore le théorème de Fubini; ces intégrales donnent : 


| ee TE Dr, y)dx © dy = J EE EH) (x, y)dx @ dy = P(E,k). (31.78) 
Rd-1xR Rd-TxR 
Nous restons avec 
1 1 
2 +, 2» 2 2\s—> 
Mol res mar _ 2x [. | k CARACAS  # 


Nous allons maintenant traiter la partie du milieu : 


il 
RER PIe 


s-| J O(E, Hd = | J PE HU+EHR2)"2 dk| = (fr, fo)zaqmal (81.80) 
R R 


4. Dont une relecture de la preuve ne serait vraiment pas de trop, ainsi que la preuve de 27.222. 
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Ici € est vu comme une constante et les fonctions fi et f2 sont 
fi: ke Q(E,k)(1 + €2 + k2)92 (31.81a) 


1 
ke 
dé (+8 +22 


Nous pouvons utiliser l'inégalité de Cauchy-Schwarz 11.1 : 


| : _ 1/2 1 1/2 
&< (Lise, (1 + +12) x) ([. appt) (31.82) 


Nous notons g(£) ce qui se trouve dans la seconde parenthèse (après intégration sur k). Avec 

cela nous continuons : 

2 1 
1 < — 

H°-35(Rd-t) 2x 


(31.81b) 


noel La, Lsoiec mp +e +2) + era ae (31.83) 


Vu que ® est Schwartz, la fonction qui est à l’intérieur des deux intégrales est dans L'(R%1 x 
R) et nous pouvons réunir les deux intégrales : 
2 1 


< = 
Iopl 3 ea 0 


[ _— l(ô)IÈ(E, k) (1 + E2 + k2)5(1 + le?) 2 dk @ dé. (31.84) 


À ce point nous démontrons qu’en réalité la combinaison g(£)(1 + e2)s-3 ne dépend pas de 
£. En effet 


s— 1 s—1 1 
g(E)(L + L)3 = (1 + E2)9-3 LE at (31.85) 
1 1+€ \° 
= dk 31.85b 
(1 + €2)1/2 LS) ( ) 
1 f | 1 | 
_ dk. (31.85c) 
2 
CET ANEES 
Nous effectuons le changement de variables t = —Æ—, dk = (1 + &2)!/24#, et le tout vaut 


VE 


le +) dt, (31.86) 


qui est effectivement indépendant de £. Nous nommons cela K (auquel nous ajoutons le +) : 


qu Ke IAE +67 + HAE @ dE = Kolr.qe (31:87) 
Nous avons donc prouvé pour tout w € Z(R‘) (avec redéfinition du K) : 
EQooNWCIoo ] 
Moël 3e, < Alle: (LSS) 


À propos de classes Il serait tentant de conclure en disant que Z(R‘) est dense dans 


H*(R%). Hélas, techniquement, l'ensemble Z(R1) n’est même pas un sous-ensemble de H*(R£) 
parce que ce dernier est un ensemble de classes de fonctions. Ce petit détail a ici son impor- 
tance parce que 70 n’est pas une application qui descend aux classes. En effet, R1 étant de 
mesure nulle dans R, deux fonctions de la même classe peuvent différer en tous les points 
de RŸ-! en même temps. 

Notons & l'application qui consiste à prendre la classe, c’est-à-dire &(f) = [f]. Ce qui est dense 
dans H*(R4), c'est (Z(R4)). Or chaque classe contient au maximum une seule fonction 
continue (qui sera même de classe C® à support compact pour les éléments de &(2)). 
L'application 70 considérée est l’application composée entre le 0 classique et le choix du 
représentant continu dans la classe. La formule (31.88) que nous venons de prouver est valide 
pour l’application 70 vue comme 


0: (2(R°) — 2(RT). (31.89) 
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(3) Densité et conclusion Ce que la majoration (31.88) prouve est la continuité de l’appli- 
cation 


do: (2%), |-Iaeçme) — (A°-2(R4 1) (31.90) 


ÿ | e-3 _ ‘ 
Mais la proposition 31.17 nous donne la densité de la partie Z(R‘) dans H(R4). La propo- 
sition 17.130 nous donne alors une extension 


no: (HR), Lee) — (A È(RYS) (31.91) 


à Mise) ° 


Remarque 31.20. 

L'extension n’est pas évidente parce que les éléments de H(R4) sont en général des classes de 
fonctions dont les valeurs sur le bord ne sont pas du tout fixées du fait que le bord soit de mesure 
nulle. 


31.3 Théorème de plongement 


L'objet des théorèmes de plongement de Sobolev est de montrer que si s > 2 + k alors les 


éléments de H°(R‘) possèdent des représentants de classe C*. Avant de démontrer le théorème, 
pour alléger, nous allons donner deux lemmes. 


LEMooZIBIooANHyPy 
Lemme 31.21. 
Soit (u;) une suite dans 7/(R9) telle que 
HS(R4 
"- (31.92) 
avec $s > 0. Alors nous avons aussi la convergence 
L?(Rd4 
"ii. (31.93) 


Démonstration. Vu que s > 0 nous avons (1 + k?)* > 1 (ici nous écrivons k? pour |k|?). Par 
conséquent 


Rd Rd 
Nous avons alors 
La. : 
lu; — ulre = En là; — à|r2 (31.95a) 
1 2 
- n. _# 1. 
End l là; — à| (31.95b) 
1 _ 2 12 2 
< ———  — 1 “dk 1. 
PS [. lâ, — a + )4 (31.950) 
1 
LEMooGDTXooJRudME 


Lemme 31.22. 
Soient des fonctions uj € .7(R1) telles que 


CYR) ,|.|00 
u; DL je (31.96) 


Alors nous avons la convergence 


J Ujp — Î Up (31.97) 
Rd Ré 
pour tout y e .S(R4). 
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Démonstration. La suite (u;) est équibornée. En effet il existe une queue de suite pour laquelle 
fu; —vlx < €; cette queue de suite est alors équibornée par |v| + €. Le début de la suite est un 
nombre fini de fonctions, toutes bornées. Le maximum des bornes donne alors une borne. 

Soit donc M > 0 tel que [u;(x)| < M pour tout x € R4 et pour tout j € N. Nous avons 
alors |u;p| < M\p| pour tout j et les fonctions [u;w| sont majorées par la fonction M|o| qui est 
intégrable. Nous pouvons donc utiliser le théorème de la convergence dominée de Lebesgue 14.200 
nous donne 


lim ujp = J Up. (31.98) 
Rd Rd 


j—0 


Nous pouvons écrire la conclusion du lemme 31.22 sous la forme 
Cu, P)L2(RaI) — (UV, P)L2 (Ra) (31.99) 


pour tout we. (Rd) (et non pour tout w e L?(R°). 
THOo0UHIPO0oXSEKVI 


Théorème 31.23 (Théorème de Sobolev avec k = 0[698]). 
Soit s > Ÿ et ue H*(R*). Alors u possède un représentant dans C8(R‘) (les fonctions continues 
et qui s’annulent à l'infini). Nous écrivons cela H°(R4) & CYR“). 


Démonstration. Nous commençons par supposer que u € H*(R1) n .7(R1), et dans ce cas nous 
notons u le représentant dans .7(R4). Nous allons prouver l'inégalité 


lu < cul ysçre) (31.100) 


La formule d’inversion de Fourier 29.26 appliquée à u; donne 


— Pa D Er G(E)dk, 


nous avons alors 


(2r){u(x)| < J là(k)|dk (31.102a) 
Rd 
L J a+ 2)2la(|(1 + #2) %24R (31.102b) 
Rd 
: [ (la + y)" (a+ y)" de (31.102c) 
Rd SE  —_—7 EE ———  ———— 
f 9 


Ici il convient nous arrêter un instant pour nous convaincre que f et g sont réellement des éléments 
de L?. En ce qui concerne f, c’est facile : à est une fonction Schwartz. En ce qui concerne g il 
faut l’intégrabilité de |gl?, c’est-à-dire de k + (1 + k?)—*. Cela a lieu si et seulement si 2s > d 
et donc a lieu dans les hypothèses du théorème. Nous utilisons le théorème de Cauchy-Schwarz ° 
pour continuer : 


Cnÿu(a)l < | flz2llelzs (31.108) 
1/2 
=. ( [ua + Ky°aK) (31.108) 
Rd 
= Cul sçma). (31.103c) 


Donc en introduisant le facteur (2r)% dans la constante c nous avons 


Iulo < cul rs me) (31.104) 


5. Formule 11.2. 
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Cela est tout ce que nous voulions faire avec u € .7(R). 
Nous considérons maintenant u € H(RŸ). Vue la densité des fonctions Schwartz dans H° 
(proposition 31.15) nous considérons une suite (u;) dans .7(R‘) telle que 


| H: RO) 


u; (31.105) 


Ici u est une classe, mais nous identifions u; avec sa classe (parce qu'il ne faut pas exagérer non 
plus). La suite (u;) est de Cauchy dans H*, donc si € > 0 est donné, il existe N tel que sin,m > N, 
um — Un| < €. Nous avons alors aussi 


[Um — Unlloo < CE, (31.106) 


ce qui signifie que (u;) est également une suite de Cauchy dans (C°(R%),|.|+) qui est un espace 
complet par la proposition 12.369. 
Il existe donc une fonction v € CS(R1) telle que 


. (CHR) . EnooBNGCogRUAQUX 


J 


La question est de savoir si nous pouvons déduire que v est un représentant de u. 
Par le lemme 31.21 nous avons également la convergence 


L?(R£) 
CS 


(31.108) 


Pour tout 4 € .7(RŸ) nous avons alors 


Cuj, P}12 — ÇU, P}rz. (31.109) 


Mais en même temps, la convergence (31.107) couplée au lemme 31.22 donne également 


uj, 12 — KV, P}L2. (31.110) 


Par unicité de la limite (dans R) nous avons 


(v,p)r2 = (u,P}r? (31.111) 


pour tout w € .7(R4). La proposition 30.1 appliquée à u — v montre alors que u — v = 0 presque 
partout, c’est-à-dire que v est bien un représentant de u. 

Le représentant v de u est non seulement continu (comme limite uniforme de fonctions conti- 
nues), mais également bornée, comme limite uniforme de fonctions Schwartz. 


Proposition 31.24 ([698]). 
Si ue H°(R°) (s€ R) alors 


(1) due H°-lel(R), 


(2) l'application 
6%: H°(R) —+ H°l4(R) (31.112) 


est continue. 
Note : ici © est l'opération de dérivée faible. 


Démonstration. Nous allons seulement prouver que 0j: H*(R) — H°-1(R4) est bien définie et 
continue. Par composition, la thèse suivra. 
Soit u € H*(RŸ) par le lemme 31.10 nous avons 


dju = iéjà. (31.113) 


6. Au sens où l’espace d’arrivée est bien celui-là. 
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D'autre part, la fonction 
J:R'-R 
v (31.114) 


L 2er 
1+ ff 


est bornée (et même indépendamment de 4) par une constante X. Donc nous avons pour tout ? s : 
k(1 + |kl?)S < KG + kf2) 5. (31.115) 


Avec cela nous pouvons calculer un peu : si u € H*(R4), nous avons 


be -| Eu + 23148 (31.116a) 
Rd 

= | k;l@|(1 + k?)51dk (31.116b) 
Rd 

<| Klä|(1 + k?)°dk (31.116c) 
Rd 


Nous avons donc que |0;u|y<-11m4) est fini lorsque u € H*(R°). 
La majoration |0;u| < K|u| donne la majoration suivante pour la norme de l’opérateur à; : 


10] = sup : Ir < K. (31.117) 


lu HS—= 


Le fait d’être borné implique d’être continu par la proposition 11.62. 


Théorème 31.25 (Théorème de plongement de Sobolev [698]). 


Soient keN ets > 5 + k. Alors EQcoï 120007: 
H“(R‘) € CR). Ga EF T8) 


Remarques : 
— L'espace CÂ(R1) est l’ensemble des fonctions de classe C* qui s’annulent à l'infini. 
— L'inclusion (31.118) signifie que tout élément dans H° possède un représentant dans Cf (R“). 
Démonstration. Pour k = 0, c’est le théorème 31.23. Si |a| < k nous savons que du € HS GC 
C$(R1). Cela signifie que les dérivées faibles sont continues, mais pas qu'il existe un représentant 


qui est réellement k fois continument dérivable. 
Soit u e HS(R%) et une suite (u;) dans .7/(R4) telle que 


| H°R6) 


u, (31.119) 
Vu que l’espace topologique (CË (Rd), ||) est complet il existe v e C£ tel que 
CE 
Uj — vd. (31.120) 
Il reste à montrer que v est un représentant de u. Cela se fait comme plus haut en montrant que 
2 
ü; E, 


7. Question : dans [698], il faut dépendre cette constante de s. Je ne comprends pas pourquoi. 


Chapitre 32 


Équations différentielles ordinaires 


Une équation différentielle ordinaire est la recherche de toutes les fonctions définies sur une 
partie de R satisfaisant à une certaine égalité, faisant intervenir les dérivées de la fonction recher- 
chée. 


Définition 32.1. 
Si T est un intervalle de R, une fonction sera dérivable sur I si elle est dérivable au sens usuel 
sur l’intérieur de I, et si elle est dérivable à droite (resp. à gauche) sur l’éventuel bord gauche 
(resp. droit) de I. 


Définition 32.2. 
Une équation différentielle ordinaire d’ordre n sur I est la recherche d’une fonction y : 1 — 
R dérivable n fois, satisfaisant à une équation du type 


Ft,y(t),y/(t),...,y"(t)) =0 pour touttel caequagi ii, 
où I est un intervalle de R et F: (1 x D) C(R x R"*1) — R est une fonction donnée. 


Remarque 32.8. 
L'équation différentielle (32.1) sera raccourcie sous la forme 


PC EEE (32.2) 
où la dépendance en t est sous-entendue. 


Exemple 32.4. 
Soit f : 1 — IR une fonction continue fixée. L’équation différentielle 


ÿ = f( (32.3) 
se ramène à la recherche des primitives de f sur l’intervalle J. A 


Le lemme suivant sert de temps en temps. 


LemuBVozy 
Lemme 32.5 (Lemme de Grônwall). 
Soient et d deux fonctions telles que pour tout t € [to,t1], p(t) > 0, d(t) > 0 et 
t 
ot) <K+L]| v(s)o(s)ds (32.4) 
to 
où K et L sont des constantes positives. Alors 
t 
o(t) < K'exp | Y). (32.5) 
to 
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LEMooUGZGooCczAmKa 
Lemme 32.6 (Lemme de Grônwall[699]). 
Si u,a,be C([0,T],R*) sont telles que 
t 
u(t) < b(E) + Î atutsias (32.6) 
0 
pour tout t E [0,T] alors pour tout t € [0, T] nous avons aussi 
t t 
u(t) < b(t) + Î b(s)a(s)els u)dugs, (2m) 
0 


32.1 Équation homogène, solution particulière 


Voici un petit morceau d’algèbre linéaire. Soient des espaces vectoriels V et W ainsi qu’une ap- 
plication linéaire D: V — W. Nous voulons résoudre D(u) = v, c’est-à-dire déterminer l’ensemble 


D (v) = {ue V tel que Du = v}. (32.8) 
LEMooEWUPooXNJMcc 
Lemme 32.7. 
Soient des espaces vectoriels V et W ainsi qu'une application linéaire D: V — W. Si up € V 
satisfait à Dup = v alors 
DT (v) = ker(D) + up. (32.9) 


Démonstration. Si u € ker(D) + u, alors u = k + u, avec Dk = 0, ce qui donne tout de suite 
Du = Dk + Dup = v. Donc u € D {(v). 

Dans l’autre sens, si u € D-l(v) alors nous pouvons écrire u = (u— up) +up. Vu que u— up € 
ker(D) nous avons bien u € ker(D) + up. 


Ce petit lemme explique pourquoi la résolution d’équation différentielles passe par le principe 
« générale de l’homogène plus particulière de la non-homogène ». Cela marche autant pour les 
équations différentielles ordinaires que pour celles aux dérivées partielles. 


Exemple 32.8. 
Considérons l’équation différentielle ordinaire 


y —y=4. (32.10) 
L'opérateur dont nous parlons est par exemple 
D: C(R) — C(R 
Œ ) a (32.11) 
VRUY —Y. 


Nous devons résoudre Dy = 4 où « 4 » est l'élément fonction constante égale à 4 dans C'?(R). 
L'ensemble ker(D) sont les éléments y € C?(R) tels que y = y : 


ker(D) = {t- Ke tel que K e R}. (42:12) 
Nous devons trouver un élément quelconque yp de D1(4). Facile : yp(t) = —4. 
Au final, 
D71\(4) = {tr Ke — 4 tel que K € R}. (32.13) 
A 


Dans cet exemple nous avons pris V = W = C®(R). Mais souvent nous sommes amenés à 
considérer des espaces plus subtils, parce qu’il existe simplement pas de solutions dans C'®, ou 
alors parce que beaucoup de solutions n’y sont pas. 
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32.2 Que faire avec f(2)dz = g(t)dt ? 
secFairedzdt 
Dans de nombreux exercices d'équations différentielles, nous tombons sur w’ = f(t), et nous 
faisons formellement 
_ =f{t) —= du= f{tdt, (32.14) 


et ensuite, il y a la formule un peu magique 
t 
u—up= | f(t)dt. (32.15) 
to 


Voyons ce qu’il en est. Tout d’abord, il faut comprendre ce que signifie la formule 


f(a)dz = g(t)dt. ÉQDHFEhennf20 


Il s’agit d’une égalité entre deux formes différentielles sur IR où z est une fonction de t. Étant donné 
que z est une fonction de £, il faut voir dz comme la différentielle de cette fonction. La différentielle 
d’une fonction à une variable est donné par la dérivée : 


dé 2 (Cdt (82.17) 
Écrire l'équation (32.16) pour chaque t revient donc à écrire 
fG()z dt = g(t)dt (32.18) 


Cela est une égalité entre deux formes différentielles. Nous avons donc égalité entre les intégrales 
des formes sur un chemin. Prenons un chemin tout simple de to vers t : 


t t 
Ï fG())z (bdt -| g(t)dt. (32.19) 
to to 

Dans le premier membre, nous faisons un changement de variable £ = 2(t), d£ = z/(t)dt, et nous 


obtenons 


z(t t 


| roue = | gtodt. Re 020) 


z0 to 
où nous avons remplacé la constante z(to) par z0 dans la borne d'intégration. Si F est une primitive 
de f et G une primitive de g, nous avons 


F(2) — F2) = G(t) — G(to). (32.21) 


Si aucun problème de Cauchy n’est donné, les constantes F(20) et G{(to) sont mises en une seule 
et nous écrivons la solution 


F(2(t)) = G() +0, (32.22) 


qui est une équation implicite pour z(t). 
Nous trouvons assez souvent le cas simple 


FAda = dt: RE: 


En remplaçant g(t) = 1 dans (32.20), nous trouvons la fameuse 
Z E s 
t— to = ] f(2)dz, FA) 
20 


dans laquelle il y a un abus de notation terrible entre le z de la borne (que les étudiants oublient 
souvent) et la variable d'intégration z!! 
Le passage de (32.23) à (32.24) sera très souvent utilisé dans le cours de mécanique par exemple. 
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32.3 Équations linéaires du premier ordre 


Une équation différentielle linéaire est une équation de la forme 


y + u(t)y = v(t). (32.25) 
EXooVVLGooPWaHUI 


Exemple 32.9. 
Tant qu'il n’y a pas de second membre, c’est facile. Prenons l’exemple suivant : 


y + 2ty = 0. (32.26) 


Nous mettons tous les { d’un côté et tous les y et y de l’autre : 


V 
— = —2t, 32.27 
- (32.27) 
et puis on intègre sans oublier la constante d'intégration : 
In(y) = +0, (32.28) 
et donc y(t) = Ke *. A 


Exemple 32.10. 
Lorsqu'il y a un second membre, il y a une astuce. Prenons par exemple 


y + 2ty = At. FPT) 


L’astuce est de commencer par résoudre l'équation sans le second membre (l’équation homogène 
associée). Nous notons yy la solution. Ici, la réponse est 


ya(t) = Ke *. (32.30) 
Ensuite le truc est d’essayer de trouver la solution de l’équation (32.29) sous la forme 
EqE iLi 
y(t) = K(tje Ÿ. se 51 


L'idée est de prendre la même que la solution de l’équation homogène (sans second membre), mais 
en disant que Æ est une fonction. Afin de trouver la fonction X qui donne la solution, il suffit de 
remettre l’essai (32.31) dans l’équation (32.29) : 


Ki cHRet Abel =4i (32.32) 
—— ———— ——, — 
y'(E) 2ty(t) 
Les deux termes avec K se simplifient et il reste 
K'(t) = 4tef”, (32.33) 


ce qui signifie K(t) = 2et°+©. Nous avons donc déterminé la fonction qui fait fonctionner l’essai, 
et la solution à l’équation est 


y(t) = (2e + Ge =92+Ce*. (32.34) 
Va 


La technique pour résoudre cette équation est de commencer par résoudre l’équation homogène 
associée. Si U(t) est une primitive de u(t), nous avons 


yat) + u(t)ya(t) = 0 


LEE 
VH ÿ (32.35) 
In(ya) = -U(t) +C 


ya(t) _ e-VO+C = Ke-VÜ) 
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où K = et. 


Cela fournit la solution générale de l’équation homogène. Il existe un truc génial qui permet d’en 
tirer la solution générale du système non homogène. Lorsque nous avons trouvé ya(t) = K e-V®, 
le symbole K désigne une constante. La méthode de variation des constantes consiste à essayer 


la solution _. ” 
y = K(be V0, F6) 


c’est-à-dire à dire que la constante est en réalité une fonction. Afin de trouver quelle fonction X(t) 
fait en sorte que l’essai (32.36) soit une solution, nous la remplaçons dans l’équation de départ 
y! + uy = v. Maintenant, 

ve) = K'(tje VO = K(tju(be VO. (32.37) 


En remettant dans l’équation, 
y + uy = K'e Ÿ _ Kue V +uKe V = K'e UV = y, (32.38) 


Notez que les termes en X se sont miraculeusement simplifiés. Cela est directement dû au fait que 
eV est solution de l'équation homogène. Nous restons avec l'équation 


(32.39) 


pour K(t). La solution générale du problème non homogène est donc finalement donnée par 
y(t) = (W(6) + Cje- VE (32.40) 
si W(t) est une primitive de w(t)eU(), 
Tout ceci est un peu heuristique. La proposition suivante dit dans quels cas ça fonctionne. 
PROPooZCXQooPQpkdQ 
Proposition 32.11. 
Soient u et v continues sur I et U, une primitive de u sur I et W une primitive de ve” 


Une fonction y: I — R est solution de y + u(t)y = v(t) si et seulement si il existe une constante 
C'ER telle que 


U sur I. 


y(t) = (W(+) + Cje- VE (32.41) 


pour toutte I. 


32.3.1 Pourquoi la variation des constantes fonctionne toujours ? 


Prenons une équation non homogène 
EqgAst 
2() = O2 + 900), ss 


et supposons avoir une solution de l’homogène associée sous la forme zx(t) = Ch(t). Le coup de 
la variation des constates consiste à essayer une solution pour l'équation non homogène sous la 
forme ! 


2(t) = K(bh(t). (32.43) 


Nous injectons cette solution dans l'équation de départ en utilisant le fait que 2/(t) = K”(t)h(t) + 
K(t)h'(+) : 

K'(E)h(E) + K(E)h'(E) = FE) K(E)h(t) + gb). (32.44) 
Le terme K(t)h'(t) se récrit en utilisant la propriété de définition de h, c’est-à-dire que h’(t) = 
f(t)h(t). Nous voyons que les termes ne contenant pas de X” se simplifient ; il reste 


K'R= 9. (32.45) 


1. Je ne sais plus qui a eu l’idée de changer le nom de la constante de C vers K au moment de la transformer en 
fonction, mais c’est une bonne idée. 
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Cette équation a comme solution 
K = [} LC (32.46) 


J’insiste sur la constante d'intégration! En réalité, celles et ceux qui auront compris l’équation 
(32.24) sauront que Æ est donné par 


_ SO 
K(t) = [ TO (32.47) 


où € joue le rôle de la constante d'intégration. 
Quoi qu'il en soit, la solution générale de l’équation non homogène est 


26) = K(OA(E) = ( J ï de c) h. Fa$olVarcosnrgogr 


Cette solution comprend deux termes : C'h qui est solution de l’homogène, et (S 9) k qui est une 
particulière de l’équation non homogène. 
Quelques conclusions : 


(1) Si vous avez encore du K (et pas que du K7) dans votre équation qui donne K, c’est que 
vous n'êtes pas dans le cadre d’une équation de type (32.42). Le plus souvent, c’est que vous 
avez fait une faute de calcul quelque part. 

(2) La méthode des variations des constantes n’est pas en contradiction avec le principe de 
«& SGEH+SPENH ». En effet, la SGEP et la SPENH sont toutes deux dans la solution (32.48). 

(3) La variation des constantes peut être vue comme une façon cool de trouver une solution 
particulière de l’équation non homogène. 

(4) La simplification ne se fait que après avoir remplacé Kh/ par K fh, c’est-à-dire après avoir 
utilisé le fait que zx est solution de l’homogène. Sinon, la simplification n’est pas du tout 
évidente à priori. Il se peut même que, visuellement, les termes Kh/ et Kfh ne se ressemblent 


pas du tout. Un exemple de cela arrivera par exemple dans l’exemple 32.15, pour arriver à 
l’équation (32.69). 


32.4 Equations à variables séparées 
Secvarsep 
Une équation à variables séparées est une équation de la forme 


y = ue) f(u) 0) 


oùu:1—Ret f:J —1R sont deux fonctions continues données. Les propositions 32.12 et 32.14 
résolvent ce cas, mais avant de voir cela, nous allons donner quelques indications « pratiques ». 


32.4.1 La méthode rapide 


On peut évidemment mettre tous les y et y d’un côté : 


y 
= u(x). 32.50 
y) (x) (32.50) 
Une fois que cela est fait, on écrit y = _. et on envoie le dx du côté des x : 
dy 
—— = u(x)dz. (32.51) 
J(y) 


Maintenant il suffit de prendre l'intégrale des deux côtés : comme la position des dx et dy l’in- 
diquent, il faut intégrer par rapport à y d’un côté et par rapport à dx de l’autre côté. 
L'intégrale à gauche est facile : c’est In(y). À droite, par contre, ça dépend tout à fait de u. 
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32.4.2 La méthode plus propre 


y'(E) = u(t) f(y(6)): (32.52) 


Nous considérons U, une primitive de u sur 1 et G, une primitive de 1/f sur J. Si l' € I et 
y: ['— J, alors y est solution de (32.49) si et seulement si il existe une constante C telle que 


G{y()) = U(# + C. Faso TRpres 


La recherche des solutions de l’équation différentielle se ramène donc à la recherche de primitives 
et de solutions d’une équation algébrique (il faut isoler y(t) dans (32.53)). Réciproquement toute 
solution régulière de cette dernière relation est solution de l’équation différentielle. 

Remarque : lorsque nous cherchons UÜ et G&, nous ne cherchons que une primitive. Il ne faut pas 
considérer des constantes d'intégration à ce niveau. 


32.4.3 Les théorèmes 
ProJLykrK 


Proposition 32.12. 
Soient des intervalles 1 et J de R. Nous considérons des fonctions continues u: 1 — R et f: J — 
R, et nous supposons que f ne s’annule pas sur J. Soit U, une primitive de u sur 1, et G, une 
primitive de 1/f sur J. 

Si l'est un intervalle, une application y: I — R est une solution de 


EQooJVCQooGoVvPv 
(0) = u(#)f (ut) 254) 
si et seulement si il existe CE R telle que 


G(y(t)) = U(t) + C. FasoluceEqDi fées 


Cette proposition dit que toutes les solutions qui ne s’annulent jamais sur un intervalle ont la 
forme G(y(t)) = U(t) + C'et peuvent donc être trouvées en calculant des primitives. 

La formule (32.55) peut être obtenue de la façon heuristique suivante, en écrivant y = dy/dt, 
et en passant le dt à droite. Nous trouvons successivement 


y = u(t)f(y 

dy = u(t) f(y)dt 

dy . 
TO 4 (32.56) 
dy . 
= J (b)dt 
G{y) = U(® + C. 

PROPooIGWTooULXrKI 


Proposition 32.13. 
Soient 0 <r < R ainsi que a € R. Une fonction y: |r, R[| — R est une solution de 


a EQooBQCTooTt 
ÿ(x) = ut). (8337) 
si et seulement si il existe K > 0 tel que 
(er) = Ka. (32.58) 


Démonstration. En deux parties. 
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(1) = Vu que le logarithme est une primitive de la fonction inverse (proposition 15.83), nous 
pouvons utiliser la proposition 32.12 avec les fonctions U(x) = aln(x) et G(t) = In(t). Si y 
est une solution de (32.57), alors il existe C'E R tel que 


In (y(x)) = aln(x) + C (32.59) 


pour tout x € |r, R[. En prenant l’exponentielle des deux côtés, et en utilisant le fait que 
aln(x) = In(x*), 

y(x) = Cent) (32.60) 
En posant À = e{, nous avons un X > 0 tel que y(x) = Kx°. 


(2) = Il suffit de dériver en utilisant la proposition 14.271. Pas de soucis de domaine parce que 
nous ne considérons que x € fr, R|. 


PropÜkmXmC 
Proposition 32.14. 
Soient u continue sur T et f continue sur J, et f(n) Æ 0 sur J. Soient to € T et yo € J. Alors ü 
existe l' € I avec tp € L' et fe CI — J) tels que 
(1) y est solution de (32.49) sur T’ et vérifie y(to) = Yo, 
(2) si z est une solution de (32.49) sur 1" € I" avec to € IL” et z(to) = yo, alors 1" = T' et 


z(t) = y(t) pour tout t e I". 
ExYCPtxgZ 


Exemple 32.15. 
Résoudre l’équation différentielle 


y — cos(t)y! = cos(t)(1 — sin(t))y”. (32.61) 
La fonction y = 0 est solution. En posant z = 1/y, nous trouvons l'équation 
z + cos(t)z = cos(t)(1 — sin(t)) ÉDEQITIO7Eqpo REZ, 
à laquelle z doit satisfaire. L’équation homogène est 


! 2H 
—— | 32.63 
É. cos(t) 


Ceci est une équation à variables séparées que nous résolvons en suivant les méthodes données plus 
haut : nous posons 


ÉQEDUURETEON 


La solution 2x est donnée par l’équation 


In () = In tan É à :) , (32.65) 


K 
= ——— 
tan (5 + 5) 
Nous appliquons maintenant la méthode de variation des constantes sur cette solution afin de 
trouver la solution générale de l'équation (32.62). En utilisant la règle de Leibnitz, 2’ = K'2x + 
K2z}, nous trouvons 


_ + cos(t) ( 


tan (Z + À 


c’est-à-dire 


zx (t) (32.66) 


K' K 
tan(f +4) 2sin2(r+{ 


= cos(t)(1 — sin(t)). (32.67) 
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Malgré leurs apparences, les deux termes en K se simplifient. En effet, en vertu de l’équation 
2m = OL nous avons 
—K —K 
2sin?(F+/)  cos(t)tan(7 +) 


(32.68) 


Le travail de voir quel est le lien entre sin? (% + À), tan (% + À) et cos(t) est en réalité fait dans 
votre formulaire au moment où vous l’avez utilisé pour intégrer u pour obtenir le U(t) de (32.64). 
Après cette simplification durement méritée, nous trouvons l’équation suivante pour ÆX(t) : 


a EDEqFracIli 
ss aFracIT107e0NyprS 
tan (& + 1) 
Résoudre cela revient à trouver la primitive de 
; T t 
(1 — sin(t)) tan (£ + :) . (32.70) 


ce qui est relativement compliqué. La réponse est 


K(t) = In (sin (= =) + 1) +In (sin (= =) L 1) _—. 


2 2 
+ 2 insec ( PE) + 2 sin? ( rie) 


Nous pouvons un peu simplifier en utilisant le fait que In(a + b) + In(a — b) = In(a? — b?) : 


2 
K(t) = In ( cos? (£)) +2 Insec (= =) + 2 sin? ( _ =) , (32.72) 


Il me semble toutefois qu’il faudrait prendre des valeurs absolues pour les logarithmes. 


32.5 Equations linéaires d’ordre supérieur 


32.5.1 Équations et systèmes linéaires à coefficients constants 
SUBSECooMXLVooALNtge 


Nous regardons l’équation 


EqLinC tantR, 
g09 + ag 0 +. + an 19 + any = U(t) RS 


où les coefficients ay; sont maintenant des constantes. Il faut commencer par résoudre le polynôme 
caractéristique 
rt Loartt+... + an = 0. (32.74) 


Si ÀA1,..., À sont les solutions avec multiplicité y1,...,ux, alors le système fondamental de 
solutions linéairement indépendantes est l’ensemble suivant de solutions à l’équation homogène : 


EE tent sfr Tor 
(32.75) 
est, te*rt, _—_ tte lent, 


Nous notons y; ces solutions. La solution générale de l’équation homogène est donc donnée par 


ya = Ÿ Gigi. (32.76) 
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Afin de trouver la solution générale de l’équation non homogène, nous appliquons la méthode de 
variation des constantes, en imposant les n — 1 conditions 


D (ul (0 = 0 Pr CET) 
i=1 


avec { = 0,...,n — 2. Ces conditions plus l’équation de départ (32.73) forment un système de n 
équations différentielles pour les n fonctions inconnues c;(t). 

Cette condition peut paraitre mystérieuse. Il est cependant encore possible de travailler sans 
poser la condition (32.77) en suivant la recette, en calculant des déterminants de Wronskien. Des 
exemples sont donnés dans les exercices sur le second ordre. 


32.5.2 Si les coefficients ne sont pas constants ? 


Une équation différentielle linéaire d’ordre n sur 1 est une équation de la forme 
_ EqLinR 
D a (ge D + un (O9 + un(é)y = v(t) AHINRAPPERS 


où v et uz, sont des fonctions continues fixées de 1 vers R. 

Pour résoudre cette équation, il faut commencer par résoudre l'équation homogène correspon- 
dante (c’est-à-dire celle que l’on obtient en posant v(t) = 0). Ensuite, nous trouvons la solution de 
l'équation (32.78) en appliquant la méthode de la variation des constantes. 

Donnons un exemple du pourquoi la méthode de variations des constantes est efficace. Soit 


l'équation a. | 
1 Xxem e 
nr Fu = alé. q prets 


et disons que uz est une solution de l’équation homogène. La méthode de variations des constantes 
consiste à poser u(t) = K(t)un(t), et donc w’(t) = K'un + Ku%. En remettant dans l'équation de 
départ, 

K'un + Kuy + fKun = 9. (32.80) 


La somme Kw} + fKux est nulle, par définition de uy. Par conséquent, il ne reste que 
t 
x! = 96) (32.81) 
UH 


Lorsqu'on utilise la méthode de variation des constantes, nous trouvons toujours une simplification 
« miraculeuse ». 

Dans l’immédiat, nous ne considérons que le cas où les u; sont des constantes. Le cas où les u; 
deviennent des fonctions de t sera vu plus tard. 


32.6 Système d’équations linéaires 


32.6.1 La magie de l’exponentielle... 
SUBSECooMDKIooKaaK17 


Prenons l'équation différentielle très simple 
y = ay. (32.82) 


La solution est y(t) = Aef. Et si on a la donnée de Cauchy y(to) = ÿo, alors 
y(t) = Aeteratopato eat to)y(to). Fay texpos impe gi ro 


Donc on a le facteur multiplicatif e®(-4) qui sert à faire passer de y(0) à y(t). C’est un peu un 
opérateur d'évolution. Ce qui fait la magie de l’exponentielle, c’est son développement en série 


2 3 4 


= Let + + Hi Fev Eee 
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qui est tel que chaque terme est la dérivée du terme suivant. 
Maintenant, si on a un système 
ÿ = Ayÿ, (32.85) 


il n’est pas du tout étonnant d’avoir comme solution ÿ(t) = et où l’exponentielle de la matrice est 


définie exactement par la série (32.84). C’est un peu longuet, mais dans le cours, c’est effectivement 
ce qui est prouvé. La matrice résolvante R(t, to): Yo — Y(t; to, Yo) est donnée par 


R(6, to) = elt-to)A, (32.86) 


exactement comme dans l'équation (32.83). 


32.6.2 ...mais la difficulté 


Maintenant, il est suffisant de calculer des exponentielles de matrices pour résoudre des sys- 
tèmes. Hélas, il est en général très difficile de calculer des exponentielles. Tu peux essayer de 
prouver les deux suivantes : 


| (32.87) 
0 a s cosh(a) sinh(a) 
S = me = |. | 
a 0 sinh(a) cosh(a) 
La première, tu vas la revoir si tu fais de la géométrie différentielle ou de la mécanique quantique : 
l’algèbre de Lie du groupe des matrices orthogonales de déterminant 1 est l’algèbre des matrices 
antisymétriques. 
La seconde se retrouve en relativité parce que e° est la matrice qui préserve x? —y?, tout comme 


eÀ préserve x? + y. Quelques mots sur l’uutilisation des fonctions hyperboliques en relativité 
dans 42.4.8.1. 


32.6.3 La recette 


Afin d'éviter de devoir calculer explicitement des exponentielles de matrices, nous faisons appel 

à toutes sortes de trucs, dont la forme de Jordan. Le résultat final est la méthode suivante. Soit le 
système homogène 

y = Aÿ. (32.88) 


(1) D'abord, nous calculons les valeurs propres de A. 


(2) Ensuite les vecteurs propres. ItemRapSystDe 


(3) Une bonne valeur propre, c’est une valeur propre dont l’espace propre a une dimension égale 
à sa multiplicité. C'est-à-dire que si À est de multiplicité m, alors on à, dans les bons cas, m 
vecteur propres linéairement indépendants. 

Dans ce cas, si v1,...,Um sont les vecteurs, alors on a les solutions linéairement indépendantes 
suivantes : 


an let, Du le, (32.89) 


Pour chaque bonne valeur propre, ça nous fait un tel paquet de solutions linéairement indé- 
pendantes. 

(4) Si À n’est pas une bonne valeur propre, alors les choses se compliquent. Mettons que À ait 
k vecteurs propres en moins que sa multiplicité. Dans ce cas, il faut chercher des solutions 
sous la forme 

ar +... + a 
: et. EqEqRapAsTe 5. 30) 


age +... + a) 
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C'est-à-dire qu’on prend comme coefficient de e?, un vecteur de polynômes de degré k. Il faut 
mettre cela dans l’équation de départ pour voir quelles sont les contraintes sur les constantes 
al ) introduites. ItenRapSystDe 

(5) Nous avons un cas particulier du cas précédent. Si À est une valeur propre de multiplicité m 
qui n’a que un seul vecteur propre v, alors il faut chercher des polynômes de degré m — 1, et 
on peut directement fixer le coefficient de {”-{, ce sera l’unique vecteur propre : 


(m—2) 
ai 
v [+ s Nés... ler, (32.91) 
(m—2) 
An 


Cela économise quelques calculs par rapport à poser brutalement (32.90). 


32.6.4 Système d’équations linéaires avec matrice constante 


Nous considérons l’équation différentielle 
E 
y/(t) = Ay(t) 055) 


pour la fonction y: R — R’" et À est une matrice ne dépendant pas de t. Nous supposons que À 
est diagonalisable pour les vecteurs propres v; et les valeurs propres À; correspondantes. 


La matrice 
A()= [etes eu] (32.93) 


est la matrice résolvante du système. Alors la solution du système (32.92) pour la condition 
initiale y(0) = yo est 


y(t) = R(t)yo. (32.94) 
En effet 
Î î 
AR(t) = | A |'eïty, |... À |enty, || = R'(+). (32.95) 
| | 


Par conséquent y/(t) = R'(t)yo = AR(t)yo = Ay(t). 


32.6.5 Système d’équations linéaires avec matrice non constante 
ThoNYEXqx0O 


Théorème 32.16 ([700]). 
Soient I un intervalle de R et M: R — L(R",R”") une fonction. Si les composantes M;; sont des 
fonctions continues sur T alors : 


(1) pour tout to € I et pour tout yo € R" le système 
Eqk 
y (6) = Mby(0) SNET0E) 


admet une unique solution maximale définie sur T telle que y(to) = % ; 


(2) l’ensemble des solutions de l'équation (32.96) sur T est un espace vectoriel de dimension n. 


32.7 Réduction de l’ordre 
SecWGdleRM 


Afin de diminuer l’ordre d’une équation dans laquelle le paramètre n’apparaît pas, il y a deux 
changements de variables très utiles. Le premier, le plus simple, est simplement de poser 2(t) = 
y'(t), ce qui donne 

2'(t) = y"(t). (32.97) 


Le second, qui n’est pas le même, est z(y(t)) = y/(t), qui entraîne 


"(= (0) = (0) (v0)). (32.98) 
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Dans ce second cas, il faut également changer de variable, et utiliser y(t) comme variable au lieu 
de t. 

Si ça ne marche pas, il faut suivre la procédure ci-après. 

Nous supposons avoir une équation différentielle d’ordre p dans laquelle y®) est isolée des autres 


dérivées : —. 
yo) = Ft y(E),y(0,...,yP-0() 25798) 


où f est une fonction f : IR x IR? — R, et la fonction cherchée est y: R — R. 
La méthode proposée ici consiste à transformer cette équation d'ordre p en un système d’équa- 
tions d'ordre 1. Pour cela nous posons 


F:R x ER? — R? 
T2 


_—. (32.100) 


Tiaret) 
Nous considérons alors l’équation différentielle 


Y'(t) = F(4,Y(#). FE 40) 


pour Ÿ : R — R?. La fonction y = YA résout l’équation (32.99) si et seulement si la fonction Y 
résout l’équation (32.101). 

De plus si l'équation (32.99) est donnée avec les conditions initiales y) = ax (k=0,...,p—1) 
alors l'équation (32.101) vient avec les conditions initiales 


Yo) = | : |, (32.102) 


c'est-à-dire Y (to) = Ao avec A9 € R?. 

Le théorème de Cauchy-Lipschitz 17.42 nous donne existence et unicité locale de la solution au 
système 32.101. Lorsque le système est linéaire, c’est-à-dire sous la forme Y”(t) = M(t)Y(t), alors 
il y a mieux : le théorème 32.16. 


EXooSHMMooHVfsMB 
Exemple 32.17. 
Nous considérons l’équation différentielle 
u”(t) — u(t) =1 (32.103a) 
u(0) = &EeR (32.103b) 
u(0)=aeR, (32.103c) 


et nous voulons montrer que ce système accepte une unique solution. Vu que l’équation différentielle 
se présente sous la forme w” = f(t,u) avec f(t,u) = —1 — u nous posons 


F:R x R? — R? 
__—. ( Lo ) (32.104) 


—1 — T1 
et nous considérons l'équation différentielle 
en) (32.105) 


pour la fonction Y : IR — IR?. La fonction F est Lipschitz (et même globalement) par rapport à Y. 
En effet, 
LF(œ) — F7 = (2 — yo) + (ai — y)? = (x — yl?. (32.106) 
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Le théorème de Cauchy-Lipschitz 17.42 s'applique et en posant Yo = (ao, ai), il existe une unique 
solution à l'équation Y’ = F(t,Y) vérifiant Y (0) = Yo. Nous notons t + Y(t) cette solution. 
En quoi cela nous aide ? Nous posons u(t) = Yi(t). Alors 


UD =N=FGCr)=r (0. (32.107) 
En dérivant encore, 


u"(t) = Y(t) = BE, Y) = —1- Yi(t) 1—u(t), (32.108) 


ce qu’il fallait. La fonction t > Yi(t) est solution de notre équation de départ. Quid des conditions 


initiales ? Vu que u = YA et w = Y2 nous avons ? 
u(0) = Y1(0) = (Yo)1 = 40 (32.109) 
et 
u'(0) = (Yo)2 = a1. (32.110) 


Toutes les prescriptions sont respectées. 
Si vous voulez vraiment résoudre cette équation, il faudra plus de travail. D'abord résoudre 
l'équation homogène associée, c’est-à-dire l'équation caractéristique r? + 1 = 0, ce qui va donner 


ug(t) = Aeï + Be #, (32.111) 
et ensuite faire le coup de la variation des constantes pour déterminer la solution générale du 
problème non homogène. A 

EXo0oJNOMooYqUuwTZ 


Exemple 32.18. 
Nous reprenons l’équation différentielle 


u"(t) — u(t) = 1. FRS) 


Nous avons déjà vu dans l’exemple 32.17 que cette équation avait une solution unique pour toute 
condition initiale. Cette fois nous voulons étudier les solutions lorsque nous imposons les conditions 
aux limites u(0) = u(r) = 0. Nous allons voir qu’il n’y à pas de telles solutions. 

Pour ce faire, soit une solution u. D'abord w” existant, la fonction uw est de classe au moins C1. 
Mais u” = —1—u, donc w” est également C!, ce qui donne la régularité C° pour w. En continuant 
ainsi nous trouvons que u est de classe CT. 

Le truc est de considérer la fonction v(t) = sin(t) qui vérifie l'équation différentielle 


—v"—v=0 (32.113a) 
v(0) = (32.113b) 
vi0)= 1. (32.113c) 


( 
Nous calculons le produit scalaire sur L?(10,7[) de (32.112) avec v : 


Cul, 0) + Cu, u) = —(v, 1). FORMES 


Le calcul de {v, 1) est simplement l'intégrale de sin(t) pour t allant de 0 à x, c’est-à-dire Çv, 1) = 2. 
Vu que u et v sont toutes deux des fonctions qui s’annulent en 0 et en 7 nous pouvons faire des 
intégrations par partie les yeux fermés et exprimer {w”,v) sans dérivées sur u : 


£a” ,u> = —{u',v'> = {u,v”> = —{u, v} (32.115) 
où la dernière égalité n’est autre que le fait que v = sin, donc v” = —v. Le membre de gauche de 
(32.114) vaut donc zéro alors que celui de droite vaut —2. 

Nous concluons que le problème aux limites posé n’admet pas de solutions. PA 


2. Dans les équations suivantes, il faut faire attention aux notations : Y6 est le vecteur Yo, tandis que YA est la 
première composante de la fonction Y. 
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32.8 Autour de Cauchy-Lipschitz 


SECooNKICooDnOFTD 
Dans cette section nous étudions les équations différentielles du type 
y'(t) = ft, y(t)) (32.116a) 
y(to) = Yo. (32.116b) 
32.8.1 Fuite des compacts et explosion en temps fini 
Théorème 32.19 (Fuite des compacts[701, 484]). 
Nous considérons l'équation différentielle 
y'(6) = f(t,y(t)) (32.117) 
y(to) = yo: (32.117b) 


où f: 1 x (Q — IR" est continue et Q ouvert dans R". Soit la solution maximale yum: Ju = 
Témins tmarl — À Si tmax < SUP(L) alors ym(t) sort de tout compact de Q lorsque t — tax. 


Démonstration. Soit K un compact de Q et nous considérons une suite (4) dans [tin tmaxl telle 
que tm — max: Si nous supposons que ym(t) ne sort pas de X alors nous avons ym(tm) € K, 
c’est-à-dire une suite dans un compact. Quitte à passer à une sous-suite, nous supposons qu’elle 
est convergente. Soit x1 € K la limite lim, YM(tm) = T1. 

Vu que tar € 1, la condition initiale y(tynax) = 1 est valide et le théorème de Cauchy- 
Lipschitz 17.42 nous donne une unique solution maximale yP définie sur un ouvert JP autour de 
max: 

Nous allons maintenant construire une solution au problème initial qui contredit la maximalité 
de ym. Attention : il n’est pas évident à priori que yp(t) = ym(t) sur l'intersection des domaines. 
Si c'était évident, la proposition serait démontrée. 

Soit J = Ju Ù Jr A Témin, +00[ et la fonction 


t) sit<t 
= Ut ee (32.118) 
Et). SE ro: 
La fonction ÿ est continue par construction parce que 
, Jim ym(t) —= Li — Eloge (32.119) 
Nous vérifions à présent que ÿ est une solution : ÿ'(tmax) = f (nas, Yimas)) : 
Ga Ut = €) sn Die) Hé YM (mar — €) . Delta) (32.120a) 
e—0 € e—0 € 
... UM ln on €) mi Ve lbaae = €) + VP lé — €) — UP Ha) 
e—0 € 
(32.120b) 
t — €) — ae 
= lim YP(tmaz — €) — YP(émaz) (32.120c) 
E— € 
= YP(tmax) (32.120d) 


Donc ÿ est solution pour la condition initiale ÿ(tmax) = æ1 et coïncide avec yp en tynax et AVEC YM 


avant émax- Donc en réalité yp, ym et ÿ sont identiques et cela contredit la maximalité de y. 
CorGDJQooNEIvpp 


Corolaire 32.20 (Explosion en temps fini). 
Soit (Ym:7) la solution maximale du problème de Cauchy (17.156) : 


y = f(t,y) (32.121a) 
y(to) = yo, (32.121b) 
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avec f:U=1XxQ— R"? où I est ouvert dans R et Q ouvert dans IR”. Nous supposons que f est 
continue sur U et localement Lipschitz par rapport à y. 


Si la solution maximale est définie sur J = ltyin: tmaxl alors nous avons l'alternative suivante : 
ItemOLYYooJVkRf) 


(1) Soit max = SUP(L), ITEMooUKFAooXwRNSB 


(2) soit tmax < Sup(T) et lims +... [y(E)| = 00. 


Le résultat tient aussi mutatis mutandis pour tin: 


Remarque 32.21. 
Attention : ceci n’est pas une simple paraphrase de la fuite des compacts. L'information supplé- 
mentaire que ce corolaire donne est que la solution sort de tout compact pour ne plus y retourner. 


Démonstration. L'hypothèse tmar < Sup(Î) signifie que la solution finit d’exister avant que les 
hypothèses sur f cessent d’être vraies. C’est-à-dire que la solution maximale est moindre que ce 
que nous aurions pu espérer. 

Soit un compact K. Supposons que que pour tout to < tmax il existe t € [to, tmarl tel que 
ym(t) € K. Alors cela crée une suite {; dans J telle que y(tx) est dans X. Comme dans le 
théorème de la fuite des compacts nous concluons l'impossibilité de la chose. 

Donc pour tout compact K de Q, il existe T < tar tel que yu(t) € Q\K pour tout t € [T, tmaxl. 
En prenant des boules fermées de plus en plus grandes en guise de compacts nous concluons que 


lim [yar(#)| = ©. (32.122) 


NORMooZROGooZfsdnZ 
32.22. 
Notons que si tmax < %, Si nous sommes dans l'alternative 32.20(2) et si la solution maximale y 
est de classe CT (ce qui est le cas lorsqu'on utilise Cauchy-Lipschitz 17.42) alors la dérivée de y est 
également non bornée dans un voisinage de tmax- 
Mais si f est globalement bornée, alors dans l'équation y = f(t, y), la dérivée y/ sera globale- 
ment bornée. Dans ce cas, la solution ne peut pas exploser en temps fini et existe donc globalement. 


ii Avertissement /question au lecteur !! 32.23 
Êtes-vous d'accord avec 32.22 ? 


Exemple 32.24. 
Soit l'équation différentielle 


y = y(y — 1)sin(yt) (32.123a) 
y(0) = : (32.123b) 


La fonction f(t,y) = y(y—1)sin(yt) ayant une dérivée bornée partout, elle est localement Lipschitz 
et le théorème de Cauchy-Lipschitz 17.42 s'applique. Pour toute condition initiale, une solution 
maximale unique existe. 

Si nous oublions la condition initiale, il est facile de trouver des solutions constantes : y = 0 
avec y(t) = k donne l’équation 


0 = k(k — 1)sin(kt). (32.124) 


Les solutions yi(t) = 0 et y2(t) = 1 sont des solutions existant pour tout t. 
Le graphe de la solution correspondante à la condition initiale y(0) = 1 ne pouvant pas croiser 
les graphes de y1 et w, elle est obligée d’exister pour tout t parce qu’elle ne peut pas exploser en 


temps fini. VAN 
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32.8.2 Écart entre deux conditions initiales 
PROPooUPRRooQgYFDKk 


Proposition 32.25 ([699, 702]). 
Soit une fonction f: 1 x Q — R” continue et globalement Lipschitz en sa seconde variable (Q est 
un ouvert de R”). Soient deux solutions y1: 11 — R” et y2: 12 — R" aux problèmes 


gite) = FE yi(E)) (32.125a) 
yi(to) = &. (32.125b) 
Alors pour tout t € l1 n là nous pouvons estimer l’écart entre y1 et y2 par la formule 

lan (8) — y] < el ollar — a2], (32.126) 
où L est la constante de Lipschitz de f. 


Démonstration. Nous avons d’abord les majorations suivantes, qui semblent juste jouer avec les 
notations, mais qui utilisent le fait (contenu dans le théorème de Cauchy-Lipschitz) que y; soit de 
classe C1 : 


t 
Ig1(E) — y(t)] = | (yi(s) — (s))lds (32.127a) 
to 
t 
< | 1f(s,y1s)) — f(s,ya(s))|ds (32.127b) 
to 
t 
<L | lan(s) — va(s)lés. (32.170) 
to 
C’est à ce moment que nous utilisons le lemme de Grünwall. Vu que 
t 
hat - (1 < L | lua(s) - u(s)lds, (32.198) 
to 
nous sommes dans les hypothèses de Grünwall 32.6 en posant 
u(t) = Ii) — y2(6)| (32.129a) 
b(t) = |y1(0) — y2(0)| (32.129b) 
a(t) = L. (32.129c) 
Nous avons la majoration 
t 
Ig1() — y2(t)] < y1(0) — va(0)| + | lg (0) — y(0)1e ds. (32.130) 
0 


Le calcul de l’intégrale intérieure donne 


14 
[ gs = lu) (32.131) 
: L 
Avec ça, nous avons 
lan () — y(t)| < e“]aa (0) — y(0)|. (32.132) 


32.26. 

Notons que la proposition 32.25 est plutôt une mauvaise nouvelle parce que les solutions restent 
seulement linéairement proches l’une de l’autre lorsqu'on rapproche les conditions initiales, mais 
elle divergent exponentiellement vite avec le temps. Donc deux trajectoires arbitrairement proches 
au départ finissent assez vite par être bien séparées. 

Cette proposition est cependant cruciale parce qu’elle explique que pour des petits t, les solu- 
tions ne s’écartent pas beaucoup, c’est-à-dire que pour t fixé, l’application qui à une donnée initiale 
fait correspondre la solution en t est continue. C’est le premier pas pour parler de régularité du 
flot. 
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32.8.3 Flot d’un champ de vecteurs 


Nous reprenons l'équation différentielle du théorème de Cauchy-Lipschitz 17.42. En ce qui 
concerne les notations, 1 est un intervalle ouvert de R contenant 0 et l’application f : 1 x IR? — IR” 
est continue et localement Lipschitz en sa seconde variable. Pour a € R”, nous notons (J;, ya) la 


solution maximale (donc y,: J, — R”) du problème PAROI OREAREE 
ya(t) = F(t, Ya(t)) (32.133a) 
ÿa(0) = a. (32.133b) 


Nous noterons aussi de temps en temps w(#, a) = Ya(t). 

Nous savons que t > yA(t) est de classe Cf, et cela est directement dans le théorème de Cauchy- 
Lipschitz. Une question d’une toute autre difficulté est la régularité de a + yat) pour t fixé, et 
encore pire : celle de (t,a) — Ya(t). 

Il se fait que l’application (t, a) + y(t) a la même régularité que celle de f, mais cela va être un 
peu long à prouver. En ce qui concerne la régularité C!, ce sera le théorème 32.33 dont la démons- 
tration, comme vous pouvez le voir sera copieuse et demandera des propositions intermédiaires pas 
simples. 


Définition 32.27. 
Si t est fité, l’application 
4: R°'—R" 
ve p(i,x) = Yr(t), 
est le flot du problème de Cauchy (32.133). 


L'application t — + est ce qui est appelé le groupe à un paramètre de flot, pour des raisons 
qui arriverons plus tard”. 


(32.134) 


Le but est d'étudier les propriétés du flot : est-il continu, un difféomorphisme, existe, pour 
quels t ? Où se cache le champ de vecteurs du titre dans l’équation différentielle ? 
Nous posons 
D = |] (JZ x {x}). (32.135) 
en 
Comme tout produit d'espaces métrique, l’ensemble D est muni d’une métrique via la défini- 


tion 7.215. 
PROPooUDQWooNFrNOQ 


Proposition 32.28 ([699]). 

Soit un intervalle 1 ouvert de R contenant 0 et Q un ouvert connexe de IR”. Soit une application 
J: TIXR" — R’ continue et localement Lipschitz en sa seconde variable. Pour a € R”, nous notons 
(Jas Ya) la solution maximale (donc Ya: Ja — R”) du problème 


Ya(t) = F(t, Ya(t)) (32.136a) 
Ya(0) = a. (32.136b) 
Nous posons 
D= | ](J2 x {x}). (32.137) 
zen 


Nous définissons la fonction $ par g(t,x) = ys(t) là où ça existe. 
L'ensemble D est ouvert. L'application w: D — Q est localement Lipschitz. 


Démonstration. Soit (s,a) € D et (Ja, Ya) la solution maximale passant par a en t = 0. Par 
définition de D nous avons 8 € J,. Nous considérons J, un compact inclus dans J, et contenant 0 
et s en son intérieur. Nous posons 


K = J x ya(J). (32.138) 


3. ou pas... 
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Vu que % est continue, cela est un compact. Chaque point de X possède un voisinage ouvert sur 
lequel f est Lipschitz { ; nous considérons un sous recouvrement fini et le maximum des constantes 
de Lipschitz. Cela nous crée un voisinage V de K dans 7 x Q dans lequel f est Lipschitz. 
Vu que V est ouvert et K est compact avec K € V, nous pouvons trouver un ouvert V’ et un 
compact K’ tels que 
KevVek er (32.139) 


Sur ce V”, la fonction f est de plus bornée parce que continue sur le compact K’. Nous renommons 
V' en V. Sur V nous avons : 

— |flo,v < M, 

— f est Lipschitz en sa seconde variable, de constante de Lipschitz L. 


En tant qu’espace produit, nous avons une distance sur Z x ( donnée en 7.215 : 


d(é,y), (€,y)) = max {lé €, [y — y|}. (32.140) 

Nous posons 
Ve(K) = {ze I x Q tel que d(z, K) < e} (32.141a) 
We = {(t,y) € J x Q tel que ]y — wat)] < €}. (32.141b) 


(1) We V(K) 
Soit (t,y) € W.. Nous avons : 


d((£,y), K) = TE re AE U) (#',y')) (32.142a) 
= inf max{t—#|]y—4]}.  PVPEROOUCZHeORPI ES 
(e,y')}eK 


Mais demander (t, y) € W signifie que t € J et |y — ya(t)| < €. Dans X nous avons l'élément 
(t, Ya(t)) qui vérifie 
d((E y), (6 va(t))) = 1y— y < € (32.143) 


Donc l’infimum de (32.142b) est majoré par €. Nous avons prouvé que W. € V.(K) et donc 
même inclusion pour les fermetures. 


(2) Il existe € > 0 tel que V(K) € V 


Supposons que V.(K) ne soit inclus dans V pour aucun €. Alors nous considérons 


2n € Vin(K)\V. (32.144) 

Nous avons par définition d(2», K) < L. Vu que Æ est compact, il comprend (au moins) un 
élément réalisant la distance : soit z/, € K tel que 

dense) = die, K). (32.145) 


Nous avons d(z»,2,,) — 0, de telle sorte que les valeurs d’adhérence de (z,) et (2,,) sont les 
mêmes. Et comme (2}) est une suite dans un compact, elle a des valeurs d’adhérence. Soit 
Zx l’une d'elles. Vu que c’est une valeur d’adhérence d’une suite contenue dans le compact 
K, elle est également dans K : 24 € K. Mais en même temps, z, est hors de l’ouvert V, et 
donc dans le fermé V®. Les valeurs d’adhérences restent dans le fermé, c’est-à-dire z4 € V. 
Vu que K € V, il y a contradiction. 


Donc il existe € > 0 tel que W(K) € V. 
(3) Il existe € tel que W. € V 
Il suffit de prendre le € dont nous venons de parler pour avoir 


W.cV(K)cev. (32.146) 


4. Cela est à peu près la définition d’être localement Lipschitz : 12.330, voir aussi 12.331. 
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Soit le e en question, et T > 0 tel que J € [-T,T]. Nous posons r = ce ŸT, Soit be B(a,r) et 
X={reJ} tel que ]0,7] © Ji et (t,yt)) e WeVte [0,r]}. (32.147) 


Nous allons prouver que À = J} en prouvant qu'il est ouvert, fermé et non vide dans J}; — 
J n]0,00f. Nous parlons bien de la topologie de J,, celle induite ® de R. Vu que 0 € J, l’ensemble 
J+ est ouvert à gauche, mais comme il est compact, il ne va certainement pas jusqu’à +00, de telle 
sorte qu'il est fermé à droite. Les ouverts de J, sont les ensembles de la forme © À J, où © est 
ouvert de R. Il y en a de la forme [0,m|. 

(1) À est fermé 

C'est parce que We et J, sont fermés. 
(2) X est ouvert 


Soit Tr € X. Si r = supJ., alors À = J, est un ouvert de J,. Supposons donc que 0 < T < 
sup J,. Dans ce cas nous avons 
(rw(r))eWe ce v, (32.148) 


et nous pouvons résoudre localement le problème de Cauchy 


y'(6) = f(t,y(t)) (32.149a) 
y(T) = ir, b) = wir). (32.149b) 


Ce y existe jusqu’à 7 + 7 (pour au moins un petit 7), et par l’unicité de la solution, y = y 
sur |[7,T + n[. Ceci pour dire que le flot w(.,b) existe au moins jusqu’à 7 + 7. 
Grâce à la proposition 32.25 nous pouvons évaluer 


(Cr, 6) — pr, a)| = Iga(r) — (nl < e271b— al. (32.150) 
Comme nous avions choisi r = ce-T et be B(a,r) nous avons aussi |b— a] < ce T et donc 
l(r,6) — pr, a)| < ee < e (32.151) 


parce que nous avions 7 < sup J4 < T,, ce qui garantit que eL(T-T) < 1. 

Est-ce que ceci nous garantit que 7 + 7 € X ? Il faudrait (r + 7, YEÛT + n)) e W, c’est-à-dire 
Ayo(r + 7) — yalr + n)| < €. L'ensemble J} étant fermé dans l’ouvert J,, ce dernier déborde 
certainement. Prenons donc 7 assez petit pour que %, existe jusqu’en T + 7. 


Vu que %, et y, sont continues, et qu’en 7 elles sont distantes de moins de €, en 7 + n, elles 
restent distantes de moins de € (quitte à prendre encore 7 plus petit). 


Ceci nous permet de conclure que X est ouvert. 
(3) X est non vide 


La solution y au problème 


vtt) = ft, yet) (32.152) 
yo(0) = b (32.152b) 
existe au moins localement et vérifie |y(0) — y,(0)| = |b — al < ée-!T < €. Par continuité 
nous avons 

IyE(É) — ya(t)| < € (32.153) 


pour tout t dans un voisinage de 0. Donc X est non vide. 


(4) Conclusion pour X 


La partie X est ouverte, fermée et non vide dans J} qui est connexe. Donc X = J} par la 
proposition 7.68(4). 


5. Définition 7.24. 
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La conclusion X = J} nous enseigne que pour tout { € J} nous avons ]0,t] € J, et (#, yo(t)) E 
W.. Nous pouvons faire la même chose pour J_ et au final nous avons que pour tout Tr € J nous 
avons d’abord 7 € J,, ce qui prouve J € 4. De plus pour tout t € J nous avons aussi 


(é,w(t)) e We € V. (32.154) 


Nous en concluons que 
JxB(arlev (32.155) 


Nous savons de plus que pour tout be B(a,r), J € J. Cela signifie que 
IX Bar) 2, (32.156) 


Mais J x B(a,r) est un voisinage de (5, a) qui était au début de la preuve un point générique 
choisi dans D. Donc D est ouvert parce qu’il contient un voisinage de chacun de ses points. 

Il nous reste à voir que w: D — Q est localement Lipschitz. Soit donc le point générique (s, a) 
dans D et l’ensemble V qui avait été construit plus haut. Nous allons montrer que & est Lipschitz 
sur J x B(a,r) € V. D'abord sur V, l'application f est Lipschitz, donc 


< el#]b1 — bol < e/T bi — bal (32.157) 


ICE, b1) — GE, b2)| 


pour tout t € J et b1,b2 € B(a,r). 
Ensuite, f est bornée, majorée par M sur V, donc 


1p(é1, 0) — (62, b)| = Î y'(s)ds| (32.158a) 
[t1,t2] 

L Î f(s,y(s))ds| (32.158b) 
[t1,t2] 

_ Ï |f(s,w(s))|ds (32.158c) 
[t1,t2] 

< Mt — tol. (32.158d) 


Et enfin nous prouvons que w est localement Lipschitz. En posant k = max{e/T, M} nous avons 


lo(E1, b1) — (42, b2)] < (E1, b1) — (1, b2)] + (tr, ba) — (42, ba)] (32.159a) 
< e°7 bi — bol + Mt — to] (32.159b) 
< K(|b1 — bol + [ti — tal) (32.159c) 
< 2k max{|b1 — bo], |t1 — t2|} (32.159d) 
= 2kd((b1,t1), (b2,t2)). (32.159e) 


Le flot 4 est donc Lipschitz de constante 2k. 


Exemple 32.29. 


ii Avertissement /question au lecteur !! 32.30 
Cet exemple doit être lu attentivement. Il me semble prouver que le fiot n’est pas dérivable en la 
condition initiale sans que f le soit. Le document [703] semble dire le contraire. Je ne suis pas 
assez sûr de mon coup pour contredire. 

Il n’y a pas de raisons de penser que a + yat) soit mieux que continue sans hypothèses 
supplémentaires sur f. Pour illustrer cela nous considérons l’équation différentielle 


= #f X(5),5) (32.160a) 
X(t)= x (32.160b) 
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où t et x sont des paramètres fixés. Nous allons étudier la dérivabilité de X en x lorsque 
fe 0 = |#|: (32.161) 


Cela est un exemple typique de fonction autant Lipschitz que l’on veut sans être dérivable. L’équa- 


tion différentielle est _. 
5 6) = |[X(s)|. (32.162) 


Si x > 0 alors X(s) > 0 dans un voisinage de s = t{ et nous avons X(s) = Ke. La constante K se 
fixe par la condition initiale X(t) = x : 


X(s) = re, (32.163) 


Et cette solution tient en réalité pour tout s parce que X (5) est alors toujours positif. 
Si au contraire x < Ü nous avons la solution 


Xe) = er *, (32.164) 
Au final, 
ze six <0 
X(ss,t)=<0 si tæ = 0 (32.165) 
ve + sr > 0 


L'application (s,x,t) + X(s;x,t) est continue. En ce qui concerne la dérivée partielle 0,X en 
æ = Ô nous avons : 


06 __. A(s,et)—X(s,0,t) - _. X(s,6t) FAROTARAGS FFE 
Ox e—0 € e—0 € 
La limite à droite donne : 


lim = = est, (32.167) 


La limite à gauche donne : 
1 RE (32.168) 
€e—0— € 
Les deux limites n'étant pas égales, la limite (32.166) n'existe pas et l'application (s,x,t) + 
X(s,x,t) n’est pas dérivable par rapport à x. A 
PROBooYUYQooSBsrNh 
ii Avertissement /question au lecteur !! 32.31 
Je ne suis pas tout à fait certain de la définition du V dans le lemme 32.32. Il faudrait écrire la 


preuve complète pour s'assurer. 
LEMooUJSNooXTJoEf 


Lemme 32.32 ([704]). 
Soit un application A: B(to,T) x Ba, R) — L(R") continue par rapport à sa première variable 
(beRetaeR”}). Nous considérons l'équation 


Le b) — A(t,b)#(t,b) (32.169a) 
Y(to,b) = bo. (32.169b) 


Alors il existe un voisinage V de a dans lequel nous avons l'estimation 


ICE, v) — DE w)|< Ipolr max _|A(s,v) — A(s,w)|x 


sEB(to,7) 


8€B(to,7) 


x exp È max _max{|A(s,u)|; |A(s,w)|} 


(32.170) 


pour tout t E B(to,T) et v,w € V. 


6. Si vous comptez donner ça à manger au jury d’un concours, soyez prudente et n’écrivez pas l’équation (32.166) 
au tableau. Réfléchissez comment rédiger cela correctement. 
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THOooSTHXooXqLBoT 
Théorème 32.33 (Régularité C! du flot [704]). 
Soit un intervalle ouvert I de R et un ouvert connexe Q de R”. Soit une fonction f € C! (EXO; EE 
ae et to € TI. 
Il existe un voisinage W x V = B(to,T) x B(a,r) de (to, a) dans TX et une unique application 
p: W x V — Q telle que 


ba) = f(b (6,2) (321712) 
p(to, x) = x (32.171b) 


pour tout x € V. 
L'application (t,x) — y(t,x) est de classe C*. 


ii Avertissement /question au lecteur !! 32.34 

La preuve qui suit doit être lue avec beaucoup d'attention, en particulier sur les incohérences pos- 
sibles de notations, et sur les oublis possibles de précautions oratoires type « quitte à encore réduire 
les voisinages V et W ». 


Démonstration. En termes de notations, pour x € ( fixé nous écrivons y;(t) pour w(t,x) et pour 
te I fixé nous notons w(x) pour y(t,x). 

De plus lorsque nous écrirons des choses comme g: IR — KR, nous n’entendrons pas que g est 
effectivement définie sur tout IR. La notation « g: IR — R » indiquera seulement que la variable 
de g est réelle, et que nous comptons préciser le domaine plus tard. Cette remarque s'applique 
seulement à cette démonstration et non à l’ensemble du livre. 

Nous considérons À > 0 tel que B(a,2R) € Q et ensuite nous posons V = B(a, R). La fonction 
Yx, Solution pour la condition initiale y(to) = x est définie sur W = [to — T,to + 7] et prend ses 
valeurs dans B(x, R). Ceci est parce que y, est continue, alors en prenant 7 assez petit, la valeur 
de y;(t) ne va pas s'éloigner de x lorsque t ne s’éloigne pas de to. 

Nous savons déjà de la proposition 32.28 que w est C'! en t et localement Lipschitz en sa seconde 
variable, avec une constante Lipschitz uniforme sur W x V. Elle est donc continue en tant que 
fonction 


p:VxW-—R". (32.172) 


(1) La différentielle partielle Df  Pout t fixé nous notons Df(4x) la différentielle de f par 
rapport à x. C'est-à-dire que 


Dfax): R" — R” 
d (32.173) 
ur CE + su) 


S= 


C’est un élément de L(R”), l’ensemble des applications linéaires de R” vers R”. Nous allons 
montrer que 


(é,x) + Dffr) (32.174) 


est continue en tant qu’application R x R” — £L(R”). Pour cela nous introduisons l’applica- 
tion d’inclusion 4: R° — R x R”, i(u) = (0,u). Elle donne 


Dial) = TTF((62) +s0,0))] = dfes ci(u) (32.175) 


Autrement dit 
D f(x) = df(tx) © À. (32.176) 


Or l'application (t,x) + df(,) est continue par hypothèse (f est de classe C1) et l'application 


£L(R x R°,R”) — L(R",R") ENooZTAPongeiqiel 
Ar Aoi | 
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est également continue. Donc (t,x) - Df(,) est continue ?. 


(2) L’équation aux variations 


Soit x € Q. Nous introduisons l’opérateur 


Sx: R x L(R”") — L(R’) 


32.178 
Sr(t, Ÿ) EE D J(t,yx(t)) o Ÿ. ) 


Par ce que nous avons raconté, cela est une fonction continue en sa première variable et 
. ; à k : < 2 
Lipschitz en sa seconde variable. Nous identifions L(R”) à R”. 


ON B SA 
Toujours pour chaque x considéré nous posons l’équation différentielle ordinaire F0 POQHEE 
Oÿ 
Ze) = Se(e (tx) (32.179a) 
Y(to, x) = Id. (32.179b) 


qui est une équation différentielle ordinaire pour Ÿ: R x R°? — £L(R”) rentrant dans le cadre 
de Cauchy-Lipschitz. 


Quel est le domaine de définition de Ÿ pour sa première variable ? C’est un ouvert autour 
de to. Nous réduisons W de telle sorte que la solution wŸ soit définie sur W. Idem pour la 
variable x qui est dans un voisinage de a. 


L’équation (32.179) s’appelle l'équation aux variations. Nous allons montrer dans la dou- 
leur que + est continue et est la différentielle de w4, c’est-à-dire que 


(dpi)s = w(t,b). (32.180) 


(3) 4 est continue en (t,x) (début) 


Il s’agit de majorer les deux termes de 


CE, a1) — Dé, a2)| < té, a) — dt, a1)| + (w(t2, 1) — dé, af RTRS 


(3a) Premier terme 


Nous avons 


Méta, 6) — wta, 0] = | L% (s,b)ds| (32.182) 
< Ï —. o p(s,b)|ds (32.182b) 

[t1,t2] 
<[ IPécacllé(sbids (82.1820) 

[t1,t2] 


jnax VC ERAEEE 


ty —-tol max |D 
LA AR | Ju 


Nous allons majorer le second maximum. Prenons { € [0,7]; et posons A(u,b) — 
D F(uyytu) Pour alléger les notations. Par l'équation de définition de 4% nous avons 


pt, b) = w(0, b) + Î RECONOUES (32.183) 


et donc 


IDE, b)1 < Ipol +] , 1A(u,b)|l(u, b)|du. (32.184) 


; 


7. Si quelqu'un peut prouver ça de façon moins verbeuse, je suis preneur. Il me semble que quel que soit la façon dont 
on s’y prend, sous le capot, on passe par la continuité de l'application (32.177). 
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En y appliquant le lemme de Grünwall dans sa version 32.5 nous trouvons 


I(s,b)| < || exp | | | |A(u, nu) (32.185a) 
< |Vol| exp (s max | A(u, 2) | (32.185b) 


En retournant à (32.182d) nous avons %0 = Id et donc |#| = 1 et 


max |w#(s,b)] < max exp (s . Dune) (32.186) 


se[t1,t2] selti t 2] 


Là dedans nous pouvons remplacer t par max{|t1|,|t2|}. Posons enfin, pour alléger les 
expressions 
a(t1,t2,b) = nes FAEONLE (32.187) 


La majoration que nous retenons est : 


ICE, b) — (62, b)| 


Cela tend vers zéro lorsque t1 — t2. 


< |t1 — tla(t1, to, b) exp (max{lti|, [t|}a(0, #, b)). (32.188) 


(3b) Deuxième terme 


En ce qui concerne le second terme, 


LÉ, b1) — WE, 02)| (22.189) 
nous utilisons le lemme 32.32 qui donne, pour t € [to — T,to + |, 
Mô(E, b1) — WE, 82)| < r max |Dfou (9 — Dfom (ol 
s€eB(0,7) 
(32.190) 
x Exp : max{|D fau, (91: 1D fs, (51) : 
Dans notre cas, to = 0, donc te [—r,r|. Vu la continuité de Df, nous avons 
ae (D fau = Démo + 0 (32.191) 
lorsque b1 — b2. 
(3c) Ÿ est continue en (t,x) (fin) 
Les deux bons calculs faits, nous avons, en repartant de (32.181), 
Id (E1, b1) — (É2, b2)| = 0, (32.192) 


7 es 
ce qui signifie que 4 est une fonction continue de ses deux variables en même temps. 


(4) Différentiabilité de Y (début) 
Nous montrons maintenant que Do(t, x) existe. Pour rappel, D est la différentielle par rap- 
port à la seconde variable. Nous sommes à étudier l’existence de Do(,5) = d(vr). Nous 
posons 


(Eh) = Eb+R) — 6(E,b) = yorn(t) — vo(t) (32.193) 


où b est le point où nous étudions la différentiabilité. Il est dans un voisinage du point a fixé 
depuis le début et autour duquel il existe un voisinage qui donne un sens à tout ce que nous 
avons fait jusqu’à présent. La dépendance de 0 en b est implicite. Vu que & est Lipschitz en 
sa seconde variable, nous avons la majoration 


le(é, h)| < CJAI Ds al 
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dès quete V'etbb+hew. 
De plus, parce que to est le temps de la condition initiale nous avons 


O(to, h) = Yb+h(to) — yo (to) =a+h-a=h. (32.195) 


Et aussi, par définition de w : 


t ê t 
v(E, b) = Ÿo + J es b)ds = Ÿo + J Dee Ô p(s, b) (32.196) 
to to 
En appliquant à h et en se souvenant que Vo = Id, 
t 
dE. b)h = h+ J rats op(s, b)}h ds. (32.197) 
to 
Puis on peut faire un calcul assez classique en se souvenant que 4(to,h) = À : 
t _ÿw cp 
O(E,h) = 8(to,h) + | [= (s,b+h) — (s,b)]ds (32.198a) 
to CE ot 
t 
= h+ J [F(s, Yorn(s)) — f(s, yv(s)) |ds. (32.198b) 
to 


On fait la différence entre les deux : 
t 
O(t,h) — y(t,b)h = -| [D faute) © V(S,b)h — fs, vorn(s)) + f(s,wo(s))]ds. (32.199) 
to 


Nous y ajoutons et soustrayons D f,,(0(s, h) et nous retenons la majoration suivante : 


t 
le(é,h) — de, )h| < Ï IDfoncyÉ (88) — Dfpateyé(s h)lds 
to ne PAU) 


t 
n [ 1fG, ns) — Fa (8) + Dfeute0(s, h)lds. 


Nous allons encore majorer ces deux termes séparément. Soit € > 0. 


(4a) Premier terme 


Ce qui est dans la norme à majorer est 


D fs (U(S,6)h — 4(s,h)). (32.201) 


Vu que Df est continue et que y, est continue”, l'application s + D Ésyts) St continue 
et donc de norme majorée sur le compact [to,t]. Nous rapellons la notation 


(32.202) 


a(to; t, b) — clio il IR I, 


et nous majorons encore et toujours. D’abord 
t t 
L IDfemcor(e(s 0h — 0(8.m)lds < attoit, [ Wé(s,0 — 4(s,H)lds. (82.20) 
to to 


(4b) Deuxième terme 


Pour traiter le deuxième terme, nous allons provisoirement noter x = y(s) et y = 
Yo+n(s) ; entre autres, y — x = 0(s,h). Ce qui est écrit dans le second terme de (32.200) 
est 


fs, y) — f(s,x) + DIESAES h) a fs, y) — f(s,x) + D f(5,x)(Y — x) (32.204) 


8. Il faut encore réduire les voisinages V et W pour que ceci ait un sens. 
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(4c) 


(4d) 


Comme D ne s'applique pas à la variable s, nous pouvons alléger la notation et déduire 
de la différentiabilité de f qu'il existe un 7 > 0 tel que x,y € W avec |y — w|] < n 
implique 


1 FCu) — f(x) — Dfx(y — x) < ely — x]. (32.205) 
Prenons |h| < n7/C' (le C de (32.194)) ; en déballant les notations, 
LA(sen(s)) — (8 u(s)) — Dontoy8(8, 1 < el8(8, HD] < CII. (82.206) 


Les deux termes ensemble 


En remettant les deux dans (32.200) nous trouvons la majoration 
t 
18, h) — DCE, b)h] < [t — toleCTR] + a(to, t, v) | Ib(s,b)h— 0(s,h)|ds (32.207) 
to 


qui est encore de la graine à Grônwall avec 


u(t) = |4(t,h) — d(t,b)| (32.208a) 
b(t) = |t — toleC|R| (32.208b) 
a(s) = a(to,t,v), (32.208c) 


la troisième étant une fonction constante. Cela donne, pour t € [to — T,to + 7|, 


14 14 
ICE, R) — D(E,b)h] < t — toleC IR] +| (s — to)eC|h|a(to, t, b) exp (| (to; t, idu) ds. 
to 


S 
(32.209) 
En valeur absolue, la différence s — to est majorée par 7, l'intégrale dans l’exponentielle 
vaut (t— s)a(to,t,b), et restons avec 


14 
I8(4,R) — p(t,b)h| < reCIR| + 7 | eCIRla(to, t, b)eXCtort ls) gs. (32.210) 


to 
En supposant t > ty nous pouvons calculer l'intégrale. Si vous m'avez suivi jusqu'ici, 
vous devriez avoir de tels maux de tête que je vous donne la réponse : 


t 
| a(to,t,b)et-Sattonb)gs = elto-Daltott) _ 1, (32.211) 
to 


En remettant dans l’expression, 


|8(É, h) — p(t,b)h| < reC|hl + eClhla(to,t, bre to) — 1) = reChet-toatéto), 
(32.212) 
Nous pouvons majorer t — to par 7 et @(t,to,b) par a(to — T,to + T,b) pour avoir la 
majoration 
184, h) — p(4,b)h] < reCIhleTto-rto+rb), (32.213) 
Différentiabilité de Y(t,b) (fin) 
Nous écrivons la définition 11.226 de la différentiabilité : nous voulons vérifier que 
t — p(t,b) — Y(t,b)h 
bn PC 0 + h) — (6,5) — W(E,5) 
h—0 [Le] 


= 0. (32.214) 


Nous remplaçons @(t,b+h)—{(t,b) par 4(t,h) et prenons la norme avec les majorations 
données : 


lim CAC b + h) ss at b) e (+, b)h| < lim reCeT%to-Tito+r.b) (32.215) 


— 


Cela étant valable pour tout €, nous en déduisons la nullité de la limite. 
Nous avons démontré que 4 était différentiable par rapport à sa deuxième variable et 


que 
Dour = Y(t,b). Sol TE 
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5) Conclusion : v est de classe C! 
p 


Nous avons déjà prouvé que (t,b) > #(t,b) est continue. Donc de (32.216) nous déduisons 
que les dérivées partielles (£,b) (4, b) sont continues. Mais comme % est Lipschitz en t, 
la dérivée partielle (£,b) Ce (4, b) est également continue. 

La continuité de toutes les dérivées partielles de @ nous donne la classe C1 pour @ par le 
théorème 12.306. 


PROPooINLNooDVWaMn 
Proposition 32.35 (Régularité C? du flot{[705]). 
Soit un intervalle ouvert I de R et un ouvert connexe Q de R". Soit une fonction f € CP (Ix Q, R), 
ainsi queae Q ettoe I. 
Il existe un voisinage W x V = B(to,T) x B(a,r) de (to, a) dans I xQ et une unique application 
p:WxV — Q telle que 


(4,2) = f(t,v(t,x)) (32.217a) 
p(to, x) = x (32.217b) 


pour tout x € V. 
L'application (t,x) + p(t,x) est de classe CP. 


Démonstration. Nous savons déjà par le théorème 32.33 que (t,x) > w(t, x) est de classe C!. Nous 
supposons que f est de classe CP avec p > 2. 

Vu que et f sont de classe Cl, nous avons aussi que l'application (t,x) + f (#, p(#, x)) est de 
classe C1. L’équation donne alors immédiatement le fait que 


(tx) 4e x) (32.218) 


est de classe C1. 
En ce qui concerne la régularité par rapport aux autres variables, il faudra travailler un peu 
plus. 


(1) Une équation différentielle pour le flot Nous allons commencer par un habile jeu d’écri- 


ture : la formule : 


p(t,x) = x + Ï J(s,ç6(s,x))ds (32.219) 


to 


devient . 


eut) = 2 + | rs e())ds: EQooQGV0oeyAEgen 


to 
Dans le même ordre d’idée nous notons f(x) = f(s,x), et ce qui se trouve dans l'intégrale 
(32.220) n’est autre que la fonction 


gs(x) = (fs 0 ps)(x). (32.221) 


Tout cela pour différentier l'égalité (32.220) par la proposition 17.28 : 


(A 
(dpt)x = Id +| (dgs)xds (32.222a) 
to 
(A 
= Id +| (dfa) y (x) O (dps)sds. (32.222b) 
to 


Nous dérivons ensuite cela par rapport à t : 


(des) = (fac © (de) Fo) 
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Cela est une égalité dans L(R?). 
Nous introduisons la fonction 
F:Ix £L(R?) x Q — L(R") 


(é, A,x) + (dfé)qute) © À. (32.224) 


En fait, à la place de J et Q il faut prendre des petits voisinages dans lesquels les choses ont 
un sens. Ce que dit l'équation 32.223 est que l’application 


A:IxA- L(R') 


(32.225) 
(x) = (dpi)x 
vérifie l'équation différentielle PRO ENT 
À 
Lt x) — Ft, A(i,2),s) (32.226a) 
A(to,x) = Id. (32.226b) 


Une autre équation différentielle 


Nous n'oublions pas l’équation différentielle pour la dérivée par rapport à t : 


Pa) = F(belh2). D 


Réécriture pour la différentielle 


Nous allons récrire l’équation (32.226) de façon à ce que le paramètre x soit inclus dans la 
condition initiale. De cette manière, la solution pourra profiter de la régularité C! du flot 
déjà prouvée dans le théorème 32.33. 
Soit 

g: I x (L(R") x Q) — L(RM) x Q 


(#, (4,2) (F(& a,2),0). 


Nous posons E = L(R”) x Q; c’est cet espace qui va jouer le rêle de Q. Nous considérons à 
à _ 4 ep S : : EQooSMYÜooDaxgQx 
présent l’équation différentielle suivante pour z,: 1 — E :| 


0e) CER0R0) (82.220) 


22(€) 
z(to) = (Id, x). (32.229b) 


(32.228) 


Il devrait y avoir un indice (Id, x) à z parce que c’est sa condition initiale. La fonction g est 
de classe C?, donc cette équation admet une unique solution dont le flot est de classe C. 
Autrement dit, si S est dans un voisinage de Id, l'application 


(x) » 2) (32.230) 


est de classe CT. Nous allons montrer qu’en posant A(t,x) = z1(t), nous avons une solution de 
(32.226) (l’unicité de la solution impose que cette solution est effectivement la différentielle de 
ds). D'abord, la seconde ligne de l'équation différentielle est 2,() = 0, c’est-à-dire z2(€) = x 
pour tout £. 

Sachant cela, la première équation devient 


At) = F(t,a(6),x) (32.231a) 
zi(to) = Id, (32.231b) 


qui est l’équation différentielle pour À. Rappel : il y a partout une dépendance de z en sa 
condition initiale x que nous n’avons pas écrite pour des raisons de légèreté notationnelle. 
Il n’en reste pas moins que le flot de l'équation différentielle pour z est C!, c’est-à-dire que 
(t,x) + z(t) est de classe C1. 

Par conséquent, (t,x) + A(t,x) est également C1. 
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(4) Régularité C? du flot 

Le fait que À soit C! n'implique pas que le flot le soit parce que le fait le flot suive la même 
équation différentielle que À ne n’implique pas qu’il soit égal. Il y a un raisonnement à faire. 
Le fait est que si À est une solution de (32.226), alors z(t) = (A(t,x),x) est solution de 
(32.229). C’est l’unicité de cette dernière qui permet de déduire l’unicité de la solution pour 
À. 

Nous avons donc que l’unique solution À du système (32.226) est égale à A(t,x) = (dy)x et 
est de classe C1 par rapport à (#,x). 


Donc (t,x) > o(t,x) est de classe C?. 
(5) Régularité CP 
Nous avons vu que le flot de y/ = f(t, y) est de classe C? dès que f est de classe C?. Supposons 


que f soit de classe CP et montrons que si le flot est de classe C* (k < p) alors il est de classe 
CK+1. 


Vu que le flot d'une équation différentielle de classe CP? est de classe CŸ, en particulier celui 
de (32.229) est de classe C*. Donc aussi la solution pour A(t,x) = (dy+)4 est de classe CF. 
Et vu que (f,x) — (dys) est de classe C*, l'application w est de classe C*T1. 


NORMooWEWVooXbGmfE 
32.36. 
Le théorème d’inversion locale 17.50 nous permet de dire que, pour t fixé, le flot x + w(x) est un 


C?-difféomorphisme local. 
PROPooPYHWoo!IZhQST 


Proposition 32.37 (Cauchy-Lipschitz avec paramètre, régularité C?[706, 707, 708]). 

Soit un intervalle ouvert I de R, un connexe ouvert Q de R" et un intervalle ouvert À de R4. Soit 
une fonction f € CP(I x Q x A,R”) localement Lipschitz en (. Soient to € I, y EN et LEA. 
existe un voisinage compact de (to, yo, Xo) sur lequel le problème 


yA(t) = (6, yx(t), à) (32.232a) 
yx(to) = yo (32,230b) 


possède une unique solution. De plus (t, À) — yx{t) est de classe C? par rapport à ses deux variables. 


Démonstration. Nous récrivons immédiatement le problème pour la fonction y: 1 x À — R” donné 


par y(é, ») =. (é) | POSENSSRMNICeRTEqun 
Oy 
a A) = F6 y(6, à), à) (32.233a) 
y(to) = yo. (32.233b) 


Nous allons montrer que ce problème est en réalité équivalent à un problème sans paramètre. Nous 
posons E£ = Q x A et 
gIxE—E 
(tx) (FE, x, t2), 0) 


où +1 est la composante Q de x et x2 est la composante À de x. Pour une valeur u € À donnée 
1 : Su pe SUBEQSOo1BTNooHZŸ Imh 
nous considérons le problème au condition initiales | 


a (t) = g(t,x(t)) (32.235a) 
(to) = (yo, 4). (32.235b) 


Le théorème de Cauchy-Lipschitz que nous prenons sous la forme 32.35 nous indique que ce pro- 
blème admet une unique solution maximale et que le flot (4,(yo,4)) + z(yn(t) est de classe 
CG? 

Nous passons maintenant à la résolution du problème (32.233) 


(32.234) 
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(1) Existence d’une solution C! 
Nous montrons à présent que la fonction y donnée par 


y, L) = T(to,n)(t)1 (32.236) 


est solution de (32.233). Vu que x a deux composantes, nous pouvons un peu déballer l’équa- 
tion. Afin d'éviter les notations laborieuses nous allons noter x pour æ(4,,) et donc x1(t) 
pour æ{t,,1)(t). Nous avons l'équation différentielle 


2°) a dd 2 (32.237) 


ÉA _—. 


La seconde ligne de l'équation donne immédiatement æx2(t) = u pour tout t. En injectant 


avec la condition initiale 


dans la première ligne : 
a1(6) = f(ba(t),n). (32.239) 


Or vue la définition de y, le nombre x (t) n’est autre que (+, 1). La fonction y que nous 


avons définie vérifie donc 5 
y 
Se 4) = FE y n), 1) (32.240) 


et la condition initiale y(to) = æ1(to) = yo. Elle est donc bien solution du problème initial. 
De plus l’application (€, u) + y(t,u) = z(0 uy(t)1 est de classe CP. 

(2) Unicité 
Pour l’unicité, soit on invoque la proposition 17.45 qui donne l’unicité dans les fonctions 
continues et a fortiori dans les fonctions C1. Soit on fait le jeu inverse : on prouve qu’à 
chaque solution de (32.233) correspond une solution de (32.235), et l’unicité de la solution x 
donne l’unicité du côté de y. 


ii Avertissement /question au lecteur !! 32.38 
Je ne suis pas du tout sûr de la proposition 32.39. Ecrivez-moi si vous avez un commentaire, et 


surtout si vous avez une preuve. La proposition 32.35 entre certainement dans la preuve. 
PROPooKPCQooQNMLQL 


Proposition 32.39. 
Soient un intervalle I de R, un ouvert connexe V de R", une application f: R? — R de classe 
CP, ainsi qu'une application y: I x V X [I —R telle que 
0y 
—(s,x,t) = f(y(s,,t),s) (32.241a) 
5 
Het = (32.241b) 


Alors y est de classe CP. 


Démonstration. Pas de preuve pour le moment. Vous pouvez aider en m'envoyant une preuve. 


ii Avertissement /question au lecteur !! 32.40 
L'énoncé du lemme 32.41 est douteux. À mon avis il doit être supprimé et remplacé par la propo- 
sition 32.39, pourvu que cette dernière soit vraie. 


LEMooQWDNooUjNXh1 
a QooKHSKoOEFCSMQ 
Soient t et x fités, ainsi que f de classe C?. Nous considérons la solution yr+ de ji 
0y 
a) = f{y(s),s) (32.242a) 
Lt = (32.242b) 


Alors l'application t + y;(s) est de classe C?. 
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Démonstration. Soit t fixé, et l’équation différentielle 


(9 = f(x 1 +) (82.243) 
2(0) = 5%. (32.243b) 


Par le théorème 32.35, la solution z est de classe C? en (s,x). En posant y(s) = z(t— 5) il est vite 
vérifié que y est solution de (32.242). C’est alors bien de classe CP en t. 


32.8.4 Stabilité de Lyapunov 
DefKMCGooUeFK1A 


Définition 32.42. 
Dans le cas de l'équation différentielle y'(t) = f(y(E),t) pour y: R — R", un point a € R" est un 
point d’équilibre lorsque la fonction constante y(t) = a est une solution. 

Le point d'équilibre a € R" est stable si pour tout € > 0, il existe d > 0 tel que |y(0) — a] < Ô 
implique |y(t) — a] < € pour tout t. 


ThoBSEJoo!lcdHYp 
Théorème 32.43 (Théorème de stabilité de Lyapunov{1, 709, 370, 701]). 
FT. : — ; EqZZLBooKBkZk 
Soit l’équation différentielle | 
Y(E) = (y) (32.244a) 
y(0) = Yo (32.244b) 


avec une fonction f: IR? — R” de classe C! vérifiant f(0) = 0 et yo € R”. Nous supposons que 
l’application linéaire dfo n’a que des valeurs propres dont la partie réelle est strictement négative. 


Alors ItemGZEAooAhxuDQi 
(1) Il existe k > 0 tel que si |yol < k alors la solution maximale est définie SUEnZEA0OMNxUDQi i 
(2) pour le même nombre k > 0, si |yo| < k alors y(t) 2% 0 exponentiellement vite, 


(3) la solution y = 0 est un point d'équilibre attractif. 


Démonstration. Placer ici une phrase intelligente ?. 


(1) Prolégomène 
Le théorème de Cauchy-Lipschitz 17.42 nous enseigne que l’équation différentielle considérée 
possède une unique solution maximale (entre autres parce qu’une fonction de classe C! est 
localement Lipschitz) et nous nommons J l'intervalle sur lequel elle est définie. 


(2) Système linéarisé 


Nous posons À = dfo. La fonction yr(t) = et4yo est solution du système linéarisé 


y'(t) = Ay(t) (32.245a) 
y(0) = yo. (32.245b) 


Pour évaluer la norme de y nous utilisons le lemme 15.152 : il existe un polynôme P tel que 


Tr 


luc (1 < P(#) D XI pol. (32.246) 
i=1 
Mais par hypothèse, Re(À;) < 0 et si nous posons À = max{Re(};)} nous avons À < O0 et 


lys (| < P(Hl)e* vol. (32.247) 


Donc quel que soit yo nous avons lim, |yz(t)| = 0 c’est-à-dire lims_, yz(t) = 0. 


9. Parce que sinon l’environnement description qui suit donne un mauvais effet. 
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(3) Une forme linéaire 
Nous définissons la forme bilinéaire suivante sur R? : 


00 
b(x, y) = [ cet x, ety)dt. (32.248) 


D'abord cela est bien défini pour tout x,y € IR” parce que 
Ket4x, et} < let4zi le 4yl < Pi (1) P2(H)e et ul, (32.249) 


qui est intégrable entre 0 et o à cause de la décroissance exponentielle !. Montrons que b 
est définie positive. Soit donc x £ 0 et calculons 


(ve) 
= Î letAz[?dt. (32.250) 
0 


Ce qui est dans l'intégrale est forcément (pas strictement) positif pour tout t. Mais si x # 0 
alors |x|? est strictement positif et sur un voisinage de t = 0 nous avons aussi |et4x|? qui 
est strictement positif. Ergo b(x,x) > 0 dès que x # 0, ce qui signifie que b est strictement 
définie positive (lemme 9.228). 

Nous notons g: V — IR la forme quadratique associée à b et aussi la norme qui va avec : 
Ixla = 1/q(x). En ce qui concerne le gradient Vg: V — V, nous avons le petit calcul 
suivant[709] qui se base sur une des nombreuses formules du lemme 12.268 !! : 


Vale) y= [oc + |. (32.251a) 
: [at + Lay) + 2tb(x,ÿ)] (32.251b) 
= 2b(x, y). (32.251c) 
Nous avons aussi 

Va(x) : Ar = 2(x, Ax) (32.252a) 
= 2 [ éetAg, etA Az) (32.252b) 
= [ L ACTES) (t)dt (32.259) 

i=T 
= Jim [<e'4x, a) (32.2524) 


Mais vu que |etx| — 0, pour { — © il ne reste que terme t — 0 de la différence, c’est-à-dire 
EqUC0G 
Va(x) + Ax = 2b(x, Az) = (x. quengontF rs 


Étant donné que Vq(x) est le vecteur dirigé vers l'extérieur de l’ellipsoïde de la courbe de 
niveau de q au point x, le vecteur Ax est dirigé vers l’intérieur. 


Va(x) 


FA 


10. Proposition 15.111. 
11. Le fait que q soit différentiable est simplement le fait que b soit bilinéaire. 
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Majoration de a(u(t)) Nous posons 


r: R—R" 


nr (32.254) 


Soit y la solution maximale au problème (32.244) que nous pouvons aussi écrire sous la forme 


(8) = r(y(8)) + AyO). (32.255) 
subeqsZCOLoo0ZTBLr 
Calculons un peu .. 

a(u(t)) = but), y (6) (32.256a) 
= (y, y) (32.256b) 
= 2b(y, Ay) + 26(y,r(y)) (32.256c) 
= —|y|? + 2b(y,r(v)) (32.253) avec x = y(t)  (32.256d) 
< ul +26) lalr (6) le Cauchy-Schwarz : [b(a,b)| < [al4lbla.  (32.256e) 


Chacun des deux  — peut encore être majoré. En ce qui concerne le premier, par équiva- 
lence des normes l?, il existe une C' telle que |y| > C|yl4. En renommant immé- 
diatement C? en C, |y|? > C|yl5 = Ca(y). 

Pour le second, nous allons utiliser la différentiabilité de r et le théorème des accroïissements 
finis. Vu que dfo = À nous avons dro = dfo — À = 0 et de plus r est de classe C! parce que 
f l'est. Toutes les normes étant équivalentes ! sur IR” nous pouvons exprimer la continuité 
de dr pour la norme |.|, : si e > O0 est fixé alors il existe à > 0 tel que |x] < & implique 
Idrxl4 < €. Nous pouvons écrire les accroissements finis ? pour la fonction r : 


EqIDTHooC 
ire) — ra < sup, lfallele Ye) 
a€|0,x 


La chose facile à remarquer est que r(0) = f(0) = 0. En ce qui concerne les choses difficiles, 
vu que dr est continue (parce que r est Cl) il existe un Ô > 0 tel que |dril, < € dès 
que a € B,(0,0). Si nous prenons |x|, < Ô alors cette majoration est valable pour tous les 
éléments sur lequel est pris le supremum dans la formule (32.257). Donc 


Ir(æ)la < era (32.258) 


tant que |x|y < 6. Par conséquent, tant que [y(t)|4 < 6 nous avons fr(y(t))| < ely(#)|o. 
Nous continuons le calcul (32.256) : 


a(y(e)) < Ca(y) + 2ey(t)[ (32.259a) 
= —(C — 2e)q(y). (32.259b) 


Si e est petit on a C' — 2e > 0 et on pose B = C — 2e pour écrire 


a(u(t)) < —Ba(y(t)) Dre ED 


tant que |y(t)|, < 6. 
subeqsFNPJooERJkxO 


Deux nombres Nous posons | 


t = min{t > 0 tel que q(y(t)) = ô} 
t> = max{t < 0 tel que q(y(t)) = 6}. 


32.261a) 


( 
(32.261b) 
Le nombre ft; est bien défini et est bien un minimum. J’en veux pour preuve que si q(u(ts)) _ 
5, on peut prendre le minimum seulement sur les t € [0,t,]; or par continuité qa(y(t)) = Ô 
définit un fermé. Bref {1 est un infimum sur un compact (fermé borné) et donc bien un 
minimum atteint. 


12. Définition 11.43 et théorème 11.46. 
13. Théorème 11.46. 
14. Théorème 11.254. 


32.8. 


(6) 
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Si q(yo) < à alors q(y(t)) < ô 
L'inégalité (32.260) est valable pour t = 0, t = t1 et t = t2; nous l’écrivons pour #1 : 


a(u(),_,, < —Ba(y(t)) < —86 < 0 (32.262) 


Nous avons donc q(y(t1)) = ô et a(ut)), 
avec0<t<tilya q(y(t)) > 6. 

Pour la même raison, prise en { = 0 nous avons pour tout t{ proche de 0 avec t > 0 que 
q(y(t)) < 6. Par continuité de t — q{y(t)) cette fonction doit passer par la valeur ô dans 
Jt2,0[ et ]0,t:1[, ce qui contredit la maximalité de t2 et la minimalité de #1. 


< 0. Par conséquent pour tout { proche de t; 


Ci-dessous, une partie de ce à quoi ressemble le graphe de t qa(y(t)) « 


Deux conclusions : 


— Vu que qa(y(t)) est borné pour tout { € R, nous sommes dans le cas (1) de l’alternative 
du théorème d’explosion en temps fini 32.20. Donc la solution y(t) existe sur tout R 
pourvu que || soit assez petit. Plus précisément par équivalence des normes, il existe 
un nombre D > 0 tel que |x| > D}x|, pour tout x. Si |yo| < DÔ alors 


Diyola < |yol < (32.263) 


qui donne immédiatement |yol4 < 9, ce qui faut pour faire fonctionner l'existence de 
y(t) pour tout t. 


— Nous pouvons maintenant d'utiliser l'inégalité (32.260) pour tout t € R sous la seule 
hypothèse que q(yo) < 6 au lieu de qa(y(t)) < 6. 


La partie (1) de ce théorème est prouvée; nous passons au reste à la partie (2). Pour cela 
nous supposons que q(yo) < Ô. 


À propos de e/tq(y) 


En sous-entendant la dépendance en t dans y nous avons 
Bt | Bt Bt pont Bt , 
(eat) = Be a(u) + efa(u) = e% (8a(u) + ay), (32.264) 
mais nous avons déjà prouvé que q(y) < —Bq(y) (équation (32.260)), donc 
À EqEJME 
(e%a(u)) < 0 MERE) 
Décroissance exponentielle Si t > 0, l'inégalité (32.265) donne 


ePtq(y(t)) < q(yo), (32.266) 


c’est-à-dire 
a(y()) < e7F'q(yo) (32.267) 


lorsque t > 0. Par équivalence des normes, nous avons des nombres D et D2 tels que 
Dilxla < xl < Dilx|g (32.268) 
pour tout x € IR”. Nous avons donc pour tout t > 0 que 


II < Daly(t)la < Dalgolae *. (32.269) 


Pour rappel, 8 > 0, ce qui prouve la partie (2) du théorème. 
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(9) Point d’équilibre 
Le point y = 0 est point d'équilibre (définition 32.42) parce que f(0) = 0, donc y(t) = 0 
fonctionne. Dans ce cas, yo = 0. 

(10) Stabilité 
La stabilité est le fait que |y(t)|, < Ô dès que |yol4 < 6. 


32.8.5 Système proies-prédateurs de Lotka-Volterra 


Le système de Lotka-Volterra est l'équation différentielle suivante : 


x’ = ax — bxy (32.270a) 
y = —cy + dry (32.270b) 
où à, b,c,d sont des constantes positives, et avec la condition æ(to) > 0, y(to) > 0. 
En ce qui concerne l'interprétation des équations[710], 
(1) x(t) est le nombres de proies, 
(2) y(t) est le nombres de prédateurs, 


(3) Les proies ont une reproduction rapide qui mène à une croissance exponentielle en absence 
de prédation (d’où le terme ax). 


(4) Au contraire, les prédateurs meurent (ou migrent) rapidement lorsqu'ils n’ont pas de proies 
et nous supposons une décroissance exponentielle du nombre de prédateurs en l’absence de 
proies. D'où le terme —cy avec le signe négatif. 


(5) Les termes —bxy et dxy sont les termes d'interaction entre les proies et les prédateurs. Ils 
sont proportionnels à la fréquence de leurs rencontres, lesquelles sont avantageuses pour les 
prédateurs et problématiques pour les proies. 


ThoJHCLooHjeCvT 
Théorème 32.44 (Lotka-Volterra[370]). 
Soient des constantes positives a, b, c, d et le système d'équations différentielles 
x = ax — bxy (32.271a) 
ÿ = —cy + dxy (32.271b) 
x(to) > 0, y(to) > (0. (32.271c) 


Alors 
(1) Les solutions sont positives sur leur domaines. 
(2) Les solutions existent sur R. 


(3) Les solutions sont périodiques. 


Démonstration. Nous divisons la preuve. 


(1) Comment le théorème de Cauchy-Lipschitz s’applique Le théorème de Cauchy-Lipschitz ! 
ne peut pas s’appliquer tel quel parce qu’il demande une condition initiale pour avoir unicité. 
En ce qui concerne les notations, ce qui est noté « y » dans le théorème est ici le couple x, y 


et la fonction f est alors 
z ax — bxy 
t : : 2.212 
1 ? () ) Le + eo (32.272) 


C’est une fonction continue localement Lipschitz partout par le lemme 12.334 et la proposi- 
tion 12.333. 

Nous savons cependant que les solutions sont de classe C! et que moyennant la donnée d’une 
condition initiale, la solution est unique. 


15. Théorème 17.42. 


32.8. 


(2) 


(5) 
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Les solutions restent positives Supposons x(s) = 0 pour un certain 8 > t9. Alors la 
solution 


t(t) = 0 (32.273a) 
y(t) = exp(—ct) (32.273b) 


est une solution pour [to,s + €]. Par unicité de la solution avec condition initiale x(s) = O, 
nous avons aussi t(to) = 0 pour toutes les solutions, ce qui contredit notre condition. 

De la même façon, avoir y(s) = 0 donne une solution avec y(t) = 0 pour tout t et donc une 
contradiction. 


Solutions sur R 


Nous montrons maintenant que les solutions sont définies sur KR. 
Nous avons x’ < ax, donc pour tout t où la solution est définie, 


0 < xt) < z(to)e tt), (32.274) 


c’est-à-dire que la solution ne peut pas exploser en temps fini !° : elle est bornée par le haut 
et le bas. Elle doit donc exister pour tout t € R. Par ailleurs, y < dxy donc 


TO (OL so (32.275) 


qui est également contraire à l’explosion en temps fini. 


4 zones : monotonie 


Nous divisons R? en quatre zones d’après les signes de a — by et c — dx. Nous montrons que 
dans chacune de ces zones, les solutions sont monotones. Prenons par exemple la partie 


{(x,y) € R? tel que a — by > 0} x {c — dx < 0}. (32.276) 


Vu l'équation æ = æ(a — by), tant que (x(t),y(t)) est dans cette zone, la fonction x’ a le 
signe de x et est donc positive. Donc x est croissante dans cette zone. 


De la même façon, y = —y(c — dx), et y a un signe constant dans la zone. 


4 zones : on bouge 


Nous prouvons à présent qu’une solution ne reste pas dans une zone. 


(5a) Supposons que (x(#o),y(to)) soit dans la zone 


{a — by > 0} * {c— dx > 0} (32.277a) 
x >0 y <0 (32.277b) 


et que la solution reste dans cette zone (pour les t > to). Nous avons en particulier 
x! > 0, donc x est croissante tout en ayant la borne supérieure x < c/d. Par conséquent 
æ à une limite que nous appelons x1 € [0, $]. 

De la même façon, ; y est décroissante et bornée vers le bas par zéro. Donc y a une limite 
que nous notons y € [0, y(to)|]. 

Vu que x est bornée et de classe C'! nous avons forcément limy_,+ æ’(t) = 0. Mais vu 
que æ/ = ax — bxy nous devons avoir 


az1 — bxiy1 = 0. (32.278) 


Mais ni z1 > 0 donc a — by, = 0, ce qui donne y = Ÿ et aussi x1 = %. Bref, y est 


décroissante et tend vers a/b; donc y(to) > a/b, ce qui contredit que y(to) soit dans la 
zone considérée. 


Étant donné que x > 0 et y < O0, la solution sort de la zone pour entrer dans la zone 


16. Voir le corolaire 32.20. 
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(5b) Supposons que (x(to), y(to)) soit dans la zone 


{a — by > 0} x {c— dx < 0} (32.279a) 
x <0 ÿ >0 (32.279b) 


et que la solution reste dans cette zone (pour les t > to). Les fonctions x et y sont 
convergentes. Par conséquent In(y) converge aussi et vu que x est croissante, 


! 


LL 04 dx > —x + dr(to) > 0 (32.280) 
y 


Cela signifie que In(y)’ est toujours positive et bornée par le bas. Cela est impossible si 
y est borné. 


Donc on sort de la zone pour entrer dans ... 


(5c) Supposons que (x(to), y(to)) soit dans la zone 


{a — by < 0} x {c— dx < 0} (32.281a) 
x! <0 y > 0 (32.281b) 


et que la solution reste dans cette zone (pour les t > to). 


Le même type de raisonnement fait passer à la zone... 


(54) Supposons que (x(to), y(to)) soit dans la zone 


{a — by < 0} x {c— dx > 0} (32.282a) 
x <0 y <0 (32.282b) 


et que la solution reste dans cette zone (pour les { > t0). Encore une fois, cela nous fait 
sortir de la zone et retourne vers la première zone. 


À ce moment nous voyons déjà que la relation entre proies et prédateurs, c’est un peu le 
mythe de Sisyphe... 


Une intégrale première 


Posons la fonction 
H(x,y) = by + dx — aln(y) — cIn(x). (32.283) 


Une simple dérivation montre que t — H{x(t),y(t)) est constante. Nous considérons la 
fonction 


f:R—R 


s H(2,s) 


dont la dérivée n’est autre que f’(s) = b—£. La fonction f est donc décroissante sur l’intervalle 
[%,00[ et donc injective. Sur les changements de zones, il existe un #9 tel que 


(32.284) 


(32.285a) 
(32.285b) 


Pour cette valeur # nous avons alors H(x(to), y(to)) = f(y(to)). En posant s0 = y(to) > 0 
nous avons 


H(x0, yo) = f(s0) (32.286) 


et f étant injective, ce 50 est la seule valeur de s à vérifier H(x0, yo) = f(s). 
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(7) Conclusion 
La fonction x passant d’une zone à l’autre, il existe un t1 > to tel que x(t1) = a/b. Nous 
avons évidemment 


H(x(t1),y(t1)) = H(xo, Yo) (32.287) 
parce que À est constante le long du mouvement. Cela se traduit par 
a 
H(5:(4)) = f(s0), (32.288) 
et donc y(t1) = f(s0) = y(to). Avec tout cela nous avons 
y(t1) = y(to) (32.289a) 
(ti) = æ(to) = . (32.289b) 
Cela est donc un point par lequel la solution repasse. Par unicité de la solution, elle est donc 


périodique. 


32.9 Équation du second ordre 


32.9.1 Wronskien 


Nous considérons ici une équation différentielle de la forme 
E 
dE) + a(b)y(®) = 0 3220) 


Dans ce point nous allons considérer la fonction q sans hypothèse de périodicité. L’équation de Hill 
(sous-section 32.9.4) sera la même équation, mais en supposant que q est périodique. 

Nous commençons par argumenter que si qg est continue, alors l’ensemble des solutions de 
l'équation (32.290) est un espace vectoriel de dimension deux. Pour cela il suffit d’appliquer la 
méthode de réduction de l’ordre (section 32.7) puis le théorème de dimension pour les systèmes 
linéaires (théorème 32.16). En effet si la fonction y est solution de (32.290) si et seulement si le 


vecteur Ÿ = (u) est solution du système linéaire 
2 


Y'(#) = 2 )) Y(6). (32.291) 


Soient deux solutions y1 et y2 de l’équation différentielle. Le Wronskien de ces deux solutions 
est le déterminant 


V1 Y2 
W(t) = : 32.292 
ÿ Vi V2 ) 
Si nous considérons l’équation différentielle 
y" + py' + qy = 0, (32.293) 


le Wronskien peut être déterminé sans savoir explicitement y1 et y2 parce que W = y1Y5 — y\yo. 
et en dérivant, 


W' = 192 + Y1Y2 — Y1Y2 — YiYo (32.294a) 
= y1(—py2 — qy2) — (—pyi — qyi)y2 (32.294b) 
U1 V2 
_—- | 32.294c 
Yi V2 ) 


c’est-à-dire ë 
W! = -pW BE) 


Il suffit donc de savoir une condition initiale pour obtenir une équation différentielle pour W. 
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32.9.2 Avec second membre 


Une équation différentielle du second ordre avec un second membre se présente sous la forme 
ay” (t) + by/(t) + cy(t) = v(t) (32.296) 


où v(t) est une fonction donnée. Le truc est de commencer par résoudre l’équation différentielle 
sans second membre, c’est-à-dire trouver la fonction yy(t) telle que 


aya(t) + byn(t) + cyn(t) = 0. (32.297) 


Cela se fait en utilisant la méthode du polynôme caractéristique. 

Ensuite, il faut trouver une solution particulière yp(t) de l'équation avec le second membre. 
Une seule. Pour y parvenir, il faut du doigté et un peu de technique. Il faut faire des essais en 
fonction de ce à quoi ressemble le v(t) : 

(1) Si v(t) est un polynôme, alors il faut essayer un polynôme, 
(2) Si v(t) = cos(wt) ou bien v(t) = sin(wt), alors essayer yp(t) = A cos(wt) + B sin(wt), 


wt 


(3) Si v(t) = e“!, alors essayer yp(t) = Ae 


32.9.3 Équation y” + q(t)y = 0 


subsecSyTwyM 
Nous allons donner quelques propriétés des solutions de l’équation 
y" + qy = 0 (32.298) 
en fonction de telle ou telle hypothèse sur q. 
Proposition 32.45. 
Si q: R* — R est continue et si 
00 
Î PO. (32.299) 
0 


converge, alors 
(1) toute solution bornée de y" + qy = 0 vérifie lims_,w y/(t) = 0, 


(2) l'équation y” + qy = 0 admet des solutions non bornées. 


Démonstration. Soit y une solution bornée, et intégrons l’équation différentielle entre 0 et 0 : 


Î  — Î | abytdt. (32.300) 


La fonction y étant bornée, l’hypothèse sur q permet de dire que l'intégrale de droïte existe. Par 
ailleurs, 


(2e) a 
Î y" = lim | y’ = lim y(a) — y/(0). (32.301) 


a—>00 a—> 00 
0 0 


Cela justifie que la limite lims_,% y/(t) existe. Posons à = lims_,, y/(t) et supposons par l’absurde 
que & £ 0. Soit e > O0 et À assez grand pour que 


|y! — afpco < €: (32.302) 


Soit aussi x > À. Nous avons, pour t € [À,x|, que |y'(t) — a] < €. Autrement dit, à € |y'(t) — 
e,y/(t) + el et donc que y/(t) > a — €. Nous avons alors 


y) = 10) + [vod (32.303a) 
> y) + Ï Re (32.303b) 
À 


= y(X) + (a — e)(x — à). (32.303c) 
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En prenant la limite des deux côtés on voit que y(x) — © dès que à # 0, ce qui est contraire aux 
hypothèses. Donc a = 0. 

Pour la seconde partie de la proposition, nous devons prouver que l'équation y” + qy = 0 
possède des solutions non bornées. Si l'équation a seulement des solutions bornées et si {u, vu} est 
une base de solutions, alors nous avons w/, v' — 0. Si nous reprenons l'équation (32.295) avec p = 0 
nous savons que dans notre cas le Wronskien satisfait à W' = O0, c’est-à-dire qu’il est constant. 
Mais vu que u et v sont bornées et que les dérivées tendent vers zéro, nous avons W(t) — 0 et 
donc W{(t) = 0. 

Or l'annulation identique du Wronskien contredit que {u,v} serait une base de solutions. Donc 
il existe des solutions non bornées. 


PropMYskGa 
Proposition 32.46. 
Soit l'équation différentielle y” + qy = 0. Si q est C!, strictement positive et croissante, alors toutes 
les solutions sont bornées. 


Démonstration. Soit y une solution et multiplions l’équation par 2y (qui est non nulle par hypo- 
thèse) : 


2y'y" + 2qy'y = 0. (32.304) 
Nous allons intégrer cela en nous souvenant que 2y/y/” est la dérivée de (y/)?. Pour tout t > 0 nous 
avons 
t 
0 = (4) — y/(0)* + 2 | q(t)y (6) y(t)dt (32.305a) 
0 
par partie 
t 
= y/(#)? — y (0)? +2 Ca — Î té) (32.305b) 
0 
(32.305c) 


Le terme qui nous intéresse est celui qui contient y(t) : 
t 
2a(e)y(t)? = —y/(#) + /(0)2 + 2a(0)y(0)? + 2 Î dy (32.306) 
0 


Nous pouvons majorer —y/ (L par zéro et remplacer toutes les constantes par K : 


t t 
q 
q(e)y(E) < [ dy +K= [ PE (32.307) 


C’est le moment d'utiliser le lemme de Grünwall 32.5 avec 9 = qy? et d = q//q. Les hypothèses de 
croissance et de positivité ont été posées exprès. Bref, on a 


2 . q'(s) 
qu" < K'exp ([ = E ds) (32.308a) 
q(t) 
_ dt) : 
= Ko (32.308c) 


Re (32.309) 


et donc y est bornée. 
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32.9.4 Équation de Hill 
SubSecDWwVVPa 


L’équation de Hill est une équation différentielle de la forme 
E 
y" + qy = 0 ERA TA) 


où 
(1) ge C'(R.R), 
(2) g est paire et t-périodique 
Nous nous intéressons aux solutions complexes de cette équation différentielle. 

Nous nommons W € C?(R, C) l'espace des solutions complexes de l'équation (32.310). Nous 
savons par ce qui à été dit en 32.9.3 que cet espace est de dimension deux. De plus avec les 
hypothèses faites ici sur q, nous savons que les solutions sont de classe CŸ parce que si y est une 
solution, alors l'équation y” = qy nous indique que y est C1! parce que y” existe (y/ est dérivable et 
donc continue). Mais si y est de classe C!, alors le membre de droite qy est C? et donc y” est C'!, 
ce qui prouve que y est de classe CŸ. La récurrence ne va pas plus loin parce que q est seulement 
de classe CT. 


Nous considérons l’application de translation 


T: C?(R, C) — C?(R, ©) 


é(o)= jte 4). PERL 


En utilisant la règle de dérivation de fonctions composées, (Ty) = Ty et (Ty)” = Ty”, de telle 
sorte que si u est solution de l’équation (32.310), alors T'u est également solution. Donc W est un 
espace stable par 7. 

Le théorème 32.16 nous permet de choisir une base de W en imposant des conditions. Nous 
choisissons une base {y1,y2} telles que 


su. He _ . (32.312) 


Le théorème 32.16 nous assure que deux telles solutions existent et qu’elles forment une base de 


W parce que W est de dimension 2. 
IVLZNaU 


Lemme 32.47 ([700]). 
Avec ce choix de base {y1,y2} la matrice de T est donnée par 


u yi(t) yen) 
T = . ) ; (32.313) 


De plus la fonction y1 est paire et la fonction y2 est impaire. 
: ; : , 1\. O\. . 
Démonstration. Cherchons la matrice de T dans cette base en associant o)à% et 1) à 22: Si 
a b 
T = (° ) alors 


a b\/fl a E P 
Ty = (° 4) (i) = U = ay1 + Cy2. ÉBT 
En évaluant cela en t = 0, 
(Ty1)(0) = ayi(0) + cya(0) = a, (32.315) 


donc a = (Ty1)(0) = yi(x). En dérivant (32.314), en tenant compte du fait que (Ty) = Tyi et 
en évaluant en t = 0, nous trouvons de même c = y,(r). Puis le même cinéma avec y2 donne 


_ fuir) yr) 
= (en  . (32.316) 
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Passons maintenant à la parité de 41 et y2. Nous posons (1) = y1(—t). Alors (1) = —yi(—t) 
et d”(t) = y}(—-t), tant et si bien que 


DCE) + a()D(E) = vi(—t) + a(t}(—t) = 0. (32.317) 

donc 1 est une solution de l’équation. Mais 
Y(0) = z1(0) (32.318a) 
d'(0) = —y1(0) = 0, (32.318b) 


donc 4 a les mêmes conditions initiales que y1. Par conséquent Ÿ = y1 (par le l’unicité donnée 
dans le théorème de Cauchy-Lipschitz 17.42) et y1 est paire. Nous procédons de même en partant 
de g(t) = —y2(—t) pour trouver que w = y2 et que donc que y2 est impaire. 


Remémorons nous toutefois, pour calmer tout enthousiasme excessif, que T dépend de deux 


solutions et donc de la fonction q donnée dans l’équation. 
PropGJCZcjR 


Proposition 32.48 ([103]). 
Nous considérons l'équation y” + qy = 0 et sa base de solutions {y1,y2} en suivant les notations 
données plus haut. 


(1) Si|Tr(T)| < 2, alors toutes les solutions de l’équation sont bornées. 
(2) Si |Tr(T)| = 2 alors nous avons une solution non bornée. 
(3) Si|Tr(T)| > 2 alors toutes les solutions de l’équation sont non bornées. 


(4) Le cas | Tr(T)| = 2 se présente si et seulement si yi(rx)y2(r) = 0. 


Démonstration. Remarquons que le déterminant de la matrice Test égal au Wronskien des solu- 
tions y1 et y2 calculé en { = r. Calculons sa valeur : 


W(y1, y2) = det É . = 192 — Y1y2. (32.319) 


En dérivant et en remplaçant y” par —qu;, nous trouvons tout de suite W{w1,y2)" = 0. Donc le 
Wronskien est constant et il est facile de le calculer en t = 0 : 


W{y1:y2)(0) = 1—0=1. (32.320) 
Donc pour tout t nous avons W{y1,y2)(t) = 1. En particulier 
det(T) = Win,y2)(r) = 1, (32.321) 


et notons au passage que Test inversible. 
Nous écrivons le polynôme caractéristique de T' sous la forme yr = X?— Tr(T)X + det(T), 
c'est-à-dire 
xr = X?—Tr(T)X + 1, (32.322) 
dont le discriminant est À = Tr(A)? — 4. 
Nous passons à présent aux différents points de la proposition. 


(1) Si |Tr(T)| < 2, alors À < 0 et xr a deux racines complexes conjuguées que nous notons 
p et p. De plus le produit des racines étant le terme indépendant, pp = 1; en particulier 
lpl = |p|] = 1. Notons {u,v} une base de vecteurs propres : Tu = pu et Tv = pu. Il est vite 
vu que la fonction |u| est r-périodique : 


jul(+x) = lu(t+x)] = 1(Tu)()| = IGou)()T = lellul(e) = lul(e). (32.323) 


La fonction [u| est continue !* et périodique ergo bornée. La fonction |[v| est bornée pour la 
même raison et par linéarité, toutes les fonctions de W sont bornées. 


17. La fonction u elle-même n’est cependant pas garantie d’être périodique. 
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(2) Si Tr(T) = +2, alors À = O0 et yr a une racine réelle double À qui doit être +1. Soit u un 
vecteur propre de T pour la valeur propre +1. Nous avons 


Qul(é + 7) = [Tu(t)| = | +u(t)|, (32.324) 


ce qui prouve encore que |u| est périodique et donc bornée. 
Notons que nous n’avons pas d'informations sur le fait qu’une autre solution soit ou non 
bornée. 


(3) Si | Tr(T')| > 2, alors yr a deux racines réelles distinctes r et r” avec rr' = 1 (toujours les 
relations coefficients-racines). En raison de quoi r’ = rl et quitte à échanger r et r/ nous 
supposons |r| > 1. L'opérateur est maintenant diagonalisable et nous considérons {u,v} une 
base de vecteurs propres pour les valeurs propres r et r’. Une solution non nulle de l’équation 
s'écrit donc sous la forme 

y = au + Bv (32.325) 


avec (a, B) (0,0). 
— Si a = 0, alors 8 Æ 0 et nous choisissons une valeur t telle que v(t) £ 0. Dans ce cas, 
y(t+ nr) = Bu(t+ nr) = B(T'v)(t) = B(r')"u(t), (32.326) 
et en faisant n — —0 nous obtenons +00 suivant le signe de f. 
— Si a 0, alors nous fixons l° + tel que u(t) 0. Alors 
y(t + nr) = ar"u(t) + B(r')"(#). (32.327) 


En faisant n — 0, nous avons (r’)* — ( tandis que le premier terme tend vers +00 
suivant le signe de a. 


(4) D'abord le théorème de Cayley-Hamilton 9.118 nous indique que xr(T) = 0, c’est-à-dire que 
E 

T2 = T(T)T + 1 = 0. EDSEN 

Nous avons déjà mentionné le fait que T'était inversible. Multiplions donc (32.328) par T_! : 


T4+T = Tr(T)lo. F435330) 


Vu que T7! est l’endomorphisme Tlu(t) = u(t — x), sa matrice est donnée par 
T-1 _ y1(—T) Bi) _ ( V1 (T) do. 32.330 
eo. FA 


où nous avons utilisé le fait que y1 était paire et y2 impaire (lemme 32.47). Si nous notons 


2a 0 
1, 
T+T = ( à) : (32.331) 
L’équation (32.329) donne alors, vu que Tr(T) = a + d, 
2a O0 a + d 0 
( . _ ( 0 on ; EP) 
ce qui donne immédiatement a = d. La matrice de T a donc comme forme T = (° et 


Tr(T) = 2a. 
Donc Tr(T) = +2 si et seulement si a = +1 et vu que 1 = det(T) = a? — bc, nous avons 
a = +1 si et seulement si bc = 0, ce qui signifie exactement y.(r)y2(T) = 0. 


18. Ce qui n’implique pas le fait d’avoir deux vecteurs propres pour cette valeur propre, mais tout de même au 
moins un, voir l’exemple 9.115. 
19. Mais pas trop hein ; nous aurons encore besoin d’assigner à t d’autres valeurs dans d’autres théorèmes. 
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32.10 Différents types d’équations différentielles 


32.10.1 Équation homogène 


SubSecEqDiffHomo 
Une équation différentielle homogène est une équation de la forme 
y = f(t,y) (32:329) 
où f(At, y) = f(t,y) pour tout À £ 0. 
Elle se présente sous la forme | 
, degré n en £,y (32.334) 


degré n en t,y° 


avec pas de y à droite : juste du y et du t. 


Lemme 32.49. 
L'équation y = f(t,y) est homogène si et seulement si f(t,y) est une fonction de y/t seulement. 


Pour résoudre l’équation homogène, on pose 
t EqDiffH 
29 = 10 ais E Hope ges 


donc tz = y, et 
y'(t) = tv'(t) +u(t), (32.336) 


à remettre dans l’équation de départ. 


32.10.2 Équation de Bernoulli 
SubSecBernh 


y! = alt}y + b(tye FaBerMOLF EE 


où @ £ 0 ou 1. Pour la résoudre, on divise l'équation par y*, et on pose u = y!"®, et on tombe sur 
une équation linéaire 


C’est une équation du type 


u'=(1-—a)(a(t}u + b(t)). (32.338) 
32.10.3 Équation de Riccati 
SubSecRicatti 
Définition 32.50 ([711]). 
C’est une équation de la forme | : | 
y = a(t)y? + b(t)y + c(t). FADIFFGFeneR ent 


En général, on ne peut pas la résoudre, mais si on en connaît à priori des solutions particulières, 
alors on peut s’en sortir. 


(1) Si on sait que y1(t) est une solution, alors on pose 
YG) = y) + (32.340) 
et on obtient une équation linéaire 
u'= —(2y1(#ja(t) + b(t)}u — a(t). (32.341) 
(2) Si y1 et y2 sont solutions, alors nous avons y sous forme implicite 


YU pete (n(b-w(n)at (32.342) 
y — yo 


Pour résoudre une équation de Ricatti, il faut donc d’abord deviner une ou deux solutions. 
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32.10.4 Équation différentielle exacte 
SubSecEqDiffExacte 


32.10.4.1 Résolution lorsque tout va bien 


Avant de vous lancer dans les équations différentielles exacte, vous devez lire la section sur les 
formes différentielles 12.21. Une équation différentielle exacte est de la forme P(t,y)+Q(t,y)y" = 0 
que nous allons écrire sous la forme 


P(t,y)dt + Q(t, y)dy = 0. Faprenie ns) 


Nous savons que si ©, P = @Q, alors il existe une fonction f(6, y) telle que Pdt + Qdy = df. Pour 
trouver une telle fonction, nous pouvons simplement intégrer la forme Pdt + Qdy. En effet, si 
7: [0,1] — IR? est un chemin tel que (0) = (0,0) et (1) = (t,y), alors en définissant 


1 
eu) = | LPar + Qan = [ [Pen + (0 nto](r" (du (32.344) 
% 


nous avons df = Pdt + Qdy. N'importe quel chemin fait l’affaire. Calculons avec y(u) = (tu, yu). 
La dérivée de ce chemin est donnée par 


ee o de () (32.345) 


Étant donné que dt () — a et dy () — b, nous avons 
Fra) = [ [Pat + Qdu](a(u)) ( () + y ()) di 
= [ P(y(t))tdu + [ Q(n(t))ydu (32.346) 


1 


= [ [éP(tu, uy) + yQ(tu, yu) |du. 


Nous retrouvons exactement la formule (20.289). Si ça t’étonne, c’est que tu n’as pas compris:) 
Dans le cas où nous avons la fonction f qui vérifie P = @,f et Q = 0,f, l'équation (32.343) devient 


Of, 0f dy 
Hu à (32.347) 
c’est-à-dire 
TFC y(t)) = (32.348) 
dt ’ 
dont la solution 
f(ty(t)) = C (32.349) 


donne la solution y(t) sous forme implicite. 


32.10.4.2 Facteur intégrant (quand tout ne va pas bien) 


Si la forme Pdt + Qdy n’est pas exacte, il n’existe pas de fonction f qui résolve l’affaire. Nous 
pouvons toutefois essayer de trouver un facteur intégrant. Nous cherchons une fonction M telle 
que 

(MP)dt + (MQ)dy (32.350) 
soit exacte. Nous cherchons donc M(t,y) telle que 2,/(MP) = G(MQ). En utilisant la règle de 
Leibnitz, nous trouvons l’équation suivante pour M : 


M(ô,P — &Q) = Q(&M)- P(8,M). ne 


Cette équation est en générale extrêmement difficile à résoudre, mais dans certains cas particuliers, 
il est possible d’en trouver une solution à tâtons. 
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32.11 Distributions pour les équations différentielles 
SecTNgeNms 
Nous commençons par définir l’espace C'? (R, F7 (R4)) en disant que { + u, est dans cet espace 
si 
(1) pour tout {e R nous avons uw € .7'(R°), 
(2) l'application t{ - u4 est de classe C?. 


Pour définir ce que nous entendons par une fonction de classe C* à valeurs dans .7/(R‘) nous nous 
souvenons de la proposition 30.63. 


32.11.1 Équation de Schrüdinger 


ThoLDmNnBR 
Théorème 32.51 (Equation de Schrôdinger[103]). 
Soit ge.S'(R1) et le problème 
EqIKhGui 
nan er à (32.352) 
uo = 9 (32.352b) 
où à e CT(R, Ÿ'(R°)) est lié à u par la remarque 30.83. Alors TtenVFracYji 
(1) I existe une unique solution dans C°(R,.7/(R1)). envers 


(2) Cette solution u vérifie de plus à € .Z!(R x RA). 


Démonstration. Nous allons donner explicitement une fonction u € C© (R, ue (R‘)) et nous allons 
vérifier l'équation (32.352a) en testant sur une fonction 4 € .7/(R x Rd). Cela prouvera le point (2) 
ainsi que la partie existence de (1). Dans ce qui suit toutes les transformées de Fourier seront par 
rapport à la variable x e IR ou par rapport à £. Jamais par rapport àte R. 


(1) Existence Pour te R nous posons 2? 


ut = F(f:ê) (32.353) 


où fre .7(R) est la fonction f(x) = e-#lel?, Pour toute fonction y e S(R1) nous avons 


ww) = (F8)(F(w)) = SF (e)) = a(FUF (e)). (32.354) 


Le fait que F1 (4) soit une fonction Schwartz fait partie de la proposition 29.26. Pour chaque 
t nous avons bien u € .7/(Q). 
De plus la fonction A(t,x) = e-#lel*(F-1@)(x) est dans C?(R x IR‘), et par conséquent 
l'application 

tr ÿ(h(t,.)) (82,955) 


est également C® par la proposition 30.65. Ceci pour dire que u € C'© (R, El (R*)). Il faut 
encore vérifier que cette fonction est bien une solution de notre problème. Nous testons cette 
équation sur Ÿ € .7(R x R‘). Pour alléger les notations nous posons 4: x + d(t,x) et par 
conséquent aussi (@44)(x) = (&4#)(t,x). Nous avons : 


O = (@ü — iA)(#) (32.356a) 
— —ü(%4y) — ia(A) (32.356b) 
= L we ((@rur) + i(Awe))dt (82.356c) 


Ici nous nous souvenons du lemme 29.29 qui nous dit que nous pouvons permuter F7! et &. 
Et pour l’autre terme il faut utiliser le lemme 29.19 avec |a| = 2 et une somme pour obtenir 
que _ 

Ap(x) = -|x/?p(x), (32.357) 


20. En utilisant la définition (30.89) du produit d’une distribution par une fonction. 
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qui dans notre cas s’écrit sous la forme 


FT ( (Au) )(a) = Hal 7 u(t, 2). (32.358) 
En remettant bout à bout, 
Q =— g)( (4 — Fly ]d 32.359 
Léo(e-a17 4) (32.359) 
LE J ÿ(x > ete? (5, — ile) v)(6, +) )dt (32.359b) 
R 


Pour alléger les notations nous notons d4(x) = (F-l4p)(t,x). Nous avons 


de Car 70) = ile lex, (æ) n ele? (G4)(x) _ e-itlel? (0, = ile|2)De(x): 
(32.360) 
cela nous permet d’un peu factoriser une dérivée dans © : 


Ge - [0 (a(e-# H())) dt (32.361a) 


: 1 ô CET) dt (32.361b) 
.. — Jim HERO) (32.361c) 


Histoire de bien comprendre les notations, il ne s’agit pas de calculer g(e- #4) pour un t 
général et de remplacer ensuite t par N et —N. En effet la valeur de ge #14) pour un # 
donné est celle qu’on obtient en calculant g(...) après avoir remplacé t{ par ce que l’on veut. 
Par conséquent, en posant (t,£) = etlélF y (é) nous avons : 


t=N 


Q= Jim E (2 ue É “it ed) (32.362a) 


t=—N 


N—00 


= lim g (: ne lé e EN, Ode) — Jim 9 (= ee 1 EME p(-N EN) (32.362b) 


La limite commute avec g parce que cette dernière est une distribution (continue). De plus 
la limite commute avec l'intégrale parce que ce qui est dedans est Schwartz. La fonction 
étant Schwartz, la limite est nulle. Donc 


O=0. (32.363) 


Cela signifie que la fonction uw proposée est bien une solution de l'équation de Schrôdinger 
dans C(R,.7/(Rô)). 

(2) Unicité 
Nous considérons deux solutions w,u2 € C© (R, SP! (R*)) et la fonction u = u1 — u2 doit 
satisfaire au problème 


(ù — iAü)(y) = 0 (32.364a) 
uo = 0. (32.364b) 
Nous allons montrer que seule la fonction u4 = 0 peut satisfaire à cela pour tout 4 € SR x 
R‘). Nous allons même montrer qu’en imposant ces équations seulement sur la partie de 


S(R x R‘) qui est à support compact par rapport à R, la seule solution est uw = 0. Soit 
donc Ye .7(R x IR) à support compact vis-à-vis de sa variable t. Alors 


O = —ü(@ + iAÿ) = — [ 7107) Ps (Au) dt (32.365) 
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où encore une fois © est la fonction x + (Gwv)(t, x). Maintenant nous utilisons la proposi- 
tion 30.86 pour dire que 


d Ô 
SE (ratu)) = af ue) + u (Se )) (32.366) 
pour écrire ï 
— ik Cue(0)) — af (a) + ue(i(AU)(E, ))dt (32.367) 
Le premier terme est facile : 
d t=N 
[ (ut) )dt = Jim Luc], = (32.368) 


parce que Ÿ est à support compact par rapport à t. Nous restons donc avec 
É a (pe) — éu((AD)(t, )}dt = 0 (32.369) 
Nous traitons le terme en un) en utilisant le fait évident T(ç@) = (FT)(F-l6) et en remar- 
quant le lemme 30.87 : 
ui (de) = (Fu Fun) = (Fu) (Fe). (32.370) 


Pour l’autre terme on fait un peu la même chose en nous souvenant ce que fait la transformée 
de Fourier en traversant le laplacien : 


u(AŸ+) = (Fuw)(F lAy) = (Fu) (x => — xl} (F ui) (x). (32.371) 


En recollant encore : 
J Fu) PF be) + (Fu) (IPF) dt = 0. FR ages 
R 


Cette équation est valable tant que 4 € .7(R x R‘) avec support compact en £. Nous allons 
nous en créer une super cool. D'abord nous choisissons ÿ € .7/(R) et y € Z(R) et nous 


considérons ?! 
DE x) = F(E lé O(E)x(#)) (x). 48237) 


Notons que la transformée de Fourier conserve le fait qu’une fonction soit Schwartz ??, mais 
pas le fait d’avoir support compact. Cependant nous ne prenons que la transformée de Fourier 
par rapport à x. Le résultat est donc une fonction 4# qui est Schwartz par rapport à x et 
support compact par rapport à t. Nous pouvons donc écrire (32.372) en utilisant la fonction 
(22,378) : 


0 = [eut (x ” cle p(x)x(#)) + (Fu) (x 4 le f2e*lel 2 (x)x(e ) dt. ET 


Là dedans, v{t) peut sortir à la fois de la transformée de Fourier et de l’application des 
distributions; il doit seulement rester dans l’intégrale. Dans le second terme nous allons 


utiliser l'égalité (due entre autre à la proposition 30.86) : FAN RÈR 
de tte 2 4 PT 
a (re g)) D” (ue (Fe e)) (32.375a) 
= a (FeïtllÈ) + us (Aretre) (32.378b) 


= (ul) M pr 
( 


) + (Fu) (x = iafPe*tle (x) (32.375c) 
_ (Fu) (x _ eitlal? x)) + (Fu) 


) ze ile et (x) lem. 30.87. 
(32.375d) 


) 
) 


21. Le candidat qui parvient à effectivement présenter ça comme développement, il est fort. 
22. Proposition 29.20. 
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Et là, magie c’est exactement ce qui est dans (32.374). Donc 


d | 
J Lau(x > ele p(x))x(#)dt = 0 (32.376) 
r dt 
pour toute fonctions à support compact x. Donc la proposition 30.1 nous dit que 
Gûu(x re ele (x) = 0. (32.377) 


C’est zéro partout et non seulement presque partout parce qu’en plus nous avons la continuité. 
Par conséquent pour tout t € IR nous avons 


(x etlel? (x)) = âo(x + p(x)) = 0. (32.378) 


Et cela est vrai pour toute fonction @ € .7(R°). Nous considérons donc to € R et une fonction 
0e .S(R) pour construire 


(x) = e #0 p(x). (32.379) 


Nous avons alors à, CE > O(x)) = 0, ce qui signifie que à, = 0. Du coup pour tout 0 € .7(R‘) 
nous avons w(F0) = 0, mais comme la transformée de Fourier est une bijection de .7(R4) 
(proposition 29.26) nous avons en fait u,,(0) — 0 pour tout 0 € (Rd), c'est-à-dire w, = 0 
pour tout to € R et au final u = 0. 


32.12 Équations différentielles du premier ordre 


Définition 32.52 (Équation différentielle du premier ordre). 

Une équation différentielle du premier ordre est une équation qui, sur un intervalle donné, 
I, décrit la relation entre une variable réelle, notée x ou t dans 1, une fonction y : 1 — KR, et la 
dérivée première de y qui on note y. 


Souvent on écrit «y/(x) = une formule contenant x et y(x}», c’est à dire 


d(&) = F(& y), pour ze I, SES BA) 
où f est une fonction de deux variables réelles. 


Remarque 32.53. 
La théorie des fonctions de deux variables ne sera pas abordée dans ce cours, nous allons nous 
contenter de prendre f dans (32.380) comme une simple notation. 


On peut presque toujours omettre d'écrire la dépendance de y en x et écrire simplement (32.380) 
sous la forme y’ = f(x,y). 


Définition 32.54 (Solution particulière d’une équation différentielle du premier ordre). 
Une solution particulière de l'équation (32.380) sur l'intervalle I est une fonction z : I—R 
telle que : 

(1) z est dérivable sur T ; 


(2) z'(x) = f(x, z(x)), pour tout re I. 


Définition 32.55 (Solution générale d’une équation différentielle du premier ordre). 
Résoudre une équation différentielle veut dire trouver l’ensemble qui contient toutes ses solutions 
particulières. Cet ensemble s'appelle solution générale de l'équation. 


Exemple 32.56. (1) Résoudre une équation du type y'(x) = f(x) revient à trouver l’ensemble 
des primitives de la fonction f, qui est donc la solution générale de cette équation. Il y a 
donc une infinité de solutions particulières, déterminées par une constante additive. 

Si f(x) = sin(x) alors la solution générale sera Y = {— cos(x) + C': CE R}. 
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(2) sua . 2, en squation_exponeiietts 


a peut-être été abordée dans votre cours de terminale lors de la définition de la fonction 
exponentielle. Sa solution générale est Y = {Ce” : C'E R}. Ici aussi il y à une infinité de 
solutions particulières. 

A 


Remarque 32.57. 
La solution générale d’une équation différentielle du premier ordre est une famille à un paramètre 
de fonctions. 


Définition 32.58 (Équation différentielle du second ordre). 
Une équation différentielle du second ordre est une équation qui, sur un intervalle donné, T, 
décrit la relation entre une variable réelle, notée x ou t dans T, une fonction y : 1 — KR, et les 
dérivées première et seconde de y qui on note y et y” respectivement. 

On utilise la forme générale 


y" - f(x, y,y), pouræel. sd_generale_second frûr | 


où f est une fonction de trois variables réelles. 


On peut définir de manière analogue les équations différentielles d'ordre supérieur. Les défini- 
tions de solution particulière et de solution générale se généralisent aux équations différentielles 
d'ordre supérieur à un. 


Définition 32.59 (Trajectoire). 
La trajectoire tracée par une solution particulière y de l’équation (32.380) est le graphe de y en 
tant que fonction de x. 


Exemple 32.60. 
Nous allons regarder de plus près l'équation (32.381), y = y, pour tout x € R. Nous savons que 
les solutions sont données par 

Y={Ce : CER}. (32.383) 


Soient y1 et y2 deux solutions distinctes de cette équation. Les seules solutions qui s’annulent en 
un point sont les solutions identiquement nulles. Nous supposons n'être pas dans ce cas y1 et y2 
ne s’annulent pas. 

Supposons qu’il existe un point x tel que y1(7) = y2(x) alors forcément y1(x)/y2(x) = 1. Le 
rapport y1(x)/y2(x) vaut C1/C2 et par conséquent C1 = C2. Ce résultat contredit l'hypothèse que 
les deux solutions soient distinctes. On a donc montré que deux trajectoires distinctes de cette 
équation ne se croisent jamais. 

La figure 32.1 représente quelques trajectoires de l'équation. Si on les avait tracées toutes elles 
recouvriraient tout le plan. Cela veut dire que par tout point (x, y) passe une et une seule trajectoire 
de l'équation (32.381). 

A 


Définition 32.61 (Condition initiale). 

Une condition initiale pour l'équation (32.380) sur l'intervalle T est un point (x,y) e TI x R. 
On dit que la solution particulière z de (32.380) satisfait la condition initiale (x,y) ET x R si 

AE) = 

Définition 32.62 (Problème de Cauchy). 

L'association d’une équation différentielle et d’une condition initiale est appelée problème de 

Cauchy 


y(&) = ÿ. 


ü = f(x,y), æel, pine_eugay 
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FIGURE 32.1: Quelques trajectoires de l'équation y/ = YLabelFigSBTooEasQsT 


Remarque 32.63. 
Sous des conditions assez générales qui seront toujours vérifiées dans ce cours, tout problème de 
Cauchy admet une et une seule solution. 


Pour passer de la solution générale d’une équation différentielle de premier ordre à une solution 
particulière il faut choisir une valeur du paramètre. Comme il y a un seul paramètre une seule 
condition (la trajectoire de la solution doit passer par un point fixe du plan) peut suffire. Pour une 
équation différentielle de second ordre comme (32.382), nous aurons besoin de plus de conditions. 
Sans rentrer dans les détails, nous allons constater ce fait dans l’exemple suivant. 


Exemple 32.64. 
La solution générale de l’équation 


ÿ = —y, °4-exRÇoRR 


est V = {Ci cos(x) + Cosin(x) : C1, C2 € R}. Remarquez que l’équation est du second ordre et 
que sa solution générale est une famille d'équations à deux paramètres réels. Ce sera toujours les 
cas pour les équations abordées dans la section 32.15. Pour déterminer une solution particulière 
de (32.385) il faut fixer les valeurs des deux paramètres et donc, en général, il sera nécessaire de 
donner deux conditions. A 


Remarque 32.65. 
Une condition comme y(0) = 4 nous dit que la constante C1 = 4 mais elle ne nous permet pas de 
trouver C2. Il y a donc une infinité de solutions de (32.385) qui satisfont à la condition y(0) = 4. 


On peut fixer les deux conditions de deux manières différentes. 


(1) Problème de Cauchy : on fixe une terne de valeurs réels #, y, y et on cherche la solution telle 
que y(z) = ÿ, Y(x) = y. 


Exemple 32.66. 
Les conditions y(0) = 4, y(0) = 15 permettent de trouver la solution 2(x) = 4cos(x) + 
15sin(x). pa 


(2) Problème aux bords : on fixe deux points dans le plan x-y, À = (x,y) et B = (%,ÿ), et on 
cherche la solution dont la trajectoire passe par À et B, c’est à dire, on impose y(x) = y, 
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y) = ÿ. 
Exemple 32.67. 


Les conditions y(0) = 4, y(rx/2) = 15 permettent de trouver la solution z(x) = 4cos(x) + 
15sin(x). A 


32.13 Premier ordre, variables séparables 


Pour certaines équations différentielles la recherche d’une solution particulière se réduit à une 
recherche de primitive moyennant un changement de variables. 


Définition 32.68 (Équation différentielle du premier ordre à variables separables). 
Une équation différentielle du premier ordre à variables séparables est une équation qui, 
pour tous les x dans un intervalle donné, 1, peut se mettre sous la forme 


f{y)y = g(x), °4-83:386) 


où f et g sont deux fonctions de R dans R. 


Nous pouvons intégrer les deux côtés de l'égalité par rapport à x et obtenir 


J f(u(æ)}y/(x) dx = G(x) + C, 


où G est une primitive de g et © une constante réelle. Il est facile à ce point d’effectuer un 
changement de variable dans le membre de gauche de l’équation en posant (sans surprise) y = y(x) 
et donc y/(x) dx = dy. 


[Auto (a de = | #0 dy = Fa) + 6 
où Fest une primitive de f et C' une constante réelle. En somme nous avons 
F(y(x)) = G(x) +0, 
et, si F admet une fonction réciproque, alors 
y(x) = FT (G{(x) + C). (32.387) 


Remarque 32.69. 
L'expression de F1! peut être difficile à calculer. Il sera alors préférable de garder y dans la forme 
implicite. 
Exemple 32.70. 
L’équation . 

3ÿ°y = x, pour tout xeR, = 538$ 
est une équation à variables séparables. Pour reprendre les notations du début du chapitre, ici 
f(y) = 3y° et g(x) = x. En intégrant de deux côtés on trouve 

2 


3 T 
= +c. 
Po 


La fonction F(y) = y° est une bijection de R dans R, donc nous pouvons écrire la solution générale 
de l’équation (32.388) dans la forme 


4 1/3 
»-|(5+e) mawcen) 
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Exemple 32.71. 
En intégrant de deux côtés l’équation à variables séparables 


2yy = x, pour tout xe R, (32.389) 
on trouve 
2 d C 
YU — 9 + C. 


La fonction F(y) = y? est n’est pas inversible sur tout R, et on sait que 4/y? = |y|. Au moment 
de rendre y explicite on doit choisir entre 


2 1/2 2 1/2 
y= (+c) ou y=- (+0) . 


Ce choix se fait suivant la condition initiale, si elle est donnée. Si il n’y a pas de condition initiale 
nous pouvons écrire que la solution générale est l’ensemble 


2 
D = {y Re Rtels quest T + Cet Ce). 


A 
Exemple 32.72. 
On considère le problème de Cauchy 
y = js ve], -8l, (32.390) 
y(—4) = 0. 


En intégrant des deux côtés nous trouvons 
e* = In(|x + 3|) + C. 


Nous pouvons alors imposer la condition initiale et obtenir e° = In(| — 4 + 3|) + C, c'est à dire 
C=1-In(1)=1 


Remarque 32.73. 

L'’énoncé du problème de Cauchy dit que x peut varier dans |—c0, —3[, mais nous voyons maintenant 
que la solution n’est pas définie sur toute la demi-droite, parce que e” est toujours positif et 
In(}x + 3|) + 1 est positif seulement pour x < —(1/e +3) & —3,3679. 


Donc la solution du problème de Cauchy est y(x) = In(|x + 3|) +1 pour tout x €] — 0, —(1/e + 
3) A 
exemple_eq_hom 
Exemple 32.74. 
Attention, cet exemple est le plus important de la section! 
On considère l’équation à variables séparables 


y = sin(x)y, xeR. Farroerz ten 


Dans ce cas, pour pouvoir écrire l’équation dans la forme (32.386) il faut pouvoir multiplier les 
deux côtés par 1/y. Il faut donc éliminer tout de suite le cas où y = 0. 

Si y = 0 alors y = 0 et on a une solution constante (on dit souvent : une solution stationnaire) 
de l’équation. Par ailleurs les trajectoires des solutions ne peuvent pas se croiser ; donc si ya est 
une solution non nulle de l'équation (32.391) alors ya(x) # 0 pour tout x. Il n’y a donc aucun 
danger à diviser par y dans la recherche d’une solution non identiquement nulle. 


23. Ça vaut la peine de prendre un peu de temps pour bien comprendre cela. 
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Supposons maintenant que y Æ 0 et écrivons y//y = sin(x). En intégrant des deux côtés on 
trouve 
n(|yl) = — cos(x) + C, 


d’où 


— cos(x)+C' C',— cos(x) 


ly| = e =e"e : 


Si on avait imposé une condition initiale alors on pourrait déterminer une solution particulière 
de l’équation en choisissant une valeur de la constante ©. Nous pouvons observer cependant que 
la fonction exponentielle est bijective de IR dans R*T* et par conséquent il n’y a pas de perte de 
généralité en disant que la solution générale de l’équation est 


Y = {u : [y] = Ke=%@), pour K € REA) LU {y = 0}. 


Il n'empêche qu’il serait plus élégant d'écrire la solution générale de l’équation sous une forme plus 
explicite, sans valeur absolue. Nous pouvons le faire en nous nous rappelant que 


x six > 0, 
x] = . 
—T si æ < 0, 


Il suffit alors d’autoriser K dans R* pour éliminer la valeur absolue. 

Pour écrire la solution générale de façon encore plus compacte nous observons que si À = 0 
alors y = 0, c’est à dire, on retrouve la solution constante nulle. 

Finalement, la solution générale de cette équation sera toujours écrite sous la forme suivante 


V = {y _ fer PR pour K € R} . (32.392) 


A 


32.14 Équations différentielles linéaires du premier ordre 


Définition 32.75 (Équation différentielle linéaire du premier ordre). 
Soit IC R un intervalle . 
Une équation différentielle linéaire du premier ordre est une équation différentielle de 


la forme ; 
a(x)y + b(x)y = c(x), pour x el, °q-tin_onfre 


où à, b, c sont des fonctions de R dans R et a Æ 0 pour tout x el. 
On dit que a, b, c sont les coefficients de l'équation (32.393). 
remarque_lineaire 
Remarque 32.76. 
Une fonction f : IR — IR est dite linéaire si pour tout x1, x2 dans KR et pour tout couple de 
constantes À et u on à 


FO + ur2) = ÀAf(x1) + uf(x2). Sa REED 


Ces équations différentielles sont dites linéaires parce que la partie de l’équation qui contient y (le 
membre de gauche) satisfait la propriété (32.394) par rapport à y. En effet par les propriétés de la 
dérivée nous avons que 


ax) (A + uy2) + b(e)QXn + age) = X(a(x)yi + b(x)y1) + H(a(x)y2 + b(x)y2). 


Définition 32.77. 
L'équation (32.393) est dite homogène quand c est la fonction nulle. Si (32.393) n’est pas homo- 


gène on dit que l’équation | 
L d 
a(æ)y + b(x)y = 0, FT se) 


est son équation homogène associée. 
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Toute équation linéaire du premier ordre homogène est une équation du premier ordre à va- 
riables séparables, comme nous en avons vu l’exemple 32.74. Nous n’allons pas répéter les détails 
du procédé pour trouver sa solution générale, qui aura la forme suivante 


À retenir 32.78 


y, = {re tie Ke R} | solgeneqlingrdres 


Proposition 32.79. (1) Soit y, une solution particulière de l'équation (32.393) et yn une solution 
particulière de l'équation homogène associée (32.395). Alors la fonction somme 2 = Yp + yn 
est encore une solution particulière de l'équation (32.393). 


(2) Soient y1 et ya deux solutions particulières de (32.393). Alors la fonction différence w = 
y1 — Y2 est une solution particulière de (32.395). 


Démonstration. (1) 


a(t) (up + Un) + br) (9 + Un) — x) = (a(x)y, + b(x)up — c(x)) + (a(x)y}, + b(x)yn) = 0: 
(32.397) 
(2) 


ax) (ga — ya) + b(x) (ui — ve) = (a(x)yi + b(x)yn — c(x)) — (a(x)y2 + b(x)yo — c(x)) = 0. 
(32.398) 


Cette proposition permet de démontrer le théorème suivant, qui est le plus important de cette 
section. 


Théorème 32.80. 
Soit y» une solution particulière de l'équation (32.393) et Y, la solution générale de l’équation 
(32.395), alors la solution générale de l'équation (32.393) est l’ensemble 


V = Yn + Up = {2 = Yn +Yn : Y=hE}Y»}. (32.399) 


À retenir 32.81 
La résolution d’une équation différentielle linéaire du premier ordre comporte trois étapes : 


(1) résolution de l’équation homogène associée ; 
(2) recherche d’une solution particulière de l’équation non homogène ; 


(3) somme de la solution générale de l’équation homogène et de la solution particulière 
trouvée au point précédent. 


La partie qui nous manque encore est de savoir comment trouver une solution particulière de 
l'équation non homogène (32.393). Si la fonction c dans (32.393) est une constante ou un polynôme 
simple, ou une exponentielle alors on peut essayer de deviner. Cette méthode cependant n’est pas 
la plus sure pour des débutants. 


Exemple 32.82. 
On considère l’équation 
y — 5y = 10, ze R. (32.400) 
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Comme tous les coefficients de l’équation sont constants on peut essayer de trouver une solution 


constante. 
Toutes les fonctions constantes ont une dérivée nulle, par conséquent, si une solution constante 
existe elle doit satisfaire —5y = 10, ce qui veut dire que la solution constante est y(x) = —2. A 


Exemple 32.83. 
On considère l’équation 
ay +y=x+l, zxeR'*. (32.401) 


Comme le membre de droite de l’équation est un polynôme de degré un on cherche une solution 
de la forme y(x) = Ax + B avec À et B dans R. 

Par substitution on obtient Ax + (Ax + B) = x + 1, c’est-à-dire que une solution particulière 
de l’équation est y(x) = x/2 + 1. A 


Exemple 32.84. 
L’équation 
zYÿ —y=x+1, xeR'*. (32.402) 
ressemble beaucoup à celle de l'exemple précédent, cependant il n’existe pas un polynôme de degré 
un qui en soit solution. 
Dans un cas comme celui-ci, il faut rapidement abandonner la divination et replier sur la 
méthode, plus technique mais plus sure, dite variation de la constante. PA 


32.14.1 Méthode de variation de la constante 


— Soit y} la solution générale de l’équation homogène associé à (32.393). Il s’agit d’une famille 
à un paramètre de fonctions. La première étape de cette méthode consiste à construire 
un candidat solution particulière y, en remplaçant le paramètre dans Y}, par une fonction 
C':R — R à déterminer. 


Exemple 32.85. 

L’équation homogène associée à y — y = cos(x) est y — y = 0, dont la solution générale 
est Vn = {Ce : CE R}. Le candidat solution sera alors y, = C(x)e”, avec C fonction à 
déterminer. A 


— La deuxième étape de cette méthode consiste à injecter y, dans l'équation. Cela permet de 
trouver une équation différentielle à variables séparables pour ©, en principe plus facile à 
résoudre que l'équation de départ. 


Exemple 32.86. 
On continue avec l'exemple précédent. On a y, = C’(x)e* + C(x)e”, d’où 
(C'(x)e” + C(x)e”) — C(x)e” = cos(x), 
c’est-à-dire 
C'(x) = cos(z)e *. 
A 


— La troisième étape de la méthode consiste à trouver une solution particulière de l’équation 
différentielle pour Cet, par conséquent déterminer une 7». 


Exemple 32.87. 
La solution générale de 
C"(x) = cos(xz)e *. 


est C — {e-1 0 cote) +K :KE R}. Il nous suffit une solution particulière, nous pou- 


vons donc choisir A = 0 et alors la solution particulière de (32.393) sera yp(x) = Le Che CR 
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Remarque 32.88. 

Le plus souvent en intégrant l'équation pour C on en trouvera la solution générale. Dans ce cas 
on peut remplacer C' par cette solution générale et obtenir d’un seul coup la solution générale 
de l’équation (32.393) , c’est-à-dire sans faire la somme entre la solution générale de l’homogène 
associée et la solution particulière. 


Exemple 32.89. 
Dans l’exemple qu’on vient de voir la solution générale de (32.393) est 


(sin(x) — cos(x)) 
2 


V = Yh + Yp = {cer + : cer}. (32.403) 
On obtient le même résultat est écrivant Y — {e- (e-1 Et ete +K])]:KEeR}. Notez qu'on 
a changé le nom du paramètre de C à K seulement pour souligner qu’on obtient de même résultat 
par deux chemins différents, sinon les deux expressions sont équivalentes ! A 


32.15 Equations différentielles linéaires du second ordre 
Secordredeux 

Définition 32.90 (Équation différentielle linéaire du second ordre). 

Une équation différentielle linéaire du second ordre est une équation différentielle de la 


is eq_lin_ordre 
a(x)y”" + b(x)y + c(x)y = d(x), pour xel, Do, EE A 


où à, b, c et d sont des fonctions de R dans R et a Æ 0 pour tout x el. 
On dit que a, b, c et d sont les coefficients de l'équation (32.404). 


Dans ce cours nous allons étudier exclusivement le cas où a, b et c sont des fonctions constantes. 


Définition 32.91 (Équation différentielle linéaire du second ordre homogène). 
Une équation différentielle linéaire du second ordre homogène est une équation différen- 
tielle de la forme (32.404), telle que le coefficient d est nul. 


À toute équation de la forme (32.404) on peut associer une équation homogène exactement 
comme on à fait dans la section précédente pour les équations linéaires du premier ordre. 


32.15.1 Équations différentielles linéaires du second ordre homogènes à coeffi- 
cients constants 


Remarque 32.92. 
L'application qui à la fonction y fait correspondre a(x)y” + b(x)y' + c(x)y est linéaire, au sens de 
la remarque 32.76. 

Cela nous dit en particulier, que si y1 et y2 sont deux solutions de l’équation homogène alors 
toute leur combinaison de la forme z = Ày1 + uy2, avec À et u dans R, est encore une solution. 


Jusqu'ici nous avons toujours travaillé avec des fonctions définies sur KR et à valeurs dans R. 
Dans cette section nous nous autorisons à passer par des fonctions définies sur KR et à valeurs 
dans €, mais cela sera uniquement une étape dans nos calculs. Au final toutes les solutions 
que nous allons considérer sont des fonctions à valeurs dans R. 


La solution générale à valeurs dans les complexes d’une équation de ce type a la forme 
1 dre_d 
VE = {Cie "E + Cher : Ci, Ce O,rel}, °°1-86n-0rdre_denx non 


où r1 et r2 sont aussi des nombres complexes. Remarquez que la solution générale est une famille 
à deux paramètres. Il faut aussi observer que en tout cas l’intervalle Z dans lequel varie x est un 
intervalle dans R, parce que 7 est une des données du problème. 
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À partir de cette information nous pouvons, pour toute équation donnée, chercher la solution 
générale complexe par substitution. Il suffit de remplacer y dans l’équation par e"* et chercher 
les valeurs de r qui nous conviennent. 

Si notre équation de départ est 


li d d 
ay” +by +cy=0, pourxel, mot 33-100) 


alors la substitution nous donne 
e"? (ar? + br + c) = (. 


Il est connu que la fonction exponentielle ne prend pas la valeur 0, par conséquent ce qui s’annule 
est le polynôme de degré deux ar? + br + c. Il est donc très facile de trouver les valeurs de r qu’on 
pourra utiliser comme r; et r2 dans la solution générale complexe. 


Si b? — 4ac > 0 : le polynôme admet deux solutions réelles et distinctes, r1 et r2: 

Si b? — 4ac < 0 : le polynôme admet deux solutions complexes conjuguées, r1 = à +iB et ro = 
a — iB; 

Si b? — 4ac = 0 : le polynôme admet une solution réelle double r = r1 = ro. 


Il faut maintenant écrire la solution générale réelle de l’équation, qui est celle que nous intéresse 
vraiment. La façon de l’obtenir est différente dans les trois cas. 


Si b? — 4ac > 0 : la solution générale réelle a la même forme que la solution complexe, (32.405), 
il suffit de prendre les paramètres C1 et C2 dans R plutôt que dans C. 


Dh = {Chen + Cher : Ci, Che RPT eff, 0078-0770 EE 


Si b? — 4ac < 0 : le polynôme admet deux solutions complexes conjuguées, r1 = à +iB et ra = 
a — iB; Il faut alors utiliser les formules suivantes 


ea+i8 — e*(cos(B) Lu isin(B)) 


Un e%(cos(B) — isin(B)). (32.408) 


T2T 


La somme e"t? + 672%, où x est dans JE R, vaut 


eto+ib)e + (a—i)e 2 02 (cos(Bx) + isin(Bx)) + e%(cos(Br) — isin(Br)) = 2e? cos(Bx) 
et la différence e"1? — e72? vaut 
eta+ib)e _ (a—i)e 2 02 (cos(Bx) + isin(Bx)) — e%(cos(Br) — isin(Bx)) = 2e% sin(Bx). 


Par ces deux calculs élémentaires nous avons trouvé deux fonctions à valeurs dans R qui 
n’ont pas de zéros en commun. Elles sont les génératrices de la famille des solutions réelles 
de l'équation différentielle (la solution générale) 


Vn = Le (Ci cos(Bx) + C2 sin( fe) Fe Ce RTE fux-hom_cong} ann) 


Si b? — 4ac = 0 : le polynôme admet une solution réelle double r = r1 = r2. Dans ce cas la solution 
générale de l’équation est la famille 


Dh = {(C1 + Cor) : ÉLIcEE — 79" ire -deux_hom_donplersc 


Pour justifier cette formule nous observons d’abord que toute fonction x + Ce'*, pour 
C'ER est une solution de l'équation différentielle (par construction). Ensuite nous utilisons 
la méthode de variation de la constante. On trouve rapidement que si une fonction de la forme 
x + C(x)e'* est une solution alors C(x) est un polynôme de degré au plus 1, c’est-à-dire 
C(x) = C1 + C2x avec Ci et C2 dans R. 
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32.15.2 Linéaires du second ordre à coefficients constants, non homogènes 


Nous ne présentons pas une méthode générale pour la résolution de ces équations. Comme dans 
le cas des équations différentielles linéaires du premier ordre non homogènes, la solution générale 
de (32.404) est donnée par la somme d’une solution particulière et de la solution générale de 
l'équation homogène associée. La recherche d’une solution particulière est facilitée par le fait que 
les coefficients de (32.404) sont supposés constants, c’est-à-dire que a, b et c sont des fonctions 
constantes. [Il faut essayer de deviner la forme d’une solution particulière à partir de la forme du 
second membre de l'équation, la fonction d. Si d'est un polynôme il faut essayer avec un polynôme 
du même degré, si d est une exponentielle, par exemple d(x) = e°?, on pourra essayer avec un 
multiple de la même fonction exponentielle, dans l’exemple f(x) = ke°*, avec k à determiner. Si d 
est une combinaison linéaire de sinus et cosinus, comme par exemple 12 cos(x) + 2sin(x), on peut 
essayer avec k1 cos(x) + ko sin(x). 


Exemple 32.93. 
On considère l’équation différentielle 


J 
y" + 12y + 36y = —192%, xeR. sxenple_nop gr 


Son équation homogène associée est 
1 
y! + 12y + 36y = 0, sxenple_h9n 45 


dont le polynôme caractéristique est r? + 12r + 36. Ce polynôme admet une racine double, qui est 
—6, par conséquent la solution générale de (32.412) est 


Vn = {(Ci + Core © : Gi, DER,ze R}. 


Le membre de droite de (32.411) est une fonction exponentielle, nous allons donc chercher une 
solution particulière de (32.411) de la forme f(x) = ke. Par substitution nous trouvons 


ke*(4 + 12 x 2 + 36) = —192e°7, 


ce qui veut dire que k doit être —3. 
La solution générale de l’équation (32.411) est donc 


VE {(Ci . Cox)e = et : Ci, Gel, re R}. 


Exemple 32.94. 
Nous allons résoudre l’équation 


y" + 12y + 36y = 12cos(x) +2sin(x), xeR. (32.413) 


Cette équation a comme homogène associée l’équation (32.412), comme dans l’exemple précé- 
dent. Il nous suffit donc de trouver une solution particulière de (32.411). 
Nous pouvons essayer avec f(x) = ki cos(x) + k2sin(x). Par substitution on trouve 


— (k1 cos(x) + ka sin(x)) + 12 (—k1 sin(x) + ka cos(x)) + 36 (k1 cos(x) + ka sin(x)) 
= 12cos(x) + 2sin(x) 
Cette équation doit être satisfaite pour toute valeur de x, en particulier pour x = 0 et x = 7/2. 


Cela revient à considère séparément les coefficients des fonctions sinus et cosinus. Il faut alors que 
k1 et k2 soïent solutions du système 


—k1 + 12k2 + 36k1 — 12, 
—k2 — 12k1 + 36k2 — 2. 
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On trouve k1 = 396/1369 et k2 = 214/1369, et la solution générale de notre équation est 


Y = (ci + Core 6? + cos(x) + _. sin(x) : C1, ER, zxe R} : 
A 
Exemple 32.95. 
Nous allons résoudre l’équation 
y" + 12y + 36y = 107? +3, xeR. (32.414) 


Cette équation a comme homogène associée l’équation (32.412), comme dans l’exemple précé- 
dent. Il nous suffit donc de trouver une solution particulière de (32.411). 
Nous pouvons essayer avec f(x) = k1x? + kox + k3. Par substitution on trouve 


(2k1) + 12 (2k1x + ka) + 36 (k1x° + kox + ka) = 10x° + 3. 
Pour trouver les bonnes valeurs des coefficients nous devons résoudre le système 


36k1 db 
24k1 + 36ko = 0, 
2k1 + 12k2 + 36k3 = 3, 


ce qui donne k1 = 5/18, k2 = —5/27 et k3 = 7/54. La solution générale de notre équation est 


5 5) 7 
6x 2 : 
Y = LCA + Code + jee 27 54 :G GER seR}. 


A 
32.16 Fonction de Green 
Soit l'équation différentielle 
{ y'(x) = g(x) (32.415a) 
(0) =wy(1) = 0 (32.415b) 
pour x € |0,1{ et où g est continue sur ]0,1{. 
Nous définissons la fonction de Green 
t(x —1 10<t<xz<1 
ol D 8 s (32.416) 
x(t—1) si0<r<t<l, 
et nous allons montrer que 
1 
E FD 
y(x) = | G(x,Og(tidt RooCOFDoRrRUTRe 


est l’unique solution. 


(1) Unicité 
Si y1 et y2 sont des solutions, alors y} = y5 et donc y1(x) = ya(x) + ax + b. Les conditions 
aux bords donnent alors 0 = y1(0) = y2(0) + b = b. D'où b = 0. En imposant y1(1) = 0 nous 
trouvons alors immédiatement a = 0, ce qui donne y; = y. 


2406 CHAPITRE 32. ÉQUATIONS DIFFÉRENTIELLES ORDINAIRES 


(2) Existence 


Il est vite vérifié qu'avec (32.417) nous avons y(0 
pour tout t. Nous fixons une valeur pour x € ]0, 


= y(1) = 0 parce que G(0,t) = G(1,t) = 0 
[ et nous découpons l'intégrale : 


) 

1 
Ua 1 

Te [ G(x, t)g(é)dt + | G(x, tg(t)dt. (32.418) 


Pour calculer y(x), il faut dériver à la fois à travers l’intégrale et dans la borne. Si vous 
connaissez une formule pour faire cela, c’est bien pour vous. Nous allons faire ça à la main 


et poser 
y 
I(x,y) = Î t(x — 1)g(t)dt. (32.419) 
0 
La dérivation de 1 par rapport à x se fait en utilisant le théorème 17.27 : 
OT y 
CE Î tg(é)dt. (32.420) 
Ox 0 


Pour la dérivation par rapport à y, il s’agit du théorème fondamental de l’analyse, plus 
précisément le lien primitive et intégrale de la proposition 14.262 : 


OI 
2 9) = VG — 1)a(v). (32.421) 
Maintenant nous considérons la fonction wr(x) = I(x,x). Elle satisfait à 
I OT F 
pyi(x) = (2) + 0) = Î tg(t) + x(x — 1)g(x). (32,499) 


Le même jeu avec J(x,y) = (e x(t — 1)g(t)dt donne 


px) = Le — ljg(t)dt — x(x — 1)g(x). (32.423) 


En remettant les bouts ensemble, 


= Î | taté)dt + J = bg(bdt. (32.424) 


1 


Le calcul de la dérivée seconde donne alors 
(a) = æg(e) + (1- æ)g(x) = g(). (32.425) 


Nous pouvons aussi, sur cette équation, estimer la variation de la solution en termes d’une 
variation de g. Soit donc une fonction continue ô, sur [0,1] et g = g + à,. Nous considérons 
l'équation différentielle 


ÿ'(x) = ÿ(x) (32.426a) 
ÿ(0) = ÿ(1) = 0. (32.426b) 


Par ce que nous venons de faire, l’unique solution est 


1 1 1 
Co = Î Ga, (bat = Î Ga, Dg(t)dt + Î G{x,0)6,(#)dt = y(x)+ (x) (32.427) 
0 0 0 


où 0, est une fonction continue ainsi définie : 


— [ CU D6 (bat. (32.428) 
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Supposons que |ô,|x = €. Alors des majorations donnent 


L x ll € 50 6 : 
ével <e[ (Ga. Ddt = 12) [eût + ex [| dt = Sa(l x) 008 7ZPoRGENET, 


DA 


Mais la fonction x + x(1—x) a son maximum en x = à, donc nous pouvons donner une majoration 


indépendante de x : 
1 EQooTWQH Y 
lôyleo < glégleo: RON ANS 


Notons que la majoration (32.430) en norme uniforme a l’air plus impressionnante, mais la majo- 
ration (32.429) donnant une majoration séparée pour chaque x est en réalité plus précise. 
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Chapitre 33 


Equations aux dérivées partielles 


33.1 Symbole principal, équation des caractéristiques 


Soit l'équation différentielle semi-linéaire d'ordre k 


D aa(r)(u)(x) + F(a,u(x),(Du)(x),…, (D u)(x)) = joe) 


lal=k 


pour la fonction u: R°— R. 


DEFooWPGHooNIMAuS 
Définition 33.1. 
Le symbole principal de l’équation (33.1) est l’application 

o:R/xR/—R 
(x, D aa(r)é Ge 
lal=k 

où ao = lo on) EtE = (bn) alors Eee ES, 

DEFooYYNOUooZ17Mxu 


Définition 33.2. 
Une caractéristique de l'équation (33.1) est une surface S de RŸ donnée par l'équation g(x) = 0 
où D satisfait à 


{ o(x, Vo(x)) = 0 (33.3a) 
Vo(x) # 0 (33.3b) 


pour tout x € S. Ici, o est le symbole principal (définition 33.1) de l’équation différentielle. 


33.2 Méthode des caractéristiques pour l’ordre 1 
SECooHKSLooUCYNDz 
Nous[712, 713] voulons étudier l’équation d'ordre 1 


aa) Een) + ban) Ge v) + eau) = Jan) RTE 


Le champ de vecteurs associé à cette équation est 


v = () , (33.5) 


(uv : Vu) +cu= f. (33.6) 


et l’équation peut être écrite sous la forme 
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DEFooNYVSooZRjNcH 
Définition 33.3. 
Le flot de ce champ de vecteurs sont les courbes paramétriques y(t) = (x(t), y(#)) vérifiant 7 (+) = 


v(y(t)). 
E URBTooVdFzZR 
Les équations du flot pour l’équation (33.4) sont | A9P Ho 


x (t) = a(x(t), y(t)) (33.7a) 
y'(t) = b(x(t),y()). (33.7b) 


Ce sont des équations différentielles ordinaires. Un système de deux équations couplées du premier 
ordre. 

Quel est l'intérêt du flot ? Nous allons voir que sur la ligne t > (t), la fonction u est constante. 
Or des solutions + au système (33.7), il y en aura plusieurs : une pour chaque valeur des constantes 
d'intégration. Pour peu que ces lignes recouvrent tout le plan, nous pourrons résoudre l’équation 
de départ ligne par ligne. 

Nous posons 


a(t) = u(x(t),y(t)) (33.8a) 
ë(t) = c((t),y(#)) (33.8b) 
FC) = Fat), y). (33.8c) 


La fonction à est une fonction IR — IR normale qui se dérive normalement, en suivant la règle de 
dérivation des fonctions composées : 


w(t) = AU U)EAU) + 3, 0: vE)v (6) (33.9a) 
: 7e + Fe (33.9b) 
= f(x), y) — c(x(0, y) )u (xt), y(6)) (33.90) 
— f(t) — é(t)ü(t). (33.94) 


Nous avons pour ü l'équation différentielle ordinaire 
À rs 


W += f (33.10) 


qui est résolue par la proposition 32.11. 


33.2.1 Un exemple complet un peu minimal 


Nous considérons l'équation différentielle[712] 


0 (33.11) 


Et nous allons la résoudre. 
Les équations du flot, sont simples parce que les coefficients sont des constantes : æ’(t) = 1, 
y'(t) = —1. Donc 
x(t)=t+C (33.12a) 
y(t) = —t + Co. (33.12b) 


À priori nous avons une caractéristique pour chaque choix de (C1,C2) et nous espérons que le tout 
recouvre le plan R?. En fait seule une des deux constantes doit être laissée libre, l’autre consiste 
seulement en décaler le paramètre t. Nous posons donc C1 = 0 et nous considérons les courbes 


caractéristiques 
t 
7c(t) = Le. . | (33.13) 
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Ces courbes recouvrent bien tout le plan. Pour savoir les valeurs de u sur la courbe c, nous devons 
résoudre l’équation différentielle ordinaire 

üo + So = f, (33.14) 


en sachant que ë(t) = c(x(t),y(t)) = —(x(t) — y(t)) = 2t — C. Cela se fait en suivant la méthode 
décrite dans l’exemple 32.9 et résumée dans la proposition 32.11. 
En termes de notations, äc(t) = u(yc(t)). Récrivons l'équation : 


a’ (t) — (2t — Cya(t) = 0. (33.15) 


La méthode pour la résoudre est de mettre les à d’un côté et les t de l’autre : 


4 
ee, (33.16) 
u 
En intégrant par rapport à t des deux côtés, 
In(ä) =#-Ct+Ko, (33.17) 
c’est-à-dire (avec redéfinition de Xc) 
ä(t) = Koe” © (33.18) 


ou encore 


u(c(t)) = K per ct EnooSSTJooEgénn 


où Cest le paramètre que nous déterminons en sachant sur quelle caractéristique se trouve le point 
(x, y) où nous voulons calculer u(x,y) et K est une constante (strictement positive parce que si 
vous avez suivi le mouvement, c’est une exponentielle) qui doit être déterminée par les conditions 
initiales. Dès que K est fixé pour un des points de la courbe %c, alors il est fixé pour tous les 
points. 

Ce que nous avons obtenu est qu’il existe un XÇ tel que pour tout t nous avons 


u(ro(t)) = Koeï-Ct, (33.20) 


Soit donc un point (x0,Y%o) € IR2. Nous devons d’abord déterminer où ce point se trouve par 
rapport aux caractéristiques, c’est-à-dire quelle est la valeur de C' pour laquelle (x0, yo) est sur la 
courbe 7c, et ensuite déterminer pour quelle valeur de { nous aurons yc{t) = (x0, yo). À résoudre : 


rc (to) = ee: c) - si | (33.21) 


Donc to = xo et C = xo + yo. En reprenant (33.19) nous avons 
u(c(to)) = Kero—(to+vo)t0 Z Ke-20%0, (33.22) 


Pour peu que des conditions soient données sur chaque caractéristique, nous pouvons déterminer 
K. Attention : ce X est une constante d'intégration de l’équation différentielle ordinaire pour à. 
Donc elle n’est valable que sur chaque caractéristique séparément. Cela n’est donc pas du tout une 
constante sur IR?. 
Nous pouvons maintenant écrire la solution générale de l'équation de départ. L’équation car- 
tésienne de la courbe c est 
x+y=C. (33.23) 


Donc K est une fonction de x + y, pas de x et y séparément. Cela est important à comprendre. À 
priori nous avons 
u(z,y) = K(x,yje (33.24) 


où K(x,y) est constante sur la courbe +c contenant (x,y). Nous avons 
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— 8i + Vi F1, 
— alors il existe © tel que (x1,w1) et (x2, y2) sont sur %c, 
— alors K(x1,y1) = K(x2, y2). 


Donc il existe une fonction R — R telle que K{(x,y) = f(x + y). 
Au final, la solution générale de l’équation est 


u(x, y) = f(x +y)e "* (33.25) 


où f est une fonction à déterminer par les conditions initiales qui peuvent être données. Typi- 
quement nous espérons que les conditions imposent une et une seule valeur de uw sur chacune des 
courbes yc. 


33.2.2 Un théorème d’existence et d’unicité 


La méthode des caractéristiques donne essentiellement une preuve de l’unicité des solutions 
aux équations de transport, et une méthode pour construire cette solution. En effet, la procédure 
suivante permet de construire u(xo, yo). 


— Trouver la caractéristique passant par le point (x, %o) 
— Calculer en quel point elle passe par une condition initiale donnée. 
— Attribuer à u(xo, Yo) la valeur trouvée sur la caractéristique là où elle passe par une condition 
initiale. 
Rien ne permet à priori de savoir que cette procédure construit effectivement une solution. En 
particulier, comment calculer du ? Le quotient différentiel serait 


- Ce, u) = lim ; (33.26) 


mais la caractéristique donnant la valeur de u(x + €, y) est différente pour chaque €. Rien à priori 
ne permet d'affirmer que le calcul soit simple, ni qu’il arrive à une solution du problème donné. 
D'où la nécessité d’avoir un résultat un peu rigoureux donnant des conditions sous lesquelles 


les choses vont bien. 
PROPooVQLBooQyFfEH 


Proposition 33.4 (Équation de transport à coefficients variables[713, 703]). 
Soit une fonction c: R? — R de classe C? en ses deux variables et uniformément Lipschitzienn 


BEQSooKWBFooK 
en sa première variable! et ge C(R). Alors l'équation aux dérivées partielles de premier ordre EERUPS id 
o © 
(et) + (re, (&,9) = (33.27a) 
u(x,0) = h(y) (33.27b) 


admet une unique solution de classe C". 
Cette SGsEGe est construite de la façon suivante?. D'abord nous considérons la solution X au 


: UBEQSooTOCEooH 
problème 
ox 
7 6 rt) = c(X(s;x,t),s) (33.28a) 
s 
Alba = (33.28b) 


et ensuite le problème (33.27) a pour unique solution 


ut = AA: 0) FAROPFS NE 


1. Dans [703], on ne demande que continue puis uniformément Lipschitz. Moi je crois que ce n'est pas assez pour 
assurer la dérivabilité de X par rapport à x, et encore moins pour permuter les dérivées dans 02,Y. 
2. Le fait que la construction ait un sens fait partie des choses à prouver 
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Démonstration. Nous commençons par étudier l’existence et l’unicité de la fonction X définie par 
le problème 33.28. La fonction c ici est dans les hypothèses de la fonction f du théorème de Cauchy- 
Lipschitz global 17.43. D'où l’existence et l’unicité de la fonction s + X(5;x,t) sur R pour chaque 
(x, y) donné*. 

La proposition 32.39 nous dit que X est de classe C? en (s,x,t). Donc nous pourrons dériver 


et permuter les dérivées autant que nous voudrons (sans exagérer : ordre 2 au maximum). 


(1) Unicité Nous montrons que u doit être constante sur le chemin 


Nat) (s) = 4 , (33.30) 


S 


En effet, en posant 


p(s) = u(y(s)) = u(X(s:x,t),s), (33.31) 
et en dérivant nous obtenons 
F ou | oX : ou : 
P (s) Œ ot (X(s: T, L), s) 5 T, t) + FA (X(s; T, t)) = (. (33.32) 


Par conséquent la valeur commune de tous les u(Yx,8 (5) doit être celle en 7:#(0) = 
R(X(0: x, t)) 
Cela prouve l’unicité parce que la valeur de u est fixée en tout point. Nous devons encore 
vérifier que la fonction u ainsi construite est bien une solution du problème. C’est l’objet de 
la partie « existence » de la preuve. 

(2) Existence 


Même l'existence est divisée en plusieurs étapes. 


(2a) Mise en place 


Nous prouvons que la fonction w donnée par (33.29) est une solution du problème. Nous 
avons : 


Ou ’ OX. 
ze) = h'(X(0; a,t)) (0: x, t) (33.33) 
. 8 ox 
u / . . 
et) = h'(X(0: mt) (DE), (33.34) 
de sorte qu’en posant 
oX ox 
g(s:x,t) L 21) + c(x,t) (8: 2) (33.35) 
nous avons Ô 5 
üu u , . . 
ne R'(X(0:;x,t))g(0; x, t). (33.36) 


(2b) Une équation différentielle pour g 


Nous allons prouver que 


Ô 
(#52, = Q(x,t(8)9(8; tt) (33.37) 
avec 
Ax fs) = er t),s). (33.38) 
(x;t) Eu AA 
D'abord nous avons 
0g, ER 'e ox 
FA int) — Sao (6: Lt) + c(e,t) (ss 2,1). (33.39) 


3. Avec l'énoncé tel que donné dans [713], il faut utiliser la technique de 32.22 pour l’existence globale, parce que 
la fonction b là-dedans n’est pas dans les mêmes hypothèses. 

4. La ligne suivante est une de celles qui me font penser qu'il manque des hypothèses dans [703]. Il faut bien pouvoir 
dériver c. 
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(2c) 


(2d) 
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Nous permutons les dérivées et nous tenons compte de (33.28) : 


og... _ 0 . Q ; 
3 6%) = ZE (c(X(s:x,1),5)) + (at) (c(X (82,8), 8) ). (33.40) 
Nous dérivons maintenant plus en profondeur. D'une part 
© êc OX 
En CAC mt), s)) _. (xs: 0); s) 3 Es 2 à (33.41) 
et d’autre part, 
Q êc 0X 
(A (s:2,8),s)) = TE (A(at),s) (2,0), (33.42) 
de telle sorte que 
0g, _. © | OX, OX, 
(sad) = SE (X(s2,t),5) EC 2,1) + c(e D (s:2,0)| (33.43a) 
= Q(x,t}(5)9(s; tt). (33.43b) 


Une condition initiale pour g 


Nous montrons maintenant que g(t; x,t) = 0. La condition initiale pour X est X(t;:x,t) — 
æ pour tout t,x € R. Nous dérivons cette dernière par rapport à x et à t : 


Enpoq ep4rg 
PR ETS En ERpoNNeEEEFENA 


Mais 0,X(t;x,t) = c(X(t;x,t),t), donc la relation (33.44b) donne 


(tx, _ —c(X(t;x,t),t) = —c(x,t) RONA 


où nous avons tenu compte du fait que X(t;x,t) = x. 


Voyons à présent ce que (33.44a) et (33.45) donnent pour g(t; x, t) : 


PILES (2,0 + cle, 9 (ta) = —c(x,t) + c(x,t) = 0. (33.46) 
ü 


Conclusion pour g 


La fonction g vérifie l'équation différentielle 


(3) = a(s)g(s) (33.47a) 
g(t) = 0. (33.47b) 


Bien entendu, g(s) = 0 est une solution. Mais la solution à ce système est unique par 
Cauchy-Lipschitz 17.42. [ci nous utilisons le fait que 


(sy) > a(s)y (33.48) 
est continue. C'est-à-dire entre autres que 
Ôc 
sr a AS He) (33.49) 
x 


doit être continue. C’est le cas parce que c est de classe C! en sa première variable. 
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Les hypothèses de la proposition 33.4 sont loin d’être optimales. Voici un exemple dans lequel 
c n’est même pas dérivable par rapport à t et qui se passe très bien quand même. 


Exemple 33.5. 
Soit l'équation différentielle 
Ou 
—(x,t +-1(xt) = 0 (33.50a) 
u(x,0) = (x) (33.50b) 


où À est une fonction bien régulière; mettons C?. En suivant la méthode de la proposition nous 
devrions poser l’équation différentielle 


(2,0 = |s—1] (33.51a) 
Ale (33.51b) 


Cela est la caractéristique passant par (x,t). Cependant il sera plus simple de chercher les carac- 
téristiques en demandant qu’elles passent par (x0,0). Nous allons donc plutôt résoudre pour X3, 
l'équation différentielle 


(8) = |s—1] (33.52a) 
Xz0(0) = æo (33.52b) 


et les courbes caractéristiques seront les chemins 


0 (5) = . | (33.53) 


S 


La résolution donne d’abord 


52 : 

RE <1 

Less (33.54) 
5 —s+K si s > 1. 


Vu que la condition initiale est donnée pour s = 0, nous fixons X3 pour la condition initiale et K2 
pour la continuité : 

_ + Ss + T0 sis < 1 

Xz0(S) = 4 À + to sis=1 (33.55) 

52 : 

Ts +itgy sl. 
Soit (r,t) € R?. Quelle caractéristique passe par là? Nous allons déterminer la fonction xo(x,t) 
qui donne le xo tel que la caractéristique x, passe par (x,t). Nous devons résoudre 


D _ o | (33.56) 


Directement : s = t. Et ensuite X,,(t) = x. Nous avons 


z+Ë-t sit<l 
ro(x,t)= 4x sit=1 (33.57) 
TS 


Le truc presque étonnant est que 0 est de classe C!. En effet le calcul de 


Ôt €—0 € 


(33.58) 
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se fait en séparant les limites € — 0Ÿ et € — 07. Le résultat est que &x0(1) = 0. Nous avons donc 
t—1 sit < 1 

(tj = +0 sit=1l (33.59) 
—t+1 sit>l. 


É 
ot 


Cela étant continu, la fonction +9 est de classe C1 en t, et la dérivée en x étant toujours 1, elle est 
de classe CT. 
En ce qui concerne la solution de l’équation de départ, 
u(z,t) = R(X(20 (0)) = A(xo(x, t)). (33.60) 


Pourvu que h soit assez régulière, la fonction u est facilement de classe C1. A 


33.3 Méthode des caractéristiques pour l’ordre 2 


33.3.1 Principe général 


Soit l'opérateur différentiel agissant sur C?(R}?) : 
©? al ra 
D= Y)— + (x, y) —— Y)— 33.61 
a(,y)=s + ba, y) Gxog * c(x, y) ET (33.61) 
Nous voulons résoudre des équations du type Du = 0 pour u: R°? — R. 


Pour commencer{712], et c’est le point crucial, nous voyons D comme un polynôme en ©, et Ôy 
et nous le factorisons : si 


aX?+bXY + cY? = (aX + BY)(yX +6Y) (33.62) 
alors nous avons 
D—\ a : ph d d + à . + termes d'ordre inférieurs (33.63) 
Ôx °y Vox °y ‘ ‘ 


Les « termes d’ordre inférieurs » sont ceux de la forme a(x, DEL T 


L’astuce est de poser 


U = (0x + 00y)u, (33.64) 

et de résoudre le système M 
(aûz + Boy)v = 0 (33.65a) 
(0x + 0y)u = v. (33.65b) 


Cela sont deux équations différentielles du premier ordre pour lesquelles nous avons déjà des 
techniques décrites en la section 33.2. 

Afin que les fonctions a, B, y et 6 soient réelles, il faut que b? — 4ac > 0. Sachant que a = æ, 
b = aô + By et c = Bô cette condition sur a, b et c donne 


(aëô + By)? — 4086 > 0. (33.66) 


Cela revient à 
(aë — By}? > 0. (33.67) 


Nous supposons à présent que l'inégalité soit stricte (cas hyperbolique). Nous avons en particulier 
que 


où — By Æ 0. (33.68) 

Cette condition implique que les équations 

dx dy 

— — 33.69 

a os) = BY) (33.69) 
sont indépendantes des équations 

dx dy 

 — — 33.70 

nu eu) 2 = (x, u) (33.70) 


Ce sont les équations caractéristiques des équations (33.65). 
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33.3.2 Exemple : l’équation d’onde 
SUBSECooYBBKooUDI1CsS 


Nous considérons l’équation aux dérivées partielles 


Fu peu 


où c est une constante réelle. Nous en cherchons des solutions de classe C°?. 
L'opérateur différentiel est donné par le polynôme P(T, X) = T? — c?X? qui se factorise en 


P=(T+cX)(T-cX), (33.72) 


c’est-à-dire que nous pouvons récrire l'équation des ondes sous la forme 


(4 + cOz)(@ — côz)u = 0. (dira) 
Nous posons donc v = (0, — cô,;)u et nous avons le système[702] 
(6, + be » pp EReeCAPasVeceR (33.74a) 
SUBE PWXM j 
CR) 7 (33.74b) 


La méthode des caractéristiques est efficace pour résoudre la première, et pour trouver la solution 
; 
générale de l’homogène associée à la seconde. 


Nous nous lançons dans la résolution de (33.74a). Le flot est v — o. et nous cherchons ses 


courbes intégrales sous la forme w(t) = (t,x(t)). Immédiatement, +/(t) = c, ce qui donne 


A 
an e n a (33.75) 
Cela donne une caractéristique pour chaque valeur de €. En posant üc(t) = v(t, ct +C') nous avons 
. Ov Ov 
ëc(t) = a No) + = (ct) = 0. (33.76) 


Donc üc est une fonction constante. Donc v est constant sur la courbe yc dont l’équation carté- 
sienne est x — ct = C. Cela implique que 


u(é,x) = f(x — ct) (33.77) 


où f est une fonction de classe C!. En effet si (41,æ1) et (t2,22) vérifient æ1 — ct1 = 2 — cto alors 
v(t,22) = v(t2,t2). Le fait que f soit C! est une demande que v soit au final dans C?. 
Nous devons maintenant résoudre l'équation (33.74b) 


(+ — coy)u = v. (33.78) 


Nous allons agir conformément à la stratégie expliquée par le lemme 32.7. Nous devons résoudre 


Du = v avec 
D: C(R) — D(C?(R)) 


33.79 
ur (04 — Cox)u. ) 


Par la même méthode des caractéristiques que celle déjà menée plus haut nous trouvons ker(D) 
comme solution générale de (© — cô;)ua = 0. C'est-à-dire 


ua = g(x + ct) (33.80) 


où g est une fonction quelconque de classe C?. 
Il nous faut maintenant une solution particulière de 


(© — coz)up(t,x) = f(x — ct). (33.81) 
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Si Fest une primitive de f alors 
1 
up(tr)= TSF — ct) (33.82) 


fonctionne. Vu que f est quelconque dans C{(R), la fonction F est un élément quelconque de 
C?(R). Au final, la solution générale de l'équation des ondes est 


u(t,x) = g1(x + ct) + g2(x — ct) (33.83) 


où g1 et g2 sont des éléments de C?(R). 


33.4 Classification des équations du second ordre 


Soit une équation générale d’ordre 2 sur R?° : 


o?u o?u ?u ou Ou 
— .84 
PET Sr } (33.84) 


a 


En ce qui concerne son symbole principal nous avons 


ox, y, Er, É) = a(x, y)éf + b(x, yJéréo + c(x, y)é5, (33.85) 


ce qui donne l'équation des caractéristiques 


0p\? pop 0 \? EQooSAFNooEimP 
«(%) a te(s) = (. ÉÉR 


Si nous nous posons sur un point (xo, yo) tel que Vé(xo, yo) = 0 et (0, yo) À 0 alors, via le 
théorème de la fonction implicite”, la condition (x, y) = 0 définit une fonction y + x(y) vérifiant 


p(x(y),y) = 0 (33.87) 


pour tout y dans un voisinage de Yo. 

Nous pouvons obtenir une équation différentielle ordinaire pour x de la façon suivante. D'abord 
nous posons (y) = p(x(y), y) et ensuite nous calculons la dérivée de @ (qui est nulle par construc- 
tion) : 


ons 08 », 09 
0 = (y) Er + dy" (33.88) 
Nous pouvons donc remplacer ©, par x'0,9 dans l'équation des caractéristiques (33.86) : 
2 2 2 
no + bx' ce + de (x)? = 0. (33.89) 
0x Ox Ox 


Vu que nous avons supposé (0,9) Æ 0 sur un voisinage de (x0,Yo) nous pouvons simplifier par 
(29)? et avoir l'équation différentielle ordinaire 


a(x(y),y) + b(x(y), y}x'(y) + c(æ(y), v)r/ (y)? = 0: (33.90) 


Notons que, conformément à ce que raconte le théorème des fonctions implicites, nous avons pris 
un voisinage de yo suffisamment petit pour que x(y) reste dans un voisinage de x9. Ce voisinage 
étant, nous pouvons le restreindre pour nous assurer du signe de a, b et c. Cela est évidemment 
très théorique parce que le théorème de la fonction implicite parle de l’existence de voisinages, 
mais pas de façon de les construire. 

Nous donnons la classification suivante. 


5. Théorème 17.51. 
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Définition 33.6 (elliptique, hyperbolique, parabolique). 
Types d'équations différentielles. 


(1) Si b? — 4ac < 0 alors l’équation est elliptique. 
(2) Si b? — 4ac > 0 alors l'équation est hyperbolique. 
(3) Si b? — 4ac = 0 alors l'équation est parabolique. 


Exemple 33.7. 
Un exemple d’équation parabolique est l’équation de la chaleur 


Ou Ou 

——-àa— =0 33.91 

ôt 0x? 
où à > Ü est une constante. Cette équation est avec b = c = 0, donc elle est parabolique. A 


Une équation aux dérivées partielles peut changer de nature selon le point. 


Exemple 33.8. 
Soit l'équation 
ou 


GP) = 


2 0. (33.92) 


Son b? — 4ac vaut 4(x? — y?). Elle peut donc être hyperbolique, parabolique ou elliptique selon le 
point où l’on se trouve. A 


33.4.1 Problème au limite 


Dans les définitions qui suivent nous considérons un ouvert ® & R‘ assez régulier et possédant 
en particulier un vecteur normal extérieur n(x) pour tout point x € 00. 


Définition 33.9. 
Un problème aux limites de Dirichlet est d'imposer la condition 


u(x) = g(x) (33.93) 
pour tout x e T € 0Q. C'est-à-dire imposer la valeur de u sur une partie du bord du domaine. 


Définition 33.10. 
Un problème aux limites de Von Neumann est d'imposer 


= ge) (33.94) 


pour tout x e LT € OQ. C'est-à-dire imposer les valeurs de la dérivée normale de u sur une partie 
du bord. 


Exemple 33.11. 
Lorsqu'on veut imposer un flux de chaleur aux bords d’un domaine pour l’équation de la chaleur, 
il s’agit de poser des conditions de type Von Neumann. A 


Définition 33.12. 

Soit un domaine Q de R et un opérateur différentiel L sur une partie de Fun(Q). Soit une fonction 
g sur 0Q. Un problème aux limites stationnaires est un problème du type : trouver u définie 
sur ( telle que 


L(u) = f (33.95a) 
ulen = 9. (33.95b) 
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Définition 33.13. 
Un problème aux limites d’évolution est du type : trouver u € Fun (10, of x Q) tel que 


Et + L(u) = f sur ]0, co[ x Q 
u(t,.)=g(t,.) sur |[0,o1[ x 0Q (33.96) 
u(0,.) = uo sur Q 


où uo est une fonction sur Q. 


L'opérateur L ne doit pas opérer sur la partie «t » de u. 
DEFooSNIRooBFYSFh 


Définition 33.14 (Problème bien posé au sens de Hadamard). 

Un problème aux limites est bien posé au sens de Hadamard si 
(1) Il admet une unique solution. 
(2) La solution dépend de façon continue en les données du problème. 


La continuité est au sens des normes sur les fonctions sur 0Q et sur ® en ce qui concerne les 
fonctions « données » du problème et des normes pour les fonctions sur ou en ce qui concerne 
la solution. 


Exemple 33.15 (Un problème de Dirichlet bien posé). 
Trouver la fonction u définie sur @ = [0,1]? telle que 


—Au=0 sur Q 
(33.97) 
u = g sur 00. 
A 
33.5 Principe du maximum 
LEMooSPVUooDQUeom 


Lemme 33.16 ([561]). 
Soit un ouvert borné Q € R". Soit une matrice symétrique strictement définie positive À telle que 
A;j € C9(Q) pour laquelle il existe À > O0 minorant toutes les valeurs propres de toutes les matrices 
A(x) pour x e (6. 

Nous posons L'=—Y;; Ai;0;;. Siue C?(Q) atteint un minimum local en xo € À, alors 


(L'u)(xo) < 0: (33.98) 


Démonstration. Nous allons bien entendu diagonaliser A. Si T est une matrice nous avons, en 
posant u(x) = v(Tx) : 


Ou Ov 
x, (x) = D _ (T x) Tri (33.99) 
et D D 
u 0) 
= Ti (To). x 
Gnès (x) 274 Tino (Tx) (33.100) 


Si T est en particulier une matrice orthogonale diagonalisant A (théorème 9.221) nous avons 
A 
SAT” = Dy = Xjôy (33.101) 
ij 


où les À sont les valeurs propres de À. Notons que partout ici, tout est fonction de x sur { : tant 
A que T que les À. Avec tous ces résultats nous calculons vite que 


(Lu)(x0) = — D (dv) (To). (33.102) 
k 


6. Cela est plus que dire que toutes les A(x) son symétriques strictement définie positive. 


33.5. PRINCIPE DU MAXIMUM 2421 


Si +0 € Q est un minimum local de u, alors l'application v a un minimum local en 11x05. Et donc 


Ov 

— > 0. 1 

Er (Trip) = 0 (33.103) 
Du coup, 

(Lu)(xo) < 0. (33.104) 


LEMooDVUYooHEkrsL 
Lemme 33.17 ([561]). 

Soit un ouvert borné Q € R”. Soit une matrice symétrique strictement définie positive À telle que 
A;j € CU(Q) pour laquelle il existe À > 0 minorant toutes les valeurs propres de toutes les matrices 

A(x) pour x € (1. 

Nous posons 
L=-N A, + biôi+e (33.105) 

19 t 


où bi,cE CA(G). 


Soit u e C°(Q) n C?(Q) telle que Lu > 0 sur Q. Alors 
(1) Sic=0 alors 


ITEMooZNUVooNGPXVc 


min(u) = min(u). FORCE AD | 


a C9) 
ITEMooQ0QIooJaqTzdA 
(2) Si c > 0 alors EQooGSXV 
min(u) > min(—u_) ERP AO) 
a 0 
où u_ est défini par 

0 j > 0 
u_(x) = ue (33.108) 

—u(x) siu(x) < 0. 


Démonstration. D'abord, vu que ( est borné, la fermeture ( est compacte et u y atteint son 
minimum. De plus 0Q est également compact (borné et le complémentaire est ouvert parce que 
Q est ouvert). Donc u y atteint également son minimum. Cela pour dire que les minimums écrits 
dans (33.106) et (33.107) ont un sens. 
Pour (1). 
(1) Lu>zn>0 
Nous supposons qu’il existe 7 > 0 tel que (Lu)(x) > pour tout x € (. Soit xo le point 
minimum sur (. Si x € Q alors il est intérieur et u(xo) = 0 par la proposition 17.72. Dans 


ce cas nous avons 


(Lu)(xo) = (L'u)(xo) > 0, (33.109) 


ce qui contredit le lemme 33.16. Nous en déduisons que le minimum de w sur ( n’est pas 
atteint dans (, mais sur 0Q. Pour la définition de la frontière, voir 7.117. Ici nous avons 
00-20; 
Cela prouve (33.106) dans ce cas. 

(2) Lu > 0 sur Q 
Nous prenons maintenant le cas général. Nous posons 


ue) = ur) 6er (33.110) 
Nous avons ? 


Le) = e1( — An(x)y? + bi(x)y). (33.111) 


7. Nous abusons un peu de l'écriture parce que ce que nous calculons vraiment est L(x > BA 
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Soit y suffisamment grand pour que 
XP — blé > 0. (33.112) 


Ici À minore toutes les valeurs propres des A(x) et nous notons que 7 ne dépend pas de €. 
En utilisant l'inégalité du lemme 9.228(3), pour tout € € R” nous avons 


D Aube > EP, (33.113) 
ij 
ce qui donne avec £ = e1 : Ay1 > À, et même pour être plus précis : Ay1(x) > À pour tout x. 
Ces inégalités donnent 


— An (x)y? + br) < — AY? + lb < 0. (33.114) 
Nous avons donc 
E XCG 
Le) = V1 — An1(x)y? + b(x)y) < — M2 + biloy <0. ER REES) 


Nous posons 
n = (A7 — bio) min(e%®), (33.116) 
Q 


où le minimum a un sens parce que Q est borné. Nous avons 7 > 0. 
C’est le moment de calculer ce que u. peut pour nous : 


Luc) = Lu — eL(e%*) (33.117a) 
> —eL(e"1) suBEgoo T2 A LAA 
= —ee*1(— Au(x)y? + bi (x)7) (33.117c) 
à ae (39e — Plan) D 
>n>0. (33.117e) 


Justification : 
— (33.117b) parce que Lu > 0. 
— (581174) par (98.05). 


La fonction u. est donc dans le cas précédent et nous avons 


Î — €e%1) = mi — ee"). 393.118 
min (u(x) — ee) min (u(x) — ee*°1) ( ) 


Mentionnons le fait que le choix fait de y ne dépend pas de €. Nous pouvons donc encore 
faire varier € sans toucher à 7 et en maintenant toutes les inégalités prouvées jusqu'ici. 
Vu que l’expression eŸ*1 est majorable sur ( nous avons convergence uniforme 


de Lier (33.119) 


pour € — (. 
Supposons qu'aucun point de 0Q ne réalise le minimum de u. Alors il existe x0 € Q tel que 
u(xo) > u(x) pour tout x € 0Q. Mais comme 00 est compact, il existe 7 > 0 tel que 


u(xo) < u(x) + n. (33.120) 


Soit e tel que }u — u.|; < 7/2. Nous avons 


u(xo) < u(x) — 7 (33.121) 
et donc aussi 
ue(to) < U(Xo) + : < u(x) — : = ue(r), (33.122) 


ce qui signifierait que u. prend son minimum dans (. Or nous savons que ce n’est pas le cas. 
Donc il existe un point de 0Q qui réalise le minimum de «. 
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Pour (2). | 
Supposons pour commencer que & > 0 sur (. Alors par continuité u > 0 sur (. Alors u_ = 0 
et 
minu > O, (33.123) 
Q 
ce qui fait que l'inégalité (33.107) est évidente. 
Nous supposons donc que l’ensemble 
Q_ = {x e ( tel que u(x) < 0} (33.124) 


est non vide. Notons que c’est également un ouvert. 


Soit Lu = Lu — cu. Vu que c > 0 et que Lu > 0 nous avons Lu > 0 sur Q_. Par le point (1) 


nous avons 


Mais le minimum de u est certainement atteint dans (_, donc 


min u(x) = minu(x). 
zen xeQ 


Cela nous donne une première bonne égalité : 


in u(x) = min ar). 


Nous pouvons la prolonger : 


min u(x) = Juin u(x) 


= min (—u-_(x)) 


xe0Q_ 
— u-(x)) 


min (— u_(x)) 


= min ( 
xe0N_n0Q 


Justifications : 
— Pour (33.128c) nous avons la décomposition 


0Q_ — (00 n Q) U (00 n 00). 


Or sur 0Q_ n Q nous avons u(x) = 0 et donc pas le minimum. 


(33.125) 
(33.126) 
(33.127) 


(33.128a) 


(33.128b) 


SUBEQOOUVEXagRA EE 
RE 184) 


(33.129) 


— Pour (33.128d). Sur 0Q, le minimum est atteint dans la partie 0Q_ parce que le reste ne 


contient que des valeurs positives de u. 
Cela prouve ce que nous voulions. 


Théorème 33.18 (Principe du maximum fort). 
Soit un ouvert borné Q de IR". Soit une matrice À dont 


— À;; est dans C(Q) 
— A(x) est symétrique strictement définie positive pour tout x. 


— Il existe À > 0 minorant toutes les valeurs propres des toutes les matrices A(x) sur (. 


Soit bi,c € C9(Q) avec c(x) > 0 sur Q. 
Soit u e C(Q) n C?(Q) telle que 


— Y Aiu(z) + Ybiôru(x) > 0 
ij i 
u(x) > 0 Vr € 00. 
Alors u > 0 sur (1. 


Démonstration. Nous appliquons le lemme 33.17(2) : 


min u > min(—u_). 
Q 2Q 


Vu que u(x) > 0 sur 0Q, nous avons u_ = 0 sur 0Q et donc mins u > 0. 


(33.130a) 


(33.130b) 


(33.131) 
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33.6 Quelques exemples 


33.6.1 Un changement de variables 


Soit l'équation différentielle 


Ou d'u . EooPGDPog) VAR 


Ôt 0x? 
sur Q = ]0,00[ x R. Nous imposons la condition aux bords 
0 six <0 
u(0, x) = L x on | Y0RS 
1 six >0. 
Nous cherchons les solutions sous la forme 
u(t,x) = f (5) | (33.134) 
Nous avons à . 
Le 3/2 gr [ Ÿ 
= — rt _ 1 
3 5? Î ( 3) (33.135) 
ainsi que 
ou ds a 
: 33.136 
2 nr" (4%) ee 
et >» 
ùu LL, x 
= ; 33.137 
de. on 
En remettant le tout dans l'équation de départ et en simplifiant par 1/t (qui est permis parce que 
LUN: 
1,{/z\x (ET EROOCRKTORYNh 
= 0. 33.188) 
1 () 7 (Gr) 
Nous résolvons l’équation différentielle 


E EFQPooGWV 
Sd) + g'(z) =0 QooEFAPoR Non 
pour la fonction g de la variable réelle z. Cela fait, la réponse sera f = go z où z serait la fonction 
z(x,t) = x/Vt, (33.140) 


Pour résoudre (33.139) nous commençons par résoudre pour la dérivée h = g/, c’est-à-dire 
l'équation différentielle 


Sh() + h(z) = 0 (33.141) 
qui donne 
h'(z) 
eV 2/2. (33.142) 
Une intégration fournit In (A(z)) = —z2?/4 + K et donc 
h(2) = Ke 7/4 (33.143) 
et - 
g)=C+K Î e*/Aqs. (33.144) 
0 


Nous ne pouvons pas aller plus loin parce que nous ne sommes pas capables de calculer la primitive 
demandée. Nous laissons donc g sous cette forme et nous posons 


u(x,t) = g(x/Vt), (33.145) 
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en pleine confiance du fait que cela soit une solution de l’équation aux dérivées partielles (33.132). 
Nous devons fixer X et C de telle façon à respecter les conditions aux bords (33.133). D'abord 
écrivons aussi explicitement que possible la fonction « : 


zVt 
u(t,x) = K + c ee /4qs. (33.146) 
0 


Il faut calculer u(0,x) en termes de Cet K. Pour cela nous calculons, pour un x fixé : 


lim u(t,x) = K +C lim er /4qs. (33.147) 
t—0+ t—0+ Jo 


En utilisant un petit changement de variables sur l’intégrale gaussienne de l’exemple 14.300, et en 
remarquant que la fonction est symétrique, 


K+C Î 0 
PT Pi Ru (33.148) 
t0+ K—-Cy7r six<o0. 
À résoudre : 
K+Cyr=1 (33.149a) 
K Cyr =0. (33.149b) 
Solution : C = 1/2,4/7 et K = 1/2. Au final, 
db FN 
_ —5/4 1 
(fa) = 5 + ll ea, (33.150) 


Notons que cela donne une valeur pour u(t, 0) : 


ut 0) = . (33.151) 
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Chapitre 34 


Numérique 


D’autres lectures agréables dans [714]. 


34.1 Introduction 


À quels types de problèmes peut-on s'attendre lorsqu'on se lance dans du calcul numérique, et 
en particulier dans la résolution numérique d’équations (algébrique, différentielles ou aux dérivées 
partielles, etc) ? 

Quelques réflexions en vrac sur ce sujet. 


Les erreurs de représentation de nombres : troncature et propagation de décalales (drift), 
Erreur de compensation (cancellation), 
Conditionnement, stabilité : les réponses peuvent fortement dépendre des paramètres, 


Si on utilise une méthode itérative, comment savoir à quel moment on s’arrête ? Calculer la 
différence [xx — 4x_1| mène t-il à une erreur de cancellation ? 

Lors d’une implémentation, les matrices des systèmes à résoudre sont souvent très grandes 
et/ou très creuses. Cela pose la question de la manière de les enregistrer. 

Pour la parallélisation, il faut faire attention au fait que parfois créer un nouveau processus 
demande plus de ressources que le mini-calcul qu’on voulait faire. Donc il ne faut pas toujours 
paralléliser tout ce qui est théoriquement parallélisable. 


Le fait que certaines méthodes sont non-déterministes (Monté-Carlo) mène à des problèmes 
pour les tests unitaires des implémentations. 


34.2 Représentations numériques 


Dans cette section, les séquences de chiffres écrites entre crochet sont à comprendre comme des 
séquences de chiffres qui représentent une quantité suivant un codage donné. 


34.2.1 Entier relatif en complément à deux (binaire) 


Si nous avons m bits pour coder un entier relatif, une idée serait de prendre le premier bit pour 
le signe (0 pour positif et 1 pour négatif) et les autres pour la valeur absolue. Deux inconvénients : 


(1) 
(2) 


Il y a deux codages pour le zéro, donc gaspillage. 


L’algorithme pour faire la somme passe mal. Par exemple pour faire 1 + (—1), le 1 est codé 
comme [001] et le —1 par [101] et la somme se ferait naïvement comme 


H|lk © 
H|©Q © 
Ole 


Donc le résultat est [110] qui s’interprète comme —2. Complètement faux. 
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Une solution est d'utiliser le complément à deux, qui est la façon usuelle de représenter des 
entiers signés. 


Les entiers positifs se codent normalement, en laissant à zéro le premier bit (donc si nous dis- 
posons de m bits, nous codons sur m — 1 bits). 


Les entiers négatifs se codent en trois étapes. 
— coder la valeur absolue 
— inverser tous les bits (d’où le nom de « complément à deux » ) 
— soustraire 1. 
Exemple 34.1. 
Pour coder —1 nous faisons 
— Nous codons 1 : [001] 
— Nous inversons tous les bits : [110] 
— Nous faisons —1 : [101]. 


A 
Avec ce système, la somme passe bien : calculer 1 + (—1) donne 
0 O 1 
1 DO I 
1 1 0 
La réponse est donc [110] qu'il faut interpréter via le complément à deux. 
Nb EE 600. (34.1) 
Et ce dernier [000] s’interprète comme zéro. 
Définition 34.2 (Entier signé en complément à deux[715]). 
La suite de bits [am-1...a0] s’interprète via la formule 
a EQooXFHKooH 
es Lun + > a;2". ET 
i=0 


Le premier bit donne effectivement le signe du nombre, mais l’interprétation d’un nombre n’est 
pas aussi simple que ce que l’on pourrait croire de prime abord. 


Exemple 34.3 (Entier signé en 8 bits). 
Que pouvons nous faire avec 8 bits? Le plus grand nombre est codé par [01111111] qui vaut 
ne 2k = 27 1 — 127. (avez-vous utilisé la somme (1.657) ?) 

Le plus petit nombre codable en 8 bits n’est pas [11111111] mais bien [10000000] (cela est plus 
clair en regardant la formule (34.2) qu’en tentant de suivre la construction du complément à deux) 
qui signifie —27 = —128. 

Nous pouvons donc coder tous les nombres de —128 à 127. AN 


Plus généralement un système qui codes des entiers signés en N bits utilisant le complément à 
deux peut coder de —(2N—1) à 2N-1 - 1, 


34.4 (Le dépassement). 
Que se passe-t-il lorsque nous commettons un dépassement ? Calculons sur 3 bits la somme [011] + 
[001] qui revient à ajouter 1 au nombre le plus grand : 


A|©Q © 
OO 
OH H 
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qui signifie —2? = —4. Lors d’un dépassement, nous retombons automatiquement sur le plus petit. 
Ce phénomène est bien connu des personnes qui programment sans faire attention dans certains 
languages de programmation qui ne font pas attention à votre place. 


Définition 34.5 (Représentation en virgule fixe). 
Soit x un réel. On définit sa représentation en virgule fixe par 


= (10 ne, ]Lhs) (34.3) 


avec bEN,b>2,se{0,1} etx;eN,x; < b suivant la formule 


nm 


Bi) ÿ ar (34.4) 


j=-m 


34.2.2 Représentation en virgule flottante 
DEFooLYONooBNskty 


Définition 34.6 (Représentation en virgule flottante[716]). 
La représentation en virgule flottante normalisée en base b d’un nombre est la donnée de 


(1) Un bit s pour le signe 
(2) Un entier non signé q de e chiffres pour l’exposant 
(3) Une suite de chiffres [ai ...am| pour la mantisse. 


Ces données s’interprètent via la formule 


f(s, q; [ai, DS süan |) = (=? . bla; X (es IA SNESERCRS 


j=1 
où d = b°—! est le décalage. 


Une idée à retenir est que l’exposant est un entier non signé parce qu'il est plus simple d’intro- 
duire un décalage dans la formule (34.5) que de compliquer l'écriture de l’exposant. 


34.2.3 Simple précision, IEEE-754 


En écriture binaire, la représentation en virgule flottante est un peu différente parce qu’il y a 
une idée supplémentaire ; la simple précision que nous allons voir maintenant n’est donc pas un 
cas particulier de 34.6 avec b = 2. 

Nous commençons par une description informelle de la précision simple avant de donner la 
définition. La représentation en précision simple d’un nombre se fait sur 32 bits répartis comme 
suit : 

(1) 1 bit pour le signe, 
(2) 8 bits pour l’exposant interprété comme nombre entier non signé 
(3) 23 bits pour la mantisse 


Soit le triple 
(s, q; [ar, c…. , a23]) (34.6) 


Dans le cas générique, l’idée est de donner 24 bits pour la mantisse, mais en gardant en tête le fait 
que de toutes façons, le premier bit doit être 1, sinon il suffirait de décaler, c’est-à-dire changer 
l’exposant. Par conséquent la mantisse ne reçoit que 23 bits; il y a un « 1 » sous-entendu en 


première position. Donc la mantisse [a1,...,a23] est à lire comme le nombre 
23 | 
1,41... = 14+ D aj2 À. (34.7) 
j=1 


Exemple 34.7. 
La mantisse [0111000] signifie 1,0111=1+2-2+2-#+2421+14h4.2 A 
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Cela pour justifier la formule 


23 
Sp (s, AE , a23]) : (—1}(1 + > aÿ2 2)27 7, (34.8) 
j=1 
Notons : 
(1) Le « 1+ » dans la parenthèse correspond au 1 implicite en première position de la mantisse. 
(2) Il y a un décalage de 127 dans l’exposant, parce que q est un entier non signé. 


Notons que cette règle du 1 implicite dans la mantisse empêche d’écrire le nombre 0, et ne 
permet pas d'écrire des nombres franchement petits parce que le 1 implicite est en première position 
dans la mantisse. 

D'où l’idée de donner une règle particulière lorsque l’exposant vaut 0. Lorsque l’exposant est 
qg = 0, alors nous ne considérons pas de 1 implicite dans la mantisse, et le décalage de l’exposant 
est —126 au lieu de —127. D'où la formule 


23 
sp(s,q = 0,[a1...a23]) = (—1)2 126 > aj2 À. (34.9) 
j=1 


En particulier, si q = 0 et a = [0...0], nous avons le nombre zéro exact (il y a deux possibilités 
pour le code). 

Enfin, nous avons des cas particuliers lorsque l’exposant est maximum, c’est-à-dire lorsque 
q = [11111111] = 2% — 1 = 255. Dans ce cas, le nombre codé est soit +00 soit NaN. Nous posons 


sp(s,q = 255, a = 0) = +0 (34.10) 
et 
sp(s,q = 255,a # 0) = NaN. (34.11) 


Il y a en réalité plusieurs valeurs différentes de NaN, mais nous n’entrons pas dans ces détails[717]. 
DEFooËETOZooYLDVis 


Définition 34.8 (Représentation en simple précision (binaire)). 

La représentation en précision simple d’un nombre se fait sur 32 bits répartis comme suit : 
(1) 1 bit pour le signe, 
(2) 8 bits pour l’exposant interprété comme nombre entier non signé 
(3) 23 bits pour la mantisse 


Un nombre est représenté par un triple 


(s,q,[a1,..., a23]) (34.12) 


Selon que l’exposant q — d soit égal à 0, 28 — 1 = 255 ou autre chose, les règles d'interprétation 
sont différentes. Il y a donc trois cas. 


Exposant q générique[718] Si q Æ 0 et q Æ 255 alors le nombre est normalisé. La règle de 
lecture est alors 


23 . 
sp (s, q, [ax 2 , a23]) _ (—1}° (1 + >, ai2 0 )2i 8, FRRRFERP OS ETS 


j=1 


Exposant q égal à O0 Le nombre est dit dénormalisé et la règle de lecture est 
_ : EQooRTBFoo j 
Sp (s, q; [ar sis , a23]) n (—-1)°2776 > aj2” ?. PE) 
j=1 


Exposant q égal à 255 La règle de lecture est alors au cas pas cas ou à peu près. 
(1) sp(s,q = 255, a = 0) = +00. 


00 
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(2) sp(s,g = 255, a 0) = NaN. 
Vous pouvez jouer avec la simple précision dans [719]. 


Exemple 34.9 (Plus petit normalisé). 
Pour faire un nombre normalisé, il faut au minimum q = 1. En prenant a; = 0 nous obtenons le 
plus petit nombre normalisé possible en simple précision. La formule (34.13) donne 


sp(l,q=1,a = 0) = 21-127 2 2-16 L 1.17549435082229 x 10%. (34.15) 
A 


Exemple 34.10 (Plus grand normalisé). 

L’exposant q ne peut pas être maximum, sous peine de tomber dans les règles spéciales de +0 
ou NaN. Donc q = [11111110] = 2° — 2 = 254. En ce qui concerne la mantisse, il faut la prendre 
maximale, c’est-à-dire a; = 1 pour tout j. Nous avons alors le nombre 


23 
1 
spÜl.o= 2540 11...11)= (4 NN 9 7)9s ET (988 34.16a 
9224 
j=1 


E RPY j 
— 3.10282346638528859811704183484516025440 * UT PPT 6b)) 
où nous avons utilisé la somme (1.657) (et Sage pour le dernier calcul). A 


Notons ceci avec Sage : 


SageMath Version 7.0, Release Date: 2016-01-19 
Type "notebook()" for the browser -based notebook interface. 
Type "help()" for help. 


sage: A=(1- (1/2*%xx24) )*x2*xx(128) 


sage: type(A) 
<type ’sage.rings.rational.Rational”> 


tex/sage/sageSnip003.sage 


La précision du nombre donné en (34.16b) aurait été embarrassante si le type avait été un 
nombre en simple précision. Précision technique : en Python, le type int n’a pas de limite supérieure 
à part la mémoire. 


Exemple 34.11 (Plus petit non nul dénormalisé). 

Pour être dénormalisé il faut q = 0 (ce qui est toutefois assez logique si nous voulons un petit 
nombre), et pour ne pas être nul, il faut une mantisse non nulle. Donc a = [0...01]. La formule 
(34.14) donne alors 


sp(s = 0,q=0,a = [0...01]) = 27126923 2 92-149 L 1.40129846432482 x 104. (34.17) 


AN 
EXEMooRHENooGwumoA 


Exemple 34.12 (Plus grand dénormalisé). 
Pour être dénormalisé il faut toujours qg = 0, mais cette fois nous prenons la plus grande mantisse 
possible : 


23 
sp(s = 0,q=0,a=[1...1]) = 276 5277 = 276(1 - 27%) = 117549421069244 x 107% 
j=1 
(34.18) 
A 


ND 


FN 
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Notons ceci avec Sage : 


sage: B=2%xx(-126) x(1-2*xx(-23)) 
sage: A=2*x*x(-126) 


sage: n(A-B) 


1.40129846432482e-45 


tex/sage/sageSnip004.sage 


Vu que 27% = 1.2 x 107”, approximer la parenthèse par 1 donne une faute sur la septième 
décimale, ce qui est visible en simple précision. 


34.3 Problèmes pour écrire des nombres 


Définition 34.13. 
L'erreur relative commise en remplaçant un nombre réel x par une valeur approchée À est définie 
par 

zx — À 


(34.19) 


Ex := 
x 


L'erreur relative n’est pas influencée par l’ordre de grandeur de x. En effet, l’ordre de grandeur 
de À est certainement la même que celle de x, dans la majorité des cas sans problèmes. Du coup 
si æ = 200x alors x’ + 200$ et le 200 se simplifie. 

Le nombre de chiffres significatifs correct dans l’approximation est donné par — log:0(e,). La 
partie entière de ce nombre est le nombre de chiffres tout à fait exacts et la partie décimale donne 
une idée sur le fait que le chiffre suivant est plus ou moins bien. 


Remarque 34.14. 
Si nous voulons donner x € R à un ordinateur, nous sommes soumis à deux erreurs : 


(1) D'abord, vu que nous ne pouvons pas taper sur le clavier toutes les décimales de x, nous 
faisons une erreur de troncature. 


(2) L'ordinateur devant convertir cela en base deux, il commet une seconde erreur, dite erreur 
d’assignation. 


34.3.1 Troncature : la base 


Supposons que nous voulions écrire le nombre (écrit ici en base 10) 
0.4567894251 (34.20) 


de façon plus facile à lire, on peut demander de ne laisser que t chiffres significatifs. Disons t = 3. 


Technique de troncature On garde 3 chiffres significatifs : 0.456. Facile. 


Technique d’arrondi Vu que le premier qu’on supprime est un 7, le dernier qu’on garde est 
majoré de 1 : on écrit 0.457. 


Que faire si le premier chiffre rejeté est un 5 ? En première approximation, nous pouvons prendre 
la règle suivante : si le premier chiffre rejeté est un 5, il faut augmenter de 1 de dernier chiffre 
gardé parce qu’il y a presque certainement encore un chiffre non nul derrière. 


Remarque 34.15. 
Les ordinateurs travaillent tous en mode d’arrondi. 


Exemple 34.16. 
Si on doit entrer le nombre 0.38358546 dans un ordinateur qui ne garde que 3 chiffres significatifs, 
il faut taper 0.384 au clavier (erreur classique dans les exercices). PA 
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34.3.2 Troncature : le drift 


Soit une machine ne pouvant retenir que 3 chiffres significatifs et effectuant les arrondis vers 
le haut lorsque le chiffre à éliminer est un 5. Nous notons @ et @ les opérations d’addition et 
soustraction avec arrondis[720]. Les égalités comprenant plus de trois chiffres significatifs sont des 
égalités au sens de la machine. Nous écrirons donc sans états d'âme : 


160.555 = 1.555 = 1.56. (34.21) 
Considérons la suite numérique 
{ zo = 1.00 (34.22a) 
avec y = —0.555. 
Nous avons 
21 = (10.555) © 0.555 = 1.56 © 0.555 = 1.005 = 1.01 (34.23) 
et ensuite 
za = (1.01 @ 0.555) © 0.555 = 1.565 © 0.555 = 1.57 © 0.555 = 1.015 = 1.02. (34.24) 


Et ainsi de suite. La suite est donc croissante alors que la définition nous donnerait envie d’avoir 
Tn = Lo pour tout n. 


Remarque 34.17. 
En réalité, cette suite se stabilise à x, = 10 pour tout n à partir de n = 845. En effet, 


(10 0.555) © 0.555 = 10.555 © 0.555 = 10.6 © 0.555 = 10.045 = 10. (34.25) 


Le fait est qu'à ce moment, l'erreur de troncature est assez loin dans les décimales pour que le 
premier chiffre négligé soit un “0” au lieu d’un “5”. 

Notons toutefois que cette stabilité n’est pas là pour nous rassurer parce qu’elle n’en est pas 
moins complètement fausse. 


La règle de troncature adoptée dans Sage est d’arrondir au nombre pair le plus proche lorsque 
le premier nombre à négliger est un 5. Donc 12.5 s’arrondit à 12 plutôt que 13. 


Exemple 34.18. 
Soient les expressions (algébriquement égales) : 


(1) A=zx(x +1) 
(2) B=zx'+x 
Nous savons que 
=) =10 (34.26) 


et 
1=f(1) (34.27) 


parce que pour 1 et 10%, il n’y a pas d'erreurs d’assignation. 

En précision simple, 107% + 1 = 1 parce qu’en précision simple, il n’y a que 7 ou 8 chiffres 
significatifs !. 

Nous avons À = 10-30, mais x? donne un underflow parce que 1070 ne peut pas être représenté 
en précision simple. En pratique, beaucoup de logiciels en font 0. Dans ce cas, en réalité B donne 


effectivement 107% après avoir fait x? + x = 0 + x = 107%. A 


1. Erreur de « relation normale ». 
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34.3.3 Quelques bonnes règles 


(1) Si on a plusieurs nombres à additionner ou soustraire, il vaut mieux commencer par sommer 
ou soustraire ceux dont on sait qu’ils ont le même ordre de grandeur. Il n’y a donc pas tout 
à fait « associativité » des erreurs. 


(2) Les opérations délicates sont l’addition et la soustraction. La multiplication et la division 
sont sans dangers, à part l'erreur de dépassement du maximum. Dans une multiplication, on 
perd au pire quelques chiffres significatifs, mais certainement les derniers, pas les premiers. 


34.3.4 Erreur de “cancellation” 


Lorsque deux nombres sont de même ordre de grandeur, avec plusieurs nombres significatifs 
identiques, la cancellation est le fait que, suite à la soustraction, tous les chiffres significatifs ou 
presque se sont simplifiés et qu’il ne reste plus que des chiffres non significatifs. 


Exemple 34.19 ([721]). 
Sur une machine ne gardant que 4 chiffres significatifs, faire 


0.5678 x 106 — 0.5677 x 105 = 0.0001 x 106 = 0.1000 x 10%. (34.28) 


Le fait est que les trois derniers zéros ne sont pas significatifs, mais maintenant la machine nous 
fait croire qu’ils le sont. 
Une autre façon de voir ce problème est d'imaginer qu’il faille calculer la différence 


0.5678 289798 x 105 — 0.5677 3136907 (34.29) 


sur cette machine. Certes la machine nous autorise à avoir 4 chiffres significatifs, donc au moment 
d'entrer les nombres nous perdons un beau paquet de chiffres. Mais au moment de faire la différence, 
nous perdons (presque) tout le reste. Donc là où nous pouvions espérer avoir 4 chiffres significatifs 
de la différence, nous n’en avons que 1. Les trois derniers zéros de la réponse (0.1000 x 10%) sont 


faux. AN 
REMooRQIJooNLdAZE 


Remarque 34.20. 

L'erreur de cancellation provoque des chiffres significatifs faux, mais ne provoque pas de faute dans 
l’ordre de grandeur des réponses ?. Donc si nous voulons nous assurer que a et b sont égaux « à 
erreur numérique près », le test 


la—b| <e (34.30) 


est valide, malgré l'erreur de cancellation qui ne manquera pas de se produire dans le calcul de la 
différence. 


Exemple 34.21. 
Soit à résoudre l'équation ax? + bx + c = 0 avec a, b,c # 0 et b? — 4ac > 0. Solution : 


_ —b + Vb? — 4ac 
2a | 


T1,2 (34.31) 


Supposons que [4ac| « b? avec tout de même pas tellement petit qu’on se perd dans la précision. 
Bref, on suppose que seules quelques dernières décimales de b? — 4ac sont différentes de zéro. 
On a : 


V/b2 — 4ac = VE = |] (34.32a) 
—b — 1/b2 — Aac 


= 4.32b 

T1 da (3 3 ) 
_b+ VA 

at ” # (34.320) 


2. Est-ce bien vrai, cela ? 
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Si b > 0, nous avons une erreur de cancellation dans x2 parce qu’on fait la différence entre deux 
nombres presque égaux. Donc x2 mal calculé. Par contre x: est bien calculé. 

Si par contre b < O0, c’est le contraire. 

Avec a = 107%, b= 0.8, c = —1.2x 107%. À la main nous obtenons : &1 = —800, 2 = 1.5x10° *, 
et un ordinateur se tromperait ... 


SageMath Version 7.0, Release Date: 2016-01-19 
Type "notebook()" for the browser -based notebook interface. 
Type "help()" for help. 


sage: f(x)=10*%x(-3)*xxxx2+0.8*xx-1.2*x10%x%x(-5) 

sage: solve(f(x)==0,x) 

[x == -1/50*sqrt (400000030) - 400, x == 1/50*sqrt (400000030) - <- 
400] 

sage: numerical_approx(-1/50*sqrt (400000030)) 

-400.000015000000 

sage: numerical_approx( 1/50*xsqrt (4000000330) - 400 ) 


>| 0.0000149999996779115 


tex/sage/sageSnip001.sage 
Donc Sage ne tombe pas dans le piège. A 


Comment résoudre ce problème ? Ou, autre façon de poser la question : comment Sage a fait 
pour résoudre le problème ? 
Utilisons les relations coefficients-racines : 


T1 + T2 — —b/a (34.33a) 

L1X2 — c/a (34.33b) 

La première lie les deux racines par des opérations de addition et soustractions, et donc n’est pas 
intéressantes. La seconde est bien. Si nous connaissons x, nous calculons 


C 


= —. 34.34 
dr (34.34) 
Quitte à redéfinir x: et x2, la solution bien calculée est : 
—b — 1/b?2 — 4 
= ro . (34.35) 
2a 
Exemple 34.22. 
Nous considérons : 
f(x) = cos(x + Ô) — cos(x). (34.36) 
Cela à une erreur de cancellation lorsque || & |x|. On élimine l’erreur de cancellation par 
| Ô 
f(æ) = —2sin(6/2) sin | x + le (34.37) 
ii Avertissement /question à la lectrice !! 34.23 
Pourquoi la condition pour avoir l’erreur est Ô & x et non simplement Ô & 1 ? 
A 


Exemple 34.24. 
Pour 


fx) = Vr +5 Vx. (34.38) 


H 
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On fait la coup du binôme conjugué : 


ô 
er rer) 


Plus d’erreur de cancellation, vu qu’au dénominateur nous avons une somme de deux positifs. A 


(34.39) 


Les erreurs de cancellation ne se résolvent pas en augmentant la précision des nombres donnés. 


Exemple 34.25 (Dans la vie réelle). 
La préparation de l’exemple 17.48 nous a porté à calculer la différence entre exp(x) et f30(x) où 
f30 est censée être une bonne approximation de l’exponentielle. Des erreurs de cancellation sont 
donc à craindre. 

Et en effet, le code suivant produit un résultat non déterministe : 


f=-1/1524441723805856930250752000000*xx"728 + — 
1/10888869450418352160768000000%xx727 + <— 
1/15511210043330985984000000*%x725 + <— 
1/310224200866619719680000*xx724 + 1/25852016738884976640000*x<— 
723 + 1/51090942171709440000*xx721 + 1/1216451004088320000*xx720— 
+ 1/121645100408832000*x"19 + 1/355687428096000%xx717 + <— 
1/10461394944000*%xx716 + 1/1307674368000*%xx715 + 1/6227020800*%xx-<— 
713 + 1/239500800*x°712 + 1/39916800*xx"11 + 1/362880*xx°9 + <— 
1/20160*%xx78 + 1/5040*%xx77 + 1/120xx75 + 1/12xx74 + 1/6*xx°3 + x — 
- cos(x) + 2 -exp(x) 

a=numerical_approx(10) 


:|print (f(a)) 


tex/sage/sageSnip016.sage 


Voir la question ici : 
https://ask.sagemath.org/question/37946/undeterministic-numerical-approximation/ 


A 
34.3.5 Calcul d’une dérivée 
Pour calculer la dérivée de f en a, il est loisible d'utiliser la formule 
D) — 
f'(a) = lim Fr ) JG) (34.40) 


Le numérateur est alors sujet à une erreur d'absorption dans le calcul de a+ h et ensuite une erreur 
de cancellation dans le calcul de la différence. 


En utilisant la formule 
a+h)— — h 
Al )— fa ) (34.41) 


f'(a) = lim 
nous pouvons espérer avoir une erreur de cancellation plus petite. 


34.3.6 Erreur d’absorption 


L’addition d’un nombre avec un nombre très différent peut faire perdre de l'information sur le 
plus petit. Par exemple avec 4 chiffres significatifs, 


0.5678 @ 0.0001237 = 0.5679 (34.42) 


où nous avons perdu presque toute l’information du petit nombre. 
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Une situation particulièrement ennuyeuse est celle où justement c’est le petit nombre qui nous 
intéresse parce que le grand est censé se simplifier : 


(0.0001327 @ 0.5678) © 0.5678 = 0.5679 © 0.5678 = 0.0001 (34.43) 


qui ne possède qu’un seul chiffre significatif correct alors que voyant le calcul, la réponse aurait pu 
être trouvée. 

Moralité : si certains manipulations algébrique peuvent faire apparaitre des simplifications 
avant de passer le calcul à la machine, il est bon de les effectuer. 


34.4 Conditionnement et stabilité 
DEFooYIFAooSJbMkC 


Définition 34.26. 
Soit F une fonction à valeurs réelles définie sur X x D où X et D sont des espaces vectoriels réels 
normés. Le problème de la recherche des solutions de 


F(x, d) = 0 (34.44) 


est dit stable autour de do € D si 


(1) la solution x = x(d) existe et est unique pour tout d; Probe cie 


(2) Pour tout n > 0, et pour tout do, ü existe un nombre K > 0 tel que |d — do] < n entraine 
Ix(d) — x(do)| < K Id — dol. 
La seconde condition est le fait que x soit Lipschitz® sur un voisinage de do. 
ExooXJONooTAYZVc 
Exemple 34.27 (Stabilité de la différence). 
Prenons le problème qui consiste à calculer la différence entre deux nombres : + = a — b. Cela se 


traduit par 
F:RxR'—-R 


34.45 
(z,(a,b)) x -a+b. 
Nous avons : 
[x(a, b) — x(a',b")] = |a —b— a! + (34.46a) 
<|a—a|+1b—b (34.46b) 
= |(a,b) — (a',0)|1 (34.46c) 


où nous avons utilisé la norme |.|; sur IR2. Par la proposition 11.44 sur les équivalences de normes, 
le nombre K = 42 fonctionne pour toute valeurs de 7. 
La problème de la différence est donc un problème stable. A 


Exemple 34.28 (Stabilité de la multiplication). 
Si a est fixé, le problème de calculer ab (b est la donnée) est stable. En effet ce problème est donné 
par la fonction F(x,b) = x — ab, dont la solution est x(b) = ab. Nous avons donc 


[x (b) x(b")] = |ab — ab'| = |al|b — b'|. (34.47) 
La constante de Lipschitz de ce problème est donc |a|. A 
Définition 34.29. 
Le nombre d d 
= EqDefA 
Kam(do = sup FOIX POS) 
d tel que |do—d|<n Id — dol D 


est appelé le conditionnement absolu du problème autour de do. 


3. Définition 12.327. 
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Soit F(x,d) = 0 un problème stable de conditionnement absolu Ky,(d,n). Le conditionnement 


relatif est défini par 
Id] D DÉREROoS Ro 


Iz(d)x 
Le problème est dit bien conditionné près de d si K,a(d,n) est petit. 


Kyel(d, n) — Kws(d, n) 


Exemple 34.30 (Mauvais conditionnement de la différence). 
Reprenons le problème de la différence, mais en fixant a. Nous avons donc x(b) = a — b et le 
conditionnement absolu est 

[x(b) — x(bo)| 


= ] 34.50 
sup (84.50) 


Le conditionnement relatif est : n 
Kye1(00, 7) = ———. 34.51 
set 0 n) la Æ b ( ) 
Et donc le problème est mal conditionné autour de a. 
Autrement dit, si a est un nombre proche de a, calculer la différence a — a’ est un problème 


mal conditionné. VAN 


Exemple 34.31 (Bon conditionnement de la multiplication). 
Pour le problème F(x,b) = x — ab nous avons 


lab — ab/| 


Kobs in Er] = |a|. (34.52) 

Et aussi n 
Ka = a— = 1. 34.53 
rel a lab| ( ) 
Le conditionnement relatif du problème de la multiplication est donc toujours 1. Il est donc toujours 
un problème bien conditionné. PA 


Ne pas confondre : 
Le conditionnement provient du problème lui-même. 


La stabilité provient de l'algorithme de résolution. 


Exemple 34.32 (Un problème mal conditionné). 
Le système 


2.17 + 3.5y = 8 (34.54) 
4.19% + 7.0y = 15 (34.54b) 


Solution : x = 100, y = —57.714285... (périodique) 

Perturbons : nous remplaçons 4.19 par 4.192. L'erreur relative est : 4.77 x 1074. 

Solution : z = 125, y — —72.714285..., avec donc erreur relative de 0.26. Autrement dit : 
l'erreur relative sur la solution est grande même avec une petite erreur relative sur la donnée. 

C’est un problème mal conditionné. 

Le fait est que c’est une intersection de deux droites presque parallèles. Donc effectivement une 
petite perturbation d’une des deux droites donne une grande perturbation du point d’intersection. 

Le fait est qu’un ordinateur effectue toujours une perturbation, au moins de l’ordre 10716 pour 
ne fut-ce que représenter les nombres. C'est-à-dire une perturbation sur les six nombres définissant 
le système. Il n’y a donc pas d’espoir d'obtenir un algorithme donnant une bonne réponse. A 


Un résultat pratique pour étudier le conditionnement d’un problè me est le suivant. 
CorConditionnementNormeNabla 


Corolaire 34.33. 
Soit x = x(d) un problème stable. Supposons D de dimension finie, supposons que U est ouvert 
dans D. Supposons encore x: U — R différentiable en do. Alors quand n est petit, on a 


Kws(do) + |Vz(do)|. (34.55) 
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LemITCxqys 
Lemme 34.34. 
Tout problème de la forme x = x(d) avec de R et x € C!(R) est stable. 


Démonstration. I1 faut démontrer qu’une fonction C! sur R vérifie automatiquement la condi- 
tion (2) de la définition de la stabilité. Pour cela, remarquons qu’une fonction C! possède une 
dérivée continue, et donc bornée sur tout compact * 

Prenons n > 0 et do € R et puis un d tel que |d— do] < n. Par le théorème des bornes atteintes, 
la fonction x’ est bornée sur l'intervalle [do — n, do + n]. Appelons X un majorant de +” sur cet 
intervalle. La fonction 


æ(d) = x(do) + K|d — dol (34.56) 
majore æ(d), et donc on a 
[x(d) — x(do)| < K|d — do|. (34.57) 
Attention : vérifier si ce raisonnement est correct avec do > d, et adapter au besoin. 
ExRZrOeoi 
Exemple 34.35. 
Un exemple de problème stable de la forme x = x(d) avec de R et x € C°(R)\C!(R). 
La fonction 
0 sid2>0 
afd=d" © (34.58) 
æ sid<0 


est continue, mais pas C1 (non dérivable en x = 0). La dérivée est partout bornée par 1, et donc 
le problème est stable. 

Un autre exemple très classique serait de prendre x(d) = |d|. Dans ce cas, on peut prendre 
n'importe que n et À = 1. Le calcul est que 


Ix(d) — x(do)| < K|d — dol (34.59a) 

I — do|| < |d — do]. (34.59b) 

Cette dernière inéquation est correcte, comme on peut le voir en mettant au carré les deux membres. 
A 

PIluknk 


Exemple 34.36. 
Un exemple de problème instable de la forme x = x(d) avec de R et x e C°(R). 

Un exemple assez classique de fonction dont la dérivée n’est pas bornée sans pour autant que 
la fonction aie un comportement immoral® est x > 4/x. Afin d’avoir une fonction définie sur R 
tout entier, nous regardons la fonction 


x(d) = Id]. (34.60) 


Si nous considérons maintenant do = 0 et n’importe quel 7, nous avons 


l&(d) — x(do)| _ Vd _ 1 
EPA D (34.61) 


Il n’est pas possible de trouver un À qui majore ce rapport. Le problème est donc mal conditionné. 


Attention : dans ce calcul nous avons supposé d > 0. Pensez à adapter au cas d < 0. PA 


Exemple 34.37 (Problème bien conditionné avec algorithme instable). 
Soit à calculer 


1 rl 
PL Î de dt (34.62) 
0 


4. Un compact est un ensemble fermé et borné, typiquement un intervalle du type [a, b]. 
5. Penser à x + æxsin(1/x). 
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avec n > 0. Par partie, nous obtenons : 
nn =1-nl,-1. (34.63) 


D'autre part, 10 = +, TI = 1. Puis par récurrence, c’est tout en main. 

Du côté de l’ordinateur, nous lui donnons forcément une approximation de 1;, parce que nous 
lui donnons une approximation de e. Soit l'erreur €; sur 11. 

Sans démonstration : 


Lemme 34.38. 
Nous avons limy-_0 1n = 0. 


Mais numériquement, il n’est pas possible de rester longtemps sous €; parce que nous n’espérons 
pas avoir une erreur plus petite que ça. Donc à partir du moment où 1, < €1, les valeurs sont toutes 
complètement fausses. Cela est le mieux que l’on puisse espérer. Mais la réalité est pire. 

En réalité, en lançant le calcul sur un ordinateur, les valeurs sont même croissantes avec n à 
partir d’un certain moment. 

On peut étudier l’erreur et montrer que l’erreur est donnée par : 


En = (—1)" Inles. (34.64) 


Mais comme la factorielle est tellement forte que c’est sans espoir d’aller loin en essayant très fort 
de donner une petite erreur sur €1. 


A 
Il existe heureusement un algorithme stable pour cette intégrale. La formule est : 
1 = (1 =) (34.65) 
Si nous savons un /N avec N grand, cette formule donne les J; avec i = N,N —1,...,2. Posons 


donc {In = a€ R n'importe comment. Donc en est grand. Mais il se trouve que l'erreur sur € est 
donnée par 


CS —1 
DT 0: (34.66) 
Donc même en prenant vraiment n’importe quoi pour 1, nous obtenons de bonnes approximations 
pour 1; avec les petits à Même avec 120 = 1000 (qui est complètement faux), nous trouvons 


énormément de chiffres significatifs corrects pour Ji. 


34.4.1 Comment choisir et penser le K ? 


La formule (34.48) contient une formule qui ressemble étrangement à la dérivée. La stabilité 
d’un problème est très liée à la dérivée de F. La stabilité et la dérivée ne sont pas les mêmes choses, 
mais il n’est pas mauvais de penser au K de la stabilité comme la dérivée. Ou plus précisément : 
le supremum de la dérivée. 

Un fil conducteur du lemme 34.34 et des exemples 34.35, 34.36 est que l’on a un X qui fonctionne 
lorsque la dérivée est bornée sur l'intervalle ]do — n, do + n[. Dans le cas où ce supremum existe, le 
prendre en guise de K fonctionne souvent. 

Il faut cependant parfois faire acte d'imagination. La fonction x + [x] n’est pas dérivable en 
0. Il n'empêche que K = 1 fait fonctionner la définition de la stabilité. Remarquez que K = 1 est 
le supremum de la dérivée là où elle existe. 

À partir du moment où c’est clair que le Æ est le supremum de la dérivée, on comprend pourquoi 
c’est le gradient qui arrive dans le corolaire 34.33. En effet, le gradient indique la direction de plus 
grande pente. C’est donc bien dans cette direction qu’il faut chercher la « plus grande dérivée ». 


Proposition 34.39. 
Pour le problème stable x = x(d) avec x € C'(R",R), on a 


Kas(d) + |dxal (34.67) 


où dx4 désigne la différentielle de x en d et la norme est la norme opérateur. 
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34.5 Un peu de points fixes 
SECooWUVTooMhmvalW 
34.5.1 Choix de la fonction à point fixe 


Pour l'équation f(x) = 0, il existe une infinité de fonctions g pour lesquelles l’équation est 
équivalente à x = g(x). 
Exemple : f(x) = x? — 2 — In(x), nous pouvons faire 


(1) z=x?-2-—In(x) +7 
(2) Poser x? = 2 + In(x) et donc 


x = —1/2 +In(x) (34.68a) 
x = 1/2+In(x). (34.68b) 


(3) Ou encore 


re ha) (34.69) 
x 
où nous savons déjà que x £ 0 parce que x = 0 n’est pas dans le domaine de f. 
(4) Ou par l’exponentielle : 
"1 de. (34.70) 


Dans tous ces cas nous pouvons construire une suite (x,) en posant un nombre arbitraire pour +0 
et ensuite la récurrence 


ait = a (34.71) 


Graphiquement, la solution de l’équation est l'intersection entre les courbes y = x et y = g(x). 
Un petit dessin pour montrer la convergence : 


À 


1 
! 
! 
1 
! 
© 
T2 


Attention : cette méthode ne converge pas toujours. Parfois elle converge de façon monotone, 
et parfois pas. Le choix de la fonction g qui fait x = g(x) peut énormément changer la vitesse de 
convergence. 


Théorème 34.40 (Condition suffisante pour existence d’un point fixe). 
Une fonction continue f: [a,b] — [a,b] admet au moins un point fixe dans [a, b]. 


Théorème 34.41 (Condition suffisante pour l’unicité). 
Soit f continue sur [a,b] avec g(x) € [a,b] pour tout x € [a,b]. Supposons qu'il existe 0 < k <1 
tel que pour tout x € [a,b] nous ayons |g'(x)| < k alors 


(1) La fonction g possède un unique point fixe dans [a, b]. 
(2) Pour tout xo € [ab], tous les termes de la suite tn+1 = g(xn) sont dans [a,b|]. 


(3) Ladite suite (xn) converge vers le point fire. 
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Théorème 34.42. 
Soit f continue sur [a, b] avec g(x) € [a,b] pour tout x E [a,b]. Supposons 


(1) qu'il existe O < k < 1 tel que pour tout x € [a,b] nous ayons |g'(x)| < k et 
(2) g est p fois dérivable sur [a, b]. 
(3) ga) = g'(a) =... = gP- (a) et gP) (a) Z 0 où à est l’unique point fixe. 
Alors la suite (xh) converge avec un ordre p. 
Exemple 34.43. 


Nous reprenons 
f(x) = x? -2-—In(x). (34.72) 


Et nous voulons résoudre f(x) = 0. Graphiquement c’est l’intersection entre y = x?—2 et y = In(x). 
Il est vite tracé de savoir qu'il y a deux solutions : a € [0,1] et a € [V2,2]. 

Déjà un petit problème : l'intervalle [0,1] ne va pas parce que f n’y est pas continue. Un petit 
raffinement d'analyse nous fournit a € [e-?,1|]. 

Nous avons au moins les fonctions de points fixes suivantes : 


g1(x) = 2 +In(x) (34.73a) 
ga(x) = de n. (34.73b) 
Pour la première, il y avait un + qui a été négligé parce que nous savons que les deux solutions 
cherchées sont positives. Travaillons avec la première. D’abord 
1 


gi () = 2%4/2 = In(x) 


Nous avons lim,_,.-2gi(x) = +00. Il ne sera donc pas possible de trouver 0 < k < 1 tel que 
|g'(x)| < k. Tentons quand même la méthode : 


(34.74) 


di = 05 (34.75) 


Il se fait que cela est plus proche de «1 que de a2. Mais en réalité la suite converge vers @. 
Passons à la seconde méthode. 
2 
dE) =2re ?, (34.76) 


Sur l’intervalle [e-?,1], g, est croissante et prend toutes ses valeurs dans [e-?,1]. Nous pouvons 
prouver que 


lan et (34.77) 


Donc poser 4 — 2e-l fait fonctionner la proposition. Donc quel que soit le xo pris dans cet 
intervalle, nous aurons une suite convergente vers un point fixe à l’intérieur de l’intervalle. C’est- 
à-dire convergente vers æ1. 

Cela est un exemple de problème pour lequel changer de fonction g change réellement la vie. A 


34.5.2 Convergence quadratique 
DEFooSUTRooAcXX;j 


Définition 34.44. 
Une suite (x,) a une convergence quadratique vers & si elle converge vers à et si il existe un C 


tel que pour tout n nous ayons EQooMWBILoo 
00 
fra — af < Ces — aff. GES 


Il est bien entendu possible de parler de convergence quadratique si la relation (34.78) a lieu 
seulement à partir d’un certain indice. 

Le lemme suivant donne l’importance du choix de point de départ lorsqu'on utilise une méthode 
itérative dont la convergence est quadratique. 
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LEMooLQMAooïCcmrn 
Lemme 34.45. 
Soit une suite xn — à de convergence quadratique. Si |x0 — a| < r alors 


ln — a < (Cr Fo RLoo PIS 


Démonstration. Nous pourrions directement prouver la formule (34.79) par récurrence, mais nous 
allons la reconstruire un peu. Nous cherchons 


ben a < CH nes 2C2V ogg 
Nous avons les inégalités 
ltn+1 — a < Cxn — af” (3481a) 
LOC (34.81b) 
= G2A(n)+1,27T7 (34.81c) 


d’où nous voyons que la fonction k doit vérifier 
{ k(D} = 0 (34.82a) 
k(n +1) = 2k(n) +1 (34.82b) 


La première équation est l’hypothèse |10 — a| < r comparée à la formule (34.80). Il est vite vérifié 
que k(n) = 2" — 1. D'où le résultat. 


Si le point de départ est choisi de façon à avoir Cr < 1 alors nous avons là un très bon majorant 
parce qu’il s’agit d’un majorant convergeant très rapidement vers zéro. Si au contraire Cr > 1 alors 
ce majorant ne sert à rien. 


34.46. 

Le fait d’avoir une convergence quadratique signifie que le nombre décimales correctes double 
(environ) à chaque itération, dans n’importe quelle base. En effet supposons que x, ait k décimales 
correctes ; cela signifie que |x» — a| + 10F. Donc 


ln — al & M107À. (34.83) 


Cela est le double de décimales correctes de |x, — a|, moins l’ordre de grandeur de M. 
Pour la méthode de bisection, le nombre de décimales augmente de 1 à chaque itération, mais 
seulement en base 2. En base 10, de façon générique © il faut entre 3 et 4 itérations pour avoir une 


décimale de plus. 
NTooVXLXooX1AGEq 


34.47 (Condition d’arrêt[722]). 
D'autre part, lorsqu'une méthode a une convergence quadratique, nous avons un test d’arrêt. Pour 
ce voir, nous avons la limite 


in net al < Jim 7 TT = 0. (34.84) 


Cette limite est alors également valable sans les valeurs absolues et si nous soustrayons x, — « au 
numérateur, la limite devient —1 : 


= de en (34.85) 
Ou encore 
— x 
je Re, (34.86) 


NO Ln — À 


Cela a pour conséquence que si n est grand, 


6. C'est-à-dire sauf coup de malchance ou coup de chance. 
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(1) æn+1 a le même ordre de grandeur que %, — a. 
(2) Zn — Tn+1 et n — à ont le même signe. 


Donc si nous voulons une approximation de & avec une erreur €, il suffit d’arrêter le calcul lorsque 
Tn+1 — Tnl < €. Et ce faisant nous savons de plus si l’approximation est par excès ou par défaut. 


34.5.3 Convergence 
PROPooRPHKooLnPCVJ 


Proposition 34.48 (Convergence d’une méthode de point fixe[722]). 
Soit g: R — R de classe C! et à un point fire attractif" de g. Soit k tel que |g'(a)| < k < 1 et ô 
tel que |g'|g(a,s) < k- 


Alors ITEMooUQKMooTRSvUo 
(1) La fonction g est k-contractante® sur B(a, 6). ITEMooFTAQooPBsBcR 
(2) Nous avons g(B(a,6)) € B(a,6). ITEMooFS0AooK1cxih 
(3) Pour tout xo € B(a,ô) la suite tn+1 = g(tn) converge vers a et 

[tn — al < [to — ak”. (34.87) 
Si de plus g (a) = 0 et g est de classe C? alors nous avons convergence quadratique (défini- 


tion 34.44). 


Démonstration. Vu que a est un point fixe attractif de g nous pouvons considérer un k tel que 
[g'(a)| < k < 1. Et comme g est de classe C!, la fonction g/ est continue et donc bornée sur toute 
boule du type B(a, 6). Soit 6 le plus grand nombre tel que < k. Nous notons 7 = B(a,û) 


3e 
pour cette valeur de 6. 


_ FA ; . UBE YXLHooSCnnRA 
Pour tout x € I nous avons, en utilisant le théorème des accroissements finis 12.195(2) : P Fee Si 


[g(æ) — al = |g(x) — g(a)| (34.88a) 
< sup |g'(t)[Ix — al (34.88b) 
< k|x — à (34.88c) 
<5 (34.88d) 


parce que k < 1 et [x — a] < 0. Par conséquent g(x) € B(a,6). Cela prouve le point (2). Pour le 
point (1), soient x,y € B(a,6) et 


|g(x) — g(y)l < p 1g'(a)llx — yl < klx — y|. (34.89) 
ae 


Pour le point (3) nous avons |g(xn) — al < k|æn — a|, c’est-à-dire 
n+1 — al < klxy — al. (34.90) 


Le résultat annoncé s'obtient par récurrence sur n. 
En ce qui concerne la convergence quadratique, c’est du Taylor (proposition 12.465). Dévelop- 
pons g(x,) autour de g(a) : 


1 2 


g(&n) = g(a) + g'(a)(œn — à) + (an — a)'e(an — à) (34.91) 
avec limy,oe(t) = 0. En posant C = +sup,.;fe(t)| nous avons |g{xn) — g(a)| < Clrn — af, 
c’est-à-dire 

ésr=al< Gear (34.92) 


7. Définition 17.32. 
8. Définition 17.36 
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Ce corolaire est une paraphrase de la proposition 34.48. Il en retient seulement les points 


intéressants en pratique. 
CORooHKZCooEXRzcW 


Corolaire 34.49. 
Soit à une solution de l’équation x = g(x), avec g continue sur un voisinage de à et dérivable dans 
l’intérieur. Nous supposons que 

|g'(a)| < 1. (34.93) 


Alors il existe un rayon Ô tel que si x0 € B(a,ô), la suite (x,) converge vers à. 


Certes cette proposition demande moins d’hypothèses, mais en réalité, il ne donne pas de vrais 
moyens de choisir un point de départ xo. Avec les deux théorèmes précédents, nous pouvions 
prendre 0 n'importe où dans [a,b]. Le fait est que pour choisir æ9 nous pouvons tracer et donner 
à la main un x) proche de ce qui semble être @&. Si ça ne converge pas, il faut donner un x0 plus 
proche. La proposition nous assure que si nous jouons bien à choisir x) très proche, la suite finira 
par converger. 

Notons que le corolaire 34.49 à encore l'inconvénient de demander de calculer g/'(«) alors que 
est inconnu. La résolution de l’inéquation |g'(x)| < 1 nous donne un certain nombre d’intervalles 
dans R. 

Soient /, les intervalles solutions de l’inéquation. Si & € 1, alors la méthode converge. Sinon, 
c'est pas garanti. En tout cas nous ne devons pas savoir réellement « pour appliquer le théorème. 
Il suffit de savoir que « est dans un des 1,. 


34.6 Méthode de Newton 


SECooIKXNooACLIljs 

L'objectif de la méthode de Newton est d'évaluer une racine a de l’équation f(x) = 0 lorsque 
nous avons déjà une approximation x9 de la racine a. 

C’est la méthode de Newton qui est à l’origine de la suite de la proposition 1.397 donnant une 


suite dans À qui converge vers 4 À. 
DEFooXS0QooAnWqKM 


Définition 34.50. 
Le nombre a est une racine simple de l'équation f(x) = 0 si f(a) = 0 et f'(a) Æ 0. Le nombre 
a est une racine multiple d'ordre r de f(x) = 0 si 


fo)= Pos 0 (34.94) 
et fi) (a) £ 0. 
Exemple 34.51. 
La fonction x + x? admet une racine d'ordre 3 en x = 0. VAN 


34.6.1 « Justification » par la formule de Taylor 


Soit une fonction f continue et dérivable sur [a,b]. Soit à une racine de f et x, une de ses 
approximations. Nous notons l'erreur 4 et nous avons à = x, +0. Du coup nous avons f(x» +0) = 
f (a) =}; 

Ecrivons la série de Taylor du théorème 12.455 autour de x, : il existe une fonction €: R — R 
telle que lims_,0 e(t) = 0 telle que 


Fa) = F{arm + 0) = f{n) + 8f' (in) + Pe(8). Fr ETES 
Nous isolons le 0 du terme d’ordre 1 en nous souvenant que le membre de gauche est nul : 


f(tn) — @?e(0) 


M J'(an) 


(34.96) 
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Vu que & = Zn + 0, nous pouvons écrire 


f(xn) + @2e(0) 


a =x 34.97 
Il est donc raisonnable de poser 
Tnt1 = Tn — fn) (34.98) 
en espérant que cela soit une meilleure approximation de «& que zh. 
En tout cas l’erreur sur æh11 est 
@2e(0 @2e(0 
Q — Lni1 = Ln + 0 — En + fn) + ee) | 0 + LE A At (34.99) 


J'(&n) f'(œn) | 


qui ne doit pas être fondamentalement plus grand que 0 dès que Ÿ est petit, surtout que si x, est 
une approximation de «, nous pouvons espérer que f(x,) soit également petit. Là où les choses 
peuvent déraper en grand, c’est si f’(x,) est petit. 

Cette méthode de Newton ne converge pas toujours. Le pire est lorsque par malheur il y a une 
bosse pas loin de la racine. Alors il y a un risque de tomber sur f'(x,41) = 0 ou en tout cas très 
proche de zéro. Dans ce cas le point x,:2 est envoyé très loin. 


34.6.2 « Justification » par points fixes 
SUBSECooTBLNooTujs10 


Nous savons que pour résoudre f(x) = 0 par une méthode de point fixe, il y a de nombreux 
choix possibles de fonctions g telles que g(x) = x donne la même solution que f(x) = 0. Soit « 
une solution de f(x) = 0 et cherchons une fonction g de la forme 


g(x) = x — kf(x). ÉnooYVF Ton ES, 


Nous savons par la proposition 34.48 que la fonction g donne une convergence quadratique lorsque 
g'(@) = 0. Pour la forme (34.100) nous avons g'(a) = 1— kf'(a), ce qui nous donne l’idée de poser 
1 

k= y 
Le fait est que f’(a) n’est pas connu, mais nous pouvons l’approximer par f’(x) lorsque x est 
proche de a. D'où l’idée de considérer la fonction 


gx) =x- na (34.101) 
et donc la suite 741 = g(xn) c’est-à-dire 
mie pe. (34.102) 


Dès que x, est proche de à, sous l’hypothèse (raisonnable par continuité) que f’(x,) soit proche 
de f’(a), la méthode devrait donner une convergence quadratique. 


Remarque 34.52. 
Cette justification par points fixes n’est pas vraiment différente de celle par Taylor parce que Taylor 
est utilisé dans la preuve de la proposition 34.48. 


Définition 34.53 (Méthode de Newton). 
La méthode de Newton pour la fonction f est la suite définie par récurrence 


: f(tn) 
J'(æn) 


Cette définition ne précise pas la valeur de xo, ni de condition d’arrêt. 


| (34.103) 


Tn+1 — Ln 
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34.6.3 Convergence de la méthode de Newton 
THOooDOVSooWsAFkx 


Théorème 34.54 (Convergence quadratique de la méthode de Newton[722]). 
Soit f une fonction continue vérifiant f(a) = 0 et f'(a) Æ 0. Nous considérons la fonction 


Ï(x) 
g(x) = x — (34.104) 
J'(x) 
que nous supposons être de classe C?. 
Si C'est une majoration de |g”| sur un intervalle contenant à, alors en posant Ô = 1/C' nous 
avons ITEMooVXSKooWCVWQc 


(1) La boule B(a,ô) est préservée par g : g(B(a,6)) c B(a.,6). ITEMooZPSXooGgbfhG 


(2) Pour tout x0 € B(a,ô) nous avons convergence quadratique vers à de la suite définie par 
Tn+1 = (tn). ITEMooZCXZooCjeWP1 
(3) Nous avons l'estimation 


1 n E FAIP 
[En — àl < a (Clro al)” S EPPIUE 
où C est la constante de la définition de convergence quadratique. 


Démonstration. Nous commençons par calculer la dérivée de g : 


? F(x)f"(x) 
— 34.106 
(= ET (34.106) 
d’où nous déduisons que g' (a) = 0. Ensuite nous utilisons abondamment la formule des accroisse- 
ments finis (théorème 12.325) en commençant par 
EQooZITH 
ROZ TROT 


|g(#) — g(a)l < 191 


où par |f|4 nous entendons la norme uniforme de f sur À, c’est-à-dire | f|4 = sup,e4 | f(æ)|. 
Note : nous écrivons [t, a], mais ça pourrait être [at]. 
Sixe {t,a] alors 


19’ (x) = 1g/ (x) — g'(a)| (34.108a) 
< ||9”tz,ol — 01 (34.108b) 
< |9" alé — al (34.108c) 
< ||9”téalé — al. (34.108d) 


En particulier, ||g/| Hat — al, et nous pouvons continuer les majorations (34.107) : 


[te] < 19° 


g(&) — g(a)l < 19” raté — af. (34.109) 


La fonction g étant de classe C?, la dérivée seconde g/ est bornée (nous supposons déjà travailler 
sur un compact contenant a). Soit C une borne. Nous sommes en mesure de prouver le point (1) 
avec 0 = 1/C. En effet si t € B(a,1/C) alors 


1 1 
Ig(£) — al = lg) —g(al<Ct-af<0e =; (34.110) 
ce qui prouve que g(t) € B(a,1/C). 
Le point (2) se prouve de la même manière : si x, € B(a,1/C) alors 


fen+1 — al = |g(tn) — g(a)l < Clen — af, (34.111) 


ce qui est bien la convergence quadratique. 

La majoration du point (3) s'obtient par récurrence sur n. Pour n = 0, la relation (34.105) 
devient |x0 — a| < |xo — a] qui est vraie. Ensuite par la convergence quadratique et la récurrence, 
— À 
EE: 


on+1 


1 n 
ent — ol < Cl — a < [A (Clxo — al? = =2[CIro- aff (34.112) 
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34.55. 
Dans les cas pratiques, nous commençons souvent par résoudre l’équation f(x) = 0 par dichotomie. 
Au moment où nous sommes assez proche de la solution nous commençons Newton. 

La raison est que la dichotomie fonctionne toujours : nous allons toujours nous approcher de 
la solution. Si par contre le point de départ est mal choisi, la méthode de Newton peut envoyer 
n'importe où, y compris très loin de la solution. 


La proposition suivante nous indique que dans le cas d’une fonction convexe, le choix de point 
de départ de la méthode de Newton n’est pas tellement crucial parce qu'ils sont tous bons. De plus 
la convergence se faisant de façon décroissante (si on part de la droite), nous savons que le résultat 


sera une approximation par excès de @. 
PROPooVTSAooAtSLel 


Proposition 34.56 (Newton dans le cas convexe). 
Soit f de classe C? et une racine a telle que f'(a) > 0. Soit b > a tel que f soit convexe sur [a, b]. 
Alors pour tout xo € [a, b] la suite de la méthode de Newton est 


(1) décroissante 
(2) reste dans [ab] 


(3) converge vers à. 


Démonstration. Nous savons par la proposition 17.86(2) que la fonction f”’ est croissante, et par 
hypothèse f’(a) > 0, donc sur [a,b] nous avons f” > 0. Par conséquent, nous avons aussi f > 0 
sur [a, b]. 

Le graphe de f est au dessus de la tangente de f en x = x, (proposition 17.92). Si nous 
nommons {; la fonction qui donne la tangente en x nous avons f,,(a) < 0 parce que f(a) = 0. 
Par conséquent 

ta, (æ) = 0 (34.113) 


pour à < x < æn. Cela prouve que +41 € [a.,b], et que (x,) est une suite décroissante 
Étant donné que (x,) est une suite décroissante dans le compact [a,b|, elle est convergente. 
Notons £ sa limite. Nous avons la relation de récurrence 


f(&n) 


_ — ; 34.114 
A) CA 
En passant à la limite n — © nous avons l’équation 
J(8) 
B=B- (34.115) 
f'(8) 
Vu que f(x) > 0 sur ]a,b] nous avons automatiquement B = a. 
34.6.4 Racine carrée par la méthode de Newton 
Nous avons vu dans la proposition 1.397 une suite dont la limite était VA. 
EXooDLSVooMHPpcl 


Exemple 34.57. 

Utilisation de la méthode de Newton pour calculer VA. La première idée serait d'appliquer le 

théorème 34.54 à la fonction f(x) = x — VA. Je vous laisse voir pourquoi ça ne marche pas. 
Nous faisons f(x) = x? — A. Le calcul donne : 


= = + = (34.116) 


Cela explique la formule (1.561). A 
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34.6.5 Formalisation de l’algorithme 


La méthode de Newton consiste a exprimer la solution x de f(x) = 0 avec f € C'{(IR) comme 
limite d’une suite {æn}nen définie par récurrence par la formule 


Î(Xn) 


Tn+1 — Ln — f(x ù 
n 


(34.117) 


où to est arbitraire. 
Si on veut exprimer cela en termes d’algorithmes, nous disons que l’algorithme de Newton est 
donné par la suite de problèmes 


A EaFPourNeyt qqn 


La donnée du problème est la fonction f, et rien que elle. 
Plus précisément, une fois que la fonction f est donnée, il existe une infinité de problèmes : 
pour chaque a € R nous avons le problème 


_,,, J@ 
Galëns f) +70 


La méthode de Newton consiste à sélectionner une partie de ces problèmes de la façon suivante : 


(34.119) 


PF) = Goo (34.120a) 
Fi = Go. (34.120b) 
Le problème F5 fournit un nombre x, qui nous permet de sélectionner le problème G;, qui va 
fournir le nombre x2, etc. 


Au moment de calculer le conditionnement de F}, nous ne devons pas voir æ,-_1 comme fonction 
de xo et de la donnée f. Il ne faut donc pas dériver à travers les æ,. 


Proposition 34.58. 
Si une racine est multiple, alors l’ordre de convergence de la méthode de Newton est 1. 


Voici un algorithme possible : 


def Newton(f,x0,toll ,maxit): 

fp=f.derivative() 

n=0 

x=x0 

diff=-toll+1 

while abs(diff)>toll and n<maxit: 
n=n+i 
diff=-f(x)/fp(x) 
x=xt+diff 


return x,,n 


tex/frido/codeSnip_2.py 


Commentaires : 


(1) Notons que dans un langage vraiment numérique comme Matlab, il faut passer f’ en argu- 
ment. 


(2) Dans le while il faudrait mettre x,}1—x, (en valeur absolue), mais cette différence est aussi 
utilisée pour calculer z,:1 donc on la calcule une seule fois. 


(3) I faudrait faire une vérification sur f(x,) # 0. Il n’y a pas tellement de choix que de changer 
le point initial. 
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34.6.6 Caractéristiques 


L’algorithme de Newton a les caractéristiques suivantes : 
(1) Pour résoudre le problème numéro n, il faut avoir résolu le problème numéro n — 1. 


(2) Aucune des solutions z, aux problèmes intermédiaires n’est une solution au problème de 
départ (à moins d’un coup de chance). 


(3) Étant donné que la donnée du problème F, est la fonction f de départ, nous avons dm = 


dn = d pour tout m et n. 
THOooMACHooLofCVu 


Théorème 34.59. 

Soit f continue sur un voisinage de «, racine simple. Alors il existe un voisinage de à de rayon 
o tel que pour tout xo dans ce voisinage, la méthode converge vers & avec ordre de convergence 
p = 2. 


Donc dès qu’on a continuité autour de la solution recherchée, il suffit de prendre x0 assez proche 
pour que tout se passe bien. Cela se fait par localisation des racines, par exemples en traçant la 
fonction avec un bon niveau de zoom. Le fait est qu’on cherche disons 3 décimales à la main (travail 
sur ordinateur et graphique) et Newton donne les 20 décimales suivantes à la vitesse de la lumière. 


34.6.7 Exemple de la racine carrée 


Nous allons nous lancer dans un exemple : le cas de la racine carrée. Soit à calculer une 
approximation numérique de 42. Il s’agit d’une racine de la fonction f(x) = x? + 2. La fonction 
de la méthode de Newton associée est : 

fG@) __æ°-2 


gt) =% F@ a. (34.121) 


Cherchons un intervalle autour de 42 sur lequel nous avons convergence de la méthode de Newton. 
Cela s’obtient grace à la proposition 34.48 qui nous informe qu'il suffit de trouver un intervalle 
autour de 42 sur lequel |g'(x)| < 1. 

Nous avons 


2 
ÿ 4 —2 
JG) = (34.122) 
et nous cherchons à résoudre |g/(x)| < 1. D'abord g/(x) = 1 n’a aucune solutions alors que g/(V2) = 
0. Donc nous avons g/(x) < 1 pour tout x € R*. Par contre l’équation g/(x) = —1 à des solutions : 


x =+4/2/a. 


Nous avons donc convergence de la méthode de Newton pour x0 dans un intervalle de la forme 


[V2/3, V2 + ..] (34.123) 


où les les trois points représentent l'expression qu’il faut pour que ce soit symétrique autour de 42. 

La valeur précise n’a pas tellement d'importance parce, vu que nous sommes en train de chercher 

12, il est peu probable que nous ayons déjà en main une bonne approximation de nombres du type 
CHE 


Proposition 34.60. 
La méthode de Newton pour la fonction f(x) = x? —2 converge vers V2 pour toute valeur de départ 
dans ]0, +ool. 


Démonstration. La fonction f(x) = x? — 2 est convexe et f/(V2) = 2V2 > 0. Donc la méthode 
converge vers 42 pour tout 0 > V2 par la proposition 34.56. 
Si par contre +0 € 0, V2[ nous avons 


r8 +2 
270 ‘ 


T1 = (34.124) 
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En posant (x) = (x? +2)/2x et en résolvant h/(x) = 0 nous trouvons x = 2. Et là, h(V2) = V2. 
Donc h(x) est toujours plus grand que V2 pour tout x € ]0, V2|. 
En d’autres termes, si xo € ]0, V2] alors 1 > 42 et nous retombons dans le premier cas. 


34.6.8 Si multiplicité 


Supposons que a soit de multiplicité r (définition 34.50). 

Cela se remarque en voyant que la méthode de Newton demande plutôt 20 itérations que 5. 
Le problème que cela pose est que chaque itération, les évaluations provoquent des erreurs. Donc 
moins d’itérations, c’est mieux. 

Nous pouvons modifier la formule avec 


f(Xn) 


Tn+1 — Ln Fan) - 


(34.125) 


Il est possible de prouver que cette suite est à nouveau à convergence quadratique. 

Ou alors on pose F(x) = fl"-1)(x) et à est une racine simple pour F. Donc faire Newton pour 
F est à nouveau quadratique, tout en donnant la même solution parce que F(a) = 0 et F’(a) # 0. 

La seconde façon est bien parce que le théorème de localisation fonctionne 34.59 

Et si r n’est pas connu ? 

Il est toujours possible de faire r = 2 puis r = 3 et caetera jusqu’au moment où l’on remarque 
que le nombre d’itérations baisse un grand coup. 

Mais ça demande beaucoup de calculs. Le mieux est de changer de méthode. 


34.6.9 Et la dérivée ? 


Un des problèmes de la méthode de Newton est que l’on doit pouvoir calculer la dérivée. 
Typiquement, il faut savoir f de façon analytique. Si cela n’est pas possible, nous pouvons changer 
de méthode et utiliser la méthode des sécantes décrite en 34.9. 


34.6.10 Méthode de Newton : le cas général 
LemXdObnV 


Lemme 34.61. 
Soient À et B deux matrices inversibles telles que la matrice (A + éB) soit inversible pour tout € 
assez petit. Alors il existe une matrice X(e) telle que 


(A+eB) l=(A t+ex) (34.126) 
et telle que lime_o X(e) = —A BA. 
Démonstration. Le candidat matrice X est relativement simple à trouver en écrivant 
(A+eB)(A lt +eX) = 1+eAX +eBAT! + 2BX. (34.127) 
En imposant que cela soit 1, nous trouvons 
X()=-(A+eB) BA. (34.128) 
La matrice X(e) étant un inverse à droite de (A + eB), son déterminant est non nul et X est 


inversible. Par conséquent elle est également inversible au sens usuel. Le calcul de la limite est 
direct : 


lim —(A+eB) IBA 1 = A 1BA (34.129) 


E— 


parce que l'inverse est une fonction continue sur GL(n, R). 
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Remarque 34.62. 
Un calcul naïf nous permet de trouver le même résultat de façon plus heuristique. En effet un 
développement usuel (dans R) est 


1 1  €b 
2 


—= ne 34.130 
a+eb a a de ( 


Si nous récrivons cela avec des matrices, nous écrivons (attention : passage heuristique !) : 


(A+eB) ! = A 1-EeA BA +... (34.131) 


Notons le choix de généraliser b/a? par a-!ba-!. Dans les réels les deux écritures sont équivalentes, 
mais pas dans les matrices. 
Étudions si A1 — eA-1BA-T est bien un inverse à €? près de (A + eB) : 


(A+eB)(A l+eA IBA 1) = 1-eBA l+eBA !_2BA BA !-1-<BA BA. (34132) 


Par conséquent, à des termes en €? près la matrice A7!—eA-1BA-l est bien un inverse de A+eB. 
ThoHGpGwXk 


Théorème 34.63 (Méthode de Newton[723]). 
Soit f: R" — R" une application de classe C? et un point a e R" tel que f(a) = 0. Nous supposons 
que df, est inversible. 

Alors il existe un voisinage V de a tel que pour tout xo € V la suite définie par récurrence 


Tn+1 — Ln — (dfa) (f(xn)) (34.133) 
converge vers a. De plus la vitesse est quadratique au sens où il existe C > 1 tel que 


lan — af < CT? AS 


Démonstration. Étant donné que df, est inversible et que df est continue, l'application df, est 
continue ® pour tout + dans un voisinage de a. Nous prenons r > 0 tel que df, est inversible pour 
tout x € B(a,r). 
Nous considérons la fonction 
F:B(a,r) — R" 
vo x (dfs) (f(x). 


Cela est une application C1. La clef est de montrer que l’application de F à un point a+h rapproche 
de a pourvu que À soit assez petit. Nous avons la formule suivante : 


F(a+h)— Fa) =h— (dfan) (fa + h)). F1) 


(34.135) 


Nous allons maintenant utiliser un développement de Taylor par rapport à h en suivant la formule 
(12.1314). Nous avons 
f(a+h) = f(a) + dfa(h) + IR]ŸE(R) (34.137) 


où €: R°? — Rest une fonction qui tend vers une constante lorsque À — 0. Nous avons aussi 
dfarh = dfa + |hlT(h) (34.138) 


où 7: R° — Mi(n,R) est une application qui tend vers une constante lorsque h — 0. En ce qui 
concerne l'inverse nous utilisons le lemme !° 34.61 : 


(dfa + nr) = (da)! + IRIA(R) (34.139) 


9. Nous pouvons voir df comme l'application qui à x fait correspondre la matrice dfx € M(n, R). Cette application 
étant continue et la non inversibilité d’une matrice étant donnée par l’annulation du déterminant, les matrices 
inversibles forment un ouvert dans l’ensemble des matrices. 

10. Pour l’inversibilité de |hr(h), notons que df, est inversible et que par hypothèse la somme df, + |h]Tr(h) est 
inversible. 
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où À est une autre matrice fonction de h qui tend vers une constante lorsque h tend vers zéro. En 
substituant le tout dans (34.136) nous trouvons 


F(a + h) — F(a) = Inl/(df) *E(R) + |A(A(R) o dfa)(h) + IAIFA()E(R). (34.140) 


En ce qui concerne la norme nous utilisons le fait que si T est un opérateur, |Tx| < |T||x|. Nous 
trouvons 


LF(a+ à) — F(o)| < [A2(dfe) HEC) + AI2IAG) o dfal + PAÉIAG)INECHI (84-1412) 
= |h”a(h) (34.141b) 


pour une certaine fonction &: R”? — R qui tend vers une constante lorsque h — 0. 
En posant C = limy_,0 a(h) nous avons la majoration 


|F(x) — al < C|x — af. Far Tan) 


Nous pouvons également supposer que C > 1. Afin de prouver la vitesse de convergence (34.134), 
nous allons encore redéfinir r en demandant r < 1/C?. De cette manière nous avons 


1 
ro — al < c2 (34.143) 
et la récurrence sur n est : 
lent: — al = Fan) — a] < Clan — af? < C(C-1-2) 2 cr, (34.144) 


Note : ce dernier calcul est le lemme 34.45 appliqué à r = (1/C?). 


Remarque 34.64. 

La valeur de la constante C a été fixée par l’équation (34.142). Certes nous pouvons toujours 
choisir C plus grand afin d'augmenter la vitesse de convergence, mais le point de départ xo devant 
être dans une boule de taille 1/C? autour de a, demander C' plus grand revient à demander un 
point de départ plus précis. 


34.7 Estimation de l’ordre de convergence 


Définition 34.65 ([724]). 
Nous disons que la suite (x,) de limite x est convergente d’ordre q pour q > 1 si il existe p > 0 
tel que 


Don EE — (34.145) 


En particulier : 
— la convergence d'ordre 2 est dite quadratique, 
— la convergence d’ordre 3 est dite cubique, 
— la convergence d'ordre 4 est dite quartique. 


Comment estimer numériquement l’ordre p de convergence de la méthode ? Soit une suite (x}) 
convergente vers a. Considérons les 4 termes 7n_3, Zn_2, Tn-_1, Tn- Alors nous pouvons écrire 


l’'approximation 
[Gr — Tn—1| _ (E= Et) (34 146) 
fn " T5] (ge _ Tn-3| 


Cette approximation ne serait pas trop mauvaise tant que n est assez grand pour que la convergence 
soit bien engagée. Passons au logarithme : 


n ele (a) (34.147) 


FPE . | (ni mn Tn=3| 
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et donc 
In |Cn—Tn—1| 
. [En—1—Tn—2| 
(à = In =) . 


[Tn—1-Tn-3| 


(34.148) 


Avec cette approximation, en réalité nous calculons une suite (p;) qui sont les approximations de 
p à partir des termes à à à + 3 de la suite (x,). Il s’agit d’une suite d’estimations de p. 


(1) Dans le cas de la bisection, nous obtenons toujours p; = 1. 


(2) Dans le cas de la méthode de Newton (34.6) nous avons p = 2. Mais les premières valeurs de 
pi peuvent être aussi bien 0 que 7. Après quelques itérations pourtant les p; se regroupent 
autour de 2. 


En tout cas, le plus important est de savoir si p > 1 ou non. Rappel : nous voulons la superlinéarité 
parce que nous voulons utiliser le test d’arrêt de la différence entre deux termes, voir 34.47. 


34.8 Autres méthodes 


34.8.1 Méthode de Schrôder 


La formule est 


! 
Cette méthode est d'ordre 2 pour toute racine et toute valeur de multiplicité. Le problème de cette 
méthode est qu’elle demande 3 évaluations de f. Son efficacité : 


Tn+1 — Ln 


E = Ÿ2 = 1.25 (34.150) 


Cela est donc moins efficace que Newton. 


34.8.2 Halley 


Il a p = 3 lorsque a est racine simple. Mais encore p = 1 pour les racines multiples. Plus efficace 
que Newton pour les racines simples, mais même problème pour les racines multiples. 


2f (tn) f'(tn) 


Pa) — j@n) fan) GE 


Tn+1 — Ln 


34.9 Méthode des sécantes variables 
SECooIUEUo0oVcHAoc 


Si nous n'avons pas de formule analytique pour f, mais seulement la possibilité de calculer 
f(x) pour tout x. Newton ne fonctionne pas, mais la bisection fonctionne. 
Nous pouvons approximer 


F'(an) = Ro (34.152) 


Tn — Ln—1 


En substituant dans la formule de Newton, nous obtenons 


els — mi) 
F(tn) — f(&n-1) 


Il s’agit de prendre la droite qui passe par (tn_1,f(æn-1)) et par (æ»,f(æn)) et de prendre 
l'intersection de cette droite avec l’axe y = 0. Cela donne le xz»11. 

Pour cette méthode, il ne faut pas seulement xp mais également x:1. 

L'ordre de convergence est le nombre d’or 


(34.153) 


Tn+1 — Ln 


: i=45 FRSONERGEAUEqE | 
2 . 


34.9. MÉTHODE DES SÉCANTES VARIABLES 2455 


Cela est donc superlinéaire. 
Le nombre d'évaluations est s = 1 (il y a deux apparitions de f dans la formule, mais l’une des 
deux est récupérée dans l’itération suivante). Donc l'efficacité est 


E = p. (34.155) 
Donc bien efficace. 


Proposition 34.66. 
Si a est racine simple, il existe un voisinage de a tel que pour tout choix de xo, x1 dans ce voisinage, 
la méthode converge. 


Psychologiquement, on est tenté de prendre +0 et x1 de part et d’autre de a (pensant à la 
bisection), mais en réalité ce n’est pas obligatoire du tout et n’a aucune influence. Il faut seulement 
les prendre très proches de a. 


Remarque 34.67. 
La méthode de la sécante est souvent écrite sous la forme 


one PER ERoOYVALOBNTE 


C’est évidemment algébriquement équivalent. 

Les formules (34.154) et (34.156) ont toutes deux des erreurs de cancellation. Laquelle est la 
plus grave ? 

Dans la première, si la fraction est mal calculée, elle ne fait que modifier x,. C'est-à-dire qu’on 
peut espérer qu’à la prochaine itération, ça aille mieux. En tout cas, dans ce cas si la fraction est 
mal calculée, ça ne détruit pas tout. 

Dans la seconde, c’est la valeur elle-même qui risque d’être mal calculée. Et si la fraction est 
mal calculée, alors on casse complètement l’éventuelle bonne approximation que nous avions déjà. 


34.9.1 Aïtken 


La méthode du A? de Aitken est une méthode d'accélération de la convergence. 
Soit (x,) une suite qui converge. Nous voudrions une nouvelle suite (y,) telle que 


— à 
de € = p (34.157) 

0 Ln — À 

C’est la définition d’une convergence accélérée. 
La façon de faire est : 
2 
Tn+2%n — T _ 
da — n+2Ln n+tl . (Xn+1 En) | (34.158) 
Tn+2 — 2Tn+1 + Tn Tn+2 — 2Xn+1 + Ln 


La première expression a deux cancellations (la seconde une seule) et de plus la première est y» 
elle-même alors que la seconde est une correction. 

Donc la seconde expression est numériquement meilleure. 

L'opérateur À appliqué à une suite est : 


CA = init = (34.159) 
Donc 
(A?x}n = (At}n+1 — (AT}n = Tn42 — Ent1 — Enx1 + En = En42 — 2En+1 + En. (34.160) 
L’accélération à alors la formule (Ax}2 
Un = Poe (34.161) 


Le problème est que ça accélère tellement que l’on arrive vite à des erreurs de cancellations, et 
donc à une précision en pics oscillants. 
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34.10 Equations algébrique 
C’est une équation du type P(x) = 0 où P est un polynôme. Soit un polynôme de degré n. 
Nous en savons des choses. 


(1) L'équation a exactement n solutions dans € en comptant les multiplicités. 


(2) Les racines complexes arrivent par paire complexes conjuguée. Elles sont donc toujours en 
nombre pair. 


Si donc nous avons n = 3, nous ne pouvons pas avoir 2 racine réelles. Il y en a donc 1 ou 3 
réelles. Pas zéro ni deux. 
Quelques méthodes : Müller, matrice compagnon, Laguerre. 


34.10.1 Résoudre un système linéaire 


Pour résoudre un système linéaire d'équations, nous échelonnons la matrice du système. Soit à 
résoudre le système Ax = b où 


2 4 —6 4 
A=1|1 5 3, et b= [10 |. (34.162) 
De 5 


En termes de problèmes, on écrit F té (A, b)) — Ax — b. La donnée de ce problème est le couple 
(A, b). 


En ce qui concerne l’algorithme, on pose comme premier problème 
F; ÊTE (A1, bi1)) . Ait = b: = 0 (34.163) 


avec À1 = À et bi = b. 
Ensuite, on commence à échelonner et le second problème est 


PF (x, (A2, b2)) = AT = bo = 0 (34.164) 
avec 
2 4 —6 —4 
A=10 3 6 |, et b= {12 |. (34.165) 
0 1 5 13 
Le troisième problème sera 
F3 (xs, (43, b3)) — A3%3 ms b3 = 0 (34.166) 
avec 
2 4 —6 —4 
A=10 3 6 |, et b= {12 |. (34.167) 
0 0 3 3 


Ce problème est facile à résoudre « à la main ». Nous nous arrêtons donc ici avec l’algorithme, et 
nous trouvons le x3 qui résous le problème F3. 


34.10.2 Caractéristiques 
L’algorithme de résolution de systèmes linéaires d'équations a les propriétés suivantes, à mettre 
en contraste avec celles de Newton : 
(1) Pour résoudre le problème numéro n, il n’a pas fallu résoudre le problème numéro n — 1. 
(2) Toutes les solutions x, des problèmes intermédiaires sont solutions du problème de départ. 
Nous avons Fh(x,dn) = 0 pour tout n (ici, dy = (An, bn)). 
(3) D'un problème à l’autre, les données changent énormément : la matrice échelonnée peut être 
très différente de la matrice de départ. 
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34.10.3 Définitions 


Nous allons maintenant formaliser en donnant quelques définitions pour nommer les propriétés 
que nous avons vues. D’abord, un algorithme est une suite de problèmes. Un algorithme pour 
résoudre un problème F(x,d) = 0 est une suite de problèmes {F,(x», dn) = 0}nen- 


Définition 34.68. 
Un tel algorithme est dit fortement consistant si pour toutes données admissibles dn, on à 


Fr.dn) = 0. Vin, (34.168) 
où x est la solution de F(x,d) = 0. 


L’algorithme des matrices est fortement consistant, mais pas l’algorithme de Newton. 


Définition 34.69. 
Un algorithme est consistant si lim», Fn(t, dn) = 0. 


Dans le cas de l’algorithme de Newton, c’est plutôt une telle consistance qu’on attend. 
L’algorithme est dit stable si pour tout n le problème correspondant est stable. Dans ce cas, 
on note KM Je conditionnement relatif asymptotique défini par 


HP = osipk: (34.169) 
nm 


où K, est le conditionnement relatif du problème F,(xh,d») = 0. 
DefAlgoConverge 

Définition 34.70. 
Un algorithme est dit convergent (en d) si pour tout e > 0, il existe N = Ne) et d = O(N, €) tels 
que pour n > 0 et [d — dn| < Ô, on ait |x(d) — tn(dn)| < €. 

RemConvAlgoNewton 
Remarque 34.71. 
Dans le cas de l’algorithme de Newton, nous avons vu que la donnée d, du problème F,, était 
en fait la même que la donnée initiale d, donc nous avons d, = d, et par conséquent nous avons 
toujours |d — d,| < 6. Dans ce cas, la définition de la convergence revient à demander que la suite 
numérique des x, converge vers la solution x. 


Remarque 34.72. 

Dans le cas des matrices par contre, les données sont très différentes les unes des autres, nous 
avons donc en général que |[d — d,| > 6. Mais en revanche nous savons que tous les problèmes 
intermédiaires F, acceptent une solution unique !! x,(d,) = x(d). Par conséquent, |r,(d,) — x(d)| 
est toujours plus petit que €. L’algorithme des matrices est donc toujours un algorithme convergent. 


34.11 Équations non linéaires 


Certaines équations non linéaires sont résolubles explicitement, par exemples les polynômes de 
degré jusqu’à 4 ou des choses comme 


sin?(x) + 3sin(x) + 5 = 0. (34.170) 
Mais ces exemples sont très rares. 
Nous allons étudier des équations du type f(x) = 0, dans R. 


(1) Un problème écrit sous la forme x = g(x) peut utiliser des théorèmes de points fixes. 


(2) Un problème sous la forme f(x) = 0 peut utiliser des méthodes de bisection, Newton ou 
autres. 


11. Nous n’envisageons que le cas où le déterminant est non nul. 
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Il y a évidemment beaucoup de façons de transformer un problème pour passer d’une forme à 
l’autre. 


Exemple 34.73. 
Soit f(x) = x? — a = 0 avec a > 0. Nous pouvons l'écrire 


r+r-a=x (34.171) 


qui donne une forme g(x) = x pour g(x) = x? +x— a. 
Ou encore x = © et donc g(x) = a/x (si par ailleurs on sait que x Æ 0). Notons que x Æ 0 n'est 
pas une hypothèse très forte parce qu’on la vérifie directement sur a. A 


Exemple 34.74. 
Soit l'équation à résoudre 

f(æ) = x? -2—In(x) =0 (34.172) 
Les solutions de cette équation peuvent être vues comme les intersections avec l’axe X du graphe 
y = 2? —2—In(x). Tracer peut donc aider. Par ailleurs, il faut noter que 


lim f(x) = 0, (34.173) 


æ— +00 


donc les solutions sont certainement contenues dans un compact de R. 
À part tracer nous pouvons écrire 


x? — 2 = In(x). (34.174) 


Et là, ce sont deux fonctions dont nous pouvons tracer le graphe pour trouver graphiquement 
les points d’intersection. Une étude de fonction montre vite qu’il y a exactement deux solutions, 
qu’elles sont strictement positives. Pour trouver des bornes, il faut calculer par exemple pour x = 2 
les valeurs de In(x) et 4? — 2 pour voir si le graphe de x? — 2 est déjà plus haut. A 


La majorité des méthodes numériques de résolution d'équations du type f(x) = 0 ou x = g(x) 
seront sous la forme de suites. Avec questions à la clef : 
(1) Quel point de départ choisir ? 
2 


(2) Convergence ? 
(3) Est-ce que la limite est bien une solution ? 
(4) Vu que la limite est unique, comment faire si l’équation a plusieurs solutions ? (souvent c’est 


le choix du point initial qui va jouer sur ce point) 


34.75. 
Si la fonction est très plate, il est possible d’avoir 


[f(&)| < € (34.175) 


sans que à ne soit une bonne approximation. 
Lorsqu'on fait tourner une méthode itérative résolvant f(x) = 0, il n’est pas suffisant de 
s'arrêter lorsque 


Fr) er (34.176) 


Il faut aussi s’assurer que, si x est la solution exacte, |» —x| < 62. Ici e1 et e2 sont deux « précisions » 
que nous nous fixons au départ. 

Évidemment, vérifier la condition |r, — #| < €, il faudrait savoir x. Et savoir x c’est justement 
le problème. Nous sommes donc amenés à faire des estimations de |x, — x|. 


34.76. 
Lorsque nous effectuons une méthode itérative, il faut donc contrôler deux grandeurs : 
[IT — tn] < € (34.177a) 
és — dl < €2. (34.177b) 


Proposition 34.77. 
Soit p l’ordre de convergence de la suite (x,) vers x. Sip > 1 et [tu1—nl < €2 alors [T—}| < €. 
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34.11.1 Méthode de bisection 


Il y a ce théorème des valeurs intermédiaires. 


Théorème 34.78. 
Soit f continue sur [a,b] telle que f(a)f(b) < 0. Alors il existe au moins une solution à l’équation 
f(x) = 0 sur l'intervalle ]a, b]. 


Pour démarrer une bisection, il est toujours bon de prendre l'intervalle [a,b] de façon à ne 
contenir qu’une seule solution. 

Soit donc un premier intervalle [ao, bo] tel que f(ao)f(bo) < 0 et ne contenant qu’une seule 
solution. À chaque itération nous considérons la moitié de l’intervalle précédent, mais la moitié 
contenant la solution. 

Le test d’arrêt de la méthode de bisection se base uniquement sur la taille de l'intervalle qui 
reste. En effet si nous avons 

[bn — An] < € (34.178) 


nous avons certainement 


[T — Zn] < (34.179) 


NI 


où zA est le point du milieu de [as, bn]. 


34.79. 
La fonction f n'intervient dans la méthode que via son signe, pas via ses valeurs exactes. 


34.80. 
Notons que le théorème des valeurs intermédiaires n’est pas très puissant pour choisir l'intervalle 
de départ ; penser à la fonction 

f)=2?-5 (34.180) 


sur l'intervalle [—10, 10]. Il y a bien deux solutions dans l'intervalle, mais elles sont invisibles du 
théorème des valeurs intermédiaires. La fonction x + x? 
n’est pas visible. 


a sa solution en x = 0, mais elle aussi 


34.81. 

Certes la méthode de bisection assure la convergence vers une solution, mais elle n’assure pas la 
convergence monotone. Il peut arriver que [x — x,| < | — x»+1|. C’est le cas lorsque la solution 
est très proche du milieu de l'intervalle choisi. Le xo est alors proche de x alors que x1 sera à une 
distance de x d’environ un quart de l'intervalle de départ. 


Supposons déjà avoir trouvé un intervalle [a,b] dans lequel se trouve une unique solution à 
f(x) = 0. Voici un algorithme possible. 


from __future__ import division 


def bissection(f, a, b, toll, mmax): 


f : une fonction 
a,b : les limites de l’intervalle 
toll : la tolérance. C’est l1l’amplitude de l’intervalle à — 


partir duquel nous nous arrêtons. 


nmax : le nombre maximum d’itérations. 
Nous supposons que \( b>a\). 


Retourne un tuple (x,n) où ?’x’ est la solution approchée et ’n<— 
* est le nombre d’itérations effectuées 
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n = -i 
amp = toll + 1 # Pour s’assurer que l’on entre dans le cycle 
while amp > toll and n < nmax 
n = n + i 
amp=abs(b - a) 
x = à + amp / 2 
if fCa) *x f(x) < 0: 
b = x 
elif f(a)xf(x) > O: 
a = x 
élsé : # Problème ZERO 
amp = 0 


return (x, n) 


tex/frido/codeSnip_1.py 


Plusieurs remarques : 


(1) Le fait de retourner le nombre d’itérations effectuées permet à l’utilisateur de savoir la pré- 
cision et si le nombre maximum d’itérations est dépassé. Si ce n retourné est égal à nmax, 
l'utilisateur sait que le x retourné n’est pas fiable. 


(2) La ligne from __future__ import division fait en sorte que l'opération / est bien la 
division usuelle. Sinon, le défaut en python 2 est que / soit la division entière, c’est-à-dire 
que 1/2 = 0 en python 2. En python 3, le symbole / désigne bien la division usuelle, mais 
Sage utilise Python 2 !?. 


(3) Même si intervalle [a, b] contient plus d’une solution, la méthode fonctionne et donne une 
solution. Il est simplement éventuellement très compliqué de savoir laquelle. 


(4) Nous faisons amp=to1l1+1 parce que nous voulons absolument lancer le cycle au moins une 
fois. Sinon, le x à retourner ne serait pas défini au moment de sortir du cycle (si le cycle n’est 
pas exécuté). 


(5) Calculer le point milieu d’un intervalle [a,b] est par la formule (a + b)/2 sauf que cette 
opération est numériquement dangereuse parce qu’à cause de l’arithmétique en précision 
finie, il est possible que cela tombe exactement sur a ou b. D'où le fait de calculer le point 
milieu par 

amp 


(6) Dans le cas Problème ZERO nous déduisons f(x) = 0. Attention que c’est pas que f(x) = 0 
mais simplement que en mettant x dans f, la machine retourne son zéro. 
Il peut cependant avoir une fonction telle que f(1) = 10% et f(2) = 0. L’algorithme de 
bisection risque de s’arrêter si æ, = 1. Parce que la machine risque de calculer f(x») = 0. 
Quoi qu’il en soit, nous y mettons amp=0 pour être sûr de sortir de la boucle dès la prochaine 
vérification. 

(7) Il y a moyen de sauver les valeurs de f(a) et f(x) pour ne pas les recalculer, et en particulier 
au moment de faire b=x nous pouvons poser fa=fx. 

Si 7 est la précision de la solution voulue, nous pouvons fixer à priori le nombre d’itérations à 
faire grâce à la formule 


n> os Le ‘| (34.182) 


= 
Il y à un “>” et non une égalité parce qu’en arithmétique numérique, le nombre obtenu à droite 
pourrait ne pas être le bon à 1 près. 

Ici pour ve R le nombre [| est le plus petit entier à être plus grand ou égal à v. 


12. Cela était vrai au moment d'écrire l’exemple. Aujourd’hui, Sage utilise la version 3. Il n’y a aucune raison 
d'importer future. 
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34.82. 
Notons l’importance de la continuité de f. Par exemple que ferait la bisection sur la fonction 
f(x) = 1/x pour l'intervalle [—3, 1] ? 

Il y a changement de signe sans avoir de racine. 


Vu que 2! est déjà 1024. Donc si on veut de la précision de l’ordre de 1/1000, dix itérations 


suffisent. Si donc nous avons besoin de 200 itérations pour atteindre la précision voulue, c’est 
l’occasion de trouver un intervalle plus petit. Par exemple en traçant la fonction, en faisant un 
zoom et en trouvant des valeurs de a et b qui sont déjà proches. 


34.83. 
Dans le monde réel, il arrive souvent d'utiliser une méthode de bisection pour se donner un point 
de départ pour une autre méthode. 


34.12 Efficacité 


Définition 34.84. 
L'efficacité est le nombre 
E = /p (34.183) 


où p est l’ordre de convergence de la méthode et s est le nombre de fois qu'il faut calculer une 
valeur de la fonction à chaque itération (nous ne comptons pas l’initialisation). 


Que le nombre de d'évaluations de f intervienne est logique parce que chaque évaluation pro- 
voque une erreur possible. 


Exemple 34.85 (Bisection). 
Pour la méthode de bisection, nous avons s = 1 parce que chercher x,:1, il faut seulement calculer 


FEnde A 


Exemple 34.86 (Newton). 
Pour l’algorithme de Newton nous avons p = 2 et il y a deux évaluations à chaque itération (une 
fois f et une fois f’), donc s = 2 et E = 2. A 


34.13 Exemples sous forme d’exercices 


Exemple 34.87. 
Nous supposons une machine acceptant 5 chiffres significatifs. Elle retient les nombres sous la forme 
+0.x-.. x 10. 
x = 1.403, y = 0.4112 x 1075, z = —0.4111 x 10. 
Soient a = (x®@y)®zetb=(y®2)@x. 
(1) D'abord la calculer à la main. 
(2) Quel est le calcul préférable ? 
(3) Donner l'erreur relative avec 3 chiffres significatifs. 


Dans le cas du calcul à la main, il faut en faire un seul parce que, algébriquement, a = b. 
Nous avons x = 1.403, y = 0.0004112 et z = —0.0004111. Et la somme donne : 


a = b = 1.4030001 = 0.14030001 x 10. (34.184) 
Faisons d’abord la normalisation de x, c’est-à-dire f(x). 
f(x) = 0.1403 x 10!. (34.185) 


et y est déjà normalisé : 
fl(y) = 0.4112 x 10 *. (34.186) 
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Il n’y à pas d’erreurs d’assignation pour ces deux nombres. 

Pour faire la somme, il faudra déjà un peu casser les nombres pour les écrire de façon à pouvoir 
les sommer. En effet, il faut écrire les deux nombres avec le même exposant de 10 (le plus grand), 
pour pouvoir les mettre en colonne : 


0.1403 x 10! — 0.1403 x 10! (34.187a) 
0.4112 x 107 — 0.00004 x 10!. (34.187b) 


La somme donne 0.14034 x 10!. Et ça, c’est à nouveau arrondi. Le premier chiffre supprimé est un 
4, donc 
x ® y = 0.1403 x 10!. (34.188) 


Et là on remarque que nous avons la même chose que x. C’est un classique du calcul numérique. 


Nous avons aussi 
fl(z) = 0.4111 x 10%. (34.189) 


Et pour faire la somme de cela avec x @ y nous devons le remettre sous la forme d’un 10! : 
fl(z) — —0.00004 x 10! (34.190) 
(erreur de conversion), et en sommant on trouve 
(x © y) © z = 0.140216 x 10!, (34.191) 
qui est encore arrondi. Le premier chiffre supprimé est un 6, donc 
fl(a) = 0.1403 x 10!, (34.192) 


Nous avons donc æ ® y = x. Le nom de l’erreur qui consiste à avoir x ® y = x est relation 
anormale. 

Calculons b. 

Les nombres y et z ont même ordre de grandeur, donc pas d’erreur au moment de les mettre 
sous forme sommable. 


fly) + A(2) = 0.00010 x 10 *. (34.193) 


Cela est renormalisé et arrondi : f(x) @fl(y) = 0.1000 x 106. 

Notons que nous avons ici commis potentiellement une erreur de cancellation parce que entre 
y et z, il y a 3 chiffres sur 4 qui sont identiques. Seul le chiffre 1 est significatif en réalité. 

Il faut maintenant ajouter x à cela. D’abord 


f(x) = 0.1403 x 10!. (34.194) 


Pour cette somme, il faudra remettre notre 0.1000 x 1076 avec une puissance 10!. Et là, nous 
obtenons zéro parce que vraiment ce nombre est trop petit pour être écrit avec 10!. Résultat des 
courses : 


fl(b) = 0.1403 x 10!. (34.195) 


Dans le premier calcul nous avons deux “relations anormales” et dans le second nous en avons 
une plus une cancellation. 

Nous préférons avoir deux relations anormales, parce que l’erreur de cancellation est plus grave : 
elle consiste à une perte de chiffre significatifs. Le fait est que faisant la différence à l’ordinateur 
nous avons obtenu 0.1 qui est certes exact, mais qui est un coup de bol : la différence aurait aussi 
bien pu être 0.19 avec d’autres nombres, machinement égaux. 

Note : avec les données ici, il n’y a en fait pas d’erreur de cancellation. Mais il y a une erreur 
potentielle de cancellation, potentiellement grave. 

En ce qui concerne l'erreur relative. Dans la formule 
[a — a*| 


(34.196) 


€ = 
| jal 
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la différence ne peut pas être calculée à la calculatrice justement parce qu’elle est très potentielle- 
ment sujette à erreur de cancellation. 


__[0.1030001 x 101 — 0.1403 x 10![ 0.1 x 1076 
” 0.14030001 x 101 0.14030001 x 101 


= 0.712758 x 1077. (34.197) 


En passant à 3 chiffres significatifs, 0.713 x 1077 (le premier chiffre supprimé est un 7). 


Exemple 34.88. 
Soient x = 0.1 x 10?! et y = 0.5 x 1020 et les expressions 


. + 
(1) es 


2442 
(2) Ro E À 


Ces deux expressions sont algébriquement équivalentes. 


(1) Calculer les valeurs. 


(2) On suppose une machine en précision simple. Laquelle des deux expressions est préférable ? 


Pour 21, en arithmétique exacte : 


20.50, LEO 


= 0,25 x 101, 34.198 
0.5 x 1020 ca 1 x 1020 à ( 


21 


Le calcul exact de x donne la même chose. 


(1) Calcul de z 
Les deux valeurs sont mémorisables et la différence x — y se fait sans erreurs de cancellation. 
Idem pour la somme x + y. Idem pour les divisions. 
(2) Calcul de 
Pour faire x?, c’est pas possible parce que c’est de l’ordre de 10° alors que nous sommes en 
précision simple. Idem pour le produit xy. 


Morale : z2 donne un overflow alors que z, fonctionne de façon exacte. 


Remarque 34.89. 

En réalité le z1 n’est pas tout à fait calculable de façon exacte sur la machine parce qu’elle doit 
d’abord convertir en binaire, ce qui n’est pas toujours possible. Mais sur notre machine qui fonc- 
tionne en base 10, il n’y a pas de problèmes. 


A 


ii Avertissement /question au lecteur !! 34.90 
Dans l’exemple suivant, je ne sais plus du tout ce qu'est la fonction g. Par conséquent, je ne sais 
pas quel est le signe à indiquer dans g(x2) du dernier tableau. 

Si vous avez tout suivi jusqu'ici, écrivez-moi pour éclaircir ces points. 


Exemple 34.91. 
Soit la fonction 
f(x) = 2x? —-4r+2-—et. (34.199) 
(1) Identifier la plus grande des solutions réelles de f(x) = 0. 
(2) Effectuer une bisection pour la savoir. 
(3) Sachant que 
a = 1.358500220734946, (34.200) 


quelle est l’erreur relative ? 
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Note : si c’est pour chercher à la main des approximations pour démarrer, il est évidemment 
préférable de dessiner f1(x) = 27? — 4x +2 et fo(x) = —e * séparément. 
Quoi qu’il en soit, voici un graphique : 


Nous voyons trois racines : a € [0,0.5,], a € [1,1.5] et ao € [—4, —3.5]. 
La plus grande solution est a2. Nous pouvons déjà remplir le tableau des précisions : 


me lon l'es l'in lat) LI = @l 


Et nous calculons les valeurs de f aux points d'extrémité de l’intervalle. Note que seul le signe 
nous importe : 


f(1) = —0.368 (34.201a) 
f(L.5) = 0.278. (34.201b) 


Voici donc le tableau avec le signe de f indiqué : 


n| An bn Tn g(Zn) [bn — an] 
0 |1(+) | 1.5(—) —0.162 x 100 0.5 
lb 0.25 
2-1: 0.125 
Puis : 
n An bn Tn g(Xn) [bn — an | 
0 1(+)11.5(—) | 1.25(—) | —0.162 x 100] 0.5 
d | 3% 0.25 
2 | 5% 0.125 
Et enfin : 
An bn Tn g(En) [bn an | 


1(+) 1.5(—) | 1.25(—) | —0.162 x 10° 0.5 
1.25(—) | 1.5(+) | 1.375(+) | +0.284 x 1071} 0.25 
1.25(—) | 1.375(+) | 1.3125(—) | 0.738 x 107! 0.125 


DH O©lz 


Note que les f(x,) restent toujours du même ordre de grandeur. Si un moment on voit un 1.6 x 107, 
c’est qu’une erreur a été commise. 

En ce qui concerne le calcul de l’erreur relative, la première chose à faire est de vérifier que le 
a proposé est dans l'intervalle qui nous reste. Sinon c’est qu’une erreur a été commise. 
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De plus notre approximation est x, = 1.3125, dont déjà deux chiffres sont corrects. En deux 
itérations de bisection en partant de 0.5, nous ne pouvons pas nous attendre à mieux. 
A 


34.14 Approximations de fonctions 


(1) D’habitude on n’approxime pas une fonction sur tout son domaine, mais seulement sur une 
partie. 


(2) I y a le problème du choix de la classe des fonctions qui vont approximer. Nous allons 
travailler avec des polynômes. 


(3) I nous faut un critère disant si une approximation est bonne ou non. 


34.14.1 Critère d’interpolation 


À partir de n + 1 abscisses points distinctes x;, nous calculons y; = f (x;). Il y a ce théorème 
qui dit qu’il existe un unique polynôme de degré (au plus) n + 1 passant par les points (x, y). 


Proposition-Définition 34.92 (Base de Lagrange). 

Etant donnés n + 1 valeurs distinctes x;, l’espace des polynômes de degré n admet la base 
(n) xx; 
nr 

Li (x) = a 
j=0 
jAi 


34.202 
=. (34.202) 


pour à = 0,...,n. 
Soit par exemple les valeurs de f données dans 


mi [wi = f(x) 


TO — 5) 1 

TL —= —7 —23 
z2 = 6 —54 
æ3 = 0 —954 


Les polynômes de Lagrange pour ces données dépendent seulement des x;, pas des y. En 
particulier, 


(x — x1)(x — x2)(x — x3) 


LG) (+) = ; 34.203 
où () (xo — x1)(xo — x2)(xo — x3) 
etc. 
La réponse est que 
L® (x) 1 + 13%? + 42x (34.204) 
x) = .204a 
: 660 
3 2 
—x? — 30 
UE Eee , PS (34.204b) 
etc. (34.204c) 
Ce qu’il y a de bien avec cette base est que en posant a; = f(x;) alors le polynôme 
02 
S'&L (x) (34.205) 
i=0 


passe par les points (x:, f(x:)). Du coup il suffit d'écrire 


Pa(x) = Lx) — 28L 00 (x) — 54L0) (x) — 954L0) (x) = 47% + 352? — 84x-— 954 (34.206) 
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Un inconvénient de cette base est qu’elle est complètement dépendante des points choisis. Si 
on ajoute un point ou qu’on en prend un à peine différent, tous les coefficients changent. Mais en 
pratique, ajouter des points est quelque chose qui arrive souvent parce que souvent, après avoir vu 
le résultat d’un polynôme d’interpolation, on veut ajouter un point pour avoir un meilleur résultat. 


34.93. 
Une habitude : le premier et le dernier nœud se choisissent aux extrémités de l’intervalle sur lequel 
nous voulons une approximation. 

Le but d’une approximation est d’avoir des approximations de f(x*) pour des valeurs de x* 
qui ne soit pas une des abscisses données (parce que sur ces points, le polynôme et la fonction sont 
égaux). Nous considérons donc 

Jeep"): (34.207) 


Si x* est dans l'intervalle T = [tynin, Zmax| alors nous disons que nous calculons f par interpola- 
tion. Si au contraire x* est en dehors de cet intervalle nous parlons d’extrapolation. 

Si x* est pris à l'extérieur de 1, alors l’erreur risque d’être très grande, surtout parce que les 
polynômes tendent tous vers +0 lorsque x — +00. 

Autant l’interpolation via polynômes est le plus souvent valable, il faut garder à l’esprit que 
les extrapolations sont souvent mauvaises si x* est trop loin des extrémités de Î. 


34.14.22 Base de Newton 


Après la base canonique et la base de Lagrange, nous voyons la base de Newton. Soient encore 
n + 1 points donnés du graphe de f. 


Définition 34.94. 
La base de Newton pour les abscisses x; est l’ensemble des polynômes suivants : 


1,(x — xo), (x — to)(x — x1),...,(x — xo)(x — t1)...(x — ïn_1) (34.208) 


Notons que ces polynômes n’utilisent pas le dernier point des x;. Le polynôme passant par les 
points est 


Pa(x) = %o + > GG] (re): (34.209) 


Le calcul des c; n’est pas absolument évident. Mais si nous ajoutons un point d’interpolation, les 
polynômes déjà calculés sont encore bons ; en particulier 


Palo) Pc [IG —@;): (34.210) 
j=0 


Et cela est bien, parce que ça donne une façon de les calculer par récurrence. 
Il y a plusieurs façons de calculer les c;. 
Les différences divisées sont des façons d’approximer les dérivées. 


Définition 34.95. 
Soient n + 1 nœuds x; pour la fonction f. La différence divisée sont : 


Ordre 0 
Tri] = f(x) (34.211) 

Ordre 1 
fi, &] = 1e — . (34.212) 

Ordre 2 


flei 2, &] = feel — fil (34.213) 
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Ordre n 
Flro,..., Ta] = feel Een) (34.214) 
TO — Ln 
Les ordres font référence à l’ordre de dérivation qui est approximé. 
Nous avons alors 
Ci — f{xo, s.. AE (34.215) 


Cela donne effectivement une méthode de récurrence pour trouver les coefficients c;. 


Remarque 34.96. 
Pour calculer co, il faut seulement calculer f[x0] = f(x0). Mais pour calculer € il faut f[xo] et 
flæ1]. Et pour © il faut f[xo, t1,x2] qui demande f[x0,x1] et f[x1,x2|, qui demande etc. 

Il faut donc calculer en réalité tous les f[x;] pour terminer le calcul. Par contre, pour ajouter 
un point, il ne faut pas tout recalculer, et même pas tout conserver en mémoire. Il faut seulement 
garder en mémoire la dernière diagonale. 


Exemple 34.97. 
Soit les nœuds 


x || f(x) 
3] 1 
1 || —3 
5| 2 
6| 4 


Ts || flti] | fl, cl Fvirel 

1+3 …. f[x ,T ]-ffx 22] ee, 2? = 3 
3 1 2 2 : He | > 8 

3-2 __5 1-2) :{8 
rs I BE a 

2-4 ro,ri,vo]—f[riv2,xs] 4 
5 2. =. — 9 O0: T1 Ter 1:22,23 20 
6 4 


Le polynôme d’interpolation sera 


Paz) = co + (x — 0) + ca(x — xo)(x — x1) + c3(x — xo)(x — x1)(x — 2). (34.216) 


A 


Un exercice typique serait de donner tout pour 3 points puis de demander le polynôme qui 
aurait un quatrième point. 


34.14.3 Méthode des minimums quadratiques 


Soient m + 1 points connus sur le graphe de la fonction f que nous devons approximer. Au lieu 
d'exiger que notre approximation ne passe par tous les points, nous allons chercher une approxi- 
mation qui minimise la somme des carrés des erreurs sur ces points. 

Soit F une classe de fonctions dans laquelle nous allons chercher l’approximation. Nous cher- 
chons g € F qui minimise 


E(g) = 5 (fi) — g(xi))” ui PR OL) 


îi= 


(e 


où w; > 0 est une pondération. Souvent on prend w; = 1, mais pas toujours. La fonction E sur F 
est la fonction d’erreur. 


34.98. 
À part dans les exercices à la main, le nombre de points est grand, du type du milliard. Il est bien 
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entendu pas envisageable de faire passer un polynôme exactement par un milliard de points, parce 
que cela demanderait un polynôme de degré un milliard. 

Plus généralement, d’un point de vue scientifique, avoir n paramètres libres pour n données 
expérimentales, ça ne passe pas Popper. 

Afin de faire de la science qui passe Popper nous nous restreignons à une classe de fonction F 
dont la dimension n’est pas grande : dim(F) « m. Et nous notons dim(F) = n +1. 


Exemple 34.99. 

La qualité d’une expérience peut être influencée par des paramètres extérieurs comme l’humidité, 
le vent, etc. Donc il est normal d’avoir des mesures moins précises que d’autres. On les pèse 
moins. A 


Soit ge F, et une base {g}i-0...n de F. Nous écrivons 


9 — Gogo + &1g1 + °°° + Ann (34.218) 
La fonction donnée E donnée en (34.217), est, à partir du moment où F et une base sont choisis, 
une fonction des paramètres a; que nous nommons F(ao,...,an). 11 faut minimiser F, c’est-à-dire 
poser 
0F 
_=0 (34.219) 
0a; 
pour j = 0,...,n. Cela sont n + 1 équations pour n + 1 inconnues. Notons que ces équations sont 


linéaires parce que chacun des termes est du type 


2 
mm 
(st > 70) | (34.220) 
j=0 
et lors de la dérivation par rapport à a;, nous obtenons du degré 1. 


34.14.4 Notre espace de Hilbert 


Nous allons maintenant formaliser un peu tout cela. Dans [725] il est expliqué que si w est une 
fonction strictement positive, alors l’espace L2 ([a, b]) dérivé de la norme 


b 
\f22 = J OO: (34.221) 


est un espace de Hilbert. Nous allons tenter le coup avec w = D owiô», où d4 est la distribution 
de Dirac © centrée en a. 

Sur l’ensemble des fonctions IR — IR nous considérons la relation d'équivalence f + g si 
f(xi) = g(xi) pour tout à = 0,...,m. Nous notons L2 cet ensemble. 


Proposition 34.100. 
La formule 


(f,9) = 5 f(x)g(riu FRooUUKHoRE IDE 
i=0 


définit un produit scalaire sur L?. Ce dernier devient un espace de Hilbert. 


Démonstration. Pour être un produit scalaire (définition 9.164), la forme considérée doit être 
symétrique et strictement définie positive. La symétrie de la formule (34.222) ne fait pas de doute. 
Le fait que ce soit semi-défini positif non plus. Pour le strict, 


GP) = D lF(œi)Pur. (34.223) 
i=0 


13. Définition 30.60. 
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Étant donné que w; > 0 pour tout à, l'annulation de (f, f) implique l'annulation de f(x;) pour 
tout i. Cela signifie que f est dans la classe de 0 et donc est nul dans L2. 

En ce qui concerne la complétude, la proposition 7.278 répond à notre place, étant donné que 
L? est de dimension finie. Une base est donnée par exemple par e;(x) = Ôx,x,. Ici le Ô est celui de 
Kronecker, et non celui de Dirac. 


Lemme 34.101. 
Si la classe de fonctions F est un sous-espace vectoriel de L? et si f e L2? il existe un unique 
élément g de F minimisant la distance à f. 


Démonstration. Le théorème de projection (au choix 12.142 ou 25.7) nous assure l’existence et 
l’unicité d’un élément de F minimisant la distance à f € L2. 


34.102. 
Ce lemme est gentil, mais ne nous donne pas de méthodes pour trouver ce minimum. Nous allons 
donc écrire explicitement un système d'équations permettant de le trouver. Si {g,} est une base 
(finie) de F alors nous cherchons le minimisant sous la forme g = Ÿ,, aaÿa- 

Nous devons minimiser 


E(g) = Ÿ (f(x) — g(æi))"wi = D (f(x) — S'aaga(ti)) wi. (34.224) 
i=0 i=0 a 


Vu que cela est maintenant plutôt une fonction des coefficients a, que de la fonction g nous la 


notons F(ao,...,an). Il s’agit d'étudier le système d'équations 
0F 
= (. 34.225 
Zas ( ) 


Un tout petit peu de calcul mène au système 


22 ep Ti )g8( Ti) = Ditisal Ti) f(x). (34.226) 


À droite nous reconnaissons (f, ga). et à gauche, 8 4B(a: 98). Donc le système s'écrit 


D GE Ga 98) = (F, Ga). (34.227) 
E 


Il y à une équation pour chaque valeur de a. 

La matrice À € M(n + 1,R) donnée par (ga, gg) étant strictement définie positive (c’est un 
produit scalaire), le système a une unique solution. Et comme cette matrice est de plus symétrique, 
elle est diagonalisable par le théorème spectral 9.221. Toutes ses valeurs propres sont strictement 
positives. 

Notons pour la curiosité que si l’on considère la matrice B € M(m x n) donnée par 


Bij = Vuigi(ar), (34.228) 


alors nous avons À = BB. 


34.14.5 Droite de régression 


La droite de régression est le cas particulier n = 1, c’est-à-dire un système 2 x 2. Nous cherchons 
P = ao + ax. Et la base choisie est go(x) = 1, g1(x) = x. Nous avons 


go: go) = di iso( ) go( Mi) n'. (34.229a) 
(go, gi) =  . (34.229b) 
ï 


(91:91) = Dur. (34.229c) 
i 


2470 CHAPITRE 34. NUMÉRIQUE 


Donc pour approximer une fonction f il faut résoudre le système 


D W; >. ) &) e 

= ! 34.230 
(À wir Duwix?) Va Cf; g1) ) 
Pour calculer les produits {f, ga) il suffit de savoir f sur les points x;. Et encore heureux, parce 


que toute la méthode est basée sur le fait que nous ne connaissons pas f ailleurs. C’est pour cela 
que nous avons défini L? comme un ensemble quotient. 


Exemple 34.103. 
Faisons la droite de régression pour les données avec tous les poids w; = 1. 


T; 6 
—5 | 18 
—3 7 
1 0 
3 7 
4 16 
6 50 
8 67 
Nous avons 
€F,g0) = D, f(xi) = 165 (34.231a) 
i 
gn =). f(m)m:=810. (34.231b) 
i 
et donc le système 
7 14 ao _ [165 
o on) (ee) = En AE 
dont résolution donne la droite de régression. A 


Proposition 34.104. 
Si tous les poids sont identiques, alors la droite de régression passe par le barycentre des points 
donnés : 


1 mm 
= 34.233 
He m + 1 dit 3) 
1 mm 
=: : 4.2 
ee Div (34.233b) 


Cela donne une vérification possible de la réponse trouvée. 


Définition 34.105. 
L'erreur quadratique est la fonction F(ao,...,an) dont il est question plus haut. Et si une 
solution est connue, son erreur quadratique est la valeur de F' pour cette solution. 


34.15 Conditionnement d’une matrice 
SECooQGLRooZQzzsA 
Soit le système d'équations linéaires Au = b avec la matrice inversible À ainsi que le système 


perturbé (A + AAju' = (b + Ab). Nous notons Au = uw’ — u et nous voudrions pouvoir dire des 


. A 
choses de l’erreur relative on. 


34.15. CONDITIONNEMENT D'UNE MATRICE 2471 


Exemple 34.106 ([378]). 
Soit la matrice 


a= (7 5 (34.234) 
32 1 
et b — .. La solution de Au = best u -( 6 ) Si nous conservons la même matrice mais nous 


— 601 US 
considérons b = Le . La solution devient uw’ = ( 4 . 


En norme ||, nous avons “ 
IAb] 0.1 
= — = 0.003125 (34.235) 
Ib] 32 
: jaul _ 17 
u | 
= —— = 0.28. (34.236) 
lul 6 
Cela montre environ amplification d’un facteur 100 entre l’erreur sur b et l’erreur sur la solution. 
A 
DEFooBKQWooJuoCGX 
Définition 34.107. 
Le conditionnement de la matrice inversible A € GL(n,C) est le nombre positif 
Cond(A) = | A||A71|. (34.237) 


Cette dénomination sera justifiée par le corolaire 34.113 parce qu’il est évident que le condi- 
tionnement d’une matrice est lié au conditionnement du problème de résolution d’un système 
linéaire. 


Remarque 34.108. 
Le conditionnement dépend de la norme choisie, mais cette dependence est contrôlée par la propo- 
sition 11.44 qui nous indique que si le conditionnement d’une matrice est grand dans une norme, 
il sera grand dans une autre norme. 

D'autre part, lorsque nous écrirons | A] nous supposerons toujours que |.| est une norme d’al- 
gèbre !* et donc que nous avons toujours 


IAB] < AN B]: (34.238) 


De plus nous supposerons toujours avoir une norme subordonnée à une norme sur l’espace C”, de 
telle sorte à avoir 
| Au < |Aflul (34.239) 


pour tout u € C”. Voir aussi le lemme 11.59. 
Proposition 34.109 ([378]). 
Si À est une matrice inversible et si a € Ü nous avons : 
(1) Cond(A) > 1 
(2) Cond(A) = Cond(A”!) 
(3) Cond(aA) = Cond(A). 
Si Q € Ofn) alors 
(1) Nous avons Cond2(Q) = 1 où Cond2 est le conditionnement pour la norme |.|2. 


(2) Nous avons aussi 
Cond2(A) = Cond2(AQ) = Cond2(QA). (34.240) 


14. La proposition 11.44(3) montre que si nous voulions des estimations en norme |.|2, il y aurait au maximum 
un facteur 42 par-ci par là. 
15. Définition 11.56. 
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Démonstration. Nous savons que Cond(1) = 1 et donc 
1 = [1] <|AÏ|AT| (34.241) 


parce que la norme utilisée est une norme matricielle. 

Les deux autres formules sont évidentes à partit du fait que la définition du conditionnement 
de À est symétrique entre À et A7. 

En ce qui concerne les formules relatives à la matrice orthogonale Q nous savons par la propo- 
sition 9.43(3) qu’une matrice orthogonale est une bijection de l’ensemble {x € R” tel que |x| = 1}. 
Par conséquent 


IAQÏ]= sup  |AQx| = sup 1AQQ x] = |A]. (34.242) 
æ tel que |x|=1 Q=—1x tel que |x|=1 
Donc |AQ| = |A|. Les assertions s’ensuivent immédiatement en remarquant que Q"! est également 


orthogonale. 


Soit une matrice inversible À € GL(n,C). La matrice A*A est hermitienne {© et le théo- 
rème 11.18 nous assure que ses valeurs propres sont réelles. Par la remarque 11.19, ses valeurs 


propres sont même positives. 
PROPooNUAUooTbVgcN 


Proposition 34.110 ([378]). 
Soit une matrice inversible À € GL(n, C), et 1 <... < jun les valeurs propres de A*A. Alors nous 


avons la formule 
Cond2(4) = , Pa. (34.243) 
1 


Démonstration. Par le théorème 12.120, la norme de À est liée au au rayon spectral de A*A par 


IAle = VA = Vin. (34.244) 


Vu que le spectre de AA* est le même que celui de A* A (lemme 12.103) nous avons aussi 


A2 = 4/p((4-2)* A1) = 4/p((4*A)1) = 


1 
V1 


parce que la plus grande valeur propre de (A* A)! est l'inverse de la plus petite de A*A. 
Ces deux calculs étant, 


(34.245) 


Condo(4) = | Ale] A2 = a (34.246) 


ii Avertissement /question au lecteur !! 34.111 
À mon avis ce qui est dans la proposition 17.117 est le conditionnement de la matrice ou sa racine 
carrée où un truc du genre. Il faut voir le lien entre les valeurs propres de À et celles de AA*. 


34.15.1 Perturbation du vecteur 
PROPooGIXFooAhJkIs 


Proposition 34.112 (Système linéaire : perturbation du vecteur REédrarcoopx _—. 
Soit une matrice inversible À et les systèmes d'équations linéaires % 

Au = b (34.247a) 

Au = b. (34.247b) 


En notant Au = u' — u et Ab = b — b nous avons 


ot < Cond(4) 199. FAooES ROIS 


16. Définition 9.175. 
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Démonstration. En soustrayant les équations (34.247) nous avons Ab = AAu, et donc Au = 
ATTAb. D'une part nous avons alors 


|Aul < |47°|]Ab]. (34.249) 
Et d’autre part, |b| < | A|]u|, ce qui donne 


[M] 


IL < ul. (34.250) 
|A] 
En mettant les deux ensemble, 


IAu| _ ]A7"1IAb] 
ul lb] 


A 
|A] = Cond(4) OP. (34.251) 


Le corolaire suivant justifie le nom « conditionnement » au conditionnement d’une matrice. 
CORooXKPWooJVHVvh 


Corolaire 34.113. 
Soit À € GL(n,C) fixée et le problème de résoudre Au = b, c’est-à-dire la fonction 


F(u,b) = Au —b. (34.252) 


(1) Ce problème est stable pour toute valeur de b. 


(2) Nous avons une majoration pour le conditionnement relatif" : 
Ka(n: bo) < Cond(A). FAoo ZE RTS 


Démonstration. (1) Stabilité Vu que À est inversible, il existe une solution unique à tout 
système de la forme Au = b’. De plus u(b) = A-1b, donc 


lu(b) — u(bo)| = | A7 — bol < 1 AT 11b — bol, (34.254) 


de telle sorte que la condition 34.26(2) fonctionne avec X = | A71||. 


(2) Conditionnement En partant de la définition 34.49, et en utilisant la majoration de la 
proposition 34.112 sous la forme 


ut) — u(b)| < Cond(4)lu(br)1 ET, (34.255) 
nous obtenons : 
Krel(bo: 1) = Kabs (bo; 1) nn (34.256a) 
+ . or EL 
< ep Cond TE Ad nn 
— Cond(À). (34.256d) 
REMooAIKIooJEBEqi 


Remarque 34.114. 

La notion de conditionnement relatif dépend aussi de la norme choisie. Dans la formule (34.253) 
il faut prendre le conditionnement Cond(A) pour la norme dans laquelle le K,4 est écrit. Encore 
une fois, toutes les normes étant équivalentes, cette majoration est à constante près bonne pour 
toutes les normes. Si la dimension est très grande, cette constante peut par contre être grande. 


17. Si vous doutez de la norme à prendre, lisez la remarque 34.114 
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34.15.2 Perturbation de la matrice 


Proposition 34.115 (Système linéaire : perturbation de la matrice[378]). 
Soient les systèmes linéaires 


Au = b (34.257a) 
lu = b (34.257b) 
avec À et À’ inversibles. Nous notons AA = À! — A. Alors ITEMooJMTKooSEBavB 
“ IAul] IAA 
ü 
< Cond(A)—— (34.258) 
u/| |A] 
(8 A AA 
ET < Cond(4) (1 + a(|AAI) (34.259) 
où lims-,0 a(x) = 0. 
Démonstration. D'abord nous avons 
0 = Au — Au (34.260) 
= (4! — Aju' — Au — Au (34.260b) 
= AAu + AAu. (34.260c) 
Par conséquent, Au = —A-t(AA)\u! et 
: EQooYYITo ] 
lAul < JA IA Au]. RFESET) 
si JA JA] JA] 
ü 
ET Se JA NAN ET = Cond(Aÿ =, (34.262) 
u/| |A] |A] 


Cela est (1). 
Pour l’autre inégalité, nous avons 4’ = A + AA et donc 


A1] = |(A + AA) (34.263) 


Nous repartons alors de (34.261) en changeant le rôle de À et 4’ (et donc aussi de u et uw’). Ce 
changement étant, | Au] et | AA] ne changent pas. Nous avons : 


A 
'< |A -1]IAA] (34.264a) 
u 
. Cond(A) 
= |(4A+ AA) IAA (34.264b) 
| AÏI AT] 
I(4 + AA) "| JAAÏ 
= Cond(A). (34.264c) 
1 AT] |A] 
Il reste à voir que 
… IA+AA] 
lim = 1, 34.265 
IAAÏ-0  |ATi] 
ou autrement dit que 
… HAT] EQooJURGopFvYi 
Jin, LA] — 1 PE) 


où la limite est celle dans GL(n, C). Par définition de la topologie, la norme est continue (quelle 
qu’elle soit par l’équivalence de norme 11.46). Par le théorème 11.262, l'application À + Al est 
également continue et commute donc avec la limite. Nous avons donc 


lim |471} = }( lim 4) 1} = A 1}. (34.267) 
A'—A A'—A 


Donc la limite du quotient (34.266) est bien 1. 
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34.16 Système linéaires (généralités) 


Soit un système d'équations linéaires Ax = b avec À € Mn, R). Le problème est évidemment 
de savoir si il existe une unique solution x et de la déterminer. Nous supposons l’existence et 
l’unicité. C’est-à-dire que les conditions équivalentes !? sont vérifiées : 


(1) À est inversible, c'est-à-dire qu'il existe une matrice notée A! telle que AA! = A-TA = 1. 
(2) det(A) # 0. 
Note : si nous avons un système pas carré du type Bx = v avec B € Min x m) alors nous pouvons 
nous ramener à un système carré en écrivant 


B'Bx = B'v. (34.268) 


Mais attention : bien que BtB soit symétrique et semi-définie positive, certaines valeurs propres 
peuvent être nulles. 


34.116. 
Deux choses générales en calcul numérique : 


(1) On ne calcule pas l'inverse d’une matrice. 
(2) On ne calcule même pas son déterminant. 


Par conséquent nous ne faisons pas à = A7 lv. 

Il faut garder en tête le fait que dans la pratique, la matrice À possède des millions de lignes et 
colonnes, si pas pire. Pour une matrice de taille de l’ordre du million, il y a 1000 milliards d’entrées. 
Si on compte 32 bits par nombre (précision simple, définition 34.8), c’est-à-dire 4 octets, il faut 
4000 giga-octets pour enregistrer la matrice. Même pour la mémoire actuellement disponible, ce 
n’est pas rien. Surtout que souvent, la précision simple n’est pas utilisée, mais la précision double, 
ce qui donne 8000 giga pour enregistrer la matrice. 

Heureusement, dans la majorité des cas pratiques, les matrices géantes qui apparaissent sont 
pleines de zéros. 


Définition 34.117. 

Une matrice est creuse si elle possède beaucoup de zéros. Une matrice non creuse est dite dense. 
Notons que lorsqu'on parle de matrice comprenant beaucoup de « zéros », nous pensons à des 

éléments très petits, et non de vrai zéros. 


Les matrices creuses ne sont pas mémorisées entièrement, mais plutôt comme un dictionnaire 
(à, j,v) qui donne la valeur v de A;;. 


Définition 34.118. 

Une matrice est de « grande dimension » si elle ne peut pas être mise en mémoire sur un ordinateur 
donné. Sur certains ordinateurs, ça commence à 5000 inconnues. Mais sur des plus forts, on peut 
aller jusqu’au million ou le milliard. 


Si la matrice est de petite dimension, il est possible d'utiliser des méthodes dites « directes ». 
Sinon, il faudra utiliser des méthodes itératives. 


34.16.1 Les méthodes directes 


Une méthode directe consiste à successivement transformer un système A(0)x = b(0) en de 
nouveaux systèmes A0) x = bÜ) dont la solution est identique jusqu’à obtenir un système AÛ7-1l)% = 
bin—1) qui est à résolution immédiate. 

L'avantage d’une méthode directe est qu’elle fournit une réponse exacte, pour autant que les 
calculs intermédiaires soient bien faits (ce qui n’est pas le cas sur un ordinateur). 

Une méthode directe fonctionne en général avec un nombre de pas fixés par la taille du système. 
Par exemple pour un système n x n, la méthode de Gauss demande exactement n pas, et il n’y a 


18. L’équivalence est la proposition 9.13(2). 
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pas moyen de faire mieux. Or chaque pas demande de recalculer tous les éléments de la matrice. 
Encore une fois, si la matrice a une taille de l’ordre du milliard, cela fait 101$ éléments à recalculer 
un milliard de fois (sans compter les éléments du vecteur b). Infaisable. 
Souvent une méthode directe passe par une factorisation À = BC avec B,C € Mn x n). 
Quelques types de matrices dont la résolution est immédiate : 


— Matrice diagonale. 


— Matrice orthogonale parce que si À est orthogonale alors Ax = v se résout par x = Atv qui 
n’est pas particulièrement lourd à faire numériquement. 


— Matrice triangulaire. 


Remarque 34.119. 
Pour une matrice diagonale, le déterminant et l’inverse sont faciles. Mais également pour la trian- 
gulaire. Pour une matrice triangulaire, le déterminant est le produit des éléments diagonaux, et il 
se fait qu'il y à une algorithme facile pour calculer l’inverse. 

Donc en fait les matrices à résolution immédiates sont des matrices pour lesquelles l'inverse et 
le déterminant sont facile à calculer. 


34.16.2 Méthodes itératives 


Si la matrice est trop grande, il n’est pas possible de faire des manipulations de matrices à 
chaque itération. 

En général, les méthodes itératives ne convergent pas toujours. Mais lorsqu'une méthode 
converge, c’est une propriété de la matrice, et donc la convergence aura lieu pour tout vecteur 
de départ x0. Cela est très différent du cas des équations non linéaires type Newton pour lesquelles 
la convergence peut fortement dépendre du point de départ. 


34.17 Système linéaires (méthodes directes) 


Les matrices que nous sommes autorisés à inverser sont les matrices 
— orthogonales : l'inverse est la transposée 
— diagonales : l’inverse est diagonale avec les inverses sur la diagonale 


— triangulaires : nous en parlons maintenant. 


34.17.1 Inversion de matrice triangulaire 


Si T est une matrice triangulaire (mettons supérieure pour fixer les idées), il est possible d’en 
calculer l’inverse sans trop d’efforts. Notons B la matrice inverse que nous allons construire ligne 
par ligne. Vu que BT = 1 nous avons 


n J 
O1 = ?, BirTkj = 
k=1 


BikTkj (34.269) 
1 


parce que T4; = 0 pour k > j. Donc nous pouvons calculer les éléments B;; un par un parce que 
chacun ne dépend que des précédents. Le même procédé fonctionne pour les autres lignes : 


j 
ed be (34.270) 
k=1 


Et tu notes que le calcul peut être parallélisé : le calcul de la ligne numéro j ne dépend pas du 
résultat des autres lignes. 
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34.17.2 Transformation gaussienne 
DEFooUJRKooDcrbeU 


Définition 34.120 (Transformation gaussienne[726|). 
Soit x E R” avec xx Æ 0. La k‘transformation gaussienne pour x est la matrice 


My(x) = 1-T;(x) (34.271) 


où T(x) est la matrice unité à qui on a ajouté le vecteur 


0 
Tk(&) = | (34.272) 
5 Tk+1/Tk | 
RÉ 
à la k°colonne. 
Autrement dit, la matrice Mz(x) est la matrice 
1 
0 
: 1 EQooMWXL 
mie) = |" ! QooMALoREPEERE 
: —Syy1/te 1 
| : : 0 . 
0 O0 —Tn/Tk 0 1 
En coordonnées nous avons 
(Mx(x)),, = Dj — Tk(T)iÔR. (34.274) 


34.121. 
Les matrices de transformation gaussienne sont des matrices triangulaires de diagonale unitaire 
(c'est-à-dire avec des 1 sur la diagonale). 


Lemme 34.122. 
Si x € R" alors nous avons 


T1 
Tk 
Ma(x)x = o |: (34.275) 
0 
Démonstration. Nous avons 
(Mi(x)x), = > Mi(zhutr = y. (ou — r(thiôm)m = di — Tk(thite. (34.276) 
1 l 
Si à < k nous avons 7g(x); = 0 et donc (M4(x)x), = x. Si par contre i > k + 1 alors (x); = … 
et alors (Mz(x)x), = 0. 
LEMooPFWWooUmMsVH 


Lemme 34.128. 
Si y ER” vérifie y; = 0 pour à > k alors My:1(x)y = y. 
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Démonstration. C’est une simple vérification : 


(Mrr(x)y), = … (di — Th+1(rhiôp+1t) ge = Yi — Th+1(T)iYe+1. (34.277) 
î 


Mais comme y4:1 = 0 il nous reste automatiquement y. 


Le sens de ce lemme est si un vecteur est déjà « gaussiannisé » au niveau k, alors en lui 
appliquant une transformation gaussienne de niveau plus élevé que k, il ne change pas. Ce fait est 
important parce qu'il assure que lorsque l’on avance dans le processus de Gauss, chaque étape ne 
détruit pas les précédentes. 

Le lemme suivant nous indique que l'inverse d’une matrice de transformation gaussienne est 
facile à calculer !?. 


LEMooFHZDooZiKdbr 
Lemme 34.124. 
L'inverse de la transformation gaussienne 
Mix); — di = me iôRs: (34.278) 
est la matrice donnée par 
Mix) — di + red: (34.279) 


Autrement dit, il suffit de changer le signe de la partie non diagonale. 


Démonstration. Il s’agit d’une simple vérification, utilisant le produit matriciel explicite, et en 


remarquant que 7(x)x = 0 pour tout k. 


34.17.3 Méthode de Gauss pour résoudre des systèmes d’équations linéaires 


Pour résoudre un système d’équations linéaires, on procède comme suit : 
(1) Écrire le système sous forme matricielle. 
2æ+3y —=5 ( 2 3 


5 
.EX. & 
di Lu. = À 1 2 . 


(2) Se ramener à une matrice avec un maximum de 0 dans la partie de gauche en utilisant les 


transformations admissibles : 


(2a) Remplacer une ligne par elle-même + un multiple d’une autre ; 


2 319 NN O0 —1| -3 
PSE, Li 64 1 2 |4 


(2b) Remplacer une ligne par un multiple d’elle-même ; 


0 —1/-3\-24/0 1]3 
PSS 4 | 4 1 214 


(2c) Permuter des lignes. 


0 1/3 \arlpatlsli [1 0|-2 
SR Re 0 113 


(3) Retransformer la matrice obtenue en système d’équations. 


ex ù 0 = <> / re 
PÉRE LI:8 —. 


19. Elle rentre d’ailleurs dans la catégorie des matrices triangulaires dont nous avons déjà discuté l'inverse. 
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Remarques : 


— Si on obtient une ligne de zéros, on peut l’enlever : 


3 4 —212 3 4 -219 
p.ex. 4 1 3 0 | = 4 1 3 lo 
0 0 O0 !0 


— Si on obtient une ligne de zéros suivie d’un nombre non-nul, le système d’équations n’a pas 
de solution : 


3 4 —-212 
p.ex. 4 —1 3 10 | = 4... = Impossible 
0 0 017 


Ox + Oy + 0z = 7 


— Si on moins d'équations que d’inconnues, alors il y a une infinité de solutions qui dépendent 
d’un ou plusieurs paramètres : 


z=2+2À 
1 9 --2)2 E— 22 = 
p.ex. 0 1 3 e& & 4y—=—-3) 


34.17.4 Méthode de Gauss sans pivot (décomposition LU) 


La méthode de Gauss est souvent aussi appelée méthode « LU » qui va décomposer À = LU 
où L est triangulaire inférieure et Ü est triangulaire supérieure. La décomposition est même plus 
précise que cela : on demande que Z aït seulement des 1 sur la diagonale. 

Si À est une matrice nous notons 


Ag(A) = (Ai)ii,j<k (34.280) 


la matrice tronquée dont nous ne gardons que le carré k x k en haut à gauche. 
LEMooXEJFooGiYoyb 


Lemme 34.125. 
Soit S une matrice triangulaire inférieure. Soient également A et B telles que B = SA. Alors 


A4(B) = Aÿ(S)Az(4). (34.281) 


Démonstration. En effet nous avons 


L EQooHBZZookHt j; 
ANA COHBZZOREE LISE 
l=1 


Dans la somme sur lil ne reste que les termes { < i. Mais dans le calcul des éléments de matrice 
Ag(B;;, nous avons évidemment à, j < k. Donc ! < à < k. Les seuls éléments de matrice de À qui 
sont utilisés dans la somme (34.282) sont les éléments A; avec 1, j < k. 
Nous pouvons donc limiter la somme à { = k au lieu de ! = n et écrire Ax(A);; au lieu de Ay;. 
Même chose en ce qui concerne S$. À partir du moment où / est limité à k, les éléments Sy et 


A&(S):x sont les mêmes. 


THOooUXKJooYaPhiu 
Théorème 34.126 (Décomposition LU[727, 1]). 
Soit une matrice À inversible telle que det(Az(A)) # 0 pour tout k. Alors il existe un unique couple 
de matrices (L,U) telles que 


— U soit triangulaire supérieure 
— L soit triangulaire inférieure, de diagonale unité 
— A = LU. 
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De plus pour tout k < n nous avons 


Az(A) = Ag(L)Ag(U). (34.283) 

Démonstration. Nous allons prouver par récurrence le fait suivant : pour tout 1 < k < n —1 il 
existe des matrices E; (i = 1,...,k) telles que en posant 

Ag = Ex...E1A, (34.284) 


— ÆE; est une transformation gaussienne 20 pour la j° colonne, 


— pour tout j < k, A;; = 0 dès que à > j. Autrement dit la matrice A} est triangulaire 


supérieure jusqu’à (non comprise) la (k + 1)° colonne (laquelle est quelconque). Exemple 
pour fixer les idées : pour une matrice À € M(4 x 4), la matrice 42 doit avoir la forme 


#  * 
#  * 
OE: 
# 


*# 


A2 = EE1A = (34.285) 


eo. © © * 
OO Oo + + 


où les éléments notés + sont à priori non nuls, 


— l'élément de matrice (Az)x+1%+1 est non nul (celui entouré dans l’exemple). 


La chose un peu triste dans cette démonstration est que l’initialisation va être très ressemblante 


au pas de récurrence. 


(1) 


Initialisation : 4 = 1 


Vu que A;(A) est inversible, l’élément A; est non nul. Il existe donc une transformation 
gaussienne Æ; telle que la première colonne de la matrice A, = E;A soit nul sauf la première 
composante. En particulier (A;)21 = 0. 

Par le lemme 34.125, nous avons A2(A1) = A2(F1)Ao(A), donc ?! 


det (A2(A1)) = det (A2(Æ1)) det (A2(A)). (34.286) 


Étant donnée la forme (34.273), toutes les matrices du type Ay(E;) ont un déterminant 
unité, et par hypothèse A2(4) est inversible, donc de déterminant non nul. Par conséquent 
det (A2(A1)) # 0. Mais comme ce déterminant est le produit des éléments diagonaux (c’est 
une matrice triangulaire), ces derniers ne sont pas nuls. Finalement, (A; )22 # 0. 


Le pas de récurrence 


Nous supposons avoir Ay = Ex ...Æ1A avec (Az)x+1#8+1 # 0. Alors il existe une transforma- 
tion gaussienne ÆE%+1 de la (k + 1)° colonne telle que 4x1 = Ey+1A% soit une matrice dont 
la (k+1)° colonne n’ait que des zéros en dessous de la (k + 1)° position. Vu le lemme 34.123, 
cette transformation n’affecte pas les colonnes précédentes. 

La matrice A}, est donc triangulaire supérieure jusqu’à la (k + 1)° colonne. 


Vu que le produit E411...Æ est une matrice triangulaire inférieure, le lemme 34.125 fonc- 
tionne encore et nous avons 


Ax+1(4x+1) — Ag+1(Er+1 .. E1)A%+1(4). (34.287) 


En ce qui concerne les déterminants, par hypothèse, nous avons det (Ax+1(4)) Z 0 ainsi que 
det (Az+1(Er+1 à E:)) = 1. Donc 


det (Ay+1(Ax+1)) # 0. (34.288) 


Cette matrice étant triangulaire de déterminant non nul, ses éléments diagonaux sont tous 
non nuls; en particulier (Ax+1)x+2,#+2 # 0. 


20. Transformation gaussienne, définition 34.120. 
21. Le déterminant est multiplicatif, proposition 9.13(1). 
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En poussant la récurrence jusqu’au bout, la matrice 
An-1 = En_1...EnA (34.289) 


est triangulaire supérieure. 
Nous posons alors L = (En_1...Æ,) ! et U = A,_1. Cela prouve l'existence parce que 


A=(Ey 1...E1) l'An. (34.290) 
Encore une fois, le lemme 34.125 nous donne 
A tAŸ= Aë ((En .. E1)7!)Au(4n-1), (34.291) 


ou encore Ag(A) = Ag(L)Ag(U). 

En ce qui concerne l’unicité, si À = LiÜ1 = LU alors Loti = UoU, !. Vu qu’à gauche nous 
avons une matrice triangulaire inférieure et que à droite nous avons une triangulaire inférieure, 
nous savons que les deux membres représentent une matrice diagonale. Mais à gauche, la diagonale 
est unitaire. Donc les deux membres représentent la matrice unité. 


34.127. 
En pratique, pour résoudre Ax = b, il faut seulement appliquer les transformations gaussiennes à 
la matrice élargie (A]b) pour finir sur un système du type 


Ux = b (34.292) 


qui est immédiatement soluble. Autrement dit, en effectuant les annulations de colonnes, la matrice 
U est « gratuite ». 

Il n’est pas indispensable de calculer la matrice L qui, elle, demande à chaque étape de se 
souvenir de la matrice £; utilisée. Si il faut résoudre plusieurs systèmes Ax; = b;, nous pouvons 
encore travailler avec la matrice encore plus élargie (A]b1...b,»). 

Si par contre nous ne connaissons pas à l’avance l’ensemble des vecteurs b avec lesquels il faudra 
résoudre le système, il est bon de calculer la décomposition À = LU in extenso, c’est-à-dire de 
garder une trace des matrices L et U séparément. Dans ce cas, résoudre Ax = b revient à résoudre 
Ly = b, et ensuite Ux = y. Ce sont deux systèmes de résolution directe parce que les matrices sont 
triangulaires. 


34.128. 
Le fait que 
Ag(ÀA) = AZ(L)AZ(U) (34.293) 


nous dit que si après avoir calculé L et U nous remarquons que le système est un peu plus petit 
ou un peu plus grand que prévu, tout le travail n’est pas perdu. En particulier si le système est 
plus petit que prévu, l’adaptation de L et U est immédiate. 


Notons que U et L sont inversibles, et que det(L) = 1. Donc det{(U) = det(A). 


Exemple 34.129. 
Pour travailler la méthode de Gauss pour le système Ax = b, nous introduisons la matrice un peu 
augmentée (A]b). Nous faisons un exemple. Soit à résoudre 


2 1 3 x 11 
4 3 10||[y1= |28|. (34.294) 
—2 1 73 z 3 


Nous introduisons la matrice augmentée 


(Alb)O = | 4 3 10 28|. (34.295) 
=D, À 8 
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Le premier pas consiste à annuler tous les éléments sous la diagonale de la première colonne. 
à : ; : Durs Ai; 
Autrement dit, nous prenons le 2 comme pivot. Nous introduisons les multiplicateurs l;; = 3. La 
(2 
nouvelle matrice est : 


2 1 3 ll 
(AJb)0 = [0 1 4 6 (34.296) 
0 2 10 14 
où nous avons utilisé les multiplicateurs 21 = 2, l31 = —1. 
Et la matrice suivante est : 
2 1 3 Il 
(Ab) = [0 1 4 6 (34.297) 
0 0 2 2 
où nous avons utilisé le multiplicateur l32 = 2. 
Cela est un système de résolution immédiate : 
2æ+y+3z=11 (34.298a) 
y + 42 = 6 (34.298b) 
22 = 2. (34.298c) 


La troisième donne z = 1. Ensuite y + 4 = 6, donc y = 2. Et la première donne : 2x +2 +3 = 11, 
c’est-à-dire 2x = 6, enfin : x = 5. 

Solution» (54.2) =1(82; 1): 

Nous notons surtout que dans (A|b)(2) nous avons une matrice triangulaire supérieure. Où est 
la matrice triangulaire inférieure ? En réalité la matrice L est la matrice des multiplicateurs : 


1 0 0 
L=|2 10|. (34.299) 
=: 9 À 


A 


Le problème de cette méthode est que faisant ainsi nous risquons d’avoir un zéro sur un des 
pivots. Par exemple tomber sur 


Dar di 
(Ab) = [0 0 4 6 |. (34.300) 
09-10: 14 


Le zéro sur la deuxième ligne nous ennuie si nous voulons tout faire dans l’ordre. Maïs notons 
qu’en échangeant les deux dernières lignes, tout va bien : le système donné par 


De vu 
(Ab) = [0 2 10 14 (34.301) 
0 0 4 6 


fonctionne très bien. Et même tellement bien qu’il est de résolution immédiate, dans ce cas. 

Un autre problème est que si un des pivots est 10714, le multiplicateur sera de l’ordre 1014, 
qui est mal représenté en mémoire. Il est donc bon de prendre les pivots le plus grand possible. Si 
le pivot est le plus grand nombre en valeur absolue d’une colonne, alors les nombres 144;/%x qui 
entrent dans la matrice de transformation gaussienne sont des nombres dans [—1,1] qui sont bien 
représentés en mémoire. 

Tout cela nous incite à développer une méthode de Gauss qui permet de tenir une trace des 
permutations. 
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34.17.5 Matrice de permutation élémentaire 


Définition 34.130. 

Une matrice de permutation élémentaire est une matrice obtenue en permutant deux lignes 
de la matrice identité. Nous notons F;; la matrice obtenue en inversant les lignes à et j de la 
matrice identité. 


Les autres opérations sur les lignes sont répertoriées en 4.87. 


Exemple 34.131. 


1 0 0 0 1 0 
0 1 O]—|1 0 0]=P. (34.302) 
0 0 1 0 0 1 


Lemme 34.132. 
La matrice P;; A est la matrice À avec ses lignes à et j inversées. 


Démonstration. Il suffit d'écrire 


(Pi; A)x = D (Pi5)km Ami (34.303) 


m 


et de faire trois cas selon que k = à, k = j ou k différent de à et j. Si k = à alors (P;;)im = ômj €t 
si k est différent de i et j alors (P;;)mk = Ôkm (troisième cas similaire au premier). 


Et la matrice AP,2 est la À avec ses deux premières colonnes échangées. 
. é # 
Avec ces notations, notre matrice (A[b)° est 


P2(A/b)0). (34.304) 


Puis la matrice (A[b)(1) est 
P23(A[b)0). (34.305) 


Et la matrice P qui arrive dans PA = LU est la matrice P — P23P211, qui est une matrice de 
permutations non élémentaire. Elle vaut : 


0 1 0 
P={|0 0 1|. (34.306) 
1 0 0 


LEMooYIYIooYhnaUt 
Lemme 34.133 ([728]). 
Sii,j > k alors les matrices de permutation élémentaires ont la relation de « commutation » 
suivante avec les transformations gaussiennes : 


Mrs = PR; Mall). (34.307) 


Démonstration. Il suffit de calculer les éléments de matrice : 


(PMr(x)). = (Pij)st — D Pom) mt (34.308) 
D PemTe(t)m = (Pyrelz)), = n(P5(&)), (34.309) 


parce que 4,3 > k implique que dans P;;r(x) nous inversons deux élément non nuls de r4(x), tout 
en laissant le k°élément. Le dénominateur ne change pas et il s’agit réellement d’une inversion de 
ligne. Donc 


(PMr(x)) y = (Pij)st — Tk (Pis) de: FHOOTBV on TPMeEn, 
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De l’autre côté, 


(May) Pi) 4 = (Pisst — (y) (Pet. (34.311) 
Mais comme ,j > k la k‘ligne de P;; est la même que celle de la matrice unité, donc (P;;)r = ôke. 
(Ma (y) Pis) 4 = (Pis)st — Tk(Y)sôke. (34.312) 


Cela correspond bien à (34.310). 


34.18 Méthode de Gauss avec pivot partiel (décomposition PLU) 


34.18.1 L'idée 


À chaque pas, nous faisons une permutation de ligne. Nous permutons à chaque pas la première 
ligne avec celle qui a le pivot le plus grand (en valeur absolue). Donc : 


2 1 3 11 
(Ab) = | 4 3 10 28 (34.313) 
—2 1 7 3 
Nous commençons par déplacer des lignes : 
4 3 10 28 
(A1b)09 = | 2 1 3 11|. (34.314) 
—2 1 7 3 
Les multiplicateurs sont {21 = 1/2 et 31 = —1/2. Le fait est que les multiplicateurs ont toujours le 


plus grand dénominateur possible et nous avons alors toujours 0 < |l;;| < 1, qui sont des nombres 
relativement petits, et bien représentés en mémoire. 
Nous avons la nouvelle matrice 


4 3 10 28 
(Ab) = [o 1/2 -2 -3|. (34.315) 
Ü ‘52. 1% 17 


Le pivot serait —1/2. Nous cherchons un pivot plus grand en dessous de ce —1/2 (et pas au dessus, 
sinon on casserait les zéros déjà trouvés). Nous trouvons le 5/2 qui est plus grand. Nous permutons 
donc les deux dernières lignes : 


4 3 10 28 
(AÏb)0) = [Oo 5/2 12 17 (34.316) 
O —1/2 —2 -3 


où le pivot est maintenant [32 = —1/5. La matrice suivante : 


4 3 10 28 
(Ab) = [o 5/2 12 17 (34.317) 
0 O0 2/5 2/5 


Dans ce cas, la matrice L n’est pas aussi simple à construire parce que nous avons permuté des 
choses. Dans ce cas, la matrice L est encore de la forme 


1 0 0 
L=|. 4 0 (34.318) 
1 


Mais vu que nous avons permuté les lignes 2 et 3 au deuxième pas, nous devons permuter l21 et 
l31 avant de remplir la matrice L avec les multiplicateurs : 


1 0 0 
L=|(-12 1 o|. (34.319) 
Le 11 
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Notons que ces L et U ne sont pas les mêmes que le LU obtenu sans pivot. Où est l’unicité ? 
Elle est que en fait maintenant nous n’avons pas À = LU, mais 


PA= LU (34.320) 


où P est une matrice de permutation. 


34.18.2 Le théorème 
PROPooGCPAooDrlrGu 


Proposition 34.134 (Méthode de Gauss avec pivot partiel[728]). 
Soit une matrice inversible À € M(n, ©). Il existe 


— une matrice de permutations P 
— une matrice triangulaire inférieure de diagonale unitaire E, 
— une matrice triangulaire supérieure inversible U 

telles que 


PA = EU. (34.321) 


Notons que cette proposition ne demande que l'hypothèse d’inversibilité pour À. Il n’y a pas 
d’hypothèses sur tous les mineurs comme c'était le cas avec Gauss sans pivot. 


Démonstration. Nous prouvons par récurrence qu’il existe des matrices Qx, E1,..., Ex et A} telles 
que 
E OBXW 
Q:A= E..EAy RooDEXHon Ets 
avec 


(1) Q% est une matrice de permutation 
(2) E; est une transformation gaussienne sur la 1° ligne 
(3) Az est triangulaire supérieure jusqu’à la k° colonne. 


Sachant que det(Q}) = +1, et que det(Æ;) = 1, le passage au déterminant dans (34.322) nous 
donne det(A;) # 0 et si nous notons (z(A) la matrice tronquée de À, ne gardant que les entrées 
plus grandes que k, nous avons 


k 


det(Ay) = | [(Ax)iidet (Ox1(44)). (34.323) 
i=1 


Donc : (Ag);; # 0 pour à < k et det (Qx+1(4x)) £ 0. 
Pour fixer les idées, voici une image de k = 2 : 


Ag(4) 
* * * * * 
0 * * * * 
0 0 * * * 
0 0 * * * 
0 0 * * * 
(x+1(42) (34.324) 


Étant donné que det (Qx41(4x)) # 0, parmi les nombres (Az);x+1 (à > k+1), au moins un est 
non nul et nous posons r441 tel que |(4%),,,,#+1| Soit maximum parmi ces éléments. 

Le nombre r4,1 est enregistré parce qu'il servira à écrire la matrice P plus tard. Les matrices 
FE; ne sont pas enregistrées, parce que nous verrons qu’elles vont encore changer. Seule la dernière 
sera enregistrée. 

La composante (k + 1,k + 1) de la matrice 


Preu1,k114r (34.325) 


2486 CHAPITRE 34. NUMÉRIQUE 


est non nulle et peut donc servir de pivot. Soit M411 la transformation gaussienne pour la (k + 
1)°colonne de la matrice Prys1,k+14k. La matrice 


A1 = Men Pr,k+148 FQ0oCETF OR PRES, 


est alors une matrice triangulaire supérieure jusqu’à la (k + 1)*colonne. En posant Ey41 = MS e 
nous avons 
Presk+1Ek+14x+1 = Àk, (34.327) 


et nous nous sentons en droit de récrire l'équation de départ (34.322) : 
QRA = E1...EpAr = EE... EP, k11Ek414k41. (34.328) 


Le lemme 34.133 nous permet de ramener la matrice P,,,,,4+1 en première position, quitte à 
modifier un peu (pas beaucoup) chacune des matrices E; (i = 1,...,k). C’est pour cela que nous 
n’enregistrons pas les matrices Æ;. Nous avons donc 


Preuk1QrA = Ei... ExEgs1 441 (34.329) 


où 


— Le produit P,,,. r:1Q% est encore une matrice de permutation, et mieux : elle vaut 


k+1; 


k+1 


HE (34.330) 


i=1 
Cela montre qu’il est suffisant d'enregistrer les nombres r; pour reconstituer cette partie. 
— La matrice E! est une transformation gaussienne pour la &° colonne. 
— La matrice A: est triangulaire supérieure jusqu’à la k + 1° ligne. 


La récurrence est maintenant finie et nous pouvons écrire avec k = n : 
EQooFUEUo PF 
QnA = F1... EnAn À PSS T) 


où le produit E1...Æ, est triangulaire inférieure et À, est triangulaire supérieur. 
Maintenant nous enregistrons la matrice U = AÀ,, le produit L = Le En et les nombres r; 
qui permettent de retrouver P. 


Note : dans l'équation (34.331) nous avons bien entendu massivement renommé les E! en E;. 
En réalité la matrice Æ1 vient avec n primes sur la tête. 
Dans les exemples 34.138, 34.139 et 34.140, nous allons résoudre le système 


a. 1) (a) _ (;) (34.332) 


d’abord de façon exacte, et ensuite en supposant une machine ne tenant que 8 chiffres significatifs 
en utilisant la méthode de Gauss avec ou sans pivot. 
Commençons par voir comment se passe en pratique la décomposition PA = LU de Gauss avec 
pivot partiel. 
EXooAZTDooTUXZJb 
Exemple 34.135. 
Décomposons la matrice 


(34.333) 


Sur la première colonne, le plus grand nombre est 3. Nous commençons par permuter la première 
et la troisième ligne en utilisant la matrice de permutation Pi, = P31 et nous enregistrons r1 = 3. 
Nous avons alors la matrice 


= {2 5 0]. neo JC 
1 2 3 
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Pour trouver la matrice A; nous suivons l'équation (34.326). Bien que le résultat net soit des 
combinaisons de lignes : Lo — Li — 21/3 et L3 — L3 — L:/3 (que nous pourrions savoir dès à 
présent), il est important de passer par la matrice gaussienne pour obtenir la matrice L1. 

La matrice de transformation gaussienne pour la première colonne de (34.334) est : 


1 0 0 
M = |-2/3 1 0 (34.335) 
8 0 À 


et Li = M, l| Le lemme 34.124 nous dit comment calculer facilement cet inverse : 


0 0 
LE = [2/3 1 0 (34.336) 
0 1 


l 0 0 3 8 0 3 8 0 EQooUBRPo 
A=|-56 1 01(S 5 0)=(0 18:40 Pr) 
1% 0.1) \1 33 D .—0/8. 8 
et nous avons 
Q1A = LiA; (34.338) 


où L1, A1 et r1 = 3 sont enregistrés. La matrice Q: peut être retrouvée en sachant r, parce que P 
est la matrice de permutation P,, 1. 

Nous travaillons maintenant sur la deuxième colonne de A1. Le plus grand élément en valeur 
absolue (sur ou sous la diagonale) est —2/3. Nous posons r2 = 3 et 


3 8 0 
A = (0 5/3 8 (34.339) 
0 —1/3 0 


et la matrice gaussienne pour la deuxième colonne est 

0 

0 (34.340) 
1 


L’inverse de cette matrice est facile : 


“(Li 
—2/3)). 


Le —1/2 provient du calcul —((—1/3)/( 


1 0 O0 
L=|0 1 0 (34.341) 
0 1/2 1 
et la matrice suivante à enregistrer est 
3 8 0 
A2 = M2P32A1 = MA = | O0 —2/3 3 : (34.342) 
0 (0) —3/2 


Notons toutefois que pour calculer cette matrice, seul le dernier élément demande un calcul. La 
première colonne ne change pas (par construction), la seconde gagne un zéro en dernière ligne (la 
matrice M sert à ça) et sur la dernière colonne, seule la dernière ligne est sujette à changement. 

Avec la matrice 42, la trigonalisation supérieure est faite. La décomposition n’est cependant 
pas terminée. Nous devons encore trouver la partie triangulaire inférieure. Nous en sommes à 


Q1A = LiA1 = LiP32L2A (34.343) 
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où Q; est la première matrice de permutation. 
Utilisant le lemme 34.133, il est facile de permuter Li avec P3 : 


Nous avons donc 


1 0 0 
L1P39 = P32 [1/3 1 0 (34.344) 
2/3 0 1 
L' 
Ps32Ps1A = LA (34.345) 


Deux multiplications matricielles plus tard nous terminons : 


avec 


PA = LU (34.346) 
00 3 8 0 
1/3 1 O0, U=A2=|0 -2/3 3 (34.347) 
oi 1 À D 0 85 
A 


Notons que Sage utilise la méthode de Gauss avec pivots : 


sage: A=matrix([ [1,2,3]1,[2,5,0]1,[13,8,0] ]) 


sage: À 


| [1 2 3] 


[2 5 0] 


51 [3 8 0] 
s'sage: A.LU() 


( 

[Oo 1 0] [ 1 0 
[Oo O 1] [1/3 1 
[1 O O1, [2/3 1/2 
) 


0] 
0] 
11; 


C 3 8 0] 
C 0 -2/3 3] 
[ 0 D, =5/21 


tex/sage/sageSnip006.sage 


Mais attention : Sage crée une décomposition À = PLU et non PA = LU. D'où le fait que la 
matrice de permutations de Sage est l’inverse de celle donnée ici. 


34.18.3 D'un point de vue algorithmique 


ii Avertissement /question à la lectrice !! 34.136 
Je ne suis pas certain de l’optimalité de ce que je raconte ici. Je décris simplement ce que j'ai fait 
pour écrire mon programme finitediff. 

Si vous êtes expert en calcul numérique, n'hésitez pas à donner votre avis. 


Nous décrivons à présent la décomposition À = PLU (du théorème 34.134, avec le P à droite). 
En suivant l'exemple 34.135 nous voyons assez bien comment créer les matrices U et P au fur et 
à mesure. La construction de L est peut-être moins évidente. 


Ecrivons un exemple très explicite pour 


À à 
A=|4 3 10]. (34.348) 
= 4 ÿ 
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Nous commençons par permuter des lignes pour avoir un grand pivot : 


4 3 10 
PoA=|2 1 3. (34.349) 
= À 7 


Et nous effectuons l'élimination avec la matrice 


1 0 O0 
M = |-12 1 0 |. (34.350) 
d3.0. à 
Cela donne le premier résultat : 
: 0 EQooKTBL 
MiPwoA= [0 —1/2 -2 SOKTBLORHeQEET 
Ù E7 


Nous continuons avec P:3 pour avoir un nouveau grand pivot : 


4 3 10 
PabPsA=|0 5% (34.352) 
D: 12 5 
Nous utilisons la matrice 
1 O0 0 
M=10 1 0 (34.353) 
D.1/5: 1 
et au final : 
4 3 10 
MoP23MiP,2A = |0 5/2 12 | =U. (34.354) 
0 O0 2/5 
L'égalité obtenue est 
Mo P33M Po A = U. (34.355) 


Pour avoir la décomposition PLU il faut écrire 
E WKUY 
A = PyoMy P3 M5, ROONRETERLEBEE) 
et permuter P23 avec MT 1, ce qui est facile par le lemme 34.133. 


Remarque 34.137. 
Nous ne devons permuter la matrice My avec une matrice de permutations qu’à partir de la 
deuxième étape. En effet l'équation (34.351) revient à 


A = M; !Pyomu (34.357) 


qui est dans le bon ordre. Ce n’est qu’à partir de la seconde étape que des matrices de permutations 
apparaissent à droite des matrices gaussiennes. 


Cependant dans un cas 4 x 4, cette méthode deviendrait fastidieuse parce que nous aurions 
encore des étapes à faire. En repartant de (34.356), mais avec my (la matrice pas encore tout à 
fait triangularisée) au lieu de U, nous aurons, pour un certain k > 3 : 


M3 P3k M P23 Mi P12A = U, (34.358) 


ce qui fait : 
A = PyoM5  Po3 M5 Par M3 U. (34.359) 
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Tous les P;; peuvent être mis à gauche parce que leurs indices sont toujours strictement supérieurs 
à ceux des M, placés devant eux. Mais c’est fastidieux. 
Nous allons donc permuter à chaque étape pour ne retenir que l'important. Si à une certaine 
étape nous avons 
A2 Pia ce Pia MS ME ME (34.360) 


avec 
Mo = Pia 0 (34.361) 


alors nous allons directement permuter P;41,,,, avec tous les Mo. Si nous notons P, la permu- 
tation (pas élémentaire) à l'étape k et Ly la matrice triangulaire inférieure à de l’étape k, 


A = Plimu = PilPhtiness Me My (34.362) 


Nous enregistrons alors Px}1 = PrPy117,,, et pour Lx,1 nous partons de Lx et nous faisons deux 
opérations suivantes : 


— nous permutons, sur ses colonnes non triviales, les indices k + 1 et rx41, 


SES =] 
— nous multiplions par M,,;, 


Notons que rx:1 > k + 1, de telle sorte que sur les colonnes non triviales (qui sont jusqu’au 
numéro k), la permutation des lignes k + 1 et rx41 ne change pas l’aspect de la matrice : elle reste 
multi-gaussienne de dernière colonne k. 


ce qui revient à simplement lui ajouter une colonne non triviale. 


34.18.4 Exemples 


Nous nous lançons dans la résolution du système 


10% TN fr 1 
pos 1)fa)() _. 
ExooNTECooXvTcoh 
Exemple 34.138. 
Nous commençons de façon exacte, par la méthode de Gauss sans pivot. La première transformation 


gaussienne est 
1 0 
FE = ar à (34.364) 


É: “ON 10.1 10 1 
A ar 1) ( dl 1) - ( 0 ns (200) 


Vu que cette dernière est triangulaire supérieure, nous avons fini la méthode de Gauss et U = FA. 


et nous calculons 


En ce qui concerne la matrice L, elle est donnée par L = E;, L c’est-à-dire 


—1 
1 0 1 0 
Le ( ie 1 = (ee 1): (34.366) 


Au final nous avons la décomposition À = LU exacte suivante : 


1 O0 10° 1 
Le (is 1) u= à AR (34.367) 


Résoudre le système Ax — b revient à résoudre LUx = b et donc résoudre successivement les 
systèmes 


Ly =b (34.368a) 
Dr (34.368b) 


CHIC sm 


D'abord le système 
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donne y = 1 et y2 = 2 — 10°. 
Ensuite nous résolvons 


107 1 x 1 
( 0 1 1) (1) . (, - ” 62870) 
10° 
a) {Ti | L (1 34.371 
G)- (47) 0: 


C’est également le résultat que trouve Sage : 


Cela donne 


sage: var(’y’) 
M 


:|sage: solve( C10%xx(-9) xx+y==1,x+y==2] ,[x,y] ) 


[C[x == (1000000000/999999999), y == (999999998/999999999)1]] 


tex/sage/sageSnip007.sage 


A 
EXooNVRNooJgQmQc 
Exemple 34.139 ([728]). 
Nous recommençons tout le calcul avec une précision limitée à 8 chiffres significatifs, sans pivot. 
Nous avons à nouveau la transformation gaussienne 


1 0 
E = (Los 1 (34.372) 


mais pour calculer U nous effectuons le produit matriciel 


1  O0\/10 ? 1 10 Î 
U=B4= (_j60 nt i à = ( . à). (34.373) 


Nous détaillons à présent le calcul de l'élément noté +. Le calcul de 10° © 1 donne 
999999999 = 9.99999999 x 105, (34.374) 


mais la précision étant limitée à 8 chiffres, un arrondi arrive. Étant donné que le premier chiffres 
supprimé est un 9 nous retombons sur 10°, et donc notre machine à précision limitée donnera 


9 
D = e . (34.375) 


Ensuite le calcul de L = E, l ne cause pas de problèmes : 


L= er 1) . (34.376) 


Maintenant il s’agit de résoudre les systèmes Ly = b et Ux = y. Du système 


CHIC sum 


nous tirons tout de suite y1 = 1 et ensuite 10° + y2 = 2, c'est-à-dire y2 = 2 — 10°, qui en précision 
limitée donne encore y = —10°. À résoudre maintenant : 


eu 1) _ = en : (34.378) 
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Cela donne immédiatement 22 = 1 et ensuite 


10 x +1=1, (34.379) 
donc æ1 = (0. La solution trouvée est 
z1\ {0 EQooBGNEORYRS La 
T2 _ 1/° ° 
qui est complètement faux au niveau de la première variable. PA 
EXooNCRSooTfmPFr 


Exemple 34.140 ([728)). 
Nous résolvons encore le même système en précision limitée, mais en utilisant cette fois la méthode 
de Gauss avec pivot partiel. 

Le plus grand élément de la première colonne est 1 ; nous utilisons donc la permutation P 2 : 


1 l 
P.2A = (os ) ; (34.381) 
La matrice de transformation gaussienne pour la première colonne de cette matrice est 
1 0 
M = (io : (34.382) 
et nous posons 


t ON 4, 4 1 1 1 1 
Ai = MfizA = ee 1) o-e 1) _ È —1079 + ) _ (6 1) Re 


où un arrondi a eu lieu pour —107° + 1 = 1. En inversant M1 nous avons 


1 O0 
— = 
Li = M, = os 1) ; (34.384) 
La décomposition est 
O0 I 1 0 1 1 
ou È j) (os 1) È 1) (256) 
En LE 
P D U 
Le moment de résoudre est venu. Vu que PLU x = b nous devons résoudre les systèmes 
Pz=b (34.386a) 
Ly = z (34.386b) 
Ux=Y. (34.386c) 


Pour z c’est facile : 


= () (34.387) 


de 1) U) a () (34.388) 


Tout de suite : y1 = 2 et ensuite 2 x 107% + y = 1, ce qui donne y = 1©2 x 10° = 1. Donc 


= () (34.389) 


1) ()-() qua 


Nous avons z2 = 1 et ensuite æ1 + 1 = 2 c’est-à-dire æ1 = 1. Au final la solution trouvée est 


— () (34.391) 


Cette solution est considérablement meilleure que (34.380). A 


Pour y il y a un arrondi : 


Et enfin pour x c’est le système 
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34.141. 

L'utilisation du pivot non seulement assure le fait que la trigonalisation va bien se passer (on évite 
les zéros en pivot), mais aussi et surtout, en choisissant de prendre le plus grand pivot possible, 
nous obtenons une meilleur stabilité numérique. 


34.19 Résolution de systèmes linéaires (suite) 


34.19.1 Déterminant 


Pour calculer un déterminant lorsque nous avons la décomposition À = LU nous pouvons faire 
det(A) = det(LU) = det(L) det(U) = det{U) (34.392) 


parce que L est triangulaire avec des 1 sur la diagonale. 
Si par contre nous avons fait des pivots, nous avons PA = LU. Il nous faut le déterminant de 
P, qui n’est autre que +1. Nous avons 


det(P) = (—1)° (34.393) 


où s est le nombre de permutations effectives effectuées. Nous précisons « effectives » parce qu’il 
ne faut pas compter le pas où nous n’avons pas permuté (les cas où le bon pivot était présent du 


premier coup). Nous avons alors 
det(A) = (—1)° det(U). (34.394) 


34.19.2 Plusieurs termes indépendants 


Mettons un système Ax = b qu’il faut résoudre pour plusieurs b différents. C’est typiquement 
le cas où l’on voudrait calculer l'inverse de À. Mais on va directement se calmer. Soient donc à 
résoudre Ax; = b1,..., Aïn = by. 

Les opérations (avec ou sans pivot) que nous faisons ne dépendent que de la matrice À, mais 
aucune décision concernant les pivots ou la matrice des multiplicateurs ne dépend de b. Autre façon 
de dire : si le système (A]b1) devient (U|y1), le système (A[b;) devient (U|y;) avec le même U. 

Nous ne sommes donc pas obligés de faire tout le travail autant de fois qu’il n’y a de systèmes 
à résoudre. Donc si on a plusieurs systèmes à résoudre avec la même matrice, on fait mieux de 
retenir une fois pour toute la décomposition LU (avec ou sans pivots), avant de vraiment résoudre. 

Ou alors on peut aussi faire que, au lieu de faire (A{b;) plein de fois, faire une seule fois 


(AÏb: bn). (34.395) 


Et on fait tout le travail sur tous les vecteurs d’un en même temps. 
Soit e; la base canonique. Si nous notons x, les solutions des problèmes Ax; = e;, tous les 
problèmes Ax; = e; s’écrivent d’un seul coup 


AX =Y (34.396) 
où À est la matrice des x; en colonnes, et Y est celle des e; en colonnes. Oh, mais Y — 1 
évidemment. Donc 

AX = I. (34.397) 


Si nous supposons que À est inversible, alors ce X est l’inverse. 

Donc pour calculer l’inverse d’une matrice de dimension non trop grande, il suffit d’utiliser la 
méthode de Gauss sur les vecteurs de la base canonique. Cette idée est la base du calcul de l’inverse 
par matrice companion. En effet, si nous partons du problème 


(A|1) (34.398) 
et nous appliquons la méthode de Gauss avec pivot, nous arrivons à 


(LE EP): (34.399) 
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Attention : le produit L-!P est une permutation des colonnes de L-!. Vu que L est triangulaire 
inférieure avec des 1 sur la diagonale, L-! est triangulaire inférieure avec des 1 sur la diagonale. 
Donc si la matrice n’est pas trop grande, on peut assez facilement remettre les colonnes de L-1P 
dans l’ordre pour recomposer une matrice triangulaire inférieure avec 1 sur la diagonale. 

Une autre façon de calculer l’inverse, si À = LU est connue, il suffit de faire 


ATt=uU IL 1 (34.400) 


Et il existe un algorithme facile pour l'inverse d’une matrice triangulaire. 


34.19.3 Cholesky 


La méthode de Gauss s'applique sans hypothèses sur la matrice À, à part qu’elle doit être 
de petite dimension, comme pour toute méthode directe. Souvent nous savons des choses sur la 
matrice. Ici nous allons supposer que À est symétrique et définie positive. 

Comment numériquement vérifier ces hypothèses ? En ce qui concerne la symétrie, il suffit de 
faire le test complet : 

AF = A, (34.401) 


La vérification de cela coûte au maximum n? comparaisons (et en fait la moitié de ça moins la 
diagonale). 

Le fait que À soit définie positive est facile à vérifier pour utiliser Cholesky parce que il suffit 
de le faire, et si il n’y a pas de nombres complexes qui arrivent, c’est que la matrice était définie 
positive. 

Un lemme très simple à mettre en oeuvre numériquement nous permet de traiter certains cas. 


Lemme 34.142. 
Une matrice symétrique possédant un élément négatif sur la diagonale n’est pas définie positive. 


Démonstration. Un simple calcul ou effort d'imagination montre que {Mez, ex) = Myx. Donc si 
M doit être définie positive, Myx doit être positive par le lemme 9.228. 


Ce lemme est un moyen déjà de faire quelques vérifications. Et si les éléments diagonaux de A 


sont tous négatifs, on peut prendre — À. 
LEMooVEIYooZbShQb 


Lemme 34.145. 
Si À est une matrice symétrique strictement définie positive, alors pour tout k, la matrice tronquée 
Ag(A) l’est également. 


Démonstration. Le fait que Ax(A) soit symétrique est évident. Le fait qu’elle soit définie positive 
l'est moins. Soit y e RŸ et le vecteur ry € R”, qui est « complété » avec des zéros. 
Nous avons (A4(A)y, y}x = ATY, TYÿn. En effet 


(Ak(A)y, y) = S hu (34.402) 
i=11=1 


Et à droite : 


k 


n k n k k 
QAryry) = D (Aryhi(ry): = D (ATy)iu = x À? a(Tyhiyi = D D Aug: (34.403) 
i=1i=1 i=11=1 


i=1 i=1 


où nous avons utilisé le fait que (Try); = 0 dès que à > k et que (Ty); = y; sinon. 
En conséquence de quoi {Ag(A)y, u) > 0 pour tout y € RÂ et la matrice Ag(A) est strictement 
définie positive. 


LEMooLBQLoo!IYvacH 
Lemme 34.144. 
Si T est une matrice triangulaire, alors (T5)! = (T-1);. 
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Démonstration. Il suffit de se rendre compte que le coefficient ii de l'égalité 1 = TT! donne 


Le Te (34.404) 
l 


Dans la somme il ne reste que le terme ! = 1. 


Nous allons chercher une décomposition de type LU sous la forme À = LL!, c’est-à-dire U = L'. 
Attention : maintenant nous n’avons plus des 1 sur la diagonale. Ce n’est donc pas exactement la 
décomposition LU dont nous parlions plus haut. C’est pour cela que nous n’allons pas la noter 
LLt mais BB!. 


Théorème 34.145 (Cholesky[727]). 
Soit une matrice réelle symétrique strictement définie positive. Il existe une unique matrice réelle 
B telle que 


— B est triangulaire inférieure, 
— la diagonale de B est positive, 
— À = BBf, 


Démonstration. Par la décomposition LU du théorème 34.126 nous avons des matrices L et U 
telles que À = LU. Soit D la matrice diagonale donnée par 


Di = VU. (34.405) 


Cette définition fonctionne parce que U;; > 0. En effet nous savons que Ax(A) = Ag(L)AZ(U), et 
en passant au déterminant, 


det (Ax(A)) = det (A&(U)). (34.406) 


Vu que A;(A) est strictement définie positive par le lemme 34.143, son determinant est strictement 
positif? et nous avons 
det (AZ(U)) > 0. (34.407) 


En appliquant cela à £ = 1 nous avons U;1 > 0 puis de proche en proche, U;i > 0 pour tout 1. 
Nous posons : 


B = LD qui est triangulaire inférieure (34.408a) 
C= DU qui est triangulaire supérieure. (34.408b) 


Nous avons bien entendu À = BC et nous allons prouver que C = Bt. Vu que À = A nous 
pouvons identifier BC et C'Bt : 
BC = CB. (34.409) 


En mettant les matrices triangulaires supérieures à gauche et inférieures à droite : 
c(B!) ! =B ct, (34.410) 
qui sont donc deux matrices diagonales. Nous montrons que cette diagonale est en réalité l’identité. 


D'abord ; 
Bi = LaDi = Li WU = VU (34.411) 


i=1 


parce que L;; = 1. Notons en passant que la diagonale de B est positive. Ensuite 


- 
Ci = DD han = (Di = ü Uii = VU. (34.412) 
it 


22. Le théorème 9.221 donne une diagonalisation par des matrices de déterminant 1. Vu que les valeurs propres 
forment sur la diagonale, et qu’elles sont toutes positives, el déterminant est positif. 


2496 CHAPITRE 34. NUMÉRIQUE 


Donc B et C ont des diagonales égales. Calculons alors la diagonale de B-!C : 
(EC) = JE ou ee (34.413) 
I 


parce que encore une fois, de la somme il ne reste que le terme ! = à. 
Mais B est une matrice triangulaire qui tombe sous le coup du lemme 34.144. Donc (B°1);; = 
(Bi)! = (C5)! Nous avons alors 
(BOL (34.414) 
Cela conclut l’existence de la décomposition de Cholesky. 
En ce qui concerne l’unicité, soient À = BBî = CC. Nous regroupons les supérieures et les 


inférieures : 
Bt(Ct)-1 = BIC. FAGOR ER 


Ces deux matrices sont donc diagonales et nous posons D = B71C, c’est-à-dire C = BD. Nous 
remplaçons donc C par BD dans (34.415) : 


A = BB! = BD(BD)' = BDD'B!. (34.416) 


Donc DD* = 1, ce qui signifie que les éléments diagonaux de D sont +1. Nous montrons qu'ils 
sont positifs : à partir de © = BD nous déballons 


Où = D BaDu, (34.417) 
l 


et donc 
BiDi = Ci. (34.418) 


En sachant que les conditions de la décomposition de Cholesky demandent les éléments diagonaux 
positifs nous en déduisons que D;; est positif et donc égal à 1. Finalement D = 1 et B = C. 


Prenons la matrice 


4 2 —2 
A=|2 10 -7 (34.419) 
—2 —7 9 
EQooFMWUooFdTgiF 


Elle est symétrique et définie positive. Nous posons | 
{ li — 4/4@11 (34.420a) 


li = @i1/l11 (34.420b) 


. 00JTVGooEkynpH 
pour i=2,...,n. Et aussi “ di 


(ajj — D Er (34.421a) 


Lij = (ai; — >» leljn)/aj; (34.421b) 


pouri=j+1,...,n 
Les formules (34.420) nous disent comment remplir la première colonne. Cela donne la matrice 


V4 =2 
L= | 2/2=1 .. (34.422) 
—2/2 = 1 


Les formules (34.421) donnent les autres colonnes en fonction des précédentes. 
Dans Sage : 


H 
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sage: A=matrix( [ [4,2,-21,12,10,-71,[-2,-7,9] ] à 
sage: A 


3 [ 4 2 -2] 

L 2 10 =7] 

NES #7 <4] 

sage: A.cholesky() 
[ 2 O0 0] 

[ 1 3 0] 

Lei <& 2 


tex/sage/sageSnip005.sage 


34.20 Système linéaire (méthodes itératives) 


Nous trouvons des méthodes itératives lorsque les matrices sont grandes, ce qui arrive lorsque 
l’on discrétise une équation différentielle. 

Nous allons chercher des méthodes de la forme 7,11 = Bxn + q; ce sont des méthodes station- 
naires. La convergence d’une méthode est toujours liée à la matrice B et en général, la convergence 
ne dépend pas du choix du vecteur initial. Nous faisons donc souvent x9 = 0 et donc x1 = q. Voilà 
donc une itération de faite gratuitement. 

Nous notons ex le vecteur d’erreur qui est défini par ex; = x — x4. Et le vecteur résidu 
rr = q — Bzxy. Attention : ici k n’est pas un indice mais un numéro de vecteur. 

Notons que si x est solution, alors q — Bx = 0, ce qui motive le vecteur résidu. 

Les conditions d’arrêt d’un algorithme seraient 


lexlloo < €1 (34.423a) 
Irklloo < €2 (34.423b) 


où €1 et € sont des précisions décidées à l’avance par l'utilisateur. 


Proposition 34.146. 
Si À est une matrice inversible, alors 


lim ex = lim rg = 0. (34.424) 
k— 00 k—00 


Vu que rx = Aey, si la matrice À est mal conditionnée, il peut arriver que r4 reste grand alors 
que ex est déjà petit. 


Remarque 34.147. 
Dans les méthode stationnaires, nous avons zh11 = Bx, + q avec B et q fixés au départ de 
l’algorithme. Il existe des méthodes non stationnaires pour lesquelles l’itération prend la forme 
Tn+1 = Bnn + Gn avec By et Qn qui changement avec les étapes. 
PROPooAQSWooSTXDCO 

Proposition 34.148. 
Pour la méthode xn11 = Bxn + q nous avons équivalence de 

(1) La méthode converge pour tout xo 

(2) B est une matrice convergente ?* 

(3) p(B) < 1 (rayon spectral). 


De plus si |B| < 1 alors la méthode converge (quelle que soit la norme algébrique). 


La norme d’une matrice (en tout cas, certaines normes) est quelque chose de facile à calculer 
à l'ordinateur. Typiquement |.|. est un simple maximum. Cependant si après avoir calculé |B|; 
pour des dizaines de normes : différentes, nous avons toujours |B|; > 1, alors nous ne pouvons 
rien conclure. 


23. C'est-à-dire limy_, B° = 0. 
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34.20.1 La méthode générale 


Nous décomposons la matrice À sous la forme À = M — N avec M inversible. Le système 
Ax = b devient 
Mz-Nz=b (34.425) 


puis Mx = Nx + b et finalement 
z= M Nxz+M , (34.426) 


et voilà une méthode stationnaire avec B = MIN et q = Mb. 

Mais ici nous voyons que M doit être non seulement inversible, mais en plus doit être facile- 
ment calculable. En sachant que nous travaillons avec des grandes matrices, il n’est pas question 
d’inverser M avec une méthode de Gauss. 

En bref, il faut choisir M triangulaire parce que c’est en gros la seule que nous pouvons inverser 
facilement ?*. 


Remarque 34.149. 
La matrice B ne doit pas spécialement être inversible. Si elle ne l’est pas, ce n’est pas un problème. 


34.20.2 Jacobi 


Nous décomposons 
A=D-E-F Eneo0C oups 


où D est la diagonale de À, —F est la partie triangulaire supérieure (sans la diagonale) et —E 
la triangulaire inférieure (sans la diagonale). Donc D, E et F sont simplement des extractions de 
parties de la matrice À (et quelques changements de signes). 

La méthode de Jacobi prend M = Det N =(E+F). L’inverse de M est facile à calculer parce 
que M est diagonale. Nous notons B 7 la matrice B de la méthode de Jacobi. 


Remarque 34.150. 

Il se peut que la matrice À ait des zéros sur la diagonale, même si elle est inversible. Et cela est 
un problème parce qu’alors la matrice D ici construite n’est pas inversible. Dans ce cas, avant de 
nous lancer dans la méthode de Jacobi, il faut permuter deux lignes de À et donc de b. 

Attention cependant que l’on pourrait vouloir effectuer ces permutations en mettant sur la 
diagonale des nombres les plus grands possibles (parce qu’ensuite, ce qui rentre dans les calculs, 
c’est D! qui aura alors des petits nombres). Mais il faut toutefois faire en sorte que le rayon 
spectral de la matrice B résultante reste plus petit que 1. 

Chaque changement dans À induit des changements dans B et donc sur la convergence de la 
méthode. 


34.20.3 Gauss-Seidel 


Nous partons de la même décomposition À = D — E — F que dans (34.427). La méthode de 
Gauss-Seidel prend M=(D-E)et N=F. 


34.20.4 Autres 


Voir la méthode des gradients, et des gradients conjugués. 


34.21 Indices connectés, matrice irréductible 


Définition 34.151. 
Soit AE M{n,R) eti,je {1,...,n}. Nous disons que les indices i et j sont directement connec- 
tés si À;; Z£ 0 où As Æ£ 0. 


24. Les matrices orthogonales sont aussi facilement inversibles, mais ne se prêtent pas bien à une décomposition 
de type somme. 
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DEFooADAAooAAMscc 
Définition 34.152. 
Soit AE M(n,R) eti,je{1,...,n}. Nous disons que les indices à et j sont connectés si il existe 
un ensemble d'indices ig = i,1,...,4r_1, = j tels que À;,:,,, Æ 0 pour tout 0 <k<r. 


Par exemple pour que les indices 1 et 4 soient connectés, on peut avoir les éléments A13, A32 


A4 non nuls. 
DEFooXIREooQt1zk0 


Définition 34.153 ([729]). 
Une matrice carrée À est réductible si il existe une permutation © telle que 


no  — é EQooGGZKoepyXS 


0 M 
où K et M sont carrées. 
Notons que par définition de la matrice d’une application linéaire, 


B;; —= ei, Be;} —= (es o'Ace;) — (oei, Ace;j) —= At) ati: (34.429) 
PROPooZTYDooZAxQxF 

Proposition 34.154 ([729]). 
Soit une matrice carrée A. Les faits suivants sont équivalents : ITEMooYULAooVagOnt 


(1) A est réductible. ITEMooNLVXo0YSQKwO 


(2) Il existe une partition non triviale I, J de {1,...,n} telle que IL J={1,...,n}, 1nJ=G 


et pour tout ie I, et pour tout je J, À;; = 0. ITEMooUNOHOoRUNpuG 


(3) La matrice À admet des indices non connectés (définition 34.152). 


Démonstration. Dans plusieurs sens... 


(1) (1) implique (2) 
Nous notons j* la taille de la matrice X dans (34.428). Nous avons B;; = 0 si 


eo (34.430a) 
legs. (34.430b) 
Donc en posant 7 = o{j*+1,...,n} et J = o{1,...,3j*} nous avons une partition non triviale 


de {1,...,n} telle que siie I et j € J alors à = o(io), j = o(jo) et 


Àij = At) atie) = Bi = (. (34.431) 

(2) (2) implique (1) Soit une partition 7,7 comme indiquée dans l'hypothèse. Soit 7* le 

nombre d’éléments dans J. Soit o une permutation de {1,...,n} telle que o{j*+1,...,n} = 71 

et a{1,...,3*} = J. Nous posons ensuite B = ot Aa. Par construction si à € I et j € J alors 
À;j = (. 
Mais si 

J'AI Sn (34.432a) 

17e. (34.432b) 


alors B;;j = A,(5(;) = 0. Donc B a la bonne forme. 


o(j 

(3) (3) implique (2) 
Soient à et j deux indices non connectés : il n’existe pas de chaines partant de à et arrivant 
à 7. Nous notons 1 l’ensemble des indices connectés à à, et J les autres. Pat hypothèses ces 
ensembles sont non vides. 


Sikeletle J alors Ay = 0 parce que sinon on aurait une chaine de à à k puis de k à let 
donc de à à /, ce qui signifierait que / est connecté à 1. 
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(4) (2) implique (3) Soit une partition 7,7 comme dans l’hypothèse. Si j € J est connecté à 
ie I alors il existe une chaine 


ü = ip, ü1.. 7 = 3. (34.433) 


Si i, est le premier dans J alors 4-1 € I et A5, , i, = 0, ce qui empêche la chaine de connecter 
jài. 


34.22 Localisation des valeurs propres 


Sur l’ensemble M(n, R) des matrices n x n à coefficients réels nous introduisons l’ordre partiel ?° 
donné par À > B lorsque À;; > B;; pour tout à et j. Nous définissons de façon similaire les relations 
A<B,A<Bet A>B. 

Si x € R" nous notons || = (|x1l,...,|æ|) et & < y lorsque x; < y; pour tout 1. 

PROPooGVRVooZEvKcn 
Proposition 34.155. 


?. nm 
Soit AE M(n,R) et x,ye R. ITEMooXQUPooPVLjFh 


(1) SiA>0 et six < y alors Ar < Ay. ITEMooQLCJo0KTbus 


(2) Si À > 0 alors Ax < |[Ax| < Afx|. 


Démonstration. Pour la première inégalité, pour tout à et k nous avons Ayxx < Ayyr et donc 


(Az)i = D Apr < D Aixyx = (Ayr. (34.434) 
k k 


Pour la seconde, d’abord l'inégalité Ar < |Ax| est évidente. Ensuite vu que A;x > 0 nous avons 


Ali = |S Apte] < D Aixlze] = (Alz|).. (34.435) 
k k 


Soit une matrice À € M(n,R). Nous notons 


PAS » lAi|. (34.436) 
JA 


Notons la somme sur la ligne À, pas sur la colonne : la somme est horizontale. 


Définition 34.156. 
Les ensembles 
D; = {2e C tel que |z — Al < ri} (34.437) 


sont les disques de Gershgorin. Nous allons également noter B; = Int(D;) les boules ouvertes 


correspondantes. 
THOooUJNFooHpvCCF 


Théorème 34.157 (Gershgorin). 
Soit AE M(n,R). Si 1e C est valeur propre de À alors À € D; pour un certain i. 


Démonstration. Soit une valeur propre À et un de ses vecteurs propres u € R” : Au — Àu avec 
u # 0. Soit à un indice réalisant le maximum [u;| = max{|uz|};. Nous écrivons la ‘ligne de 
Au = ]u : 
D Aux — AU;, (34.438) 
k 


25. Définition 1.12. 
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c’est-à-dire Aj;u; + De Ajxuy = Àu;, Où encore 


A+ D Ag = (34.439) 
ki de 
qui donne 
u 
| Ai — À] < D Au = … | Aix | (34.440) 
ki KL $z 


parce que |u;| > [ux|. Notons que sur la ligne précédente, |.| est le module dans C, pas la valeur 
absolue dans R. 


THOo0TXAPooQqsBC;j 
Théorème 34.158 (Gershgorin 2[729]). 
Soit une matrice irréductible A € M{(n,R) et une valeur propre À de A. Si elle est sur la frontière 
de l’union des disques de Gershgorin, alors elle est sur le bord de tous les disques. 


Démonstration. Soit une valeur propre À de À telle que À € o( LL D}: Alors À n’est dans l’intérieur 
d'aucune boule et nous avons |À — 4;;| > r; pour tout i. 

Soit un vecteur propre u de À tel que |u|,x = 1. Nous posons 1 = {1 < à < n tel que [u;| = 1} 
et J = {1 < j < n tel que |u;| < 1}. Par hypothèse Z n’est pas vide, et de plus 1 n J = Get 
TO J = {1,...,n} parce qu'aucune composante de u n’a un module ? plus grand que 1. 

La i*’composante de la relation Au = Àu peut s'écrire 


(A — Àjü; + » Aug = 0. (34.441) 
ki 


Forts de cela nous écrivons les inégalités suivantes : 


re & À — Al = | — Aiju] = | D Aiuel < D lAixlluel < D Aixl = ri. (34.442) 
k#i kzi ki 
Donc les inégalités sont des égalités : 


ri = [À — Au = [OX — Aijuil = | D Aux] = D Auelluel = D JAixl. FE RTE 


kzi kzi kzi 


En particulier l'égalité ©; | Aixllux| = 4, |Aixl donne 
S_ lAixl(lux| — 1) = 0. (34.444) 
ki 


Donc pour tout k € J nous avons À;4 = 0. Vu que À est irréductible, cela donnerait une partition 
impossible {1,...,n} = 1 U J. Nous en déduisons que J est vide et donc que |[u;| = 1 pour tout j. 
En repartant de (31.443) nous avons alors 


re = [OO — Aijui) = JA — Aüllui) = JA — Al. (34.445) 
Cela prouve que À € 0D,; pour tout 1. 
EXooUKQIooQqteHx 
Exemple 34.159. 
Soit la matrice 
2 O0 1 
B=|.0. 1 A42%|. (34.446) 
—1 0 3 


D'abord nous rappelons que si vous voulez entrer cette matrice dans Sage (ou plus généralement 
dans Python? ?’), vous devez faire attention au 1/2 qui, tel quel, est évalué à 0. Nous vous rappelons 
donc que tous vos codes Sage doivent commencer par ceci : 


26. Les composantes de u sont à priori dans ©, et non spécialement dans IR, même si À est une matrice réelle. 
27. Que vous n’avez aucune raison d'utiliser autre que Sage. 
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1l# -*+*- coding: utf8 -*- 
from __future__ import unicode_literals 


3\from __future __ import division 


tex/sage/sageSnip015.sage 


Les éléments non nuls hors diagonale sont B13, B31 et B23. Elle n’est donc pas irréductible : 
nous avons par exemple la partition 1 = {1,3}, J = {2} pour le critère de la proposition 34.154(2). 
Les disques de Gershgorin sont 


D: = {2e C tel que |z—-2| <1} (34.447a) 
D: = {2e C tel que |z — 1] < 1/2} (34.447b) 
D3 = {2e C tel que |z —-3| < 1} (34.447c) 


Les valeurs propres de la matrice sont sur des bords de disques de Gershgorin, sans être sur tous 
les bords, comme ça aurait été le cas par le théorème 34.158 si la matrice avait été irréductible. 
Elles sont sur la figure 34.1 ; notez en particulier les valeurs propres À2 et À3 qui sont sur le bord 
de deux disques mais pas sur le bord des trois disques en même temps. 


À 


1 A2 


X 


—1+ x 


FIGURE 34.1: Les disques de Gershgorin et les valeurs propres pour sara phtrkb 3 RHgO Ci 


A 
EXooDQYDooPxqH;jz 
Exemple 34.160. 
Soit la matrice 
0 —-1 0 
A= 0 ia. (34.448) 
3. 0 2 
Nous avons 
D; = {2e C tel que |z] < 1}, (34.449a) 
D2 = {2e C tel que |z— 1| < 2}, (34.449b) 
D3 = {2e C tel que |z — 2] < 3}, (34.449c) 
Le polynôme caractéristique est 
XX) = —X$ + 3X2 — 22 — 6. (34.450) 
Une fois remarqué que À1 = —1 est une racine, les autres sont faciles à trouver (division euclidienne 


de x(À) par À+1):12=2+iV2 et À3 = 2 — 52. 

La matrice À est irréductible. En effet les éléments non diagonaux non nuls sont A2, A3 et 
A31. Is peuvent former une chaine reliant tous les indices entre eux. 

Les contraintes sur la localisation des valeurs propres est donc qu’elles doivent être dans ou 
sur les disques de Gershgorin, mais que celles qui sont sur le bord d’un disque doivent être sur le 
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FIGURE 34.2: Les disques de Gershgorin et les valeurs propres poux Lrseraphnakbd66t ff Lxd 


bord de tous les disques en même temps. C’est cela que nous observons sur la figure 34.2. Notez 
en particulier la position de la valeur propre À. 


a 
34.22.1 Matrices à diagonale dominante 
DEFooLSUTooHuXabV 
Définition 34.161 ([730, 729]). 
La matrice À € M(n,K) est à diagonale dominante si pour tout 1, 
» lis] < | Al (34.451) 


JA 


où |.| est la module dans © ou la valeur absolue dans R. 
Elle est à diagonale fortement dominante si elle est à diagonale dominante et si il existe 
un à tel que 


> lAisl < |A]. (34.452) 
Ai 


Elle est à diagonale strictement dominante si 


> [Al < Ai ERooUENLoR EE 


Ai 
pour tout à (entier entre 1 et n). 
Nous avons les inclusions suivantes : 
strictement dominante € fortement dominante € dominante. (34.454) 


LEMooMQAEooUCKkQxU 
Lemme 34.162. 
Si À est dans un des deux cas suivant : 


— diagonale strictement dominante, 
— diagonale dominante et irréductible ?? 


alors À;; Æ O0 pour tout 1. 


28. Définition 34.153. 
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Démonstration. Si A est à diagonale strictement dominante, alors l'inégalité stricte (34.453) n’est 
pas possible. 
Si À est à diagonale dominante, alors si 4;; = 0, toute la ligne est nulle. Dans ce cas, la matrice 


ne peut pas être irréductible. 


Proposition 34.163 ([730]). 
Une matrice à diagonale strictement dominante est inversible. 


Démonstration. Soit une matrice À à diagonale strictement dominante. Soit x tel que Ax = 0. Le 
but est de montrer que x = 0. Soit un indice io réalisant la norme maximum : 


és] = 16100: (34.455) 
Nous écrivons la composante à de l'égalité Ax = 0 : 


D Aioktk = 0, (34.456) 
k 


et nous séparons le terme # = 0 des autres : 


>, AiokTk + Aioio Lio = 0. (34.457) 
kÆio 


Nous prenons le module et majorons les sommes : 


Aioiol|Tio | < » Aisklitkl < D | AiokllTiol- (34.458) 
k#io kÆio 


Si |x;,| est non nul nous pouvons simplifier : 
lAioiol < > lAiokl- (34.459) 
kÆio 


Hélas, l'hypothèse de diagonale strictement dominante implique l’inégalité stricte dans le sens 
inverse. Impossible. Nous en déduisons que [x;,| = 0. Donc |xl,x = 0, ce qui signifie que x = 0. 
Le fait que le noyau de À se réduise à {0} implique linversibilité de À. 


PROPooTQWUooSLoniQ 
Proposition 34.164. 
Soit AE M(n,C) une matrice qui est dans un des deux cas suivants : 
— à diagonale strictement dominante 
— à diagonale dominante et irréductible 
Si A = D — M où D est la diagonale de A (et M est « le reste ») alors D est inversible et 


p(D M) <1 (34.460) 
où p est le rayon spectral (thème 39). 


Démonstration. Le lemme 34.162 nous dit que les éléments diagonaux de À sont non nuls. Cela 
donne déjà le fait que la matrice D est inversible et que la produit D-1M ait un sens. Nous posons 
T = DM. Nous avons alors 
DD M. (34.461) 
k 
Si k = à alors My; = 0 et si k Z à alors D; = 0. Donc T;; = 0 pour tout 1. 
En ce qui concerne les autres éléments de 7, 


1 ". 
Tij = DD )x M — >» 2. dikMr = Dre. (34.462) 
k k ? at 


Notes : 
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— Les hypothèses sur À jouent pour dire que À;; # 0. 
— Le signe moins est dû au fait que M;; = —A;; lorsque à Z j. 
En faisant la somme des modules : 


À. 
Sri=Y ui " D lAgl < 1. (34.463) 


JA ji JA 


La dernière inégalité est le fait que À soit à diagonale dominante. 


(1) Si À est à diagonale strictement dominante Alors nous avons l'inégalité stricte 


NES (34.464) 
jÆi 


Et le théorème de Gershgorin 34.157 dit que le spectre de Test contenu dans l’union des 


disques 
D; = {2e C tel que [2 — Til < ri} (34.465) 
où 
Do lEe (34.466) 
ji 


Mais nous avons prouvé que pour tout à, T;; = 0 et D ITij| < 1. Donc toutes ces boules 
sont contenues dans B(0,1). Cela prouve que p(T) < 1. 


(2) Diagonale dominante, irréductible 


La matrice Test alors également irréductible parce que les éléments non nuls de À et de T'sont 
les mêmes : Ti; = —A;;/A;j. Nous utilisons alors le second théorème de Gershgorin 34.158. 
Si À est une valeur propre de 7’, alors soit 


Xe (JB(0;r;) (34.467) 


soit 
Xe f)6B(0;r;). (34.468) 


Vu que r; < 1 pour tout , dans le premier cas À est dans l’union des boules ouvertes de 
rayon 1. Le nombre À est donc une la boule ouverte de rayon 1. Bref, |A] < 1. 

Dans le second cas, l’intersection de deux cercles de même centre sont soit vide soit tout le 
cercle (auquel cas les rayons sont égaux). Dans le second cas, ledit rayon est certainement 
strictement plus petit que 1 parce que 


Ai 
= =>] Ti| = » A <1 (34.469) 


ji ji 


34.22.22 M-matrice 


DEFooZAWWooEAujPy 
Définition 34.165. 
Une matrice A € M(n,R) est une M-matrice si 
(1) A > 0 pour tout i, 
(2) Ai; <0 siiZj 
(3) À est inversible et A! > 0. 
PROPooWVHXooCfsvGq 


Proposition 34.166. 
Soit À € M(n,R) telle que Ai; > 0 pour tout à et À;; < 0 pour tout i Æ j. Nous posons À = D - M 
où D est la diagonale de À. 

La matrice À est une M-matrice si et seulement si p(D-1M) <1 
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Démonstration. En deux morceaux. 


(1) 


Si p(D-1M) <1 Nous posons encore T' = DIM. Par le théorème 15.148, la matrice 1 —T 
est inversible et 


Le] 
G—T) = NT. (34.470) 
k=0 
D'autre part, via des calculs déjà faits, et les hypothèses sur les signes des éléments de À, 
A. 
Tj = -? > 0. (34.471) 
Ai 


Donc tous les éléments de T sont positifs (ou nuls). Par conséquent T* > 0 pour tout k et 
(1—T) L est positive. 

Mais A = D - M = D(1 - DM) = D(1 -T). Vu que D et 1 — T sont inversibles, nous 
savons que À est inversible et 


AT = (= TY "D", (34.472) 
qui est un produit de matrices positives. Donc A7! > 0. 
Au final, À est une M-matrice. 


Si À est une M-matrice 


Soit une valeur propre À de T = DM et un vecteur propre u : Tu = Au. Vu que T > 0 
nous avons d’une part | Au] = |Al[|u| et d’autre part [Au] = |[Tu| < Tlu|, ce qui donne 


[Alu < Tlul. (34.473) 
Dans cette inégalité nous substituons T par 1 — (1 — T) pour avoir 
Jul < lu] — (1 — Tlul (34.474) 


ou encore 


(1— Tu < (1— Alu. re) 


Mais (1—T) 1 = A 1D > 0 parce que À et D sont positives. Donc en appliquant (1—T)! 
à l'inégalité (34.475), elle est conservée (proposition 34.155(2)) : 


lu] <(1-T)-1(1—Al}lul. (34.476) 


Si [A] > 1 alors toutes les composantes de (1 — |A|)|u| sont négatives et l'inégalité n’est 
possible qu'avec [u| = 0. Dans ce cas, À n’est pas une valeur propre (le vecteur propre soit 
être non nul). 

Nous en déduisons que || < 1 et donc que p(T') = p(D-1M) < 1. 


Le théorème suivant résume ce que nous avons vu en donnant une condition suffisante facile à 
vérifier pour être une M-matrice. 


THOooLZGSooSevgg)j 


Théorème 34.167. 
Soit À € Min, R) telle que 


(1) A > 0 
(2) Ai; < 0 pour i £j 


(3) vérifiant une des deux conditions suivantes : 


— à diagonale strictement dominante 


— à diagonale dominante et irréductible. 


Alors À est une M-matrice. 
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Démonstration. Au vu de la proposition 34.166, il suffira de montrer que p(D-1M) < 1 où D et 
M sont la décomposition À = D — M habituelle. C’est le cas grâce à la proposition 34.164. 
PROPooZDMQooIZAbKK 


Proposition 34.168. 
Soit À e M(n,R), une M-matrice irréductible. Alors A7? > 0. 


Démonstration. Nous posons T = DIM. En comparant la définition 34.165 de M-matrice et la 
caractérisation de la proposition 34.166, nous avons p(D7!1M) < 1. Par conséquent 
Le] 
GT) 1=S T* (34.477) 
k=0 


par la proposition 34.166. D'autre part, A1 = (1 — T) {D où les éléments D sont strictement 
positifs. Donc nous devons encore prouver que (1 — T) ! > 0. Nous savons que T > 0, et vu que 


(Dre YO; (34.478) 
k k 


il nous suffit de prouver que pour chaque (ij), un des (T* Ji est strictement positif. Soient donc deux 


indices à et 7. Vu que À est irréductible, ils sont connectés par une suite d’indice à = i9,%1,...,,p = 
j tels que 
À. 
Tips = — 2 > 0. (34.479) 
Aix 


Or les indices À} sont choisis de telle sorte que les numérateurs soient non nuls et donc strictement 
négatifs. Nous avons, en général : 


Ge =» POI RU R (34.480) 


li, lr— 1 


Chacun des termes est positif ou nul, mais pour k = r, il y a entre autres le terme 
Patrie 0 (34.481) 
Donc (T");; > 0 et XP (1); > 0. Et par conséquent 


A t=(1-T) 1D>0. (34.482) 


THOooWIFGooBQpddF 
Théorème 34.169. 
Soit une M-matrice À € M(n,R) et ge R" tel que (Ag); > 1 pour tout i. Alors | A1}, < |glo. 


Démonstration. Nous posons u = (1,...,1) et considérons x € R”. Vu que À est une M-matrice, 
nous avons A7! > 0, donc 


JA al < AT }el < flo Au < [tlog. (34.483) 


Justifications : 
— La première inégalité est la proposition 34.155(2). 


— La seconde provient de 


(BIx|), = À: Bxlexl < D Baltlo = Ill >», Birux = |tloBu. (34.484) 
k k 


— Étant donné que A7! > 0 nous conservons l'inégalité et Ag > u implique g > Alu (c’est la 
proposition 34.155(1)). 
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En ce qui concerne la norme de A7! nous avons donc 


|A = sup |ATxlx < sup [tlolglo = |gloo. (34.485) 


ællo=1 Itllco=1 


PROPooQBWQooBbeZLO 
Proposition 34.170. 
Une matrice de M(n,R) qui 


(1) est symétrique, 

(2) Vérifie une des deux conditions suivantes 
— est irréductible à diagonale fortement dominante 
— est à diagonale strictement dominante, 

(3) vérifie A;; > 0 pour tout i 


est strictement définie positive. 


Démonstration. D'après le théorème de Gershgorin 34.157, chaque valeur propre de À est dans un 
des disques fermés 
D; = {2€ C tel que |[z — A;] < r;}. (34.486) 


Par hypothèse, les centres de ces disques sont réels et strictement positifs. Mais le fait que À 
soit à diagonale dominante donne que le rayon de ces cercles sont plus petits que 4;;. Donc D, 
n’intersecte pas |—c0,0[. Mais le fait que À soit symétrique implique que les valeurs propres soient 
réelles (théorème 9.221(1)). Cela montre que les valeurs propres de À sont toutes dans [0, |. 

Si la matrice À est à diagonale strictement dominante, alors les inégalités sont strictes et le 
théorème est prouvé. 

Sinon nous somme dans le cas irréductible à diagonale fortement dominante et nous avons le 
théorème de Gershgorin numéro 2 34.158. Soit une valeur propre À. Soit elle est dans un des disques 
ouvert (qui est inclus dans ]0,æ[), soit elle est dans l'intersection des bords des disques. Mais au 
moins un des disques n’intersecte pas 0 (parce que la diagonale est fortement dominante). Dans ce 
cas non plus À ne peut pas être nul. 

Nous en déduisons que dans tous les cas, les valeurs propres sont toutes réelles strictement 
positives. 


Chapitre 35 


Méthode des différences finies 


ii Avertissement /question à la lectrice !! 35.1 
Dans toute la partie sur la méthode des différences finies, il y a un flottement entre ( et Q. 

D'une part je ne vois pas bien pourquoi on ne peut pas se contenter de travailler avec une 
fonction u: Q — IR avec ( ouvert dans R et u même pas définie sur le bord. 

Mais d’autre part, de nombreuses sources demandent de la régularité sur un fermé, à commencer 
par wikipédia : 

https:// fr.wikipedia. org/wiki/Méthode_ des_ différences_ finies 

Si vous avez une idée sur la question, écrivez-moi, ou répondez directement sur la page de 
discussion de la page Wikipédia, sur laquelle j'ai laissé une question. 


35.1 Problèmes de dimension un 


Soit u: R — R une fonction et h > 0. Nous définissons les opérations suivantes (qui sont 
supposées approximer la dérivée u/(x) lorsqu'elle existe). 


Définition 35.2. 
La différence progressive est 


(Dj u)(x) = : (35.1) 
la différence régressive est 
Dpu(a) = DEN) (35.2) 


la différence centrée est 
u(x+h)—u(x—h) 


(Dfu)(a) = " 


(35.3) 


Nous ne noterons pas toujours la dépendance en h, c’est-à-dire que nous noterons D*u au lieu 
de Du lorsque cela ne pose pas de problème. 
7 à nr + p+ 0On+ p+n— 
Notons que u” peut être approximé par D, Dju, D,D,, D; D, , et encore de nombreuses 
autres possibilités. 
Voici un lemme qui dit que tout cela n’est pas si mal, pourvu que soit assez régulière. 


LEMooZECZooVKxOZZ 
Lemme 35.3. 
Soit un ouvert connexe Q de R, soit x eQ et h > 0 tel que B(x,h) € Q. 
(1) Si u e C?(Q) alors 
h 
ju'(æ) — Déu(æ)| < Slu”lo (35.4) 
et b 
ju (x) — Dru(x)| < Sue. (35.5) 
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ITEMooSAWJooJUTWAb 
2) Si u e C*(Q) alors 
(3) (a) , 
ju’ (x) — D} (x)| < Ze lo (35.6) 
ITEMooRWUHooZJLKuL 
(3) Si u e C#(Q) alors 
_ h° 
fu” (x) — D Du(x)| < lu lo. (35.7) 


Démonstration. Nous prouvons le point (3). D'abord nous regardons de quoi nous avons besoin : 


(DYu)(x) — (D'u)(x—h)  u(x+h) —2u(x) + u(xEQ%BLIIooW 
5 = 5 ESA 


Nous allons y mettre les approximations de u(x+h) et u(x —h) par Taylor, proposition 12.466(2) : 


DT D'u(x) = 


h? h° h* 
u(x +h) = u(x) + hu'(x) + D (x) —- 4% + a (x + 01h) (35.9) 
avec 01 € [0,1]. De même, 
he h Le 
u(x — h) = u(x) — hu!(x) + (x) = 4") + TL (x — 62h) (35.10) 
avec 02 € [0,1]. 
Donc 
h4 
u(x + h) + u(x — h) — 2u(x) = hR?u"(x) + PT) (ut (x + 81h) + (9 (x — 62h) ), (35.11) 
ce qui donne 
h? 
(DD u)(x) = w"(x) +2 (ut9 (x + 81h) + u@ (x — 62h) ). (35.12) 


Chacun des deux termes dans la parenthèse peut être majoré par lu® la parce que æ + Oh ne 
prend ses valeurs que dans [x,x +h] € B(x,h) € (. Quoi qu'il en soit nous ne pouvons pas dire 
mieux que 


h?2 
lu”(x) = D Dtu(x)l < Del (35.13) 
Remarque 35.4 ([1]). 
Si nous avons l'égalité EGooHSPFooT IT 
lu(x) — Diu(x)| < 6 BEA 
pour tout x, il faut faire attention en écrivant 
fu — Déulo < à (35.15) 


parce que l'inégalité (35.14) n’est valable que pour les x tels que [x — h,x + h] € Q, de telle sorte 
que l'inégalité n’est pas spécialement correcte sur Q. Il faut donc d’abord se mettre d’accord sur 
ce que signifie |.|.. Est-ce une norme supremum sur Q ou sur (7? 
35.1.1 Un schéma à cinq points 
35.1.1.1 Poser le système 

Soit Q = ]0,1/{ et l'équation différentielle 


—u"(x) + c(x)u(x) = f sur Q 
u(0) 2. FOR TENOoREn ET 
u(1) = 8 
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où c est une fonction positive et à, 8 € R. Nous considérons h > 0 assez petit pour que le reste ait 
un sens. Si nous cherchons des solutions dans C#(Q), le lemme 35.3 nous dit que 


Qu” (x) — D Dtu(x)| = n(h?) (35.17) 


où 7 est une fonction telle que lims_,0 n(t) = 0. Nous pouvons récrire l’équation différentielle sous 
la forme 


D D'u(x) + c(x)u(x) = f(x) + n(h?). (35.18) 


Si nous négligeons le terme 7(h?) qui est supposé être petit nous pouvons tenter de résoudre pour 
la fonction up, 
—D D'un(x) + c(x)un(x) = f(x). (35.19) 


Notons ici l'importance de la notion de problème bien posé parce qu’en remplaçant le paramètre 
(fonctionnel) f par f + n(h?), nous modifions les solutions. Dans la mesure où le problème est 
bien posé, cette petite modification ne modifiera pas trop la solution et nous pouvons espérer que 
u — un] soit petit pour une norme ou une autre. 

Utilisant l'expression (35.8) pour D D* nous avons l'équation suivante pour uy, : 


1 EQooECLXo0o 
. (2un(e) — un(x +R) — un(e —h)) + aun(r) = f(x). : (750) 
Avons-nous gagné quelque chose ? Pas encore. L’idée de la discrétisation est de ne considérer up 
qu’en certains points, et de prendre ces points à intervalles réguliers de taille h. Soient donc N un 
nombre entier et À = 1/(N + 1). Nous posons 


zx = kh (35.21) 
pour k = 0,...,N +1. Avec cela nous avons 
NN 
Q = U (tx, Tr+1] (35.22a) 
k=0 
xzo = Ù (35.22b) 
GNai — 1. (35.22c) 
Nous posons surtout 
Qp = {tiki=1,.,N (35.23) 
et EL 
On = {ti}i=0...,N +1. (35.24) 


Enfin, nous ne considérons plus uy que comme une fonction up : ®} — IR. C'est-à-dire que uy est 
un vecteur à NV + 2 composantes. 
L’équation (35.20) devient 


(un (a) 1) RU 


pour i=1,...,N. Sur les bords, cette équation n’est pas possible parce que x;_1 ou x;:1 n’existerait 
pas. Au contraire, sur les bords nous avons les conditions aux bords 


un(To) = à (35.26) 

et 
un) = D: (35.27) 
Nous posons c; = c(x;) et u; = un(x;). Les nombres up et uny+1 sont donnés par les condi- 
tions aux bords, et les inconnues du problème sont donc les nombres u; (à = 1,...,N). Pour les 


déterminer, nous devons résoudre un système d'équations linéaire. 
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L'écriture du système linéaire à résoudre consiste essentiellement à écrire (35.25) en séparant 
les cas à = 1 et à = N parce que nous connaissons déjà les valeurs de wo et un1. Le système que 
nous avons est : 


2 l a ; 
(% + a) Uu] pe "2 = fi + p2 i=1i (35.28a) 
2 1 B . 
(z + ex) UN — Pan = fN + p2 i=N (35.28b) 
2 1 1 
(& . di) Ui— pod — pau = Ji autres. (35.28c) 
Cela se met sous la forme matricielle 
LhUn = Fh (35.29) 
pour 
a EQooMNTJoo ] 
Pi = (fi+ fn fr fn + À) (39.20) 
et les éléments non nuls de L}, sont : 
1 ’ 
(bla 72 pour i=2,...,N (35.31a) 
1 ; 
(Lpeira = 72 pouri=1,...,N-—1 (35.31b) 
2 
(Lhhii = = + pour il. 30, (35.31c) 


F2 
Cette matrice est pleine de zéros, à part les trois diagonales centrales, et il existe des méthodes 
efficaces pour résoudre le système d'équations correspondant. 
35.1.1.2 Propriétés du système 


La matrice est la suivante : 


+ —1/h 0 0 .…. 0 
—1/R? + —1/h° 0 ... 0 
0 —1/h? +es —1/h2 : 
= LR: 1/ | (35.32) 
0 0 —1/h? # M 0 
: LÉ” Le —1/h? 
0 0 _ 0  —1/R 5 +cn 


où nous avions déjà posé l'hypothèse c; > 0 pour tout i. 
LEMooGGHQooNnVsuu 


Lemme 35.5. 
La matrice Ly, est irréductible ! à diagonale fortement dominante ?. 


Démonstration. Nous décomposons la preuve en plusieurs parties, en notant L pour L}, afin d’al- 
léger les notations. 


(1) La première ligne Sur la première ligne, seuls deux éléments sont non nuls et nous avons 
(Lul = _ + € parce que c est une fonction positive et |Li12| = FH. Nous avons donc 


1 1 
Le 0 (35.33) 


2 
ail — |Liol = PERS DS nr 


L’inégalité stricte est importante. 


1. Caractérisation 34.154. 
2. Définition 34.161. 
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(2) La dernière ligne Elle est semblable à la première. 


(3) Les autres lignes Sur les autres lignes nous avons trois éléments non nuls et 


2 2 
> Lie 5 <5 +a= Li. (35.34) 


(4) Diagonale fortement dominante Nous avons prouvé jusqu’à présent que Ly était une 
matrice à diagonale fortement dominante. 


(5) Irréductible Nous allons utiliser la caractérisation de la proposition 34.154(3). Pour cela, 
nous considérons la chaine d’éléments non nuls 
1 
Li9, Lo3,..., LN_1N = 72 (35.35) 


Soient deux indices à et j avec à < 7. Cette suite d’indice (ou une sous-suite) rend à et 
connectés. 


Si par contre ? > j, il faut considérer la suite inversée grâce au fait que Ly, est symétrique : 


1 
LNN-1, LN-1,N-0,..., Lao, Lai = ne (35.36) 


PROPooUQJVooJMTKVM 
Proposition 35.6. 
Soit le problème 


ie à FO EE ER 


où c est une fonction positive et &, B € IR. Nous considérons hk > 0 assez petit pour que le reste ait 
un sens. Et nous approximons uw” par D Du. 
La matrice Ly des différences finies associée à ce problème est 


(1) une M-matrice, 

(2) strictement définie positive, 

(3) d’inverse L,1 > 0. 
Démonstration. Le théorème 34.167 dit que Ly est une M-matrice. La proposition 34.170 nous 
donne aussi que L, est strictement définie positive. 


Le lemme 35.5 dit que L} est irréductible, ce qui permet à la proposition 34.168 de conclure 
que Le° > 0. 


Cela étant rappelé, nous pouvons continuer. 


LEMooDXPRooUhwqsz 
DEA ss UBEQooFJKIoo! 
Soit Q = 10,1{, sot NENeth=1/(N +1). La solution wn: (An — R du problème doocisel 
—(D Dtu)(tx) = 1 (35.38a) 
wn(0) = 0 (35.38b) 
wn(1) = 0 (35.38c) 
SUBE CRFU 
pour tout xx = kh (k =1,...,N) donne les valeurs exactes des w(x4) lorsque w est la solution del di 
—w"(x) = 1 (35.39a) 
w(0) = 0 (35.39b) 


w(1) = 0. (35.39c) 
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Démonstration. Un enseignement de la proposition 35.6 est que le système (35.38) peut être écrit 
sous la forme d’un système linéaire Loup = Fy où Le est inversible. Il y a donc unicité de la 
solution. 

D'autre part, la solution du système (35.39) est w(x) = à(x — x?), qui est de classe C®. Le 
lemme 35.3(3) dit que D DTw = w”. Donc les valeurs w(x}) résolvent aussi le système (35.38). 


Lemme 35.8 (Quelques estimations). 
La matrice L du problème sus-mentionné en (35.37) vérifie* : 


(1) ILnloo < 7 + [lle 
(2) 1Ln°lo < &- 


Démonstration. Nous nous souvenons de la formule (11.163) : 
nm 
lAlo < max, D Al. (35.40) 
J= 


La première ligne a pour somme : + c1, la dernière a pour somme _ + c, et les autres ont pour 
somme _ + c. Elles sont donc toutes majorées par me + |clloo. 
Pour l'estimation de |L, {| nous allons nous appuver sur le théorème 34.169. 
A BEA UE 


SUBE KooZaRjvL 

Commençons par considérer le problème | no 
—w” = 1 (35.41a) 
w(0) = w(1) = 0. (35.41b) 


La première équation dit que w est un polynôme de degré 2. En écrivant w(x) = ax? + bx + cet 
en imposant toutes les contraintes, nous trouvons l’unique solution 
l' 2 
w(x) = EC — x). (35.42) 

Le lemme 35.7 nous dit que la fonction w prise aux points æ, = kh donne les valeurs de w}. 

La matrice Le est une M-matrice et le vecteur w} vérifie Lu, — 1. Donc le théorème 34.169 
s'applique et 
1 
8" 
L'obtention de 1/8 n’est rien d’autre que la recherche du maximum (en valeur absolue) de la 
parabole x + (x — x?)/2 pour x € [0,1]. Le maximum est atteint pour x = 1/2; calcul de dérivée 
et tout Ça ... 

Nous retournons maintenant à notre matrice originale LA. Nous avons 


I(Lh) TU < wnloo = (35.43) 


Ln — L9 = diag(c1,...,cn) > 0, (35.44) 
et aussi 
L'- (LS) = Li! (LL) (1)! (35.45) 
En 7 
Z0 <0 z0 


parce que Ly est une M-matrice. Donc tous les coefficients de L,} — (L9)-1 sont négatifs. Cela 
implique 

Li <(L) (35.46) 
Mais nous savons que les coefficients de L,? sont positifs, donc le maximum de ses coefficients en 


valeur absolue est plus petit que ceux de (L9)-1, c’est-à-dire 


IL lo < 1(LR) 7 oo < (35.47) 


œi- 


3. Dans le CTES d'analyse numérique de Marseille, l'estimation donnée est |L "| < À. 
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35.1.2 Exemple 


Soit Q = ]0,1[ et une fonction u: ( — IR de classe C4 vérifiant 


—u"(x) + u(x) = sin(x) (35.48a) 
u(0) = 0 (35.48b) 
u(1) = 0. (35.48c) 
Nous allons écrire la méthode des différences finies pour À = 1/4. Nous posons donc les points 
zo = 0 (35.49a) 
Fi = 1/4 (35.49b) 
xo = 1/2 (35.49c) 
a = 8/4 (35.494) 
Si 1: (35.49e) 
Puisque nous avons supposé u de classe C#, le lemme 35.3(3) nous donne { 
u"(x) = (D DYu)(x) + a(h) (35.50) 
avec limy_,0 a(h)/h = 0. L’équation discrétisée serait alors PRES 
—(D7 D'u)(x) + u(x) = sin(x) (35.51a) 
u(0) = u(1) = 0. (35.51b) 


où nous n’avons pas précisé l’indice À au bas des opérateurs D* et DT. Les équations (35.51) ne 
doivent être posées que pour æ1, æ2 et x3 parce que les valeurs en x9 et x4 sont déjà connues. 


(1) Pour x: 
U2 — 2U1 + Uo 


n? + U1 = sin(x) (35.52) 
(2) Pour x2 
U3 — 2U2 + U] ue 5.53 
pe + u2 = sin(r2) (35.53) 
(3) Pour x3 
U4 — 2U3 + U2 , À 
p2 + u3 = sin(x3). (35.54) 
Nous tenons compte du fait que up = u4 = 0 et que h = 1/4 pour écrire le système 
—31 16 0 ui S1 
16 —31 16 u2 | = | 5 (35.55) 
0 16 —31 Uu3 S3 


où les s; sont des nombres parfaitement connus : par exemple s1 = sin(x1) = sin(1/4) + 0.247403959254523. 


35.2 Problèmes de dimension deux 


Nous allons considérer le système 


en = f sur Q Fons 


u = g sur 0Q 
où Q = ]0,a[ x ]0,b. 


Remarque 35.9. 

Pourquoi un signe moins devant le laplacien ? Pour avoir la proposition 35.6 qui dira que la matrice 
correspondant aux différences finies appliquées à ce système est une M-matrice. Sinon, c’est la 
matrice —L} qui en serait une. 


4. Nous ferions n'importe quoi pour ne pas écrire w”(x) = (D D*u)(x) + o(h?). Notez que vous faites ce que 
vous voulez : écrivez avec la notation « petit o » si cela vous chante. 
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35.2.1 Discrétisation en croix 


Nous allons maintenant déduire une discrétisation du laplacien en discrétisant les opérations 
02 et F4 Nous discrétisons ( en mailles carrées de côté h : x, = kh et y, = kh. L'opération de 
dérivée partielle ©, est discrétisée par 


u(x +h,y) — u(x,y) 


(Dru)(x, y) = : (35.57) 
(Dyu)(x, y) = ue te —h,#) (35.58) 
(Do) = RUE RE) (35.59) 


2h 


où le À est sous-entendu dans les opérateurs D0, D* et D-. 

La dérivée partielle seconde d?u peut être approximée par toutes les combinaisons imaginables, 
par exemple 
u(x + h,y) — 2u(x,y) + u(x — h,y) 

he 

Pour évaluer la différence entre (d?u)(x, y) et (D D*u)(x, y), il est possible d’utiliser le théorème 
de Taylor en deux dimensions, mais nous pouvons également recycler ce qui a été fait. Nous posons 
uy(x) = u(x, y) et alors (du)(x, y) = u,(æ) et le lemme 35.3(3) donne, si u, est de classe a 


(D; Dru)(x,y) = 


| (35.60) 


1 
juÿ(æ) — DT D'uy(x)| < TL ML (35.61) 


Là, les opérateurs DŸ* et DT sont ceux à une dimension. Mais nous avons (D D*uy)(x) = 
(D D*u)(x, y) (à droite ce sont les opérateurs à deux dimensions), donc 


(Cu), y) — (DT DTu)(x, y)| < houle (35.62) 
et nous pouvons écrire 

(QZu)(æ,y) = (D D+u)(, y) + RR(œ, y) FT 08.0) 
où R est une fonction qui dépend de x, y et h, mais aussi de u. Le point important est que R soit 


majoré par une quantité indépendante de h, de telle sorte que nous ayons quelques garanties que 
négliger ce terme soit une bonne approximation lorsque h — (. 


Au niveau de la discrétisation, nous considérons x; avec à = 0,...,N, et y; avec j = 0,...,N,,. 
La discrétisation de —(Au)(x,y) = f(x, y) donne, pour 4 =1,...,N; -1et j=1,...,N, — 1, 
1 EQooPWXBooPimUr 
Rtuitis + di — ui — Uijet + uiÿ1) = fig. (ESA) 


Les équations avec à ou j valant 0 ou N,, N, sont les valeurs aux bords. 


35.10. 
Nous notons pour référence ultérieure la discrétisation suivante du laplacien : 


1 EQooQQUHooNY 
(Anu) Cris Vj) — PA — Aus j + Ui+1,j À ii, + Ui,j-1 + de) Li Le B5453 


Elle vérifie 
Ajf = Af + Ra(h). (35.66) 


Cette discrétisation est dite « en croix » parce que les points exploités forment une croix. 
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35.2.2 Discrétisation en carré 
L'opérateur laplacien est défini par À = 0? + de, mais il existe de nombreuses autres façons de 
l'écrire. 


Lemme 35.11. 
Le laplacien est invariant par changement de coordonnées orthogonales. Plus précisément, si À est 
une matrice orthogonale, en posant u; = y Aixex nous avons 


D. on or = (35.67) 
Démonstration. Nous avons : 

Of : | Of 

a D Aix D (35.68) 


et donc 


af Ô 
D TE D Oui 


En particulier si À est une matrice orthogonale, (4'A) jk = Ôjk et le résultat est prouvé. 


5 sua) = S(At)jAn of = S'(A'A)02F. (35.69) 


k ik jk 


Les plus convaincus diront que À = V : V et que le produit scalaire est invariant sous chan- 
gement de coordonnées orthogonales. 
Nous avons déjà déduit la discrétisation (35.65) du laplacien : 


1 
(Anu) (ré Uj) = | _ Aus j + 41,5 + Ui-1,j + Ui,j-1 + dti): (35.70) 
Nous allons maintenant en déduire une par l’idée de décomposer le laplacien dans la base u = e1+e2, 


v = e1 —e2. Pour cela nous introduisons les opérations (le nombre h dont dépendent ces opérateurs 
est sous-entendu) 


(D F)(x,y) = : (35.71a) 
(D+ f}(&, 9) = J(@+h,y D — f(x,y) (35.71b) 
(D: f\(&, 9) = J(x,y) En (35.710) 
(D, f)(x, y) = fe) = te y) (35.714) 
Puisque 
02 + © = 2A, (35.72) 


nous discrétisons le laplacien par 
le - 
A° = 5 (Du Di + D, Dj). (35.73) 
LHBDooSBFkh 
Un peu de calcul donne : + si M 


AP) = gps (AS) + fe + hey +) + a hu +) (35.74a) 


+ f(x+hy—h) +fG-hy—h)). (35.74b) 
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35.2.3 Résolution de la discrétisation en croix 


Les équations (35.64) forment un système d'équations linéaires à résoudre. Certaines peuvent 
être simplifiées parce qu’elles « touchent » le bord. Nous verrons cela un peu plus tard. 

Nous allons d’abord numéroter correctement les équations de façon à ne pas avoir deux mais 
un seul indice. Notre fonction de numérotation sera 


p(i,7) = (j — 1)(Nx — 1) +i (35.75) 


avec à = 1,...,N;—1et j =1,...,N, —-1. Cela correspond à numéroter les points de l’intérieur du 

quadrillage ligne par ligne de bas en haut, et de gauche à droite. Avec cela les équations (35.64) vont 

être numérotées par un seul indice J allant de @(1,1) = 1 à @(N;—1,Ny—1) = (Nr —1)(N, — 1). 
Si 1 = (à, j) alors nous avons vite 


pÜ+ls)=r+1 (35.76a) 
Dern 1 (35.76b) 
pi Lire (35.76c) 
BST NET, (35.76d) 
Nous posons Ur = u,-1(1, et l'équation (35.64) devient 
1 
CU Ur Vie Van Un) = fr (35.77) 


Pour écrire la matrice représentant ce système, nous devons simplifier les équations qui doivent 
l'être. Par exemple avec 1 = 1, le terme Ur_1 = Uo vaut u61 = fo1. Ce n’est donc pas réellement 
une inconnue de notre problème. 

Nous voulons mettre les équations sous la forme du système 


LRU = F. (35.78) 
Sur la ligne numéro 1 de L},, les éléments non nuls sont : PAPERS 
Li, = À (35.79a) 
Ljr41 = —1 (35.79b) 
LT = —] (35.79c) 
Lifan,1 = 1 (35.794) 
LIN, +1 = —] (35.79e) 


pour peu qu'ils existent. Par exemple pour T1 = 1, il n’y a pas d'éléments Lyr_1. Les indices I et 
J de Li j vont de 1 à &(N; —1,N, —1) = (N, —1)(N3 — 1). 
Voici un dessin de notre situation : 


Ny. . . 
KT + + l*X 
ki %X | % 
* Lx x | % 
DESIRE IE 
0: : : : : | 
0 Nz 


À chaque élément du quadrillage correspond une équation. 


— Aux points simples sur le bord, correspondent des équations triviales parce que la fonction 
u y est directement donnée par les conditions aux bords. 


39.2. 
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Aux points étoilés entourés en traits continus correspondent des équations « incomplètes » 
parce que certains termes de l’équation (35.64) sont donnés par les conditions aux bords. Elle 
correspondent aussi aux lignes incomplètes de la matrice L}y où certains éléments donnés en 
(35.79) n'existent pas. 


Le membre de droite de ces équations est par contre enrichi de ce qui à gauche est « donné ». 


— Aux points étoilés du centre entourés en traits discontinus correspondent des équations com- 


plètes. 


Notons que foo ne joue aucun rôle dans notre histoire parce que dans les équations (35.64), 
chaque point (i,j) du maillage n’est lié qu'aux quatre points situés « à côté ». 


PROPooWGTRooVjWhYY 
Proposition 35.12. 
La matrice Ly est 
. / . A . . 5 
(1) irréductible et à diagonale fortement dominante”, ITEMooUOHPooDsvUPP 


(2) 
(3) 
(4) 
(5) 


une M-matrice, 
inversible avec Ly > 0, 
symétrique, 


strictement définie positive. 


Démonstration. On divise la preuve. 


(1) 


Irréductible Une matrice n x n dont les deux premières diagonales sont entièrement com- 
posées d'éléments non nuls est toujours irréductible. En effet, la première lie l’élément (1,2) 
à l'élément (n — 1,n) et donc permet de dire que tous les à < j sont connectés. 

La seconde diagonale lie l’élément (n,n — 1) à l'élément (2,1). 


Diagonale fortement dominante En ce qui concerne la dominance de la diagonale, il 
faut sommer sur les lignes. Or chaque ligne contient (en valeur absolue) un 4 sur la diagonale 
et au plus quatre éléments qui valent 1. D’où 


nl > D El. (35.80) 
JÆI 


La première ligne n’est jamais complète : elle contient un 4 sur l’élément (1,1) et au maximum, 
deux 1, plus à droite. Donc la matrice L} est à diagonale fortement dominante. 
M-matrice 


D’après ce que nous venons de voir (proposition 35.12), le théorème 34.167 s’applique et Ly 


est une M-matrice (. 


Inverse strictement positif La proposition 34.168 nous assure qu’une M-matrice irré- 


ductible est d’inverse strictement positif. Donc Le > 0. 


Symétrique La ligne numéro 1 est 


(..., —1 ,...,—1,4,-1,..., —1 ,...) (35.81) 
en ——/ 7 
I-Nz+1 I+Nr-1 


Prenons par exemple l'élément (7,1 — N, + 1) qui vaut —1. Son symétrique est l’élément 
(1 — N,; +1,17) qui se trouve sur la ligne 7 — N, + 1. Sur cette dernière ligne nous avons un 
—1 sur la colonne 1 — N, +1+N, —1 = I. Donc l'élément (1 — N, +1,17) vaut bien —1 et 
la matrice est symétrique. 


5. Définition 34.161. Le cas 1 x 1 est discutablement à diagonale fortement dominante, il faut avouer. 

6. Notons que c’est ici que nous sommes content d’avoir posé —Au = f dans le système (35.56), avec un signe 
négatif devant le laplacien. Sinon tous les signes auraient changé, et la matrice —L} aurait été une M-matrice, au 
lieu de La. 
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(6) Strictement définie positive Vu que la matrice L} est symétrique, irréductible à diago- 
nale fortement dominante (proposition 35.12), et comme ses éléments diagonaux sont stric- 
tement positifs (ils valent 4), la proposition 34.170 nous dit que L} est strictement définie 
positive. 


35.3 Consistance, convergence 


35.3.1 Définitions, mise en place 


Soit un ouvert Q € R” et un opérateur différentiel L sur Q. Nous considérons le problème qui 
consiste à trouver une fonction u sur { telle que 


Lu= f (35.82) 


pour une fonction f donnée. 


ii Avertissement /question au lecteur !! 35.13 
La définition suivante est une invention personnelle, n’est pas précise et mérite des commentaires 
de la part du lecteur. 


Définition 35.14 ([1]). 

Un schéma numérique de pas h pour Lu = f est la donnée de 
(1) un nombre h > O0 supposé petit, 
(2) une quantité N de points x; dans Q formant l’ensemble discret Q}, 
(3) une matrice Ly de taille N x N, 


(4) une solution un: Qn — R de l’équation (Lnun)(x;) = f; où nous avons posé f; = f(x). 


35.15. 

Évidemment pour qu’un schéma mérite le nom de schéma de pas h pour l'équation Lu = f, il 
faut que le nombre À soit lié au choix des points x;, et que la matrice L}, soit liée à l’opérateur 
L. La définition n’impose pas formellement de tels liens, parce qu'il y a de nombreuses façons 
d’approximer une équation différentielle en un système linéaire, sans compter que même l’équation 
(Lnun)i = fi peut se résoudre de beaucoup de façons, exactes ou approchées. 

Cela pour dire que le lien entre la solution exacte u et la solution approchée n’a rien d’évident, 
et va dépendre des choix faits lors de la discrétisation et lors de la résolution du système linéaire. 
Nous allons supposer dans un premier temps que l’équation Lyuy = f est résolue exactement (nous 
avons un peu parlé de ces problèmes dans les sections 34.15 et suivantes). 


Définition 35.16. 
L'erreur de consistance d’un schéma numérique est la fonction Tr: Qn — R définie par 


Th(ti) = (Lau)i — (Lu)(xi). FAooPFERoo RAD 


Il y a un jeu de notation pas tout à fait évident dans la définition (35.83). En effet, Ly est 
une matrice, et ne s’applique donc à priori pas immédiatement à une fonction. Ce que signifie la 
notation (Lyu); est que l’on applique la matrice Ly au vecteur j - u(x;) et que l’on prend la 
composante À du résultat. 


Définition 35.17. 
Nous disons que le schéma est consistant avec l’opérateur différentiel L lorsque 


lim, [rl = 0 ÉdooMPUToog ERA, 


où la norme |.| est souvent la norme uniforme, c’est-à-dire |r,| = max; rn(xi). 
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Notons que le lien entre h et le choix des x; fait partie de la définition du schéma. Sur un 
segment de longueur /, lorsque h n’est pas un diviseur de /, le schéma devrait expliquer ce que l’on 
fait pour que la limite (35.84) ait un sens. 


Définition 35.18. 
Le schéma (Q»,Ln) est consistant à l’ordre p avec l’opérateur différentiel L pour la norme ||.| 
si il existe une constante C indépendante de h telle que 


Ir < CR?. (35.85) 


Définition 35.19. 
L'erreur de discrétisation entre la solution u du problème Lu = f et la solution approchée un 
sur (y est la fonction 


ep: Op —R 


Ti UT) — Ui. 


(35.86) 


où ui = un(ti) est la solution approchée. 
Le schéma discret (Laun)(æi) = f; est convergent si limp_,0 ler] = 0. Si de plus, il existe une 
constante C, et p > 0, tels que 


ler] <CR?, (35.87) 
alors nous disons que le schéma est convergent à l’ordre p. 


Si l’erreur de consistance est petite, le problème est bien approximé par le système linéaire. 
Cela n'implique cependant pas que la solution trouvée soit bien approximée. 


Exemple 35.20 (Deux opérateurs différentiels proches dont les solutions sont loin). 
Soit la partie Q = ]0,{, et les problèmes 


Liu = w =0 (35.88a) 

u(0) = 1 (35.88b) 
et 

{ Lov = v — ev = 0 (35.89a) 

v(0) = 1. (35.89b) 


Les solutions exactes sont u(x) = 1 et v(x) = e%. 
En ce qui concerne les opérateurs, quelle que soit la norme utilisée, nous avons 


Va — El = sup HN — EP (35.902) 
= sup |ef| (35.90b) 

1F1=1 
€. (35.90c) 


Donc lorsque € est petit, l'opérateur L2 approxime bien l'opérateur L1. Pour toutes les normes. 
Mais 

[u(z) — v(x)| = [1e], (35.91) 
donc quel que soit € nous avons |u — v|,x = 00. Et d’ailleurs, quelle que soit la norme raisonnable 


que nous mettons sur l’espace des fonctions, avoir |u — v] = 00 semble inévitable. 
Donc deux opérateurs différentiels proches peuvent avoir des solutions lointaines. A 


2522 CHAPITRE 35. MÉTHODE DES DIFFÉRENCES FINIES 


35.3.2 Exemple 


Soit l’opérateur différentiel L donné par 
Lu = —-u" + cu (35.92) 
où c est une fonction. Nous considérons sur Q = ]0,1[ l'équation différentielle 
Lu = 0. (35.93) 


En ce qui concerne la discrétisation, nous définissons le maillage Qy = {x; = ih} avec à = 0,...,N+ 
1. La solution approchée discrètement sera le vecteur v qui peut être vu comme fonction v: Q} — R. 
Les nombres vo et vw:1 sont à priori donnés par les conditions aux bords. Pour les autres v; nous 
avons les équations 
Vi+1 — 2Ui + V1 
h2 

Cela est la définition de l’opérateur LA, et le vecteur v solution de Lyv = 0, est la solution du 
problème au sens de la méthode des différences finies (pour peu qu’il existe, soit unique et tout 
ça). 

Pour calculer l’erreur de consistance, nous considérons une fonction w et nous posons u; = u(x;). 
Le vecteur (u;) ainsi construit est approximé par v (on espère). Nous avons : 


(Lnv); = 


+ c(ri)ui. (35.94) 


Ui+1 — 2Ui + Ui-1 
F2 


Th(ti) = c(t;)u; — (Lu)(x:;). (35.95) 


Pour étudier cela nous développons u;41 = u(x; + h) et u;-1 = u(x; — h) à l’ordre 4 : il existe 
ai E [ri,t; + h] et B; € [ri — h, r;] tels que 


hk h 
us = Ut) + hu/(rs) + —u"(x;) + ur) + u® (a; 35.96) 
2 3! 4! 
et 
h? h$ R= 4 
Us = U(x;) — hu/(x;) + —u"(x; 6) Li) + —_ut® Bi). 35.97 
2 3! 4! 
Après simplification de plusieurs termes, 
Ui+1 — Zu + Wii 


h?2 
Th(Ti) = A1 


Qui + U”(xi) + Cu; = à 


5 fu (a;) + u(9 (8). (35.98) 
Parler de la consistance du schéma demande d’étudier limp_,0+ ||, et pour cela, il faut préciser 
la norme avec laquelle nous voulons travailler. L'ordre de consistance va dépendre de la norme 
utilisée. 

Pour la norme |.|,, les nombres u(9(a;) et u(®(8;) se majorent par [u(®|,, et nous avons 


h? 
Iralo < lu Iloo. (35.99) 
12 
Nous avons consistance d’ordre 2. 


Remarque 35.21. 
La valeur de |r,|x dépend de la fonction uw sur laquelle nous la calculons. Cependant nous avons 
convergence |rh|æ — 0 pour toute fonction (de classe disons, C4). 

La constante C pour laquelle nous avons |7,| < C'h? et donc qui nous vaut de pouvoir dire que 
la consistance est d’ordre 2 ne dépend pas de h, ni des valeurs ponctuelles de u ou de ses dérivées, 
mais dépend des normes de u et de ses dérivées (en l’occurrence seulement de la norme de ul4).) 


EÉtudions la consistance pour la norme L: : 


h? 
bras = D Im) < SD lu P oo (35.100) 
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où nous avons majoré chacun des u(#)(a;) par |u(1)|,,. Combien de termes dans la somme ? Nous 
avons h = 1/(N — 1) et donc N = (1+h)/h, ce qui donne 


h?2 
Ir < Nul = (+ R)CR. (35.101) 


La constante 1 + h se majore par n’importe quelle constante strictement plus grande que 1. Nous 
pouvons donc la rentrer dans C et écrire 


Irnli < Ch (35.102) 


et donc avoir la consistance à l’ordre 1. 


35.3.3 Consistance, stabilité et convergence 
LEMooUOUMooPCoAtA 


Lemme 35.22. 
Soit un opérateur différentiel L, soit u la solution de Lu = f et un schéma numérique (Ly, Q) 
pour cette équation. Nous notons un la solution de Lun = f. Alors nous avons 


Lheh = Th (35.103) 


Et si de plus Ly est inversible, 
lea < 1 Z3 "Aral: (35.104) 


Démonstration. Par définition u} est solution de Lyuy = f en tant que fonction sur (}. Nous 
avons donc 
Lyeh — Lyup _ Lu (35.105) 


où u doit être compris comme la restriction de u à Q. En appliquant au point x;, 


(Len)(ti) = (Lrun)(ti) —-(Lnu)(ti), (35.106) 
ns 


mais f; = (Lu)(x;) parce que u est solution de Lu = f. Donc 
(Len)(xi) = (Lu)(xi) — (Lau)(ti) = Th(ti). (35.107) 
Si la matrice L}, est inversible nous avons ep — Litrs, et donc 


leal < 13" Ural (35.108) 


par le lemme 11.59. 


Bien entendu, en tant qu’opérateur linéaire sur un espace de dimension finie, l’opérateur D 
est borné pour chaque h. Mais si il n’y a pas une borne uniforme en h, alors le lemme 35.22 dit 
qu’il n’y a pas d'espoir de majorer |ez| de façon à passer à la limite limy_,0 | L; ||. 


Définition 35.23. 
Un schéma numérique est stable si il existe une constante C' > 0 indépendante de h telle que 
lledel 

THOo0EPQQooUQMcgF 
Théorème 35.24. 
En deux parties. 


(1) Si un schéma discret est consistant et stable, alors il est convergent. 


(2) Si de plus il est consistant à l’ordre p, alors il est convergent à l’ordre p. 
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Démonstration. Nous savons du lemme 35.22 (qui s'applique parce que l’inversibilité de L} est 
dans la définition de la stabilité) que |ex| < |Z,'||ral et que |Z, | < C:. En passant à la limite”, 


li <CI = (. .l 
Him [lea] < C Him fra = 0 (85.109) 


La dernière limite est le fait que le schéma soit consistant. Le schéma est donc convergent. 
Si de plus il est consistant à l’ordre p, alors 


len| < Cri < CR? (35.110) 


Il est donc également convergent à l’ordre p. 


35.3.4 Exemple : schéma à cinq points, laplacien en croix 


Nous avions développé le schéma dont l'opérateur sur (4 est (voir (35.64)) 


1 
(Lun )(ti; Y5) = Al — Ui1,5 — Ui,j+1 + AUi,ÿ — Wii; — Ui,j1). (35.111) 


Proposition 35.25. 
Le schéma est : 


(1) consistant à l’ordre 2, 


(2) stable pour la norme uniforme et 


le" lR< =. (35.112) 
(3) convergent à l’ordre 2 pour la norme |.|s. 
Démonstration. Cet opérateur avait été construit de telle sorte à avoir (voir (35.63)) 
(Au)(æi, y) = (Lnu)(ri, Yi) + RR(x, y, h) (35.113) 
où À peut être majoré indépendamment de h. En tant que fonctions sur (} nous avons 
Th = Au — Lou = hR2R(x,y,h), (35.114) 
et donc || < Ch?, parce que le lemme 35.3(3) donne aussi 
WF < Cmex(| De Elo) (85.115) 


En ce qui concerne la stabilité nous allons utiliser le théorème 34.169. Nous considérons la 
fonction : 
g(e,y) = —; (a +97), (35.116) 


qui vérifie —Ag = 1 sur le carré [0,1]?. Nous considérons le vecteur ga d'indices (à, 5) — gij = 
g(xi, y) sur lequel nous calculons L;, : 


l 
(Lngh)ij = 72 ( dit1,j — Gi,j+1 + Agij — Gi-1,j — di,j—1); (35.117) 


en remplaçant les g par leurs valeurs en termes de 5, %5_1, tiy1, Yj, Yj-1 et Yj+1, et en tenant 
compte du fait que xx = kh et y = lh, nous avons : 


(Lngn)ij = (CG + 1)? — ÿ7 +8 + (5 +1)? — 42 —4ÿ + (1) + 57 +8 + (5 —1)?) = 1. (35.118) 


LI 


Donc Lngn = 1. 


7. Toutes les limites h — 0 sont en réalité des limites À — 0*, mais nous allégeons cette notation. 
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Comme L}y est une M-matrice (proposition 35.12(2)), le théorème 34.169 nous dit alors que 
LR vérifie 
IL leo < |gnlloo. (35.119) 
Mais 
1 1 1 
Ighlloo < Îglo = 9(5; En) —S 
Notons que cela est bien une inégalité et non une égalité parce que rien n’assure que le point 
(1/2, 1/2) soit sur le maillage ; donc rien n’assure que la valeur g(1/2,1/2) ne soit parmi les valeurs 
du vecteur discrétisé gp. 
Notre schéma numérique est stable et consistant à l’ordre 2 pour la norme |.|.. Le théo- 
rème 35.24 dit alors que le schéma est convergent à l’ordre 2 pour la même norme. 


(35.120) 


35.4 Autres laplaciens 


Nous avons vu le laplacien en croix (35.65) | PASOUEMISODENS 
1 
(Anf)(e,y) = 5 AF (9) + Fa + hu) + f(x — h,y) (35.121a) 
+ fa uy+h)+ f(x,y—h)) (35.121b) 
qui vérifie 

Anf = Af+Kh, EooQITHoRgV JiVs 

ainsi que le laplacien en carré (35.74) EQooUDYVooRpAMOC 

1 

( Aie y) = De (— 4e) + fe +hy+h) + fe hy+h) (35.123a) 
+f@+hy—h) +f(&—hy-h)) (35.123b) 


qui vérifie également A f = Af + Kh?. 
À priori toutes combinaisons de la forme 


aAp + LA! (35.124) 


avec a + b = 1 sont valable comme tentative de discrétiser le laplacien. Ce sont des schémas à 9 
points. Evidemment la matrice L}, correspondante va être moins creuse, mais nous pouvons espérer 
ajuster a et b de telle sorte à obtenir une consistance d’un ordre supérieur à 2. 
Nous allons développer les À, f et À}, f à l’ordre 4 (reste à l’ordre 6). Quelques remarques avant 
de commencer. 
(1) Allez relire la proposition 12.361 et les notations qui vont avec pour comprendre les différen- 
tielles. 


(2) Écrivez les formules du type (12.993) pour d°f et df. 
(3) Allez relire le développement de Taylor du théorème 12.459. 


(4) À l’ordre zéro, il n’y a rien, parce que le terme —4f (x, y) compense les quatre termes d’ordre 
zéro des autres termes. 


(5) Aux ordres impairs, il n’y a rien. En effet, prenons un nombre impair { et la formule 
l 
(Pt 2 hs Ro (35.125) 


h; 
È 0%, ses Ch 
LR RE nt 


Nous avons 


(Passe RE Dal hs h) = 0. (35.126) 


Or dans les expressions (35.123) et (35.121), les termes arrivent par paires opposées. 


œ 
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Commençons par calculer h?(A;, f(x, y). 


Ordre 4 . Le premier terme est : 


CRD (CA, 0), (h, 0)) _ ess ((1, 0), (1, 0)). (35.127) 


La formule (12.993) à peine adaptée permet de calculer ça explicitement. 


Il y à encore les termes du même type avec (0,1), (—1,0) et (0, —1). 


Ordre 4 Cette fois, ce sont 4 termes du type 
RL F) (x y) (0), (1,0), (1,0), (1,0) (35.128) 


à calculer. 


Cela fait beaucoup de termes à calculer. Je vous laisse vous persuader que le programme suivant 
en Sage nous donne les coefficients. 


#! /usr/bin/env python3 
# -*- coding: utf8 -*- 


5\x,y=var("x,y") 


C=[] 
C.append(x) 
C.append(y) 


def coef4(h): 
S=0 
for i in [0,1]: 
for j in [0,1]: 
for k in [0,1]: 
for L in [0,1l: 
S=S+h[il*xh[jl*h[k]l*xh[1]*xC[i]l+xC[j]l*C[k]*C[1] 


return $S 


def coef2(h): 
S=0 
for i in [0,1]: 
for j in [0,1]: 
S=S+hlil*xhljl*xClilxCl;] 


return $ 


cross={[] 
square=!{] 


cross.append( [1,0] ) 
cross.append( [-1,0] ) 
cross.append( [0,1] ) 


slcross.append( [0,-1] ) 


5| square=f{] 
s|square.append( [-1,-1] ) 


square.append( [1,-1] ) 
square.append( [-1,1] ) 
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»| square .append( [1,1] ) 

40 

al 

w|print ("Cross scheme :") 

43 

ulK=sum( coef2(v) for v in cross ) 
i5lL=sum( coef4(v) for v in cross ) 
as| print (K) 

ar| print (L) 

48 

4] print ("square scheme :") 

50 

s1K=sum( coef2(v) for v in square ) 
2|L=sum( coef4(v) for v in square ) 
sal print (K) 

sal print (L) 


tex/sage/coefs.sage 


Le résultat est, en utilisant la formule 


CS + Loos + Ogf = AA, (35.129) 
nous avons 
(An) y) = SOOËT + 202 )(œ,0) + DARCOS + OÉPY(æ,1) + KR (35.130) 
= (Af)(x, y) + 2 + 0, f)(x,y) + Kh° (35.130b) 
= Af + aa = Mount + Kh4 (35.130c) 
me me 
= Af+-SAAf- run f+Kh{ (35.130d) 


où K est une constante qui peut être majorée en termes des dérivées quatrièmes de f. En particulier 
la plus grande des normes supremum de ces dérivées. 
Le même genre de calculs donnent 


(A/,F)(x,) = S[oiar+ À og + D0208S + ap)] + KM. (35.131) 


Ca donne : 
h? 
(A! f) = Af + AA + Pa LKR (35.132) 


avec redéfinition du Æ ; nous ne le préciserons plus à chaque fois. 
Nous avons donc le résultat proposé dans [731] : 


aA} f + bA/, f = (a+ DAS + (a+ DE A?f + hE(a — 2) Ceyyf + Kh°. (35.133) 


L'idée est d'appliquer ça à une fonction u qui vérifie l'équation différentielle Au = f (attention au 

clash de notation pour f). Le mieux est de supprimer le terme en Oyryyf en demandant a — 2b = 0. 
Nous avons donc à résoudre le système 

a+b=1 (35.134a) 

a — 2b = 0. (35.134b) 


Qui propose une décomposition PLU pour résoudre ce système linéaire ? Quelle que soit la manière, 
la solution est 


a=, b== (35.135) 
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Nous allons donc étudier la discrétisation à neuf points 
2 1 EQooRFJVooV 


En faisant quelques additions nous trouvons que l’opération 


1 
(Lnu)(æi, y) = x ( — QOuy + Afuis1,5 + Ui-1,5 + UWij+1 + Ui,51) RE) 
URL PURE TUE Ut 
vérifie h? 
E TLH 
Lnf = Af+ AS +KN. Rooronter ses, 


35.4.1 Travail avec le laplacien à 9 points 


Nous allons écrire un schéma numérique pour l’équation différentielle —-Au = f utilisant la dis- 
crétisation à 9 points du laplacien. Nous recopions ses propriétés fondamentales (35.136), (35.137), 
(35.138) : 


2 1 
fi Ai À. (35.139) 
3 3 
et 1 
(Lnu)(xi, y;) = ax ( — DOuij + Afuiti,; + Ui-1,5 + Ui,j+1 + Uiÿ1) 
6h (35.140) 
+ Ui41,5+41 À Ui-1,541 À Ui41,5—1 + set), 
et p2 
Lnf = Af+ AS + KR. FAROROR SA 
Nous appliquons (35.141) à u et nous isolons Au : 
Au = L LA +kh= ln + a+ Kh (35.142) 
u = Lau — —A°u _ u : 
LT 6h? * 12 
où nous avons utilisé A?u = —Af et avons noté 
Tru = Out Austen Us ea dan 0e à a een 0e 15e (85.18) 
Nous imposons maintenant Au = — f en écrivant 
Loue -f- À Af + a(hynt (35.144) 
u = | : 
GA?" 12 L 
Une idée est de remplacer A f par son approximation en croix (35.122) : 
h4 
Tnu = 6h? f — 5 (nf + KR?) + a(h)h$ (35.145) 


: Zi ; EQooKUMVooCVrzjt 
Avec quelques calculs nous trouvons le schéma numérique suivant : | 


DOass = Auests À di 5 À it = Mis à) = ts = Wir = Wii = is (89.1464) 
h? 
n 5 Bfi + fins + fins + fijan + fija) + a(R)h$. (35.146b) 


6 


En oubliant le terme en a(h)h°, nous obtenons un système d'équations linéaires. 


ii Avertissement /question à la lectrice !! 35.26 
Il me semble que ce schéma donne une convergence d'ordre 6. C’est correct ? 


Chapitre 36 


Variables aléatoires et théorie des 
probabilités 


36.1 Espace de probabilité 


Définition 36.1. 
Une mesure de probabilité sur un espace mesurable! (Q,A) est une mesure positive telle que 
P(Q) = 1. Dans ce cas, le triple (Q, A, P) est un espace de probabilité. 


Un point w € Q est une observation, une partie mesurable À € À est un événement. 
L'ensemble AUB représente l'événement À ou B tandis que l’ensemble An B représente l'événement 
A et B. 

Si les À, sont des événements, nous avons défini en 10.43 limite supérieure et la limite inférieure 
de la suite À, par 


lim sup An = R U Ak (36.1) 
nr? n>lk>n 
et 
liminf 4, = [7] (7) A4 (36.2) 
ii n>lk>n 


Si w € liminf 4,, alors w réalise tous les À, sauf un nombre fini. 
Nous avons 


lim sup À, = {w € Q tel que w € A,pour une infinité de n}. (36.3) 
Théorème 36.2 (Borel-Cantelli). 
Si 
OO 
P(An) < © (36.4) 
n=1l 


alors P(lim sup 4;) = 0. 


Démonstration. La condition ÿ,,., P(An) < © signifie que la fonction 


p= ) 14, (36.5) 


n>1l 
est P-intégrable. Par conséquent, elle est finie presque partout (au sens de P), c’est-à-dire 
P(g = wo) = 0. (36.6) 


Les points w sur lesquels &{w) = % sont ceux tels que 


>, la.) (36.7) 


n>1l 


1. Espace mesurable : 14.1, mesure positive : 14.18. 
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c’est-à-dire les w qui appartiennent à une infinité d’ensembles 4,, ou encore les w € limsup 4,. 
Nous avons donc montré que 


{w tel que w(w) = w} = {we Q tel que w € A,pour une infinité de n} = limsup An. (36.8) 


Or l'hypothèse signifie que la probabilité du membre de gauche est nulle. 


CORooUWLZooFLYmcY 


Corolaire 36.3. 
Si 31 P(CAn) < 0, alors presque surement tous les B, sont réalisés à l’exception d’un nombre 


fini. 


36.2 Variables aléatoires 
DEFooSZRX0oQUSZYU 


Définition 36.4. 
Une variable aléatoire est une application mesurable 


X: (0,4) — (R4, Bor(R!)). (36.9) 


Nous convenons que R! = R, c’est-à-dire que dans le cas où la variable aléatoire X est réelle, 


nous acceptons les valeurs +00. 
DEFooRNKZooRczFwB 


Définition 36.5 ([732]). 
Une variable aléatoire réelle X:Q — R4 est absolument continue si il existe une fonction 
positive et intégrable f: R — R telle que pour tout borélien À € Rf, 


P(X € À) = J | La(x)f(x)dx. (36.10) 


R 
Nous disons alors que f est la densité de X. 


Cela ne devrait pas être sans rappeler la définition 17.22. 


36.2.1 Indépendance 


DEFooVYCUooKWvReO 
Définition 36.6 ([733]). 
Nous disons que les événements A1,..., A, sont indépendants si pour tout choix {i1,...,w} € 
{1,...,n} nous avons 
Les sous tribus A1,...,,4, sont indépendantes si pour tout choix À; € AÀ;, les événements À; 


sont indépendants. 


Exemple 36.7. 

Soit Q = [0,1] x [0,1] muni de la mesure de Lebesgue. Soient À = [0,a]x[0,1] et B = [0,1] x1[0,b]. 

Nous avons P(A) = a et P(B) = b ainsi que P(A N B) = ab. A 
LemIndepEvenCompl 

Lemme 36.8. 

Les événements (A;);=0...n sont indépendants si et seulement si les événements que nous obtenons 

en remplaçant certains des À; par CA; le sont. 


Démonstration. Sans perte de généralité, nous pouvons nous contenter de prouver que les événe- 
ments CAo, 4A1,..., 4, sont indépendants sous l'hypothèse que les événements 40, A1,..., A4, sont 
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indépendants. Soit Î un sous-ensemble de {1,...,n}. Nous avons 
iel iel iel 
= P((A;) - P([ Ain 40) (36.12b) 
iel iel 
P([) 4) (1 - P(CAo)) (36.12c) 
iel 
P([) 4;)P(CAo). (36.124) 
iel 
LemTribindepProdProb 
Lemme 36.9. 
Les tribus A1,...,,4, sont indépendantes si et seulement si 
P(A;n...n An) = P(A:)...P(4;) (36.13) 


pour tout À; € AÀ;. 


Démonstration. L'implication dans le sens direct découle immédiatement des définitions. 

Nous supposons avoir un choix (A;)i-1..n avec À; € À; et nous devons montrer que ces 
événements sont indépendants, c'est-à-dire que si J € {1,...,n} alors les événements (A;);e7 sont 
indépendants. Sans perte de généralité, nous pouvons supposer que si à € J, À; = (. Alors nous 


P(()4;) = P([ 4) = RES = [[P(4; (36.14) 


jeJ i=1 i=1 jeJ 


parce que P(4;) = P(Q) = 1 lorsque à n’est pas dans J. 


DefNJUkotc 
Définition 36.10. 
Nous disons que les variables aléatoires Xx: Q — R sont indépendantes lorsque les tribus 
engendrées? Ax,,..., Ax, le sont. 


Remarque 36.11. 
Il n’a de sens de dire que X3 et X2 sont indépendants que si X, et X2 sont des applications dont 
l’espace de départ est identique. 

Si nous voulons modéliser le jet de deux pièce indépendantes, le mauvais choix est de faire 
Q = {0,1}, y mettre la mesure d’équiprobabilité, et de considérer les deux variables aléatoires 


xiu) = {/ eo (36.15) 
p siw=l. 


Ces deux variables sont évidemment pas indépendantes. Il faut poser Q = {0,1} x {0,1}, y mettre 
la mesure d’équiprobabilité et poser 


ix—0 
X1(æ,y) = L ur (36.16) 

p sit=l 

iy=0 
Xa(x, y) = u on. (36.17) 

p siy=l 

Ces variables aléatoires sont indépendantes. Par exemple 

XL" {p} = {(1,0),(1,1)} (36.18a) 
X3'"{p} = {(0,1),(1,1)} (36.18b) 


2. Définition 14.6. 
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et on a bien 


P(XE {p} n Xz {p}) = P{(L,1)} = à (26.19) 
ainsi que 
PEXT (p)} = à (36.20) 
pouri=1leti= 2. 
PropMLbfRTKk 


Proposition 36.12. 
Soient (Xx: A — R%X) des variables aléatoires indépendantes. 


(1) Si By € Bor(R#). Alors 


P(Xy € BaVk < n) = P(X1€ B1)... P(Xn € Bn). (36.21) 
ItemHRjuTTii 


(2) Les événements {X; € B;} sont indépendants. TtemHRjuTTi ii 


(3) Les tribus engendrées par des X; et d’autres sont indépendantes. Plus précisément, si T et J 
sont deux ensembles disjoints de N alors les tribus 


o({Xiel}) (36.22) 


et 
o({Xi,ie J}) (36.23) 


sont indépendantes. 


Démonstration. Lorsque nous écrivons X; € B;, nous parlons de l’événement 
(X; € B;) = {we Q tel que X;(w) € B;} = X; '(B;)€ Ax.. (36.24) 


Vu que par hypothèse les tribus (.4;) sont indépendantes, le lemme 36.9 nous montre que 
nm 
P(f\XieB;) =[[P(Xe B;). (36.25) 
i=1 i 


Il reste à voir que l’ensemble X; !(B;) fait partie de la tribu À de départ. Cela est la définition du 
fait que l'application X,; soit une variable aléatoire : elle doit être mesurable en tant qu’application 


X;: (Q, 4) — (R%, Bor(R°)). (36.26) 


Les affirmations (2) et (3) ne sont que des façons alternatives d'exprimer la même chose. 


Proposition 36.13. 
Les événements (Aj)i=1..n sont indépendants” si et seulement si les variables aléatoires associées 
14,,...,14, le sont. 


Démonstration. La tribu engendrée par la variable aléatoire 14, est 
EqtribAAï 
Aa, = {9, Ar,CAg,Q)}. q 1668 


En effet si 1e B, alors À; € 13 (B), et si0 € B, alors CA; € 13: (B). Les éléments 0 et 1 sont 
tous deux soit dans B, soit hors de B. Cela donne les 4 possibilités énumérées dans (36.27). 
Supposons que les événements (4;) sont indépendants. Nous devons vérifier que les tribus le 
soient, c’est-à-dire que les événements 4; et CA; sont indépendants. Cela est une conséquence du 
lemme 36.8. 


3. Événements indépendants, définition 36.6. 
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PROPooSYNQooA1pGdl 
Proposition 36.14. 
Soient des variables aléatoires indépendantes X4: Q — R% et des fonctions boréliennes fr: R4% — 
IR?r. Alors les variables aléatoires 
Je O X% (36.28) 


sont indépendantes. 
Démonstration. Le théorème 14.116 assure que les applications 
Je o Xr: Q — RP* : (36.29) 


sont Ax,-mesurables. En particulier pour tout borélien B € R?#, nous avons X} lo Le 1(B)e Ax,. 
Nous avons donc 
o(frk° Xk) € o(Xk), (36.30) 


et par conséquent les tribus o(fx o Xx) sont indépendantes étant donné que les tribus o(X%) le 
sont. 


LEMooWBAZooLVVRj0 
Lemme 36.15. 
Soient des variables aléatoires X,Y : ( — E que nous supposons être indépendantes et identique- 
ment distribuées. Si f: E — F' est mesurable,alors les variables aléatoires f o X et foY sont 


indépendantes et identiquement distribuées. 
LemHOjqqw 


Lemme 36.16 (Lemme de regroupement|734]). 
Soit (Q,A, P) un espace de probabilité et (A;j);ier une famille de tribus indépendantes dans A. Si 
(Mj)jez est une partition de TI, alors les tribus 


B; — o( U À) (36.31) 


ieM; 


sont indépendantes. 
Si les variables aléatoires {X1, X2, X3, X4, X5} sont indépendantes, et si f et g sont des fonc- 
tions mesurables, alors les variables aléatoires f(X2, X3, X5) et g(X1, X4) sont indépendantes. 


36.2.2 Lois conjointes et indépendance 


Définition 36.17 (Loi conjointe et loi marginale). 
Si nous considérons n variables aléatoires réelles X1,..., XX»: Q — IR, la loi du n-uplet X — 
(X1,..., X») est une variable aléatoire X : Q — R” appelée la loi conjointe des lois X;. Dans ce 


cas, les variables aléatoires X; elles-mêmes sont dites lois marginales de X. 
PropPXXXPXPXPX 


Proposition 36.18. 
Les variables aléatoires {X;} sont indépendantes* si et seulement si 


Fix.) = Px, @...@ Px,. (36.32) 
DefFonrepCon)j 
Définition 36.19. 
Soient {X;}i<ien des variables aléatoires réelles (pas spécialement indépendantes). Une fonction 
f:R"—0R qui satisfait 
(Li) faim 0 pour tout (te: 0) ER 
(2) has Î 1}, 


(3) pour tout À; € R nous avons 


ItemDefFonrepConjiii 


P([\Xie 4;) | h f(a1,...,Tn)dr1 den (36.33) 
i=1 à hi 


4. Variables aléatoires indépendantes, définition 36.10. 
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est nommée densité conjointe de X3,...,X»n 
PROBooPVIXooNLpmIn 


ii Avertissement /question au lecteur !! 36.20 
Il manque un théorème d’unicité pour la densité conjointe. Ecrivez-moi si vous en connaissez un. 


PropDensiteConjIndep 
Proposition 36.21. 
Si les variables aléatoires X1,...X, sont indépendantes et ont des densités fx,,...,fx,, alors la 
variable aléatoire conjointe X = (X1,...,Xn) a pour densité conjointe la fonction 
fx, ...,Tn) = fre)... fx, (Œn). (36.34) 


Démonstration. En partant de la définition de l’indépendance et de la fonction de densité conjointe, 
ainsi qu’en utilisant le théorème de Fubini, 


(X1 € A1,..., Xn € An) 


P 
P(X1 € A1)... P(Xh € Ah) 
(J, Fe (man) . ([. a (and) (36.35) 


] Fe laiie..: Maldri.. din = 

A1X.…… An 

_ ] fe le fe ler. de. 
A1 XX A 


La fonction (x1,...,%n) — fx, (x1)...fx,(æ&n) vérifie donc la condition (3) de la définition 36.19. 
La vérification des autres conditions est immédiate. 


36.2.3 Espérance 
DEFooQKFBooCBZtRG 


Définition 36.22. 
Si X e L{(Q, A, P) est à valeurs dans R”", nous définissons l'espérance de X par 


E(X) = RO Fa) 


Pour l’espérance de f o X, il y a le lemme de transfert 36.83. 
La proposition suivante provient du fait que la mesure d’une loi conjointe est le produit des 
mesures lorsque les variables aléatoires sont indépendantes (proposition 36.18). 


PROPooDKQDooREiSSf 
Proposition 36.23 ([118]). 
Si les variables aléatoires réelles X1,...,X, sont intégrables et indépendantes, alors leur produit est 
intégrable et l’espérance® du produit est égal au produit des espérances : 
E(X1--.Xn) = E(X1)... E(Xh). (36.37) 
LEMooIVIWooUUVSt\W 


Lemme 36.24. 
Soit une variable aléatoire à densité X : Q — IR". Soit une fonction f: IR? — KR telle que pour 
tout choix ai < bi < a2 <... < an < by nous ayons 


P(XeÏ)= (E (36.38) 


où I — IL1l&, b;. 
Alors f est une densité pour X. 
PROBooAHJSooWUuJhb 


ii Avertissement /question au lecteur !! 36.25 
Je n'ai pas vérifié que ce lemme est correct. Soyez prudent. À mon avis ü doit être bon parce que 
les pavés donnés engendrent la tribu des boréliens d’une façon ou d’une autre. C’est à peu près ce 
qui est dit dans [735]. 

Écrivez-moi si vous avez une preuve où un contre-eremple. 


5. Espérance d’une variable aléatoire, définition 36.22. 
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36.2.4 Espérance 


Définition 36.26. 
Soit 1 < p < 0. Le moment d'ordre p d’une variable aléatoire X € sur (Q, A, P) est l’espérance 


mp(X) = E(X?) (36.39) 


pour autant que l'intégrale converge. 
LEMooEHTYooWmMAgf 


Lemme 36.27 (|1]). 
Soit un espace de probabilité ® ainsi qu’une variable aléatoire X: Q — IR prenant seulement les 
valeurs {yk}rken. Alors 


E(X) = Sy P(X = y). (36.40) 
k=0 


Démonstration. Vu que l'application X: Q — IR ne prend que les valeurs y,, nous avons Q = 
Le X-l{(yx), avec une union disjointe. Nous avons 


E(X) = RAC (36.41a) 
D I X(u) dP(u) SUBEQooVLTMonQEIRAT 
27 

- Du Lu AB(L) (36.41c) 
: > mP(XUu)) SUBEQOOKRHOOR UF EN 

k=0 
L ÿ mPUX = y) SUBEQooHDIBo que 

k=0 


Justifications : 
— Pour (36.41b), nous avons utilisé la o-additivité de l'intégrale de la proposition 14.203. 
— Pour (36.414), l'intégrale de la fonction 1 donne la mesure de la partie, c’est le lemme 14.170. 


— Pour (36.41e), la notation P(X = y) signifie P({w e Q tel que X(w) = y}) ; c’est la mesure 
de X—l(y). 


36.2.5 Somme et produit de variables aléatoires indépendantes 
subsecscnP?BfheuB“iEboSnpdp 


Proposition 36.28. 
La densité de la somme de deux variables aléatoires réelles indépendantes est le produit de convo- 
lution des densités : 


Lr = far (36.42) 


dès que X et Y sont indépendantes. 


Démonstration. Soient X et Ÿ, deux variables aléatoires réelles indépendantes. Nous voudrions 
étudier la loi de la variable aléatoire S — X + Y. Nous commençons par calculer la fonction de 
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répartition en utilisant le résultat de la proposition 36.21 : 


Fx4y(2) = P(X +Y < 2) = Î fxy (x, y)dx dy (36.43a) 
T+UY<Z 

= [ da Le dufx(æ).fv(u) (36.43b) 

_ J | ( [. fra) Éd (36.430) 

_ LE Fy(z—x)fx(x)dx. (36.434) 


Pour calculer la fonction de densité de S', nous dérivons la fonction de répartition : 


fxrv (2) = __ (2) (36.44a) 
= [ fy(e-zx)fx(x)dr, (36.44b) 


ce qui nous amène à dire que la densité de la somme est le produit de convolution © des densités : 


fev [ fv (x — +) fx (dt, ot 


ou encore fxiy = fx * fy. 


Notez que nous avons passé sous le silence la difficulté d’inverser la dérivée et l’intégrale. Un 
exemple sera donné au point 36.5.8. 
LemEXYEXEYprodindep 
Lemme 36.29. 
Soient X et Y, deux variables aléatoires indépendantes. Alors? 
E(XY) = E(X)E(Y). (36.46) 


Démonstration. Par indépendance et par proposition 36.21, la fonction de densité conjointe de X 
et Y vaut fxy = fxfy. Par conséquent l’utilisation de Fubini sous la forme (14.954) entraine 


E(XY) = [ UP y)dxdy = E(X)E(Y). (36.47) 


Nous dirons tout un tas de chose sur l’indépendance et la variance en 36.5.13, mais pour 


l'instant nous allons mentionner et démontrer déjà ceci : 
LemVarXpYsmindep 


Lemme 36.30. 
Soient X et Y deux variables aléatoires indépendantes et identiquement distribuées. Alors 


Var(X + Y) = Var(X) + Var(Y). (36.48) 


Démonstration. Par définition, Var(X + Y) = E([X +Y — E(X) — E(Y)]?). En développant le 
carré et en utilisant le lemme 36.29, 


Var(X +Y) = E(X?)- E(X})° + E(Y?) — E(Y}? = Var(X) + Var(Y). (36.49) 


6. Définition 27.55. 
7. Espérance d’une variable aléatoire, définition 36.22. 
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ExWLzkuWd 
Exemple 36.31. 
Deux variables aléatoires non indépendantes dont la covariance est nulle. Nous considérons la 
variable aléatoire 
Z:Q— {(1,0),(—1,0),(0,1),(0,—1)} (36.50) 


de loi uniforme. C'est-à-dire que P(Z : z) : : pour tout z. Ensuite nous considérons les variables 
aléatoires X = proj, 07 et Y = proj, 0Z. Toute personne étant capable de compter jusqu’à 4 
voit que 


P(X =1) = P(X = -1) (36.51a) 


1 
: (36.51b) 


et les mêmes probabilités pour Y. De même E(X) = E(Y) = 0. Par conséquent 
Cov(X,Y) = E(XY) = 0 (36.52) 


parce que pour tout w € ( nous avons soit X(w) = 0 soit Y(w) = 0. Ces variables aléatoires X et 
YŸ ne sont donc pas corrélées. 

Mais elles ne sont pas indépendantes pour autant, comme nous allons le voir pas plus tard 
qu'immédiatement. Nous avons 


P(X =0,Y = 0) 


P(X = 0|Y = 0) = FY =ù 


= 0 (36.53) 
parce que X et Ÿ ne peuvent pas être simultanément nulles, tandis que 
PLX =0)P0T = 0): (36.54) 


A 


Définition 36.32. 
Si E(X) = 0 nous disons que la variable aléatoire est centrée. La variable aléatoire X — E(X) est 
la variable aléatoire centrée associée à X. 


PropZBnsCgh 
Proposition 36.33 ([736, 737]). 
Soient deux variable aléatoires X,Y € L!(Q, A, P). Alors 
E(X + Y) = E(X) + E(Y). (36.55) 
Démonstration. Il suffit d’écrire 
E(X+Y)- [ (X + Y)(w)dP(u), (36.56) 
a 


et de faire jouer la linéarité de l’intégrale de la proposition 14.186. 


Une application de l'inégalité de Hôlder (proposition 27.33) est la suivante. Si X et Ÿ sont des 
variables aléatoires intégrables alors 


E(XY) < E(X?)/?E(y?)72. (36.57) 


En effet 
EqEXYleqXdYdNorm 
E(XY) < |XYInço < [Xl Y le). (50.58) 
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36.2.6 Variance 


Si Xe L?(Q, A4, P) alors nous définissons la variance de X par 
Var(X) = E([X — E(X)]°). (36.59) 
PrropVarAlterfrom 


Proposition 36.34. 
La variance de la variable aléatoire X peut être exprimée par la formule 


E 
Var(X) = E(X?) - [E(X)]? ERA) 
où X?=X - X et E(X)? = E(X) : E(X) sont des produits scalaires dans R‘. 
Démonstration. De façon explicite, nous avons 


E([X - E(X)P) = [ (X(w) — E(X)) + (X(w) - E(X))dP(w) (36.61) 


où E(X) € R est une constante. En développant le produit scalaire nous avons 


E([X - E(X)|) = E(X° -2X - E(X)+E(X)) (36.62a) 
= E(X NY VE(X) LECX) (36.62b) 
= E(X?) - E(X}°. (36.62c) 


Définition 36.35 (écart-type). 
Nous définissons l’écart-type de X par 


ox = VVar(X), (36.63) 
c’est à dire 
ox = |X — E(X)|72. (36.64) 


Définition 36.36 (moyenne quadratique). 
On définit encore la moyenne quadratique de X par 


1/2 
[XIz2 = [EX] "2. (36.65) 
Définition 36.37 (moyenne empirique). 
Si les X1,...,X, sont des variables aléatoires on considère la moyenne empirique 
=: D'ÉRTEED € 
Re ere (36.66) 
n 


Définition 36.38 (variance empirique). L 
Si (X1,..., Xn) sont des variables aléatoires, nous notons X, leur moyenne empirique, et la va- 
riable aléatoire 


Va = =D (Xi - Xn)° (36.67) 


est la variance empirique de l’échantillon (X;). 
LemEXYEXEYindep 
Lemme 36.39. 


Si X est une variable aléatoire, 
(1) Var(aX) = a? Var(X) pour tout ae R'; 


(2) Si de plus Y est une variable aléatoire indépendante de X, alors Var(X + Y) = Var(X) + 
Var(Y). 
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Démonstration. Nous avons 


Var(X +Y)= E(X?+Y?+2XY) — (E(X) + E(Y)) (36.68a) 
= E(X?) + E(V?) L9E(XY) = E(X) = E(FY) +9E(X)E(T). (36.68b) 


Étant donné que X et YŸ sont indépendantes nous avons E(XY) = E(X)E(Y) par le lemme 36.29. 


36.2.7 Covariance 


Soient X et Y, deux variables aléatoires réelles. Leur covariance est définie par 
Cov(X, Y) = El (X - E(X))(Y - E(Y))] Fa EU) 


L'idée est que la covariance devient grande si X et Y s’écartent de leurs moyennes dans le même 
sens. Il existe une formule alternative : 


Cov(X, Y) = E(XY) - E(X)E(Y) (36.70) 


En ce qui concerne les dimensions plus hautes, si X: ( — R% est un vecteur aléatoire de carré 
intégrable, nous définissons 


Cov(X) = E|(X  E(X))@ (X - E(X)) | FT 


où par a @ b nous entendons la matrice (a @ b);; = a;b;. Cela peut aussi être noté ab si l’on fait 


bien attention à qui est un vecteur colonne et qui est un vecteur ligne. 
PropoVarXpYCov 


Proposition 36.40. 
Si X et Y sont deux variables aléatoires non spécialement indépendantes, nous avons 


Var(X +Y) = Var(X) + Var(Y) + 2Cov(X,Y). (36.72) 
Démonstration. 1 s’agit d’un calcul en partant de 


Var(X +Y)=E((X+Y))-E(X+Y) 
= E(X?) + E(Y?) +2E(XY) 


9 : (36.73) 
+ (E(X) + E(Y)) —-2E(X)" -2E(X)E(Y) 
—2E(Y)E(X) -2E(Y). 
À partir d'ici il s’agit de recombiner tous les termes pour former la formule annoncée. 
Plus généralement nous avons la formule 
Var(S Xi) =) Var(Xi)+2 D, Cov(Xi, X;). (36.74) 
i i 1<i<j<n 
36.2.8 Probabilité conditionnelle : événements 
DEFooGJVHooVbhVYv 


Proposition-Définition 36.41. 
Soit (Q,A, P) un espace de probabilité et B € À avec P(B) > 0. Alors avec la formule 


Pal) = EE EqPre}eqn 


l’espace (Q, A, Ps) est un espace probabilisé. Nous notons P(A]B) le nombre PB(A) et nous le 
nommons probabilité conditionnelle de À sachant B. 
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Démonstration. On vérifie que (Q, À, Pg) est un espace de probabilité parce que PB(Q) = 1 et 


Pg([] À) = > P(Ai) (36.76) 


si les À; sont deux à deux disjoints. 


Une conséquence immédiate de (36.75) est que si À et B sont des événements indépendants 


alors 
P(AnB) 


P(3) 
La probabilité conditionnelle à B est quelque chose qui ne tient compte que de ce qui se passe 
dans B. Si K est un événement tel que À n B = K An B, alors 


P(AIB) = P(K|B). FaouE en, 


EXo01AYTooFjFTrT 


P(AIB) = — P(A). (36.77) 


Exemple 36.42 ([738]). 

Soient des événements À, B et X dont À et B sont indépendants. Intuitivement, nous devrions 
8 

avoir 


P(A]|B n X) = P(AIX). (36.79) 
Cela est faux. Prenez par exemple Q = {1,2,3,4} avec la mesure d’équiprobabilité. Ensuite À — 
{1,2}, B = {1,3} et X = {1,4}. Alors P(A) = 1/2, P(B) = 1/2 de telle sorte que 
1 


P(A4)P(B) = = P(ANB) (36.80) 


parce que À n B = {1}. Les événements À et B sont donc bien indépendants. Nous avons 


P(AIB n X) = RE L FU =, (36.81) 


bic P(ANX) 1/4 1 
n 
P(AÏX) = _ = —. .82 
pa 
ThoBayesEtAutres 
Théorème 36.48. 
Soient (Bn)n>1 une partition finie de Q telle que P(B;) > 0. Soit A € À tel que P(A) > 0. 
(1) Si À, B et C sont des événements, alors 
P(An B|C) = P(AIB n C)P(BIC). (36.83) 
(2) Si P(B) > 0, alors P(A n B) = P(A|B)P(B) = P(B|A)P(4). 
(3) On a la formule des probabilités totales : 
P(4) = ÿ P(AIB;)P(B;) = ÿ P(An Bi). (36.84) 
i=1 i 
(4) On a la formule de Bayes : 
P(AÏBk)P(Bx) 
P(BklA) = 36.85 
TS PAIBDP(B) 
Démonstration. (1) En développant le membre de droite, 
P(AnBnC)P(BnC) 
P(A n BIC) = 
EOAO PBnO PO (36.86) 


= P(An B|C). 


8. Probabilité conditionnelle, définition 36.41. 
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(2) C’est la définition de P(A]B) et P(B|A). 


(3) Vu que les B; forment une partition, nous avons 


P(4) = D P(An Bi) = Ÿ P(AÏB;)P(Bi). (36.87) 


(4) En utilisant les deux premiers points, nous trouvons 
P(AÏB:)P(Bx) = P(A n Bk) 
= P(Br|A)P(4) 


(36.88) 
= P(Bx|A) ,P(AIB:)P(B). 


Lemme 36.44 ([1]). 
Soient une variable aléatoire X : Q — R ainsi qu'un réel y £ 0 et qu'une partie À € ( de mesure 
non nulle*. Alors 
P(X14 = y) = P(X = y[A)P(A). (36.89) 

Démonstration. Juste pour être clair avec les notations, 

— La notation X = y désigne l’ensemble {w € Q tel que X(w) = y} = X-l(y) 

— De même X 114 = y désigne l’ensemble {w € Q tel que X(w)14(w) = y}. Comme ici y £ 0, il 

s’agit des éléments de À tels que X(w) = y, ou encore X_!{y) n À. 


Nous avons : 


P(X = À ] 
P(X = ylA) = ( y N À) PRO ET n 
P(4) 
_ P(ATA = y) SUBEQooDAATooBe 
- &50P) 
Justifications : 
— Pour (36.90a), c’est la définition 36.41. 
— Pour (36.90b), vu que y 0 nous avons 
{w € ( tel que X(w) = y} n À = {we Q tel que (X14)(w) = y}. (36.91) 
LEMooRDXRooQLMRGF 


Lemme 36.45 ([1]). 
Soit un espace de probabilité (Q,F,P). Nous considérons un mesurable B € F ainsi que des 
mesurables (A;);en deux à deux disjoints. Alors 


00 00 
P(|[J 418) = ÿ P(AIB). (36.92) 
i=0 i=0 
Démonstration. Nous commençons par la définition 36.41 de la probabilité conditionnelle : 


P(B) P(B) 


P(UJAI1B) _ P(UAinB) _ P(U(4 0 B)) EQooRUXHOON Eng 


Ensuite, les À; étant disjoints, les À; n B le sont aussi. Vu que P est une probabilité (et donc une 
mesure), elle vérifie la condition de la définition 14.18(2), qui donne ici 


P( [ca n B)) = P(A;nB). (36.94) 
i=0 i=0 


9. Ceci est exactement synonyme de « un événement de probabilité non nulle ». 
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En remettant dans (36.93), 


P([JAIB) DE 2 2, P(AIB). (36.95) 


LEMooVYDTooGELPRY 
Lemme 36.46 ([1]). 
Soient des ensembles E, F, G. Soit une application f : E x F — G. Soient des éléments a € G, 
x € E. Nous considérons des variables aléatoires X:Q — EE tY:Q—#F. 
Soit BE Q tel que X(w) = x pour tout w € B. Alors nous avons 


P(f(X,Y) = alB) = P(f(x,Ÿ) = a|B). (36.96) 


Démonstration. Posons À = {w € ( tel que f(X(w), Y(w)) = a}. Ce que nous cherchons à calculer 
est P(A|B) qui est défini en 36.41. En posant 4’ = {we Q tel que f(x, Y(w)) = a}, nous avons 


AnB={wen tel que f(X(w), Y(w)) = a,we B} (36.97a) 
= {we Q tel que f(x, Y(w)) = a,w e B} (36.97b) 
= An B. (36.97c) 

nee P(AnB) P(4nB) 
n n ” 
PAIE) = 5 Fm PA) (36.98) 
LEMooZTBSooLemswG 


Lemme 36.47 ([1]). 
Soient des ensembles E; (i = 1,...,n), F et E. Soient des variables aléatoires X;: Q — FE; et 
Y:Q—EF, et une application f: E1 x... x En — F. 

Nous supposons que Y est indépendante des X;. Pour ye E et 2€ F' nous avons 


Pres) 6) = PTS) (36.99) 
LEMooWAOSooBsGucQ 
Lemme 36.48 ([1]). 
Soient des variables aléatoires X;: Q — E; (i=1,...,n) et Yi: Q — F;. Nous supposons qu’elles 
sont toutes indépendantes. Nous considérons des applications f: FE x...xE, — Set g: FX Fm — 
T. Alors les variables aléatoires 


wr> f(X1(w),..., Xn(w)) (36.100) 
et 
wi g(Y1(w),..., Ym(w)) (36.101) 


sont indépendantes. 


36.2.9 Espérance conditionnelle 
ThoMW£DPQ 


Théorème-Définition 36.49 (Définition de l'espérance conditionnelle[598]). 
Soit un espace de probabilité (Q, À, P) et une variable aléatoire intégrable X : Q — R. Pour chaque 
sous tribu F de À, il existe une (presque partout) unique variable aléatoire Y : ® — R telle que 


(1) Y est F-mesurable 
(2) Y est P-intégrable 
(3) pour tout BEF, 


[ XdP = [ YdP. F0) 


36.2. 
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Cette variable aléatoire sera notée E(X|F) pour des raisons qui apparaîtront plus tard. 


Démonstration. Remarquons que prendre Y = X ne fonctionne pas parce qu’en général si © est 
mesurable dans R, alors X-{(©) est dans la tribu À, mais n’est pas automatiquement dans la 
tribu F. Il faudra donc un peu plus travailler. 


(1) 


Uñnicité Si YA et Y2 vérifient tous les deux les conditions, l’ensemble {Y1 < Y2} est un 
élément de F et nous avons 


Ï X = Yi = J ÿ. (36.103) 
{Y1<Y} Y<Y Y<Y 


En particulier nous avons re =} — Y2) = 0 et donc 
M - Y)lrier = 0 (36.104) 


presque partout. Le corolaire 14.193 montre alors que Y1 — Y2 > 0 presque partout. De la 
même manière, l’ensemble {Y2 < Y1} est dans F et nous trouvons que Y2 — Y1 > O0 presque 
partout. Par conséquent Y1 = Y2 presque partout. 


Existence dans le cas de carré intégrable 


Nous supposons à présent que X € L?(Q,.4, P) et nous considérons X, le sous-ensemble de 
L?(Q, À, P) des fonctions F-mesurables. Le théorème des projections 25.7 nous indique que 


L(Q,A4,P)=KOK! (36.105) 
par la décomposition X = projx À + (X — projx X). La variable aléatoire Y = projx X 


a les propriétés d’être F-mesurable et {Y — X,7 = 0 pour tout Z € K. Soit AE F, si nous 
considérons Z = 11, la dernière condition signifie que 


[xu- | Y14, (36.106) 
a ® 


ou encore 


h Y = k X. (36.107) 


La variable aléatoire Y = projx(X) répond donc à la question lorsque X € L?(Q, A, P). 


Existence en général 


Nous considérons maintenant que X € L'(Q, 4, P). Quitte à décomposer X en deux fonctions 
positives X}, et X_ telles que X = X}, + X_, nous pouvons supposer que X est positive. 
Par hypothèse X € L!(Q,4, P); pour chaque n € IN nous posons 


Xn(w) = min{X{(w),n}. (36.108) 


Étant donné que la mesure P est une mesure de probabilité, les constantes sont intégrables 
et X, € L?(Q, A, P). De plus la suite (X,) est croissante et 


lim Xn(w) = X(w). (36.109) 


n—00 


Si nous notons encore K l’ensemble des variables aléatoires dans L?(Q, 4, P) qui sont F- 
mesurables, pour chaque n nous avons donc la variable aléatoire 


Yn = projx Àn = E(XnlF) (36.110) 


qui est }-mesurable et telle que 


[. Xn = h Ya (36.111) 
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pour tout À € F. Nous voudrions prouver que la variable aléatoire Y = lim, Y, existe et est 
la solution au problème, c’est-à-dire est E(X|F). 

Commençons par prouver que Ÿ, > 0 presque partout. Pour cela nous remarquons que 
l’ensemble {Y, < 0} est mesurable et 


0 > J F— x 0 (36.112) 
Yn <0 Yn <0 


La première inégalité est évidente et la dernière est due au fait que X, est positive. Par 
conséquent 


J Yh = 0 (36.113) 
Yn<0 


et le lemme 14.193 conclut que P(Y, < 0) = 0. 
Soit Z: (Q — R une variable aléatoire positive dans L?(Q, A, P). Montrons que projx Z est 
encore positive. Pour cela nous considérons l’ensemble À = {projx Z < 0} et les inégalités 


o< | z= | projr Z < 0, (36.114) 
À A 


ce qui montre que [,projx Z = 0 et par conséquent que P{projx(Z) < 0} = 0. Cela nous 
montre que la projection depuis L? conserve la positivité. 


Etant donné que X,+1 — X, > 0 nous avons aussi 


OR D (36.115) 
La suite de fonctions 
ne Yn = E(XhlF) (36.116) 
est croissante et vérifie le théorème de la convergence monotone : 
Î Fc - Î EXP) = ] nn SOC ] Y. (36.117) 
à n—00 A n— 00 A A n— 00 A 


Par conséquent E(X|F) existe et 


Y = lim E(XalF) = E(X|F). (36.118) 


NORMooHPHOooUuJWHR 
36.50. 
Vu la définition 36.49 nous pourrions croire que la variable aléatoire E(X|F) = X fait l'affaire. Il 
n’en est rien parce que la variable aléatoire X n’est pas spécialement ÆF-mesurable alors qu'il est 
requis que E(X|F) le soit. Avec la tribu F = {@,{}, nous n'avons en général pas que X-!(B)e F 
pour tout borélien B. 

Par contre si o(X) est la tribu engendrée par la variable aléatoire X, alors E(X|o(X)) = X. 
DefooKIHPooMhvirn 

Définition 36.51. 
Soit Z une variable aléatoire. L’espérance conditionnelle « X sachant Z » est la variable aléa- 
toire 


E(X|Z) = E(X|o(Z)) (36.119) 


où o(Z) est la tribu engendrée par Z. Le membre de droite est une variable aléatoire définie 


en 36.49. 
DEFooEYVCooCeyOXW 


Définition 36.52. 
Soient À € À un événement et F une sous-tribu de A. Nous définissons P(A|F) par 


P(AIF) = EGP). (36.120) 
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Notons que cela est une variable aléatoire et non un réel. Le membre de droite est l’espérance 
conditionnelle de la variable aléatoire 14 par rapport à F définie en 36.29. 
Et l’espérance conditionnelle d’un événement par rapport à une variable aléatoire est : 


E(A|X) = E(Alo(X)). (36.121) 


Proposition 36.53. 
Soit un espace probabilisé (Q, A, P) ainsi qu’une variable aléatoire X à valeurs dans R‘, et un 
événement A. Alors 

E(P(A|X)) = P(A). (36.122) 


Démonstration. Tout le point de la preuve est de remarquer que E(14) = E(14|X). 


(1) La formule E(14) = E(14|X) 


La notation E(14|X) est un raccourci pour écrire la variable aléatoire E(14|o(X)). Cette 
dernière est l’application ® — R4 telle que 


] E(1alo(X)) -| 14 (36.123) 
B B 


pour tout borélien B de R% tout en étant o(X)-mesurable. Comme expliqué en 36.50, il est 
tentant de dire E(1alo(X)) — Î14, mais ce n’est pas le cas parce qu’il n’y à aucune raisons 
que 14 soit une application o(X)-mesurable. Au niveau des espérances, par contre, l'égalité 
tient : 


E(E(14|X)) = k E(14|X) = [ 14 = E(14) (36.124) 


où nous avons utilisé le fait que Q lui-même soit o(X)-mesurable. 
(2) La preuve 


Nous avons alors 
P(4) = E(14) = E(E(4lX)), (36.125) 


alors que E(14]X) = P(A]X). En mettant l’un dans l’autre : 


P(A) = E(P(AIX)). (36.126) 


PropRGcscX; 
Proposition 36.54 (Transitivité de l’espérance conditionnelle). 
Si B2 € B1 € À alors 
E(E(XIB:)\B&) = E(X|B»). (36.127) 


Démonstration. Si B € B2, nous avons 
Ï E(E(X1|B:)|B2)dP = ] E(X|B1)dP = ] XdP. (36.128) 
B B B 


La première égalité est la définition de l’espérance conditionnelle par rapport à B:. La seconde 
égalité est celle de l’espérance conditionnelle par rapport à B: et le fait que B € B3 € B:. Ce que 
nous avons prouvé est que 


E(E(X|B:)|B2) (36.129) 


est une variable aléatoire B2-mesurable vérifiant la condition 


] E(E(X|B:)|B2) - | E(X|B2) (36.130) 
B B 


pour tout B € B:. C’est donc E(X]|B2) par la partie unicité du théorème 36.49. 
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Proposition 36.55. 

Soit (9,F,P) un espace de probabilité, soit À une sous tribu de F et X, une variable aléatoire F- 
mesurable et intégrable. Alors la variable aléatoire E(X|A) du théorème 36.9 est l’unique (presque 
partout) variable aléatoire à être A-mesurable telle que nous ayons 


E(E(X|A)Y) = E(XY). (36.131) 
pour toute variable aléatoire Y A-mesurable. 


Démonstration. Supposons pour commencer que Ÿ soit une fonction simple positive, alors Y — 
nm 
D; &lp, et nous avons 


[ E(X|Y) = D a Ï. E(X|A) (36.132a) 


=), ] Le (36.132b) 
i Ei 


= [ XY. (36.132c) 
a 


Maintenant si Ÿ est mesurable et bornée, elle est limite croissante de fonctions étagées bornées 
(proposition 14.115) et le résultat tient par la convergence monotone, théorème 14.173. 

Si Ÿ n’est pas positive, nous séparons Ÿ = Y} — Y_. 

Pour l’unicité, soit Z et 7’ deux variables aléatoires telles que pour toute variable aléatoire Y, 


| 2v = | xy=| ZY. (36.133) 
Q ® A 


Si nous prenons Ÿ = 1{74z1, nous avons 


o= | (GT lens - | pu n, (36.134) 
Q ZEZ! 


d’où le fait que P(Z Æ 77) = 0. 


Si X est une variable aléatoire dont la tribu engendrée est indépendante de la tribu F, nous 
voudrions que la connaissance de F n’influence pas la connaissance de X, c’est-à-dire que 


E(X|F) = E(X). (36.135) 


Ce que nous avons est même mieux. Nous avons le lemme suivant qui dit que conditionner une 
variable aléatoire par rapport à une tribu indépendante ne change pas notre connaissance de la 


variable aléatoire. 
LemxUZFPV 


Lemme 36.56 ([118]). 
Les tribus F1 et F2 sont indépendantes si et seulement si 


E(U|F) = E(U|R) = E(U) (36.136) 


pour toute variable aléatoire U étant F\-mesurable. 


Ici, par E(U) nous entendons la variable aléatoire constante prenant la valeur numérique E(U) 
en tout point de (1. 


Démonstration. Si F1 et F2 sont indépendantes, alors pour tout B € F2 nous avons pasGagx 
] UdP = E(U1g) (36.137a) 
B 
b 
= E(U)E(13) ME RE r) 
= E(U) [ 1rdP (36.137c) 
Q 
— [ E(U)dP. (36.137d) 


Justifications. 
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— L'intégrale | BUdP a un sens même si B € F2 alors que U est F,-mesurable. Le supremum 
(14.461) définissant l'intégrale est tout de même bien défini, en particulier, l’ensemble sur 
lequel on prend le supremum est non vide. 


— Pour (36.137b), la variable aléatoire U est F1-mesurable (donc la tribu engendrée par U 
est dans F1) alors que 18 est F2-mesurable. Les tribus engendrées étant indépendantes, les 
variables aléatoires le sont et nous pouvons décomposer l’espérance. 


Ce que montre le calcul (36.137) est que E(U) est une variable aléatoire F2-mesurable (parce que 
constante) dont l'intégrale sur chaque élément de F2 vaut l'intégrale de U. Par la partie unicité du 
théorème 36.49, nous déduisons que E(U) = E(U|F2). 

Pour l’autre sens, écrivez-moi si vous avez une démonstration. 


CorakyvMp 
Corolaire 36.57. 
Si X est une variable aléatoire et si F est une tribu, alors 
E(E(X|F)) = E(X). (36.138) 
Démonstration. Il suffit d'appliquer la définition (36.102) à B = Q : 
E(E(XIF)) = [ E(XIF)(w)dP(w = [xt X(W)dP(w) = E(X). (36.139) 


Exemple 36.58. 
Soient X1, X2 deux variables aléatoires à valeurs dans {0,1} avec probabilité 1/2 et indépendantes. 
Nous considérons $ = X3 + X2. La situation est modélisée par l’espace 


Q = {(0,0), (0,1), (10), (1,1)} (36.140) 

et les variables aléatoires 
X; (wi, wo) = (36.141a) 
S(w1,wo) = W] + Wo. (36.141b) 


Pour vérifier que de cette manière nous avons bien que X; est indépendante de X2, nous commen- 
çons par voir les tribus associées. Un ouvert de R soit contient 0 et 1, soit contient un seul des 
deux soit n’en contient aucun des deux. En appliquant X} là chacune de ces quatre situations 
nous voyons que la tribu o(X;) est 


Fi = a(X1) s {{(0,0), (0, DECO), (1,1)},9, 2}. (36.142) 


De la même façon nous avons 


F2 = o(X1) = {{(0,0),(1,0)},{(0,1),(1,1)},0, 2}. (36.143) 
Nous posons 
Ao = {(0,0),(0,1)} (36.144a) 
A1 = {(1,0),(1,1)} (36.144b) 
Bo = {(0,0),(1,0)} (36.144c) 
B1 = {(0,1),(1,1)}. (36.144d) 


Étant donné que A; n B; = (i,j), nous avons toujours que P(A; n B;) = } = P(A;)P(B;). 
L'indépendance est donc assurée. 


2548 CHAPITRE 36. VARIABLES ALÉATOIRES ET THÉORIE DES PROBABILITÉS 


Calculons l’espérance conditionnelle E(S|F;). Une fonction F-mesurable doit être constante 
sur A6 et A1, donc l’espérance conditionnelle est une fonction constante sur 49 et À; dont l'intégrale 
sur ces ensembles est égale à l’intégrale de S. Nous avons en particulier 


[. E(S|F1) = [. 5, (36.145) 


c’est-à-dire 
E(S|71)(0,0) + E(S|F:)(0,1) = S(0,0) + S(0,1) = 1. (36.146) 


Nous en concluons que E(S|F1)(0,0) = E(S|71)(0,1) = À. Cela correspond à l'intuition que si on 
est au point (0,1) ou au point (0,0) en ne sachant que X;, nous ne savons que le premier zéro, et 
donc l’espérance de la somme est 1. 

Un calcul très similaire montre que 


E($|7)(1,0) = E(S|F)(1,1) = L (36.147) 


Cela correspond au fait qu’en ces points, nous ne savons que le fait que le premier tirage a donné 
1, et donc que l'espérance est 5. 

Complétons ce tour d’horizon en mentionnant que la tribu engendrée par X3 et X2 est la tribu 
des parties de (, de telle façon que l’espérance conditionnelle de $ sachant X: et X2 est égale à 


1: A 
PropRNBtfql 


Proposition 36.59 ([118]). 
Soit (Q, À, P) un espace probabilisé et X,Y deux variables aléatoires sur Q réelles. Soit B une sous- 
tribu de A. Nous supposons que X € L1(Q,A,P), que Z € L°(Q,B,P) et que XZ € L'(Q,P). 
Alors 

E(ZX|B) = ZE(X|B) (36.148) 


presque surement. 


Démonstration. Nous commençons par prouver que 


[ ZE(XIB) = [ ZX. DEN EU) 


Si Z = Îg pour un ensemble B € B, alors cette égalité est vraie par définition de l’espérance 
conditionnelle !°. Donc cette égalité est correcte tant que Z est une variable aléatoire B-mesurable 
et étagée. Nous considérons alors, grâce au lemme 14.113, une suite Z, de variables aléatoires 
étagées et B-mesurables avec [Z,| < Z. Pour chaque n nous avons donc 


[ ZX= [ ZnE(X|B). FES) 


Notre idée est de passer à la limite. Vu que Z et Z, sont bornées (et donc intégrables sur Q), 
pour chaque n nous avons [Z, X| < M|X| où M majore Z et donc tous les Z, de façon uniforme 
vis-à-vis de n. Tout cela pour dire que le théorème de la convergence dominée fonctionne et que 


lim | ZX = [ ZX. (36.151) 
Q 


n—00 a 


D'autre part vu que X € L!' et que { € B nous avons l'égalité fo E(X1B) = {, X, ce qui prouve que 
|E(X]|B)| est intégrable. Cela nous permet d'utiliser encore la convergence dominée avec l'inégalité 
[Zn E(X|B)| < M|E(X]|B)| pour écrire 


Jim [ ZnE(X|B) = [ ZE(XIB). (36.152) 


10. Théorème 36.49. 
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En passant à la limite des deux côtés de (36.150) nous avons donc 
[ ZE(X|B) = | ZX. (36.153) 
Q Q 
L'égalité (36.149) est prouvée. 


Nous passons maintenant à la preuve de l'égalité demandée : E(ZX|B) = ZE(X]|B). Pour cela 
il faut montrer que pour tout B € B nous avons 


J ZE(X|B) = Ï ZX. (36.154) 
B B 


Cela n’est rien d’autre que l'égalité (36.149) que nous venons de prouver avec ZI au lieu de 
Z. 


Proposition 36.60. 
Soit une variable aléatoire réelle X € L'(Q,A,P). Pour toute variable aléatoire Y : A — Rd, à 
existe une fonction borélienne Aÿ-mesurable h: RŸ — R telle que 


E(X|Y)=hoY. (36.155) 


Démonstration. Nous utilisons le résultat de Doob (théorème 14.116). Par définition E(X|Y) est 
une variable aléatoire réelle Ay-mesurable, et il existe une fonction borélienne h: R° — R telle 
que E(X|Y) = hoY. 


Cette fonction h:RŸ— R nous permet de définir 
E(XIZ = 2)=h(2). (36.156) 


Cela est l’espérance conditionnelle d’une variable aléatoire par rapport à une valeur donnée d’une 
autre variable aléatoire. 


DEFooOUMLCooJgrbpx 
Définition 36.61 (Espérence conditionnelle à un événement|739]). 
Si X est une variable aléatoire et si À est un événement, nous définissons 
E(X14) 
E(X |A) = —— 36.157 
MA = TE (36.157) 
Pour rappel, la définition de l’espérance d’une variable aléatoire est 36.22. 

LEMooRTVBooCEelIxL 


Lemme 36.62 ([1]). 
Soit un espace de probabilité (Q,F, P). Nous considérons une variable aléatoire X à valeurs réelles, 
prenant ses valeurs dans la partie dénombrable 


{0} LU {yr}ren (36.158) 


avec yx Æ 0. Si À est mesurable dans (À, alors 
00 
E(X1A) = Ye P(X = wlA), (36.159) 
k=0 


c’est-à-dire que nous prenons la somme sur les valeurs non nulles atteintes par X. 


Démonstration. Nous partons de la définition 36.61 de l’espérance conditionnelle : E(X]A) = 
E(X14)/P(A). La variable aléatoire X 14 peut prendre les valeurs 0 et y,. Nous pouvons utiliser 
le lemme 36.27 pour écrire 


B(X 14) = 0 x P(X La = 0) + YPO = me) = Ÿ yeP(X LA = gp RER 
k=0 k=0 
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Afin de traiter le dernier terme, nous prouvons que {X14 = y} = Xl(y;) n A. En effet si 
we {X14 = y}, c'est que 
X(w)1A(w) = yk. (36.161) 


Mais dans notre cas, y, # 0, donc 14(w) = 1, ce qui signifie w € À. Donc we À et X(w) = y, ce 
qui signifie w € X_!(y) n À. Nous avons donc 


P(X1A = yx) = P(X (y) n A). (36.162) 
En utilisant (à l’envers) la définition de la probabilité conditionnelle 36.41, 
P(X 14 = yx) = P(X  (yx)|A)P(A). (36.163) 
En remettant ça dans (36.160) et dans la définition de E(X|A), 


B(x14) = Dino P OLA = ve) _ Fa 2 PU -ul4)P = DuPOX = ul4) (86160 
k=0 k=0 


P(A) 


36.2.10 Probabilité conditionnelle : tribu 
Soit un espace probabilisé (Q, 4, P). 
LEMooXXTYooZCXiVr 
Lemme 36.63. 
Soit (B;)ien une partition de ® en éléments de À deux à deux disjoints tels que P(B;) Æ 0. Soit F 
la tribu engendrée par les B;. Une variable aléatoire réelle est F-mesurable si et seulement si elle 
est constante sur chaque B;. 


Proposition 36.64. 
Soit (B;)ien une partition de Q en éléments de À deux à deux disjoints tels que P(B;) £ 0. Soit 
F la tribu engendrée par les B;. Soit une variable aléatoire X. Alors nous avons : 


E(X|F) = Y Ga [, xdP) ln FA RES 


ieN 


Démonstration. Si X est une variable aléatoire, alors la variable aléatoire E(X|F) définie en 36.49 
est une variable aléatoire F-mesurable et elle est donc constante sur les ensembles B; par le 
lemme 36.63 : 
E(XIF) = ÿ «lg, (36.166) 
ieN 


Étant donné que, par construction, B; est F-mesurable, nous avons 
Ï, XdP = Ï, E(X|F) = Zu, 15, = 2iasdsP(B; = a; P(B;). (36.167) 
Par conséquent 
1 
= —— | XdP 36.168 
P(B;) [, ) 
et 


E(X|F) = ÿ: Ga [, xaP) 1p,, (36.169) 


ieN 


ce qu'il fallait. 


Notons que si B € À alors la tribu engendrée par B est aussi celle engendrée par la partition 
{B,CB} de (. Cette circonstance nous permet d’aller plus loin. 
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Proposition 36.65. 
Soit un espace probabilisé (Q, A, P) et un événement B € A avec sa tribu engendrée F = o(B). 
Alors 

E(LAlF) = P(AIB)15 + P(ACB)lg. (36.170) 


Démonstration. Nous allons particulariser la formule (36.165). Si B € À nous considérons la par- 
tition {B,CB} de { et la tribu engendrée 


F =4{9,B,CB,Q}. (36.171) 


La formule (36.165) devient 


E(X|F) = ee [ xaP) 1 + (on : xaP) lg. (36.172) 


Si nous considérons À € À, nous écrivons cette égalité avec X = 14 pour obtenir 


P(ANnB) 
P(B) 


P(AnCB) 
P(CB) 


E(LAlF) = 1g + leg = P(A|B)18 + P(AÏCB)les (36.173) 


parce que nous avons reconnu la probabilité conditionnelle P(A|B) de la définition 36.41. 


Remarque 36.66. 
Le nombre P(Alo(B)) = P(1alo(B)) n’est pas la probabilité conditionnelle de A sachant B. 


Il nous reste à définir la probabilité conditionnelle d’un événement relativement à une variable 


aléatoire. 
DEFooFRLFooNvXuPK 


Définition 36.67. 
Si la variable aléatoire X est à valeurs discrètes, nous disons que P(AÏX) est la variable aléatoire 
de valeur 

P(A|X)(w) = P(A]X = X(w)). (36.174) 


Dans le cas d’une variable aléatoire à valeurs continues, cette définition ne fonctionne pas parce 
que la condition X = X(w) est souvent de probabilité nulle, tandis que c’est toujours une mauvaise 
idée de conditionner par rapport à un événement de probabilité nulle. C’est la base du paradoxe de 
Borel. La bonne définition du conditionnement de l’événement À par rapport à la variable aléatoire 


X est 
DEFooIUJMooBAVtMW 


Définition 36.68. 
Si À est un événement et X une variable aléatoire à valeurs continues dans R, nous définissons 


P(A|X) = P(Alo(X)) = E(1alo(X)). (36.175) 
La première égalité est une notation. La seconde est la définition. 


Cette définition s’appuie également sur la définition 36.49. 


Proposition 36.69. 
Si X est une variable aléatoire et si À est un événement, alors 


E(P(AÏX)) = P(A). (36.176) 


Démonstration. Nous commençons par le cas discret, c’est-à-dire À: ( — IN. Nous notons px — 
P(X = k). En décomposant l'intégrale sur Q par rapport à l’union disjointe 


PE U Az = U {w € ( tel que X(w) = k}, (36.177) 
keN keN 
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nous obtenons 


E(P(AIX)) = FA w)dP(w) (36.178a) 
= ] P(AIX = X(w))dP(u) (36.178b) 
k=0 Ÿ Ak 
= a e L D Pa) dans 4x, X(w) = k (36.178c) 
k Ak 
i 
= » PA nX=k) le 1dP(w) (36.178d) 
=P(Ax)=pr 
=) P(ANX=Rk) (36.178e) 
k 
= P(A). (36.178f) 


Nous devons maintenant prouver la propriété dans le cas où X prend des valeurs continues. Pour 
cela il suffit d'appliquer le corolaire 36.57 : 


E(E(1a|o(A))) = E(14) = P(A). (36.179) 


36.2.11 Variables de Rademacher indépendantes 
SUBSECooWOUGooVxf1vz 
Une variable aléatoire de Rademacher est une variable aléatoire qui prend les valeurs 1 et 
—1 avec probabilité 1. Nous pouvons en décrire une explicitement de la façon suivante. L'espace 
probabilité est à deux éléments : Q = {a,b} avec la mesure P({a}) = P({b}) = à. La variable 

aléatoire est alors l’application X : (Q — R donnée par X(a) = 1 et X(b) = —1. 
Soient X et Y deux variables aléatoires de Rademacher indépendantes. Cela donne Q = {a, b}? 

et 

X(a,a)=1 X(a,b)=1  X(b,a) =—-1 X(b,b) = —1 


Remarque 36.70. 

Si une variable aléatoire d’un certain type est donnée par une application X:(Q — IR, pour 
construire des variables aléatoires indépendantes identiquement distribuées, il faut considérer les 
variables aléatoires sur (au moins) le produit Q x Q muni de la mesure produit. 


(1) Tribu du produit XY 


Quelle est la tribu de la variable aléatoire produit XY ? Le produit XY peut prendre les 
valeurs 1 et —1. Nous avons 


(XY)-1(1) = {(a, a), (b,b)} (36.181a) 
(XY)-1(-1) = {(a,b), (b, a)} (36.181b) 

La tribu est donc 
o(XY) = {0,9,A,B} (36.182) 


avec À = {(a,a),(b,b)} et B = {(a,b),(b,a)}. 
Calcul de E(X|XY) 


La définition de l’espérance à calculer est le théorème 36.49. Pour chaque élément B de 
o(XY) nous avons besoin de [,, X = {, E(X]XY). Nous notons V = E(X}XY) pour alléger 
la notation. Nous avons 


2 
ND 
KE? 


4 J V = V(a, a) + V(6,b) (36.183) 
A 
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et 
1 X=X Ext; (36.184) 
A 


Pourquoi le facteur 4? Parce que sur ®? nous avons la mesure produit de celle que dont nous 
avions parlé sur {a,b}. C’est la mesure d’équiprobabilité et donc chaque singleton a mesure 
1/4. Pour plus de détails, il y a le théorème 14.239. 


Nous en déduisons V(a, a) + V(b,b) = 0. Mais pour tout te R nous avons V7 {(t) e o(XY) 
parce que la contrainte est que V soit XY-mesurable. En particulier 


V'(V(a, a)) (36.185) 


est un mesurable qui contient (a, a). C’est donc soit (, soit {(a, a), (b,b)}. Dans les deux cas 
nous avons V(a,a) = V(b,b) et nous en déduisons V(a, a) = V(b,b) = 0. 

En faisant de même avec , V = V(a,b) + V(b, a) nous déduisons V(a,b) = V(b,a) = 0 et 
au final nous avons 


E(X|XY) = 0. (36.186) 
Cette égalité signifie E(X|XY )(w) = 0 pour tout w € (2. 


(3) Calcul de E(X|X +Y) Il ne faudrait pas croire que, seulement parce que X a une es- 
pérance nulle, nous trouverons une espérance nulle quel que soit le conditionnement. Juste 
pour le plaisir, nous calculons E(X|X + Y). 


La variable aléatoire X + Ÿ peut prendre trois valeurs : —2, 0 et 2. La tribu engendrée par 
X +Y doit en particulier contenir À = {(a,a)}, B = {(b,b)} et C = {(a,b),(b,a)}. 
Nous notons V = E(X|o(X +Y)). Vu que 


[. pe L X, (36.187) 


nous avons V(a,a) = X(a,a) = 1. Même chose pour B qui donne V(b,b) = X(b,b) = —1. 
En ce qui concerne l'intégrale sur C nous avons 


Ve davioe ans 0 0 FQooGiDroR tie 


Par ailleurs l’ensemble V-! (V(a, b)) est un ensemble mesurable qui doit au moins contenir 
(a,b). Vu la tribu que nous avons, cela doit également contenir (b,a), de telle sorte que 
V(a,b) = V(b, a). La relation (36.188) nous permet alors de conclure que V(a,b) = V(b,a) = 
0. 


Quoi qu’il en soit, l'espérance conditionnelle E(X|X + Y) n’est pas nulle. 
(4) Calcul de E(XY|o(XY )) . Celle-là, elle est facile par 36.50 : c'est XY. 


Nous aurions pu croire que si X et Ÿ sont indépendantes, alors 
EQooHSVC 
E(XY |A) = E(XIA)E(Y A). RooHS Con seen 
L'exemple que nous venons de faire montre qu’il n’en est rien. 


Exemple 36.71 ([740]). 

Un autre exemple, peut-être plus simple, pour contredire l'équation (36.189). Soient X et Y des 
expériences indépendantes de pile ou face non truquées. Les résultats sont représentés par 0 et 1. 
Nous notons À la tribu engendrée par l'événement « les résultats des deux lancers sont différents » ; 
c'est-à-dire la tribu engendrée par l'événement À = (1,0),(1,0). La variable aléatoire X et la tribu 
À sont indépendants (définition 36.6), donc, donc E(X|A) = E(X) = 1/2. Pareil pour Ÿ. En 
revanche, le produit XY est nul sur À donc E(XY |A) aussi. Ça ne peut donc être égal à la 
constante 1/4 = (1/2)2. A 
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36.2.12 Un petit paradoxe 
subSecGXVYooTDdZaB 


Attention : ce qui est écrit ici est ma réflexion personnelle sur le sujet. Merci de me dire si je 
me trompe. 
Soit une famille dont vous savez seulement qu'il y a exactement deux enfants koi situatiqnss 


(1) Vous frappez, une fille ouvre la porte et dit « Bonjour, je suis l’aînée ». Quelle est la probabilité 
que l’autre enfant soit une fille ? 


ITEMooBGIWooLnVCpm 
(2) Vous frappez, une fille ouvre la porte et dit « Bonjour ». Quelle est la probabilité que autre 
enfant soit une fille ? ITEMooCBNSooMaIwwB 


(3) Vous demandez aux parents si il y à au moins une fille, ils répondent « oui ». Quelle est la 
probabilité que les deux enfants soient des filles ? 


Dans les trois cas l'intuition dit que la probabilité est 1/2. Il semble que de plus la (2) et la (3) 
soient les mêmes parce que l’on sait qu’il y a une fille et on se demande quelle est la probabilité 
qu'il y ait deux filles. 

Nous allons voir ça de plus près. 


36.2.12.1 « Bonjour, je suis l’aînée » 


Résolution Si nous notons X9 et X1 les variables aléatoires donnant le sexe des deux enfants, 
ce sont des variables aléatoires indépendantes et identiquement distribuées, avec P(X; = f) = 3. 
La formule (36.75) de la probabilité conditionnelle ainsi que l’indépendance donnent : 


PO = fX2 = À) 


P(X = f|X2 = f) = PO = f) 


Le numérateur vaut i et le dénominateur vaut î : le résultat vaut 3. Fin de l’histoire. 


Simulation Voici un petit programme qui simule la situation. Il retourne clairement 1/2. 


#! /usr/bin/python3 
# -*- coding: utf8 -*- 


unun 
Vous frappez à la porte d'une famille qui a deux enfants. Une — 


fille ouvre la porte et vous dit "Je suis l’aînée". 
Quelle est la probabilité que l’autre soit une fille ? 


import random 


| def famille(): 


return à pair of 7° and °’gp*. 
a=[random.choice( [’g’,’f°1] )] 
a.append(random.choice( [’g’,’f°] )) 
return a 


def toctoc): 


- Create a family with two children. 
— Pick the second one, the elder. 
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= dAf 16 1s à ’pg°, return None. 
f 2 
» 


= SÉ LE ds &, 7? return the other one. 


F=famille() 
if F[1] != *f*: 
return None 
else 
if F[O]=="#f: 
return 1 
else 


return © 


N_girl_opens=0 


N_girl_other=0 
for k in range (1,10000) : 
res=toctoc() 
if res is not None: 
N_girl_opens = N_girl_opens+i 
N_girl_other = N_girl_other + res 


1proba=N_girl_other/N_girl_opens 
s|print (proba) # -0.5, intuitively correct. 


tex/sage/simul_famille_aine.py 


36.2.12.2 « Bonjour » 


Nous frappons à la porte, une fille ouvre en disant « bonjour », sans préciser si elle est la 
première ou la seconde. Quelle est la probabilité que l’autre soit une fille ? Naïvement on croirait 
es / 1 
que la probabilité est également 3. 
Un raisonnement moins naïf montre le contraire. 
Et nous allons voir qu’un raisonnement encore moins naïf montre que la probabilité est bien ï. 


Premier raisonnement (incorrect) Voici le raisonnement qui est, à mon avis, faux. Vu que 
l'enfant qui ouvre la porte est une fille, la famille a une des compositions suivantes : fg, ff ou 
gf. Le cas où une fille ouvre la porte et que l’autre est également une fille est seulement le cas f f 
dont la probabilité est 1. 

Pour justifier cela nous considérons le couple de variables aléatoires (X1, X2) et le condition- 
nement À = {X1 = f} U {X2 = f} : évidemment P(A) = Ÿ. Nous calculons facilement la loi du 
couple (X1, X2) conditionné à À : 


PA{X1=f,X2=fjnA) 1/4 1 


(36.191) 


Donc sachant À, la probabilité que la famille soit constituée de deux filles est L. 


Comment faire mieux? Ce calcul semble être correct, mais il ne l’est pas. Ce raisonnement 
fait l’hypothèse implicite que l’espace probabilisé décrivant la situation contient deux variables 
aléatoires X et X2 représentant les deux enfants. Or nous avons bien trois événements aléatoires 
dans l’histoires : le sexe des deux enfants et le choix de l’enfant qui ouvre la porte. 

Certes, nous pouvons penser que cette troisième variable aléatoire ne change rien. Oui oui, on 
peut le penser. Mais ici, on ne doit pas penser, on doit démontrer. 

Nous allons donc rédiger un calcul complet, en introduisant toutes les variables aléatoires, et 
en décrivant correctement l’espace probabilisé Q et la mesure de probabilité P. 
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Peut-être que ça ne changera rien. Ou peut-être pas. Maïs au moins nous serons surs d’avoir 
résolu le problème correctement. 


La vraie réponse Nous considérons les variables aléatoires X0, X1: Qg — {f,g} avec probabilité 
L. De plus nous considérons une nouvelle variable aléatoire qui donne le numéro de l’enfant qui 
ouvre la porte : 

o: Nc — {1,2}. (36.192) 


Notre espace de probabilité est donc l’ensemble Q = {f,g} x {f,g} x 0,1 sur lequel nous 
considérons la mesure d’équiprobabilité !!. 
Nous introduisons les variables aléatoires 


X1: Q — {f,g} 


12 


(36.193) 
(s1,82,n) + 81 
et . 
Xo:Q — {f, 
; (9) (36.194) 
(s1,52,n) + 82 
et . 
o: (O — {1,2 
1,2 (36.195) 
(s1, S2;, n) en 
Nous devons calculer 
PS a EE Xo Ti Î) 
PL ee 36.196 
a — RES 
Pour être explicite jusqu’au bout, nous énumérons tous les éléments de Q : 
(1) g,g,0 (3) 9, f,0 (5) f,g,0 (7) f, 7,0 
(2) g,g,1 (4) 9, f,1 (6) f,9,1 (8) f, f,1. 
Et tant qu’à être explicite, l'événement vulgairement noté {X, = f} est la partie 
{Xy = f} = {we Q tel que X,{)(w) = f} (36.197a) 
= {(51,52,n) tel que X,(51,52,n) = f} (36.197b) 
= {(51,52,n) tel que sh = f}. (36.197c) 


Méditez la dernière égalité ; elle n’est pas totalement indispensable au raisonnement, mais elle est 
cool. 
Nous avons 


{Xo = f} = {(g, f,1),(f, 9,0), CF, f,0), CF, f, D}. (36.198) 
et 
{Xe = f} ON {Xo = f} = {(F,f,0), CF, FL}. (36.199) 
Donc 1 
PSE ER  — ) = 3 > (36.200) 
et 4 1 
PL) )= Sd (36.201) 
Au final, 
1/4 2 1 


Piel) (36.202) 


1/2 4 2 
11. C’est une hypothèse forte faisant appel d’un part ce que l’on sait de la reproduction humaine, et d’autre part 


ce que l’on sait de la sociologie de deux enfants qui entendent une sonnette. 
12. Sur Q, sur {f,g} et sur {0,1} nous mettons la tribu des parties. Vérifiez que X1, X2 et o sont mesurables. 
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Simulation Vous avez encore un doute ? Faites tourner la simulation suivante : 
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#! /usr/bin/python3 
# -*- coding: utf8 -*- 


Vous frappez à la porte d’une famille qui a deux enfants. 


fille ouvre la porte. 


Quelle est la probabilité que l’autre soit une fille ? 


import random 


def famille(): 


return a pair of ’f’ and ’g’ 
a=[random.choice( [’g’,’f°1] )] 
a.append(random.choice( [’g’,’f°] )) 
return a 


def toctoc(): 
“un 
- Create a family with two children. 
- Choose one (the one who opens the door) 
= dif it is à ‘gg’, return None. 
— if it is a ’f’?, return the other one. 
“un 
F=famille() 
s=random.choice([0,1]) 
if Fls] != °5#f°: 
return None 
else 
t=(s+1)%2 
if F[t]==’#: 
return 1 
else 


return © 


N_girl_opens=0 
N_girl_other=0 
for k in range (1,10000) : 
res=toctoc() 
if res is not None: 
N_girl_opens 
N_girl_other 


N_girl_opens+i 
N_girl_other + res 


proba=N_girl_other/N_girl_opens 
print (proba) # -0.5, intuitively correct. 


Une — 


tex/sage/simul_famille_simple.py 


Le faisant tourner, la réponse est sans appel : la fréquence observée est beaucoup plus proche 
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de 0.5 que de 0.33 ou 0.66. 


386.2.12.3 Le parent qui répond aux questions 


Nous avons une famille de deux enfants dont nous savons qu’au moins un des deux est une fille. 
Quelle est la probabilité que la famille contienne deux filles ? Cela est à priori la même question 


que celle où une fille ouvre la porte sans dire si elle est l’aînée ou non. 


Simulation Commençons par la simulation : 


#! /usr/bin/python3 
# -4x- coding: utf8 -*- 


Vous savez qu’une famille a deux enfants. 
Vous demandez à un parent si il y a une fille. 


filles 


Réponse : Oui. 
Question : quelle est la probabilité que ce soient deux 
uunun 
import random 
def famille(): 
unun 
return à pair of ?’£° and ’p*°- 
nunun 
a={[random.choice( [’g’,’f?] )] 
a.append(random.choice( [’g’,’f°] )) 
return a 
def toctoc(): 
uunn 
- Create a family with two children. 
= If gg’, there are no girls -> return None 
= If ‘’gf?, there is a girl but the other is a boy -> 0 
= If ‘’fg”; there IS à girl but the other is à boy => 0 
= If ff’, There 16 à glrl and the other IS à girl => 1 


F=famille() 

if F==[’g8?,’g?] 
return None 

if F==[l’g,#1°]l: 
return © 

en 
return © 

if F==[r#r,1#7]; 
return 1 


N_at_least_one_girl=0 

N_two_girls=0 

for k in range (1,10000): 
res=toctoc() 


? 
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if res is not None: 
N_at_least_one _girl=N_at least _one_girl+i1 
N_two_girls=N_ two _girls+tres 


proba=N_two_girls/N_at_ least _one girl 
print (proba) # -0.333. Beware ! 


tex/sage/simul_ famille _une_ fille.py 


Et là, bing, la réponse est clairement plutôt 0.33 que 0.5. 


Résolution Nous avons les variables aléatoires X; et X2 qui valent 0 ou 1 suivant que l’enfant soit 
une fille ou un garçon ; ce sont des variables aléatoires indépendantes et identiquement distribuées. 
Nous définissons la variable aléatoire somme 


S = Xi + Xo (36.203) 


qui compte le nombre de filles. La question est de calculer 


: _P(S=2nS>1) P(S=2) 
RÉTAEE PO >1) POS A 


(36.204) 
L'événement $ = 2 est réduit au singleton {ff} et sa probabilité est }. Au contraire l'événement 
S > 1 est l’ensemble {fg, gf, ff} et sa probabilité est 5. Nous avons donc 


P(S=2KS>1) = =-. (36.205) 
Et là, la réponse est 1/3 et non 1/2 comme d’aucuns auraient pu le croire. 


Précision Notons que l'événement $ > 1 n’est pas le même que l'événement X, = f. En effet 


Sz>1= D CP 2), (fg, 1),(fg;2).(gf, 1), (gf,2)} (36.206) 


tandis que 


{Xo .. 1; — {CFE LLC 2), (fg, 1), (gf,2)}. (36.207) 


36.2.12.4 Conclusion 


L'internet regorge de sites discutant du paradoxe des deux enfants l?. 

Beaucoup insistent sur le fait que non seulement certaines informations apparemment anodines 
sont importantes, mais en plus la façon dont on obtient l’information est importante. Dans la 
situation « une fille ouvre », nous obtenons l'information « il y a au moins une fille » en en voyant 
une; dans la situation « la parent dit qu’il y a au moins une fille », nous obtenons l’information 
«il y à au moins une fille » de façon plus « pure ». 

Personnellement je ne souscris pas vraiment à cette façon de penser. Le fait est que la formule 


P(AnB) 


P(AIB) = 57 


(36.208) 
n’est pas seulement une formule dans laquelle il faut remplacer À par « la question » et B par « ce 
qu'on sait ». Il faut également remplacer P par « la bonne » mesure de probabilité. 

Il est important de construire le bon espace de probabilité, avec la bonne mesure. Et pour 
cela, il faut bien s’assurer d'introduire une variable aléatoire pour chaque événement aléatoire se 
produisant dans l’histoire. 


13. Par exemple [741]. 


H 
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36.2.12.5 Une analogie 


Imaginez un parc de jeux réservée aux familles de deux enfants dont au moins une fille. Le 
videur à l’entrée a (au moins) trois stratégies possibles pour ne laisser entrer que les familles 
contenant au moins une fille. 


(1) Regarder l’ensemble de la famille, et ne laisser entrer que les familles ayant au moins une 
fille. 


(2) Ne regarder que l’aîné et ne laisser entrer que les familles dont l’aîné est y ER Taooct — 


(3) Prendre un des deux enfants au hasard et ne laisser rentrer la famille que si cet enfant est 
une fille. 


Je vous laisse déterminer à quel scénario correspondent ces trois stratégies. Notez que la stra- 
tégie (3) contient un énorme biais de sélection : la moitié des familles fille-garçon et garçon-fille 
sont supprimées, alors que toutes les familles fille-fille entrent. 


36.2.12.6 La belle au bois dormant 


Vous avez aimé les questions avec les filles qui ouvrent la porte ? Vous trouvez que Monty Hall 
est trop facile ? 
Cadeau de numperphile : https://www.youtube.com/watch?v=cW27QJYNXtEU 


36.2.12.7 À propos des simulations 


Si vous lisez ces lignes avec l’intention de passer l’agrégation en utilisant Sage à l’épreuve de 
modélisation, vous devez être capable de refaire les trois simulations. Les bouts de code donnés ici 
sont écrits pour python3 alors que Sage utilise Python2. Je ne vous dit pas si ça change quelque 
chose l#. 

Allez oui, je vous dit. Si vous changez dans simul_ famille une _fille.py la première ligne 
pour utiliser python? au lieu de python3, le résultat affiché sera O0 et non 0.333. La raison est 
que dans Python2, l'opérateur / entre deux entiers est une division entière. Autrement dit : le 
résultat 0.33 est arrondi à zéro. 

Solution : forcer python à interpréter le / comme une vraie division. Pour Sage, ça donne ceci 
comme début de programme : 


#! /usr/bin/sage 
# += coding: uUtES -*- 


from __future__ import division 


tex/frido/codeSnip_3.py 


Importez toujours division de __future__ 

Ah oui, et dernière remarque : pour autant que je le sache, le jour de l’oral, vous n’aurez que 
Sage en mode notebook. Je ne sais pas si l'import fonctionne aussi bien. 

Sinon vous pouvez forcer la division dans les float de la façon suivante : a/float (b). 


36.2.13 Inégalité de Jensen 
PropABtKbBo 


Proposition 36.72 (Inégalité de Jensen). 
Soit g une fonction convexe! sur R et une variable aléatoire Y € L!(Q, A, P) telle que go Y soit 
également L'. Alors 

g(E(FY|F)) < E((goY)|F). (36.209) 


14. Je ne suis pas certain qu’encore en 2021, l’agrégation ait Sage en version python2. 
15. Définition 17.79. 
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Démonstration. La convexité de g et la proposition 17.94 nous donnent deux suites (a,) et (b,) 
dans R telles que pour tout ze R, 


g(x) = sup(ant + by). (36.210) 
neN 
Nous avons alors ETC 
an E(Y|F) + bn LE E(anY + bn) < Ego YF). PAS 


L’inégalité est due au fait que go Y est le supremum sur les n de a, Ÿ +b,. Pour chaque n, l'inégalité 
(36.211) est fausse sur un ensemble de mesure nulle R, € Q. L'union 


R= {Jr (36.212) 
neN 


est encore de mesure nulle. Sur (\R, nous avons 
an E(Y|F) + bn < Ego Y|F). (36.213) 


Vu que cela est vrai presque partout et pour tout n nous passons au supremum et nous avons 
encore presque partout l’inégalité 


sup (an E(Y|F) + bn) < E(goY|F). (36.214) 
neN 


Si nous ne nous intéressons pas à E(Y|ÆF) mais seulement à E(Y), alors une démonstration 
plus simple est donnée sur Wikipédia[742]. 


36.2.14 Fonction de répartition 
DefooYAZVooNdxDCx 


Définition 36.73. 
Si X est une variable aléatoire réelle, nous définissons sa fonction de répartition par 


Fx:R— [0,1] 


Fx(x) = P(X < x). (36.215) 


Remarque 36.74. 
La fonction de répartition est discontinue en a si P(X = a) > 0. En particulier nous ne pouvons 
pas dire 
P(X > a) = 1- Fx(a). (36.216) 
LEMooMNXJooBdGXWg 
Lemme 36.75. 
La fonction de répartition de la loi exponentielle est 


F(x)=1-e #, (36.217) 


36.2.15 Fonction caractéristique 
DefooEIVXooNtHLQQ 


Définition 36.76. 
La fonction caractéristique de la variable aléatoire X : Q — R est la fonction réelle définie par 


Dx(t) = E(et*). (36.218) 


Une autre façon d'écrire la définition est 


Px(t) = [ eXdPx(x), (36.219) 
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ou encore, si X a une densité fx, 
0 J et fr (x)dz FafRract agen 
R 


Nous reconnaissons la transformée de Fourier : 
Dx(t) = fx(—-t/27). (36.221) 


La proposition suivante se déduit en utilisant le théorème de dérivation sous l’intégrale 17.23. 
PropDerFnCaract 


Proposition 36.77. 
Soit X une variable aléatoire qui accepte un moment d'ordre r > 1. Alors la fonction caractéristique 
Px est r fois continument dérivable et 


#Q D = 2(Orex) Eee Ten 


Démonstration. Nous étudions la fonction 
d(t) = [ etX(&)GP(w). (36.223) 
a 


Nous considérons la fonction 
J:RxO—R 


36.224 
(4, w) _ eitX(w) ( ) 


et nous regardons si ce contexte vérifie les hypothèses du théorème 17.23. 


(1) Étant donné que X est mesurable, f sera mesurable. 


itX(w) est absolument continue pour chaque w. 


(2) La fonctiont- e 
(3) Note : par rapport aux notations du théorème 17.23, nous avons ici À = R. Prenons donc 


un intervalle (compact) [a,b] € R et calculons 
À au) = iX(wyeïtX, Fafpipttoitieithg 


et 
b b 
J [ BOMAETE J [ | X (uv) du dt. (36.226) 
a JQ a JA 


Par hypothèse X accepte un moment d'ordre 1, de sorte que l'intégrale par rapport à w 
converge vers un nombre qui ne dépend pas de t. L'intégrale sur t ne pose alors aucun 
problèmes. 


Par conséquent nous pouvons effectuer la première dérivation : 


_ db 


D'(t) = pr 


(é) = Ï iX (wetX@) qu = E(iXetX) (36.227) 
Q 
et la fonction ®’ est absolument continue. Ce dernier point est important parce que c’est lui qui 
permet de faire la récurrence et passer à l’ordre deux. 
Le résultat ressort alors en dérivant successivement l’expression (36.225). 


Exemple 36.78. 
Sachant la fonction caractéristique de X, nous pouvons calculer les moments. Par exemple en 
posant r = 2 et t = 0 dans la formule (36.222) nous avons 


E(X?) = -&",(0). (36.228) 


A 
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ThonMxtTy 


Théorème 36.79. 
Si Dx = Py, alors Px = Py. 


Notons que cela n'implique pas que X = Y. En effet X et Ÿ peuvent même être définis sur des 
espaces probabilisés différents. 
Dans le cas d’une variable aléatoire vectorielle, nous définissons ® x : RŸ— R par 


Bx(v) = E(eXvX) FEU 


36.2.16 Fonction génératrice des moments, transformée de Laplace 


Soit À une variable aléatoire. Sa transformée de Laplace ou fonction génératrice des 
moments est la fonction 


Mx(t) = E(ei*) (36.230) 
pour chaque t tel que cette espérance existe. 


Théorème 36.80 ([743]). 
Soit X une variable aléatoire réelle et 


Ix={teR tel que E(et*) existe}. (36.231) 
La fonction 
Mx:1x;—+R 
_ (36.232) 
tr E(e*) 


est la transformée de Laplace de X. 
(1) Ix est un intervalle contenant 0. 


(2) Si Ix n’est pas réduit à {0} alors MXx se développe en série entière 


Mx(t) = > es (36.233) 


(3) Si X et Y sont des variables aléatoires indépendantes, alors Ix+y = Ix n Iy et 
Mxiy = MxMy (36.234) 


sur Ix1y. 


Démonstration. Le fait que 0 soit dans 7x est évident : E(1) = 1. Pour montrer que 7x est un 
intervalle nous prenons z € 1x et 0 < s < z ou z < s < 0, puis nous montrons que s € 1x. Il faut 
remarquer que dans tous les cas, 


RIRE (36.235) 


En effet soit sX et zX sont tous deux à gauche de zéro et alors ils sont tous deux plus petit que 
1; soit ils sont tous deux à droite de 0 et alors e** > e°* par croissance de l’exponentielle. Nous 
avons donc dans tous les cas que 


E(e*) = [ fx(x)e dx < [ fx(x)(1 + e%) = 1 + E(e*). (36.236) 
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aX & 


Soit maintenant a > 0 tel que [—a, a] € 1x. Étant donné que e%lXl < eX*e-aX, l'espérance 


E(e%X*1) existe toujours pour [t|. Nous avons 


N N 
E(X" x" 
Mx(® - Ÿ a )yn| 2 E(e* =>. 4) (36.237a) 
n=0 : n=0 
ve) x? : 
= E( 5 +") (36.237b) 
n=N+1 
ve) 
EX |" 
«| + = (36.237c) 
n=N+1 


Maintenant le but est de prendre la limite N — en inversant la limite et l'espérance par le 
théorème de la convergence dominée (14.200). L'intégrale à traiter est 


00 
tX(w)|" 
im | AO gpçu). (36.238) 
ou Qn=N+r1 Le 


tX(w) 


L’intégrande est uniformément borné (en N) par e , qui est intégrable par hypothèse (choix 


de t). Du coup 


O0 oO 

tX(w)|" EX" 

im | ÿ RO gp(u) =Ellim ÿ | = G; (36.239) 
N—00 o n=N+1 nm: N n: 


36.2.17 Loi d’une variable aléatoire 
DEFooBKJVooRJdMeA 


Proposition-Définition 36.81 (Loi d’une variable aléatoire[744]). 
Soient un espace probabilisé (Q,F, P) ainsi qu'une variable aléatoire X : Q — R". En définissant 


Px: Bor(R") — R* 


; (36.240) 
Br (PoX  )(B), 
le triple (R”, Bor(R”), Px) est un espace probabilisé. 
La mesure Px est la loi de la variable aléatoire X 
LEMooHVFJooBDZYnT 


Lemme 36.82. 
Soient un espace de probabilité (Q, À, P) ainsi qu'une variable aléatoire X : Q — R”. Nous consi- 
dérons un autre espace probabilisé (S, As, 1) ainsi que l’application 


Y:QOxS-—R" 
(36.241) 
(w,s) X(w). 
Alors : ITEMooDSIKooSqdyJb 
——_ . és 16 
(1) L'application Y est une variable aléatoire sur ° (Q x S,A@ As, P @ Li) sremooqMMHooPcGKoD 


(2) La loi de Y est la même!" que celle de X. 


Démonstration. Tout repose sur le fait que Ÿ soit la même chose que X, mais « diagonalisé » sur 
S. Commençons par prouver que si B € R", alors Y-!(B)=X-1(B)x 5. 
(1) Dans un sens Soit (w,s)e X_!(B) x S. Alors Y(w,s) = X(w)e B. Nous avons donc bien 
K (Desert 0). 


16. Produit de tribus, définition 14.124; produit de mesure, définition 14.239. 
17. La même; pas seulement la même à abus de notation près. Ce lemme est une partie du bout manquant dont 
il est question dans [745]. 
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(2) Dans l’autre sens Soit (w,s) € Y _!(B). Nous avons X(w) = Y(w,s) € B, donc w € 
X71(B) et donc (w,s)e X-!(B)xS$. 
Passons maintenant à la preuve proprement dite. 
(1) Pour (1) Soit un borélien B € R’. Nous avons Y _!(B) = X-!(B) x $. La partie X_!(B) 


est un borélien de Q, et S est un borélien de $. Donc X-!(B) x S est un borélien de Q x $. 
L'application Ÿ est donc mesurable. Elle est une variable aléatoire. 


(2) Pour (2) Soit un borélien B de R”. Nous avons 


Py(B) = (P@u)(Y”'(B)) (36.242a) 
= (P@u)(X71(B) x S) (36.242b) 
= P(XT"(B))u(S) (36.242c) 
=P(XT"(B)) (36.242d) 
= Px(B). (36.242e) 


Nous avons utilisé le fait que p(S) = 1. 


La proposition suivante permet de calculer en pratique les intégrales qui définissent par exemple 


l'espérance mathématique d’une variable aléatoire. 
PropintdPintdPXeR 


Proposition 36.83 (Théorème de transfert[746]). _ 
Si X:(Q — R est une variable aléatoire, alors dès que f: R? — R est telle qu’une des deux 
intégrales existe, 


E(fox)= | 


J(X(w))dP(w) = f(x)dPXx(x) (36.243) 
Q Rd 


où Px est la loi de X À. 
En particulier, ça marche si f est borélienne. 


En utilisant cette proposition nous trouvons une formule pratique pour l’espérance d’une va- 
riable aléatoire réelle : 


E(X) = [ KE) = J abs ( (36.244) 
(a R 
en vertu de la proposition 36.83 appliquée à la fonction f(x) = x. 
PROPooNNTNooUmCLvy 


Proposition 36.84. 
Une variable aléatoire réelle X est intégrable si et seulement si P(x = +0) = 0 et 


[ (GldPe(e) <è6: (36.245) 

Le lien entre la densité fx de la variable aléatoire X et sa loi est 
Px(4) = [. Fe (36.246) 
pour tout ensemble mesurable À € R. Le lien entre la mesure de Lebesgue et celle de la loi de X 


est alors donné par 
dPx(x) = fx(x)dx. (36.247) 


En particulier l’espérance de X peut être calculée à partir de sa densité via la formule 


E(X) = Le xdPx(x) = IE zfx(x)dx. FGESPDRRE ART 


18. Définition 36.81. 
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LEMooYVJAooXUKRTh 
Lemme 36.85. 
Soit une variable aléatoire X : Q — IR” de densité gx. ITEMooBUWNooJkiRPp 
(1) Nous avons 
E(X) = J zgx(x)dx. (36.249) 
ITEMooKZHAooKQQmno 
(2) Si la fonction f: R" — R est borélienne, alors 
E(foX) = Î Had. (36.250) 
R? 


ii Avertissement /question à la lectrice !! 36.86 
Je n'ai pas vérifié le lemme 36.85. Écrivez-moi si vous en connaissez une démonstration, où si 
vous croyez qu'il est faux. 

À mon avis le point (1) est une variation autour de (36.248) et (2) utilise ça et le théorème de 
transfert 306.83. 


LEMooAVTFooIQRvop 
Lemme 36.87. 
Soient des variables aléatoires X;: Q — R" fi =1,...,n). Nous supposons qu'il existe une appli- 
cation g: R”? — R telle que 
Es Xn)) = f(x)g(x)dx (36.251) 
R? 
pour tout fonction borélienne f : R'" — R. 
Alors g est une densité pour la variable aléatoire (X1,..., Xn): Q — R. 
PROPooNYNUooTCJgp1l 


Proposition 36.88 ([747]). 
Soient des variables aléatoires X;5: Q — R fi =1,...,n). Nous posons Z = (X1,...,X»n) et nous 
supposons que Z est une variable aléatoire à densité notée fz. 

Alors les X; sont à densité et les densités de X; sont 


He) — J Jelris: + sites . di. 00-41 .. dl. (36.252) 
Rr-1 


PROPooVUTLooDPdhxK 
Proposition 36.89. 
Soient des variables aléatoires à densité X;5: Q — R fi =1,...,n); nous notons f; leurs densités. 
Nous posons Z = (X1,..., Xh). 


(1) La variable aléatoire Z est à densité. ITEMoOUQEFOoAAFXJY 


(2) Les variables aléatoires X; sont indépendantes si et seulement si fz = [Ii fi. 


ii Avertissement /question à la lectrice !! 36.90 
Je n'ai pas vérifié si cette proposition est vraie. Ecrivez-moi si vous connaissez une démonstration, 
ou si vous savez que c’est faux. 


36.2.18 Changement de variables 
THO00ODSTYooXMW£ Nw 


Théorème 36.91. 

Soit O, un ouvert de R” et O' un ouvert de R°° ainsi qu'un difféomorphisme CT 6: O — O'. Soit 
X:(Q — R" une variable aléatoire prenant presque surement ses valeurs dans ©. Si nous supposons 
que X a la densité fx, alors la variable aléatoire Y = &(X) accepte la densité fy : O' — R donnée 
par 


fr(v) = fx(e (v))lT-i1(v)l. (36.253) 
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Démonstration. Nous devons vérifer la relation 
P(Y EeB) = Ï fr (v)dv (36.254) 
B 


pour tout borélien B € ©’. Nous avons 


P(YeB)= [1 tde (36.255a) 
RT 

= E(1goŸ) (36.255b) 

= E((1goy)oX) (36.255c) 

= le ., (A5 0 6) dPx(u) (36.255d) 

= [. . (lo )(u)Px (ad (36.255e) 


À ce niveau, nous utilisons la formule de changement de variables du théorème 14.290. Nous 
trouvons alors 


P(YeB)= J : 18(p 7 (v)) fx (eo (v))|Z-1(v) de. (36.256) 


36.3 Convergence 

DEFooZKLFooZkKuMC 
Définition 36.92. 
Soit un espace de probabilité (Q, À, P). Soient des variables aléatoires ® X,: Q — RU {+0}. Nous 
disons que X; converge presque surement vers la variable aléatoire X et nous notons 


MES (36.257) 
P({weQ tel que Xn(w) — X(w)}) =1 (36.258) 


où la convergence Xn(w) — X{(w) est la convergence usuelle dans R L {+00}. 


Définition 36.93 ([748]). 
Nous disons que les variables aléatoires réelles X, convergent en probabilité vers la variable 
aléatoire X si pour tout n > 0, on a 


P(IXn — X| > 7) — 0, (36.259) 
et on note 
EX (36.260) 


Définition 36.94 (Convergence en loi). 
Nous disons que X, converge vers X en loi vers la variable aléatoire X et nous notons 


XX (36.261) 


si pour toute fonction continue et bornée g nous avons 


E(g(X})) — E(g(X)) = Jours. (36.262) 
LEMooADHZooGCxVvn 
Lemme 36.95. 


Nous avons Xn => X si et seulement si il existe un événement À € A tel que P(A) = 1 et tel que 
Xn(w) — X(w) pour tout w € À. 


19. Définition 12.27 pour la topologie et donc les boréliens sur la droite réelle achevée. 
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LEMooNTNIooKbLwgx 
Lemme 36.96. 
Si X est une variable aléatoire à valeurs dans R L {+}, alors 
(1) Pour tout n € N, l'application 
min(X,n): Q — IR LU {+00 
) | eo (36.263) 
w min (X(w),n) 
est une variable aléatoire. 
(2) Nous avons la convergence presque sure ?° 
min(X,n) 25 (36.264) 


Démonstration. Le fait que min(X,n) soit mesurable est le lemme 14.96. D'ailleurs pour la suite, 
nous la notons X, = min(X,n). Sinon il faudrait écrire des choses comme min(X,n)(w) pour 
Xh(w), et ça deviendrait compliqué. 

Nous allons montrer que pour tout w € (, nous avons Xy(w) — X(w). Ainsi le lemme 36.95 
conclura. 

Soit w € (. Si X(w) = 00, alors nous avons X,(w) = n pour tout n et alors X,(w) Æ, © = 
X(w). 

Si par contre X(w) < 00. Alors en choisissant N > X(w) dans IN (lemme 1.421), nous avons 
Xn(w) = X(w) pour tout n > N. Et donc aussi Xy(w) — X(w). 


36.97. 
Dans certains textes, la variable aléatoire min(X,n) est notée X À n. Donc le lemme 36.96 s'écrit 
Xnn?$ (36.265) 
PrpopCaractCvL 


Proposition 36.98. 
Deux autres caractérisations de la convergence en loi. 


A . : 
n 
(1) Nous avons X, -—— X si et seulement si 
Dx, (v) —> Dx(v) (36.266) 


pour tout v e Rd. Ici ®x est la fonction caractéristique de X. 


(2) Dans la définition de la convergence en loi nous pouvons indifféremment utiliser les fonctions 
continues et bornées, les fonctions continues à support compact ou les fonctions bornées 


uniformément continues. 
PropJFVJDux 


Proposition 36.99. 
Les types de convergence sont reliées par les implications suivantes : 


presque sure = en probabilité = en loi. (36.267) 


La convergence en loi n’implique pas la convergence en probabilité, et par conséquent pas non 
plus la convergence presque certaine. 


Dans le cas particulier d = 1 nous avons quelques critères supplémentaires. 
PropoFnrepCvL 


Proposition 36.100. 
Supposons que les variables aléatoires X, soient réelles, et notons F, la fonction de répartition de 
Xn. Si F,(x) — F(x) pour tout x dans l’ensemble des points de continuité de F, alors X, EX: 


20. Définition 36.92. 
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PROPooNRQJooXoCcbZ 
Proposition 36.101. 
Si les X, sont des variables aléatoires réelles positives, et si X est une variable aléatoire positive, 
alors X» Æ, X si les transformées de Laplace des fonctions de répartition convergent ponctuelle- 
ment, c’est-à-dire si 

E(e nr) = E(e°*) (36.268) 

pour tout à > 0. 

PROPooZMHKooLwCwqs 
Proposition 36.102. 
Si les X, et X sont des variables aléatoires réelles discrètes à valeurs dans {x0,x1,...} alors 


Xh 5, si et seulement si 
P(Xn = 28) — P(X = y) (36.269) 


pour tout k E N. 
PropXncvXFXcvFxt 


Proposition 36.103 ([733]). 
Soient X, et X des variables aléatoires réelles. Nous avons 


ne (36.270) 
si et seulement si pour tout t où Fx est continue, 


Jim Fx, (0) = Ex (#). (36.271) 


PropCvLfcvPsicst 
Proposition 36.104 ([733]). 


Soit X, une suite de variables aléatoires Q — Rd et ae Rd. Si X, Es a, alors 


NEA (36.272) 


Démonstration. Quitte à passer aux composantes, nous pouvons supposer que d = 1. Soit 7 > 0: 
nous savons que l'inégalité |x| > a a pour solution x > a ou x < —a. Dans notre cas, 


P(|Xn — al > 7) = P(Xn — a > n) + P(Xn — a < —n) 
= P(Xn > n+0a)+P(Xn <a-—n) 
= 1-P(X, <n+a)+P(Xh <a—n)—P(X, =a—1) (36.273c 
<1-—Fx,(n+a)+Fx,(a—1) (36.273d 


où la majoration est l’oubli du terme P(X,, = a —n), lequel est positif ou nul et Fx, est la fonction 
de répartition de X,, définition 36.73. Nous allons utiliser la proposition 36.103. La fonction de 
répartition de la variable aléatoire constante X = a est donnée par 


Fat) = Pa < t) . OU — a). (36.274) 


Par conséquent, la convergence en loi X, —Z, à nous montre que 
Fx,(t) — 1p,x[(t — a) (36.275) 


pour tout { Æ a parce que { = 0 est un point de discontinuité de 1,0. Nous avons par conséquent 


P(IX — al > n) = 1] —- Lf0,0[(7) EL 1 f0,c[( n) =1-1+0=0 (36.276) 


parce que 7 > 0. 


Le lemme de Slutsky sera utilisé en combinaison avec la proposition 36.106 pour calculer des 
intervalles de confiance, voir par exemple ce qui se passe autour de l’équation (37.126). 
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LemgXDlhs 
Lemme 36.105 (Slutsky[749]). 
Soient Xh et Yn des suites de variables aléatoires réelles telles que 


XX 


_ (36.277) 
Y —aeR. 


Alors (Xn, Yn) en (X, a). 
Démonstration. Étant donné que Y, TE a, nous avons Ÿh LE, à par la proposition 36.104. Soit 
une fonction f : R? — R?: nous devons prouver que 
EI, M) EC a). (36.278) 
Soit € > 0. Nous avons 
E(IF(Xn Ya) — FX, a)|) < E(IF(Xn Ya) — F(Xn 0)|) + E(IF(An 0) — FC, a) CES 
La fonction g(t) = f(t,a) étant continue et bornée, la convergence en loi X, Z, X donne 
E(|f(Xn, a) — f(X, a)|) — 0. (36.280) 


Étudions à présent le premier terme du membre de droite de (36.279). Pour tout 7 > 0 et toute 
variables aléatoires Z et 77 nous avons 


E(Z) = E(Z1z4<n) + E(Z1iz4>n). (36.281) 
Nous décomposons donc le premier terme de (36.279) en 


BI FX:,5) . a)|) = E(|f(Xn: Yn) — FX, a)|Liv,-a<n) PARRADecoRe ras, 
+ E(|f(Xn; Yn) — f(Xn 0) ys-alzn) : | 


Choisissons maintenant une valeur de 7 telle que 
x, y) — (ay) <n = f(x, y) — f(x, y < €. (36.283) 


Un tel 7 existe par l’uniforme continuité de f. Dans le premier terme, |Y, — a] < m, par conséquent 


I(Xn; Yn) — (Xn,a)] = [Yn — al < 7 (36.284) 
et donc 
1 F(Xn; Yn) — F(Xn,a)| < €. (36.285) 
Le premier terme devient donc 
E(|f(Xns Ya) — f(Xn:0)| ls -olen) < EE, -ojer) < € (36.286) 


parce que E(14) = P(A) < 1. Pour le second terme de (36.282) nous effectuons la majoration 
1 FXn Yn) — F(Xn; 4)| < 2] flo (36.287) 


: P | 
tandis que la convergence Ÿ, —— a entraine 


P(|Yh — al > 7) — 0. (36.288) 
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PropcvLsousfonc 
Proposition 36.106 ([750]). 
Soient X; des variables aléatoires telles que 


ns (36.289) 


et h, une fonction mesurable sur l’espace d'arrivée de X;. Soit C l’ensemble des points de continuité 
de h au sens 
C={we tel que h est continue en X;(w)}. (36.290) 
Alors si P(X € C) = 1, nous avons 
HR) ES HR). (36.291) 


Une conséquence de cette proposition couplée au lemme de Slutsky est le résultat suivant, qui 
est donné sous le nom de théorème de Slutsky sur wikipédia. 


CorINgTPH 
Corolaire 36.107. 
En reprenant les notations du lemme de Slutsky, si 
XX (36.292a) 
a (36.292b) 
alors 
Xn+Yn > X+a (36.293a) 
XnYn —— aX (36.293b) 
Vi ep (36.293c) 
(36.293d) 
pourvu que a soit inversible. 
LEMooXWMXooYEwWBn 
Lemme 36.108 (Borel-Cantelli). 
Soit (A,) une suite d'événements (avec À, € A pour tout n). 
(1) Si 550 P(An) converge, alors 
P(A, is.) = 0. (36.294) 


(2) Si la somme D, P(A:) diverge, et si de plus les À; sont indépendants, alors 
P(Ah is.) = 1. (36.295) 
La notation P(A, i.s.) signifie « infiniment souvent », c’est-à-dire 


P(Anis.) = P( (7) (J 4x) = P(imsup4,) (36.296) 
NEN k>N 


Une façon de paraphraser le lemme de Borel-Cantelli est que nous avons l’alternative 


Paso À) = L Si D n>0 P(An) < 0 EqparaphrCapse ii 


1 sinon. 


Proposition 36.109. 
Soit X}, une suite de variables aléatoires et X° une variable aléatoire. Si 


D P(IXn- X| > €) < 00 (36.298) 


pour tout €, alors Xn 7 X. 
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Démonstration. Fixons € et considérons les événements À, = | X, — X| > €. L'hypothèse dit que 


D P(Ane) < © (36.299) 


et le lemme de Borel-Cantelli implique que 
P(limsup |X, — X| > €) = 0. (36.300) 


Un élément w est dans lim sup À, si il est contenu dans tous les A,, par conséquent, pour chaque 
e nous avons l'inclusion 


{w € ( tel que Xh(w) — X(w)} € Climsup 44. (36.301) 
Nous pouvons aller plus loin et écrire 
{w e N tel que Xa(w) — X(w)} = C{w e N tel que | Xn — X] > Fe SÉPARER) 
Or la probabilité de l’ensemble 
{w € Q tel que |X, — X| > €} (36.303) 


est 0 pour chaque €, et par conséquent la probabilité du membre de droite de (36.302) est 1. 


Exemple 36.110. 
Considérons une suite de 0 et de 1 dans laquelle le 1 arrive avec une probabilité p et le 0 avec une 
probabilité 1 — p. Une telle suite est modélisée par une suite de variables aléatoires de Bernoulli 
(Xn)nen indépendantes de paramètre p. 

Question : une telle suite contient elle une infinité de 1 ? Considérons les événements indépen- 
dants À, = {X, = 1}. Nous avons 


Y PA) ) PO ==) pc (36.304) 
n n n 
Par Borel-Cantelli et son expression (36.297), nous avons alors 
P(lim sup 4) = 1. (36.305) 


Donc une infinité d'événements À, se produisent, et nous avons bien une infinité de 1 dans la suite. 
Remarque : dans ce raisonnement nous pouvons considérer une probabilité non constante p, 


tant que la série Ÿ,, ph diverge. A 
EXooSRQUooWEpXRi 

Exemple 36.111. 

À propos de maximum. La fonction h: IR — IR donnée par h(æ1,...,74) = max;{x;} est une 

fonction continue. Nous voudrions prouver que si on à une famille (finie en à = 1,...,{) de suites 


) 


: / : à) ps. À He 
(en n) de variables aléatoires x{ —> a convergeant toutes vers la même limite à, alors 


My = max{X 0} ES à. (36.306) 
ï nm 


D'abord si nous avons / suites numériques (x®), alors la suite 


Mn = max xl) (36.307) 


converge vers la même limite. En effet si e > 0 est donné, il suffit de prendre N,; l’entier tel que 
EP — a] < € pour tout n > N;. Et ensuite on prend N > max{N}. 

Si maintenant au lieu de suites numériques, nous avons des variables aléatoires, le résultat reste 
valable. Nous cherchons à prouver que 


P({u e ( tel que max{XU) (w)} — a}) = 1: EIRE RER) 


Par ce que nous venons de dire sur les suites numériques, un élément w n’est pas dans cet ensemble 
seulement si il y à un à pour lequel x ne converge pas vers a. Or cela, pour chaque ? est un 
événement de probabilité zéro. 

Les w qui ne fonctionneront pas dans l’équation (36.308) sont ceux de la réunion d’un ensemble 
fini d’ensembles de probabilité nulle. C’est donc de probabilité nulle. A 
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36.4 Loi des grands nombres, théorème central limite 


36.4.1 Loi des grands nombres 


Lemme 36.112 (Inégalité de Markov|751]). 
Soit une variable aléatoire X € LP ete > 0. Nous avons 


P(IX| > €) < E(XI) (36.309) 
Démonstration. Nous avons 
E(|X|") > | X(w)dP(w) > | dP = éP(IX| > 6). (36.310) 
IX1Ze IX1Ze 
CorEWhIsBB 


Corolaire 36.113 ([751]). 
Soit p, une fonction croissante et positive ou nulle sur l'intervalle 1. Soit aussi une variable 
aléatoire Y: Q — R telle que P(Y € I) = 1. Alors pour tout b € I tel que (b) > 0 nous avons 


PITY =0)S< arte) (36.311) 
ThoefQyKZ 
Théorème 36.114 (Loi forte des grands nombres). 
Soit (X»n) une suite de variables aléatoires réelles 
(1) indépendantes et identiquement distribuées, 
(2) intégrables (c’est-à-dire dans L\), 
alors : 
DE 2 Xi); (36.312) 


Note : étant donné que les variables aléatoires sont identiquement distribuées, nous avons 
évidemment E(X1) = E(X2) =... 


ii Avertissement /question à la lectrice !! 36.115 
Est-ce que les variables aléatoires doivent vraiment être réelles ? 


CORooAYTPooMdAdoN 
Corolaire 36.116. 
Si les variables aléatoires réelles X, sont 
(1) indépendantes et identiquement distribuées, 
(2) dans L? 
alors - 
PART D ele (36.313) 
Démonstration. Nous voulons prouver que pour tout 7 > 0, 
P(IXn — E(X1)| > 7) — 0. (36.314) 


Remarquons d’abord que les variables aléatoires X, étant identiquement distribuées, E(X,) = 
E(X1) parce que E(X;) = E(X:) pour tout ti. L’inégalité de Markov avec r = 2 nous donne 


P(IXn — E(Xn)| > 1) < EUR — E(Xh)f) (36.315a) 
= 7 Var(K) (36.315b) 


1 
) Var(X:) (36.315c) 
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où nous avons utilisé la la proposition 36.39 : Var(X,) = Var(X1)/n. Au final nous avons prouvé 
que 


. : 1 
P(IXn — E(Xan)l > n) < np Var(X1), (36.316) 


qui tend vers zéro lorsque n — 0. 


Proposition 36.117. 
Soient X, des variables aléatoires indépendantes et identiquement distribuées avec X, > 0. Nous 
acceptons E(X1) = 0, c’est-à-dire que nous relaxons la condition X, € L! par rapport à la loi des 
grands nombres. 
Alors 
Xe )e lb]. (36.317) 


Démonstration. Si E(X1) < ©, nous sommes dans le cas de la loi des grands nombres. Pour chaque 
N € N nous considérons la suite de variables aléatoires 


XN) = min(Xy, N). (36.318) 
(N) (N) 


Nous avons évidement X} ” < X,. Les variables aléatoires X} ” étant bornées par N, elles vérifient 
la loi des grands nombres pour chaque N séparément. Par conséquent nous avons pour chaque N 


la limite 
AN = E(XN) Fapar bee Enns 


Nous supposons que E(X;) = ©, par conséquent limn_,4 E (x) — œ. Soit n > 0 et choisissons 
N de telle manière à avoir 


E(XN) > n+1. (36.320) 
La limite (36.319) nous permet de trouver no tel que pour tout n > ng nous ayons x) > 7. Au 
final, : : 

LEP MES. (36.321) 


ce qui montre que À} — co. 


Exemple 36.118. 
La loi des grands nombres justifie la pratique courante d’approximer une grandeur physique par 
la moyenne empirique d’un grand nombre de mesures. 


Exemple 36.119. 
Citons ici le dernier paragraphe de Le mystère de Marie Roget par Edgar Allan Poe, traduit par 
Charles Baudelaire ?!. 


Rien, par exemple, n’est plus difficile que de convaincre le lecteur non spécialiste que, 
si un joueur de dés a amené les six deux fois coup sur coup, ce fait est une raison 
suffisante de parier gros que le troisième coup ne ramènera pas les six. Une opinion 
de ce genre est généralement rejetée tout d’abord par l'intelligence. On ne comprend 
pas comment les deux coups déjà joués, et qui sont maintenant complètement enfouis 
dans le Passé, peuvent avoir de l’influence sur le coup qui n'existe que dans le Futur. 
La chance pour amener les six semble être précisément ce qu’elle était à n’importe 
quel moment, c’est-à-dire soumise seulement à l’influence de tous les coups divers que 
peuvent amener les dés. Et c’est là une réflexion qui semble si parfaitement évidente, 
que tout effort pour la controverser est plus souvent accueilli par un sourire moqueur 
que par une condescendance attentive. 


Dans le cours de la nouvelle, Edgar Poe cite et utilise la théorie des probabilités avec une justesse 
inaccoutumée dans la littérature. Maïs dans ce paragraphe final, Poe montre de façon la plus 
formelle qu’il n’a rien compris à la loi des grands nombres. A 


21. Disponible sur https://fr.wikisource.org/wiki/Le Mystère_de Marie _Roget 
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36.4.2 Théorème central limite 


Lemexpznznsurnton 
Lemme 36.120. 
Soit 2n — z une suite convergente dans C. Alors 
£: nm 
(i à 2) + ét. (36.322) 
n 
ThoUWodAï 


Théorème 36.121. 
Si les variables aléatoires X, sont 
(1) indépendantes et identiquement distribuées de loi parente X, 
(2) X1 € L°(Q, À), 
alors nous notons Xn = 157% X;, m= E(X1) et o? = Var(X1) et nous avons 
HD RE oi (36.323) 
Var(X,)  2/Vn 


Démonstration. Nous allons écrire la démonstration dans le cas de variables aléatoires réelles. 

La proposition 36.98 dit que la suite X, converge en loi vers X si et seulement si les fonctions 

caractéristiques convergent ponctuellement. Nous devons donc prouver, pour chaque ?? te R, que 
EqgPhitophi 


Supposons dans un premier temps que E(X;) = 0 et o(X;) = 1. Dans ce cas nous considérons la 
fonction 


Ds, = E(e'vr Di: Xr) (36.325a) 
Vr 
= [[ET*) (36.325b) 
k=1 
. t 

= [[Sx (+) (36.325c) 

as) vn 

t nm 
= dx, (5) (36.325d) 


Cette quantité est à priori complexe; nous ne pouvons donc pas immédiatement passer au loga- 
rithme. Nous pouvons par contre utiliser un développement en puissances de { en nous servant de 
la proposition 36.77 et de l'hypothèse comme quoi X1 € L? : 


2 


D x (#) = x, (0) + y, (0) + ak, (0) + a(be (36.326) 


où @ est une fonction qui a la propriété lim,_,0 a(x) = 0. 
En utilisant les hypothèses et la formule de dérivation de la fonction caractéristique, 


BD) =1 (36.327) 
x,(0) = E((iX)) = 0 (36.327b) 
SX, (0) = E(—X?) = — Var(X1) = —1. (36.327c) 
Nous avons donc : à 
t le à t 
Px, ( ) = 1 6 ( ) (36.328) 
/n 2m Nm (ya 
eR eC 


22. Chuck Norris peut vraiment le faire pour chaque t ER 
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de telle sorte que, en considérant une valeur fixée de t, 


ds, (t) = É = T à) " Egphifracfachengnr jet 


n 


où On = t'a(t/y/n). Nous avons bien entendu limy_ Bn = 0. 
Nous pouvons appliquer le lemme 36.120 pour obtenir la limite 


lim ds, (6) = e #72. D 


La convergence (36.324) est par conséquent prouvée dans le cas où E(X;) = 0 et Var(X;) = 1. 
Considérons maintenant des variables aléatoires avec E(X;) = met Var(X;) = o?. Elles peuvent 
être écrites sous la forme 
X;i=0X;+m (36.331) 


où X} est d'espérance nulle et de variance un. Nous avons alors 
n 
Sn=0 X;+nm, (36.332) 
i=1 


et 
Sn—nm  S 


— 36.333 
CEVET] nn 
où 97, = >, À}. L'étude de la variable aléatoire 
Si = 
ne (36.334) 


oyn 


revient donc à celle de $///n qui vient d’être effectuée. 


36.122. 

À propos du théorème central limite 36.121. Si pour une certaine variable aléatoire X on a E (X) = 
m, alors nous n’avons pas forcément P(X = m + a) = P(X = m — a). Est-ce que le théorème 
central limite permet cependant d’affirmer que dans un certaine mesure nous avons 


P(Xn = m + a) = P(Xn = m- 0) Fons ER 


lorsque n est grand ? 

Tel quelle, l'équation (36.335) est en général fausse pour chaque n parce qu’il existe des dis- 
tributions non symétriques. Mais bien entendu les deux membres tendent vers zéro pour n — co. 
Mais cela n’est pas lié à la symétrie de la distribution gaussienne. C’est seulement le fait que la 
gaussienne n’a pas de masses ponctuelles. 

Par contre, il y a effectivement une assurance de symétrie pour X,, lorsque n — «0. Le fait est 
que X» Æ, X où X est une gaussienne. La fonction de répartition de X est continue partout et 
la proposition 36.103 nous dit que pour tout x ER, 


Jim Fx,(æ) = Fx(t). (36.336) 


Vu que le nombre P (Xn € B(m+a, ô)) peut être exprimé avec des sommes et différences F>,,, 
nous avons 


Jim P(X, € B(m + a,6)) = P(X € B(m + a, ô)). (36.337) 


Par symétrie de la gaussienne le membre de droite est égal à P (X Ee B(m— a, ô)) et nous avons 
bien 
lim P(XnE B(m+a,6)) = lim P(X, € B(m— a,6)). (36.338) 


n—00 
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RemRHFDooGbaPYu 

Remarque 36.123. 
Le théorème central limite s'applique quelle que soit la distribution des variables aléatoires X; (dans 
les limites de hypothèses) ; en particulier il ne dit rien sur la moyenne des X;. Il dit seulement que 
l’écart de la moyenne « mesurée » à la moyenne « théorique » est une variable aléatoire gaussienne 
si on a mesuré assez de fois. 

Autrement dit, si la durée d’attente à la poste est de 5 minutes, et si j'y vais 2000 fois, alors 
la probabilité que ma moyenne d’attente soit de 4 minutes est la même que la probabilité qu’elle 
soit de 6 minutes ?* 


ii Avertissement /question au lecteur !! 36.124 
La remarque 36.123 est une interprétation personnelle. J'aimerais avoir l’avis de quelqu'un de plus 
compétent. 


Remarque 36.125. 

Nous pouvons obtenir la limite (36.330) d’une façon alternative. Nous considérons la détermination 
du logarithme complexe sur C\R- ; cela est une fonction analytique (théorème 26.34) vérifiant 
l'équation 


em) = ; (36.339) 


pour tout 2€ C\R et le développement 


O0 
n(1 + z) =} ie (36.340) 


En particulier, In(1 + z) = z + za(z) où lim,_,o a(z) = 0. Nous reprenons à l'équation (36.329) en 
fixant {. Nous avons 


P su (t) = exp D (Ps L (36.341a) 
Vr Vn 
— În 
= exp|nin(1+-2 17" (36.341b) 
n 
ê Ca —È — Pa 
À la limite n — 0 nous tombons sur et /2. 
Remarque 36.126. 
Étant donné que la variable aléatoire 
Sn — nm 


NE (36.342) 


converge en loi vers .Ÿ(0,1), nous avons la convergence des fonctions de répartition partout où la 
fonction de répartition de la normale est continue * (donc sur tout IR). En particulier, 


nm : 1 mn 
1 (Se È ) - | . “dy 1. (36.343) 


EVE) o V2T 
Nous avons la borne de Berry-Esséen qui donne une estimation de la vitesse de convergence : si 
X € L», alors il existe une constante C, indépendante de x, des X; et de n telle que 


Sn — nm FOOT 2 Cu 
PES < Pqyl < 36.344 
| ( oyn ) [. Tr. u on ( 


OÙ U3 = E(|X 1— m{°) est le moment d’ordre 3 de X. La chose à retenir est que la convergence est 
à la vitesse de 1/4/n. 


23. Et en l’occurrence, cette probabilité est nulle parce qu’on est en train de parler de variable aléatoire continue, 
mais vous voyez l’idée. 
24. Proposition 36.103. 
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En dimension d > 1, nous avons encore un théorème central limite. 


THOo0ADSIooFrWawC 
Théorème 36.127. 
Si d > 1, et si nous avons des variables aléatoires X\ à valeurs dans R‘ avec 
(1) les X, sont indépendantes et identiquement distribuées 
(2) les X, sont dans L?. 
Alors nous notons X1 = aus ns ,X(9). Nous avons 
Sn—nm 
— — N(0,Y 36.345 
en (0,5) (26.345) 
où 2 est ma matrice de covariance du vecteur aléatoire X1 : 
1 d 
Se (st) à (36.346) 


36.4.3 Marche aléatoire 


Nous considérons un mobile qui se déplace sur l’axe Z. À chaque pas de temps, nous supposons 
qu’il va faire un pas à gauche avec une probabilité p et un pas à droite avec une probabilité (1 — p). 
Nous nous demandons quel est le mouvement du mobile sur le long terme. 

La position $, du mobile à l’instant n est donnée par 


nm 
Eee (36.347) 
i=1 
où X; est le pas effectué à l'instant à. Ce sont des variables de Bernoulli indépendantes avec 
X: Epos + (l= por (36.348) 
c’est-à-dire 
P(Xi=-1)=p (36.349a) 
P(X;=1)=1-p. (36.349b) 


Ces variables vérifient les hypothèses de la loi des grands nombres : 
(1) elles sont indépendantes et identiquement distribuées, 
(2) elles sont intégrables. 


Pour le second point, le calcul est 


[ X\4P = J lrldPx = Î PE ET En (36.350) 
Q R R 
Nous avons par conséquent 
= 1 L ps. 
Xn=—) Xi #5 E(X1) = (1—2p) (36.351) 
LEE 
i=1l 
et 
Sn 
DS El (36.352) 
n 


Si p £ 1/2 nous pouvons conclure que 
(1) sip > 1/2, alors 5, 2% —o 
(2) si p < 1/2, alors S, 2% co. 
De plus nous connaissons la vitesse de divergence : elle est linéaire. Le mobile suit essentiellement 


l'équation p(n) = (1 — 2p}n. 


Remarque 36.128. 
Cela ne traite pas le cas p = 1/2. Dans ce cas, nous pouvons simplement dire que S, = o(n). 
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36.5 Les lois usuelles 


36.5.1 Loi de Bernoulli 


Une expérience de Bernoulli consiste à tirer au hasard un 0 ou un 1 avec une probabilité p de 
tomber sur 1 et 1 — p de tomber sur zéro. Il s’agit donc d’une expérience qui réussit ou qui rate. 

Le cas typique est une urne avec des boules indiscernables blanches ou noires. La probabilité p 
est la proportion de blanches dans l’urne (avec remise entre les tirages). Dans ce cas, nous avons 
l’espace de probabilité (Q, 4, P) où { représente l’ensemble des boules, À est l’ensemble des parties 
de ( et P est l’équiprobabilité sur (. Une variable aléatoire est une application 


X:Q— {0,1} 


w + couleur de la boule w. ee 
Nous notons Z(1,p) la loi de Bernoulli. Elle à une expression très simple : 

(0,1)({1}) = p (36.354a) 
B(0,1)({0}) = 1—p (36.354b) 

Une variable aléatoire réelle est de Bernoulli de paramètre p (0 < p < 1) si 
X:0-R (36.355) 

avec P(x =1)=pet P(X = 0) = 1 —p. En tant que mesure sur R, nous avons 
Px = pô + (1 — p)ôo. (36.356) 


Une fonction À qui réalise le supremum de la formule (14.461) est par exemple une fonction en 
escalier qui vaut en x le plus petit entier plus grand ou égal à x. L’espérance d’une loi de Bernoulli 


est alors 
E(x) = p. (36.357) 


Étant donné que la variable aléatoire X prend seulement les valeurs 0 et 1, nous avons pour tout 


ensemble mesurable B 
Px2(B) = P(X? eB)=P(XEB), (36.358) 


et par conséquent Px2 = Px et E(X?) = E(X). Nous trouvons donc la variance 


Var(X) = E(X?) - E(X)? = pp? = p(1-p). gr 880) 


36.5.2 Loi binomiale 


Une expérience binomiale consiste à répéter n expériences de Bernoulli de paramètre p et de 
compter le nombre de réussites. Une telle expérience peut être réalisée selon la procédure suivante. 

Soit une urne contenant V boules dont une proportion p de 1 et 1 — p de 0. Une expérience 
binomiale de paramètres n et p consistera à prendre n boules avec remise et à compter le nombre 
de 1 obtenus. 

En termes d’espaces probabilisé, nous avons ( qui est l’ensemble des tuples de taille n à valeurs 
dans {0,1}, la tribu À est l’ensemble des parties de Q, et la probabilité P est l’équiprobabilité : 


1 


P(w) = Nr (36.360) 
si il y a N boules dans l’urne. Nous construisons alors la variable aléatoire 
nm 
X(w) = Ÿ w (36.361) 


où w est une suite de taille n de 0 et de 1. 
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Calculons P(X = k). Il s’agit de considérer tous les sous-ensembles de taille n de Q contenant 
exactement k fois 1. Il y a (ei manière de décider lesquelles des n boules seront blanches. Ensuite, 
chaque boule blanche peut être choisie parmi les m boules disponibles, et chaque boule noire peut 
être choisie parmi les (N — m) disponibles. Nous avons donc 


PL = à = “ m” (N — my Eqformunprksin 


k NE 


En effet la mesure de probabilité sur { est la mesure de comptage renormalisée par le cardinal de 
Q qui vaut N°. Etant donné que p = m/N, nous transformons facilement (36.362) en 


P(X = k) = u pti pré. (36.363) 


Une variable aléatoire de loi binomiale étant une somme de variables aléatoires de Bernoulli 
indépendantes, l'espérance ? et la variance ?° s’obtiennent en sommant les espérances et variances 


E(X) = np FRERE 


termes à terme : 


et 


Var(X) = ÿ Var(X;) = np(1 — p) EURE 
i=1 


en vertu de (36.359). 
La loi binomiale lorsque p = 0.7 et n = 10. 


À 


+ 
ND + 
Co <e 
+ e 
Qt 

[ep] 

a 

O0 

Ke) 

_ 

(= 


36.5.3 Loi multinomiale 


La loi multinomiale .#{(n; k; p1,...,px) consiste à effectuer n épreuves d’une démarche aléatoire 
qui peut avoir k issues différentes avec probabilités p1,...,p4. Les variables aléatoires multinomiales 
sont N; avec les contraintes 


k 
D M=n (36.366a) 
i=1 

k 

> Hi (36.366b) 
i=1 

La fonction de probabilité multinomiale est 
! 
PO = nue Ne = 0) = pit per, (36.367) 
n1:...nE: 


Chacune des N; est une binomiale de probabilité p;. 


25. Valable même sans indépendance, proposition 36.33 
26. Lemme 36.30. 
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36.5.4 Loi géométrique 


Soit (X,) une suite indépendante et identiquement distribuée de lois de Bernoulli de paramètre 
p. Alors la variable aléatoire 
Z = inf{n > 1 tel que X, = 1} (36.368) 
est une loi géométrique de paramètre p. 
La loi géométrique compte donc le nombre d’expériences de Bernoulli à effectuer avant que le 
premier succès soit au rendez-vous. Nous avons 


P(Z =k) = P(Xy = 1)P(X1,..., Xg_1 = 0) = p(1— p} 1 (36.369) 


La loi géométrique de paramètre p = 0.2. 


À 


? e . * + + 4 — 
ré 8 9 10 11 12 13 14 


== 
N 
CO 
æ 
or+ € 


Note : si p est trop grand, on ne voit vite plus rien parce que la probabilité d’attendre longtemps 
est vite très faible. 


36.5.5 Loi de Poisson 
DEFooUWKHooUFKIlcr 


Définition 36.129 (Loi de Poisson). 
Une variable aléatoire Z suit une loi de Poisson de paramètre À, notée (À) si 


pz = 1 = 60% EReoL LUE 


pour tout ke N. 


La loi de Poisson est une loi de probabilité discrète qui décrit le comportement du nombre 
d'évènements se produisant dans un laps de temps fixé, si ces évènements se produisent avec une 
fréquence moyenne connue et indépendamment du temps écoulé depuis l'évènement précédent. 

Si un événement se produit en moyenne p fois par seconde, la probabilité d'observer l’événement 
k fois durant n secondes est donnée par P(Z = k) où Z est une loi de Poisson de paramètre À = pn. 


ThojDZjuj 
Théorème 36.130 (wikipedia). 
L’espérance et la variance d’une variable aléatoire de Poisson sont À : 
E(X) = À (36.371a) 
Var(X) = À. (36.371b) 


La loi de Poisson de paramètre À = 2. 


À 


æ 
NO 

CO 
a 
cr+ € 
[e»] 
+ 
O0 
Le) 
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36.5.6 Loi exponentielle 


La loi exponentielle représente le temps qu’il faut attendre pour qu’une particule se désintègre 
si elle a en permanence une probabilité?" Xdt de se désintégrer entre t et 4 + dt. L'espérance est 
donc 1/À. 

Il se passe donc en moyenne À événements par seconde. La proposition 36.138 nous montrera 
que le nombre d'événements se produisant en une seconde suit une loi de Poisson de paramètre À. 

DEFOooTSFNooULWNHY 
Définition 36.131 (Loi exponentielle). 
La loi exponentielle de paramètre À > 0, notée &(X) est la mesure de probabilité sur (R, Bor(R)) 
ayant pour densité ® l'application 


f:R—Rt 
he ir >=0 (36.372) 
Tr 
0 sinon. 


Voir la définition 36.81 pour ce qu'est la loi d’une variable aléatoire. 


Densité de la loi exponentielle de paramètre À = 2. 


PropTxGclin 


Proposition 36.132. 
Soit X = &(À). La fonction caractéristique est donnée par 


E(eiX) = À EQooMDJF onze 


À 
L’espérance et la variance sont données par 
1 
1 (36.374) 
Var(X) = x: 


27. Étant donné que À n'est pas limité à 1, en réalité ce n’est pas une probabilité. Je suis preneur d'une bonne 
interprétation physique de ce paramètre. 
28. Densité, définition 36.5. 


36.5. LES LOIS USUELLES 2583 


Démonstration. Pour la fonction caractéristique, 


00 
E(e#X) - | ete e 1 0 o(t)dr (36.375a) 
. 
=; 440. (36.375b) 
0 
ert-AHit) |" A 
= ja | (36.375c) 
AGE 
ns LE (36.375d) 


A—o it — À it — À 
Le premier terme est nul parce que si on prend la norme, 


A(—X+it) XA 


: € 
= À 


e 
=À + 


> O. (36.376) 


Cela prouve la formule (36.373). 
En ce qui concerne l’espérance nous faisons le calcul suivant : 


1 
E(X) = [ zfx(x)dx = À " re dx = 7 (36.377) 


Pour la variance, nous utilisons la formule (36.60). Nous avons 


00 
2 
E(X?) = J a fx (xx = j ae dr = >. (36.378) 
R 0 


Donc Var(X) = E(X?) — E(X)? = ÿ. 


La loi exponentielle est une loi sans mémoire en ce sens que 
P(X > x +uylX >y)= PIX > x) (36.379) 


En effet nous utilisons la règle de la probabilité conditionnelle 


P(AIB) = ER (36.380) 
Ici, 
P(X > x +ylX > y) = EX - Le = 7. (36.381) 


La proposition suivante montre que la loi exponentielle est à peu près la seule à être sans mémoire. 


D'où son importance dans l’étude des machines dont les pièces ne subissent pas d'usure. 
PropREXalBg 


Proposition 36.133. 
Soit X, une variable aléatoire admettant une densité continue f par rapport à la mesure de Le- 
besgue. Si elle est sans mémoire, alors elle est exponentielle. 


Démonstration. Nous posons w(x) = P(X > x). Cela est la fonction de répartition de X (à part 
que cette dernière est 1 — $(x) mais c’est pas grave), et est donnée par 


sie [ | f(bat. (36.382) 


Cette dernière intégrale vérifie les hypothèses du théorème 36.133, de telle sorte que 4 soit une 
fonction dérivable et w'(x) = f(x). 
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D'autre part en utilisant la définition de la probabilité conditionnelle la propriété de ne pas 
avoir de mémoire donne 


p(x + y) = p(x)p(y) (36.383) 
et de plus w(0) = 0. Calculons la dérivée de  : 
. T+E) — (x , €) —1 
0) = ti PETITE) Lim PO 2 (2) (0) (36.384) 


Donc % vérifie l'équation différentielle de l’exponentielle. 


Exemple 36.134. 

Une machine a une durée de vie représentée par une variable aléatoire suivant une loi de Poisson 
de paramètre À. Soit T, la variable aléatoire qui représente le temps de vie restant sachant que 
la machine a déjà vécu un temps y. Nous voulons trouver la fonction de répartition de 7,,. Nous 
avons 


P(T,>x)=P(X >z+yX >y)=P(X>r)=e ". (36.385) 
Dans ce cas, la loi de T,, ne dépend pas de y. Cela signifie que la machine ne vieillit pas et surtout 
que le modèle n’est pas réaliste. A 


Proposition 36.135. 
Si X + &(À) et Y — E (ui) sont indépendantes, alors 


(1) PX<Y)= 
(2) PX>Y)= HE 
(A PIX = Y)=0 


(4) min(X, ) + EX + p). 
De plus les variables aléatoires exponentielles ont une propriété d'absence de mémoire : 
P(X >t+5s|X>s)=P(X >t)=e "À. (36.386) 


Démonstration. Étant donné que X et Y sont indépendantes, la densité conjointe est le produit 
des densités (36.21). Nous avons donc 


P(X >Y)= ] Xe "ue dxdy (36.387) 
D 
où D est le domaine D = {(x,y) € IR? tel que x,y > 0,x > y}. Nous avons donc 
O0 z 
_)r — H 
P(X >Y)= ju | dx | dye "Te = (36.388) 
0 0 A+ 
sage: var(’a,b’) 
(a, b) 
sage: f(x,y)=exp(-a*x)*xexp(-bxy) 
sage: assume (a>0) 
sage: assume (b>0) 
sage: a*b*f.integrate(y,0,x).integrate(x,0,00) 
(x, y) |1--> a*xb/(a72 + axb) 
Pour trouver la loi de min(X, Y), nous écrivons 
Plon T)==PALrs-d (36.389a) 
= P{X = PT > 6) par indépendance (36.389b) 
= (1— Fx(t))(1— Fy(t)) (36.389c) 
= e AH} or(t) (36.389d) 
= 1 F;(t) (36.389e) 


où Z + E(À +). 
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36.5.7 Approximation de la binomiale par une Poisson 


Proposition 36.136. 
Soit (Xh) une suite de variables aléatoires avec Xn + Z{(n,Pn) telle que npn converge vers une 


constante À > 0. Alors Xn -2> (À). 


Démonstration. Commençons par écrire la loi binomiale sous une forme plus adaptée au passage 
à la limite : 


P(X = k) = (jeta st; _u RTL 8 pu (36.390) 


Le produit au numérateur contient k termes dans lesquels nous mettons n en évidence. Nous 


pee = GG D = 2). 017 50 


trouvons 


ln (36.391) 


Lorsque nous passons à la limite, tous les facteurs du type 1—1/n tendent vers 1 ainsi que (1—p,)""#. 
Les facteurs dont la limite n’est pas 1 sont donc 
k 
P(Xn=k)= cupn) (1 — pat. (36.392) 
Nous avons oo 
: n _ J: _ MPn À 
Jim (1 — DPn)" = Jim (i L ) ca (36.393) 


La thèse est alors obtenue en remettant les morceaux ensemble. 


Exemple 36.137. 
Considérons un serveur informatique qui reçoit des requêtes. Toutes les 107%5 il reçoit une requête 
avec une probabilité p = 0.05. La variable aléatoire qui consiste à donner le nombre de requêtes 
effectivement effectuées en une seconde suit une loi binomiale 4(1000, p). 

Déterminons la probabilité que le serveur reçoive 20 requêtes en une seconde. Nous approximons 
Z(1000,0.05) par Z(50), et la réponse est 


20 
Ts 10 (36.394) 


A 


36.5.8 Loi de Poisson et loi exponentielle 
subsecPoissonetexpo 


Soient X1,..., X, des variables aléatoires réelles indépendantes de loi exponentielle de para- 
mètre À. En utilisant le produit de convolution, nous pouvons trouver la fonction de densité de la 
somme (voir point 36.2.5). Commençons avec deux variables aléatoires X et Y. Les densités sont 


fx (x) = Izghe** (36.395) 
fr (9) = Ip>ahe #, (36.395b) 
et la densité conjointe est alors 

fxav (x) = J lo 0 14>0he dt (36.396a) 

R 
= Xe Î 1 dt (36.396b) 

0 

= x\e #7, (36.396c) 


Par récurrence si $S = X1 +:-::+X, nous trouvons 


fs(x) = x 1e, (36.397) 
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PropGMntiy 
Proposition 36.138 ([752]). 
Soit (Tr)ken une suite de variables aléatoires indépendantes de loi &(X). Nous considérons la 
variable aléatoire S, = Y_, Xi et pour chaque t € RŸ nous considérons 


nm 
N, = max{n > 1 tel que y, HS (36.398) 
i=1 


Alors Ni, - P(Xt). 


Démonstration. Ce que nous devons calculer est 


P(Ne = k) = P(Sn <t< Sns1). (36.399) 
Nous introduisons la variable aléatoire V,=1 = (X1,..., Xn+1) ainsi que l’ensemble 
An = {x € R°# tel que 1 +. + tn SÉ< Ti + + En + Tnri}. (36.400) 


Le problème est donc de calculer 
Fetes Pare) ]  fnn(o)de (36.401) 
An+1 


où A +1 est la partie de 4,1 dans laquelle x; > 0 pour tout à et f,+1 est la fonction de densité 
conjointe des variables aléatoires X;. Nous effectuons le changement de variables 


Rd (36.402a) 
i<k 
TR = Sp — Sk_1 (36.402b) 


dont le déterminant vaut 1. D’autre part par indépendance des variables aléatoires X;, la fonction 
de partition jointe f,:1 s'exprime sous la forme 


Pa LCCL: PRE Tai) = Fe, (x) ss ÉXns Cri) (36.403a) 
SE (36.403b) 
= Arte Anti, (36.403c) 


En ce qui concerne les bornes de l'intégrale dans les variables s;, nous voulons que tous les x; soient 
positifs, par conséquent 51 > 0 et ensuite l’équation xx = 5x — s4_1 demande 54 > sx_1. Les bornes 
sont donc données par l’ensemble 


IR e SES, (36.404) 
c'est-à-dire B, x ]t,00[ où 
Bn = {(s1,-.., Sn) tel que 0 < 51 < 52 <<... < 8, <t}. (36.405) 


Le théorème de Fubini nous permet de décomposer l'intégrale : 


Peru) ] AMPLES eds à (36.406a) 
BnxX]t,00[ 
O0 
= (| ds1.. ds) (| A (36.406b) 
L t 
SR —————— 
=)-1le-At 


= Xe Vol(B,) (36.406c) 
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où Vol(B,) est le volume de B, qui reste à calculer. L'ensemble C” = [0,{]" se décompose en 
cellules disjointes (à ensemble de mesure nulle près) de la forme 


Co = {0 < 81) < 802) < - +: < So(n) < t} (36.407) 
pour chaque permutation o € $,. Il y a exactement n! telles cellules dans C”. Par conséquent 
= Vol(C") = n! Vol(C,) = n! Vol(B,) (36.408) 


et Vol(Bh) = #5. Finalement nous avons 


PIN = mn) = PE SES in) = é FE, (36.409) 


36.5.9 Loi normale 


La loi normale de paramètres m et a > 0, notée .W(m, o?) est la loi donnée par la densité 


Yn,o2(€) = = | ; (£ =) (36.410) 


Proposition 36.139. 
Si la variable aléatoire réelle X suit une loi normale .W(m, o?), alors nous avons E(X) = m et 
Var(X) 0". 


Démonstration. L’espérance d’une variable aléatoire se calcule à partir de la formule (36.248) : 


+ LE (=) | dx (36.411a) 


ou+ me "/2 (36.411b) 


E(X) 


nl 


où nous avons effectué le changement de variable u = (x —m)/o. Nous utilisons ensuite l'intégrale 
remarquable 


J e%/2qu = V2r. (36.412) 
R 


En ce qui concerne la variance, nous avons le même genre de calculs. 


La loi normale réduite est la densité 


1 —x2/2 
æ) = T) = ——e ; 36.413 
Y( ) 70,1 ( ) 27 ( ) 
La variable aléatoire X suit la loi .W(m, o?) si et seulement si la variable aléatoire Z = À" suit 
la loi normale réduite .W(0,1). 
PropFnCaractNorm 
Proposition 36.140. 
La fonction caractéristique de la distribution normale .W(m, 0?) est 
a? 
P y(m,02)(t) = EXP (it — —) . (36.414) 
Démonstration. En suivant la formule (36.220), l'intégrale à calculer est 
it 1( m \2 
® y(m02)(t) = Le (7) dx. (36.415) 


= 
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Nous reconnaissons une transformée de Fourier. Afin de la calculer sans encombres, nous passons 
par les fonctions intermédiaires suivantes : 


g(x) = e7 3% 
h(x) = (=) (36.416) 


g 
k(x) = h(x — m). 


La fonction caractéristique que nous cherchons est 7h). Les formules liées à la transformée 


de Fourier nous donnent 
Ë(e) = R(Deït supeqhatier Er pEn 
h(t) = oÿ(ot) (36.417b) 


g(t) = etre 2 dx = Vore t/2, (36.417c) 
R 


Attention : l'intégrale à calculer est une transformée de Fourier inverse, d’où la formule (36.417a) 
qui à un signe de différence avec la formule usuelle. En recombinant toutes ces expressions nous 


trouvons  … 
Diese FREE (36.418) 


ce qu'il nous fallait. 


Lemme 36.141. 
Si Z = N(0,1), alors l'espérance de X = eZ est 


E(ef7) = «72, (36.419) 
/ . ; z 2 2 2 FAR OEReRe 
Démonstration. L’espérance se calcule en remarquant que 4° — 28x = (x — B)° — G° : 
BZ 1 Bx —x?/2 
E(e”*)=— | ee dx (36.420a) 
27 R 
1 1 2 92 
_ —3(z-8)* 6*/2 
= —— | e 2 e 36.420b 
5x Ja ( ) 
B?/2 
e 2 
: eY/2q 36.420c 
A y ( ) 
= EP, (36.420d) 


36.5.10 Vecteurs gaussiens 


Source : [418, 753]. 


Définition 36.142. 

Un vecteur aléatoire X:Q — Rd est un vecteur gaussien si toutes les combinaisons linéaires 
de ses composantes sont des variables aléatoires normales. En d’autres termes, X est un vecteur 
gaussien si pour tout vecteur u, la variable aléatoire u : X est gaussienne. 


Le vecteur moyenne d’un vecteur gaussien est E(X) = (E(X1),..., E(X,)) et sa matrice de 
variance-covariance est la matrice 


Kx = Var(X) = E|(x _ E(X))@ (X - E(X))| (36.421) 


où l'opération @ est celle introduite autour de léquation (11.642). Cela n’est rien d’autre que la 
matrice de covariance de la variable aléatoire X : (Q — Rd. 
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Lemme 36.143. 
Si les variables aléatoires réelles X1,...,X, sont des variables aléatoires réelles gaussiennes indé- 
pendantes, alors le vecteur X = (X1,...,X,) est un vecteur gaussien. 


Démonstration. Nous devons montrer que si X et Ÿ sont des variables aléatoires gaussiennes 
indépendantes, alors X +Ÿ est encore gaussienne. L'indépendance nous assure les égalités suivantes 
pour la fonction caractéristique : 


dyiy(t) = (PEN) — p(ét) pr). (36.422) 
Dans le cas où X et Ÿ sont gaussiens nous trouvons 


2,2 2,2 2 2142 
. oft . Oôt | of + 6 )t 
Pxy(t) = exp (ire _— 5 ) exp (ire ne ) = exp (ic + ma)t — Gite Ê 2) 


2 2 
(36.423) 
Étant donné que la loi d’une variable aléatoire est entièrement déterminée par sa fonction carac- 
téristique (théorème 36.79), nous déduisons que X + Ÿ est une normale de moyenne m1 + m2 et 


de variance a? = 0? + 03. 
Propfmzuol 
Proposition 36.144. 
La fonction caractéristique d’un vecteur gaussien est donnée par 
| 1 
Px(u) = exp (in : E(X) — LE Kxu) (36.424) 


où Kx est la matrice de covariance de X. 


Démonstration. Nous considérons la variable aléatoire réelle gaussienne uw + X. Son espérance m = 
Eu : X)=u: E(X). Nous commençons par établir la formule suivante : 


wKyu=u: Kxu= E[(Ix = E(X)] : u)°|. (36.425) 
Utilisant la linéarité de l’espérance, 


D E(Au)uru = Ÿ E(Arrut), (36.426) 
kl kl 


nous trouvons 


(36.427a) 
(36.427b) 
[X — E(X)] - u)([X — E(X)] : u)) (36.427) 
(LX — E(X)] : u).) (36.427d) 
Par la linéarité du produit scalaire et de l’espérance, 

[X —E(X)| u=u: X—E(u: X), (36.428) 
ce qui nous ramène à la variable aléatoire u : X. Nous avons alors 


Kilt) L (Lx = EG: u)”| = Var(u : X). (36.429a) 


Nous avons donc obtenu une forme pour la variance de la variable aléatoire u + X. Etant donné 
que u : X est gaussienne de moyenne m = u : E(X) et de variance o? = Kx(u,u), nous avons 


Dy - x(t) = exp (itm — So). F6480) 
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Par ailleurs nous avons Dx(u) = ®, : x(1) parce que 


Dx(u) = E(e% À) =D. x(1). (36.431) 
En utilisant la forme (36.430) pour ®, : x nous trouvons 
1 1 
Px(u) = Pa: x(1) = exp (im — 54) = exp (Eu : X)— LE Kxu). (36.432) 
ThoPRkxPdQ 


Théorème 36.145. 
Soit X = (X1,...,Xa), un vecteur gaussien. Les composantes sont indépendantes si et seulement 
si elles sont non corrélées. 


Démonstration. Nous savons que les variables aléatoires indépendantes sont non corrélées. Nous 
devons donc surtout prouver le contraire. Le fait que les variables aléatoires X; soient non corrélées 
signifie que la matrice de covariance est 


Kx = bas (36.433) 
0 di 


où a? = Var(X}4). Notons my = E(X%). Si u € R4, nous avons en vertu de la proposition 36.144 
que 


1 
Px(u) = exp (its +... + UM) — j(oru ++ cauë)) (36.434a) 
1 1 
= exp (iuim — AU) .… EXP (iuamMa — 57dud) (36.434b) 
—_ Px, (u1) ses D x, (ua). (36.434c) 


Les variables aléatoires X; sont donc indépendantes parce que la fonction caractéristique se facto- 
rise. 


Exemple 36.146. 
Nous donnons à présent un exemple de deux variables aléatoires gaussiennes qui ne forment pas un 
vecteur gaussien. Pour ce faire nous devons chercher des variables aléatoires non indépendantes. 
Soit Y — .W(0,1) et € une variable aléatoire (indépendante de Y) donnée par P(e = —1) = à, 
P(e = 1) = À. Nous considérons le vecteur (Y, eY). 

D'abord montrons que eŸ est une variable aléatoire gaussienne. Soit À un borélien de R. Nous 


avons 
P(eY € A) = P(e=1,Ye À) + P(e= —-1,-Y € À). (36.435) 

Par indépendance et par symétrie de Y ?* nous trouvons 
P(EY € À) = P(e=1)P(Y € A) + P(e=-1)P(-Y € À) (36.436a) 
- SPC eA)+ P( Y e À) (36.436b) 
= P(Y € À). (36.436c) 


Nous avons donc Ÿ - eY, et donc eŸ est gaussienne. 
En ce qui concerne la covariance, nous savons que E(Y) = E(e) = 0, donc 


Cov(Y,eY) = E(Y : eY) = E(eY?) = E(e)E(Y?) = 0. (36.437) 


Note : E(Y?) = 1. 

Les variables aléatoires Y et eY ne sont pas indépendantes. En effet si elles l’étaient, Y serait 
aussi indépendante de (eY }? = Y?, alors que Y et Y? ne sont pas indépendantes. Donc X = (Y,eY) 
n’est pas un vecteur gaussien. A 


29. C'est-à-dire que P(Y € A) = P(Y € —A) = P(-Y € À). 
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THOooLRZNooFXWwqy 
Théorème 36.147 ([118]). 
Soit me R et K e M(d,R) une matrice symétrique et positive. Alors il existe un vecteur gaussien 
de moyenne m et de matrice de covariance K. 


Démonstration. Nous effectuons la preuve avec m = 0%. Nous choisissons l'espace probabilisé 
(Q,.4) = (R”, Bor(R”)) où r est le rang de À muni de la probabilité de densité 


1 = Sr ee ( Sl). AAES) 
Nous considérons la variable aléatoire 
Y:A—R 
| (36.439) 
ut U. 


C’est une variable aléatoire gaussienne de loi Py, = À, où À, est la mesure de Lebesgue sur R’. Sa 
densité (36.438) s’écrit comme le produit de r gaussiennes indépendantes ; sa matrice de covariance 
est donc 1,,,. 

Étant donné que X est symétrique et positive, il existe une matrice d x r telle que À = AA. 
Pour voir cela, remarquons qu’il existe une matrice d x d qui fait le travail. En effet K se diagonalise 
par une orthogonale (théorème 9.221) : 


K = ADA' = AVDVDA! (36.440) 


où D est une matrice diagonale contenant d— r zéros et VD est la matrice que l’on imagine. Donc 
la matrice L = AVD est une matrice telle que LL! = K. Maintenant, étant donné que les d—r 
dernières lignes de D sont vides, les d — r dernières lignes de L n’ont pas d'importance et peuvent 
être choisies nulles, voire même ne pas exister. La matrice À € M(d x r,R) qui réalise AA! = K 
est la & troncature » de L à ses r premières lignes. 


Nous considérons la variable aléatoire Y = AY5:  — IR Étant donné que AYo est une 
transformation linéaire d’un vecteur gaussien, c’est un vecteur gaussien. Nous avons encore m(Y) = 
0 et 


Var(Y) = E(Y @Y) = E((A4Y) @ (AY)) = AE(Y @ Y)4* = AA = K (36.441) 


parce que E(Y@Y) = 1. Nous avons utilisé les formules du produit tensoriel introduit en (11.642), 
et en particulier la formule (11.645). 


Lorsqu'une matrice symétrique et positive K est donnée, nous avons créé un vecteur gaussien de 
covariance K en créant X = AŸ où Ÿ est le vecteur gaussien « le plus simple » et où À est donnée 
par AA! = K. La proposition suivante montre l'inverse : un vecteur gaussien X peut se réduire 
au vecteur gaussien « le plus simple » en utilisant la transformation Y = A-1X où À est encore 
donnée par AA! = K. Ce résultat nous permettra de voir les vecteurs gaussiens généraux comme 
des « changements de coordonnées » par rapport au vecteur gaussien simple Y = (Y1,..., Ya) avec 
Fr #0, 1): 

PropGacmRi 
Proposition 36.148. 
Soit Y = (Y1,...,Yh) le vecteur gaussien formé des variables aléatoires indépendantes Y; — 
N(0,1). Soit K une matrice symétrique et positive et la matrice À telle que AA = K. Alors 
le vecteur X = AY est gaussien de covariance K. 


30. À mon avis le cas m 0 se déduit alors facilement. Ecrivez-moi pour me donner la preuve quand vous l'avez. 
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Démonstration. Nous montrons que la covariance de X = AY est donnée par K. Nous avons 


Kx = E([X - E(X)]@[X - E(X)]) (36.442) 
= E(A(Y - E(Y))®@ A(Y - E(Y))) (36.442) 
= E(A([Y -E(Y)|@[Y - E(Y)])A!) (36.442c) 
— E(AA) (36.442d) 
=. (36.442e) 


Nous avons utilisé le lemme 11.222 ainsi que le fait que 


[Y - EY)]@[Y - E(Y)] = Ky = 1. (36.443) 


Notons que E(Y) = 0, mais cela ne joue pas ici. 


Théorème 36.149. 
Un vecteur gaussien X : Q — IRŸ possède une densité par rapport à la mesure de Lebesque si et 
seulement si sa matrice de covariance est inversible. Dans ce cas nous avons la densité 

1 1 _ E w 
RO = orne (-5LX ECO KX 860). AY 
Démonstration. Nous supposons que E(X) = 0. En utilisant la proposition 36.148, nous posons 
X = AY où Y est un vecteur gaussien Y < .W (0,1) et AAË = Kx. Si K n’est pas inversible, alors 
A n’est pas inversible non plus. Notons r < d le rang de A. Étant donné que X = AY, la variable 
aléatoire X prend presque surement ses valeurs dans l’image de À, c’est-à-dire dans un sous-espace 
de dimension r < d de R%. Ce sous-espace est de mesure nulle pour la mesure de Lebesgue, mais 
de mesure 1 pour la mesure Px. La mesure Px ne peut donc pas avoir de densité par rapport à 
celle de Lebesgue. 

Supposons maintenant que K%x soit inversible. La matrice À l’est aussi. Nous anticipons l’uti- 
lisation du théorème de changement de variable 14.290. Ici le changement de variable sera la 
transformation linéaire À dont le jacobien vaut 


1 1 


det(A”1)| = = 36.445 
dei(A = Le (86.445) 
Soit y la densité de Y. Nous posons 
1 
fx(x) = (36.446) 


= — "1 + 
Tr" 


où 7 est le produit des densités de d gaussiennes usuelles (0,1). Nous allons d’abord montrer 
que cette formule est bien la fonction (36.444) et ensuite que X admet fx comme densité. Nous 
avons 


_ 1 re 
NAT) = ras °P (-314 at). (36.447) 
et 


LA 1x? = £A tx, Al) 36.448a 


( 
( 


) 
= ((AT')A x, x) 36.448b) 
= (AA) x, x) (36.448c) 
= me, (36.448d) 


ce qui nous donne bien la formule (36.444). Nous vérifions maintenant que fx est bien une densité 
pour X. Soit B un borélien de R4. Nous avons d’abord 


P(Xe B) = P(AYeEB)= P(Ye À !B). (36.449) 
Ici nous avons utilisé le fait que À était bijectif. Nous avons ensuite 
P(X e B) = ] de Ï nec) ] td (36.450) 
A-1B B B 
C’est ici que nous avons utilisé le théorème de changement de variable 14.290. 
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36.5.11 Variable aléatoire de Rademacher 
Une variable aléatoire de Rademacher est une variable aléatoire de loi 


EY 00 — 01, (36.451) 


sur l’ensemble Q = {0,1}. C’est la variable aléatoire qui prend valeur 1 ou —1 avec probabilité 1. 


Parmi les propriétés évidentes de cette variable aléatoire nous avons Æ(e) = 0 et E(e?) = 1. 


PropCZRNRsf 
Proposition 36.150 (Inégalité de Khintchine[103]). 
Soient r1,...,17n des variables aléatoires indépendantes et identiquement distribuées de Rademacher 
et une combinaison linéaire ” 
X— ),ar (36.452) 
i=1 


avec a; € R. Alors 


IX» < VEE (IX). De) 


Démonstration. Pour rappel la définition est que 
IX {2 = 4/E(IXP). (36.454) 
Vu que c’est de la quantité E(|X |) que nous voulons parler, nous notons l'inégalité 


E(|X|) = LixwaPt > | XP) = [E(X)|. (36.455) 


Nous supposons que Dia ai = 1; sinon nous multiplions les a; par ce qu’il faut pour l'avoir 
et ce facteur sortira des deux côtés de (36.453). 
Nous allons passer par la variable aléatoire intermédiaire 


02 
Y=[[(+iayr;) (36.456) 
j=1 
et pour presque tout w € ( nous avons 
Y(w)| = ] [11 + iaçr;(w)| (36.457a) 
j=1 
nm 
=]] 1+ar;(w) (36.457b) 
ji ns ——/ 
=] 
nm 
=][]4/1+0 (36.457c) 
j=1 
L 2 
<][[Ve (36.457d) 
j=1 
L 2 
=, | le (36.457e) 
j=1 
= V2 (36.457f) 
= 4e. (36.457g) 


Donc |Y sx < Ve où |.| est la norme supremum sur (. Cela nous permet de donner une première 
inégalité à propos de E(|X|). D'abord 


EG = | XGY GAP GI < | (XIIe dP() = MIE), (86458) 
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ensuite en remplaçant |Y |, par la majoration que nous venons de donner de |Y(w)|, 
E 
VeE(IX|) > [E(XY)|. 36480) 


Il nous reste à prouver que |[E(XY)| > |X|o. 
Pour ce faire nous commençons par noter que pour chaque j nous avons E(r;) = 0et E (iajr?) = 
ia; ; en utilisant l’indépendance des r; et le lemme 36.29 nous avons alors 


E(r;Y) = E(r;(1 + ir) [ [GA + iare)) (36.460a) 
kz£j 
= E(r;(1 + iar;)) | | EC + aura) (36.460b) 
k#j 
= ia | Ï (1 +iaxE(re)) (36.460c) 
k#j 
= iaj. (36.460d) 


Par conséquent, en utilisant la proposition 36.33 dans le cas non indépendant, 
nm 
BIXY) = Ÿ a Er Ÿ) = Yajia; =) 4 =4. (36.461) 
j=1 j j 


Nous pouvons compléter l'équation (36.459) en 


VeE(|X|) > |E(XY)| = 1, (36.462) 
et nous nous empressons de montrer que | X|2 = 1. En effet |X|2 = 4/E(|X{[?) alors que 
IX12 = E(Q œri)?) (36.463a) 
ï 
= E( S'ari+2Y aaÿrir;) (36.463b) 
k i#j 
_ . 2 re me 
= a$ +2) &a;E(rir;) (36.463c) 
k i#j 
— (36.463d) 


36.5.12 Loi de Student 


Définition 36.151. 
La loi x? à d degrés de liberté est la loi de la variable aléatoire Y? + --: + Y? si les (Y;) sont des 
variables aléatoires normales indépendantes centrées et réduites. 

La loi de Student à d degrés de liberté est la loi de la variable aléatoire 


a (36.464) 


où X = .W(0,1) et K = x?(d) sont des variables aléatoires indépendantes. Cette loi est notée 


T(d) 


Nous avons une illustration de la densité de la loi x?(10) à la figure 36.1. 
L'importance de cette loi sera dans le théorème de Cochrane 37.15. 


36.6. ESTIMATION DES GRANDS ÉCARTS 2595 


Sr 


à 


| | : ++ 
6) 10 15 20 25 30 
FIGURE 36.1: La densité de x?(10). LabelFigChiSquared 
36.5.13 Indépendance, covariance et variance de somme 
subsecTTHohur 


Si X et Ÿ sont des variables aléatoires réelles, nous avons défini la covariance par (36.69) : 
Cov(X, Y) = E[(x — E(X))(F - E(Y))| (36.465) 
Une clef est le lemme 36.29 qui dit que lorsque X et Ÿ sont indépendantes, alors E(XY) — 
E(X)E(Y). Nous avons les liens suivants. 
(1) Si X et Y sont indépendantes, alors Cov(X, Y) = 0. 
(2) 
(3) 


La réciproque n’est pas vraie par l’exemple 36.31. 


Si Z est un vecteur gaussien, les composantes Z; sont indépendantes si et seulement si la 
matrice de covariance est diagonale, c’est-à-dire que les Z; sont deux à deux non corrélées ; 
c’est le théorème 36.145. 


(4) En ce qui concerne la variance d’une somme, 
Var(X +Y) = Var(X) + Var(Y) +2Cov(X, Y). (36.466) 


Donc lorsque X et Y ne sont pas corrélées, la variance est sympa avec la somme. En particulier 
lorsqu'elles sont indépendantes, mais pas seulement. 


36.6 Estimation des grands écarts 


Si Sn est une somme de variables aléatoires de Bernoulli X; indépendantes de probabilité p, 
l'espérance de S$,/n est p, et nous voudrions savoir quelle est la probabilité d’avoir un taux de 
succès un peu plus important : 


P(È > p+é). (36.467) 


La loi des grands nombres nous permet de dire que ça ne va pas être très grand. En effet si nous 
posons 


K=X;-p-e (36.468) 
et : 
1 sa 
Zn = = à: EE (36.469) 


la loi des grands nombres (théorème 36.114) nous indique que 


Zn 5 E(Mi) = —e. (36.470) 
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La proposition 36.99 sur le lien entre les types de convergence nous donne immédiatement la 
convergence en loi. C'est-à-dire que pour tout 7 > 0, 


P(IZ + el > n) = 0. (36.471) 
En prenant mn = 3, 
P(Zn = 0) < P(|Zn + él > 5) 0) (36.472) 
Tout cela montre que 
Jim P(Ÿ > >p+e)=0. (36.473) 


Autrement dit, la probabilité de tomber à une distance fixée de la moyenne tend vers zéro lorsque 
le nombre d’essais augmente. Rien d’étonnant. 

Le théorème suivant nous indique la vitesse de convergence. Elle est exponentielle et le coeffi- 
cient est donné en fonction de p et de €. 


ThoYYaBXKU 
Théorème 36.152 ([103]). 
Soient des variables aléatoires X; - Æ(p) et 
nm 
Sn = » X; = B(n,p). (36.474) 
i=1 
Pour € € ]0,1 — p[, nous définissons 
ee 
h4(e) = (p+en (2 L :) +(1=-p—e)m (=) | (36.475) 
p 1-92 
Alors ItemUWyKcpMi 
(1) h4(e) > 0. ItemUWyKcpMii 


(2) Pour tout n > 1, nous avons 


P (& __—. ) 0) EqXFor tn 


ItemUWyKcpMiii 
(3) L'’estimation (36.476) est optimale au sens que 
Fe DES (36.477) 
n—0 n n rP E + ° ° 
Démonstration. Pour tout t > 0 nous avons : 

S 
P (= > p+ <) = P(S, > np+ne) (36.478a) 

n 
< pois) nn 
Hu Al 2 Sn) (36.478c) 


“a > ER P(S, = k) supers 
= & "t(p+e . 


er "t(p+e 


}a pie (36.478e) 


p) + pet)" (36.478f) 


(Le 
= exp (- n(t( p+e)—In(1 — p+pe He (36.478g) 


Justifications : 


36.6. ESTIMATION DES GRANDS ÉCARTS 2597 


— L'inégalité (36.478b) est l'inégalité de Markov (corolaire 36.113) avec (x) = et. 
— La ligne (36.478d) est une utilisation du théorème de transfert 36.83. 


Nous posons maintenant 
h = sup (t(p + €) — In(1 — p + pe’)). (36.479) 


t>0 


Pour cette valeur de À nous avons 
S 
P (& >p+ <) ie 1. (36.480) 
n 


Nous considérons la fonction 

Rs R 
À : (36.481) 
tr t(p+e) — In(1 — p + pe”). 


Elle vérifie g(0) = 0 et 


!(t) = = 36.482 

JO = E+- x (86.482) 
D 

0) = (p+e) — = €e> 0. 36.482b 

JDE (36.182b) 


Par conséquent sur un voisinage de t = 0 la fonction g est strictement croissante et nous concluons 
que g prend (au moins) quelques valeurs strictement positives. Du coup nous avons 


h = |glo > 0. (36.483) 
Nous cherchons maintenant pour quelle valeur de t est réalisé le maximum de g. D’abord résoudre 


g'(t) = 0 donne 
_mf@+9û—?r) 
to =] ( be ) (36.484) 


Vu que g'(t) — p+e—1 < 0, nous avons lim ,% g(t) = —00 et donc le to trouvé est bien un 
maximum et non un minimum. 


Il est maintenant loisible de calculer une valeur pour À : il suffit de calculer g(to). La calcul 
n’est pas très compliqué et donne 


but) = bird (e2<) vob (2) (36.485) 


ce qui est bien h = h}(e). Cela démontre les points (1) et (2). 
Nous montrons à présent l’aspect optimal de l’estimation. Nous savons déjà que 


= (PÈ >p+ ) < h}(e). 6480) 


Nous posons k, = [n(p + e)]. Vu que p +e < 1 et que S, < n, nous avons 


n 


Pr >p+e) = P(Sh > n(p+e)) > P(Sn = kn) = L 


}r pre, (36.487) 


C’est maintenant que nous utilisons la formule de Stirling (lemme 20.203) pour chacune des fac- 
torielles intervenant dans le coefficient binomial. Nous trouvons : 


(2)" V2rna(n)pt (1 — p}Er | 
()" VZrbna(k) (En) 270 = 4) 


Nous savons que kh = n(p + €) + o(n) avec o borné par 1. Par conséquent n — k, — 0 et nous 
pouvons regrouper les coefficients en a en 


(36.488) 


P(S>p+e) > P(S, = h)=&= 
nm 


> 1. (36.489) 
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Nous remarquons aussi que les e se simplifient. Nous récrivons & sous la forme 


* V2r \ ki(n ra PLEY PP TES (36.490a) 
= A(n) 
p kn 1—9 n—kn 
= A(njn" (2 ) ( =. ) (36.490b) 
np\e [n(1-p}\" 
re ( ) ( > ) : (36.490c) 


Nous passons au logarithme et nous étudions In (P(Sn — En) Nous avons les termes suivants à 
étudier : 


Ho = n(2) + > ïs ee =) 


nm 


(36.491) 


+ ki (2) + (n — kn)in (2) 4 Lin (a(n)). 


Nous étudions terme à terme la limite de cela lorsque n — 0. 
(1) Le terme ÆIn(2r) ne pose pas de problèmes. Il tend vers zéro. 


(2) Si nous remplaçons k, par n(p + €) + o(n) nous voyons que ce qui est dans le logarithme est 
In(P(n)) 


= qui tend vers 


majoré par LOI pour un certain polynôme P. Ce terme est dans le cas 
zéro lorsque n — 00. 


(3) Pour ce terme nous remplaçons k, par n(p + €) + k, — n(p+e). Nous devons alors étudier la 


limite de e (re) . kn — + €) . (2e) F0) 


kn kn 


Ce qui est dans les logarithmes est encadré de la façon suivante : 


n(p + €) _ ke n(p+e) +1 


< (36.493) 
np np np 


Donc la limite de k,/np est (p + e)/p. Les logarithmes restent bornés. Pour le second terme 
de (36.492), le numérateur du coefficient est borné par 1. Donc le second terme tend vers 
zéro et le tout tend vers 


(p+e)ln ( ) | (36.494) 


p+e 


(4) Nous devons enfin étudier le dernier terme. La combinaison s’étudie de la façon sui- 


vante : 


n—kn 
n 


n—kn n—-n(p+e) +n(p+e)—-kx  n(l—-p—e) +n(p+e) —kn 
n n n 


> 1—p—e (36.495) 


parce que n(p + €) — k, est borné par 1. Sachant cela, notre terme a pour limite 


n— En, (ee 2) t-on (2) | (36.496) 


n n — kn 


En remettant tous les morceaux bouts à bout, 
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Étant donné que nous avions déjà prouvé que P(È > p + €) > P(Sy = kn), nous avons 
1 1 
liminf —-In (PÈ* > p+ 9) > lim —P(S, = kh) h+(e). (36.498) 
no 7 n no 7 


En combinant avec (36.486) nous trouvons que 
1 Sn 
di in (PC >p+6))=h4(0). (36.499) 


Pour cette dernière déduction nous utilisons le fait que si (a,) est une suite telle que a, < l et 
lim infn_,00 An = l, alors (a,) admet une limite qui vaut L. 


36.7 Simulations de réalisations de variables aléatoires 
Le générateur de base que possède un système informatique est un générateur de nombres 
pseudo-aléatoires de nombres entiers entre 0 et m — 1 généré par une suite du type 


Tn+1 = (a%n +b) mod m. (36.500) 


36.7.1 Générateur uniforme 
36.7.1.1 Première méthode 


Une première façon de générer une variable aléatoire de loi uniforme sur |0,1|[ est de diviser 
par m — 1 la suite de x,. En effet nous avons la proposition suivante. 


Proposition 36.153. 
Si (Yh) est une suite de variables aléatoires indépendantes et identiquement distribuées de loi 
uniforme sur {0,...,n—1}. Alors 


y, 
+ [0 1: (36.501) 
n 
Démonstration. Nous prouvons la convergence en loi en passant par la fonction de répartition et 
la proposition 36.100. La fonction de répartition de la densité 7 [0, 1] est 
Fx(x) = xllon- (36.502) 
La fonction de répartition de la variable aléatoire (discrète) X, = 2 est 


[rx] 


FE = PP <= — (36.503) 
n n 
où |a| est le plus grand entier inférieur à a. Nous avons évidemment 
lim Hal =, (36.504) 
n—D 7 


ce qui montre la convergence des fonctions de répartitions et donc la convergence en loi qui nous 
intéresse. 


36.7.1.2 Seconde méthode 


Soit (Ÿ,) une suite de variables aléatoires indépendantes et identiquement distribuées selon la 


loi Y, + 7{0,...,m — 1}. Alors la série de variables aléatoires 
OO 
Ye 
Eee (36.505) 


est une série qui converge presque surement parce que Ÿ4 est borné par m. Avec probabilité zéro 
nous avons Z = ÿ} 1/mf qui converge. Nous avons 


Z-4%10,1]. (36.506) 


L’argument pour montrer cette loi est qu’en base m, la variable aléatoire Z a un développement 
décimal Z = 0.Y1Y2Y3Y4: 
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36.7.2 Simulation par inversion 
Nous cherchons maintenant à simuler une loi X de fonction de répartition F. 


Définition 36.154. 
Soit f: R — [0,1] une fonction croissante, continue à droite et telle que 


Jim, tx) = 0 (36.507a) 
Jim (a) = 1. (36.507b) 


L'inverse généralisé de f, notée f-! est la fonction définie par 
FT (t) = inf{x tel que f(x) > t}. (36.508) 


Remarque 36.155. 


L’inverse généralisé d’une fonction bijective est la vraie fonction réciproque usuelle. 
Proplnvgenecntddr 


Proposition 36.156. 
Soit f une fonction admettant un inverse généralisé f-!. Alors nous avons f-!(t) < a si et 
seulement sit < f(a). 


La continuité à droite joue pour démontrer cette proposition. 


Proposition 36.157. 
Si Fest la fonction de répartition de la variable aléatoire X et si U est une variable aléatoire de 
loi uniforme [0,1], alors FU) a la même loi que X. 


Démonstration. Nous montrons que les fonctions de répartition de X et de F!(U) sont identiques. 
En utilisant la proposition 36.156, nous avons 


P(FTUU) < y) = P(U < F(y)) (36.509) 
= F(y) (36.509b) 
= P(X < y). (36.509c) 


Donc FT{U) est la fonction de répartition de X. 


La difficulté de la méthode par inversion est qu’il faut être capable de calculer l'inverse de la 
fonction de répartition de la loi à simuler. 


36.7.2.1 Loi exponentielle 


La loi exponentielle est une loi qui peut être simulée par inversion. Nous savons du lemme 36.75 
que sa fonction de répartition °! vaut 


F(x)=1-e *, (36.510) 


et l'inverse vaut | 
Fl{y) = a In(1 — y). (36.511) 


Par conséquent, une bonne formule pour simuler une loi exponentielle est 
1 
= h(i=0) (36.512) 


Notez que U étant uniforme, nous pouvons tout autant prendre —In(U)/À. 


31. Définition 36.73. 
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36.7.3 Algorithme de Box-Muller 
Il s’agit de simuler une loi gaussienne. La proposition est la suivante. 


Proposition 36.158. 
Si U et V sont des variables aléatoires indépendantes de même loi uniforme sur [0,1], alors le 
couple 
(X,Y) = (4/—-2Im(U) cos(27V),4/—21n(U)sin(27V)) (36.513) 
vérifie 
(1) X est indépendante de Y 
(2) X et Y sont de loi.W(0,1). 


Démonstration. Nous allons montrer la proposition en utilisant les fonctions tests. Soit donc 
w: R? — R une fonction bornée et mesurable. Soient Z et W, deux variables aléatoires indé- 
pendantes de loi .#(0,1). Nous allons montrer que 


F((X,Y)) = E|v( —2n(0) cos(2rV). —2h(U) sin(2rV)) | (36.514) 


Par indépendance de U et V, la densité du couple est le produit des densités, donc en passant aux 
coordonnées polaires, 


o = ne (36.515a) 
= =. Fo Je 2e l24xdy (36.515b) 
27 
= . a (r cos 0, rsin0)e ” "Pydr. (36.515c) 
Nous posons u = e"/2 et v = a. En particulier r = 4/—21In(u) et 
ÿ= (L [4 4/—2 In(u) cos(2rv), 4/—21In(u) sin(2rv))dudv (36.516a) 
= E(e (V/=2m(0) cos(27V), V—2m{U) sin(2rV)) (36.516b) 


parce que mesure dudv est la densité de la loi uniforme. 


En pratique, la formule 
(x, y) = (V-21nxcos(2ry), V-21nxsin(2ry)) (36.517) 


est une façon d'obtenir deux gaussiennes à partir de deux variables uniformes. 


36.7.4 Méthode du rejet 


La méthode du rejet permet de simuler des lois à densité. Soit f la densité de la loi à simuler. 
Nous faisons les hypothèses suivantes. 


(1) Il existe une densité g d’une variable aléatoire facile à simuler. 
(2) Il existe un k > 0 tel que f(x) < kg(x). 


Remarque 36.159. 
Le k de la seconde hypothèse est nécessairement plus grand que 1. En effet, 


1-[r<xfo=k (36.518) 


parce que f et g sont des densités et ont donc une intégrale égale à 1. 
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Proposition 36.160. 
Soient (X,) et (Uh) des suites de variables aléatoires indépendantes au sens où non seulement les 
X; et Ux sont indépendants entre eux, mais de plus X; est indépendant de U; pour tout à et 5. 
Nous supposons que les X; sont indépendantes et identiquement distribuées, de densité g et que les 
U; sont indépendantes et identiquement distribuées de loi uniforme. 

Nous introduisons la variable aléatoire à valeurs dans N 


p(w) = inf{n > 0 tel que a(Xa(w)) > Un(w)} (36.519) 


où «a est la fonction définie par 


FOR 
a(x) = (ee HAE (36.520) 
0 


Y(w) = Xy(u)(w) (36.521) 
admet f pour densité. 


Démonstration. D'abord étant donné que f(x) < kg(x) nous avons a(x) € [0,1]. Nous pouvons 
à priori avoir p(w) = %, ce qui rendrait Ce la définition de Eden cons our 
commencer que P(p = = 0. En utilisant l'indépendance nous avons 


N 
PalX,) < Un) = Jim P(a(X;) < U) (36.522) 
PPT 
= lim P(a(X1) < WU)”. (36.522b) 
N—co 


Pour conclure nous devons prouver que P (a(X1) Le Ui) < 1. Pour cela nous calculons 


1 
P(a(X1) < Ui) = dx | du (x) <u9(T) (36.523a) 
R Jo 


: (ato = fe) dx (36.523c) 


(36.523d) 
ST (36.523e) 


| 

= Loco (1— a(x))dx (36.523b) 
| 
ï 


L'équation (36.522) nous permet donc de conclure que P(a(X,) < Uh,Vn) = 0. Par conséquent 
la variable aléatoire Y(w) = X,{,)(w) a un sens. 
Nous devons maintenant prouver que Ÿ a bien f pour densité. Pour nous considérons un 


ensemble mesurable À € Bor(R) et nous montrons que P(Y € A) = (, f(x)dx. Nous avons 
O0 : : 
P(Y € A) = P(X,€ 4) = Ÿ P(X;e A,p= j). Fadscr AUS, 


i=1 
Par ailleurs nous avons 


P(X;e A,p= j) = P(X;e A,a(X;) > U;,a(Xm) < Um Vm < j — 1) 
1 


= P(X;e A,a(X;) > Uj)P(a(X1) < Ui)” FqalPAj Ava past) 
j—1 
on 
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Étant donné que g(x)dx est la densité de X; et que du est la densité de U, nous avons 


1 
P(X;e A,a(X;) > U;) = J Î lreAla(x)>u9(t)dudr (36.526a) 
R Jo 
1 
_ J (axes | Lo(r)>udu dx. (36.526b) 
R 0 
a(x) 
- [ LE) (36.526c) 
R k 
= LP(X e A). (36.526d) 


En remplaçant dans l'équation (36.525) nous trouvons 


1 LT 
P(X;e A,p = j) = EP(X € À) (: = 5) | (36.527) 
Et enfin, l'équation (36.524) donne 
1 e IN 
P(Y € A)= = P(X € 4) (: :) = P(X € À). (36.528) 
i=1 


36.7.5 Simuler une loi géométrique à l’ordinateur 


Si (X,) est une suite de variables aléatoires indépendantes et identiquement distribuées avec 
Xn = B(p), alors 
Z = min{k > 1 tel que X4 = 1} - #(p). (36.529) 


Nous avons alors P(Z = k) = (1 — p)*p. 
Si nous avons un générateur de lois de Bernoulli de paramètre p, alors nous simulons jusqu’à 
obtenir 1 et nous comptons combien de simulations ont été nécessaires. 


36.7.6 Simuler une loi exponentielle à l’ordinateur 


Nous pouvons utiliser la méthode de l’inversion. Étant donné que la fonction de répartition de 


la loi exponentielle est F(x) = 1—e7", nous avons F7! (y) = LIn(1—y). Par conséquent à partir 


d’un générateur uniforme U, nous pouvons calculer 
— 1 
FA x h(U) (36.530) 
qui suivra une loi exponentielle d'espérance 1/À. 


36.7.7 Simuler une loi de Poisson à l’ordinateur 


Nous savons du point 36.5.8 que si les T; sont des variables aléatoires indépendantes et identi- 
quement distribuées de loi & (À), alors nous avons 


max{n > 1 tel que ne Se PiX): (36.531) 


U 


La façon usuelle pour créer une loi exponentielle est d’avoir un générateur de loi uniforme U; et 
d'écrire que 
1 
3 nu) - &(À). (36.532) 
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Nous devons donc faire la somme de telles variables aléatoires et voir à partir de quel moment la 
somme dépasse 1. Le calcul est le suivant : 


| 
— ) = Im(U) <1 (36.533) 
i=1 À 
implique : 
LA <E (36.534) 
i=1 


En pratique, la variable aléatoire qui se comporte comme une loi de Poisson de paramètre À est 


nm 
N = max{n > 1 tel que | [U; > e}. (36.535) 
i=1 
Nous générons donc des nombres aléatoires entre 0 et 1 et nous effectuons le produit jusqu’à ce 
qu’il passe en dessous de e-*. À ce moment, nous retournons le nombre de nombres qu'il a fallu 
générer. 


36.8 Sage 


Nous allons montrer maintenant quelques trucs importants dans l’utilisation de Sage pour 
réaliser des petits graphiques. 


Remarque 36.161. 

Dans ce qui suit, nous allons parler de « Sage », mais en réalité nous allons surtout parler du 
module scipy qui fait partie des modules hyper-usuels de Python. Les remerciements vont donc 
au moins autant du côté de l’équipe de scipy que vers celle de Sage. 


36.8.1 Loi exponentielle 


Il faut savoir que la définition d’une loi continue retourne automatiquement la loi centrée 
réduite. Pour avoir une loi exponentielle de moyenne donnée, il faut donc préciser de façon plus 
maligne que ce que l’on croit. 


from scipy import stats 


s[X=stats.expon(scale=5) 


print(X.mean()) # retourne 5 


P=plot( X.pdf ,x,0,10 ) 


show(P) # Affiche le graphique 


tex/frido/code_sagel.py 


36.8.2 Inverser des lois 


Pour trouver des intervalles de confiance, il faut souvent calculer des inverses de loi. Bien 
entendu Sage le fait. Ce que sage connaît, c’est l’inverse de la fonction de survie. Autrement dit si 
X est une variable aléatoire, X.sf est la fonction x + 1— P(X < x) et X.isf en est l'inverse. Pour 
résoudre P(X < €) = à, il faut résoudre F(£) = a, c’est-à-dire 


1—F(é=1-a, (36.536) 


ce qui se fait de la façon suivante : le programme suivant donne pour une loi normale centrée 
réduite la valeur de £ pour laquelle P(N < £) = 0.05 : 


H 
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from scipy import stats 


3IN=stats.norm 


print N.mean() # 0 
sprint N.var() # 1 
xi = N.isf (0.95) 
print xi # -1.64485 
N.cdf(xi) # Vérification : 0.065 


|# Graphiques de la fonction de densité et la cumulative. 
s|P=plot (N.cdf ,x,-10,10) 

11Q=plot (N.pdf ,x,-10,10 ,color="red") 

5s| show (P+Q) 


tex/frido/code_sage2.py 


36.9 Monte-Carlo 


Nous voudrions calculer une valeur approchée de l’intégrale 


= [ f(x)dx. (36.537) 


Les méthodes classiques consistent à discrétiser l'intervalle [a, b] et en calculant une somme de la 
forme ÿ, w; f(x). 
L'idée de Monté Carlo est de remplacer le découpage déterministe x; par des variables aléatoires 
X; en trois étapes. 
(1) Pour cela nous commençons par écrire l'intégrale comme une espérance : 1 = E(X) où X est 
une variable aléatoire définie sur un espace probabilisé (Q,F, P) à déterminer. Une contrainte 
est évidemment d’avoir X € L1(Q,F, P). 
(2) Nous générons une suite de variables aléatoires indépendantes et identiquement distribuées 
(Xh) de même loi que X et la loi (forte) des grands nombres implique que 


DE 


31 


nm 
SXr 2% E(X) = LI. (36.538) 
k=1 


(3) Le dernier point sera de donner un intervalle de confiance. 
ExemplelintfdxEXu 


Exemple 36.162. 
Nous voudrions déterminer de façon approchée l'intégrale 1 = { f(æ)dz. Si U - %1[0,1], alors 


I = E(f(U)) (36.539) 
et il suffit de faire 
1 nm 
TI = — =): .b4 
: 2: (0) (36.540) 
où mes Ü,; sont indépendantes et identiquement distribuées de loi Z[0, 1]. A 


Exemple 36.163. 
Supposons que la fonction à intégrer se présente sous la forme f(x) = h(x)g(x) avec g > 0 et telle 
que l'intégrale fe g existe. Notons 


cC = J g (36.541) 
R 
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et 
I -| 7 de (36.542) 
R C 
Nous avons alors 1 = E(ch(Y)) où Y admet la densité g(x)c. A 


Passons au cas de plusieurs variables et considérons l’intégrale 
I = Ï Fier doi dE (36.543) 
[0,1]4 
Nous écrivons 


L=E(Uisss3 040) (36.544) 


où les U, sont de loi uniforme sur [0,1]. En pratique, nous générons une suite de variables aléatoires 
(Zx) de lois uniformes que nous regroupons par paquets : 


Va = (Zar, Zak+1, - -, Za(k+1)-1)- (36.545) 


Ces variables aléatoires V; sont indépendantes et identiquement distribuées de loi 7[0,1]4. Ensuite 
la loi des grands nombres nous indique que 


Re ÿ f(V). (36.546) 
Fe k=1 


36.9.1 Intervalle de confiance 
36.9.1.1 Principe 


Nous supposons que nous travaillons sur une approximation de Monte-Carlo telle que la variable 
aléatoire choisie soit dans L?. La loi des grands nombres nous dit que X, — 1 tandis que le théorème 
central limite nous enseigne que 


>» N (0,1). (36.547) 


Par conséquent 


Xn = E(X) u,U a —U U 
ne Ta ef al) = P <Z<u) (36.548) 


où Z = .W(0,1). En remplaçant E(X) par TZ et en effectuant les manipulations usuelles, nous 
trouvons que P(I E J,) = 1—-asi 


_ © = © 
Ja _ Xn a > Xn NE 36.549 


où o? est la variance de X. Si o n’est pas connue, alors nous le remplaçons par un estimateur 


LÀ - 
Tee 2 
= D (Ar — Xn) (36.550) 
k=1 
et nous considérons l'intervalle 
L S' S! 
Je = [Xn = Ua, Xn + Ua 2 |: (36.551) 


Il y a deux façons de faire diminuer la longueur de l’intervalle de confiance : augmenter n ou 
diminuer o. Pour le second point, le choix de X dans 7 = E(X) est essentiel. 
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Exemple 36.164. 
Soit à calculer 


1 2 
I= | ee /2q 36.552 
Le Tr Lee, 


avec B > 0. Nous introduisons la variable aléatoire X = e°7 avec Z + .W(0,1). Nous avons alors 
I = E(X). (36.553) 


Par ailleurs l'intégrale demandée vaut e#°/2, En appliquant les formules vues plus haut nous trou- 
vons 


- o o 
Ja = [Xn — Ua NL + Va] (36.554) 

où 
o? = Var(X) = E(e 7) - E(e=)? = e28° _ P?, (36.555) 


Nous avons utilisé la formule (36.420). Si nous choisissons B = 2, nous trouvons a? + 2926. Donc 
si nous voulons une longueur de J, plus petite que 10? tout en demandant & = 0.05 (ce qui 
implique ux = 1.96), nous devons avoir 


2 
196222 107 (36.556) 
Vn 


c’est-à-dire environ n = 10!1, ce qui soit dit en passant est très largement au delà des capacités de 
la commande de scilab[754] *. A 


Nous allons maintenant voir quelques méthodes pour réduire la variance. 


36.9.1.2 Échantillonnage préférentiel 


Nous devons calculer 1 = > f(x)dæx. Pour cela nous introduisons une densité g et nous écrivons 


LT 4 ça - 5 (10 
Fe Lo s(rn) Or 


où Ÿ est de densité g. Il faut essayer de trouver g de telle sorte que 


Var (5) (36.558) 


soit la plus petite possible. 


36.9.1.3 Méthode de la variable de contrôle 


Soit ? = E(X). Nous introduisons une variable aléatoire Z et nous écrivons 
FX e 7 LE). (36.559) 


Il faut alors choisir Z de telle sorte que E(7) soit calculable et que X — Z ait une variance plus 
faible. En particulier, Z ne peut pas être indépendante de X. 


32. Je n'ai pas vérifié si c'est encore le cas avec les nouvelles versions de scilab. Ecrivez-moi si vous le savez. 
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36.9.1.4 Variables antithétiques 
Soit I = 1 f(x)dx. La première idée (exemple 36.162) est d’écrire 
I = E(f(U)) (36.560) 


où U = [0,1], mais nous n’avons pas de garanties sur la variance de f(U). Nous pouvons écrire 


1 
1 = E(f(U)) = E|; (QU) _ U))|. (36.561) 
Ici 1—U est encore une variable aléatoire uniforme sur [0,1], mais il se fait que la variable aléatoire 
1 
Z = 2 U) + f(i-U)) (36.562) 


a une variance inférieure à Var (f(U)). En effet, f(U) et f(1—U) ne sont pas indépendantes, par 
conséquent le résultat du lemme 36.30 n’est pas valide, par contre la proposition 36.40 reste vraie 
et nous avons 


Var(Z) = 7 Var (f(U)) + 7 Var (f(1 —U)) + = Cov (f(U), f(1 -U)). (36.563) 


Nous avons Var (f(1—U)) = Var (f(U)). En ce qui concerne le terme avec la covariance, nous lui 
appliquons l'équation (36.58) : 


Cov (F(U), f(1—U)) = E((F(U)-1)((1-U)-1)) (36.564a) 
< ECO) = 10) Pau?) (36.564b) 
= Var (f(U)) (36.564c) 


où nous avons utilisé le fait que E(f(U)) = E(f(1—U)) = I. Au final nous avons bien obtenu 


Var(Z) < Var (f(U)). (36.565) 


36.10 Résultats qui se démontrent avec des variables aléatoires 


36.10.1 Nombres normaux 


Tout nombre x € [0,1[ admet un unique ** développement en base b > 2 : 


x = ÿ cn(æ) (36.566) 


avec e(x) € D. Nous excluons x = 1 parce que son développement en puissances négatives de b 
est zéro. 
Nous notons À = {0,...,b— 1}. Soit k > 1 et re AF; nous posons 


N;(r,n) = Card {i € {1,...,n—k+1} tel que e(x) = r1,...,61R 1 = re}. (36.567) 
C’est le nombre d’occurrences du motif r (de longueur k) dans les n premières décimales de x. 


Définition 36.165. 
Un nombre x € [0,1[ est normal en base b si pour tout r € {0,...,b— 1}* nous avons 


CR (36.568) 


Un nombre est normal si il est normal en toute base. 


33. Voir le théorème 11.133 pour plus de détails. 
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PropEEUXLae 
Proposition 36.166 (1755, 103]). 
Au sens de la mesure de Lebesgue, presque tous les nombres de [0,1[ sont normaux. 


Démonstration. Pour x € [0,1[, nous notons e,(x) son développement en base b. Cela nous donne 
des variables aléatoires €; : [0,1[— À dont la loi de probabilité est donnée par 


P(e = d) = P([£, + Ip = : (36.569) 


parce que l'intervalle [£, at [ est l’ensemble des nombres de [0,1[ dont la première décimale est d. 


Pour la loi des €;, il faut un peu plus découper, mais ça donne le même résultat : P(e; = d) = 1/b. 
Ces variables aléatoires sont indépendantes et identiquement distribuées. Nous considérons aussi 


la variable aléatoire 
N(r,n):[0,1[ —N 


36.570 
ze Na(r,n) ) 
Pour un r € À fixé, nous définissons encore la variable aléatoire 
X; : A — {0, 1} 
1 sie;(x) =b (36.571) 
ze ; 
O0 sinon. 


Les variables aléatoires X; sont des variables aléatoires de Bernoulli indépendantes et identique- 
ment distribuées de paramètre E(X;) = P(X; = 1) = P(e1 = b) = }. Nous pouvons utiliser dessus 
la loi forte des grands nombres (théorème 36.114). Pour dire que 


LS x 2e px = L Eyes 
i=1 


Mais en réalité nous avons aussi r X; = N(r,n) parce que en appliquant à x € [0,1{ : 


. FH TTL Card{ie {1,.,n} tel que a(a) = r} = Nef), (36.573) 


sinon 


de sorte que l’équation (36.572) nous dit exactement que pour tout r € À, 


Ém N;(r,n) _ I 
n—00 n b 


(36.574) 


pour presque tout x € [0,1|. 
Il reste à prouver la même chose pour tout r € AF. Voyons avec k = 2 et r = (u,v) € 42. Nous 
posons 
Y; Te lieues (36.575) 


et N(r,n) = 2: Y;. Les Yi sont encore des binomiales de paramètre D mais elles ne sont pas 
indépendantes. En effet pour avoir Y1(x) = Y2(x) = 1, il faut que les trois premières décimales de 
x soit en même temps de la forme uv. et .uv, donc 


P(M,Y = 1) = éuv/b° (36.576) 


alors que P(Y1 = 1)P(Y2 = 2) = 1/b4. Nous pouvons contourner ce problème en remarquant que 
les €;, eux, sont indépendants. Donc le lemme de regroupement 36.16 nous dit que la famille {Y2, } 
est une famille de variables aléatoires indépendantes (et idem pour la famille Y2,_1). En effet, les 
variables aléatoires Y2, correspondent à la partition 23, 45, 67, etc. 
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Nous appliquons la loi des grands nombres sur les deux familles indépendamment : 


ie és: À 
Lie (36.577) 
j=1 
et 
1 ps. 1 
- DE ñ (36.578) 
j=1 


Pour rappel, le but pour l'instant est d'établir la limite lim,_, L Di Y; = D. Nous allons l’établir 
séparément pour les termes pairs et impairs de la suite. Pour les pairs : 


Le: LS y, 1 de _— (36.570) 
2n 179 re 24 2\n 23 bp? ‘ 


Pour les impairs °{, 


NS — n 1.5 n eu i 
= —— P — NN = . 
m1 À 17 9n—1 ED 2j Jen (à ) b2 (86-280) 


parce que les deux parenthèses convergent vers F alors que les coefficients devant convergent vers 
1 


Au final nous avons bien 
1 


N(rn) 17 SR 1 
 — d 581 
n n À L n 2) / b2 Post 


tant que r € A?. 

Pour prouver la même chose avec r € AF, il suffit de faire le même raisonnement en divisant 
en plus de paquets : {Ygj4m}m=1,...k-1 Sont indépendants et nous utilisons k fois la loi des grands 
nombres. 

Donc pour toute base b nous savons que les nombres non-normaux en base b forment un 
ensemble de mesure nulle dans [0,1{. Il reste à voir que leur union reste de mesure nulle. Cela est 
vrai parce que nous avons une union dénombrable et qu’une union dénombrable d’ensembles de 
mesure nulle est de mesure nulle par le lemme 14.27. 


RemUXAkcuH 
Remarque 36.167. 
Un nombre x est normal en base b si et seulement si la suite ux = æb* est équirépartie modulo 
1 sur [0,1] (c’est-à-dire quel la suite des parties fractionnelles des uz est équirépartie). Pour le 
nombre 0.2357873 ..., nous parlons de la suite 0.2357873...; 0.357873...; 0.57897... etc. C’est la 
suite des queues de suites de la suite de ses décimales *. 


36.10.2 Théorème de Bernstein 


ThoDJIvrty 
Théorème 36.168 (Théorème de Bernstein[103]). 
Soit f € C°([0, 1], C) et son module de continuité 
w:[0,1| — R 
[0,1] (36.582) 


he sup{|f(u) — f(v)| tel que [u — v| < h}. 


Pour n > 0 nous définissons le n° polynôme de Bernstein de f par 


BA(f)(x) = > () 21 x) f (5) | (36.583) 


Alors il existe C tel que pour tout n > 1 : 


34. Ici dans [103], la seconde somme va jusqu'à n — 1 et je ne comprends pas pourquoi. 
35. C’est pas trop bien dit, mais on se comprend, non ? 
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(1) 
FES) 


1 
1f — Ba(Ple < Cu (+) | 
(2) | 
BD (36.585) 
sur [0,1]. 
(3) L'inégalité (36.584) est optimale : il existe une fonction g € C°([0, 1], C) et Ô > 0 tels que 
pour tout N > 1, |g — Ba(g)lo > NÉ Cette fonction peut être choisie Lipschitzienne. Une 


telle fonction est donnée par exemple par g(x) = |x — il. 


(4) Les polynômes forment une partie dense dans (c(o, 1) ll). 


Démonstration. Soit x € [0,1] et une suite de variables aléatoires de Bernoulli indépendantes *° et 
identiquement distribuées (X;);>1 de paramètre +. Nous notons 5, = D, XK. 


(1) Pour cette histoire de convergence, il faut majorer la quantité | f(x) — B\A(f )(æ)|. Pour cela il 
y a trois astuces. La première est de se souvenir que E( Î 62) — f(x), et la seconde est que 
le théorème de transfert 36.83 appliqué à x > f(x/n) donne 


E ue) = De (à) Phh=t= D (5) () (Lea), (36.586) 
c’est-à-dire que 
BA(f)(x) = E (%) (36.587) 


Et enfin la troisième astuce est d'utiliser le lemme 11.273 pour avoir 


; C #1) (iv #1) < (vis - # + 1) (Te). (36.588) 


À partir de là nous pouvons un peu calculer : 


8, = [8 (70 1 À) | (86.580) 
< E (IG - (1) (36.589b) 
<E (u(lr s 2 ) (36.589c) 


< w (+) E ( nx — # L 1) | (36.589d) 


Le dernier facteur peut être récrit sous la forme 
Sn Sn 
E(Vnlz -—|+1})=4VnE [x -—|) +1, (36.590) 
n n 


et c’est là que nous pouvons utiliser l’inégalité de Hôlder 27.33 : 


E(IX|) = Xl: < IX (36.591) 


IX|2 = 4/E(IXP). (36.592) 
36. Définition 36.10. 


37. Nous avons aussi utilisé la formule de l’espérance pour les variables aléatoires discrètes. 


où | X|2 désigne 
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Nous pouvons donc écrire 


L f(x) — BA(f)(x)| < w (+) (vale — 4, + 1) | (36.593) 


Nous étudions maintenant de plus près la quantité |x — Ba jo. D'abord 


E (le #p) 122" E(S,) + D E(S?). (36.594) 
nm nm nm 


Ensuite nous savons l’espérance de $, (qui vaut E(S,) = nx) par (36.364) et le lemme 36.29 
nous permet de calculer E($?) par indépendance des X; qui composent $,. Nous avons alors 


Se 1 1e 
E (le . ) = 2? — 2x? + . D, E(X;)E(X;) + : Ÿ E(X?) (36.595a) 
1<i£j<n i=1 
n? nn nx 
Se en (36.595b) 
1 — 
te) (36.595c) 
nm 


Quelques justifications : 


— E(X;) = E(X?) = x parce que X; est une variable aléatoire de Bernoulli de paramètre 
œ. 


— La première somme contient tous les couples (1, j) sauf les diagonaux ; il y en a donc 


nn. 
. ubEqsRSuRoCJ 
En recombinant le tout, Fin 


n 


= {à (+) (Vz(1- x) +1) (36.596b) 
1 


< 7 (&) | (36.596c) 


La dernière majoration est une rapide étude de la fonction x(1 — x). 


f(x) — Ba(f)(x)| < w (3) (v en + ) (36.596a) 


Étant donné que les majorations (36.596) sont valables pour tout x, en passant au supremum 
nous avons 


3 1 

1 — Ba(f)lo < 5% (+) — 0. (36.597) 
Ceci prouve les deux premiers points du théorème. 

(2) Fait. 

(3) Nous considérons la fonction 


1 
g(x)=lz-;] (36.598) 
et nous vérifions qu'elle vérifie toutes les conditions. D'abord si u, v € [0,1] alors 
jg(u) — g(v)| < lu — v (36.599) 


et donc w(h) < h, ce qui signifie que g est 1-Lipschitz. Le principe de cette partie est de 
montrer que |g — B,(g)|x est plus grand que d’autres trucs (et non plus petit que d’autres 
trucs comme d’habitude). Nous commençons par 


1 


lo Bag) > 9) — Ba) (86.600) 
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Très vite nous nous rendons compte que g(1/2) = 0. Ensuite nous nous souvenons que 


BG) = 8 (at) = E (51) = LE(S, -n) (36.601) 


si nous posons €; = 2X; — 1, alors les €; sont des variables aléatoires de Rademacher indé- 
pendantes et identiquement distribuées qui satisfont à 25, — n = 3,6. Nous utilisons la 
proposition 36.150 : 


\g — Bag le (2 al) > > al éjlh- (36.602) 


Calculons ce qui est dans la norme : 


nm 


DCE { > ) = ON E(&)E()+) E(é)=0+n=n. (36.603) 
j=1 


j=1 1<ij<n i=1 


Nous finissons alors notre travail de majoration : 


9 — Bn(g) (36.604) 


RD Eee te 1e 
® 7 Pnye A 727 2/nye ” 2Ve F7 1 


(4) Nous avons trouvé une suite de polynômes qui converge uniformément vers un élément arbi- 
traire de C°([0,1]). Cela prouve la densité. 


CORooCWLMooWwCOAP 
Corolaire 36.169. 
Dans R, si I = [a,b] alors les polynômes forment une partie dense dans (C®(1), |.|). 


Démonstration. Nous supposons que b > a. Le cas a = b est assez facile parce que l’espace des 
fonctions sur {a} est de dimension 1. 
Nous considérons une bijection affine @: [0,1] — [a,b] telle que w(0) = a et w(1) = b. Soit 
feC(1). 
Si g = f 0, alors le théorème de Bernstein 36.168 nous donne une suite de polynômes gx sur 
[0,1] tels que 
unif 


9h — 9. (36.605) 


1 


Nous considérons f, = gx ° w71 qui est encore un polynôme parce que #7! est affine. Étant donné 


que @ ! est une bijection, si À est une fonction sur [0,1], nous avons 


sup (how ")(x)| = sup |A(y)|. (36.606) 
x€[a,b] ye[0,1] 


Cela nous permt le calcul suivant : 


fe — Flo = Igkow 7 —-gep | (36.607a) 
= |(gr—g)ow7°| (36.607b) 
E (gx — g)(p7"(æ))| (36.607c) 
xela,b 

= sup |(9x — g)(y)| (36.607d) 

ye[0,1] 
= ||9x — 9lloo- (36.607e) 

Nous avons donc 

Jim [fx — flo = 0, (36.608) 


ce qui prouve la densité. 
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Chapitre 37 


Statistiques 


37.1 Notations et hypothèses 


Nous notons X le caractère à étudier, et ( l’ensemble des individus. Le caractère à étudier est 
vu comme une fonction sur { : 


X:A—R,N, {0,1}... (37.1) 


Les statistiques descriptives sont les techniques pour présenter et résumer les données : dia- 
grammes, graphiques, indicateurs numériques : moyenne, écart-type, médiane, ... 
Nous faisons les hypothèses suivantes : 
(1) Chaque observation x; est la réalisation de la variable aléatoire X qui sera de loi inconnue y. 
(2) Le n-uple (x1,...,æA) est la réalisation de (X1,...,X,) qui est l’échantillon de taille n. 


(3) Les variables aléatoires X; sont indépendantes et identiquement distribuées, de loi commune 
4. La loi u est la loi parente de l’échantillon. 


Exemple 37.1. 
Un échantillon de taille 1 consisterait à tirer au sort une personne dans une population et mesurer 
sa taille. A 


Exemple 37.2. 
Une échantillon de taille n consisterait à tirer au sort n personnes dans une population et de 
mesurer leurs tailles. PA 


L’inférence statistique est l’art de dégager des informations sur la population à partir d’in- 
formations partielles : intervalles de confiance, estimateurs, test d’hypothèses, ... 

En théorie des probabilités, nous connaissons la loi de la variable aléatoire X et nous en 
déduisons des informations sur la réalisations de X : valeur la plus probable, moyenne, intervalle 
dans lequel X(w) a le plus de chance d’appartenir. En statistique, au contraire, la loi est inconnue 
et nous cherchons des informations sur la loi à partir d’un échantillon de données numériques 
observées. 


37.2 Modèle statistique 


Un modèle statistique est un triplet 


S— (A7, P), (X9)0c0, (H)so | (37.2) 


où (Q,F, P) est un espace probabilisé, (X9) est une famille de variables aléatoires définies sur Q 
et telles que pour tout 0 € O, la variable aléatoire X, suive la loi 19. Les u9 sont des mesures sur 
les boréliens de R et pour tout B € Bor(R) nous avons 


P(X9 € B) = o(B). (37.3) 
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Remarque 37.3. 
D'une certaine manière, l'introduction de 9 dans la définition est redondante parce que ces mesures 
sont déjà contenues dans la donnée des variables aléatoires X,. 


Exemple 37.4 (Modèle statistique gaussien). 

Si nous savons que les variables aléatoires X; suivent une loi gaussienne, alors nous considérons 
O6 = RxR+ et 0 = (m,0?). Dans ce cas, y = .W(m, a?) et le but de la statistique est de déterminer 
la valeur de 0 qui correspond à une population en partant de l’observation d’un échantillon. A 


Définition 37.5. 
Si O & RŸ, nous disons que le modèle statistique est un modèle paramétrique. 


Le modèle gaussien est un modèle paramétrique : dès que m et o? sont déterminés, la loi du 
phénomène X est connue. 


Définition 37.6. 

Pour chaque 0 € ©, nous disons qu’un échantillon de taille n associé à un modèle statistique 
[(Q,F, P),(Xo), (uo)] est un vecteur (Xo1,..., Xon) de taille n de variables aléatoires indépen- 
dantes et identiquement distribuées de la même loi que la variable aléatoire X9. La loi ug est la 
loi parente de l’échantillon. 


Définition 37.7. 
Un modèle d’échantillonnage sur le modèle statistique S est une famille (X61,..., Xon)oce 
d'échantillons de taille n > 1. 


Nous noterons souvent (X1,...,X,) à la place de (X51,..., X9n) un échantillon, mais il faut 
se souvenir que les X; suivent toujours la même loi donnée par 0. La loi du vecteur (X1,..., X») 
est 19 ©... @ ue et est définie sur l’espace (Q7,F@...@F, Per). 


Remarque 37.8. 

Le travail du statisticien est de proposer un modèle statistique $S à priori. Si nous étudions la taille 
d’une population, nous allons choisir un modèle gaussien. Plus le modèle est précis, plus l’espace 
© est petit mais plus il y a de risques que la vérité soit hors de l’ensemble considéré. 


Exemple 37.9. 
Soit X une variable aléatoire de carré intégrable que l’on sait simuler. Afin d'évaluer la moyenne 
u de X, nous pouvons considérer la moyenne empirique des simulations : X, = OU e X; où les 
variables aléatoires X; sont indépendantes, identiquement distribuées et de même loi que X. 

La loi des grands nombres nous enseigne que X, — y. De plus, 


Re NA 
jm P(uelx, CE) [ « Var (37.4) 


En effet, la condition sur u est équivalente à 


Xn— 4 
Sn à 
n—H 


tandis que le théorème central limite nous enseigne que la variable aléatoire À Ja Se comporte 


(37.5) 


comme .W(0,1) lorsque n est grand. Dans ce cas, nous avons que 
eue L 1 [ 22 

P|———El-a,a| | = — e%"/2qx. 37.6 

Gered)- ef. Su 


Notons que dans ce calcul nous avons utilisé le fait que y = E(X;). 


Montrons que la suite 
2 _ > 2 ) ; 
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converge presque surement vers a’. Le théorème central limite implique que 
1 Us yo pes. 2 
- SX? 2$ E(Xi) (37.8) 
i=1 


et que 
2 
1€ s 
É 3 x 2$ E(X1)?. (37.9) 
1 i=1l 


La différence converge donc presque surement vers o? en vertu de la proposition 36.34. 


Nous avons également E(a2) = a?. En effet, sachant que E(X;) = E(X;) = u et que E(X?) = 
E(X?) =? + 0°, 


E(0%) = : 5 E(X?) — - 5 ex) + SJ E(XiX;)) (37.10a) 
i 11 


i#j 
1 
= 0? + ji? — 3 (n(0° din = n)n°) (37.10b) 
1 
= 0? — —o?, (37.10c) 
n 


dont la limite n — 0 donne bien 02. 


Nous voudrions à présent montrer que 
Xn — 
On / nn 


Vu que le théorème central limite donne une convergence en loi, nous pouvons utiliser le lemme de 
Slutsky pour montrer que 


0 D), (37.11) 


(SE +) Z, (9Z, 0?) (37.12) 


où Z < (0,1). En vertu de la proposition 36.106 appliquée à la fonction f: IR? — RR, 


+ siy£0 
f(&, y) = Es (37.13) 
0 sinon 
nous avons la convergence en loi 
Xn— 4 
1 A oc) 5 flo), (37.14) 
c'est-à-dire _ 
XX. — 
ee (37.15) 


NT 


Afin d’être complet, précisons que 
P((0Z,0)€eR x {0}) = 0. (37.16) 


a 
PropLimxBNpxbxbsqrt 


Proposition 37.10. 
Soient des variables aléatoires indépendantes et identiquement distribuées X; de loi parente (n, p). 
Alors si X, désigne la moyenne empirique, 


Es, Z NO, D). Gr 


2618 CHAPITRE 37. STATISTIQUES 


Démonstration. Cela est une application de la loi des grands nombres, tu théorème central limite, 
du lemme de Slutsky et de la proposition 36.106. 

D'abord, la loi des grands nombres nous indique que X, — p parce que p est l'espérance de 
Bernoulli. Ensuite nous avons 


Xn — E(X) = - Xn—p 
V Var(X)/Vn or) 


parce que la variance d’une loi de Bernoulli est p(1 — p). Le théorème central limite nous indique 
par conséquent que 


(37.18) 


a. 
p(1 — p) 


Le lemme de Slutsky implique alors la convergence du couple : 


7e N (0,1): (37.19) 


Xn—p 


(5 à.) À, (Z,p). (37.20) 
p(1 — p) 


Nous appliquons maintenant la proposition 36.106 avec la fonction 


J(x,y) = Vri = p}e (37.21) 


y(1 — y) 


qui est une fonction dont l’ensemble des points de discontinuité est © = {0}. Étant donné que 
P(X» = 0) = 0, la proposition s'applique et nous avons 


ir rs, , f(Z,p), (37.22) 
p(1 — p) 
c’est-à-dire : 
RE, FO), (37.23) 
Xn(1 — Xn) 


37.3 Modèles d’échantillonnages 


Soit X, une variable aléatoire sur (Q,F, P). Un échantillon de taille n pour X est une suite 
de n variables aléatoires (X1,...,X,) définies sur (Q,F, P) indépendantes et de même loi que X. 
Nous disons que la loi de X est la loi parente de la suite X;. 


Définition 37.11. 
Soit 


S = [(@,F, P), (Xo), (us)] (37.24) 


un modèle statistique. Un modèle d’échantillonnage de taille n associé au modèle statistique S 
est la donnée d’une famille de n-échantillons (X91,..., Xon) telle que pour tout 8 e 6, l'échantillon 
(Xo:) soit de variable parente X9. 


PÉCX 


La moyenne empirique du n-échantillon (X;) est la variable aléatoire 
L 1 € 
An == : Le (37.25) 


La proposition suivante signifie que la moyenne empirique est une « bonne » façon d’approcher 
la variable aléatoire. 
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Proposition 37.12. 
Soit X, une variable aléatoire dans L?(Q) (c’est-à-dire E(X?) < œ) d'espérance m et de variance 
o?. Alors 

2 


(1) E(Xn) = m et Var(Xn) = . 


n 


(2) Nous avons les convergences 


NES (37.26a) 
Xe 
RAT AR AND (37.26b) 


o/yn 
(3) Si X est de loi N(m,0?), alors Xn = .W(m, a}, c’est-à-dire 


Xn—m 


re MU) (37.27) 


Remarque 37.13. 

L'intérêt de cette proposition en statistique descriptive expérimentale est le suivant. La taille 
moyenne des français est un nombre m qui existe, mais qui est largement hors de portée de 
l'expérience (mesurer 65 + 106 personnes risque de prendre un sacré temps). Si on mesure seulement 
n personnes dont les tailles sont (x;);-1..n (ici x; est un nombre expérimental, pas une variable 
aléatoire), alors on peut calculer la moyenne 7, de ces n personnes-là. La proposition indique que 
si n est assez grand, alors x, donne une bonne idée de m. 


Ne pas confondre X,, qui est une variable aléatoire, c’est-à-dire une application mesurable, qui 
nous sert à démontrer des théorèmes en mathématique, avec x, qui est un nombre mesuré sur le 
terrain, qui a une existence physique bien définie, mais aucun statut mathématique. 

Si on croit que toute cette histoire de variables aléatoires, de tribu et de mesures décrit ef- 
fectivement la réalité, alors on peut croire que le comportement de la suite X, décrit bien le 
comportement de la suite x, (cette dernière n'étant même pas une suite parce qu’on n’a jamais 
qu’un nombre fini de mesures expérimentales). 


La variance empirique d’un échantillon est la variable aléatoire 
D Xi — Xn)°. (37.28) 


La variance empirique corrigée est la variable aléatoire 


s2 = L re ZX,» HAS EVA FENPA OT E) 


n— 1; 1 


Lemme 37.14. 
La variance corrigée et la variance empirique ont comme espérances : 


E(V2) = = (37.30a) 
E(S2) = 0°. (37.30b) 


Démonstration. Nous commençons par calculer l'espérance de la variance non corrigée. La première 
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étape est de la récrire sous la forme 


1 - : 
v? = DAS 644) 
k 
_1 2 _ 2 2 
_- = di A Xn D, Xk +=) X? 
k k k 
—— —— 
1 2 
NU Ur + x 
D k n + n 
= LS x? _ X2 
ie 7 


Nous calculons séparément l’espérance de ces deux termes. Si X est la loi parente des X;, en 
utilisant l’indépendance des X; nous trouvons 


il 1 € 
s(ipxt)- ES ex 
‘ ne (37.32) 
= E(X?) 
= E(X)°? — Var(X) 
Nous devons à présent calculer l’espérance de X2 : 
E(X?) = E(Xn)° + Var(X). (37.33) 


En utilisant le lemme 36.30, 


Var(X,) = Var É y x) (37.34a) 


k 
1 
= 5 >, Var(Xx) (37.34b) 
k 
1 
= — Var(X) (37.340) 
Par conséquent 
1 — 1 
E(V?) = Var(X) (: _ :) =? = Var(X). (37.35) 
En ce qui concerne la variance corrigée, 
2 = DUXr - Ka)? = V2 (37.36) 
n | = n ll 0 à 


par conséquent (52) = 2 E(V?) = Var(X). 


ThoCochraneChiStudent 
Théorème 37.15 (Théorème de Cochran{[418]|). 
Soient (X;) des variables aléatoires gaussiennes indépendantes de loi .W(m, o?) avec a > 0. Alors 
(1) Xn = Nm, ©), 
(2) Cor) Sn = (2) Ve + xn 1), 


(3) les variables aléatoires X, et V, sont indépendantes et 


ItemThoCochraneChiStudentii 


Zum am 
San Vin 1 


F(n—1). (37.37) 
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Nous pouvons aussi écrire le dernier résultat en termes de la variance corrigée $,, l’estimateur 
sans biais de la variance, parce que 


= 1 1 
——=$, 37.38 
FYn-1 n°” ( ) 
en vertu de la définition (37.29). 
Proposition 37.16. 
Soit X une variable aléatoire de variance Var(X) = o. Si E(X#) < ©, alors 
(1) 82 25 62. 
(2) > 0 
nr N(0,1) (37.39) 
1404 
n 
où 4 = E(X#) est le moment d'ordre 4 de X. 
Théorème 37.17. 
Si (X1,..., Xn) est un n-échantillon de loi parente .W(m, o?), alors 
(1) Les variables aléatoires 
Xn—m : 
t = 1) = 37.40 
Bed (n-DS (87.40) 
sont indépendantes. 


2 
(2) La loi de (n — 1)53 est X?(n — 1). 
Si un échantillon vérifie ces deux propriétés, alors les X; sont de loi .W(m, o?) 
L’inégalité de Markov donne une borne supérieure à la probabilité qu’une variable aléatoire 
positive soit plus grande ou égale à une constante. 
Théorème 37.18 (Inégalité de Markov). 


TholnegMarkov 
Soit X une variable aléatoire à valeurs dans R et w: R% — [0,00[. Alors 


P(ç(X) > a) < PAPE) 


pour tout a > 0. 


(37.41) 
Démonstration. Calculons le second membre : 
E 
((X)) - EX) 3p 
a a a 
X X 
| 2 ap + | EX) yp 
p(X)>a LA, @(X)<a à (37.42) 
>1 
> dP 
p(X)<a 


D'où l'inégalité voulue. 


37.4 Estimation ponctuelle 


Nous considérons un modèle statistique 


s— [(Q,F, PF}, (Xe), (4)loe (37.43) 
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et pour tout 0 nous notons X = (X951,..., Xon) un échantillon de loi parente y9. Tant que nous 
travaillerons avec un 0 fixé, nous écrirons X = (X1,...,X,) sans expliciter la paramètre 9. Nous 
noterons 


Ep(p(X1,.……., Xn)) = L. bts) Conde FREE 


Dans cette notation nous plaçons le 0 sur l’espérance, tandis qu’en réalité le 0 devrait être sur 
chaque X;. Tant qu'aucune confusion n’est possible nous ferons toujours cet abus d'écriture. 

Le but de la théorie de l'estimation est de déduire la valeur de © (et donc la loi 49) à partir 
d’un échantillon de loi parente 0. 

Nous posons les hypothèses suivantes. 


(1) Le modèle statistique S est paramétré, c’est-à-dire que @ € R‘ avec le plus souvent d = 1,2. 
Typiquement les paramètres seront la moyenne et la variance. 


(2) Le modèle statistique est identifiable, c’est-à-dire que pour tout couple (41,02) € @?, si 
01 # 02, alors Ho, Æ io, 

(3) Le modèle S est dominé par la mesure de Lebesgue si les lois 49 sont continues et par la 
mesure de comptage si les lois 9 sont discrètes. 


Exemple 37.19. 
Quelques familles identifiables : 


— La famille des lois exponentielles (&(À)) _. est identifiable. 


À1>0 


— Les lois gaussiennes (.W(m, a°)) sont également identifiables. 


meR,02>0 
En réalité il est assez compliqué de trouver un exemple de modèle non identifiable à moins de la faire 
exprès. Par exemple en paramétrant les lois exponentielles de la façon suivante : (E (sin(À))) XER 
Cette famille n’est pas identifiable. 


Le corolaire 14.230 ainsi que l’hypothèse de modèle dominé impliquent que les lois ont des 
densités. Si la loi up est discrète, nous notons 


p(x,0) = ({x}) (37.45) 


la densité de 19 par rapport à la mesure de comptage. Si La loi u9 est continue, nous notons 


p(x, 0) = fo(x) (37.46) 
la densité par rapport à la mesure de Lebesgue. 
Si u9 est une loi discrète et si (X1,...,X,) est un échantillon de taille n, alors pour tout 
(t1,...,%n) € R” nous avons 


be: me ur (rs, ie) He) =. 0te. 0) “(OTAT) 


La première et la dernière égalité sont des notations ; la seconde est une conséquence de l’indépen- 
dance des X; contenues dans l’échantillon. Pour une loi continue, nous adoptons la même notation. 
Le vecteur aléatoire (X1,...,X,) admet la densité 


(asset 20e Dbi)-2400m) = pts --20e,,. 0) (37.48) 


Exemple 37.20. 
Soit (X1,...,X,) un n-échantillon de loi (1,0) avec 0 € ]0,1[. C’est une loi discrète portée par 
l’ensemble {0,1}. Nous avons 


0 si0£#xÆl 
p(x,0)=41-08 six =0 (37.49) 


0 six — I. 
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De façon plus condensée nous pouvons écrire 


p(x, 0) = 6°(1— 0) Loi} (x). (37.50) 

Pour tout (x1,...,æ») € R”, la densité du n-échantillon est donnée par 
Dali m0) RL SO En fem), (37.51) 
a 


37.5 Statistiques et estimateurs 


Définition 37.21. 

Une statistique sur un modèle d’échantillonnage est une variable aléatoire fonction de l’échantillon 
(X1,..., Xn) ne dépendant pas de 0!. C'est-à-dire une application borélienne T: R" — R ne 
dépendant pas de 0. La statistique associée à cette application est S = T(X1,...,X,). 


Les fonctions T(X1,..., X\) données par ÿ»,; X;, e2 Xi sont des statistiques. La constante l est 
également une statistique (mais elle est moins intéressante). 
Un estimateur est une statistique qui prend ses valeurs dans @. Nous la noterons 


On = OX1,..., Xn). (37.52) 
La fonction 0, est borélienne à valeurs dans ©. 


Exemple 37.22. 
Soit un n-échantillon de loi Z(1,0)#ço1. Les fonctions 0, — He X; et On — i sont des 
estimateurs. Cependant nous devinons que la première va être plus intéressante que la seconde. A 


Pour la suite, nous travaillerons avec des estimateurs de carré intégrable, c’est-à-dire que 
Eg(lôn(X1,.…., Xn)[?) < 00 (37.53) 


pour tout 0 e ©. 


37.5.1 Qualité des estimateurs 


Définition 37.23. 
Un estimateur est convergeant ou consistant si pour tout 0 € ©, la suite de variables aléatoires 


A 


On(X1,..., Xn) converge en probabilité vers 0. 
En d’autres termes, l’estimateur Ô, est convergent si pour tout 0 E © et pour tout 7 > 0, 
Jim P(bn(X1,..., Xn) — 6] > n) = 0. (37.54) 
La probabilité dans le membre de gauche est donnée par 


pp (Gr, ...,Æn) € R" tel que [6h(æ1,...,%n) — 0] > n}). (37.55) 


Soit 0, un estimateur pour 0. Nous cherchons à minimiser l’erreur commise en remplaçant @ 
par 0,. Nous introduisons donc le risque quadratique de l’estimateur 4, par 


A 


R(Ô»,0) = Ee((ôn — 0)?). (37.56) 


Nous disons qu’un estimateur 0, 1 est préférable à 0, 2 si pour tout # € 6 nous avons 


A A 


R(ôn1:0) < R(ôn 2,0). (37.57) 


1. Parce que d’habitude c’est ce qu’on cherche à estimer. 
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Lemme 37.24. 
Une formule alternative pour le risque quadratique : 


R(0,,0) = Var(0,) + (Eo(ôn) — 0)” (37.58) 
Démonstration. Nous avons 
Ep (x - o)°) — Var(ô, — 0) + Ep(ôn — 0). (37.59) 
D'une part Var(Ÿ, — 0) = Var(0,) et d'autre part E(0, — 0)? = [E( 0 . Par conséquent 


R(Ôn,0) = Var(ôn) + +(E E(ôa) - . D on à 4 1) 


Le biais de l’estimateur ô, est la quantité 
Eg(ôn) — 8. (37.61) 


À ce niveau, nous rappelons que nous écrivons Æ9 l’espérance calculée en supposant la valeur 4 
pour le paramètre des différentes variables aléatoires entrant dans le calcul. Voir la discussion 


autour de la définition (37.44). 
ExytN1lTq 


Exemple 37.25. 
Dans le cadre de la proposition 36.138, nous voulons savoir si à est un estimateur sans biais de 
À. Pour ce faire nous calculons _. : 

E) (4) = Ex(N:) = à (37.62) 
parce que E(N;) = Àt. Ici nous avons calculé E(N;) en prenant À pour valeur du paramètre du 
processus de Poisson, alors qu’en principe c’est justement le paramètre que nous voulons estimer. 


A 
Exemple 37.26. : 
La moyenne empirique X,, est un estimateur sans biais de la moyenne. L’estimateur 
1 Ç je 
_ DA: — Xi) (37.63) 
i=1 
est un estimateur sans biais de la variance. PA 


Un estimateur sans biais n’est pas toujours de meilleure qualité qu’un estimateur avec biais. 
En effet ce que nous voulons est de se donner un (petit) intervalle 1 autour de la bonne valeur 
de 0 et de maximiser P(ôr € I). Sur la figure 37.1, c’est l’estimateur biaisé rouge qui tombe plus 
souvent sur le bon intervalle que l’estimateur non biaisé bleu. 

Nous allons maintenant étudier quelques manières de construire des estimateurs convergeant. 
Il vont évidemment s'appuyer sur la loi des grands nombres. 


37.5.2 Méthode des moments 


Sans surprises, un bon estimateur pour la moyenne est 
À 1 
On(X-..s Xn) = = Tr (37.64) 


Plus généralement, nous supposons qu'il existe une fonction borélienne ? M : R — R telle que 


Eo(|M(X)|) < 0 (37.65) 


2. Définition 14.52. 
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FIGURE 37.1: Un estimateur sans biais et un avec biais. LabelFigBiaisOuPas 


où X est la loi parente de l’échantillon. Supposons également que la fonction 
h(8) = Ep(M(X)) (37.66) 


soit inversible et continue sur @. Dans ce cas, pour estimer le paramètre 0, nous considérons 
l’estimateur 
: [1 
=h 1 É Sue) (37.67) 
= 
Cela est un estimateur convergent. En effet, la loi des grands nombres dit que 
l 
=: DM(Xi) À$ Ep(M(X)). (37.68) 
i 
En composant avec la fonction h, nous avons 
a 25h (EH(MUX))) = 8. (37.69) 


Dans cette construction, M(X) est le moment de X que l’on souhaite déterminer. 


Exemple 37.27. 


Soit (X1,..., Xh) un échantillon de loi &(À). Construire À,. Pour une loi exponentielle, 
1 
E(X) = =. (37.70) 


Nous devons donc déterminer le moment d’ordre 1 de X (c’est-à-dire sa moyenne). Nous considérons 
donc la fonction M(x) = x; par conséquent 


1 
R(A) = E(X) = x (37.71) 
et h-1(0) = 1/0. L'estimateur que nous considérons pour À est finalement 
à 1 
On = = —.: (37.72) 
L Diet X; 


A 


37.5.3 Méthode de substitution 


Supposons que nous connaissions un estimateur convergent #, — 4. Si g: RŸ — R est une 
fonction continue, alors 


g(ôn) — g(@). (37.73) 
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37.5.4 Méthode du maximum de vraisemblance 
ExVrasMaxLp 


Exemple 37.28. 

Nous désirons contrôler la qualité d’une chaine de production ; pour cela nous prélevons un échan- 
tillon de 10 pièces, et nous en trouvons 3 défectueuses. Que dire de la proportion de pièces défec- 
tueuses ? 

Évidemment, le plus probable est que la proportion de pièces défectueuses soit de 1 /3. Analysons 
en détail comment nous arrivons à ce résultat. Nous considérons que le fait de tirer 10 pièces 
revient à une expérience binomiale de paramètres 10 et de probabilité p inconnue. Dans ce cas, la 
probabilité d'observer exactement 3 pièces défectueuses est de 


L{(p) = P(X = 3) = (ra =". (37.74) 


Y 


9 
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OU + 


| 

L 
3 
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Hi 


FIGURE 37.2: La fonction de vraisemblance de l’exemple 37%.4Be1FigMaxVraissLp 


A 
Soit (41,...,%n), une réalisation de l'échantillon (X1,...,X,). L'application 
nm 
0 pra, ;2n;0) = | [p(x4,0) (37.75) 
i=1 
est la vraisemblance de l'échantillon. Nous définissons 0, par 
Bliss En x) = Sup D (Mi 225%: 0): (37.76) 


LAS) 


Remarque 37.29. 
Nous passons sous le silence le fait que la fonction sup soit une fonction mesurable, et que par 
conséquent #, soit bien une variable aléatoire. 


La variable aléatoire Ü, = ba(X 1,-.., Xn) est l’estimateur de maximum de vraisemblance 
de 6. 


37.5.5 Exemples sous forme d’exercices 


Exemple 37.30. 
Soit (X1,...,X,) un échantillon de loi (1,0) avec 0 € [0,1]. Trouver l’estimateur de maximum 
de vraisemblance de 0. 

En utilisant la densité de la loi multinomiale, 


Pn(es- En 0) = | [p(xs,0) = [ [8% (1 — 0) tony (er, ,œn). (37.77) 


U 


En passant au logarithme, si x; € {0,1}, 


La(0) = Div In(0) + (1— x;)In(1 — 6) (37.78) 
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En passant à la dérivée, nous trouvons que l’extrémum est donné par 


1 F4 
SN 37.79 
ee 2 (37.79) 


Exemple 37.31. 
Soit (X1,...,X,) un échantillon de loi & (À) avec 0 > 0. Trouver l’estimateur de maximum de 
vraisemblance de 6. 

Nous avons 


Dites [I der ti, (37.80) 


En passant au logarithme la fonction à maximiser est 


L(8) = n1n(8) —- 6x. (37.81) 
La maximisation donne ë 
0 = 37.82 
RE ( ) 
c’est-à-dire 
Re D ENS (37.83) 
n les An ee x, : 


Ce résultat n’est pas étonnant vu que le paramètre À de la loi exponentielle est l’inverse de la 
moyenne. 


A 
Exemple 37.32. 
Soit (X1,..., X,), un échantillon de loi parente uniforme sur [0,0] avec 9 > 0. 
(1) Montrer que la fonction de vraisemblance est donnée par 
1 ; 
HIGH cs Ln; ()) E ga Loco (min(ær, DER ;En)) Lfmax(o,….en),0o[(0)- (37.84) 


(2) Déterminer l’estimateur du maximum de vraisemblance de 6. 


Lorsque nous parlons de paramètres qui peuvent prendre un spectre continu de valeurs, il 
est inutile de calculer la probabilité parce qu’elle est nulle. Le système de maximum de vraisem- 
blance fonctionne avec les densités. Dans notre cas, la fonction de vraisemblance est le produit des 
densités : 


n 


Etre 0)= I Let: 0) (37.85a) 
i=1 
1 
= [I ge) (xi) (37.85b) 
i 
. gn Lio.gr (æ1, s.. a) (37.85c) 
De cette expression nous voyons que min{x1,...,4,} doit être positif en même temps que le 


maximum doit être plus petit que 0. Cette seconde condition peut s’écrire Lhax{z…æn},00[ (0). Au 
final nous avons 


1 


L(x1, cs Ln; Q)) ze gn Loco (min(ær, CS ;Tn)) Lhassa tor(O): (37.86) 

Il n’est évidemment pas possible de dériver explicitement cette expression. Par contre pour 

que cette fonction soit non nulle, il faut obligatoirement 4 > max{x1,...,x,}. Par conséquent elle 
prend son maximum pour 0 = max{x1,...,2»}. 


La conclusion est que l’estimateur de maximum de vraisemblance de 0 est Ô, = max;{X;}. A 
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Exemple 37.33. 
Déterminer l’estimateur de maximum de vraisemblance de la moyenne pour un modèle statistique 
dans laquelle la famille de probabilités est 


(ue) = {A (8, o?) tel que 8 ER}. (37.87) 


Nous supposons que © est connu. 
La densité de la variable aléatoire conjointe (X1,...,X,) au point (x1,...,x,) est le produit 
des densités, donc 


7 1 1 Ti-m É 


Étant donné que le but est de maximiser, nous pouvons oublier le facteur et passer au logarithme : 


Éia)= ; 5 (). (37.89) 


i=0 


Nous pouvons également supprimer le ë et le 1/02. La fonction à maximiser devient 
Ets re — m?, (37.90) 
i 


dont la dérivée vaut 2nm — 2Ÿ,;x;. Par conséquent nous avons un maximum avec 


1 nm 
= — 7 37.91 


37.5.6 Estimation d’une fonction de répartition 
ThoXAEMbTI 


Théorème 37.34 (Glivenko-Cantelli[756]). 
Soient X; des variables aléatoires indépendantes et identiquement distribuées suivant une loi dont 
la fonction de distribution est F (inconnue). Nous définissons l’estimateur 


Fo = Dix EMA SG 


i=1 
Alors 
P(lim | En — Flo = 0) = 1. (37.93) 
Autrement dit, pour presque tout w € Q, 
Jim [Æa(w,) — Flo = 0. (37.94) 


C'est-à-dire qu'il y a presque certainement convergence en probabilité. 


Notons que de façon générale lorsqu'on parle d’estimateurs, partout où il y a un « n » dans une 


variable aléatoire, il y a une dépendance sous-entendue en w. 
PropHSHFbEq 


Proposition 37.35. 
Pour presque tout x, l’estimateur Fh(x) est sans biais par rapport à F(x) : 


E(F,(x)) = F(x). (37.95) 


Démonstration. C’est juste un calcul : 


2 F(x) = F(x). (37.96) 
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37.5.7 Exemples sous forme d’exercices 


Exemple 37.36. 
Dans cet exercice nous construisons un estimateur biaisé qui présente un risque quadratique infé- 
rieur à un estimateur non biaisé. 

Soit un modèle statistique dont la famille de lois est {.W(m, o?)}9e]0,c0[ où m est un paramètre 
réel connu. En ce qui concerne la variance nous considérons 


sir 


= 


D (Xi - m}°. (37.97) 
i=1 


(1) Montrer que 6? est un estimateur sans biais de 6. 


(2) Montrer que le risque quadratique de 62 est 


R(6?, 0) = —. (37.98) 


(3) Considérer la famille d’estimateurs c6? avec c > 0. Déterminer la valeur de c qui minimise 


le risque quadratique de l’estimateur. 


(1) Nous calculons 
22 1 $ 
E(65) = - ) E[(X; - m)*] 


1 1 
— al =m)=) E(X; M 
or) 7 | n à | (37.99) 


1 

= > Var(X;) 
t 

= 7. 

(2) Par la formule (37.60) nous savons que le risque d’un estimateur sans biais est donné par sa 
variance : 


R(6n, 0) = Var(|6? — 8]|) = Var(6?). (37.100) 


Etant donné que les variables aléatoires X; sont indépendantes et identiquement distribuées, 
le lemme 36.30 nous enseigne que la variance de la somme est la somme des variances. Nous 
avons donc à calculer 


Var(|6? — 0|) = Var(ô?) 


—= ar ; — Um À 
| nr 2" [GX m)"] (37.101) 


- > E[(X; - m)*] - E[(X; - m}°°. 


Ces espérances ne sont pas très compliquées à calculer en utilisant la fonction caractéristique 
donnée par la proposition 36.140 : 


: | . \ 242 
Px_m(t) = ("Et -mR) = e ME (EX) 2e ME, (4) = exp (-—) : (37.102) 
Nous avons ®(9(0) = 304 et D’(0) = —o?. Par conséquent 
1 20° 
22 2 
Var(ô?) = F2 .. (37.103) 


Notez ici que 0 = o?. 
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(3) En tenant compte du fait que Var(62) = 2 et E(6?) = 6, nous avons 


E((c6% — 0)*) = Var(cô? — 0) + E(c6% — 0) (37.104a) 
= as + (c— 1) 62. subeqcdtedes than) 


La dérivée (par rapport à c) de cela s’annule pour & = 7. Notons que nous n’avons pas tout 
à fait démontré que cela est bien un minimum. Calculons cependant le risque quadratique 
de notre estimateur pour cette valeur de c. Pour cela nous reportons c = co dans l’expression 
(37.104b) : 


(37.105) 


Cela est effectivement plus petit que R(6?, 0). 


Nous avons ainsi construit un estimateur biaisé qui a un risque quadratique plus petit que l’esti- 
mateur non biaisé. VAN 


Exemple 37.37. 
Nous considérons la famille de probabilités 19 = .W(0) où 0 = (m,o?) € IR x ]0,00[. Déterminer 
l'estimateur de maximum de vraisemblance du paramètre 0 = (m, o?). 

Pour chaque observation x; nous avons une densité gaussienne. Le produit donne 


1 1 
| 2 | 2 
pts: (mi a) TPE exp | 502 (x; — m) | | (37.106) 
En passant au logarithme et en supprimant des facteurs inutiles à la maximisation, 


L(m,o) = —-nln(o) — EC =)", (37.107) 


L'’annulation de la dérivée par rapport à m donne immédiatement m = 1 Ÿ.x;. L'annulation de 
nm t 
la dérivée par rapport à o donne 


et donc 1 
2 - 
nn î n): 1 


i 
L’estimateur de maximum de vraisemblance du couple 0 = (m, 9?) est donc 


Ôn = (xs EU = x) | (37.110) 


t 


A 
37.5.8 Espérance et variance d’un estimateur 
Soit Tn = T(X1,...,X,) un estimateur du paramètre 0 dans un modèle d’échantillonnage. Les 
moyennes et variances de l’estimateur sont les variables aléatoires 
man Æellh)= J Tous Mn) se els (37.111a) 


Varo(Tn) = J MERCURE Men] du8"(x1, a. (37.111b) 
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Lemme 37.38. 
Si l’estimateur T, satisfait 
Jim Eo(Tn) = 0 (37.112a) 
lim Varo(Tn) = 0, (37.112b) 


alors il est convergent. 


Démonstration. Nous utilisons l’inégalité de Markov (théorème 37.18) et nous introduisons l’espé- 
rance de l’estimateur : 


P(IT(X1,..., Xn) — 8] > €) < LE(Xi, .…, Xn) — 6) EMRRE) 
1 1 

< E(ITa — Mn,6|) + TE (Imn,s — 0) (37.113b) 

(37.113c) 


Le second terme est l’espérance d’une constante. Nous majorons le premier terme en utilisant le 
fait que |.|1 < |.|2 (voir la remarque 27.34 après l’inégalité de Hôlder) : 
PIX, Xn) 0 >) < 


E(|Tn — Mno|°) |Eo(Th) — 8] (37.114a) 


nait 


€ 
1 
Var(T,)!? + = lEe(Tn) — 61. (37.114b) 


Les deux termes tendent séparément vers zéro par hypothèse. Nous avons par conséquent la conver- 
gence en probabilité Ty — 6. 


37.6 Estimation par intervalle de confiance 


Nous voudrions estimer la proportion d'individus dans une population ayant un certain ca- 
ractère déterminé par une variable booléenne : chaque individu a ou non le caractère étudié. 
L’échantillon sera donc une suite de 0 et de 1. 


Pour tout 4€ {1,...,n} nous notons 
= Ü . le ième individu a le caractère (37.115) 
O0 sinon. 
et Tn = 4 x;. Notre modèle statistique sera 
S=|(0,F,P),(%9),2(1,6)| (37.116) 


où Q est l’ensemble des individus étudiés, P est la manière de choisir les individus lors du sondage 
(essentiellement c’est une loi uniforme) et Xy est la variable aléatoire 


Ste) = L si w a le caractère (37.117) 


O0 sinon 


Cela est une variable aléatoire de distribution Z(1,p) où p est inconnu. Ici, @ = [0,1] est l’ensemble 
des p possibles. 


Remarque 37.39. 

Nous supposons que ( est la population entière et que la variable aléatoire est l’opinion de la 
personne w. En cela, nous considérons que le tirage de l’échantillon est sans remise. Le fait que nous 
modélisions par une variable aléatoire de Bernoulli signifie que nous considérons l’approximation 
dans laquelle la population globale est grande. 
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Nous supposons que nous ayons un échantillon (X1,...,X,) dont nous avons observé une 
réalisation (x1,...,2n) de fréquence 3,. Nous voudrions déterminer un intervalle dans lequel X, 
a de fortes chances de se trouver. Plus précisément nous considérons un petit a et nous cherchons 
e tel que 

P(pEe[Xn—e, Xn +) =1-a. (37.118) 


Typiquement, a = 5%. Le nombre a est le niveau de confiance que nous nous fixons à priori. 
Si nous trouvons un intervalle 1 tel que P(p € 1) = 1—a, nous disons que l’intervalle est exact, 
si nous avons P(p € 1) > 1 — à, nous disons que l'intervalle est par excès. 
Il y a deux points de départ pour trouver l’intervalle. Le plus simple est d'utiliser le théorème 
central limite et considérer : 
X, — 
Re À pi (37.119) 
p(1 — p) 
La seconde est d'utiliser la loi exacte : nX, = 3, X; + Zn, p). 
Bien entendu la seconde donne lieu à des calculs plus compliqués. 


Remarque 37.40. 
Dans certaines vraies vies (par exemple en médecine), la taille des échantillons est très réduite. 
Dans ce cas le théorème central limite n’a aucun sens et les calculs exact s'imposent. 

De plus dans de nombreux cas de la vraie vie, nous avons un ordinateur à disposition pour 
calculer avec la loi exacte. L'utilisation du théorème central limite dans le but de produire un 
intervalle de confiance semble donc de plus en plus être une survivance du passé. 


Dans la suite, nous allons supposer que n est suffisamment grand pour justifier l’approximation 
normale du théorème central limite 36.121. Si Z est une variable aléatoire normale centrée réduite, 
notre premier essai est de faire 


1—-a=P(pe[X,—e, Xn +él) subéquaans F 56e) 


. —Evn . Xn —p EvVn 
É ( D). Fe =D ° ru =.) POS 


Dev R __ c 
#| << (37.120c) 


—2P (2 < Fe) =? (37.120d) 
p(1 — p) 


La dernière ligne utilise la symétrie de la distribution .W(0,1). Le nombre € que nous cherchons 


vérifie donc 
(ps te). à (37.121) 
p(1 — p) 2 


De nos jours, les ordinateurs donnent la loi de répartition inverse des normales. Cela nous fournit 


en _ Eqepsnqsr épis pen 


p(1 — p) 


un nombre t, tel que 


où t est le nombre tel que P(Z < t4) = 1 — a/2. 
Conclusions de ce premier essai : 


(1) Le problème est que nous ne pouvons pas déduire € de l’équation (37.122) parce que p est 
inconnu. 


(2) Cela ruine notre premier essai et nous demande de trouver mieux. 


(3) L’astuce est évidemment de remplacer p par X,, mais il faut le justifier. 
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Méthode Slutsky Le point de départ du premier essai infructueux était la convergence 


Xn—p L 
pu 


SN -N“(0,1) (37.123) 
p(1 — p) 
donnée par le théorème central limite 36.121. Ce que nous voudrions en réalité est la conver- 
gence : 
Xn —pP 4 
Vn—= —_&N (37.124) 
Xn(1 — Xn) 


RldleX) pl-p) (37.125) 


Par conséquent le lemme de Slutsky implique la convergence en loi du couple : 


re Er x) L(NvrG-n). “FES 


p(1 — p) 


À ce point des opérations nous pouvons utiliser la proposition 36.106 au couple avec la 


fonction 
\/p(1 — p) (37.127) 


dont la probabilité d’être continue est 1 (y = 0 est de mesure nulle dans R?). La conclusion 
du théorème est que 


J(æ, y) HE 


Xn—p 


#0, D: (37.128) 


C’est à partir de là que nous pouvons construire notre intervalle de confiance : 


1-a=P(Xn-e<p<Xn+e) (37.129a) 
ZX : 
pee te Ne (37.129b) 
HR) RUEX) ARE) 


= P = >N> ne | (37.129c) 
A] Xn(1 — Xn) A] Xn(1 — Xn) 
Nous cherchons maintenant dans les tables le £ qui fait 
P(-É<N<E£)=1-a (37.130) 
puis nous cherchons € de telle sorte à avoir 


1/ne 


Xn(1 — Xn) 


= é, (37.131) 


Dans cette équation tout est connu à part le e qui se découvre. 


Méthode piétonne Nous remarquons que l’événement 


evVn L Xn —p evn 
VD(i — p) - Va à VD(1 — p) ES 


est le même que l’événement 


Xn—p 


ee (37.133) 
p(1 — p) 


NA 
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Vu que t, est positif, cela est encore le même événement que 


Mas 
pa)" Sr (37.134) 
p(l — p) 
ou encore : L 
pinLe)=p@nX, EE) ENX2< 0. (37.135) 
Les racines du polynôme du membre de gauche sont 
QnXn + 12 + 4/(2nX + ta)? — d(n + 2)nX2 
pi = ; (37.136) 


2(n +t2) 


Le but étant d’effectuer une limite n — ©, nous factorisons d’abord n. Après simplification 


: 12 2 XX) 
Xn + 2n L z + n 


pr = nm. | (37.137) 


Etant donné que nous considérons que n est grand, nous allons négliger les termes en 1 en 


faisant attention à ce que le terme en 1 sous la racine est en réalité 1/,/n et ne doit pas être 


négligé. Nous trouvons, à cette approximation, que 


= PAU CEE XL X, 
pe[x, tai] a Lg a EE (37.138) 


avec une probabilité 1 — «. 


37.6.1 Région de confiance 


Soit un n-échantillon (X1,..., X,) de loi parente 49. Nous supposons @ € R avec @ ouvert. 
Soit a € [0,1] un intervalle de confiance et une application mesurable 


A: R” — Bor(6) 


37.139 
Caps te NAS Te 


On appelle région de confiance exacte au niveau de confiance 1 — & une région aléatoire 
ÂA(x1,...,%n) telle que 
P(8E A(z1,...,%n)) =1-—a. (37.140) 


Si d = 1, la région A(x1,...,%,) est un intervalle. 


37.6.2 Fonction pivotale 


Soit ô. un estimateur de 0. Une fonction v sur @ x @ est pivotale pour 6 si la loi de la variable 
aléatoire v(4,,0) ne dépend pas de 4. Elle est asymptotiquement pivotale si 


Un, 0) À £ (37.141) 


où € est une variable aléatoire indépendante de 0. 

En pratique, nous essayons de faire apparaitre une variable aléatoire de loi connue qui ne 
dépend pas du paramètre que l’on recherche. Si la variance est connue et si l’échantillon est grand, 
le théorème central limite nous permet d’introduire une loi normale centrée réduite. 


Exemple 37.41. 
Soit X1,...,X, des variables aléatoires de loi parente .W(m, o?). Une fonction asymptotiquement 


pivotale pour m est 
21 — 22 


a/vn 


U(z1, 22) = (37.142) 
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parce que la variable aléatoire . 
- Xn—m 
VX n, M) = ——— 
( nm; ) a/yn 


tend vers .W(0,1) qui ne dépend pas de m. A 


Exemple 37.42. 
Si (X,) est une suite de variables aléatoires indépendantes et identiquement distribuées de moyenne 
m et d'écart type o que nous supposons inconnus. Le fonction suivante est asymptotiquement 
pivotale pour m : 


2 Xn-m 
X ee 37.144 
u( n m) o/yn ( ) 
A 
Soit (X1,..., XA) un échantillon de loi .W(m, a?) avec 9? connu. Nous cherchons un intervalle 


de confiance 1 — & pour m. Pour cela nous allons utiliser une fonction asymptotiquement pivotale, 
à savoir L 
Xn—m 
——— = N(0,1). 37.145 
Te NO. (87.145) 


Nous devrions chercher des valeurs z, et z_ telles que 


Xn—m 
PR de fs 37.146 
(-<r <a)-1- SE 
Pour des raisons de symétries (de la courbe gaussienne), nous allons chercher un intervalle symé- 
trique : z- = —z,. Le nombre à chercher est donc le z, tel que 
P(|Z| < za) =1- a. (37.147) 


Si nous demandons a = 5%, la réponse est z4 = 1.96, c’est-à-dire que 


+= 
P (-106 Le 1.96) — 0.95. (37.148) 
o/\yn 
Nous avons donc fie ae 
: «00  — .J00 
Pimelx X = 0.95. 14 
(metz, D An + ]) 95 (37.149) 


Supposons maintenant que nous avons observé 100 valeurs numériques avec Z, = 12 et o = 1. 
La réalisation de l'intervalle de confiance pour m au niveau de confiance 0.95 est : 


[12 — 0.196, 12 + 0.196]. (37.150) 


Cet intervalle est à interpréter de la façon suivante : si nous recommençons un grand nombre de 
fois le sondage, la moyenne tombera 95% des fois dans l'intervalle ainsi calculé. Mais il faut bien 
comprendre que la probabilité 


P (me [12 — 0.196,12 + 0.196]) (37.151) 
vaut zéro où un. 


Exemple 37.43. 
Soit un échantillon (X1,..., X,) de loi parente .W(m,o?) où m et a? sont inconnus. Déterminer 
un intervalle de confiance exact symétrique au niveau de confiance 1 — a. 

Déterminer un intervalle de confiance pour 0?. 


Nous savons que la moyenne empirique est un estimateur de la moyenne : 


1 nm 
eo 37.152 
2 (37.152) 
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Nous cherchons un intervalle du type 1 = [X, — e, X, + €] pour lequel P(m € 1) = 1 — a. Nous 
savons que la variable aléatoire 
Xn-m 
o/vn 


suit une loi .#(0, 1), mais la variance est inconnue. La subtilité à savoir est que la variable aléatoire 


(37.153) 


Zum 
Vo 


où 52 = D,(X; — Xh)2/(n — 1) suit une loi de Student à n degrés de liberté 7(n — 1) en vertu du 
théorème de Cochran 37.15. Comme il est usuel de le faire, nous inversons l'intervalle : 


Z (37.154) 


1-a=P(-Ee<Xn-m<e) (37.155a) 
Ur ne) (37.155b) 
Sa Sa 
Les valeurs se trouvent dans des tables ; par exemple pour n = 10 et «à = 5% nous trouvons 
RL 9,960. (37.156) 
Sn 


Plus généralement nous notons bn—1,1-2 le quantile d'ordre 1 — % de la loi 7(n — 1), c'est-à-dire 
le nombre tel que 


P(Z<tni1-5) =1- 5 (37.157) 
si Z + F(n—1). L'intervalle de confiance est alors donné par 
tn—1,1- 2 On tn—1,1- 2 Sn 
T='\X ——* X _——— |. 37.158 
ee us 


Cela est un intervalle exact pour m au niveau de confiance 1 — a. 
Nous pouvons aussi trouver un intervalle asymptotique en utilisant le théorème central limite : 


Xn-m 4 


SR 


T (37.159) 


avec T = (0,1). 
Rappel : dire que /, est un intervalle de confiance asymptotique signifie que 


Jim P(melh)=1-a. (37.160) 


En ce qui concerne la variance o?, l'intervalle de confiance se construit en utilisant la partie 
(2) du théorème de Cochran 37.15. Nous introduisons la variable aléatoire pivot 


2 
Z=(n- D (37.161) 


qui suit une loi y2(n — 1). Cette loi n'étant pas symétrique (voir figure 36.1), nous n’allons pas 
chercher un intervalle de confiance symétrique. Nous cherchons € et c2 tels que 


P(o°elc,c]) =1-a (37.162a) 
P(o? € [0,a]) = © (37.162b) 
P(o? € [e2,o) = © (37.162c) 


La situation est représentée à la figure 37.3. 
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St 


1 i } 
T T T T dé 


5) 10 15 20 25 30 


FIGURE 37.3: L’intervalle de confiance pour UP ÏFigChiSquaresQuantile 


La construction des nombres c1 et c2 passe par la relation 


__1e2 _ 1e 
Pa see)? (£ Din << ES) | (37.163) 


C2 C1 


Nous notons t, 1,2 € Én_1,1-2 les quantiles donnés sur la figure 37.3, c’est-à-dire 


P(Z <ty_13) = SP hui ed . (37.164a) 


Ce que nous obtenons est 


(n—1)52 
nr “his (37.165a) 
—1)$® 
Ce ee (37.165b) 
C1 7 2 


et par conséquent l'intervalle de confiance pour a? est 


(n—1)52 (n—1)52 


F 
n—1,1-2 


(37.166) 


n—1,1-2 


avec P(o? € I) = 95%. 


Remarque 37.44. 
Il n’est pas clair à priori que la longueur de l’intervalle 7 décroïisse avec n parce qu’il y a n dans 
les t au numérateur. 


A 


37.6.3 Sondage de proportion 


Une utilisation classique des statistiques est d'interpréter une proportion donnée par un son- 
dage. Nous considérons une élection avec deux candidats À et B. Nous avons interrogés n = 2500 
personnes et nous avons obtenu 51% pour le candidat À et 49% pour le candidat B. Que peut on 
dire ? 

La modélisation de cette situation est que nous avons des variables aléatoires X; < Z(pA) et 
que nous en avons observés n avec une moyenne 


än = 0.51. (37.167) 
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La loi de X, est une binomiale. Sa densité n’est pas symétrique, mais si n est grand, elle le devient. 
Nous cherchons un intervalle 
1=[%,=8%;+é] (37.168) 


tel que P(p4 € 1) = 1 — a. Pour cela nous considérons le fait que n = 2500 est grand et nous 
utilisons la limite de la proposition 37.10 : 


Ai 
D Re oi), (37.169) 


La variable aléatoire Z,, est asymptotiquement pivotale et normale centrée réduite. Nous cherchons 
donc un intervalle symétrique pour X, — pA : 


1—-a=P(-E< Xn —pA<eE), (37.170) 
c’est-à-dire, si n est grand, 
1 Œ — P € = vn — < Zn < = (37.171) 
A/Xn(1 — Xn) A/Xn(1 — Xn) 
où ZA est une normale centrée réduite. Nous trouvons ainsi, via les tables que 
SO. (37.172) 


Xn(1 — Xn) 


si nous voulons un intervalle à 5%. Par conséquent nous avons € = 1.96Y ——— et l’intervalle 


__ 1964/X,(1—X;) _ 2.964/Xn(1 — Xh) 
10= | X; . 37.178 
C di + Von ( ) 


de confiance est 


La propriété de cet intervalle est que 
Jim P(pael)=1-a. (37.174) 


Remarque 37.45. 

À quel moment avons nous fait une hypothèse sur la taille de la population globale ? En modélisant 
les sondés par des variables de Bernoulli et leur somme par une binomiale, nous supposons que 
le sondage est avec remise, sinon, elles ne seraient pas indépendantes. En supposant les sondés 
indépendants, nous avons donc fait comme si la population totale était infinie. 


37.7 Estimer une densité lorsqu'on ne sait rien 


Nous supposons avoir une série d'observations issues d’un processus complexe dont nous n’avons 
aucune idée de la loi parente, et nous voudrions nous faire une idée de la densité de cette loi 
inconnue. 

Nous observons une suite de réalisations que nous modélisons comme étant des variables aléa- 
toires (X1,..., X\) de loi parente (inconnue) uw. Notre but est de trouver un estimateur À de y. 
Par simplicité nous allons nous restreindre aux lois admettant une densité par rapport à la mesure 
de Lebesgue. C'est-à-dire que nous allons estimer 1 par une suite de lois f, qui sont toutes des 
lois acceptant une densité par rapport à la mesure de Lebesgue. 
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37.7.1 Distance entre des mesures 


Si 1 et 2 sont deux mesures de densité sur R, la distance entre 7 et 22 est définie par 


d(ii,12)= sup (4) —2(4)| (37.175) 
A€Bor(R) 


où Bor(R) désigne l’ensemble des boréliens de R. 


Théorème 37.46 (de Scheffé[757]). 
Si f1 et f2 sont les densités de v1 et va par rapport à la mesure de Lebesque, alors 


dense = [GA = 3 la = 54 — re (87.176) 


où f+ est la partie positive de f (pour la décomposition f(x) = f4(x) — f_-(x)). 


Démonstration. La dernière égalité est simplement une notation usuelle ; nous devons seulement 
prouver les deux premières. Pour la première nous commençons par prouver que le borélien réalisant 
le supremum est 


B={xeR tel que f1(x) > fi(x)}. (37.177) 


En effet si À est un borélien nous avons 


(4) — (4) = [. TRS h AL — f2 < [ fi — f2 = Lea — f2)+ = Le — f2)+ (37.178) 


n 
Justifications : 
— f1 — f2 négative sur AN CB. 
— Vu que f1 — fo > 0 sur B, l'intégrale augmente si on augmente le domaine. 
— Sur B nous avons f1 — fo = (f1 — f2)+. 


Donc pour tout borélien À nous avons 


d(v1, 72) Le — f2)+. (37.179) 


Mais pour À = B nous avons égalité : 


v1(B) — (B) = [ ER Lu — f2)+ = Le — f2). (37.180) 


Pour la seconde égalité nous savons que f1 et f2 s’intègrent toutes deux à 1 (parce que ce sont 
des densités de probabilité), donc 


J heat (37.181) 
R 


En particulier nous avons 


J he} J (he (37.182) 
R R 


ce qui donne bien 


Le =} ; L = (37.183) 
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37.7.2 Estimateur par fenêtres glissantes 


Nous considérons les estimations suivantes de la fonction de répartition : 
1 nm 
x) = = à 1{x,<x}: (37.184) 


et un nombre h, qui sera la taille de la fenêtre glissante. Nous avons en tête de faire limy-, An = 0. 
Nous considérons ceci comme estimateur de la densité inconnue f des variables aléatoires X; : 


à _ Fn(x + in) — En — ha) 


Jn(x) Th, (37.185) 


L'idée sous-jacente est de prendre la dérivée de la fonction de répartition comme densité. 


Lemme 37.47 ([757]). k 
Pour tout hn > 0, l’estimateur f, est une densité de probabilité. 


Démonstration. D'abord f, est bien à valeurs positives ou nulle. Ensuite devons parler de son 
intégrale. Pour le numérateur nous avons 


1 nm 
Fn(e + hn) — En(® — hn) = > D LxeB(ahn): (37.186) 
=] 


En réalité cette égalité est valable seulement presque partout parce qu’elle n’est pas valable en 
x =zx+h}, mais cela ne va pas nous ennuyer dans la mesure où nous avons dans l’idée d’intégrer 
cela sur R. Avant de nous lancer dans l'intégrale nous remarquons que X; € B(x,h,) est la même 
chose que x € B(X;,hh), c’est-à-dire que 


{Xe B(x, hn)} = {x € B(Xi, n)}. (37.187) 


Donc 


[Li - 7 5 jen 23 fe rrn) B(Xihn) © 9n D DE = 1. (37.188) 


D 0 


LemTZopXDd 
Lemme 37.48 ([757]). 
L'estimateur fn est déjà pas mal parce que 


dim (fe) = f(x) (37.180) 


pour presque tout x € R. 


Démonstration. Nous commençons par nous rappeler le fait que F, (x) est un estimateur sans biais 
de F(x) (proposition 37.35). Donc 


Be) = FE) FE tn) es 


Nous devons prendre la limite de cela lorsque h,; — 0, c’est-à-dire considérer la dérivée de F. 
Attention : rien ne dit que F' soit dérivable, si ce n’est la proposition 17.26 qui indique qu’elle est 
dérivable presque partout avec f comme dérivée. 

La limite h, — 0 dans (37.190) nous donne donc bien presque partout 


Jim E( f(x) = f(x). (37.191) 
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Proposition 37.49 ([757]). 
Si la suite (h,) est telle que hn — 0 et nhy — ©, alors pour presque tout x € R nous avons les 
convergences 


fe) 9 (x) (37.192) 
et 
fax) # f(x). (37.193) 


Démonstration. Il faut d’abord comprendre ce que signifie la convergence L?(P) pour presque tout 
x. Pour cela il faut comprendre que f(x) est en soi une variable aléatoire et est en réalité une 
fonction w + fat, w). Ce que nous allons montrer est que pour presque tout x (maintenant fixé), 
cette variable aléatoire converge vers une constante (par rapport à w) et que cette constante est 
f(x). 


2 
La convergence X} n D: signifie E(|X, — X[?) — 0, c’est-à-dire 
[ IX (w) — X(w)*dP(w) — 0. (37.194) 
) 


En faisant une décomposition biais-variance nous devons donc étudier 


A 


Et) — f))°] = Elh(e) — F@T + Var (f(x) — (a) (37.195) 


Ici f(x) doit être vue comme la variable aléatoire constante sur (. Par le lemme 37.48 et la 
proposition 36.33 le terme de biais converge vers zéro lorsque n — 00. 
Pour traiter le terme de biais, nous savons déjà que 


2nhn fa(x) — D L{x;eB(x,hn)}1 (37.196) 
i=1 


où le membre de droite (et donc aussi celui de gauche) est une variable aléatoire binomiale comptant 
le nombre de succès de l'expérience X; € B(x,hA) en n essais. Nous notons Prn — P(X; € 
B(x, hn)). Si u est la loi parente des X;, alors 


Pn,x = P(X; € B(x,hn)) = u(B(x, hn)) = F(x + hn) — F(x — hn) EaReTo 


où Fest la fonction de répartition (parente) des X,;. 
Alors la variance de ladite binomiale est donnée par (36.365), c’est-à-dire npyn(1— Prn). Nous 
avons alors 


Var (2nhnfn(x)) = npzn(1 — Pr,n) (37.198) 
et 
Var (a(n)) = rpg" Pen( — Pan). (37.199) 
Nous pouvons faire la majoration {(1 — t) < t qui est valable pour tout t et écrire 
Var(f(æ)) < Per, (37.200) 
Anhn An 


Le premier facteur tend vers zéro parce que nous avons supposé que nh, — co. Pour le second 
facteur, il faut remarquer que l’expression (37.197) nous donne presque partout 


: Pn,x 
lim 
An—0 An 


= 2f(x), (37.201) 


qui est constant et certainement borné. 
: 5 3 L?(P) 
Nous avons maintenant prouvé que pour presque tout x nous avons f,(x) —>’ f(x). Montrons 


que cela implique la convergence en loi, c’est-à-dire que pour tout 7 > 0, nous avons la limite 


P(|fa(æ) — fa) > 7) — 0. (37.202) 
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Si cela n’était pas vrai, nous aurions un nombre 70 > 0 et e > 0 tel que pour tout n à partir d’une 
certaine taille, 


P(lA() — fG@)P > m) > 6 (37.203) 
et en particulier en notant A l'événement |f,(x) — f(x)? > né, P(A) > €. Alors 
1 (rw) — f(x,w)dP(w) > ] te, w) — f(x,w)dP(w) > J m=nP(A). (37.204) 
a À À 


Cela signifie que k 
ln(x) — f(x)|z2çP) > no P(A), (37.205) 


ce qui contredit la première convergence démontrée. 


Note : l'hypothèse nhx — 0 revient à dire que nous voulons que chaque boîte contienne de 
plus en plus d'observations. Si nous avions nh, — 0, alors avec n qui augmente, la majorité des 
boîtes deviendraient vides, ce qui reviendrait à une perte d’information. 

2 


37.8 Test d’hypothèses, prise de décision 


37.8.1 Exemple : qualité des pièces d’usine 


Une usine fabrique des composantes électroniques garantis un an. Le constructeur ne veut pas 
accepter que plus de 5% des pièces tombent en panne avant un an. 

Nous supposons que la durée de vie T d’une pièce soit une variable aléatoire suivant une loi 
exponentielle de paramètre À (qui est l’inverse de la moyenne : 0 = 1/À). Le fabriquant veut donc 
s'assurer que 


0.95 < P(T > 1), (37.206) 
ou encore 
21 
PE | ge dr = 6718 > 0.95, (37.207) 
0 
donc le fabriquant doit s’assurer que 
1 
Pa, (37.208) 
I (555) 


Nous posons donc 06 = 19.5 et nous prenons comme modèle de décision que si 0 < 66, alors la 
chaine de production doit être revue, et si 0 > 60, alors l’usine peut continuer son travail. 

Ce dont nous disposons n’est pas de #, mais d’une estimation de 0 à partir d’un échantillon. 
Cela étant il faudra aussi pouvoir estimer la probabilité de faire un mauvais choix. 


37.8.2 Exemple : la résistance d’un fil 
subsecExempLFilResituzz 


Un artisan a besoin d’un fil qui a une résistance à une traction de 100g en moyenne. Si la 
résistance est trop faible, le fil casse ; si elle est trop grande, c’est trop rigide et ça ne convient pas. 


Remarque 37.50. 

Dans l’exemple précédent, avoir 0 > 00 ne dérange pas. Si la durée de vie moyenne est de 2 ans, le 
directeur de l’usine ne sera pas malheureux. Ici par contre l’artisan cherche une valeur précise et 
a donc une borne vers le haut et vers le bas. 


L’artisan reçoit un lot de fils et souhaite savoir si il est conforme. Pour cela, il prend 4 fils au 
hasard et mesure une moyenne de 112 g. Est-ce que cela est cohérent avec une moyenne de 100 g ? 

Nous faisons l'hypothèse que la résistance des fils suit une loi normale .W{(m,a°?) avec m 
inconnu. Pour la simplicité nous supposons que © est connu et vaut 10. 

Nous devons prendre une décision entre deux hypothèses. L'hypothèse H, sera de dire que le 
lot a une résistance de 100 g et l’hypothèse alternative sera que le lot a une résistance différente. 
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Les 4 observations sont quatre variables aléatoires (X;);=1,23.4, et le nombre 112 est une réali- 
sation de la variable aléatoire 


= 1 
XA = ai + Xo + X3 + X4). (37.209) 


Nous supposons que H, est vraie, et nous calculons quel est l’intervalle autour de m = 100 qui 
a 95% de chances de contenir la moyenne observée. Si 112 est dedans, nous acceptons H, et si 112 
est hors de cet intervalle, nous refusons H5. 

Compte tenue de l’hypothèse H5, nous avons 


X3 100 -X4— 100 
20e Ë ” 
Va 


N(0,1). (37.210) 


Nous commençons à connaitre par cœur l'intervalle de confiance à 95% d’une loi normale centrée 
réduite ; le quantile est à 1.96, c’est-à-dire 


Nil 
P(-156< 2 


< 1.96) = 0.95, (37.211) 
ou encore 


P(X1 € [90.2,109.8]). (37.212) 


Il y a donc moins de 5% de chances que la moyenne de ces quatre fils tombe en dehors de l’intervalle 
[90.2, 109.8]. L’artisan doit donc rejeter l'hypothèse et considérer que le lot est mauvais. 
La région 
]-00,90.2] Ü [109.8, oo[ (37.213) 


est la région de rejet, ou région critique. 

Ici, le nombre 5% représente le risque de refuser ÆQ alors qu’elle était vraie. Notons que nous ne 
pouvons pas calculer le risque d'accepter H, alors qu'elle est fausse. En effet, si H, est fausse, nous 
ne savons pas quelles sont les valeurs de X4 acceptables parce qu’il y a une infinité de possibilités 
pour m qui soient alternatifs à m — 100. 

Évidemment si la vraie moyenne est 100+1077, l'hypothèse H9 sera acceptée, mais nous n’avons 
aucun moyen de savoir si elle est vraie ou non. 


37.8.3 Vocabulaire et théorie 


Nous avons un modèle d’échantillonnage paramétrique (X91,..., Xon) de taille n et de para- 
mètre inconnu 6, de loi parente {19 appartenant à une famille paramétrique de lois (49)9c0-. 

Soient H, et H: deux ensembles disjoints tels que ® = Ho © H. L'ensemble HQ sera nommé 
hypothèse nulle et l’ensemble H; sera l'hypothèse alternative. 

Pour l'exemple des fils, nous avions Ho = {100} et Hi = R\{100}. Si une hypothèse est réduite 
à un singleton, nous parlons d’hypothèse simple et sinon c’est une hypothèse composite ou 
multiple. Faire un tests consiste à déterminer une région critique. 


Définition 37.51. 


Un test est une application mesurable Ô qui à (x1,...,%n) € R" associe 
tisse) el (37.214) 
Si 0(t1,...,%n) = 0 on accepte l’hypothèse Ho pour l'échantillon x1,...,%n, et si ô(æ1,...,%n) = 1, 


alors on rejette Ho et on choisit H;1. L'ensemble 
W= ria:2,) eR7Tted'que (ot. %n) = D (37.215) 


est la région de rejet ou la région critique. 
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L'ensemble W = 6-1(1) est un borélien de R” parce que 6 est mesurable. L'événement auquel 
nous sommes intéressés est l'événement 


Res New. (37.216) 


Exemple 37.52. 
Pour l’exemple de 37.8.2 nous avions 


0(21,...,%4) = 1cfo0.2,100.8] (T4). (37.217) 


37.8.4 Risque de première et seconde espèce 


Le modèle de décision que nous avons introduit comprend deux façons de se tromper. Soit nous 
rejetons Ho alors qu’elle est vraie (c’est le risque de première espèce), soit nous acceptions Ho 
alors qu’elle est fausse (risque de seconde espèce). Nous pouvons formaliser ces concepts de la 
façon suivante. 

Nous considérons un test de région critique W. Le risque de première espèce, noté a est la 
fonction 

a: Ho — [0,1] 


(37.218) 
CE P((Xo1, “Es > Xon) E W). 


Il s’agit de la probabilité de rejeter Ho alors qu'elle es vraie. Le risque de seconde espèce est la 
fonction 


: Hi — [0,1 
Per cl (37.219) 
0 P((X61, 3 Xôn) É W). 
C’est la probabilité d'accepter H, alors qu’elle est fausse. 
DefPuisszYkrQa 
Définition 37.53. 
Soit Ô un test de région critique W. La puissance du test est la fonction 
: Hi — [0,1 
PER ON (37.220) 
CE P((Xo1, DC AG) E W). 
La courbe d’efficacité du test est la fonction 
h: 6 —1[0,1 
[0,1] (37.221) 


0 P((Xo1,..., Xen) € W). 


La puissance d’un test est la probabilité de rejeter H5 lorsque H; est vraie. Plus la puissance 
est grande, mieux c’est. La courbe d’efficacité du test est la probabilité d'accepter Ho pour une 
certaine valeur de 6. 

Soit un test 6. Une statistique T4 = T,(X91,..., Xon) est une variable de décision pour Ô 
si CW peut s’écrire d’une des façons suivantes 


Fltisisesmu) € IR tel que Thlti,:4 tu) 6} test unilatéral à droite 
CW = 4 {(x1,...,2%n) € R” tel que Tn(x1,...,Æn) > C} test unilatéral à gauche (37.222) 
{(t1,...,Tn) € R” tel que c1 < Tn(t1,...,Tn) < C2} test bilatéral. 
Le plus souvent la variable de décision sera la moyenne : T,(æ1,...,2») = 1 + æ;. Les valeurs 


C, C1, c sont des valeurs critiques. 

En ce qui concerne les notations, ici T} représente la valeur mesurée sur un n-échantillon (d’où 
l'indice n) alors que T9 est la valeur théorique de T lorsque 4 est la vraie valeur du paramètre qu’on 
veut estimer. 
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Pour un test unilatéral à droite, nous fixons la valeur critique c de telle manière à avoir 
P{Ts > €) <a. (37.223) 
Pour un test unilatéral à gauche, nous fixons c de telle manière à avoir 
PIE < ci <a (37.224) 
et pour un test bilatéral nous fixons c1 et c2 de telle façon à avoir 


P(To > ©) = P(Te < à) < (37.225) 


CIRE) 


37.8.5 Modèle paramétrique de loi gaussienne 


Soit un modèle statistique paramétrique de lois gaussiennes .W(m, 1) de moyenne m inconnue 
avec m € R*. Nous avons © = [0, |. 

Nous observons un échantillon de taille n = 36. Avec un risque de première espèce de 5% nous 
voulons estimer l’hypothèse H5 = {0} contre l'hypothèse A1 = ]0,{. De notre échantillon nous 
construisons la variable aléatoire 


S x (37.226) 


dans laquelle les X; sont les éléments de l’échantillon, elles sont indépendantes et identiquement 
distribuées de loi .W(m, 1) avec m inconnu. 

Si X, est proche de zéro nous acceptons Ho, sinon nous la rejetons. La région de rejet s’écrit 
donc sous la forme 


1 nm 
W = {(x1,...,%n) € R° tel que Zn = = D,%i>u} (37.227) 
i=1 


dans lequel il faut fixer le u pour satisfaire au risque de première espèce de 5%. La contrainte est 


d’avoir 
P(X,>u)=a FaprUBàs 


si Ho est vérifiée. Cela revient à dire que dans 5% des cas où Ho est correcte, nous la rejetterons. 
Si Ho est vraie alors X,, est une moyenne de gaussiennes de moyennes m et nous avons 


Xn—m 
o/\n 
avec m = 0 et « = 1. L’équation (37.228) devient donc 
on u 
P 
” (re 7 1VR 


où T + .W(0,1). Avec n = 36 et à = 5% nous trouvons 


= N(0,1) (37.229) 


) = P(T > ynu) (37.230) 


1.64 
. ei = 0.274 (37.231) 


La règle de décision est donc la suivante : si Zz, > 0.274 alors nous rejetons Ho, et sinon nous 
l’acceptons. 
Calculons la puissance de ce test (définition 37.53). C’est la fonction donnée par 


n: Hi —-R 


1 (37.232) 
mt PO) E W) —? CEx > à) | 
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Dans ce calcul, les X; sont d’une loi normale .W(m, 1), et non .W(0,1). En retranchant m et en 
divisant par 1/4/n nous trouvons 


LSX;-m u-m 
n(m) = P (3 TA PS VAE (37.233a) 
= P(T > yn(u — m)) (37.233b) 
= P(T > 16.45 — 6m) (37.233c) 
= 1 — ®(1.645 — 6m) (37.233d) 
où ® est la fonction de répartition de .W(0, 1). La fonction » a les propriétés suivantes : 
lim n(m) = (37.234a) 
Jim n(m) = (37.234b) 
Gi 
= .234 
n(0) = Le (87.2340) 


Remarque 37.54. 

Si nous regardons m — 0.001, le risque de seconde espèce est quasiment de 90%. En effet le risque 
de seconde espèce est d'accepter Ho alors qu'il est faux. Lorsque m = 0.001, l'hypothèse H, est 
fausse, mais la probabilité qu’on l’accepte est grande. D'ailleurs les conséquences de l’accepter à 
tort ne sont peut-être pas si grandes que cela. 


37.9 Tests paramétriques 


La proposition suivante montre le lien entre région de confiance et les tests. 


Proposition 37.55. 
Soit A(X1,...,XA) une région de confiance par excès de niveau de confiance 1 — a. Alors il existe 
un test pur de niveau a pour tester Ho = {00} de région de rejet 


W, = {x = (x1,...,%n) € R" tel que 00 € A(x1,...,xn)}. (37.235) 

Démonstration. L'hypothèse sur À signifie qu'avec les observations (X1,..., X,), il y a une forte 

probabilité (plus grande que 1 — a) que soit dans A(X1,...,X,). Avec ou sans Ho nous avons 
donc 

P(ÉEA)>1-a. (37.236) 


Supposons maintenant l'hypothèse H5, alors 


P((X1,..., Xn) € Wa) = P(65€ A(X1,..., Xn)) & a. (37.237) 


Remarque 37.56. 
Soit W, la région de confiance d’un test de niveau a pour tester H6 = {00}. Alors 


A={xe R" tel que x é Wn} (37.238) 
est une région de confiance 1 — «a pour 6. 


Exemple 37.57. 

Soit (X1,..., XA) un échantillon de loi parente .Ÿ (9, 1) avec 0 € {00,01}. Nous supposons 46 < 41. 
Nous voulons tester Ho = {05} contre H1 = {01}. Nous proposons le test suivant. La variable de 
décision sera X, et la région de rejet sera 


00 + 6: 
2 


1 
W = ..., Zn) € R” tel _ : : 37.239 
(Green) ER te que La (87.239) 
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(1) Donner le risque de première espèce de ce test. 
(2) Soit 0 < a < 1. Pour quelle valeur de n le test a-t-il un risque de première espèce égal à a ? 


(3) Donner la puissance du test. 


Les réponses peuvent être exprimées en termes de la fonction de répartition F' de la loi normale 
centrée réduite. 
Le risque de première espèce est donné par 


“-P( > Peu “n) F5 210) 


où les X; sont des variables aléatoires indépendantes et identiquement distribuées de loi parente 
(60,1). Cela est la probabilité d’être dans la région de rejet alors que l'hypothèse H9 est vraie. 
La formule (37.240) se transforme en 


LEUXi 600. ii 6 
a= P | WE > PE (37.241a) 
= P(T > Vrai 2), (37.241b) 


En termes de la fonction de répartition nous avons alors 


gi 5 ) (37.242) 


a=1-F(yn 


I s’agit maintenant de trouver le nombre n qui réalise cette égalité. Pour cela nous utilisons 
l'inverse F1 de la fonction de répartition de la normale : 


9 2 | 
n = ( Fi o)) FRS) 
01 — 60 
Le risque de seconde espèce est la possibilité d'accepter A5 lorsque H est vraie, c’est-à-dire 
00 + 0 EgBKQo 
s-r( 2x <%+ ) Reg 


sous l’hypothèse H1. Dans le calcul de (37.244) nous prenons donc X; + (01,1). Le résultat est 
que 


00 — 6 


8 = F(VRŸE 


À (37.245) 


Remarque 37.58. 

L'expression (37.243) diminue lorsque 4 et 01 s’éloignent, ce qui est normal : plus les nombres à 

discerner sont éloignés, moins l'échantillon à prendre pour réaliser le travail doit être grand. 
Notons aussi que 06 — 01 < 0, par conséquent augmenter n diminue la valeur de 


— 0 
B= F(yn® EE (37.246) 
A 
37.10 Tests d’adéquation 
Soit X1,..., X, un échantillon de loi parente X finie prenant ses valeurs dans {a1,...,az}. La 


loi de X est donnée par les nombres 
pi = P(X = ai) (37.247) 
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pour à = 1,...,k. Nous introduisons l'effectif empirique, la variable aléatoire N; qui compte 
le nombre de fois que a; est observé dans l’échantillon. La fréquence empirique est la variable 
aléatoire 


FE, = —. (37.248) 
Nous savons que la loi de N; est Z{(n, p;), et la loi des grands nombres dit que 
FE ES »; (37.249) 


pour chaque 5. Le théorème central limite nous indique de plus que 


N; — np; 


EP (OL) (37.250) 
npi(1 — Di) 


Nous considérons un cas où les p; sont inconnus. Ils peuvent être approchés par N; = np;. Le 
théorème de Pearson nous indique comment. 


Théorème 37.59 (Théorème de Pearson). 

Nous avons 

(W-np) + 
1 nPi 


> K = x?(k—1) (37.251) 


D 


U 


où la distribution x?(1) est la somme des carrés de l gaussiennes centrées réduites indépendantes. 


Démonstration. Nous commençons par le cas 4 — 2. Dans ce cas nous avons M = n — N; et 
p1 + p2 = 1. La somme que nous regardons est 


(NM — np1)° ” (N2 — np2)? _ (M - np)? ” (MN — np1)° 


(37.252a) 
npi np2 npi n(1 — pi) 
N — 2 
EN EReUe SoRe STD) 
np1(1 — pi) 
Étant donné que M, est une variable aléatoire binomiale nous avons 
Ne — 
EL ne 01) (37.253) 
npi(1 — pi) 
Par conséquent la limite de (37.252b) est 
. 2 
7 L, T2 2 201). (37.254) 
np1(1 — pi) 
Cela conclut le cas k = 2. 
Passons à présent au cas général. Le k-uple (N,,..., Ny) est une variable aléatoire multinomiale 
de loi 
Mn k; p1,...,Dk). (37.255) 
Nous introduisons les variables aléatoires U; données par U;: A — RF avec 
Pb) (37.256) 


c’est le vecteur aléatoire qui prend ses valeurs dans les vecteurs de la base canonique de R et qui 
prend la valeur e; avec probabilité p;. Par construction nous avons 


(Nu... Ne) = s Us. (37.257) 
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Nous allons étudier la fonction caractéristique de (N1,...,N%) définie par l'équation (36.229) : 


Done R* — C 


. 37.258 
e; + E(eisi  N) = E(eiMs). ) 
Plus généralement, 
Benne. ste) = E(e Nm), (37.259) 
Nous avons 
END = gi24 0) 2 | | 60 (37.260) 


j 
et vu que les Ü; sont imdépengantes et identiquement distribuées nous pouvons écrire ÜU1 à la place 


de U; de façon à avoir 


SN... .Nx) (41, at un (ei Fa) (37.261a) 
= TE meteo (37.261b) 

j | 
=||> ne (37.261c) 

ET 


k nm 
= 5 put) | (37.261d) 


1=1 


Nous allons montrer que 


k 2 
| _isn 
Jim P(n.n,)(#1,..., te) = € 116 — D 2) : (37.262) 
ÿ=1 


Pour ce faire, nous allons effectuer un développement limité. D’abord nous introduisons les variables 


aléatoires 
so rs 


np; 


et nous calculons 


(37.264) 


., (MN -n N-n 
Dioisar) (bis Se in) — E exp (ie ( | 2 2 = ) 


np un V/NPk 


Etant donné que n et p; sont des variables déterministes, nous pouvons les sortir de l'espérance. 
Nous avons alors 


k 
| ti LE E 
Péonory(i5.-t8) = Xp | —È ) tj4/nb;j | Een … ( re. ) (ES | 
(a1,…., "1 1 k) | À J ) (Ni, Nx) VITE V/MPk 65) 


parce que 


4, Nip —tjnp; 
E £ 570; | eV E CAES (37.266) 


En remplaçant (37.261) dans (37.265) nous trouvons 


B(o1,...a) É1 tk ) = — EXP (- D tj VND; vs) (one FA x) ee 


J=1 


———  — 
A 
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Nous analysons maintenant le terme À. Nous écrivons l’égalité À = À + 1 — 1 en tenant compte 
de »,;p; = 1 sous la forme 


k nm 
A = É + : p;(exp(it;/Vnp;) — :) : (37.268) 
j=1 
Nous avons alors 
ee) 
In(A) = nln : + >; Pj (ett/ VRP: = 1 (37.269) 
j=1 


Nous développons l’exponentielle en 


« 2 


eits/ MP; 1 = - + —e(1/n) (37.270) 


et ensuite le logarithme selon la formule 


m(1+x) = L + r?a(x?). (37.271) 
Nous avons 
it, CE 
In(A) = nin + Zn 5, nn = w)] (37.272a) 
RE 
= nln : + Sr; (it EE . H)] (37.272b) 
5 
2 
.… JP; Ë 1 
=" 2 Ê em — Le + su) (37.272c) 
I— 
K 
1 1 ° 
nn D Lo 
ns À Ê “ui 5 NE) (37.272d) 
+nkK?a(K) (37.272e) 


Nous introduisons dans € tous les termes en 1 /n2 et nous trouvons 


2 2 
In(A) = », Ê pin — à) — : 5 ils ) + e(1/n) + K?a(K). (37.273) 


j j 


En remplaçant dans (37.267) et en passant à la limite pour n — , 


ant top (DD) FE 
J j 


Nous reconnaissons des lois gaussiennes dans le premier terme de l’exponentielle. Nous allons 
maintenant nous atteler à identifier le second terme. 
Soit C une matrice orthogonale dont la dernière ligne est (,/p1,...,,/pr). Nous considérons les 
vecteurs 
a li 
dre, =] 2e (37.275) 


(07 tk 
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et ensuite nous notons U = (u1,...,ux) le vecteur Ct et (B1,...,/Bx) le vecteur Ca. Étant donné 
que C'est orthogonale, nous avons 3, a? = 3,82 et 3,1? = Y,u?. Nous avons alors 


Sep) = E(E MP) = E(®) = De, (trs... te). (37.276) 


Nous pouvons récrire l'argument de l’exponentielle (37.274) de la façon suivante : 


k 
Lio (37.277a) 


i=1 j 
k 
D tip; = (Ct)r, (37.277b) 
j=1 
Nous avons alors 

Jim P(a..s)(1-..te) = lim Poax)(U1;--.; uk) (37.278a) 

1 #1 
= exp É >; 4) (37.278b) 

j=1 
= (2,74 1,0)(U15- +; Uk) (37.278c) 


où les Z; sont des variables aléatoires indépendantes et identiquement distribuées de distribution 
normale centrée réduite. Nous avons donc montré que 


(Pigsses On) A (Zi: 281 0). (37.279) 


Étant donné que l'application x + |x|? est continue, nous avons aussi 


4 
(81, ne , Bx)|? — I(Z2, PS 0)|?, (37.280) 
et par conséquent 
k—1 
A 
Con, …, 4) 5 D, 77 + x?(k — 1). (37.281) 
j=1 


D’après la définition (37.263) nous avions 


k 2 
N: _ à 
lan. af = > SE (37.282) 
j=1 j 
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Chapitre 38 


Chaînes de Markov à temps discret 


Mets tes deux pieds en canard, c’est la chaine de Markov qui se prépare. 


38.1 Généralités 


Les chaines de Markov interviennent pour la description des systèmes dont l’évolution future 


ne dépend que de l’état présent. 
DEFooGDPFooWsvfRv 


Définition 38.1. 
Soit E un ensemble au plus dénombrable! et (Q,F, P) un espace de probabilité. Une chaine de 
Markov à valeurs dans E est une famille (Xh)nen de variables aléatoires telles que pour tout 
TO,.:..,Ln+1 € E, 


P(Xnyt un Ent] À = Ens...) XO — x0) = Play — RS F7 — Bo): (38.1) 


Pour une chaine de Markov, il n’est pas important de savoir l’historique pour prédire le futur : 
Xn1 est seulement déterminé par X;. 


Remarque 38.2. 
Il existe une théorie des chaines de Markov à temps continu ou avec E non dénombrable, mais ce 
n’est pas au programme. 


38.3. 

Vu que l’ensemble Æ des états est au plus dénombrable, nous rappelons très humblement à la 
lectrice la proposition 11.113 qui nous permet de changer des sommes sur Æ en des sommes sur N 
sans nous soucier de l’ordre sur Æ. Si f est une fonction sur E, nous nous écrirons 


O0 
Di f(x) = D, fax) (38.2) 
xeE k=0 
sans citer 11.113 à chaque fois. 
DEFooVVWUooKIBQDv 
Définition 38.4. 
Si (X,) est une chaine de Markov?, nous notons 
Pat, y) = P(XnH = YlXn = à) (38.3) 


la probabilité de transition de la chaine à l'instant n. Si cette probabilité ne dépend pas de n, 
nous disons que la chaine de Markov est homogène, et nous notons p(x,y) au lieu de pa(t, y). 


1. Une chaine de Markov sur un ensemble indénombrable demanderait plus de technique à cause du lemme 11.109 
qui fait que toutes les sommes sur des ensembles indénombrables sont infinies. 
2. Définition 38.1. 
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DEFooKQROUooYvJvvl 
Définition 38.5 (Matrice de transition). 
Nous notons QÙ) la matrice de transition qui est éventuellement infinie : 
QÙ) = pa, y). (38.4) 


Si l’ensemble des états E est infini, ce n’est pas une matrice à proprement parler. 


Le lemme suivant est intuitivement rien d’autre que le fait que la somme des probabilités doit 


être 1. 
LEMooQNIWooQBMlge 


Lemme 38.6. 
Soit un processus de Markov (X,) sur l’ensemble E. Pour chaque x € E pour pour tout n € N 
nous avons 


D Pn(z,y) = 1. (38.5) 


yeE 
Démonstration. Nous avons le calcul 
D Prey) = D P(Xnu1 = ylXn = %) (38.6a) 
yeE yeE 
BE IRGE 
= P(Q|Xr = x) SUBEQooIRG CoeE 
PDO Xz = 4%) 
PC =) ou 
=]. SUBEQooBRMToo Éd} 


Justifications : 
— Pour (38.6b), c’est le lemme 36.45 en observant que Q = Uk p{Xn+1 = y}. 
— Pour (38.6d), c'est (0 n À = A. 


Remarque 38.7. 

Attention à ce que ce lemme 38.6 ne fonctionne que sur les colonnes de p,. En effet, la somme 

D ep P(t, y) ne vaut pas spécialement 1. Si les états æ1 et x2 arrivent tous les deux en y de façon 

certaine, alors nous avons »,,p(x,y) > 2. Il n’y a donc pas de limites aux sommes des lignes. 
LEMooZIEPooXHGnvy 

Lemme-Définition 38.8 (Produit de matrices de transition). 

Soient deux processus de Markov (X,) et (Yn) sur le même ensemble E. Si nous notons p et q 

leurs matrices de transition® alors ITEMooWNWXooCKOYPE 


(1) La somme Ÿ,,6rp(a,æ)q(x,b) converge pour tout a,be E. ITEMoOEZTE00FEbuh j 


(2) Nous notons pq la « matrice de transition » 


(pg)(a,b) = Ÿ, p(a,x)q(x.b). (38.7) 
xeE 
ITEMooKEFXooMLREKO 
(3) La matrice pq vérifie 


D (pg)(x,y) = 1 (38.8) 


yeE 


pour tout x € E. 


Démonstration. Nous considérons la mesure de comptage sur Æ (définition 14.255). Cela nous 
permet d’écrire la somme comme une intégrale. 


3. Qui n’est pas spécialement une matrice, voir la définition 38.5. 


38.1. 


(1) 
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Pour (1) Nous devons donc démontrer la convergence de 


Z pla.ratz.n = | p(amatr Dam(r) RE 


xeE 


où dm(x) n’est pas du tout la mesure de Lebesgue (qui n’aurait aucun sens), mais bien la 
mesure de comptage en x. 


Nous pouvons majorer q(x,b) par 1 (tous les nombres sont strictement plus grands que zéro) : 
pour chaque x nous avons 


p(a,x)q(x,b) < p(a, x), (38.10) 


alors que [, pa, x)dm(x) = 1 par le lemme 38.6. 


Vu que la fonction x + p(a,x)q(x,b) est dominée par la fonction x + p(a,zx) et que cette der- 
nière est intégrable, le lemme 14.185 conclut à l’intégrabilité de la première. Bref, l'intégrale 
(38.9) existe et est finie. 


Pour (2) Iln’y a rien à prouver, c’est seulement une définition. 


Pour (3) Nous devons calculer la valeur de 


DD rat) = | (| RC 0) 0 (38.11) 


bE xcE E JE 


Pour cela nous allons utiliser le théorème de Fubini comme expliqué en 14.298, et nous 
partons de la somme dans le sens inverse. D'abord nous prouvons que (x,b) + p(a,x)q(x, b) 
est dans LI(E x E) en étudiant les intégrales en chaine : 


[ ([ Ip(a, x)a(æ, b)dm(b) }dm(x) = [ p(a, x) ( [ d(x,bdm(b) }dm(æ) (38.123) 


= [re x)dm(x) (38.12b) 
— À. (38.12c) 


Donc la fonction est LI(E x E) et nous pouvons fusionner et permuter les intégrales à volonté. 
Nous avons alors 


i= [ ( [ Ip(a, æ)a(æ, b)ldm(b)dm(a) (38.13a) 
- J ne Date bte à (38.13b) 
EXE 


s k ( [ (a, æ)a(e,b)dm(a) )dm(b). (38.13) 


38.1.1 Matrice stochastique 


DefGJEBooZvulAV 


Définition 38.9. 
Une matrice dont tous les éléments sont positifs ou nuls et dont la somme de chaque ligne vaut 1 
est une matrice stochastique. 


Notons que l’ensemble des matrices stochastiques est un fermé dans l’ensemble des matrices. 


Exemple 38.10. 
Nous considérons une fourmi qui se déplace dans un appartement à trois pièces À, B, C'. Supposons 
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qu’à chaque minute, elle a une probabilité 1/3 de rester dans la pièce et une probabilité 2/3 de se 
déplacer. Le plan de l’appartement est 


FRE: Te. (38.14) 


De la pièce À il est donc uniquement possible d’aller vers la pièce B : de la B il est possible d’aller 
en À et en C et de la C'il est uniquement possible d’aller en B. 
La matrice de transition de cette chaine de Markov est 


1/5 273 0 
O= | 1/3 1/3 1/3 (38.15) 
0 2/3 1/3 
As 
38.2 Chaînes de Markov sur un ensemble fini 
Définition 38.11. 
Une chaine de Markov est finie si l’ensemble E dans lequel elle prend ses valeurs est fini. 
PROBooNEMXooLbPpIN 


ii Avertissement /question à la lectrice !! 38.12 
Je ne suis pas totalement certain du lemme suivant (38.13). Soyez prudente, et écrivez-mot si vous 
avez une démonstration ou un contre-exemple. 


Le lemme 38./2 donne une partie de la preuve, je crois. 
LEMooYKFZooUEOWbi 


Lemme 38.13. 
Une matrice est stochastique si et seulement si elle est la matrice de transition d’une chaine de 
Markov sur un ensemble fini. 


Définition 38.14. 
Soit une matrice stochastique p. Une loi stationnaire pour p est un vecteur u tel que 


(1) = uP, 
(2) uj > 0 pour tout j, 


(3) Dati = 1. 


Lorsque nous parlons d’une chaine de Markov sur un ensemble fini FE, la matrice stochastique 
est indexée par les éléments de E, et, par exemple, la condition u = uP s'écrit 


bij = D bipis (38.16) 
icE 


pour tout j € E. 
Notez que dans ce cas si À € E, nous pouvons définir g(A) = ÿ,-1u. Cette application y est 


alors une mesure positive ° sur E£. 
DEFooGKRQooFNuwRm 


Définition 38.15 ([758]). 
Une chaine de Markov est irréductible si pour tout x,y € E, il existe n tel que p(x,y) > 0 où 


px, y) = P(Xh = y|Xo = x). (38.17) 


Le nombre n peut dépendre de x et y. 
Une chaine de Markov finie est régulière si il existe un n € N tel que P" a uniquement des 
éléments strictement positifs. 


4. Matrice stochastique, définition 38.9. 
5. Définition 14.18. 


38.2. 
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PropUMPpOHW 


Proposition 38.16 ([759]). 
Soit une chaine de Markov irréductiblef finie. Alors il existe une unique loi stationnaire rx et de 
plus nous avons m; > 0 pour tout état i de E. 


Je crois que pour prouver ça, il faut utiliser le théorème de Perron-Frobenius 10.105. 


Théorème 38.17 ([758]). 
Soit P la matrice de transition d’une chaine de Markov régulière" sur un ensemble E de cardinal 
N. Alors il existe des nombres m1,...,7n tels que 


(1) 
(2) 
(3) 


Ti > 0 pour tout i =1,...,N 
Ti+-.+AmN = li 


T1 72 ... TN 
lin PPS) SE 2 : (38.18) 
a he : 
1 A2 ... AN 
De plus le vecteur ñ = (m1,...,7nN) est l’unique solution de 
FP = 7. (38.19) 


Démonstration. Si la chaine n’a qu’un seul état c’est évident parce que la probabilité de transition 
est toujours 1; fin de l’histoire. 


(1) 


Hypothèse 

Sinon nous supposons que P n’a que des éléments positifs, quitte à considérer P" au lieu de 
P. Nous notons d le plus petit élément de P; il vérifie d < ; parce que la somme des élément 
d’une ligne de la matrice P doit être égale à 1. 


Les suites min et max 


Soit x un vecteur quelconque (de composantes positives). Nous notons mo = min{x;} et 
Mo = max{x;}. Etant donné que les éléments du vecteur Px sont des moyennes pondérées 
des éléments de x, si nous posons 


mx = min{(Péx);}i1.N (38.20a) 
My = max{(Px);}i 1, (38.20b) 


la suite (mx) est croissante et la suite (M4) est décroissante. 


Stricte croissance et décroissance 


Si Mys1 — My, alors toutes les composantes de P*x sont égales à My et le théorème est 
prouvé. Cela est encore une propriété de la moyenne. Même remarque pour la suite (mx). 
Nous pouvons donc supposer que la suite (mx) est strictement croissante et que la suite (M3) 
est strictement décroissante. Elles sont toutes les deux bornées dans [mo, Mo]. Le lemme 10.35 
nous donne la convergence. 


Égalité des limites 


Vu que les éléments de P*x ne sont pas tous les mêmes et s’étalent de mx à My, pour 
majorer My+1 nous mettons le plus petit coefficient possible (c’est-à-dire d) devant my et 
nous supposons que toutes les autres composantes sont M4; nous avons alors 


My+1 < dmx + (1 — d) Me (38.21) 


parce que tous les autres coefficients de la ligne contenant le d (dans PF) sont plus petits ou 
égaux à 1 — d. De la même façon nous avons la minoration 


mr+1 > dMx + (1 — d)mg. (38.22) 


6. Définition 38.15. 
7. Définition 38.15. 
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En faisant la différence, et en nous souvenant que 0 < 1 — 24 < 1, 
Mi — Mer (1 Æ 24d)(My# = Mk), (38.23) 


ce qui signifie que 
My — Mr (1 _ 24)" (Mo Fe mo); (38.24) 
et donc que les deux limites sont égales. 


(5) Conclusion pour la limite 


Pour tout vecteur x, la suite Pkx tend vers un vecteur dont toutes les composantes sont 
égales. En particulier pour le vecteur e; de la base canonique, 


Ti 
Phe; = | : |. (38.25) 

Ti 
Mais Pfe; est la i° colonne de la matrice PF. Cela prouve la convergence annoncée PF — II. 
Réglons rapidement le cas des deux autres allégations du théorème. D'abord les matrices P* 
sont toutes des matrices stochastiques ; et l’ensemble des matrices stochastiques est fermé, donc 
la convergence se fait à l’intérieur de l’ensemble des matrices stochastiques. Cela prouve que T1 + 

..+TN=l. 


Ensuite la suite (mx) étant strictement croissante et mo étant égal à 0 dans le cas de e; nous 
avons toujours 7; > 0 (strictement). 


38.2.1 Graphe de transition 


Le graphe de transition d’une chaine de Markov est le graphe dont les sommets sont les 
éléments de l’espace des états de la chaïne et dont les sommets sont reliés par des arêtes pondérées 
par la probabilité de transition correspondante. 


Lemme 38.18. 
Une chaine de Markov homogène est irréductible si et seulement si son graphe de transition est 
connexe. 


Démonstration. Pour chaque couple (x, y) € E? nous avons 
p"(x,y) = >» PÜXn = Y, Xn-1 = 2n-1,..., À1 = 4, X0 = &) 
zeE 


(38.26) 
= D pzn-1,Y)p(en-2, 2n-1) p(as, 22)p(x, 41). 


La positivité d’un des termes de la somme signifie que le graphe est connexe tandis que la positivité 
de p"(x, y) signifie que la chaine est irréductible. 


38.2.2 Nombre de visites 


La fonction 
1 nm 
= ls (38.27) 
k=1 


est la fréquence empirique de la chaine de Markov. 
Soit x un état récurrent, c’est-à-dire que P(T(x) < w|X9 = x) = 1. Nous classons les visites 


: ubEq$sDefTirectempsreto 
de la façon suivante : è L F 
Ti(x) 


T(x) = inf{k > 1 tel que X4 = x} 
Dix) = i 


) 
inf{k > 1 tel que X7,(x)4r = T} 


Th(x) = inf{k > 1 tel que X7,,_ (x)+k = T} (38.28d 
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La variable aléatoire T; représente le temps entre la visite numéro à — 1 et la visite numéro à (si 
X0 # x, sinon il faut décaler). Nous définissons l'instant la visite numéro n : 


Sn = > Ti(x). (38.29) 
k=1 


Lemme 38.19. 
Les variables aléatoires T; sont indépendantes. 


Démonstration. Nous choisissons n des T; et nous calculons la probabilité 


à = PT = Ki Ta = ho, Ti 


= kn) (38.30) 


OÙ nous SUPpoOsOns 1 > 42 >... > in. Nous décomposons cette probabilité en sommant sur toutes 
les histoires de la chaine de Markov compatibles avec les nombres k; donnés : 


d— }, PL) (38.31) 
{25} 
compatibles 

Notons qu'ici, le numéro du dernier terme de la somme n’est pas certain parce que tous les T; 
ne sont pas fixés. Nous l’avons noté N, mais en réalité il est différent d’un terme à l’autre de la 
somme. Il est certain que 24 = x et 28-47, = x et si N — k; < j < N, alors 2; # x. Cela est 
simplement le fait que nous demandions aux z; de respecter les conditions données par les k;. Nous 
avons 


A= D PXn= 2, Xi; N—-h<j<N|X;=2,j<N-—MH)P(X; = 25,5 <N —k) 
{25} 
(38.32a) 
= P(Xn = 2,X; = 2;,N ki <j<N|\XN-&, = z)P(X; = 2, < N —- ki) (38.32b) 
} 


{35 


(38.32c) 


Le premier facteur est P(T;, — ki) tandis que le second facteur est précisément P(T;, = k;,j > 1). 
Nous avons donc montré que 


PE au kr; Ti bei his — kn) — P(T, k1) P(T:, = k;,3 > D}, (38.33) 


n 


et donc les T; sont indépendants. 


DEFooDWLAooINqgep 
Définition 38.20 (Temps de première atteinte). 
Soit (X%) une chaine de Markov dont l’espace des états est noté E. Pour chaque x € E nous notons 


T(x) = inf{k > 1 tel que Xx = x}. (38.34) 


Ce nombre est le temps de première atteinte de l’état x. 
Si Xo = x, alors T(x) est le temps de retour en x. Si pe N nous notons 


Th(x) = inf{k > 1 tel que Xz49 = t} (38.35) 


C’est le temps mis pour atteindre x à partir de l'instant p. 
Lembyftks 


Lemme 38.21. 
Soit (XZ) une chaine de Markov dont l’espace des états est noté E. Pour chaque x € E nous 
considérons les temps de premier atteinte® T et T,. Alors nous avons 


P(T(e) = kIX, = y) = P(T(æ) = HXo = 4). (38.36) 


8. Définition 38.20. 
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Remarque 38.22. 
La loi des grands nombres est encore vraie sans l'hypothèse de variables aléatoires dans L! pourvu 
qu’elles soient positives. Alors dans la conclusion de la loi nous devons accepter la possibilité que 


l'espérance soit infinie. 
PropMrkIirreLoishLCkpjkptXk 


Proposition 38.28. 
Soit (Xh) est une chaine de Markov irréductible. Nous notons T le temps de première atteinte ° 
Alors 
(1) Six est un état récurrent, alors T(X) < © presque surement. 
(2) Nous avons une égalité entre les lois 
20 -0)r (0) 2 ) L 7 (XÉPRR ET; reLoisLOkpSKpEXE Trent 
DefWknULk 
Définition 38.24. 
Un état x est récurrent si P(T(x) = w|X0 = x) = 0, c’est-à-dire si la probabilité de ne jamais 
retourner en x lorsqu'on y est passé est nulle. L'état x est transient ou transitoire dans le cas 
contraire. 
Six est un état récurrent, et si E(T(x)|Xo = x) < ©, nous disons que x est récurrent positif. 
Si E(T(x)|Xo = x) = © alors nous disons que est récurrent nul. 


38.2.3 Récurrent et transient 
DEFooPVHHooBkIDpW 


Définition 38.25. 
Nous introduisons une variable aléatoire qui compte le nombre de fois que la chaine de Markov 
passe par l’état x : 


O0 
de Epetnn 
k=0 


C’est une variable aléatoire à valeurs dans N L {oo}. 
PropEquivEPrecuequiv 


Proposition 38.26. 
Les deux propriétés suivantes sont équivalentes à dire que x est récurrent !0 : 


(1) PÜNs <@|Xo= #)= 0 
(2) E(Nz|X0 = x) = 00. 
Les deux propriétés suivantes sont équivalentes à dire que x est transient : ItemiMnGpD 
CL) PIN, Sole 1 
(2) E(N|X0 = x) < ©. 


Démonstration. En tant que événements, nous avons l'égalité 


Ns < 00 = [J{Xn = 2, Xuux # aVk > 1}. (38.39) 
neN En 

Nous avons donc | 

P(N, < ©|Xo = x) = Ÿ P(FilXo = x), Fareprencal nat) 
n=0 
et 

PF |Xo = 2) = Pur a, VE > 1, Xi = xl Xo = #) (38.41) 
Pare Né == PIX, = 2 X6e 6) (38.41b) 
PIX des h= 1x =pP = 5 en ET) 
= P(Xx 2 x, k > 1]Xo = 2) P(Xn = xlXo = &) SUbEQPE ER a qE) 
= P(T(x) = o|X0 = r)P(X4 = 2|X0 = x) SUPEQPFRREREQRT TT 


9. Définition 38.20. 
10. La variable aléatoire N, est définie par 38.25. 
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Justifications : 
(1) Pour (38.41c), nous utilisons le fait que la chaine soit « sans mémoire ». 
(2) Pour (38.414), nous utilisons le fait que la chaine soit homogène. 


(3) Pour (38.41e), l'événement X, £ x pour tout k > 1 est exactement l'événement T(x) = 0. 


En nous servant de la proposition 14.301 (théorème de Fubini et mesure de comptage), nous 
; : : ..  EqPEEEntstq 
permutons l’espérance et la somme dans l’expression | 
00 00 
D PXa=alXo =) = Ÿ Elie. Xo =) (38.42a) 
n=0 n=0 
Le] 
= E(S Lx, X0 = 2) (38.42b) 
n=0 
= E(N:|X0 = x). (38.42c) 


Voyons ce passage plus en détail. D’abord, en général nous avons 


E(Y|X = %0) = La Y(w)dP(w) = [ Lx=x0}(w)Y (w)dP(w). (38.43) 
Dans notre cas, 
E(lix, | Xo = x) = [ 1xo=x(w)1{x, 27} (w)dP(w). (38.44) 


La fonction qui correspond à la proposiiton 14.301 est 


Jnw) = fn(w) = Éxo(u),r0Xn(w),2 (38.45) 


qui est bien une fonction positive et mesurable. 
Nous reprenons à présent le calcul (38.40) en remplaçant les éléments par leurs valeurs que 
nous avons calculées : 


P(Nx < ©|Xo = x) = P(T(x) = |Xo = x) E(N;|Xo = x). FqPnxNerg ae 


Si x est récurrent, nous avons P (T(x) = ©|X0 = x) = (, mais la relation (38.46) ne permet pas de 
conclure que le membre de gauche est nul parce qu’il reste la possibilité que E(N,|X0 = x) = ©. 
Nous devons donc faire un pas en arrière et écrire cette espérance comme la limite des sommes 
partielles : 


N 
dim D PTE) = 0] X5 = z)P(Xh = x|Xo = x) = 0 (38.47) 
parce que tous les termes de la suite des sommes partielles sont nuls. Nous avons donc bien que 
P(Nx < ©|X0 = x) = 0. Il s’ensuit immédiatement que E(N,|X0 = x) = 1. 

Nous devons maintenant démontrer l'implication inverse. Supposons que P(N; < w|X0 = 
x) = 0. Dans ce cas nous avons immédiatement P(N,; = ©|X0 = x) = 1 et E(N;|X0 = x) = ©. 
L'équation (38.46) nous indique alors que 


P(T(x) = ©|Xo = x) = 0, (38.48) 


c’est-à-dire que x est récurrent. 


38.2.4 Chaînes irréductibles 


Proposition 38.27. 
Soit (X,) une chaine de Markov irréductible. 


Proptoustanstousrecirrsi 


(1) Un état x est récurrent si et seulement si tous les états sont récurrents. 
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(2) Un état x est transient si et seulement si tous les états sont transients. 


Démonstration. Soient x et y des états de la chaine de Markov. Nous devons tester la valeur de 
P(Xn = Y|Xo = y). Afin d'exploiter l'hypothèse d’irréductibilité, nous considérons r,s € NN tels 
que 


p'Ce, y) > 0 (38.49a) 
p°(y,x) > 0 (38.49b) 


et nous minorons en passant par quelques intermédiaires : 


P(Xnrres = YIX0 = y) > P(Xnirts = Y, Xnts = 2, X4 = 2|X0 = y) (38.50a) 
= Phi Ven = 6% 0) (38.50b) 
P(Xnts t|Xs x, X0 y)P(Xs _ z|X0 — y). 


Les deux premiers facteurs se calculent en utilisant la propriété de Markov et l’homogénéité de la 
chaine. Pour le premier, 


PIX = =, = PA = nl = 4) PO =1X0 2). (38.51) 
Nous avons donc 


D P(Xuvres = ylXo = 9) > p'(e,y)p y) D P(Xn = alXo= 2) US 


neN neN 


En réutilisant Fubini, avec la mesure de comptage, nous permutons somme et probabilité !! comme 
ceci : 
D P(Xntrts = ylXo = y) > KE(Ne|Xo = %) (38.53) 
neN 
où K est une constante strictement positive, par hypothèse d’irréductibilité de la chaine de Markov. 
Si x est un état récurrent, alors le membre de gauche est infini par la proposition 38.26 et donc 


» P(Xntr+s — yIXo … y) = ©. (38.54) 
neN 


Aux r + s premiers termes près (qui ne changent pas la somme), nous avons 


D P(Xn = ylXo = y) = æ, (38.55) 
neN 


ce qui signifie que y est récurrent. 


Nous rappelons l? que T(x) est le temps de première atteinte de l’état x. Nous notons 


F(t) = - : East 


E(T(x) LXo = œ) 


Étant donné que T(x) est un entier positif ou nul nous avons E (T(x)|Xo = x) € [1,00] et donc 
n(x) € [0,1]. 

Si x est un état transient, alors T(x) = © lorsque X0 = x et donc E(T(x)|Xo = x) = 0 et 
r(x) = 0. Si x est récurrent par contre, P(T(x) < w|X6 = x) = 1 et il n’y à pas de garanties sur 
la valeur de E(T(x)|Xo = x). 

CorLhpRsk 
Corolaire 38.28. 
Un état récurrent est récurrent positif si et seulement si n(x) > 0. Un état récurrent est récurrent 
nul si et seulement si n(x) = 0. 


11. Un autre exemple de telle utilisation dans (38.42). 
12. Définition 38.20. 
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Démonstration. C’est la formule (38.56). 


Propj0jDux 
Proposition 38.29. 
Si (X»n) est une chaine de Markov irréductible et si x € E alors 


r( pee D le … FqPiEndenpropEgpEen 


n— 20 n 


presque surement. 


Démonstration. Étant donné que la chaine est irréductible, les états sont soit tous transient soit 
tous récurrents par la proposition 38.27. Nous commençons par considérer que x est transient. 
En comparant la définition (38.38) de N, et le membre de droite de (38.57), nous avons pour 


chaque n l'inégalité 
1 Eqgkkueusnfra 
DAT 3 < EU). RES) 


Dans le cas d’un élément transient, nous avons (x) = 0, donc il serait bon de montrer que 
E(Nx) < ©, de sorte que prendre la limite n — dans (38.58) donne zéro. 
Nous décomposons le calcul en deux morceaux : 


E(N>) = E(N.ÎT(x) = ©) P(T(x) = ©) + E(N;IT (x) < ©) P(T(x) < oo). (38.59) 


Le fait que le premier terme soit fini découle immédiatement du fait que T(x) = © implique X4 # x 
pour tout k > 1. Dans ce cas l’espérance de N, est évidemment finie. 
Pour le second terme nous avons 


E(NIT(x) < co) = E( D 1x, = IT (x) < æ) (38.60a) 
k=0 


18 


E(Lix,=}|T (x) < 00). (38.60b) 
k 


1 


Pour inverser la somme et l’espérance, nous avons utilisé le théorème de Fubini-Tonelli qui est 
encore valable pour des fonctions qui prennent la valeur ©. Le fait d’inverser ne signifie pas que 
ni la somme ni l'intégrale soit finie. D'ailleurs c’est exactement ce que nous sommes en train de 
déterminer. 

Étant donné que nous voulons seulement savoir si cette somme est finie ou non, nous pouvons 
nous restreindre à la somme depuis k = 1 et oublier le premier terme. D'autre part nous avons 


00 we] 
k=1 j=0 
parce que les T(x) premiers termes sont par définition nuls. Nous regardons donc 


> sur) et) = : P(XjiTt) = t|T(x) < ©) (38.62a) 


j=0 
: D P(X; _ ae, : 2) subeqsumkPX)Krsegti 
j 


= D E(lix,-23lXo = ©) (38.62c) 
j 
= E(S 1x;=lXo = 7) (38.624) 
j 
= E(N;|X0 = x) (38.62e) 
< 00 parce que x est transient. 


(38.62f) 
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L'équation (38.62b) provient de la proposition 38.23 et plus précisément de l'égalité entre les lois 
(38.37). Nous avons terminé la preuve dans le cas où x est transient. 

Nous passons maintenant au cas où æ est récurrent, c’est-à-dire P(T(x) < &]X0 = x) = 1. 
Les variables aléatoires T; définies en (38.28) pour à > 2 sont indépendantes et identiquement 
distribuées et 


(Tir) = LT Xo= Ex). (38.63) 
La loi des grands nombres nous indique que PE. 
Sn : Tifx) 1 L _. 
- =. D T(x) SE (D(x)) (38.64a) 


= ET) e 7): (38.64b) 
Nous posons pour m € N 


n(m) = . Lx, =7) Fqpennns nat 
j=1 


qui est le nombre de visites de x avant l’instant m. Nous avons évidemment n(m) < m. Mais $, 
est l’instant de la nième visite, par conséquent 5,(,,) est l'instant de la dernière visite avant le 
moment m. Pour tout m nous avons les inégalités 


Pate) <Mm < Safe) 1: (38.66) 


Nous divisons par n(m) et nous effectuons la limite m — 0 : 


Sn(m) L mm Sata) + À Eqdrenb£nn 


n(m) n(m) n(m) 


En ce qui concerne la limite de n(m), nous utilisons la définition (38.65) : 


m O0 
lim nm) = lim D Lxieo) = D L{xi=e) 5 00 (38.68) 
n=1l j=1 


par la proposition 38.26. Plus précisément, la limite vaut N,; qui vaut presque surement © dans le 
cas où x est récurrent. Par ailleurs la loi des grands nombres (38.64) nous enseigne en particulier 
que 

Sntm) ps, E(T(x)|Xo = x) (38.69) 
Le terme de droite dans (38.67) se traite de façon usuelle : 


Sn(m)+1 _ On(m)+1 Nm) +1 
n(m) n(m) +1 n(m) 


(38.70) 


Le dernier facteur tend vers 1 et le tout a pour limite Æ (T(x)|X0 — B). Par conséquent nous avons 


=] PS E(T(x)|Xo = x) (38.71) 
et à) 
n(m ie 1 
— Lx — = T(x). 38.72 
n m 2 Hbeal E(T(x)|Xo = æ) e 


La proposition suivante nous permet de parler de chaine de Markov récurrence positive. 
PropUyLCzp 
Proposition 38.30. 
Soit (x») une chaine de Markov irréductible. 
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(1) Un état x est transient si et seulement si tous les états sont transients. 


(2) Un état est récurrent positif si et seulement si tous les états sont récurrents positifs. 


Démonstration. Nous rappelons (proposition 38.29) que si la chaine est irréductible 
oi Eatqs 
a = Em . > TX, =x] : j 


Notons aussi que 


N . 
0 si N <T{(x) 
Î1x,=x = NT . (38.74) 
> : du (æ) IlXure=z SN> Ti) 


où dans la seconde ligne nous avons effectué le changement de variable de sommation k’ = k+T(x). 
Dans la limite (38.73) nous sommes toujours dans le cas où N est assez grand. Nous pouvons donc 
écrire 


N-T(x) 
Nous pouvons aussi écrire 
N-T(x) 
N 1 
: Lruirç=s = N=T@N à Lx (38.76) 
=0 = 


Dans cette dernière égalité le membre de droite tend vers x(x) et nous avons 


(x) 


1 
M NT T(x > lXiirçy=e = T() (38.77) 
ou encore 
1 N 
Lu N 2 TX ir(e)=T = (x) (38.78) 


Étant donné que (x) est une constante nous avons évidemment E(n(x)) = r(x). Nous pouvons 
cependant considérer les variables aléatoires 


1 nm 
Zn = = les (38.79) 


et remarquer que Z, 2 (x) avec 0 < Z, < 1. Le théorème de la convergence dominée (14.200) 
nous permet d’inverser la limite et l’espérance et écrire 


an 
rx) = Jim = > E(Ixs,rç=x) (38.80a) 
k= 
1h 7. 
= Jim = 2 P(Xx4T() = ©). (38.80b) 


Par le lemme 38.21 nous avons 
P(X&+T(x) +) = PL = EX 7) (38.81) 


et r(x) prend la forme 


n(x) = lim — D PA ==). FEES 


n—o0 n 


Soit maintenant un état x positif récurrent et y, un autre état. Par définition 38.24 et par 
corolaire 38.28 nous avons r(x) > 0. Nous devons prouver que r(y) > 0. 
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Étant donné que la chaine est irréductible il existe r et s tels que 


p'ag) = P(X, = lo = 2) > 0 (38.83a) 
nisu)= Pix. = 34% 1) 0 (38.83b) 


Nous reprenons l'équation (38.52) multipliée par 1/N : 


N N 
1 1 
K Di PXoasanyxo=y) > pe y)p(u,2) + D P(X = | Xo = 5) (38.84) 
n=1l Y n=1l 
Z>0 Lan, nn ”/ 


—T(x) 


et nous prenons la limite lorsque N — 0. À r + s termes près, nous trouvons à gauche l'expression 
(38.82) de x(y). Par conséquent 


N 
(y) Z im = > P(Xr+s4n S y|X0 Te y) Z ar (x) (38.85) 


n=1 


où « est une constante positive. Le nombre r(x) étant strictement positif par hypothèse nous avons 
montré que (y) > 0, c’est-à-dire que y est récurrent positif. 


38.2.5 Périodique et irréductible 


Nous voudrions savoir sous quelles conditions la variable aléatoire X, converge en loi vers 
quelque chose lorsque n — 00. Une telle loi limite doit dépendre de la loi initiale * comme le 
montre l’exemple de la chaine de Markov 


CA 0 5" à (38.86) 
Si Xo = C, alors la loi limite est 
1 
7 (6 + ô8). (38.87) 


Si par contre Xp = B, la loi limite est ôg. Notons que la chaine de Markov proposée ici est 
irréductible. 
Notons qu’il n’y a pas toujours de lois limite comme le montre l’exemple 


AZ *B (38.88) 


1 


avec Xo = À. La loi en est 


= (38.89) 


0A sikest pair 
À = . ue 
Op sik est impair. 


Lemme 38.31. 
Si nous avons une loi limite 


E 
P(Xn = x) — Ua), RS 
et que la chaine est irréductible, alors nous avons l = T. 


Démonstration. D'après la proposition 38.29 nous avons 


. ; ÉD = rt) (38.91) 


13. Lorsque la loi limite ne dépend pas de la loi initiale, nous disons que la chaine de Markov est ergodique, nous 
y reviendrons. 
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Par le lemme 11.129 sur la moyenne de Cesàro et l’hypothèse (38.90), nous avons aussi 


31 


: P(Xx = x) — (x). (38.92) 
k=1 


Du coup r(x) = {(x). 


Lemme 38.32 ([759]). 
Si x est une loi stationnaire et si x est un étant transient, alors m(x) = 0. 


Ce lemme (qui peut être prouvé rigoureusement) est principalement dû au fait que la chaine 
de Markov ne visite un état transitoire qu’un nombre fini de fois par la proposition 38.26(1). 
DefCxvOaT 
Définition 38.33. 
Un état x € E est apériodique si 


pagcd{n > 1 tel que p'(x,x) > 0} = 1. (38.93) 


Mettons que tous les n tels que p'(x,x) > 0 ont 2 comme diviseur. L'état n’est alors pas 
apériodique, mais on voit que si Xo = x, alors les états impairs ne peuvent pas être sur x. Cela est 
une forme de périodicité. 

Si un état est apériodique, il existe r et s premiers entre eux tels que p’(x,x) et p°(x,x) sont non 
nuls. En particulier pour tout n € rN + SN, P(Xh = x) # 0. Par conséquent la proposition 1.255 
nous indique qu’à partir d’un certain moment tous les XX pourraient être x. 

L'état C de la chaine de Markov suivante est apériodique : 


1 
ee —. 1) 
2/3 
NA 
C 
En effet p°(C,C') Z 0 par le chemin € — À — B — C' tandis que p°(C,C) Z 0 également par le 
chemin C — A— B— A B — C. Or pgcd{3,5} = 1. 


A (38.94) 


PropsaUyssS 
Proposition 38.34 ([759]). 
Soit (Xn), une chaine de Markov irréductible. Un état x est apériodique si et seulement si il existe 
N tel que 
p'(x,x) = P(Xy = x|X0 = x) > 0 (38.95) 
pour tout k > N. 
DEFooBNBVooBuWQqi 
Proposition-Définition 38.35. 
Si une chaine de Markov est irréductible, alors un état est apériodique si et seulement si tous les 
états sont apériodiques. 
Dans ce cas nous disons que la chaine est apériodique. 


Démonstration. Soit x un état apériodique de la chaine de Markov (X»)nen. En vertu de la pro- 
position 38.34 il existe N, tel que pl(x,x) # 0 pour tout & > N,. Soit ye E. Étant donné que la 
chaine est irréductible, il existe r et s tels que p'(x,y) > 0 et p°(y,x) > 0. Nous avons 


PTS (y, y) = P(Xk4rts = YIXo = y) > p'(a, y)P(Xx = xl Xo = æ)p'(y, æ). (38.96) 


Si k est assez grand, cette quantité est strictement positive. Donc il suffit de prendre N,, = N;+r+s 
pour savoir que y est également apériodique. 


Exemple 38.36. 
Quelle est la différence entre une chaine irréductible et une chaine apériodique ? Une chaïne est 
irréductible lorsque aucune sous-chaine ne peut piéger le système. Pour toute paire d'états x,y € E, 
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il existe un n tel qu’il soit possible d’aller de x à y en n pas. Une chaine est apériodique lorsqu’après 
un temps suffisamment long, tous les états soient possibles en même temps. 
Un exemple de chaine irréductible non apériodique : 


AT DB (38.97) 
1 


Cette chaine est irréductible parce que le graphe est connexe, par contre il n’est pas apériodique 
parce que si Xo = À il n’est pas possible d’être dans l’état À après un nombre impair de pas. 
Plus formellement, p”(A, A) = 1 dès que n est pair ; le PGCD de la définition 38.33 n’est donc 


certainement pas 1. VA 
ThoQSuLZoz 


Théorème 38.37 ([759]). 
Si (Xh) est une chaine de Markov finie, irréductible * et apériodique © de loi stationnaire x, alors 


(1) La suite de matrices stochastiques p* converge vers la matrice 
pt —I=|:|. (38.98) 


(2) Nous avons convergence des variables aléatoires au sens où 


P(Xy = pp) = 7. (38.99) 


38.3 Marche aléatoire sur Z 


Soit (Y,) une suite de variables aléatoires indépendantes et identiquement distribuées valant 
—1 avec une probabilité p et 1 avec une probabilité (1 — p). La loi est 


Yn = pô1 + (1 — pô. (38.100) 


Nous considérons la variable aléatoire 


nm 
Xn = Xo+D Y (38.101) 
i=1 


où X9 est une variable aléatoire indépendante des Y; à valeurs dans Z. Nous vérifions à présent 
que X, est une chaine de Markov avec comme espace d’états E = Z. Nous devons montrer que 


Paule = tr oem) = Po mulx, = 0). PR EETO) 


Pour ce faire nous allons exprimer tout cela en termes des Y; au lieu des X;. D’abord étant donné 
que nous avons égalité des événements 


{Xn+1 — AS D [A] {X» = Tns...  X0 — xo} — Vori = Ln+1 — 0 [A] {Xy = Lns...  X0 — xo}, 
(38.103) 
nous pouvons, en vertu du principe (36.78), remplacer Xh+1 = Æn+1 Par Yn+1 = Zn+1 — Tn dans 
le membre de gauche de (38.102). Nous avons donc déjà 


PA = Ta] Xn = Ts. XO — to) = PP — Ln+1 — En | Xn = Ts. XO — to ). 
| 
A B 
(38.104) 


14. Irréductible, définition 38.15. 
15. Définition 38.35. 
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L'événement B est égal à l'événement 
{X0 _ To, Yi = T1 — xo; Ÿ2 — 22 — L1,... Yn — Ln — RE (38.105) 
qui n’est autre que l’ensemble 


Xi (x) n mon... NY an — Tn1) (38.106) 


n 


qui est dans la tribu engendrée par les variables aléatoires X0,(Y;i);=1..n. Le point délicat du 
raisonnement est de montrer que les événements À et B donnés par 


À = ar = Ln+1 — Di (38.107a) 
B={Xo=z}n (KV =xi-x} (38.107b) 
i=1 


sont indépendants. Nous ne pouvons pas montrer directement que P(A n B) = P(A)P(B) parce 
que cela est la formule que nous voulons utiliser pour montrer que la chaine est de Markov. Nous 


; subesqgsÂBtribsYYXzY 
passons donc par les tribus : | Le 


A € o(Yn+1) (38.108a) 
Beo(xri Mi: V). (38.108b) 


Nous utilisons maintenant l'hypothèse d'indépendance des variables aléatoires X9 et Y; pour 
conclure que les deux tribus des équations (38.108) sont indépendantes. Les événements A et 
B sont par conséquent indépendants. 

L'événement À est indépendant de l'événement {X, = x,}. Nous avons donc successivement 


PL = En An = Ln,...  X0 LL To) 


= Past Storm = 0 = To) (38.109a) 
= Pot = Papi = TalY = 2% = 2562, Xo = 2%) (38.109b) 
= Par ii) cf. justif. FaERREUGS) 
= Puma alX, = 6,) cf. justif. Fa 7684) 
Pa = mai = A X, =2,) cf. justif. FAR) 
= PR AE Gal 0). (38.109f) 


Justifications : 
— (38.109c) parce que les tribus o(Y,+1) et o(Y;, Xo) sont indépendantes. 


— (38.109d) Nous avons 
An = Ent E Xi M:1::Ya) (38.110) 


tandis que 
(= mai meurs): (38.111) 


ce sont donc deux événements issus de tribus indépendantes. Donc conditionner ou non 
l’événement Yy1:1 = Tni1 — Zn à l'événement X, = x, ne change rien. 
— (38.109e) est encore l’utilisation du fait que P(A|B) = P(K|B) dès que An B = KA B. 
La chaine est par conséquent de Markov. 
La matrice de transition de cette chaine de Markov est une matrice infinie « dans tous les 
sens » : 
p siy=x—l 
p(x,y) = 4(1—-p) siy=r+1 (38.112) 


0 sinon. 
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Remarque 38.38. 
La plupart du temps lorsqu'il faut démontrer qu’une chaine est de Markov, il faut suivre la procé- 
dure que nous venons de suivre pour la marche aléatoire sur Z. 


— Ecrire tout en fonction des incréments. 


— Dire que les incréments conditionnés sont indépendants des incréments qui conditionnent 
(via les tribus engendrées). 


— Ecrire que la probabilité cherchée est égale à l’événement conditionné dans lequel on a juste 
remplacé l’incrément par sa valeur. 


— Conditionner à nouveau par rapport au dernier incrément qui est indépendant. 
— Changer la valeur du dernier incrément par la variable aléatoire. 


Dans ce raisonnement nous utilisons deux fois le fait que P(A|B) = P(K|B) ss An B=KnB. 


38.3.1 Chaînes de Markov homogènes 
PROPooYIDWooAKTVvS 


Proposition 38.39. 


Voici quelques propriétés des chaines de Markov homogènes !Ÿ. 


ITEMooSDDUooVRnpjv 
(1) La probabilité d’une trajectoire donnée est 

P(Xn = Zn; Xn-1 = Tn-1,..., X0 = To) = P(tn-1, Tn) -..P(ro, T1) P(X0 = ro) (38.113) 

où les p(x,y) sont les probabilités de transitions introduits dans la définition 2 AmooxFaTac 

(2) La probabilité de transition « en n coups » est donnée par la puissance n° de la matrice de 
transition : 

PLXÆ; — Tn|X0 — To) — Q (38.114) 

ITEMooJUEMooWXEkBO 


n 
TO ,Tn 


(3) Si l’espace des états E est fini, l'espérance d’une fonction bornée!" f: E — R de l’état est 
donnée par 


E(f(Xnt1)Xn = 2m... Xo = 20) = E(f(Xnt1)|Xn = %n) = D, F(Y)P(an,Y) (88.115) 
yeE 


pour tout To,...,%n € E. 


Pour être précis, ce que nous notons « f(Xn+1) » est la composée f o Xn+1. 


Démonstration. En plusieurs étapes. 


(1) Pour (1) Nous écrivons la formule P(A n B) = P(A|B)P(B) pour les événements À = 
{Xn nn Zn} et B = pee — Ti} : 


PR mu = ol 
PIX = Sal Xe 4 = nl...) ÀQ = to) P(Xn-1 = Tn-1,-..., ÀO — To). 


Par la propriété de Markov, le premier facteur est 
PIX == Dead it) (38.117) 


Le reste est une récurrence sur n. 


16. Définition 38.4. 
17. L'hypothèse de borne sur f n’est pas très chère parce que E est fini. Il suffit que f ne soit infinie en aucun 
point. 
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(2) Pour (2) Montrons avec n = 2. En utilisant les divers points du théorème 36.43, nous 


avons 
P(X2 = | Xo = 0) = D, P(X2 = æ, X1 = y|Xo = %o) (38.118a) 
yeE 
= D P(X2 = 2|X1 = y, Xo = 20) P(X1 = y|Xo = ro)  (38.118b) 
yeE 
= D P(X2 = 2|X1 = y)P(X1 = y|Xo = 0) (38.118c) 
yeE 
subE 
= Ÿ p(y,22)p(xo, y) BE NES) 
yeE 
0: (38.118e) 


Nous avons utilisé l’homogénéité de la chaine de Markov au moment d'écrire l’expression 
(38.118d). En principe nous aurions dû écrire p2(y, x2)p1(xo, y). 


TS 
Co 
Ses 


Pour (3) Vu que E est fini, f(E) est fini et nous notons {ax}x=1..,n l’ensemble des valeurs 
non nulles (dans R) atteintes par f. Nous utilisons le lemme 36.62 pour la variable aléatoire l° 
Jo Xn+t1: À — {0,ax}6=1,.,n : 
N 
E(f(Xn#1)|Xn = ns... > X0 _ To) = » ax P(f O Xn+1 on ak|Xn = Tps... , X0 — To). 


k=1 EQooLRZ Jon qaeN 


L'événement f o Xh11 = ag signifie Xh+1 € f (ax) ou encore 


{w € tel que Xn+1(w) € fl (ax)}. (38.120) 
Vu que E est fini, l’ensemble f—!(az) est fini et nous écrivons 
Fax) = {ye1,..., ven}. (38.121) 
Nous avons 
Nx 
{w e Q tel que Xn+1(w) € fl (ax)} = (Ut e ( tel que Xn+1(w) = Yri}. (38.122) 


i=1l 


Nous pouvons utiliser le lemme 36.45 pour décomposer 


Nx 
P(f 0 Xi = age.) = D P(Xn41 = nil.) (38.123) 
i=l 
et continuer (38.119) pas 
NM 
E(f(Xn#1)|Xn = Zn: , Xo = %0) = > ak D, P(Xn+1 = YkilXn = En... , Xo = To) 
k=1 il 
(38.124a) 
Le SUBEQooOWSUooT 
: , a », Pin = ile DES PRTTAE)) 
k=1 i=1 
N 
_ » ar P(Jf Suit = An me) (38.124c) 
k=1 
= EX) =) (38.124d) 


Pour (38.124b), nous avons utilisé la propriété de Markov. 


18. La composée de fonctions mesurables est mesurable, proposition 14.43. De plus f est mesurable parce que E 
étant dénombrable, nous y mettons la tribu de toutes les parties. 
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38.3.2 Chaîne de Markov définie par récurrence 


38.3.2.1 Le cas général 
PropqiMdHh 


Proposition 38.40. 
Soit Xo une variable aléatoire à valeurs dans E, un ensemble au plus dénombrable. Soit (Y,) une 
suite de variables aléatoires réelles indépendantes et identiquement distribuées indépendantes de 
X0. 

Soit (X) la suite de variables aléatoires à valeurs dans E définie par récurrence selon la formule 


Xn31 = GX Fit) (38.125) 


oùG:EXR—E est une fonction mesurable. Alors (Xh) est une chaine de Markov. 


Démonstration. Soient xo,...,%n+1 des éléments de E. Nous devons calculer la valeur de 
Pb == ni) (38.126) 
Commençons par préciser les espaces sur lesquels nos variable aléatoires sont définies. Nous avons 
X0: QE (38.127) 


et 
Y:Q—R. (38.128) 
La variable aléatoire X: est donnée par 
X;: Qo xQO—#E 


(wo, ur) > G(Xo(wo), Yi(w)). (38.129) 


La variable aléatoire X2 est 
Xo: Oo X Q? — E 
(wo, w1,wo) + G(X1 (wow), Ya(wo)) (38.130) 
— G(G(Xo(o);a1), Y:(u2)) 


et ainsi de suite. 
Considérons maintenant l'événement 


{X1 — æ1, X0 = xo} (es Qo x (1. (38.131) 
Il est donné explicitement par 
{X1 = 1, Xo = to} = {(wo,w1) tel que G(Xo (wo), Y1(w1)) = t1, Xo(wo) = To} (38.132a) 
— {(wp,w1) tel que Go, Yi(u1) = æ1), Xo(wo) = ÿ} (38.132b) 
= {wo € Oo tel que Xo(wo) = ro} X {wi € ( tel que G(xo, Y1(w1)) ti 
(38.132c) 


Le premier terme du produit cartésien est dans o(Xo), tandis que le second est dans o(Y1). Étant 
donné la définition des tribus produit (définition 14.124) nous avons 


{X1 = æ1, X0 = xo} E o(Xo, Y1). (38.133) 
Ce raisonnement se généralise immédiatement et nous trouvons que 


À M Basses A0 0 E CA Mine Po) (38.134) 
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Nous en sommes donc à calculer 


© on P(Xu En En41|Xn = Xn, CRC > X0 = To) (38.135a) 
. PGM) = Tn+1 [Xn = Lpyess  X0 . to ). (38.135b) 

= —_] 2° ——— 

Eo(Yn+1) €Eo(X0,Y1,.….,Yn) 
Les tribus o(Y,+1) et o(X0,Y1,..., YA) étant indépendantes nous avons 

D = P(G En a) = Eat) (38.136a) 
= P(G{an, Yas1) = Ent1|Xn = En) (STEP) 
= P(G(Xn, Yni1) = Ent] Xn = En) (38.136c) 
PER 8 =). (38.136d) 


Pour (38.136b) nous avons utilisé le fait que o(Yh+1) est indépendante de o(X,). Nous avons 
prouvé que la chaine était de Markov. 


Les probabilités de transition de la chaine de Markov définie dans la proposition 38.40 sont 


P(X1 = y|Xo = x) = P(G(Xo, 1) = ylXo = +0) = P(G(x0, 1) = y). (38.137) 
PROPooBYELooKLsthC 


Proposition 38.41 ([760]). 
Soient : 


(1) Un ensemble F, un ensemble au plus dénombrable E, 

(2) Des variables aléatoires indépendantes et identiquement distribuées Z,: Q — F, 
(3) Une variable aléatoire X5: Q — E, indépendante des Zy 

(4) Une application mesurable f: E x F — E. 


Alors la définition par récurrence 


Xn+1: Q — E 
(38.138) 
we f(Xn(w), Zn+1(w)) 
est une chaine de Markov homogène dont la matrice de transition est donnée par 
Pi = P(F(i, 22) = ÿ). (38.139) 


Démonstration. Nous commençons par construire des applications g,: E x F" — E telles que 
Xn(w) = gn(Xo(w), Z1(w),..., Zn(w)). D'abord nous posons g\ = f. Ensuite, pour la récurrence 
nous posons 

His DRE D 


: ; (38.140) 
(4, T1,... al > rl ine"eng ou): 
Nous vérifions que c’est bon : 
Qn+1(i, T1,-.. Bada) — F(gn(i, T1,... a) Bi) (38.141a) 
= f(Xn(w), Zn+1(w)) (38.141b) 
= Xh11(w). (38.141c) 


Et maintenant il faut vérifier que les X,, forment une chaine de Markov homogène. C’est un bon 
calcul, et nous commençons par une étape simple : 


R = P(Xn41 = SXn = 2n,..., Xo = 20) = P(F(Xn Zn41) = SlXn = En... , Xo = To) 
(38.142a) 


= Fa) = =. Ro = vo) GED) 
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Pour la seconde ligne, nous avons utilisé le lemme 36.46. Pour la suite, nous nous souvenons que 


Xe = g(X0,Z1,...,Zx). Nous pouvons exprimer le conditionnement de la façon suivante : 
B = {we ( tel que Xh(w) = ïn,..., Xo(w) = to} (38.143a) 
n 
= (EXx = 4} © {X0 = vo} (38.143b) 
k=1 
n 
= M {gx(Xo, 21... Zx)} n {Xo = vo} (38.143c) 
k=1 
(38.143d) 


Maintenant, en considérant l’application 


RER ETS EN 


g1(i, 1) (38.144) 
(é, (21, | , 2n)) > + ; 
CAGE En) 
nous avons 
B = {we Q tel que g(Xo(w), Z1(w),..., Zn(w)) = (t0,%1,... , En)}. (38.145) 
Nous avons 
= {fr Ba) = 1h ms. 2h fn, sl (38.146) 


) 
Le lemme 36.48 dit que les variables aléatoires f(X», Zn+1) et g(X0, Z1,..., Zn) sont indépen- 
dantes. Donc les événements f(x», Zn+1) = 3 et g(X0, Z1,..., Zn) = (To, ... , Xn) sont indépendants 
par la proposition 36.12(2). 
Nous avons donc montré que 


Pa am mi Pl Zu) 5) (38.147) 


19 


Des calculs similaires ” montrent que 


Pan =lem)= Pts. ati) (38.148) 


Nous avons donc bien une chaine de Markov. 
Nous montrons à présent que cette chaine est homogène en montrant que les probabilités de 
transitions P(X,+:1 = j|Xn = i) ne dépendent pas de n. Posons 


An = {we Q tel que f(i, Zn+1(w)) = 5}. (38.149) 


Nous voudrions prouver que P(A4,) = P(A;) pour tout n. Les variables aléatoires Z, et Z1 sont 
indépendantes et identiquement distribuées ; utilisant le lemme 36.15 avec 
gF—-E 


38.150 
sil) (88.150) 


nous voyons que les variables aléatoires f(i, Z,) et f(i, Z1) sont indépendantes et identiquement 
distribuées. Donc 


PEZA)=r=PUGA)= I) (38.151) 


et la chaine de Markov est homogène. 


19. Je n'ai pas vérifié; écrivez-moi si il y a un problème. 
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LEMooQBOIooMNbJ1V 
Lemme 38.42. 
Si P est une matrice stochastique ® N x N ainsi qu’un ensemble E de cardinal N, alors il existe 
une chaine de Markov dont la matrice de transition est P. 


Démonstration. Nous supposons que E = {1,...,N}. Si E est un ensemble quelconque, il faut 
considérer une bijection ?! w: E — {1,...,N} et écrire w(i) partout au lieu de i. 

Nous considérons des variables aléatoires Z,: ( — [0,1] indépendantes et uniformes sur [0, 1]. 
Nous considérons aussi une variable aléatoire X5: Q — E, indépendante des Z,. 

Ensuite nous construisons les variables aléatoires X, : ( — E par récurrence en posant 


j—1 
Xnn1(w) = 5 SD Pxs(u,r < Zn+1(w D Px,(u) (38.152) 
k=1 


Notons que pour j = 0, la première somme est « vide » et vaut donc zéro. La proposition 38.41 
appliquée à la fonction 


FE E x [O, 1] — E 
Gt É si DE Pa <t< Xi Pa (38.153) 
| N sit=1 


implique que les X} forment une chaine de Markov homogène dont la matrice de transition est 
donnée par 


Pij = P(f{i, 71) = j). (38.154) 
Nous calculons facilement cette probabilité : 
{fi A) = j} = {w € Q tel que f(i, Z1(w)) = 5} (38.155a) 
j-1 
= {we { tel que 2 Pr < <ù Px} (38.155b) 
= {we Q tel que Zi(w io Fès » Pl} (38.155c) 
k=1 


Vu que ZA est RHoRe sur [0,1], la probabilité de cet ensemble est la mesure de Lebesgue de 
l'intervalle Per 1 Pa, 22 1 Pl, c'est-à-dire P;;. 


38.3.2.2 Exemple : la file de réparation de machines à laver 


38.43. 
David Madore parle de file d’attente[761]. En bref, il est inexplicable qu’une file d’attente soit 
durablement longue sans s’allonger à l'infini. 


Nous considérons un magasin de réparation d’électroménager. Durant le jour n, un nombre 
aléatoire Z, de machines en panne arrivent au magasin. Une machine est réparée chaque jour 
(aucune si le magasin est vide). Nous supposons que les Z, soient indépendantes et identiquement 
distribuées, et nous posons X,,, le nombre de machines en magasin le jour n. 

La loi d'avancement de X,, est 


Xn+Zn—1 Si Xn Æ£0 
M ed nu (38.156) 
Zn si Xn = 0. 
Cela est une chaine de Markov en vertu de la proposition 38.40. Ici la fonction est 
G(x,y) = tr +y— Ll:40. (38.157) 


20. Définition 38.9. 
21. Existence par la définition 1.122 du cardinal d’un ensemble fini. 
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Les probabilités de transitions sont 


p(z,y) = 4 P(Z =0) siy=x-1 (38.158) 


pour x Æ (. 


38.4 Classification des états 


Sauf mention expresse du contraire, nous considérons toujours une chaine de Markov homogène. 
DEFooFIQUooScQDMI 


Définition 38.44. 
Un état x € E est absorbant pour la chaine (Xxn) si p(x,x) = 1. 


Il n’est pas spécialement impossible d’arriver sur un état absorbant, mais il est impossible d’en 
sortir. 


Proposition 38.45. 
En notant T le temps de première atteinte??, a loi de la variable aléatoire [T,(x)|X, = x] est la 
même que celle de la variable aléatoire [T(x)|Xo = x]. 


Démonstration. Nous devons montrer que 
PR) = ere PT (a) = Hot) (38.159) 


Cela est intuitivement évident du fait qu’une chaine de Markov soit un processus sans mémoire. 
Afin de prouver, nous allons sommer sur tous les états intermédiaires possibles : 


P(T, (x) = k|X0 = x) = P(Xpir = 2, Xp #2,..., Xp # t| Xp = &) (38.160a) 
=) Phare nie ou Al, 4) (38.160b) 
H£T 
=) Pat usa Pa =AalX,=0) (38.160c) 
. =p(a,2) 
nn (38.160d) 
Zi 
P(Xp42 = 2|Xp41 = 1, Xp = +) p(x, 2) (38.160e) 
= (38.160) 
= D pr, 2)p(a, 22)... p(zx-2, 4-1)p(zk-1, 2). (38.160g) 
Zi 


À ce point ci, nous avons éliminé toute référence à p grâce à l’homogénéité de la chaine. Nous 
pouvons refaire le calcul à l’envers pour reconstituer l'expression de départ sans le p : 


D p(æ,21)p(en, 22). p(ar-1, 28-1)p(2r-1, 2) (38.161a) 
= Per Xi Ets A0 #5) (38.161b) 
= P(T(x) = b), (38.161c) 


ce qu'il fallait obtenir. 


22. Définition 38.20. 
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Exemple 38.46. 
Soit (X,) une chaine de Markov de matrice de transition 


02 0.5 0.3 
P=|01 0.1 08|. (38.162) 
0.5 0.2 0.3 


Calculer P(X3 = 1|[X0 = 1) et P(X7 = 0|X4 = 0). 
Déterminer, si il en existe, une loi stationnaire vers laquelle converge la chaïne. 


Nous avons 
0.344 0.251 0.405 


P3= [0.283 0.307 0.41 |. (38.163) 
0.287 0.248 0.465 


La probabilité d’aller de l’état 1 à l’état 1 en trois étapes est donc 0.307. La chaine étant de Markov, 
sans mémoire, les probabilités entre les temps 4 et 7 sont les mêmes qu'entre 0 et 3. Nous avons 
alors 

P(X7 = 0|Xa = 0) = 0.344. (38.164) 


La chaine est irréductible et n’a pas d'états absorbants. PA 


Si une chaine de Markov contient r état absorbants, nous convenons de numéroter les états de 
telle sorte à mettre en premier les N — r états non absorbants. La matrice de transition s’écrit 


alors sous forme canonique : 
P— é : EQooGJVFop}l. Gus 


où Q est une matrice N — r x N —r. 
PROPooUNBDooVhXZxi 


Proposition 38.47 ([758]). 
Soit une chaine de Markov contenant des états absorbants. Nous considérons la matrice de transi- 
tion sous forme canonique. Alors 


(1) limn-00 Q" = 0. 
(2) La matrice 1 — Q est inversible et 


(1—Q) = > Q". (38.166) 


PROPooCAURooMEaxtq 
Proposition 38.48 ([758, 1]). 
Si (X;) est une chaine de Markov irréductible* sur un ensemble fini, alors pour toute partie 
AC E nous avons 
Piras 00) = lim Pa <n)=i (38.167) 


n—00 


où TA = min{k tel que Xy € A}. 


Démonstration. Soit P la matrice de transition de la chaine (X,). Nous considérons une nouvelle 
matrice stochastique 


A 
rs - Us (38.168) 


Nous considérons (Y4) la chaine de Markov construite par le lemme 38.42 à partir de la matrice 
P, ainsi que (Y}) celle construite à partir de P’. 

Les chaines X et Y ont la même matrice de transition, mais l’intérêt de Y est d’être définie 
sur le même espace que Y”. Nous allons procéder de la façon suivante : 


23. C’est à dire sous la forme (38.165). 
24. Chaine de Markov irréductible, définition 38.15. 
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(1) Prouver le résultat sur Y” 
(2) Le déduire pour Ÿ parce que T4 ne change pas entre Y” et Y. 


(3) Le déduire pour X parce que la matrice de transition de X et Y sont les mêmes. 


Pour la suite, voir [758] en utilisant la proposition 38.47. 


38.5 Mesure invariante 


Définition 38.49. 
Une mesure de probabilité | sur l’espace des états E d’une chaine de Markov est invariante si 
pour tout x e E 


(x) = D pu, r)u(y). (38.169) 
yeE 


Remarque 38.50. 
Une mesure invariante est une mesure de probabilité et nous noterons par abus (x) pour u({x}). 
Si AC E nous avons 


u(A) = Ÿ au(x). (38.170) 


RemwcRRFZ 
Remarque 38.51. 
Une loi invariante associée à une chaine de Markov est une loi associée à la matrice de transition 
de la chaine, mais pas à la loi de Xo. Par conséquent nous pouvons tester si 4 est une mesure 
invariante pour une certaine chaine de Markov (X%) en considérant la chaine (Ÿ%) avec Y4 = X4 
pour k > 0 et Yo arbitraire. 


L’adjectif invariant provient du lemme suivant. 
LemUVMwbM 


Lemme 38.52. 
Soit (X,) une chaine de Markov homogène * telle que X9 — 1 où pu est une mesure invariante sur 
l’espace des états. Alors Xy% — u pour tout k. 


Démonstration. Par hypothèse, P(X0 = x) = (x). Ensuite nous avons 


P(Xi = y) = Ÿ, P(X = ylX0 = z)P(Xo = 2) (38.171a) 
xeE 

= D p(x,y)u(x) (38.171b) 

= (y). (38.171c) 


Par conséquent X, suit également la loi 1. Par récurrence tous les états suivent cette même loi. 


Définition 38.53. 
Si les états d’une chaine de Markov ont comme loi une mesure invariante, alors nous disons que 


la chaine est stationnaire. 
RemcOEy1F 


Remarque 38.54. 
Pour une chaine de Markov stationnaire de loi invariante y nous avons 


(x) = D p(y,z)u(y) (38.172) 
y 


et si l’ensemble E est fini cette équation signifie 


= On (38.173) 


où Q est la matrice de transition de la chaine de Markov. 


25. Définition 38.4. 
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Théorème 38.55 (Théorème ergodique). 

Une chaine de Markov irréductible est positive récurrente si et seulement si elle accepte une mesure 
invariante. Cette mesure est invariante est alors unique et vérifie = Qu où Q est la matrice de 
transition. 


Démonstration. Nous allons seulement prouver le théorème ergodique dans le cas où Æ est fini. 
Soit (X,) une chaine de Markov récurrente positive; nous avons 7(x) > 0 pour tout x € E. Nous 
allons montrer que x est une mesure invariante. 

Nous commençons par montrer que 


D ri) 1. (38.174) 
xeE 


Pour cela nous reprenons la propriété de chaine irréductible pour écrire 


N 
1 
nn _ 1 
n(x) fn 2 x (38.175) 


Etant donné que E est fini nous pouvons sommer sur x € E et permuter la somme avec la limite : 


N 


i 
Doa()= lim ND lxir. (38.176) 
xeE NN k=11eE 


=1 


Nous nous retrouvons donc avec limyw_, +N = 1. La fonction x définit donc bien une mesure de 
probabilité sur Æ. 
Nous montrons à présent que cette mesure est invariante, c’est-à-dire que 


r(x) = D py,x)r(y). (38.177) 
yeE 


Pour cela nous utilisons encore le théorème de la convergence dominée pour permuter la limite et 
l’intégrale dans 


N N 
r(a) = E((x)) = dim + Ÿ'E(lxene) = lim + D P(Xeu = 2). Eagques, 


La dernière égalité découle du fait qu’en divisant par N et en faisant tendre N vers l’infini, le fait 
d’enlever un terme à la somme ne change pas la valeur de la limite. Nous pouvons substituer dans 
(38.178) la valeur 


P(Xk4 = æ) = D p(y,z)P(XR = y). (38.179) 
yeE 
Nous avons alors 
N 
> (y,æ)P(Xx = y) (38.180a) 
m(x) = Jin + p(y, k=Y 
k=1yeE 
1 N 
= D p(y,z) lim = D P(Xk = y) (38.180b) 
 N 
yeE k=1 
= D p(y,2)r(y), (38.180c) 
yeE 


ce qui signifie que 7 est une mesure invariante. Notons que nous avons encore utilisé le fait que Æ 
soit fini pour permuter avec la limite. 

Il nous reste à montrer l’unicité de la mesure invariante sur la chaine de Markov. Soit w une 
mesure invariante pour la chaine de Markov (X}). Comme indiqué dans la remarque 38.51 nous 
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pouvons supposer que X9 suit la loi u. Par le lemme 38.52 nous avons P(X% = x) = (x) pour 
tout k. Par conséquent 


N 
> PO =) Ho). (38.181) 


Théorème 38.56 (loi des grands nombres pour les chaines de Markov). 
Soit (XA) une chaine de Markov irréductible acceptant une mesure invariante. Soit f: E — R une 
fonction dans L\(E, a). Alors nous avons 


FC) À Ÿ f(x) (38.182) 


xeE 


IL 


d 
En ce qui concerne les notations, l'hypothèse f € L!(E, u) signifie 


Ÿ 1fGlu(x) = [ Lf(æ)ldu(æ) < ©. (38.183) 


xeE 


Démonstration. Nous prouvons le théorème dans le cas où Æ est fini. Si nous écrivons 


Fe) = D FU) Leg (38.184) 


alors 


LT 1.Y 
DSC) = D fu) D Lriey (38.185) 


Étant donné que E est fini nous pouvons permuter les sommes et prendre la limite N — co : 


Jim © DC) = D f(y) ) lim — > £e=) 0 (38.186) 
k 


yeE yeE 


38.6 Convergence vers l’équilibre 
Théorème 38.57 (Convergence en loi des chaine de Markov). 
Si (X») est 

(1) irréductible, 

(2) récurrente positive, 

(3) apériodique, 


alors X, converge en loi vers l’unique probabilité invariante tr vérifiant 
nm 


n(x) = D p(y,x)r(y) = : (38.187) 


ucE E(T(x)|Xo D x) | 
Cette convergence est indépendante de la loi de X0 et on a 


P(Xa=rX6= 1,28 710). (38.188) 
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38.7 Processus de Galton-Watson 


SecBPmrPdtGalton 
Nous considérons une maladie et notons Z, le nombre de malades à l'instant n. Nous posons 


Zo = let 
Ce É Si Zn = 0 Eapy il), 


ra et) sinon 


où Et) est le nombre de personnes contaminées par le malade à l'instant n. Nous supposons que 
ces variables aléatoires sont indépendantes et identiquement distribuées et admettent un moment 
d'ordre 1. 

L’équation de propagation 38.189 signifie que nous supposons qu’une personne malade à l’ins- 
tant n n’est plus malade à l’instant n +1. Par aïlleurs les hypothèses d'indépendance signifient qu’à 
chaque instant, le nombre de personnes contaminées par le malade à est indépendant du nombre de 
personnes contaminées par le malade j. De plus la façon dont la contamination se passe à l’instant 
n est indépendante de la façon dont la contamination se passe à l’instant m. Ces hypothèses sont 
raisonnables tant que le nombre de personnes non contaminées est grand. À partir du moment où 
presque tout le monde est malade, l’approximation de Galton-Watson ne fonctionne plus. 

Nous notons é la loi parente des Et, Ensuite nous considérons 


G(s) = E(sf) (38.190a) 
m = E(é) (38.190b) 
Gn(s) = E(s7"). (38.190c) 


Par le théorème de transfert (proposition 36.83) avec f(t) = s!, ce que nous avons est 
Le] 
Gn(s) = E(/(Z)) = J sdPz,(2) = D SE P(Zn = k) Eat 
R k=0 


où l'intégrale s’est transformée en somme parce que la loi de Z, est discrète : dP7, est une somme 
de masses de Dirac. En particulier nous avons 


00 
Gn(s) = D SF P(Zn = k) (38.192a) 
k=0 
G(0) = P(Zn = 0) (38.192b) 
et 
n = Jim P(Zn = 0) = Jim Gn(0). (38.193) 
D'où l'intérêt d'étudier G}. 
LemezrOil 
Lemme 38.58. 
Pour tout ne N* et pour tout 8 € [0,1], nous avons 
Gn(s) = GoGo...oG(s). (38.194) 
——— — 
n fois 
Démonstration. Pour n = 1, nous avons Z1 = en et donc 
Gi(s) = E(s) = G(s), (38.195) 
comme il se doit. SR dE 
Sin £ 1 nous écrivons | L è 
Gn(s) = E(s7") (38.196) 
Zn-1 p(n-1) 
= (es *& | ) (38.196b) 


O0 
_E D Lg, set Ë j (38.196c) 
k 


Il 
= 
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À ce niveau, nous voulons permuter la somme et l’espérance. Etant donné que le lemme est facile 
à vérifier pour s = 1, nous supposons s < 1. Du coup 


Din 1 (38.197) 


et ce qui se trouve dans l’espérance est majoré par 
00 
Nat (38.198) 


La fonction constante 1 est intégrable sur Q (ici nous utilisons à fond le fait que l’espace Q 
soit un espace de probabilité) et nous pouvons utiliser le théorème de convergence dominée de 
Lebesgue 15.2 pour permuter la somme et l'intégrale. Nous continuons donc le calcul (38.196) : 


(ve) 
(n— 
VE (lez, 2086 1) | (38.199) 
k=0 


La tribu engendrée par la variable aléatoire 1,7,_,-4; est une fonction des variables aléatoires Et) 


: ’ > 5 k  g(n—1) ; s / : 
avec m < n—2 tandis que la variable aléatoire 5241 & est une fonction des variables aléatoires 
(n—1) 


ê; . Par conséquent le lemme de regroupement 36.16 nous dit que ces variables aléatoires sont 
indépendantes, donc 
æ k (n—1) 
Gn(s) = D E(lyz, 20) E(n (38.200) 
Or 
FT Ur) 


Nous avons utilisé le fait que l’espérance d’une fonction indicatrice est la probabilité de l'événement. 
En ce qui concerne la puissance de s, les événements ent sont indépendants et suivent tous la 
même loi €, donc 


+ (n—1) k CN 1) 
mé = [[S# (38.201) 
i=1 
et 
k 
E(][ [s) = Ets) = G(sÿf. (38.202) 
i=1 
En mettant tout bout à bout 
00 = 
Gn(s) = » P(Zn-1 = k)G(s}f = Gn-1(G(s)). (38.203) 
k=1 
ThoJZnAUA 


Théorème 38.59. 
La probabilité d’extinction n est donnée par 


n=P [U (Zn = ) = lim P(Z, = 0). (38.204) 


n—> 00 
n>1 
Ce nombre est la plus petite solution positive de l’équation G(s) = s. 
De plus la classification des cas est comme suit. 

(1) Si P(£ = 0) = 0 alors n = 0. 

(2) Si P(£ = 0) 0 alors 
(2a) sim < 1 alors n = 1, 
(2b) sim > 1 alors ne ]0,1[. 
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Le cas m < 1 est dit sous-critique, le cas m = 1 est dit critique. Le cas m > 1 est dit 
sur-critique. 


Démonstration. Commençons par prouver que G est une fonction continue. En utilisant le théorème 
de transfert comme pour l’équation (38.191) nous trouvons que 


G(s) = E(s°) = 5 ps” FR500) 
k=0 


où nous avons noté px = P(£ = k). Si r < 1, alors la suite pyr* est bornée, donc le critère d’Abel 
(15.18) nous indique que la série (38.205) converge absolument et la théorie générale des séries 
entières conclut que la fonction G est en particulier dérivable terme à terme pour tout s € |—-1,1]. 


(1) La probabilité d’extinction est un point fixe de G 


En utilisant la continuité de G en 0 nous passons à la limite dans Gh+1(0) = G(G(0)) et 
nous obtenons 

n = G(n), (38.206) 
ce qui signifie que la probabilité d'extinction est un point fixe de G. 


(2) n est le plus petit point fixe de G 


Nous démontrons maintenant que 7 est plus précisément le plus petit point fixe de G sur 
[0,1]. Nous allons effectuer cette partie en décomposant selon les valeurs de po et de p1. 
Au vu de l'écriture (38.205), si p1 = 1 alors G(s) = s pour tout s € [0,1]. Mais dans ce cas 
nous savons par ailleurs que l’extinction est impossible. Zéro est bien la plus petite solution 
de G(s) = 5. 
Supposons maintenant que p1 < 1 et po + p1 = 1. Alors G{s) = po + p1s et s = 1 est l’unique 
solution. Mais vu que nous savons que 7 est solution, c’est que 7 = 1 et l’extinction est 
certaine. 
Nous passons au cas général : po + p1 < 1. D'abord nous remarquons que s = 1 est solution 
parce que 

G(1) =po+pi+:-.=1. (38.207) 


Remarquons aussi que dans ce cas s = 0 n’est plus solution. 
La fonction Gest strictement convexe sur [0, 1] (parce que G” > 0). Cela se voit en effectuant 
deux dérivations terme à terme (le rayon de convergence de la dérivée est le même que celui 
de la fonction). Cette stricte convexité entraine que l’équation G(s) = s a au maximum une 
autre solution que s = 1. Nous nommons 59 la plus petite solution dans [0,1]. Étant donné 
que G est croissante on a 

G(0) < G(50) — S0. (38.208) 


En appliquant G à cette équation nous obtenons G(G (s0)) < G{s0) = 50 et en appliquant n 
fois, 
Gn(0) < 50. (38.209) 


En passant à la limite, 7 < 50 mais 7 étant solution, nous avons 7 = 50. Nous avons donc 
prouvé que la probabilité d'extinction n est la plus petite solution de G(s) = s. 


(3) Classification des cas 


Nous devons encore discuter les cas. Si P(£ = 0) = 0, alors po = 0 et G(0) = 0, ce qui signifie 
que 50 = 7 = 0 et l’extinction est impossible. 

Nous passons au cas po Æ 0. Si po + p1 = 1, alors m = p1 < 1 et nous avions déjà vu que 
dans le cas po + p1 = 1, la probabilité d'extinction est 7 = 1. 


Il nous reste à traiter le cas po + p1 < 1. Encore une fois, la courbe G est strictement convexe 
sur [0,1] et elle est en particulier plus grande que sa tangente en s = 1, c’est-à-dire 


G{s) > G'(1)(s — 1) + G(1). (38.210) 
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Nous savons que G(1) = 1. En ce qui concerne G”(1), nous dérivons encore terme à termes : 


O0 
G'(s) = D kpes*"!, (38.211) 
k=1 
donc 
00 
G'(1) = Ÿ, kpe = E() = m. (38.212) 
k=1 
Ce que nous avons donc est 
G(s) > 1+m(s —1). (38.213) 


Nous nous particularisons au cas sous-critique (m < 1). En nous rappelant que 8 — 1 < 0, 
G(s)>1+(s—-1)=Ss, (38.214) 


donc s = 1 est la plus petite solution et effectivement nous avons déjà vu que 7 = 1 dans ce 
cas. 


Sim > 1, alors on a 
G(s) > 1+m(s—1). (38.215) 


Mais dire m > 1 revient à dire G’(1) > 1 et donc dans un voisinage de s = 1 on a 


ECHEC ï, (38.216) 
s—1 
ce qui implique que 
G(s) <s—1+G(1)=s. (38.217) 


Nous avons donc G(s) < s dans un voisinage de 1. Mais G(0) — 0 = po > 0, donc la fonction 
f(s) = G(s) — s est positive en 0 et négative proche de s = 1. Le théorème de la valeur 
intermédiaire nous indique alors qu'il existe un s € |0, 1[ tel que f(s) = 0, c’est-à-dire tel que 


G(s) = 5. 


Chapitre 39 


Martingales 


39.1 Convergence de martingales 


Définition 39.1. 

Si À est une tribu, une filtration de À est une suite croissante de sous-tribus B; € B;11 € A. 
Nous disons qu’une suite de variables aléatoires (X,) est adaptée à une filtration (Fh) si X; 

est F;-mesurable pour tout 1. 


Ces définitions impliquent immédiatement que si (X,) est adapté à (F,) alors X, est Fy- 
mesurable pour k > n. 


Définition 39.2. 
Une martingale adaptée à la filtration (Bn)nen est une suite de variables aléatoires M, telle que 
(1) M € L'(Q,A,P), 
(2) M, est B,-mesurable, 
(3) E(Mn+1lBn) = Mn. 
Le processus M, est une sur-martingale si E(M,:1|lB») < M, pour tout n, et c’est une 
sous-martingale si E(M,+1|B») > My. 


Exemple 39.3. 

Si M e L'(Q, A, P) et si (Ba)nen est une filtration, nous pouvons considérer la martingale M, = 

E(M|B:). A 
ExtFFKTr 

Exemple 39.4. 

Soit (X;);>1 une suite de variables aléatoires indépendantes et centrées. On pose 


Sn = Xi+:+X» (39.1) 
et la filtration B; = o(X1,..., X,). Pour montrer que cela est une martingale, nous commençons 
par remarquer que 

ERlb) = EX.) =0 (39.2) 


par indépendance des tribus B, et o(X»+1). Ici c’est le lemme 36.56 qui joue. 

Ensuite nous argumentons que E(X1 + ---+ X,]B) = X1 + --- + X,. En effet d’une part 
X1+:.-+ X, est B,-mesurable et évidemment la condition intégrale de l’espérance conditionnelle 
est satisfaite. 


Plus généralement si X est une variable aléatoire et si o(X) € B alors E(X|B) = X. A 
LemqanhgJ 
Lemme 39.5. 
Soit (M,) une martingale adaptée à la filtration (F,) et n > k. Alors 
E(MalFe) = Me (39.3a) 
E(MalFn) = My. (39.3b) 
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Démonstration. La seconde relation revient seulement à dire que M} est F,-mesurable, ce qui est 
évident parce que Fx € Fh. 

Nous prouvons la première par récurrence (à l’envers) sur k. D'abord si k = n, l'égalité 
E(MhlFr) = M\. Nous supposons maintenant que E(M,|F;) = My, et nous prouvons que 
E(MhnlFs_1) = M1. Si By_1 € Fx_1, nous avons 


M1 = My = M. (39.4) 
Bx-: By-1 By 


La première égalité est la définition d’une martingale, et la seconde est l'hypothèse de récurrence. 


ThobysyWI 

Théorème 39.6 ([762, 763]). 
Soit (Mh)n>o une martingale bornée dans L?(Q), c'est-à-dire telle que 

a = sup E(M?) < oo. (39.5) 

nZ0 
Alors la suite M, converge dans L?(Q). 
Démonstration. Nous écrivons M, en somme télescopique 
nm 
Mn = Mo+ D Ar (39.6) 


k=1 


où Ag = My — My_1. Nous commençons par montrer que les incréments sont orthogonaux au 
sens où E(A» Az) = 0. Pour n > k, la variable aléatoire E CALAGE) est la variable aléatoire 
Fn_1-mesurable telle que 


HA AE, 0 = Ï An A& (39.7) 


Bn-1 Bn-1 


pour tout Bn_1 € Fn_1. En particulier avec B,_1 = ( nous trouvons 
E(E(AnAK|Fn-1)) = E(A,Ay) (39.8) 


par la définition de l'espérance (36.36). Par conséquent, en utilisant le lemme 39.5 nous avons ! 


E(A,Ay) = E(E(AnAr|Fn 1) : E(AkE(AnlFn-1)) = (39.9) 


parce que E(An|Fn-1) = E(MalFn-1) — EMy-1lFn-1) = 0. 
Utilisant l’orthogonalité des incréments, nous avons 


E(M2) = E(Mÿ) + Ÿ E(A?). (39.10) 
k=1 


En prenant le supremum (par rapport à n des deux côtés), 


E(Mÿ) + Ÿ E(AË) = a < «. (39.11) 
k=1 


Cela prouve que la suite D}_, Ax converge dans L?(Q). Nous en déduisons immédiatement que 
(M) est de Cauchy dans L?(Q) parce que si k,! > n, nous avons (en utilisant encore l’orthogonalité 
des incréments) 


l 00 
E(IM-MP)= ÿ, E(AŸ)< Ÿÿ, E(4ÿ), (39.12) 
i=k+1 i=k+1 


qui tend vers zéro lorsque n — 0. 


1. À ce niveau je crois qu’il y a une faute dans [763] qui conditionne par rapport à Fa. 
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Le théorème suivant complète la conclusion du théorème 39.6. 
ThofcttYW 


Théorème 39.7 ([763]). 
Soit (M, )nen une martingale bornée dans L?. Alors (M) converge dans L?(Q) et presque surement 
vers une même variable aléatoire My qui vérifie 


Mn = E(MolFa). Fan 4) 


Notons en particulier que la variable aléatoire M, est presque surement finie parce qu’en vertu 
de (39.13) nous avons 


[ Ms = | Mn < ©. (39.14) 
Q Q 


Exemple 39.8. 
Soient des variables aléatoires indépendantes V, + &(2F\) et la variable aléatoire somme 


Sn = D, Ve. (39.15) 
k=1 


.S. N s: 2 . . 
Nous allons montrer que $, 2% X où X est une variable aléatoire presque surement finie. Nous 
posons 


nm 
l 
Mn = Sn — D. (39.16) 
k=1 
Cela est une martingale adaptée à la filtration F, = o(V1,...,VA) en vertu de l'exemple 39.4. Nous 


montrons à présent qu’elle est bornée dans L?(Q) au sens où ÿ,>, E(M?) < 0. Nous avons 


E(MŸ) = E 1, -Y AT) =E (x _ af) | (39.17) 
k k 


La variable aléatoire V, — 1/2F À est une variable aléatoire centrée de variance 1/(2* À)? (voir pro- 
position 36.132). Étant donné que M, est centrée, Var(M,,) = E(M2) et nous avons 


L 1 SO 1 
2 _ 
E(M?) = ÿ Var (vi x) >, PI (39.18) 
k=1 k=1 
cette dernière somme étant bornée par ! = + 2 nous avons 
E(M}) <1 (39.19) 


avec | indépendant de n. C’est pour cela que (M, ),en est une martingale bornée dans (0 Par 
le théorème 39.7 nous avons M,, — M, et en faisant n — © dans 


nm 
1 

Sn = Mi+ Y ne (39.20) 

k=1 

nous trouvons 
cd l 

Sn — M — = M, — 39.21 
. co + 2 Su La: (39.21) 


qui est presque surement finie. A 
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39.2 Temps d’arrêt et martingale terminée 


Définition 39.9. 
Soit (0, F,,F,P) un espace de probabilité filtré. Une application T : Q — N est un temps d’arrêt 
adapté à la filtration (F,) si pour tout ne N nous avons {T < n} € F». 

Le temps d'arrêt T est borné si il existe k € NN tel que T(w) < k pour presque tout w € Q. 


LemXYeCLXW 
Lemme 39.10. 
Si T est un temps d'arrêt presque surement fini, alors? 
ps. 
(HTAn DT, ItemIPPkxmAii 


(2) limy-,0 E(T À n) = E(T). 


Note : il est d’usage assez classique de noter a À b le minimum de a et b. 


Démonstration. Vu que T est presque surement finie, il suffit de prouver que 
E 
(T À n}(w) — T{w) USE) 


pour tout w tel que T(w) = k pour tout k € N. Soient donc w € ( tel que T(w) = k et n > k. Nous 
avons 


(T A n}(w) = T(w) An=k=T(w). (39.23) 


En ce qui concerne la seconde assertion, la suite de variables aléatoires X, = T'An est croissante 
et positive, donc le théorème de la convergence monotone 14.173 montre que 


lim E(T An) = E(T). (39.24) 


n—00 


Remarque 39.11. 
Notons la différence subtile entre Sr(w) et (Sr)(w). La première est la variable aléatoire 


nr > ST(w') (w) (39.25) 


et la seconde est le nombre S7(,,) (w). 

ThoQMsRbkp 
Théorème 39.12 (Théorème d'arrêt borné[763]). 
Soit (Xh) une sur-martingale et S < T, deux temps d’arrêts bornés. Alors 


(1) les variables aléatoires Xs et Xr sont intégrables, 
(2) E(Xrlo(S)) < Xs presque surement. 


Si par contre (X,) est une martingale alors X$s et Xyr sont bornées, et 


E(Xrlo(S)) = Xs. (39.26) 
RemKCdpnid 
Remarque 39.13. 
Un cas particulier intéressant de ce théorème 39.12 est le cas S = 0 qui est un temps d’arrêt 
vérifiant Fo = {Q, 9}. Si X est n'importe quelle variable aléatoire, la tribu engendrée o(X) est 
toujours indépendante de la tribu {Q, }, donc le résultat E(X7|Fs) = X$ donne 


ee. (39.27) 
ThoZTrdjtZ 
Théorème 39.14 (Premier théorème d’arrêt de Doob[764]). 
Soient (X,) une martingale et T un temps d'arrêt ; tous deux pour la filtration (F,). Nous suppo- 
sons qu’une des trois propriétés suivantes soit vérifiée : 


2. Dans [103], dans le problème de la ruine du joueur, la seconde assertion est avec une limite sup et non avec une 
limite normale. 
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(1) T est presque surement bornée. 


(2) ET) < © et il existe une constante c telle que 
E(|Xn+1 — Xnl|Fn) < € (39.28) 


Fe 
sur l'événement {T > n}. LtemQVWZuBkiii 
(3) Il existe une constante c telle que |Xran| < € presque surement. 


Alors Xr est une variable aléatoire presque surement bien définie nous avons 
E(Xr) = E(X). (39.29) 


Si (Xh) est une sur-martingale, alors la conclusion est E(Xr) < E(Xo) et si (X,) est une sous- 
martingale, la conclusion est E(Xr) > E(X5). 


ii Avertissement /question à la lectrice !! 39.15 
D'après la page de discussion de l’article sur Wikipédia, il semblerait que la seconde condition soit 
mal énoncée. Je n'ai pas vérifié. 


Remarque 39.16. 
Sous l’hypothèse (3), il est possible d’avoir T = sur un ensemble de mesure non nulle. Sur cet 
ensemble, la variable aléatoire X7 doit être définie de façon plus fine. 


Définition 39.17. 
Nous disons que la martingale (Myn>1 est terminée si il existe M € L!(Q,A,P) telle que 
E(M\A;) = M pour tout n > 1. 

Def0ZlZnse 
Définition 39.18. 
Un ensemble H € L'(Q,u) est équi-intégrable si 


de (sp J | nant) = (39.30) 
Liza 


a—® | fe 


Notons dans cette définition que vu que f € L! nous avons toujours 


lim [f(x)|du(x) = 0. (39.31) 


Eds 


L’équi-intégrabilité donne une sorte d’uniformité en f de cette limite. 
ThoEFbpVXb 


Théorème 39.19. 
Si (Mn) est une martingale, nous avons équivalence entre 


(1) (Mn) converge dans L\ ; 
(2) (My) est terminée ; 
(3) l’ensemble {Mh}n>1 est équi-intégrable. 


Attention : en vertu de la proposition 27.18 et surtout de l’exemple 27.19, la convergence L! 


n'implique pas la convergence presque partout. 
ThoHBvnTRK 


Théorème 39.20 (Théorème de Doob[418]). 
À propos de convergence de martingales. 


(1) Toute martingale terminée converge presque surement et pour la norme Fr 
(2) Toute martingale bornée dans L? converge presque surement et pour la norme L?. 


PropAYJpGsc 
Proposition 39.21 ([765]). 


Soient (M) une martingale et T un temps d'arrêt (pour la même filtration (Bh)). Alors le processus 
Va = Mhr est une martingale. 
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Démonstration. Nous décomposons V, de la façon suivante : 


Va = Moir = Malr>n + Mrirén = Mhlr>n + > My1T-4. Fay 


k<n 


Nous avons, grâce au lemme 14.3, 


{T >n}=C{T<n} =C{T <n-—-1}e Bh1 (39.33) 
et, sik <n, 
{T=k}={T<k}\{T<k-1}eB,c B. (39.34) 
En © 
€EBk EBx-1 


La forme (39.32) donne donc manifestement la B,-mesurabilité de V,. 
En ce qui concerne l’espérance nous devons calculer 


E(Va+1lBn) = E(Mntilrent1lBn) + D, E(Mrlr-x|Bn) (39.35) 


k<n+1 


où nous avons utilisé la proposition 36.33. Étant donné que Îr>n+1 et Î1r-x sont des variables 
aléatoires B,-mesurables nous pouvons utiliser la proposition 36.59 pour les sortir : 


E(Va+1lBn) = 1r>n+1Mn + D, Lr=x My = Mran = Va. (39.36) 
k<n 
Pour cette ligne, nous avons aussi utilisé les égalités suivantes : 
— E(Mn+1lBn) = MA parce que (M,) est une martingale 
— E(Mx|B») = My parce que M4 est B,-mesurable. 


Définition 39.22. 
Si(Xh) est un processus adapté à la filtration (F,) et si T est un temps d'arrêt F,-mesurable alors 
le processus arrêté à l'instant T est le processus Yh = Xh\T. 


Nous avons déjà vu par la proposition 39.21 que si (X,) est une martingale alors son processus 
arrêté est encore une martingale. 


39.3 Décomposition de martingales 


Définition 39.23 (Processus croissant prévisible[763]). 
Un processus X, adapté à la filtration F, est un processus croissant prévisible si 


(1) Ao =0 
(2) An < An+1; c’est cette condition qui correspond à « croissant », 
(3) An+1 est F,-mesurable ; c’est cette condition qui correspond à « prévisible ». 


Proposition 39.24 (Décomposition de Doob pour une sous-martingale[763]). 
Toute sous-martingale (X,) s'écrit de façon unique sous la forme 


Xn = Mn + An CUS 


où (M) est une martingale et (A,) est un processus croissant prévisible. 


/ : rte EqQF1GRzo 
Démonstration. Nous considérons le processus | a 


4 =0 (39.38a) 
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Nous vérifions que cela est un processus croissant prévisible. D’abord 
E(Xu41 — Xnlfn) = EXn41lFn) — E(XalFn). (39.39) 


Le second terme est égal à X,, parce que cette variable aléatoire est F,-mesurable tandis que (X») 
étant une sous-martingale nous avons E(X,:1|F,) > X,. Nous avons donc bien 4,,,1 > A, et le 
processus (4,) est croissant. 

En ce qui concerne la prévisibilité nous devons prouver que 4,11 est F,-mesurable. D’une 
part À, est F,-mesurable et d’autre part par définition de l’espérance conditionnelle, la variable 
aléatoire E(X»+1 — XnlFn) est également F,-mesurable. 

Nous posons alors M, = X, — À, et nous devons prouver que cela est une martingale. Nous 
avons 


E(Mh+1 MhlFn) n E(Xn+1 Fe XP) nu E(An+1 _ AnlFa (39.40) 


Le second terme vaut 
Éd Aie E(E(Xn+1 = XnF)|Fn) He ne) (39.41) 


par la proposition 36.54. Le processus (WM,) est donc une martingale. La preuve de l'existence 
d’une décomposition (39.37) est achevée. 

Nous passons maintenant à l’unicité en posant Xn = M, + An = M} + A!,. Nous avons 
Ao = Àf = 0 et 4°, = Xn — M}, donc 


n+1 À, = Xn+1 — ÀÂn + Mi M, = Xny1 — Xn — ( si _ M,). (39.42) 


Nous appliquons E(.|F,) des deux côtés de cette égalité : 


E(A,+: — A Fn) = E(Xn41 — XnlFn) — E(M,,1 — MF): (39.43) 
= À! A!, 0 


n+1 


Nous avons utilisé le que que (M,,) étant une martingale, E(M,,1 — M;lFh) = 0, et idem avec 
(M). Donc 


is — A = E(Xn+1 — XnlFn) — E(Mh41 = Mal) + E(An+1 … Aura) D An+1 ss A (39.44) 


Nous avons donc montré que An+1 — An = 4,41 — 4’, et donc que À, = À, pour tout n. Nous en 
déduisons immédiatement que M, = M} pour tout n et l’unicité de la décomposition. 


LemPVgeKfc 
Lemme 39.25. 
Si (X») est une martingale de carré intégrable adaptée à la filtration (Fh) alors 


(1) Le processus (X2) est une sous-martingale. 
2) Si X2 = My + An est la décomposition de Doob, alors 
nm 


= À (E (E (x? |Ai-1) - x?) — ÿ E((x: cu Xi) Ai). Fa A 
i=1 i=1 


Démonstration. Pour la première assertion, nous utilisons l’inégalité de Jensen 36.72 : 
2 
E(XiFn-1) > (E(XnlFn1)) = X$ (39.46) 


parce que E(Xh|Fn-1) = Xh du fait que (X,) soit une martingale. 

En ce qui concerne la seconde assertion, nous nous souvenons que le processus prévisible de 
la décomposition de Doob d’une sous-martingale est donné par la récurrence (39.38) que nous 
recopions ici : 


A0 = 0 (39.47a) 
{ An+1 = An + E(X2 4 — XF) (39.47b) 
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Vu que X2 est F,-mesurable, il peut sortir de l'espérance : 


Anti = An + EX Fa) — XÈ (39.48) 

et donc : 
=) (# (X?|Fi-1) — X} à). (39.49) 

i=1 

Pour obtenir la dernière partie de (39.45) nous travaillons un peu : 

E((Xi- Xi1) F1) = E(X? + X2 5 — 2XiX5 1l7i 1) (39.50a) 
= E(X|F-1) + X£ 1 — 2E (XX F1) (39.50b) 
E J 
= E(X}|F-1) + X2 1 —2X5 EXIF) FRS : 
= E(X|F-1) + Xf 1 — 2Xi 1X (39.504) 


où nous avons utilisé la proposition 36.59 pour obtenir (39.50c). 


39.4 Problème de la ruine du joueur 
SecMS0jfgM 
Nous considérons un joueur compulsif qui joue à un jeu très simple* : il joue à pile ou face 
contre la banque avec une pièce truquée. Si pile sort, la banque donne 1 au joueur et si c’est face, 
c’est le joueur qui donne 1 à la banque. Nous nommons a la fortune initiale du joueur, b celle de 
la banque et p la probabilité d'obtenir pile. 
Nous supposons que le jeu se poursuit jusqu’à la ruine du joueur ou de la banque. La modé- 
lisation est comme suit : nous considérons (Y,) une suite de variables aléatoires indépendantes et 


identiquement distribuées de loi 
Yn = pô1 + (1 — p)ô_1. (39.51) 


C’est le résultat financier pour le joueur du n° jet. La fortune du joueur au bout de n jets est la 
variable aléatoire 


Sn =a+) Y; (39.52) 
j=1 
Nous notons Y5 = a. 
Nous considérons la filtration 
An = o (Si tel que 0 < i < n) _ o(Y; tel que 0 <i< n), (39.53) 
et le temps d'arrêt du jeu : 
T = inf{n > 1 tel que S, € {0,a +b}}; (39.54) 


c’est le temps qu’il faut pour que tout l’argent appartienne soit au joueur soit à la banque. 
Nous voulons étudier les paramètres suivants : 


(1) p = P(Sr = a+b), c’est-à-dire la probabilité que ce soit le joueur qui gagne contre la banque. 
(2) P(T < ), c'est-à-dire la probabilité que le jeu se finisse. 


(3) E(T), la durée moyenne du jeu. 
LemEOAmVyZ 


Lemme 39.26. 
Le processus S, du problème de la ruine du joueur, en notant q = 1 — p, vérifie 


E(SnlAn-1) = Sn-1 + p— q. FETES 


De plus le processus S, est 


3. Le gros des choses dites à propos de la ruine du joueur provient de [103]. 
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(1) une martingale si p = q = i, 


(2) une sous-martingale si p > q. 


Démonstration. Pour n > 1 nous avons 


n n—1 
E(SalAn-1) = a+ D E(YjlAn-1) = a+ D E(YjlAn-1) + E(YnlAn-1). (39.56) 
j=1 j=1 


Sij <n— 1 alors Ÿ; e m(Ah_1). Mais nous savons que si X est F-mesurable, alors E(X|F) = X 
(c’est la définition de l’espérance conditionnelle), donc . E(Y;| A4, :)= dd ie 

En ce qui concerne le terme j = n nous utilisons le fait que o(Y,) soit une tribu indépendante 
de A»_1 ; nous avons donc au final pour tout j que E(Y;|A4»_1)E(Y;) = p — q. Nous avons donc 


E(SnlAn-1) = Sn-1+p—9q. (39.57) 


Si p = q = à alors c’est une martingale, et si p > q c’est une sous-martingale. 


LemXDINxtE 
Lemme 39.27. 
La variable aléatoire T est un temps d'arrêt. 


Démonstration. Par définition T = inf{n > 1 tel que $, € {0,a+b}}. Vu que les variables aléatoires 
Si avec i < n sont 4,-mesurables, les ensembles {5% & {0, a + b}} avec k < n sont 4,-mesurables. 
Donc les ensembles 


{T = n} = (9 {Sx é {0,a + b}} n {S, € {0,a +b}} (39.58) 


k<n 


sont 4,-mesurables. Nous en concluons que l’ensemble {T < n} est également mesurable. 


39.4.1 Le cas où la pièce est truquée 


Nous supposons être dans le cas p > q. 


39.4.1.1 Introduction d’une martingale 
Considérons le processus 
Ao = 0 (39.59a) 
{ An = An-1 + E(Sn — Sn-1l An-1)- (39.59b) 


Vu que E(Sy|An-1) = Sn-1 + p — q (lemme 39.26) et que E(Sh_1|An-1) = Sn-1 (parce que S;-_1 
est dans la tribu de 4,-_1), nous avons 4, = Ah_1 + (p — q) et donc 


An = n(p — Q). (39.60) 
Ce processus (4,) est croissant et prévisible. Nous introduisons le processus 


Mn = Sn — An Fa 89.6 1) 


et nous montrons que c’est une martingale *. Nous conditionnons la définition (39.61) par rapport 


à A1 : 


E(MylAn-1) = E(SnlAn-1) — E(Anl An-1) (39.62a) 
Du on 
= An — An_1 + E(Sy_1l An-1) — An (39.62b) 
= E(Sn_1|An-1) — An-1: (39.62c) 
Mais Sh-1 est A,_1-mesurable, donc E(S,_1|45_1) = Sh-1 et 
Lu es 4-1. (39.63) 


ce qui signifie que (WM,,) est une martingale. 


4. Ceci est un peu le contraire de la décomposition de Doob. 
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39.4.1.2 Finitude du temps d’arrêt 


Nous montrons maintenant, en étudiant Mr, que T est intégrable et nous prouvons que 
PIE = 6%) = 0, 


Proposition 39.28. 
La variable aléatoire T est intégrable, et P(T = ©) = 0, c’est-à-dire que le jeu se termine presque 
certainement après un temps fini. 


Démonstration. Nous rappelons que le lemme 39.27 nous indique que T est un temps d’arrêt. Le 
temps d'arrêt T A n est borné (par n évidemment) et nous pouvons donc lui appliquer le théorème 
d'arrêt 39.14 pour dire que 

E(Mrin) = E(Mo). (39.64) 


Le membre de droite est simple parce que Mo = So — A0 = So = a parce que c’est l’argent de 
départ du joueur. Pour l’autre : 


E(Mr \n) D E(ST\n) . E(ArT\n): FRET V8 


D'une part, E(Aran) = E((T A n)(p — q)) et d’autre part, E(Sr\n) < à + b parce que Sr vaut 
zéro ou a + b (avec des probabilités encore inconnues °). En combinant avec ce qui était dit juste 
au dessus et remarquant que (p — g)E(T À n) > 0 nous pouvons écrire 


O<(p-qE(T An) <b. Farg0 


La suite de variables aléatoires T À n est donc croissante, positive et intégrable 6 et donc nous 
avons du travail pour le théorème de la convergence monotone 14.173. La variable aléatoire Test 


alors mesurable et ? 
Jim E(T À n) = E(T). FarBiguee 


Notons que nous n’avons pas encore prouvé que E(T) < ©, mais en passant à la limite dans (39.66) 
nous écrivons 


0 <(p—4)E(T) <b. (39.68) 


Maintenant nous avons prouvé que T' est intégrable et même L!. Par conséquent 


P(T = w) = 0. (39.69) 


Le jeu se termine donc presque certainement après un temps fini. 


39.4.1.3 Temps moyen de jeu 


Le lemme 39.10 nous indique que Sr\n 2, ST. 
Nous avons les bornes 0 < Sr\in < a +b et comme a + b est intégrable, Sr, l’est aussi et nous 
pouvons parler de E(Sr,n). Repartons de (39.65) : 


a = E(M) = E(Mran) = E(Sran) — E(Aran) = E(Sran) -(p-@ET an). ESA 


La variable aléatoire Sr, est majorée par a + b indépendamment de n; donc le théorème de 
la convergence dominée 14.200 donne limy_,% E(Srin) = E(Sr). En ce qui concerne le second 
terme, la convergence dominée ne fonctionne pas parce que TA n n’est pas à priori majoré par 
quelque chose d’indépendant de n. Heureusement, le théorème de la convergence monotone donne 
lim, E(T À n) = E(T). Au final en passant à la limite dans (39.70) nous avons 


a = E(Sr) — (p— 4 ET). (39.71) 


5. Mais on y travaille. 

6. Je rappelle que les constantes sont des fonctions intégrables sur Q. Oui, je sais, quand on est habitué à faire 
de l’analyse sur R” c’est un truc qu’on perd toujours un peu de vue. 

7. Dans [103], l'équation (39.67) vient avec une lim sup et non une limite normale. Je ne comprends pas pourquoi. 
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Étant donné que T > 0 et p — q > 0 nous pouvons récrire cela sous la forme 
0 < (p — q)E(T) = E(Sr) — a. (39.72) 
Par définition de T nous avons aussi 
E(Sr) = (a+b)P(Sr = a +b) +0 - P(Sr = 0) = p(a + b). (39.73) 
Nous déduisons 


pr) = RDS FaREO A 


p—gq 
Ne crions pas victoire trop vite : nous n’avons pas encore d'expression de p = P(Sr = a + b). Le 
temps moyen de jeu n’est donc pas encore tout à fait connu. 
39.4.1.4 Probabilité de victoire du joueur 
Nous avons besoin d'exprimer p en termes de a, b et p. Pour cela nous introduisons la variable 


aléatoire * ”_ ( S | Expat 


P 


Nous commençons par prouver que c’est une martingale en calculant 


E(UnlAn-1) = E (( Ge) 


Nous utilisons la proposition 36.59. Dans notre cas, $,_1 et Y, sont des variables aléatoires 4,- 
mesurables ; la variable aléatoire Y, est même 4,,_:-mesurable et sort donc du conditionnement ; 


nous avons donc , - 
1e É EqW 
CUAPENES CIRE (2) | SENS 


P 


a) (39.76) 


Nous allons utiliser le théorème de transfert 36.83 : 


E(s*") - | sn) GP (w) = J 


sal Î Pt) (39.78) 
o Yn=1 


Yn=—1 $ 


Mais nous savons que P(Yh = 1) = pet P(Yh 1)=1-—-p= 9, donc 
E(s"®) = ps + —+., (39.79) 
5 


En posant s = g/p et en tenant compte de 1 — p = q, nous trouvons 


E (7) Spb gel (39.80) 


Sn—1 
AA = (2) =. (39.81) 


Donc 


ce qui prouve que (U,) est une martingale. 
Par définition nous avons toujours $, > 0 tant que n < T°, donc Ur,n € [0,1]. Il est donc 
évident que si a > 1 nous avons 


[, | IUT anldP = 0 (39.82) 
Tanl>4@ 


8. Nous dirons un mot sur ce choix dans le « petit complément » 39.4.3. 
9. Pour n > T le jeu est terminé, donc on ne se pose pas la question. 
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parce que le domaine d'intégration est vide. Donc les variables aléatoires VW, = Ur, sont équi- 
intégrables !° et le théorème 39.19 montre que la martingale (V,) est terminée; par ricochet !! le 
théorème de Doob 39.20 montre qu’il existe une variable aléatoire X telle que V, 2* X. Nous 
allons prouver que X = Ur presque partout. Nous savions déjà (voir l'équation (39.22) et ses 
alentours) que 


Snar “+ Sr. (39.83) 


Nous avons alors (au sens du presque surement) : 


ST nn ST 
lim Va = lim Uran = lim (2) = (1) = (39.84) 


Donc par unicité de la limite presque partout nous avons X = Ür presque partout. Par le théorème 
de transfert 36.83 nous évaluons 


E(Ur) = ol P(Sr = 0) + OT = a+b)=(1-p)+ (y Fate Res 


La remarque 39.13 nous permet de dire que 


E(Ur an) = Uo-. (39.86) 
Mais par définition 
So a 
Er (2) . (2) (39.87) 
D P 
donc nous avons : 
E(Uran) = (2) (39.88) 


Nous voudrions passer à la limite n — 0 dans cette équation. Pour permuter la limite et l’es- 
pérance, il faut utiliser le théorème de la convergence dominée 14.200. Vu que nous avons choisi 
q > p, nous avons g/p > 1 et donc Ur,n < (q/p)**?, ce qui montre que la fonction w + (Ur in)(w) 
est majorée par une constante (qui est une fonction intégrable). Nous pouvons donc permuter la 
limite et l'espérance : 


Jim E(Uran) = E( lim Uran). (39.89) 


0 . Je 2 :8. 
Mais nous avion déjà montré que Urin Pen Ur. Donc 


E(Ur) = (2). (39.90) 


En égalisant avec l'expression (39.85) de E(Ur) nous trouvons 


GE (39.91) 


et ensuite nous trouvons E(T') en remettant ce p dans l'expression (39.74) donnée plus haut. 


39.4.2 Le cas où la pièce est non truquée 


Maintenant p = q = 1/2. 


10. Définition 39.18. 
11. Nous rappellons que la convergence L! n'implique pas la convergence presque partout. 


39.4 PROBLÈME DE LA RUINE DU JOUEUR 2697 


39.4.2.1 Probabilité de gagner 


Le lemme 39.26 nous indique alors que (S,) est une martingale et le lemme 39.25 nous permet 
de dire que (S2) est alors une sous-martingale. Le processus croissant prévisible de (S?) est donné 
par (39.38) qui en adaptant les notations est 


Bo = 0 (39.92) 


By = Bn-1 + E((Sn — Sn-1)/lAn-1) PRES (39.92b) 


Nous avons toujours Sy — $,_1 = +1 parce que soit le joueur gagne soit le joueur perd, mais de 
toutes façons sa fortune varie de 1 à chaque étape du jeu. Donc (39.92b) nous donne By = Bn-1+1 
et 

By = n. (39.93) 


Cela nous dit que la variable aléatoire 
SF —B, =S5-n (39.94) 


est une martingale (une sur-martingale moins son processus prévisible croissant). Nous lui appli- 
quons le théorème d’arrêt 39.12 avec les temps d'arrêt 0 et TA n : 


E(S2,, -T An?) = S2— 0 Far ani 


où F9 est la tribu engendrée par la variable aléatoire 0, c’est-à-dire {Q, G}. Cette tribu est indé- 
pendante de toute autre tribu et nous pouvons donc supprimer le conditionnement dans (39.95). 
Nous avons aussi So = a par définition. Avec tout ça nous avons la majoration 


E 
E(T À n) = E(S2,.) — a? & (a + b)? — a? AT 
parce que $5% est toujours positif et entre 0 et a + b. En utilisant le lemme 39.10 et en passant à la 


limite, 


E(T) < (a + b)° — a°. (39.97) 


En particulier, Te L(Q) et P(T < oo) = 1. 
En suivant exactement les mêmes étapes que dans le lemme 39.10(2) nous avons aussi 


Jim ST an = ST (39.98) 
presque partout. De plus nous savons que 
O<SE,, <(a+b), (39.99) 
et nous pouvons donc utiliser le théorème de la convergence dominée 14.200 pour dire que 


Jim E(S£,,) = E(SÈ). (39.100) 
Nous montrons à présent que ST\n En Sr. Pour cela nous devons évaluer la limite 
lim [ |Sran — Srl°. (39.101) 
n—>00 Q 


La fonction [Sr\n — Srl? est majorée par (a+ b)? et nous pouvons à nouveau appliquer la conver- 
gence dominée : 


Jim E(Sran — Sr) = Ji, | ISruan(e) — Srun(o)FdP() = [| in, 1Sran — Sr = 0. 
(39.102) 


À : : : L1 
La même chose en n’écrivant pas les carrés montre que l’on a aussi Srin — Sr. 


2698 CHAPITRE 39. MARTINGALES 


Il n’y a pas que n + 52 — n qui est une martingale. Il y a aussi (S,) lui-même (lemme 39.26). 
Nous pouvons lui appliquer le théorème d’arrêt 39.12 pour les temps d’arrêts TA n et 0 : 


E(Sran) = E($0) = a. FE 10) 


En passant à la limite, E(Sr) = a. L’espérance E(Sr) peut par ailleurs être calculée comme 
BB = De Pr = 0) LL OP =uSb) Eai q Et 


En égalisant les valeurs (39.103) et (39.104) de E(Sr) nous trouvons 
a E 5 
Æ ———_— a | 
PE + b à 
Cette formule est assez logique : la probabilité que le joueur gagne est égale à la proportion d’argent 
en jeu qu’il a amené. 


39.4.2.2 Temps moyen de jeu 


Nous calculons maintenant l’espérance E(T) du temps de jeu (sans compter les pauses ni les 
jours de fermeture du casino !?). 
Nous recopions la première égalité de (39.96) sous la forme 


ad =E(S?,,-TAn) (39.106) 
et nous passons à la limite * en sachant que E(S%) = p(a + b)? : 
a = p(a + b)? — E(T). (39.107) 


En reprenant la valeur (39.105) de p, 
E(T) = ab. (39.108) 


Et là, on voit que si le joueur amène 1000 euros contre une banque qui en a un million, et si ils 
jouent toutes les secondes , on en à pour 32 ans de jeu en moyenne. 
Voilà. C’est fini pour la ruine du joueur. 


39.4.3 Un petit complément 
SUBSECooACWWooBuSxGv 


Nous avons introduit lors de l'équation (39.75) la variable aléatoire U,, = (p/q)°". Sans aller 
jusqu’à motiver complètement ce choix, nous nous proposons maintenant de voir que parmi les 
variables aléatoires U, = s°", le choix s = p/q est le seul qui donne une martingale. 

Soit donc U, = 5°" et exprimons le fait que ce soit une martingale. Nous avons 


E(UnlAn_1) = E(s°r-15}| 4, 1) (39.109a) 
= sn1E(s}"| 4, _:) ot T0) 
= s°n-1E (5), (39.109c) 


Le passage à (39.109b) se justifie en disant que s°*-1 est une variable aléatoire bornée et A, _1- 
mesurable, et en invoquant proposition 36.59. La variable aléatoire Y, vaut 1 avec probabilité p et 
—1 avec probabilité q; donc l’espérance est vite vue : 


1 
E(s*) = ps + q= (39.110) 
et nous avons 


S 


1 
Elalir= (rs + a) ni 2 (ps + ET (39.111) 


12. Le joueur est un vrai joueur compulsif. 
13. Comme il est dit dans La Grande Illusion, à quoi sert un n°? À passer à la limite. 
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Pour que (U,) soit une martingale il faut (et il suffit) que 
. EEE 


Les solutions de cette équation sont s € {1, E}. C’est évidemment s = p/q qui donne une martingale 
non triviale. Attention pour être complet, il faut se demander ce qu’il se passe si s = 0 séparément 
parce que manifestement l'équation (39.112) ne traite pas ce cas. Encore une fois, en repartant du 
début, s = 0 ne se révèle pas être une martingale très excitante. 


Bref, nous devons poser 
Sn 
b.= (2) (39.113) 
q 


pour avoir une martingale. 


ii Avertissement /question à la lectrice !! 39.29 
Les variables p et q sont inversées par rapport à (39.75). Ecrivez-moi si vous voyez pourquoi. 
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Chapitre 40 


Processus de Poisson 


40.1 Processus de Poisson 
SecHxbtzQ 


Définition 40.1 (processus de comptage). 
Un processus de comptage est une famille de variables aléatoires {N,: Q — R};cr+ telles que 


(1) Now) = 0 pour tout w € (1. 
(2) Pour toutte R* et pour tout w E Q, N{(w) € N. 
(3) Pour chaque w € Q, la fonction t + N,(w) est croissante. 
DEFooWDXDooRGCtXL 
Définition 40.2 (processus de Poisson[735]). 
Un processus de Poisson d'intensité À est un processus de comptage (Ni);em+ tel que 


(1) Pour tout choix de 0 < t1 < ... < tm, les variables aléatoires N;,—N;.., sont indépendantes !. 


i—1 


(2) Pour tout (s,t) e IR?, la variable aléatoire N;,14 — N, suit une loi de Poisson? de paramètre 


À. 
PROPooGMBBooCIKkVCB 
Proposition 40.3 ([735]). 
Soit un processus de Poisson (N,). Pour tout t > 0 nous avons 
lim P(Nur-N>1) =0. (40.1) 
h—0 
LEMooLNIZooDWUvRN 
Lemme 40.4 ([766]). 
Si les variables aléatoires X1,...,X, sont indépendantes et identiquement distribuées de densité 
f, alors le vecteur (X1,...,X,) est à densité et sa densité est 
n 
dose) ee. 2 (40.2) 
i=1 
LEMooXTVNooSBnnAd 


Lemme 40.5 ([1]). 
Soit un processus de Poisson {N;: (Q — N};cm+ d'intensité À. Pour chaque n € N nous posons 


Tn:0—+R 


40.3 
wi inf{t > 0 tel que Ni(w) > n}. 5 


Soit h> 0. ITEMooXVSQooSQmIUv 
(1) Il existe une partie de mesure nulle Z € Q telle que {Ty <h} € {Ny > n}UZ. 


1. Ceci demande en particulier que l’ensemble Q soit assez grand pour contenir une infinité non dénombrable de 
variables aléatoires indépendantes. 

2. Définition 36.129. 

3. Cette subtilité est manquante dans [767, 768, 769]. Plus généralement, je ne l'ai vue nulle part. Si vous savez 
démontrer que les événements 7, < h et N, > n sont égaux, dites-le moi. 


2701 


2702 CHAPITRE 40. PROCESSUS DE POISSON 


ITEMooIPKCoo!If jUzs 
(2) Nous avons {Ny > n} € {Tn < h}. 
(3) Au final, 
P(Tn < h) = P(Ny > n). (40.4) 
Démonstration. En plusieurs parties 
(1) {Zn <h} EC {Ni Zn} LUZ Soit we {Th < h}. Cela signifie que 
inf{t > 0 tel que N(w) > n} < h. (40.5) 


Si Th(w) < h, alors Nj(w) > n, et le point est démontré. 

Nous prouvons maintenant que Z = {T, = h} n {Ny < n} est de mesure nulle. Soient w € Z 

ainsi que € > 0. Vu que T}(w) = h, nous avons Ny+e(w) > n. Donc, pour w € Z nous avons 
Nh+e(w) — Na(w) > 1. (40.6) 


En posant Ze = {Nyp14— Ny > 1}, nous avons donc Z € Z+ pour tout €. Nous avons alors, 
pour tout €, que P(Z) < P(Z:). Mais la proposition 40.3 nous indique que lime_,0 P(Ze) = 0. 


Donc P(Z) = 0. 
(2) {M >zn} CC {Mn <h} Soit we Q satisfaisant Ny(w) > n. C’est direct parce que si N,(w) > 
n, alors 
Tn(w) = mf{y > 0 tel que N(w) > n} < h. (40.7) 
(3) Les probabilités Le point (1) donne 
P(T,<h) < P(Ny > n) + P(2) = PIN; > nn), (40.8) 
le point (2) donne P(N, < n) < P(T, < h). Au final, nous avons l'égalité des probabilités. 
LEMooJHMTooQWvOalI 
Lemme 40.6 ([769]). 
Soient À > 0 ett > 0. Nous posons 
t (Ag)*-1 
= TE dr. 40.9 
" [x (a — Di æ (40.9) 
Alors ai 
Tu = ln ex , (40.10) 
n! 


Démonstration. Nous intégrons 1,41 par partie en posant u(x) = x" et v'(x) = Àe-"; w/(x) = 


na}, v(x) = —e-", Cela donne 


17 t 
la Per v'(x)u(x)dx (40.11a) 
* Jo 
n EL 1 t 
L . [are x] + +] nr le "dx (40.11b) 
. . 0 
= — eo e + (40.11c) 
n! 


Lemme 40.7 ([1|). 
Soit un processus de Poisson {N3: (Q — N},cm+ d'intensité À. Pour chaque n € N nous posons 
TT: —+R 


40.12 
wt inf{t > 0 tel que Ni(w) > n}. ) 


Soit t > 0. Pour tout n nous avons 


pe <= [fan ER oROL ooyfA 
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Démonstration. Nous y allons par récurrence sur n. D'abord pour n = 0 nous savons que T0 = 0, 


donc 
P(Nn = 0) = P(D < t) — P(T < Ô). Footer AE 


Nous savons que N,1:4 — N, suit une loi de Poisson de paramètre Àt. En particulier avec s = 0, 
nous voyons que N, suit une loi de Poisson de paramètre M. Donc P(N, = 0) = e-" (définition 
36.129). 

L’équation 40.14 donne donc e-" = 1— P(T <t). Par ailleurs, pour n = 1, l'intégrale (40.13) 
est facile à calculer et donne bien 1 — et. 

Pour la récurrence, en reprenant la notation du lemme 40.6, nous supposons que P(T, < t) = 
1h, et nous prouvons que P(Th+1 <t) = 1h41. Pour cela nous repartons de 


PIN= mn) = PR <Ù = Pins € 6) (40.15) 
et nous substituons P(N, = n) = e-"(Xt)"/n! ainsi que P(T, < t) = I}. Il reste 


_x (Qt)? 
nl 


Pire —e (40.16) 


Et le lemme 40.6 nous indique que le tout est égal à 7,41. 


Voici un théorème donnant des propriétés d’un processus de Poisson. Une réciproque partielle 


est donnée dans la proposition 36.138. 
THOo00YRIMooSREVEO 


Théorème 40.8 ([770, 735, 1]). 
Soit un processus de Poisson {N;: Q — N},-r+ d'intensité À. Pour chaque n € N nous posons 


Tn:Q0—+R 
| (40.17) 
wt inf{t > 0 tel que Ni(w) > n}. 
et Sy = Ty — Ty_1. 

Alors ITEMooSLWOooR jYhBA 
(1) Th est une variable aléatoire. ITEMooHGXTooUdonXa 
(2) Pour tout n, la variable aléatoire (T1,...,Th) a pour densité la fonction 

g:R'—-R 
— (40.18) 
Céies) > Lo<x: <..<xn À € de 
ITEMooGBIXo08jXpsx 
(3) Les variables aléatoires S; sont à densité. ITEMooUTTWooQUhkZh 
(4) La variable aléatoire (S1,...,S) est à densité. ITEMooUZGFooAbCvvG 


(5) (Sn) est une suite de variables aléatoires indépendantes et identiquement distribuées de loi 
exponentielle* &(X). 


ITEMooDXZFooXkklhG 
(6) La variable aléatoire T} suit la loi de densité 
fn: R—R 
mème Os) sis >0 (40.19) 
sr 
sinon. 


Démonstration. En plusieurs parties. 


Pour (1) 


Pour (2) 


4. Définition 36.131. 
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Soient des nombres a; et b; tels que 
0 < ai < b1 < a2 <... < an < bn. (40.20) 


Pour éviter les petits effets de bord, nous supposons que n > 2. Nous considérons les événements 


nm 
An = (V{T € Jai, bi} (40.21) 
i=1 
et 
n—1 n—1 
Ba = ( {Nu — Na = 1} 0 (Nain — No; = 0} N {Nos — Nan > 1} NO {Na = 0}; (40.22) 
=] i=1l 


et nous allons prouver qu’il existe des parties Y et Z de { telles que ° 


A eH GY (40.23a) 
Be A; 07 (40.23b) 
P(Y) = F(2) = 0: (40.23c) 


Courage. 


(1) Quelques valeurs au bord dans À, Soit w € An. 
. PAAAOONRORO CERN 


(la) Sii<n Nous montrons que si à < n, alor 
Na(w) =i-1 (40.24a) 
Ny,(w) € {i — 1,i}. (40.24b) 

Pour cela, rien de tel qu’une récurrence. D’abord 
Ti(w) = inf{t > 0 tel que N,(w) > 1} € Jai, bi]. (40.25) 


Donc Ti(w) > ai et nous déduisons que N,,(w) = 0. De la même manière’, 


Ti(w) = inf{t > 0 tel que N,(w) > 2} € ]as, bi]. (40.26) 


En particulier Ta(w) > a2 > b1 et nous avons M, (w) < 2. Donc M, € {0,1}. 

Soit à < n — 1, et supposons que (40.24) soit valide. Nous avons T;(w) < b;, et donc 
Ni+n(w) > à pour tout h > 0. En particulier N,,,,(w) > i. Mais Ti,1(w) > a;+1. Donc 
Na;s1(w) < i +1. Nous en déduisons que M,,,(w) = 1. 


Comme à + 1 < n nous pouvons encore écrire 


Tio(w) > aire > bis, (40.27) 


donc Ny,,,(w) <i+2. Vu que N,,,(w) > N 


aix1 (w) = à, nous avons M,,,(w) € {i,i+1}. 
(1b) Pour i=n De la même manière, nous avons M,, < n, et Tn-1(w) < an. Nous en 
déduisons N,,(w) >n—1et donc N,, =n—1. 
Nous avons aussi N,,(w) > n —1et, vu que Th(w) € ]an, b,], nous avons M,,+n(w) > n 
pour tout h > 0. 
(2) Une partie de mesure nulle Pour à = 1,...,n, nous posons Z; = {Ny, = i —1}. Ensuite 
nous définissons Z = [J#_, Z. Nous démontrons que P(Z A 4,) = 0. Si we Z n An, alors 
Ni(w) =i-1et N,rn(w) > à pour tout h > 0. Donc 


ZiNnAÂne {Noith — Np, > 1}. (40.28) 


5. Je suis impressionné à quel point cette subtilité est absente de [735]. Soit il y a un truc macroscopique qui m'échappe, 
soit il y a un gros trou dans les livres sur lesquels est basé [735], soit il y a quelque chose que je ne comprends pas. 
6. Nous utilisons le fait que n > 2 pour être sûr ; mais je crois que ce n’est pas nécessaire. 
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— 


Donc 
P(ZiN An) < P({Notn — Ni, > 1}). (40.29) 


En prenant la limite h — 0*, la proposition 40.3 fait que 
P(Z; N An) = 0. (40.30) 


Nous en déduisons que P(Z n A) = 0 


An € Bn uv Z Soit we À4,. Nous devons montrer que si w & Z, alors w € B;, c'est à dire 


(3a) M,(w) — dupe ns .,n—1, 
(3b) Ne, (w) — Ni, (w a 
(3c) Ni, (w) — Na, (w) > 1 

(3d) Na, (w) = 


Sii<n—1, alors N,(w) = i—1et Ny,(w) € {i —1,i}. Mais si w n’est pas dans Z, alors 
ÎNa,(w) = i. Dans ce cas, nous avons bien w € {M, — No, = 1}. 
De même si w est dans À, mais pas dans Z, il vérifie No,,,(w) = à = Np,(w) = i. 


Pour à = n, nous avons N,,(w) = n—1et N,,(w) > n — 1. Et encore une fois, si w n’est pas 
dans 7, alors N,,(w) — Ny,(w) > 1. 


Enfin pour w € A}, nous avons T1(w) = inf{t > 0 tel que N(w) > 1} > a1. Donc M, (w) = 0. 
Nous avons fini de prouver que À, € By L Z. 
P(An) < P(B») En utilisant le lemme 14.22(2), et (4), nous avons 


P(An) < P(Bn 0 Z) < P(Bn) + P(Z) = PB). SCT 


Quelques valeurs au bord pour B, Soit we B,. Nous avons N,, (w) = 0. Donc 


Ti(w) = inf{t > 0 tel que Ni(w) > 1} > a. (40.32) 


De même nous prouvons les valeurs suivantes. Pour à < n nous avons : 


N Hj=i= (40.33a) 

MN (u) = (40.33b) 
et pour à = n nous avons 

Nalw)=n-1 (40.34a) 

NM,(w)zn (40.34b) 


Nous avons donc l’appartenance 
EQooVYVJoo 

Ti{w) € [ai, bi] (10.33) 
pour tout 1 < n. 
Cela n’est pas suffisant pour dire que w € A, parce que la possibilité T;(w) = a; n’est pas 
exclue. 
Une partie de mesure nulle Nous posons Y; = {w € ( tel que Ti(w) = a;}, et nous 
prouvons que P(Y; n B;) = 0. Pour we Yi n B, nous avons No,(w) = i—1et N,,in(w) = à 
pour tout h > 0. Donc pour tout h > 0 nous avons 


Yi 0 Ba € {Nath — Na > 1}, (40.36) 


et donc 
P(F 0 Ban) < P(N, 


di+h 


— Na, > 1). (40.37) 


En utilisant à nouveau le lemme 40.3, nous trouvons P(Y; n B,) = 0. 
Nous posons Y = {J"_, Y:. 
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(7) P(By) < P(A;) Si w € By, nous avons (40.35) : Ti(w) € [a;,b;]. Par définition de Y, si 
w € Bh\Y nous avons 


Ti(w) € Jai, bi]. (40.38) 
Autrement dit, B\Y € A, et donc By € An L Y. Nous en déduisons que 
P(Bn) < P(An U Y) < P(An) + P(Y) = P(An). POP) 
(8) P(A») = P(B») En mettant ensemble (40.31) et (40.39) nous avons 
PA =P(B;)} (40.40) 


Calculons la probabilité de B,. Vu que No = 0, l'événement N,, = 0 peut être écrit N;, — No = 0. 
Donc B, peut être écrit comme intersection d’incréments indépendants. Nous pouvons donc écrire 
P(Ax) comme un produit : 


n—1 n—1 
P(An) = | ] POV Na; = 1) x [ | P(Nas —Noi = 0) x P(No, — Nan Z 1) X* P(Nai = 0). (40.41) 
i=1 i=1 
En posant l; = b; — a; et 0; = a;+1 — b; et en utilisant la formule (36.370) pour 
Àt 
P(Niu—N, =k) = ex! ù , (40.42) 
nous trouvons 
n—1 n—1 
P(A)= LG T EE aie ve) (40.43) 
i=1 i=1 


Note : pour le dernier nous avons posé X = N,, — N,, qui suit une loi exponentielle de paramètre 
\A et nous avons dit P(X > 1) = 1- P(X = 0) = 1- en, Remarquez que l; + 0 = @i1 — &: 
en regroupant les exponentielles, nous avons une somme téléscopique ; au final 


n—1 
P(An) = Mer (1 — en) [ [(4). (40.44) 
i=1 
Pour le plaisir d'ajouter des notations, nous posons 1, = |a1,b1] x ... x Jan, bn]. Cela permet 
d’écrire 
An = {(T,...,Tn) € ln} (40.45) 


et nous incite à calculer ( 1, 9- Pour alléger le calcul suivant, notez que 


fa Hopeteons memes 


a 


Ensuite nous calculons pour de vrai : 


b bn 
] bises = J | L | 22 de 0 dt1...dn (40.47a) 
n ai an 
b bn 
= J Le [Men dm dr cf Fast 2040410) 
ai an 
n—1 bn 
=([]5 J AE "ait (40.47c) 
i=1 an 
= ( ui DES ES (1— 6 Aa-an)) eq. (40.46) (40.474) 
i=1 
| [I AR nl 74) (40.47e) 
i=1 
= P(4;) (40.47f) 
Per (40.478) 


Justifications : 
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— Pour (40.47b). Vu que nous avons choisi ay < b1 < ... < an < bn, nous avons toujours 
Îlo<x.<..<rx, = 1. La fonction à intégrer ne dépend pas de æ1,...,%n-1. Les intégrales sur 
T1,-.., En—1 Sont immédiates, et nous avons 


Nous savons que les T; sont à valeurs dans R*. Donc sur les pavés N contenant des coordonnées 
négatives, nous avons P((T1,...,17,) € N) = 0. Heureusement nous avons aussi (;; g(x)dx = 0. 

En prenant tous les pavés /, ainsi que tous ceux avec des coordonnées négatives, nous en- 
gendrons les boréliens. Le lemme 36.24 conclut que la fonction g proposée est une densité pour 
(Tisses ne 


Pour (3) 
Pour (4) 
Pour (5) 


(1) Densité pour (5:,...,5») 
Le point (4) nous indique que ($51,...,$,) est à densité. Nous notons h: R” — R sa densité. 
Soit une application borélienne f: IR? — IR. En posant 


m:R°" — R" 
(40.48) 
Ci Gr tn) ne (t1,t2 — Lise — bit) 
nous avons 
EPS al) = ECOLE =D Tri) (40.49a) 
= Eos) (40.49b) 


[. roma “HPReGES oz) 


Luomo do dtrar SRE 
= fre \(g 0 d\(a)de SUBEQOOETUFOpEY100Q 


(40.49f) 


Justifications. 
— Pour (40.49c), c’est le lemme 36.85(2). 


— Pour (40.494), nous effectuons le changement de variables © pour la bijection linéaire 
o:R"—R" 
li + (40.50) 
(see ble ; . 
tt +... +in 


Notons que @ est de déterminant 1 : c’est une matrice triangulaire avec des 1 sur la 
diagonale. 


— Pour (40.49e). Parce que (mo d)(x) = x dans R”. 


Bref, pour toute application borélienne f: IR? — IR, nous avons 


EU (Brisesn)) = L. f(x)(g o D)(x)dx. (40.51) 


7. Formule (14.886). 
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Le lemme 36.87 nous indique que go 6 est une densité pour ($1,...,8,). Plus explicitement, 
la densité de (51,...,Sh) est 
h:R'—-R 
ge mr (a)Ne NEiteten), mn 
+ 


(2) Densités marginales La proposition 36.88 nous assure que les variables aléatoires S; sont 
à densité et que pour trouver les densités, il suffit d'intégrer. La densité de S; est 


AO J NC ann (40.53) 
Rr-1 + 
Les différentes intégrales sont indépendantes et valent 
1 00 
J Looç(u)e "du = ER (40.54a) 
R À 0 
l 
= (0 — 1) (40.54b) 
1 
Au final, nous avons 
’ É EQooBZNBoo 
hu) = Loop(u) Xe. PAR 


(3) Conclusions Nous voyons que (40.55) est la densité d’une loi exponentielle (définition 
36.131). La proposition 36.89(2) nous dit que les S; sont indépendantes. 


Pour (6) 


DEFooWXHEooEHQUIJU 
Définition 40.9. 
Une famille de variables aléatoires (N4)1>0 est un processus de Poisson d'intensité À si il existe 
une suite de variables aléatoires indépendantes et identiquement distribuées (T)ren de loi expo- 
nentielle® &(X) telles que 


nm 
N, = sup{n > 0 tel que > Ted: (40.56) 
k=1 


Plus explicitement, un processus de Poisson sur espace probabilisé (Q, A, P) est une famille de 
variables aléatoires N,: Q — N telles que qu'il existe des variables aléatoires Ty: Q — R vérifiant 


Ni(w) = sup{n > 0 tel que > Titi) < 6} (40.57) 
k=1 


pour tout w € (1. 


Si nous posons S, = »}_, T4, alors nous avons une expression plus pratique pour N, : 


Le) 


Ni = lis,<n- (40.58) 


n=1 
Nous avons par la proposition 36.138 vu que N; - Z(Xt). 
Pour chaque w € , la fonction t + N;(w) est une fonction (pas du tout strictement) croissante 
à valeurs dans N. Cette fonction part de 0 et fait un saut de taille 1 après des intervalles de temps 
Ti(w), Ti(w), etc. Elle est continue à droite. 
Nous avons les égalités d'événements suivantes qui sont pratiques : 


(s<he<t=iN>n>N.) (40.59a) 
iM=n si Ste ik (40.59b) 


8. Définition 36.131. 
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THOooVDMCooVycib)j 
Théorème 40.10. 
Les variables aléatoires (N;):20 forment un processus de Poisson d'intensité À si et seulement si 
elles vérifient les trois propriétés suivantes. 


Accroissements indépendants Pour tout choix 0 < to < t1 < ...tn, les variables aléatoires 
N4,, — M, sont indépendantes. 


Accroissements stationnaires $10 <s<tet h>0 alors 
L 
Niihn — Not = N;— N:, (40.60) 


c’est-à-dire que les accroissements décalés suivent les mêmes lois. 


Poisson Pour tout t nous avons N4 suit une loi de Poisson® : N; = P()t). 


: 6 . | £ 
Une conséquence des accroissements stationnaires est que N; — N, = N,_, — No = Ny_, parce 
que No = 0. 


Proposition 40.11. 
Si (N:) est un processus de Poisson d'intensité X, alors 


lim Ne = +00 (40.61) 
presque surement. De plus 
EE DU) 
presque surement. 
La relation (40.62) est appelée loi des grands nombres. 
Démonstration. Par définition nous savons que 
N4 = sup{n > 0 tel que S, < t}. (40.63) 
Évidemment la fonction {++ N, est croissante, donc la limite 


Jim Ni(w) (40.64) 


existe dans [0,00]. Nous pouvons nous restreindre à { € NN et considérer L(w) = lims_,4 Na(w). 
Par somme télescopique avec M = 0, 


Na Dimi(Ne = Noi) FaRps) 


n nm 


Étant donné que le processus est de Poisson, les variables aléatoires (Ny — Ny-1)x-1..n sont 
indépendantes et suivent toutes la loi de N; — No, c’est-à-dire la loi de N;. Encore par le fait que 
N; soit de Poisson nous savons que N, + (À). La loi des grands nombres (36.114) appliquée aux 
variables aléatoires Ny — N;_, nous dit que 

Nhn ps. 

E(N)=)>0. (40.66) 
Du coup N, — c et L(w) = 0. 

Nous démontrons maintenant la loi des grands nombres pour les processus de Poisson. Étant 

donné que pour les entiers N,/n — À, pour les réels, si la limite existe, ça ne peut pas être autre 
chose. Si nous notons f la partie entière de te R*, 


A PT 
t t t. 


(40.67) 


9. Définition 36.129. 
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Le second terme est relativement simple à traiter : 


N NN; t 
Se (40.68) 
t t t 

— À 1 


où nous avons utilisé le premier point, t étant entier. Pour le premier terme nous savons que + N, 
est croissante et donc que 
Ni Ni Nu M Nu Nt+1 


= 


t t t+1 t 


(40.69) 


Le second facteur tend vers 1 lorsque t — 0. Le premier s’écrit 


me cafe 


nm 


et tend vers zéro en tant que terme général de la série (40.65) qui converge. 


Proposition 40.12. 
La variable aléatoire N;/t est un estimateur sans biais de À. De plus il converge vers À en moyenne 
quadratique. 


Démonstration. Vu que N,/t — À presque surement, la variable aléatoire N,/t est un estimateur 
de À. Le fait qu'il soit sans biais a été fait dans l’exemple 37.25. 
D'autre part nous avons (voir théorème 36.130) 


N: 1 À 
Var (:) = 72 Var(N) a (40.71) 


En appliquant la formule Var(X) = E(X?) — E(X)? à X = N,/t nous trouvons 


2 
E (#) = : x. (40.72) 


L2 
Cela montre que ke — À. 


Pour le théorème central limite d’un processus de Poisson, nous visons un résultat du style de 


1 
=D, Xi mn 2, 


ovn 


Nous écrivons le théorème central limite pour le nombre de sauts que le processus de Poisson a 
connu en un temps t. Le rôle de la moyenne empirique est joué par N;. Nous considérons avoir 
fait une seule expérience qui a duré un temps t. Donc le rôle de n est joué par 1 (et non t comme 
on pourrait le croire). Pour le reste, le nombre de succès en un temps t{ d’une variable aléatoire 
exponentielle de paramètre À est une variable aléatoire de Poisson de paramètre À, en vertu de ce 
qui est raconté au point 36.5.8. C’est cela qui motive l’énoncé suivant. 


N(0,1). (40.73) 


ThoCSuLLo 
Théorème 40.13 (Théorème central limite pour les processus de Poisson). 
Si (N4)1>0 est un processus de Poisson de paramètre À, alors nous avons 
N - 
: Æ, N(0,1). (40.74) 


VXt 


Remarque 40.14. 
Avant de nous lancer dans la démonstration, remarquons que si nous nous limitons à t € N, alors 
nous avons 


Nan D CNe — Ng-1) — Mn 
VAn VAn 


(40.75) 
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or par définition nous avons les égalités de lois 


Ny- Ni Me PUY, (40.76) 
donc , : 
Sn — À p9n— À  yo9n d (40.77) 
Van O2 Var 
ce qui est exactement le théorème central limite pour une suite de lois de Poisson !°. 
Démonstration. Nous écrivons t la partie entière de t et nous décomposons : 
Ni—Xt N-N; N;-X X- (40.78) 


+ ; 
VAE VAL VAt VAL 


En ce qui concerne le terme B, nous avons 


IN) 
=" #01) 40.79 
. (0.1) (40.79) 


Notons que nous utilisons le fait que si a, — 1 (en tant que suite de nombres) et si X, — (0,1) 
(limite en loi), alors an Xn — (0,1) en loi. 
Le terme C' est également facile parce que At — Àt est majoré en norme par À. Du coup 


A — (40.80) 


Donc limy_,0 C = 0. 
Reste à travailler sur À. Vu que t — N, est croissante, la différence N, — N; est positive. Soit 
n > 0, nous avons 


P(IA] > 9) = PM Ne > Vin) < P(Nsn — N5> Vin) = P(M > nV At) (40.81) 
parce que nous savons que N;,, — N; + Ni + (À). En vertu des propriétés de la loi de Poisson, 
lim P(M > VX) = 0. (40.82) 


En effet si Z est une variable aléatoire de Poisson de paramètre À nous avons 
00 . 90 JE 
P(Z > 1) = 20 =k)=e à de (40.83) 


Nous reconnaissons la queue de série de e*, qui tend donc vers zéro lorsque { — 0. Nous avons 
donc prouvé que 
Jim P(IA| > 7) =0, (40.84) 


c’est-à-dire la convergence en probabilité de À vers zéro. 
Nous avons montré que 


BOUM (40.85a) 
À 7 $; (40.85b) 
Le lemme de Slutsky (36.105) nous avons une convergence du couple 
(A B4 0) € (0,0): (40.86) 
Utilisant le corolaire 36.107, nous trouvons la convergence en loi 


A+(BEO0E0 (40.87) 


ce qu'il fallait. 


10. Au fait près que nous devrions encore montrer que $, est de carré intégrable. 
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PROPooWAVPooHDVsER 
Proposition 40.15. 
Si N4 est un processus de Poisson !!, alors les variables aléatoires X, = N, avec n € N forment 
une chaine de Markov !?. 


J'espère qu’un jour une preuve arrivera ici : https://math.stackexchange.com/q/4563414 


40.2 Quelques trucs sur la simulation 


Le théorème ergodique dit que 


N 
r(x)= lim le (40.88) 
C’est avec cela qu’on calcule (x) à partir d’une simulation de chaine de Markov. 


40.2.1 Le théorème central limite pour Markov 


THOo0BCKQooCkoUEV 
Théorème 40.16 (Version allégée). 
Si(X») est irréductible et positive récurrente, alors pour toute fonction f, 
Me 4 
— -N | jdn  N(0, 0?) (40.89) 


où o? dépend de la fonction f et de la chaine de Markov. 


Tai, far = Xe one). 
Nous allons simuler la variable aléatoire 
2-7 D FX) — NE rats) (40.90) 


et puis on va mettre sa réalisation dans un histogramme. Dans le cas où on prend f(i) = 1;-;,, il 
y a de la simplification dans l'intégrale qui devient 


1 VE | 
Z = 7 p Lx. ta) | (40.91) 


A40.2.2 Feuille 5 


On pose 
Dh = Vnsup|Fh(x) — F(x)|. (40.92) 
zeR 


On en génère un millier de fois D, on note D$ ) ces réalisations, et on regarde ce que vaut 


1 1000 
0 > p{o>e. (40.93) 
k=1 
Cela nous donne une approximation de 
P(vnsup|F(x) — F(x)| > c). (40.94) 
zeR 


Note que chacun des D® demande de créer un nouveau vecteur Y; de lois qu’on veut regarder. 
Par exemple de loi exponentielle. 


11. Définition 40.9. 
12. Définition 38.1. 
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40.2.3 Feuille 6 


Pour créer une fonction qui renvoie à avec probabilité p; pour 4 = 1,2,3, on peut faire 


U - 410,1] (40.95) 
et puis on à 
P(U < po) = po (40.96a) 
P(po <U < po + p1) = pr (40.96b) 
P(po + p1 < U < pa) = p2. (40.96c) 


Une façon de faire une loi uniforme [0, 1] est de faire rand 
40.2.4 Feuille 7 
L'échantillon est (Y1,...,Y,) et nous écrivons le vecteur 
Y = XB+e (40.97) 


où Ÿ = W(XB,0?Id)ete = .W(0, 0? Id). Nous utilisons le principe de maximum de vraisemblance. 
Soit (y1,...,Yn) un échantillon et 


._ yt8\2? 
Po(y1;...;Yn) = (5 = exp -; (HSE) | ; (40.98) 


i 


L’astuce est de faire que y; — X{B est la iième composante du vecteur Y — XB et donc la somme 
qui est dans l’exponentielle devient la norme de Y — XB : 


ie (x) sv an -x8| (10.99) 


On passe au logarithme et on dérive par rapport à o?. Attention : la variable est o?, donc la dérivée 
de o? est 1 et non 20. Bref, on trouve 


1 
2 
= XP]. 40.1 
où = LIU + X6| (40.100) 


40.2.5 Simuler des lois conditionnelles 


Nous voulons générer des couples (X, Y) tels que Ÿ prend les valeurs 0 ou 1 et tels que 


P(XI|Y = 0) + #() (40.101a) 
PRIE eu): (40.101b) 


Le plus simple est de générer une liste 


C0) on) (40.102a) 
(X2,0) LC) (40.102b) 
(X3,0) Du) (40.102c) 


avec X1, X2, X3 É &(Ào) et X4, X5, X6 ce &(Ai). 

Avec cette méthode cependant la liste est triée et en plus on a autant de 1 que de 0. On 
peut faire un peu plus technologique pour corriger cela. Pour créer un couple, on commence par 
Y = Z(p) et puis suivant que Ÿ = 0 ou y = 1, on génère X + 6 (1) ou X + (A). 
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Chapitre 41 


Langages 


41.1 Alphabets et mots 


Définition 41.1. 
Un alphabet est un ensemble fini de symboles appelés lettres. 


On utilise aussi parfois le terme vocabulaire pour désigner un alphabet. 


Définition 41.2. 
Un mot sur l’alphabet Y est une suite finie et ordonnée, éventuellement vide, de lettres de Y. Le 
mot vide est toujours noté €. 


Définition 41.3. 
La longueur d’un mot w, noté |w|, est le nombre de lettres constituant le mot w. Le mot vide a 
une longueur de 0. 


Soit w un mot de longueur k, on peut désormais noter w = wi - --wx, où chacun des w;,1 <i<k 
représente une lettre de w. Par convention, si & = 0, alors le mot w est le mot vide. 


Définition 41.4. 

Soient w un mot sur l’alphabet Y et a € Y une lettre, le nombre d’occurrences de la lettre a 
dans le mot w, noté |w|l,, est le nombre de fois où apparaît la lettre a dans le mot w, c’est-à-dire 
le cardinal de l’ensemble {i | wi = a,1 <i< |wl}. 


Définition 41.5. 
Soit Z un alphabet, l’ensemble des mots non-vides sur l'alphabet Y, noté ZT, est l’ensemble : 


ET = {ao = u1...un,n > 0} (41.1) 


Définition 41.6. 
Soit © un alphabet, l’ensemble des mots sur l'alphabet Y, noté X*, est l’ensemble : 


2° = {w = u1...un,n > 0} (41.2) 


Des deux définitions précédentes, on tire l'égalité suivante : 


D*=>+u{e} (41.3) 


Définition 41.7. 
Soient Y un alphabet et x,y € X* deux mots sur l'alphabet Y de longueur respective n et m, le 
produit w de x et y, noté x * y est défini par w = x1...ÆnY1...Ym-. 


Le produit est également appelé concaténation. 


Proposition 41.8 (Longueur du produit de deux mots). 
La longueur du produit de deux mots x et y est la somme des longueurs des mots x et y. 
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le yl= xl + y (41.4) 


Proposition 41.9 (Monoïde (X*, - ,€)). 
L'ensemble Z* muni de l’opération produit d’élément neutre £ est un monoïde!. 


Démonstration. Soient x,y,z € X*, avec les définitions précédentes, on peut vérifier facilement 
que : 

— le produit est une loi interne : x : y € X*: 

— le produit est associatif : & + (y : 2) = (x * y) * z; 


— € est l'élément neutre du produit :æ'°E=E: x = x. 


Le produit n’est pas commutatif. 


Définition 41.10. 
Soient X un alphabet et w € X*, la puissance n°d’un mot w, notée w"”, est définie par : 


À sin = 0 


w -w"l sin>0 


41.2 Langages 


Définition 41.11. 
Un langage sur un alphabet Y est un sous-ensemble de X*. C’est un ensemble de mots sur l’al- 
phabet Y. 


Un langage étant défini comme un ensemble, on peut appliquer toutes les notions de la théorie 
des ensembles aux langages. 


Définition 41.12. 
Le langage vide, noté © est le langage qui ne contient aucun mot. 


Définition 41.13. 
Le langage unité est le langage qui contient uniquement le mot vide : {e}. 


Définition 41.14. 
Soient X un alphabet et L:, Lo € X* deux langages sur l’alphabet Y, on définit le produit L de LE; 
et La, noté Li.L2 par : 

L = L:.Lo — {u ‘ Uj,U] € Li,uo E Lo} (41.5) 


Le produit de langages est également appelé concaténation. Il ne faut pas confondre le produit 
de langage avec le produit cartésien de deux ensembles. Le langage unité est l’élément neutre du 
produit de langages. 


Proposition 41.15 (Distributivité du produit de langage par rapport à l’union). 
Le produit de langage est distributif par rapport à l’union. Soient YZ un alphabet et L;, Lo, L3 € X*, 
alors : 


Li.(Lo U La) = (L1.Lo) U (La.Ls) et (La LU La).L3 = (L1.Ls) U (La.Ls) (41.6) 


Démonstration. Soit w € Li.(L2 L L3), montrons que w € (Li.L2) L (L1.L3). wi € Li,w € 
La © L3,w = wi : w’. Donc w’ € L2 ou w'€e L3. Si w’ € Lo, alors w = wi : w’ € L1.L. Si w'e La, 
alors w — V1 * w' € L;.L3. Donc, w € (L1.Lo) U (L1.La). Donc Li.(Lo U L3) € (L1.L2) (eg (L1.La). 


1. Définition 6.23. 
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Soit w € (L1.L2) L (L1.L3), montrons que w € Li.(L2 L La). w € Li.L2 ou w € Li.L3. Si 
w € Li.La,i avec à € {2,3} alors wi € Li1,w; € L;,w = wi * wi. Donc w € L1.(L2 L La). Donc, 
(L1.Lo) U (L1.L3) € Li.(Lo U L3) 

Donc (L1.Lo) LU (L1.L3) = Li.(L U L3) 

L'autre partie de la proposition se montre de manière analogue. 


Définition 41.16. 
Soient Y un alphabet et L € Y*, la puissance n°du langage L, notée L” est définie par : 


an - [9 sin =0 


LILI gn>0 


Définition 41.17 ([771]). 
L'étoile de Kleene est un opérateur unaire noté *x. L’itéré d’un langage L, noté L*, est l’appli- 
cation de l'étoile de Kleene à un langage L et est défini par : 


L* = | JL (41.7) 
iz0 


En particulier, on remarque que le mot vide fait toujours partie de l’itéré d’un langage, y 
compris quand ce même langage ne contient pas le mot vide. 


Définition 41.18. 
L'’itéré strict d’un langage L, noté L*, est défini par : 


L+ = JL (41.8) 
i>0 


Proposition 41.19 (Relations entre itéré et itéré strict). 


Soit L un langage, alors on a : 
EF = ET ue) (41.9) 


L'eRErerrE (41.10) 
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Chapitre 42 


Utilisation dans les autres sciences 


Dans ce chapitre nous donnons des applications de divers théorèmes dans les autres sciences 
que la mathématique. 


42.1 Démystification du MRUA 
SecMRUAsecondeGGdQoT 
42.1.1 Preuve de la formule 


Nous sommes maintenant en mesure de donner une démonstration complète de la formule du 


MRUA : . 
te) = Es + vot + To. FREE, 


Au niveau de la physique, nous considérons un mobile qui se déplace avec une accélération 
constante a. Nous notons par vo sa vitesse initiale et par to sa position initiale. 

Nous savons que, pour tout mouvement, si x(t) est la position en fonction du temps, et si u(t) 
et a(t) représentent la vitesse et l'accélération en fonction du temps, alors 


u(t)=z(t) et at) = v'(t) = x"(#). (42.2) 


Afin de trouver x(t) en connaissant a(t), il « suffit » donc de prendre deux fois la primitive. Essayons 
ça dans le cas facile du MRUA où a(t) = a est constante. 

La vitesse v(t) doit être une primitive de la constante a. Il est facile de voir que v(t) = at est 
une primitive de a. Par le corolaire 12.202(bis), 


v(t) = at + Ci EYES 


pour une certaine constante C1. Afin de fixer C1, il faut faire appel à la physique : d’après la 
formule (42.3), la vitesse initiale est v(0) = Ci. Donc il faut identifier C1 à la vitesse initiale : 
Ci = vo. Nous avons donc déjà obtenu que 


v(t) = at + vo. (42.4) 
Afin de trouver x(t), il faut trouver une primitive de v(t). Il n’est pas très difficile de voir que 
at?/2 + vot fonctionne, donc il existe une constante C2 telle que 
2 


(#) = + vot + C2. (42.5) 


Encore une fois, regardons la condition initiale : la formule donne comme position initiale (0) = C2, 
et donc nous devons identifier C2 avec la position initiale x0. En définitive, nous avons bien 


at? 
at) = ed vot + xo. (42.6) 


Cette formule est donc maintenant démontrée à partir de la seule définition de la vitesse comme 
dérivée de la position et de l’accélération comme dérivée de la vitesse. 
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Remarquons cependant que la preuve complète fut très longue. En effet, nous avons utilisé les 
règles de dérivation de la proposition 12.174, pour la démonstration desquels, les résultats 12.9 
et 12.8 ont étés utiles. Mais nous avons surtout utilisé le corolaire 12.202(bis) qui repose sur le 
théorème de Rolle 12.192, qui lui-même demande le théorème de Borel-Lebesgue 10.19 dans lequel 
la notion d'ensemble compact a été cruciale. 


42.1.2 Interprétation graphique 


La distance parcourue x(t) en un temps t est la primitive de la vitesse. Nous savons, par ailleurs, 
que la primitive est liée à la surface ! sous la courbe. Pour reprendre les mêmes notations, nous 
notons 5,(t) la surface contenue en dessous de la fonction vw entre 0 et x. Nous ne serions donc pas 


étonné que 
2 


t 
Sult) = _. + vot + To ÉqEn cor eMRUISYE, 


soit la surface en dessous de la fonction v(t) = at + vo. Nous voyons que la surface totale sous la 
fonction v(t) = at + vo est exactement 
at? 


Sy(t) = 9 + Vot. (42.8) 


Cela est un bon début, mais hélas nous ne retrouvons pas le terme « +x9 » de la formule (42.7). 
Cela n’est pas tout à fait étonnant parce que nous savons que la surface sous une fonction était une 
primitive de la fonction, mais nous n’avons pas dit laquelle. D’après le fameux corolaire 12.202(bis), 
la primitive n’est définie qu’à une constante près. Ici, c’est la constante x0 qu’on a perdue en chemin. 

Nous parlerons plus en détail du lien entre les surfaces et les primitives dans la section dédiée 
à l'intégration. 


42.2 Relativité en mécanique newtonienne 


42.2.1 Relativité du mouvement 


Prenons quelqu'un qui court le cent mètres en onze secondes. Par rapport à un spectateur 
dans les gradins, il se sera déplacé de cent mètres. Mais si je cours à côté de lui de telle façon à 
avoir parcouru 80 mètres le temps qu’il en fasse cent, alors par rapport à moi l’athlète ne se sera 
déplacé que de 20 mètres. Par contre, par rapport à mon chronomètre, il aura également mis onze 
secondes : ce n’est pas parce que je cours que mon chronomètre s’affole ! 

Entre moi et les spectateurs, on a donc une loi de transformation 


z'= x vt f=t. FaTrenpsg) 


C'est-à-dire que la distance x’ qu’aura parcouru l’athlète par rapport à moi vaut la distance x 
parcourue par le spectateur moins la distance que j’ai courue moi-même, c’est-à-dire moins vt. 


42.2.2 Bob et Alice 


Formalisons le concept de changement de repères. Pour cela, prenons deux amoureux, Bob et 
Alice ?. Mettons que Bob reste assis sur un banc pendant qu’Alice court en ligne droite à une 
vitesse v. Tout deux déclenchent leur chronomètre quand Alice passe devant Bob. À tout moment, 
Bob et Alice ont leur repères de temps et d’espace. Par exemple si après un temps t, Alice voit 
une peau de banane à 1 mètre devant elle, elle va dire « Il y a une peau de banane à un mètre. », 
tandis que Bob va dire « Il y à une peau de banane à (1 + vt) mètres ». 

Plus généralement, si il se passe quelque chose à la position x au temps t{ pour Bob, ce quelque 
chose se passera au temps #’ = t à l'endroit à’ = x — vt pour Alice parce qu’en un temps t, elle 
aura déjà avancé d’une distance vt. 

Ca c’est ce dont tout le monde était persuadé depuis Galilée jusqu’au début du vingtième siècle. 


1. L'intégrale d’une fonction entre deux valeurs de t donne l’aire sous la courbe. 
2. C’est plus poétique que dire « soient À et B deux observateurs ». 
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42.3 Invariance de la vitesse de la lumière 


42.8.1 Champ de gravitation et électrique 


Nous savons que la force de gravitation s'écrit : 


mm 


Forav = G 


r2 ? 


tandis que la force électrique entre deux charges q et q/ est donnée par 


F. elec — ag” FaRappe/ ht 


r? 


Nous avons aussi fait remarquer que dans le cas de la gravitation, la force a l’air d’être instantanée, 
et que cela posait quelques problèmes conceptuels. La force électrique a apparemment le même 
problème. Une différence entre les deux est qu’une charge électrique c’est tout petit et qu’on 
peut expérimenter à souhait, tandis que pour avoir une masse dont on peut mesurer le champ de 


gravitation correctement, il faut quelque chose grand comme la Terre *. 


42.3.1.1 Finitude de la vitesse de propagation de la force électrique 


directement. Quand il s’arrête, tu ne l’entends plus. Si le micro est placé à 600 m de toi, tu ne 
commenceras à l’entendre que deux secondes après le commencement du son, et tu continueras à 
l'entendre deux secondes après qu’il a fini. 

Eh bien, pour la force électrique, on à pu mesurer que c’est la même chose (sauf que ça va 
beaucoup plus vite). Si on place une charge quelque part, on ne ressent la force (42.10) qu’après 
qu’elle a eut le temps d’arriver. Si on déplace la charge électrique, on continue à ressentir la même 
force pendant un certain temps : il faut que la modification du champ électrique ait le temps 
d'arriver. Exactement comme quand on fait des remous quelque part dans un étang : il faut du 
temps que les remous arrivent plus loin. 

On a pu faire des dizaines d'expériences de ce type avec l'électricité, le magnétisme et la 
lumière ; et les résultats sont clairs : il faut du temps pour que ça se déplace. Tout cela provoque 
des ondes électromagnétiques qui se déplacent à une vitesse finie. On peut produire de telles ondes 
avec n'importe quel courant électrique alternatif. 


42.3.1.2 Pourquoi pas la gravitation ? 


La gravitation telle que donnée par Newton pose le même problème de vitesse de propagation 
que l'électricité. Est-ce qu’en réalité la gravitation se propage également à une vitesse finie ? 

Avec la gravitation c’est beaucoup plus compliqué parce qu’elle est beaucoup plus faible, et donc 
c’est beaucoup plus difficile à détecter. D’après la théorie d’Einstein de la gravitation, la gravitation 
devrait également produire des ondes gravitationnelles. Seulement, si un simple courant électrique 
suffit pour mesurer une onde électromagnétique, afin de mesurer une onde gravitationnelle, il 
faudrait un déplacement de masse de l’ampleur d’une étoile qui explose. Or ça, on ne sait pas 
produire dans un laboratoire. 

Des ondes gravitationnelles ont été observées pour la première fois en 2016[772]. 


42.3.2 Support du champ : pas d’éther 


Nous avons dit qu’une onde électromagnétique se propage comme une onde sonore (quoique 
beaucoup plus vite). Une question se pose alors. En effet, une onde sonore est matérialisée par de 
l'air qui vibre. Qu'est-ce qui vibre pour une onde électromagnétique ? 


3. Une autre différence fondamentale est qu’il existe des charges électriques négatives, mais pas de masses néga- 
tives ; de ce fait on ne peut pas construire d’isolant gravitationnel, contrairement aux isolants électriques qui existent. 
Cela augmente encore la difficulté de faire des expériences avec la gravitation. 
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Étant donné que les ondes électromagnétiques se propagent dans le vide (c’est pour ça que la 
radio fonctionne dans l’espace), la question est problématique. Les physiciens ont donc supposé 
que tout l’univers était rempli d’un fluide invisible appelé l’éther. L’électromagnétisme consiste 
en une vibration de l’éther, exactement comme l’acoustique consiste en une vibration de l’air. 

En fait, vérifier cette hypothèse n’est pas très compliqué. En effet il n’y à aucune raison que 
l’éther suive la Terre dans son mouvement. Or la Terre se déplace à environ 30 km/s autour du 
Soleil. Donc les ondes électromagnétiques doivent se propager plus vite dans le sens du mouvement 
de la Terre que dans le sens perpendiculaire. Tout comme le son se propage plus vite dans le sens 
du vent. 

La célèbre expérience d’interférométrie de Michelson-Morley[773] a mesuré cet effet . ..et ce fut 
la consternation : il n’y a aucun effet ! Or, la lumière se déplace à 300.000 km/s * ; une variation de 
30 km/s devrait être détectable! 

Mais rien! On a recommencé les expériences dans tous les sens, à tous les mois de l’année, à 
tous les endroits de la Terre. On n’a pas observé un poil de variation de la vitesse de la lumière. 
Et ça, ça pose un gros problème à la physique. 


42.3.3 Le problème 


Si je joue au football dans un train qui avance à 100 km/h et que je lance une balle à 20 km/h, 
quelqu'un au sol mesura la vitesse de la balle soit à 120 km/h soit à 80 km/h d’après que l’on ait 
shooté vers l’avant ou l'arrière du train. Cela paraît logique. Mais ce qu’on vient de voir c’est que 
ça ne marche pas avec la lumière. 

Si un train avance à 100.000 km/s et qu’on y allume une lampe de poche, la lumière avancera 
à 300.000 km/s par rapport au train et 400.000 km/s par rapport au sol. Non! Justement pas! La 
lumière avancera quand même à 300.000 km/s par rapport au sol. 

Là encore, on a fait des dizaines d’expériences partout, sur Terre, dans des avions, dans l’espace 
avec des atomes, des lampes de poche et des horloges atomiques, et dans tous les sens, le sens de 
déplacement de la Terre, le sens inverse, le sens perpendiculaire, vers le haut, vers le bas : rien! 
Personne n’a jamais observé un rayon de lumière se déplacer à une autre vitesse que 300.000 km/s. 

Le problème est que le principe d’addition des vitesses est faux pour la lumière. Puisque l’ex- 


périence nous force, nous devons faire avec. 
LoiVitLum 


Loi numéro 1. 
La réalité est que la vitesse de la lumière est la même dans tous les référentiels. On note c cette 
vitesse. C’est une constante fondamentale de la Nature. 


Etant donné que c’est une loi expérimentale, nous n’y pouvons rien. C’est la nature qui est 
comme ça. En particulier tu ne peux pas en vouloir à ton prof de physique d’avoir inventé une 
théorie compliquée. Ce n’est pas lui qui l’a inventée et ce n’est pas de sa faute. 


42.4 Conséquences 


C’est maintenant que les choses vraiment graves commencent (cela soit dit sans vouloir te 
faire peur). Afin d’un peu simplifier les choses, nous n’allons étudier que les mouvements en une 
dimension, c’est-à-dire sur une droite. 


42.4.1 Ligne d’univers 


Un événement a une coordonnée (t,x). Si je pose un objet juste à mes pieds (disons en x = 0), 
ses coordonnées seront à tout moment (t,0). Il est bon de voir cette coordonnée comme l’équation 
paramétrique d’une droite horizontale dans le plan des coordonnées + et x. Plus généralement 
quand un mobile effectue un mouvement x(t), on appelle la ligne d’univers du mobile la ligne 
(pas forcément droite) (t,x(t)). Dans le premier exemple, on avait x(t) = 0 pour tout t. 


4. 299.792.458 m/s très exactement 
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Le cas d’un mobile se déplaçant à vitesse constante v donne comme ligne d’univers la droite ° 
(t,xo + ut), et un objet qui se déplace selon un MRUA à comme ligne d’univers 
at? 
(é, To + vot + D 


42.4.2 Transformations de Lorentz 


Reprenons les amours scientifiques de Bob et Alice, mais cette-fois, analysons celles-ci en tenant 
compte du fait que la vitesse de la lumière soit invariante. Maintenant, si Bob voit se passer quelque 
chose au temps t à l’endroit x, on va dire qu’Alice voit cette chose au temps t’ à la position x, et 
on va chercher (t/,x/) en fonction de (t,x). 

Posé en termes démarque, le problème s’énonce ainsi : trouver les fonctions f et g telles 
que les formules | 


d = f(t,x) (42.11a) 
= ÿ(4,7) (42.11b) 
donnent les coordonnées vues par Alice pour un événement vu par Bob à l’instant t au point x. 
Une première étape importante est franchie par la proposition suivante ©. 


Proposition 42.1. 
Les fonctions f et g contenues dans les transformations (42.11) sont nécessairement linéaires 
(affines), c’est-à-dire qu’elles doivent s’écrire sous la forme 


V=at+Br+p 
x’ = yt + Ôx + q 


pour certaines fonctions a, B, y, 0, p et q de la vitesse d’Alice relativement à Bob. 


Démonstration. Pendant qu’Alice court et que Bob la regarde, ve tente de lancer une pierre sur 
Alice (Eve est jalouse). Bob et Alice regardent deux événements. Le premier est la pierre qui quitte 
la main de Eve, et le second est la pierre qui percute le sol. Pour Bob, le jet s’est passée au temps 
to au point &o, et la pierre touche le sol un petit peu plus tard, au temps to + At et un peu plus 
loin, au point zo + Az. Bob écrit donc ceci sur sa feuille de papier : 


Ei — (to, to) 
E2 = (to + At, to + Ax), 


tandis qu’Alice, en observant les mêmes deux événements, aura noté 


Ef = (f(to, o), g(to, to)) 
E = (f(to + At, x0 + Ar), g(to + At, ro + Ax)). 


Bob et Alice se demandent combien de temps la pierre est restée en l’air et quelle distance elle a 
parcourue. Par le principe général d’homogénéité, les deux seules quantités pertinentes (qui ont 
un sens physique) pour Bob sont (to + At) — to et (x0 + Ax) — x0, c'est-à-dire At et Ax. En effet, 
si Bob avait choisi de s’asseoir autre part et si Alice avait commencé à courir un peu plus tard, ça 
n'aurait rien changé à la longueur du jet de Eve. 

D'une façon ou d’une autre, il doit exister une façon de déduire les mesures de Alice en connais- 
sant celles de Bob; je ne connais pas avec quelles formules, mais ces formules ne peuvent contenir 
que At, Azx et v parce que ce sont les seules quantités qui définissent tous les événements. 

Cela dit, Alice va caractériser le mouvement de la pierre avec la différence des coordonnées 
entre le jet et la chute sur le sol mesurées par elle-même. En d’autres termes, pour Alice ce qui 
compte c’est la différence entre E! et E5, soit 


(f(to + At, xo + A), g(to + At, 0 + Ax)) — ({(to, vo), g(to, ro)). "835 


5. bon exercice de révision de ton cours de math de vérifier que c’est une droite. 
6. dont je te suggère fortement de ne pas lire la preuve si tu ne veux pas que ton cerveau éclate. 
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Mais nous venons de signaler que ce qu’Alice mesurait devait pouvoir être exprimé en termes de 
At et Az. Nous concluons que la différence (42.12) ne dépend en fait pas de x et t mais seulement 
de Ax et At. 

Prenons maintenant une notation plus compacte et notons X = (t,x), AX = (At, x) puis 
F = (f,g). Avec ça, l'expression (42.12) se note F(X + AX) — F(X). Comme mentionné, cette 
expression ne dépend que de Azx. En particulier, elle ne dépend pas de X. 

Maintenant tu vas comprendre pourquoi on apprend les dérivées dans ton cours de math. 
Comme F(X+AX)-—F(X) ne dépend pas de X, le rapport (F(X+AX)-—F(X))/AX non plus. 
La limite de ce rapport quand AX tend vers zéro non plus : 


(42.13) 


ne dépend pas de X. Tu reconnais là la dérivée de F au point X. En d’autres termes, F'(X) est 
constante, elle ne dépend pas de X. Disons donc que F’(X) = a. Tu connais beaucoup de fonctions 
dont la dérivée est constante ? Non ? En effet, il n’y en a pas beaucoup. Les fonctions qui vérifient 
F'(X) = a sont toutes de la forme 


F(X) = aX + b. 
À ce niveau, il convient de re-déballer les notations compactes : si a = ( à et b = (p,q) on 
EqLoUn 
trouve | 
f(x) = at+Bx+p (42.14a) 
g(t,x) = vt + 6x + q, (42.14b) 


comme annoncé. 


Nous savons que lorsque (t,x) = (0,0), alors (#',x’) = (0,0). En effet, Bob et Alice ont lancé 
leurs chronos en même temps au moment où ils étaient au même endroit. En mettant (t,x) = (0,0) 
dans les équations (42.14), on trouve (t/,x/) = (p,q), et donc p = q = 0. Ça fait une chose de réglée ; 
on se retrouve avec | +794 


V = at+Bx (42.15a) 
x = yt+ 0x. (42.15b) 


Quelles sont les contraintes à vérifier pour que ces transformations décrivent correctement la phy- 
sique que l’on cherche à écrire ? 


(1) Il faut que les transformations décrivent correctement que Alice avance à une vitesse v par 
rapport à Bob, 


(2) dans le même ordre d’idée, il faut que l’on trouve que Bob avance à la vitesse —v par rapport 
à Alice, 

(3) il faut que si Alice et Bob observent un rayon lumineux, ce rayon aille à la vitesse c par 
rapport à Alice et à la même vitesse c par rapport à Bob, 


(4) enfin, il faut avoir le principe de relativité, c’est-à-dire que comme les équations (42.15) disent 
ce que Âlice voit en fonction de ce que Bob voit, on demande que les équations qui disent ce 
que Bob voit en fonction de ce que Alice voit soient les mêmes. En d’autres termes, il faut 
que les transformations et les transformations inverses soient les mêmes au changement près 
du signe de v. 


Étudions une à une ce que chacune de ses contraintes impose. Rappelons que (#,x) et (#/,x!) 
sont les coordonnées que Bob et Alice mettent sur le même événement. Par exemple sur l’événement 
qui consiste à ce que Ève, par jalousie envers Bob, jette une peau de banane sous les pieds d’Alice. 
Cet événement a lieu à un certain moment, à un certain endroit. C’est ce moment et cet endroit 
qui sont notés (t,x) et (4/,x/). 


42.4. 


(1) 
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Les coordonnées (t,x) et (t’,x’) peuvent décrire n’importe quoi. Regardons les coordonnées 
de Alice qui cours. Pour Alice, cela correspond à (#,x’) = (t/,0) parce que si x” désigne 
la position de Alice par rapport à Alice, alors x’ est toujours nul. Pour Bob par contre, 
Alice ne reste pas en place, mais se déplace à une vitesse v. C'est-à-dire que si (t,x) sont 
les coordonnées de Alice pour Bob, alors x/t = v. Écrivons les équations (42.15) en tenant 
compte de tout ça : avec x’ = 0, la seconde équation donne 


0 = yt + x, (42.16) 


d’où on déduit que x/t = —7/ô. En imposant que cela soit v, on trouve 7 = —vô, et on 
ré-écrit les transformations en tenant compte de ça : 


{ td = at+ x (42.17a) 
x = —vôt + x. (42.17b) 


Nous voilà débarrassé d’un paramètre. 


Maintenant, on regarde ce qu’il se passe quand (t,x) et (t’,x/) décrivent les positions de Bob. 
On a (t,x) = (t,0) parce que selon Bob, Bob est au repos. Les équations deviennent : 


= at x! = —vôt. (42.18) 
La vitesse de Bob par rapport à Alice est —v, donc on exige que x//t° = —v, c’est-à-dire que 


—vôt : 
at 


? 


ce qui implique que Ô = &. On avance encore un peu. Ecrivons à nouveau les lois de trans- 
formation en en tenant compte : 


V = at+Bx (42.19a) 
x = —vat + ax. (42.19b) 


Si maintenant Bob et Alice regardent un même rayon de lumière (comme c’est romanesque !), 
alors (t,x) et (t’,x') expriment les coordonnées d’un rayon lumineux. Le fait que Bob regarde 
un rayon lumineux fait que x = ct, et donc que les coordonnées du rayon lumineux, observé 
par Alice sont : 


td = at + Bct z' = —avt + act. (42.20) 


L’invariance de la vitesse de la lumière exige que Alice mesure une vitesse c pour le rayon de 
lumière, c’est-à-dire x’ = ct’. On exige donc que 


avt + act = cat + Bet, 
ce qui implique que 


Une fois de plus, l’avant-dernière, on ré-écrit les lois de transformations en tenant compte de 
ce fait ; mais cette fois, on fait l'effort d'écrire aussi les transformations inverses : 


av 1 av E y 
# = at x t= (at + x PSS 
3 Ar) ic 
1 
2 = —aut + ax ÿ= A (avt + ax!) (42.22) 
S __,2 _ œv? Aie : PR : 
où À = @ 2 que tu noteras au passage être toujours positif, et nul uniquement quand 


— C. 
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(4) Maintenant il reste à imposer le principe de relativité. Les transformations (42.21) montrent 

comment Alice voit le monde (c’est-à-dire (t/,x”)) en fonction de la façon dont Bob voit le 
monde (c’est-à-dire (t,x)). On se demande donc quelle seraient, pour Bob, les coordonnées 
(t,xæ) d’un point vu en (t/,x’) par Alice. Cela signifie que l’on impose que les deux systèmes 
(42.21) soient en réalité les mêmes, à un changement de signe près. 
Attention : il est à priori faux de dire qu’en changeant le signe de v dans av/c?, j'obtiens 
—av/c? parce que a est une fonction de v. En réalité, il faut noter a(v)v/c? et donc le 
changement de signe de v donne —a(—vw}v/c?. Ceci étant clair, on peut un petit peu calculer. 
Commençons par égaliser le coefficient de x dans t” à celui de x’ dans t, en changeant le signe 
de v : 


et donc a(v) = a(—v). Ça c’est une bonne nouvelle. Égalisons maintenant le coefficient de t 


\ 


dans t’ à celui de t{’ dans t en changeant le signe de wv : 


Comme a(—v) = a(v), on en déduit que 


ie —_— Eqalphan 


Maintenant qu’on a tout, on peut écrire les transformations de Lorentz. On met donc l’expres- 
sion (42.23) dans les lois de transformations (42.21) : 


: 1 v 1 Fi Ur 
= (e 2) t = (e SE 52) 
v? C v? C 
lea EE EqTrLppente 
( 1 _ 1 ! ! ‘ 
M (x ut) Fe —=— (vi + +). 
1-7 1-7 


€ 


Tu remarqueras que À = 1; si tu ne sais pas ce qu'est le déterminant d’une application linéaire, 
ça n’a pas d'importance. Mais si tu sais ce qu’est le déterminant d’une application linéaire, alors 
ce À = I est crucial! 

Afin d’avoir des équations un peu plus courtes, à partir de maintenant nous allons noter 


42.4.3 Conditions d’existence 


Comme tu vois une racine carrée et un dénominateur dans ces formules, tu dois te demander 
quelles sont les conditions d’existence. Étant donné que v < c,on a v?/c? < 1 et en particulier, 
v?/c? = 1 si et seulement si v = c. 

Ce qui se trouve dans la racine carrée ne pose donc jamais de problèmes parce que ce n’est 
jamais négatif. 

Le dénominateur est par contre plus problématique : quand v = c il n’y a plus rien qui fonc- 
tionne. Quelle est la physique de ce problème ? Pour le comprendre, il faut se souvenir ce que 
représente v. Nous avons dit que v est la vitesse à laquelle Alice court. Ce que la condition d’exis- 
tence nous enseigne, c’est que personne ne peut courir à la vitesse de la lumière. C’est une vitesse 
que l’on ne peut pas atteindre. 

Dit en termes plus savants, on ne peut pas choisir un repère qui se déplace à la vitesse de la 
lumière. 

La question qui se pose alors est « ah bon, on ne peut pas atteindre la vitesse de la lumière ! 
Et la lumière, comment elle fait ? ». Bonne question, merci de l’avoir posée. Hélas la réponse sort 
du cadre de ce cours. 
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loivitlumlimite 
Loi numéro 2. 
Aucun objet ne peut atteindre la vitesse de la lumière. 


Loi numéro 3. 
Tu ne dois pas te demander pourquoi la lumière elle-même se déplace à la vitesse de la lumière 
malgré la loi numéro 2. 


42.4.4 La notion d'intervalle 


Un événement est quelque chose qui se passe à un endroit à un certain moment. C’est donc 
caractérisé par le moment et le lieu. Comme on travaille à une dimension, c’est un couple de réels 
RATE 

Regardons un rayon de lumière. Un événement est le fait d’allumer une lampe de poche, et 
un autre est le fait que la lumière arrive sur l’objet qu’on éclaire. Appelons-les (t1,æ1) et (t2, 2). 
Comme d'habitude, on note At = t2 —t1 et Ax = x2 — x1. Comme le rayon de lumière va à la 
vitesse c, on à c = Ax/At, ou encore 


CAE = y =, 


Pour cette raison, on va dire que l’intervalle entre deux événements (t1,x%1) et (2,72) vaut en 
général 


s? — (to of (x m1). (42.25) 


Par invariance de la vitesse de la lumière, si un intervalle est nul pour un observateur, il sera nul 
pour tous les observateurs. 


42.4.4.1 En mécanique newtonienne 


Afin de voir un peu mieux l’enjeu de l’invariance de l’intervalle, regardons un exemple chiffré. 
Si par exemple je me déplace de 10m en 5s, mon intervalle mesuré par une personne extérieure 
est 
At? — Ax? = (300.000.000)? -+ (5)? — (10)? = 2,25 + 10/5 m. 


Si je fais le calcul pour moi, j’ai que Ax’ = 0 parce que je ne me déplace pas, et At! = 5 parce que 
je me suis déplacé en 5 secondes. Le truc est que à côté de (300.000.000)?, l'intervalle spatial Ax 
ne pèse pas grand chose. Ça ne change presque rien qu’il soit de 5 mètres ou de zéro. Ça ne change 
pas grand chose, mais ça change quand même! Entre moi qui calcule ou une personne extérieure, 
l'intervalle change de 100 sur un nombre de la grandeur de 200.000.000.000.000.000.0000 ! 

Reprenons plus clairement le raisonnement. D’après la mécanique classique, l'intervalle mesuré 
par deux personnes est différent, mais très peu différent. Inutile de dire que du temps de Newton, 
on n'avait pas les moyens techniques de mesurer si cet intervalle est effectivement différent ou bien 
si il est en réalité égal. C’est un peu comme si on te mettait un spot dans les yeux et qu’on te 
demandait si c’est un spot de 1000 W ou de 1001 W. Bonne chance pour le dire! 


42.4.4.2 En mécanique relativiste 


Maintenant qu’on a des moyens techniques nettement plus poussés que Newton, on a pu mesurer 
que l'intervalle est égal. L’intervalle est un invariant. Cela n’est pas un nouveau principe physique 
parce qu’il découle des transformations de Lorentz. 


42.4.5 Le cône de lumière d’un point 


Il est intéressant de dessiner dans le plan (f,x) l’ensemble des points atteints par le rayon 
lumineux. Le point (t,x) est atteint si ct? — x? = 0, ou encore si x = +ct. Cela forme deux droites 
dans le plan tracé par les coordonnées t et x. Ces deux droites forment ce qu’on appelle le cône 
de lumière du point (0,0). 


2728 CHAPITRE 42. UTILISATION DANS LES AUTRES SCIENCES 


42.4.6 Contraction des longueurs 


Bob prend un morceau de bois qu’il mesure de longueur / et le dépose devant lui. À l'instant t 
(de Bob), les deux extrémités sont aux coordonnées e1 = (t,0) et e2 = (4,1). 

Afin de savoir quelle est la longueur de ce même morceau de bois pour Alice, il faut qu’elle 
mesure les deux extrémités en même temps (pour elle), et qu’elle fasse la différence. Comme Bob 
et Alice déclenchent leurs chronomètres en même temps, le plus simple est de faire la mesure à cet 
instant. 

Pour Bob, c’est clair : les coordonnées des deux extrémités sont e1 = (0,0) et e2 = (0,4). 
La longueur du bois est /. Pour savoir quelle est la longueur mesurée par Alice, on utilise les 
transformations de Lorentz qui donnent les coordonnées el et e, relatives à Alice. On trouve 


e, = (0,0) et 
é : CL l ) | Faspdeprf a) 
Y(v) y) 
En d’autres termes, on a +1 = 0 et x2 = l/y(v), ce qui fait que la longueur observée par Alice est 
l = Lo — Li = l/y(v). 

Eh bien ce résultat est faux. Si tu vois pourquoi sans lire la suite, tu es très fort. 

Pour mesurer la longueur d’un objet, il faut mesurer la position des deux bouts en même temps 
puis faire la différence entre les deux. Effectivement, e; et e2 sont en même temps pour Bob, et 
donc Bob peut mesurer la longueur de son bout de bois en faisant la différence x9 — +1. Mais comme 
le montre les coordonnées (42.26), les événements e et e, ne se passent pas en même temps pour 
Alice! Eh oui : #, = 0 et t, = —ul/c?y(v); c'est pas la même chose. 

Il faut donc trouver un événement qui pour Alice correspond à l’extrémité du bout de bois 
au temps { = 0. Comme l'événement général qui correspond au bout du bois pour Bob est (4,1), 
l'événement général est pour Alice 


t— 51 = 
td — L x! = . 42.27 
1) To) Se 


Afin d’avoir # = O, il faut t = vl/c?. En mettant cette valeur de t dans x’, on trouve 


te) GE) 
Af1=# \1=% 


Et là, c’est la bonne formule. Si un objet a une longueur { dans le référentiel où il est au repos, il 
aura une longueur 


= ly(v). 


U=n)1-—- (42.28) 


dans un référentiel qui se déplace à la vitesse v par rapport à l’objet. 


42.4.7 Dilatation des intervalles de temps 


Encore un petit effort et nous passons à une application concrète que tu connais des bizarreries 
de la relativité. Mais en attendant, regarde bien ta montre, tu ne va pas en croire tes yeux! 

Reprenons Bob et Alice. On se rappelle que Bob et Alice avaient déclenché leurs chronomètres 
en même temps quand Alice était passée devant Bob. Un peu plus tard, Alice regarde sa montre 
qui indique un temps t. Et elle se demande si Bob a aussi à ce moment une montre qui indique un 
temps t. 

Ce serait dingue que non hein !?! En effet, si je synchronise ma montre avec quelqu'un et que 
je pars faire un tour, ma montre ne sera pas tout d’un coup désynchronisée. Oui, mais Alice, elle 
cours presque à la vitesse de la lumière .. .et à ces vitesses-là, on a déjà vu des choses incroyables. 
Calculons donc pour en avoir le cœur net. 

Le fait qu’Alice regarde sa montre est un événement qui se passe pour Alice aux coordonnées 
(4,0) (le zéro c’est parce que par rapport à elle-même, Alice est toujours au repos). À quelles 
coordonnées ({t,x) pour Bob correspond cet événement ? 
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L'équation de t en fonction de t’ et x’ dans les transformations de Lorentz (42.24) prise avec 
x’ = 0 donnent , 
t 
vo) 
Et si, juste pour le plaisir, on faisait l'inverse ? Bob regarde sa montre, il voir un temps t et sa 
coordonnée spatiale est x = 0. À quel temps d’Alice cela correspond ? Mettons æ = 0 dans la 
transformation de Lorentz de t’ en fonction de t et x. Ce qu’on obtient c’est 
1 A 
(v) 
N'est-ce pas génial ? C’est la même! Évidemment, ça ne pouvait pas être autre chose : le principe 
de relativité demande qu’on ne puisse pas faire la différence entre Alice qui cours vers la droite 
avec Bob assis et Alice assise avec Bob qui cours vers la gauche. C’est exactement pour ça que dans 
une gare, quand le train d’à côté démarre, il t’arrive de croire que c’est ton train qui démarre : tu 
ne peux pas faire la différence, c’est un principe physique. 


42.4.8 Invariance de l’intervalle 


Dans deux secondes, je vais te montrer comment une utilisation intelligente des exponentielles 
permet de trouver un résultat très fort en relativité. Quoi ? Les exponentielles, les mêmes qu’au 
cours de math ? Eh oui : la même exponentielle que celle qu’on t’a introduit avec des populations 
de bactéries qui se multiplient, cette même exponentielle qui la la miraculeuse propriété d’être 
égale à sa propre dérivée. 

Mais n’anticipons pas. 

Nous avons déjà signalé que si la quantité As? = © At? — Ax? était nulle pour un observateur, 
alors elle était nulle pour tous les observateurs. Supposons deux événements À et B observés par 
Alice et Bob. Bob les note aux coordonnées (4,,zæ4), et (45,8) tandis qu’Alice les note en (t!,,x!) 
et (t},æ}). 

L’intervalle entre les deux événements mesuré par Bob sera 


2,2 2 2 
S° = (tp — ta) — (Xb — Ta)”, 
tandis que ce même intervalle mesuré par Alice sera 
12 2/4! 1 \2 ! 1 \2 
$ —C (4, ta) (x, La) ; 
On peut bien entendu remplacer dans la première équation les ta, tp, Ta et ty par leurs valeurs en 
termes de t!,, t,, x, et x, données par les transformations de Lorentz. Tu paries que les trois quart 


des termes dans le calcul se simplifient et qu'il restera exactement s/2? Je te dis que oui, et je te 
conseille de me croire sur parole, sinon tu vas devoir lire le calcul suivant : 


1 v 1 v À 
2 2 2 2 2 ! ! ! ! 
S CL t T x C À, + —x LL, + —x 
( b a) ( b a) (- ( b 5) @) a a .)) 


Jusqu'ici, on n’a fait que remplacer les choses par leurs valeurs données par les transformations 
de Lorentz. Maintenant on regroupe à l’intérieur de chaque parenthèse les termes de façon à faire 
apparaitre Az’ et At: 


2 C U 2 
= re (+ txt) 


3 (Get — #4) + ot — 4)" 


— 
= 


- : At}? PAU A D Au 
= (At) +2 At + x’) 


DE (A2)? + 20Ax' At + v(At}?). 
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Là, on a utilisé le produit remarquable (a+b)? = a? +2ab+b?, et on a systématiquement renommé 
tous les intervalles avec la notation À pour être plus compact. Maintenant, on va regrouper tous 
les termes contentant (At)? ensemble, tous ceux qui contiennent At/Azx' ensemble et ceux qui 
contiennent (Ax')? ensemble. Autre manière de le dire, on met les À en évidence comme on peut. 


On trouve ceci : 
L à 2vc? 2v 
av ( - - 75) +arav ( ) 
SAR COLE TOE *ORSETOE 


+ (Az)? ( en ) | 


y) 7(v) 


À partir de là, je te laisse vérifier (en utilisant le fait que y(v)? = 1 — v?/c?) que les coefficients se 
simplifient beaucoup et valent finalement respectivement c?, 0 et —1 comme il se doit. Avec tout 
ça, nous avons montré le résultat très important suivant : 


L’intervalle entre deux événements est invariant sous les changements de repères d’iner- 
tie, c’est-à-dire que la valeur mesurée par n'importe qui qui se déplace en MRU sera 
toujours la même. 
Pourquoi cela est tellement important ? À cause de Pythagore et d’une petite démonstration à 
coups d’exponentielles ?. 


42.4.8.1 Rappel de trigonométrie hyperbolique 
SUBSUBSECooZVHLooYwuhA ;j 


Les fonctions de trigonométrie hyperboliques sont : 


z —T T _ ZX 
cosh(x) = —— sinh = a (42.29) 


Elles ont pas mal de propriétés en commun avec les sinus cosinus et normaux. D'abord, leurs 
dérivées sont faciles à calculer : 
! “ 
cosh' (x) = sinh(x) 
1 / 
sinh (x) = cosh(x) 


où tu noteras qu’il n’y a pas de signe moins qui apparaît, contrairement au cas de la trigonométrie 
normale. Une autre propriété qui ressemble fort à une propriété de la trigonométrie est : 


Proposition 42.2. 
Pour tout xeR, 
cosh?(x) — sinh?(x) = 1 (42.30) 


avec un signe moins comme différence avec la trigonométrie. 


Démonstration. La preuve revient simplement à calculer en utilisant le produit remarquable de 
(a + b)?. D'abord, on a : 


1 1 1 
cosh?(x) = 2 (e° + é 4)? . (e2® + 2e" + e7 2) = il +2+e 7%) 


A 


où l’on a utilisé le fait que (e*)? = e27 et que e*e-? = 1. Il te reste à faire la même chose pour 


sinh?(x), la réponse est : 
1 
sinh?(x) = à (e#—2+e 7). 


En faisant la différence entre les deux, il reste 1. 


Une propriété qui est par contre très différente entre la trigonométrie plane et la trigonométrie 
hyperbolique, c’est la périodicité. Les fonctions usuelles cos et sin sont périodiques. Pas les fonctions 
hyperboliques. 


7. oui oui tout ton cours de math va finir par y passer. 
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Proposition 42.3. 
La fonction sinh: R — R est bijective. 


Démonstration. Il faut démontrer que sinus hyperbolique est injective et surjective. Calculons 
d’abord les limites. Comme tu sais que lim;_,% e* = © et lim, _,;_e* = 0, tu vois facilement que 


lim sinh(x) = —c0 Jim sinh(x) = 00. (42.31) 


Par ailleurs, la fonction sinus hyperbolique est continue et respecte donc le théorème de la valeur 
intermédiaire. Soit y € R. Voyons si il existe un x € R tel que sinh(x) = y. Les deux limites 
indiquent qu’il existe +1 € R tel que sinh(x;1) < y et x2 € R tel que sinh(x2) > y. Le théorème de 
la valeur intermédiaire conclut qu’il existe un x entre æ1 et x2 tel que sinh(x) = y. Cela prouve la 
surjectivité. 

Pour l’injectivité, on va utiliser le théorème de Rolle 12.192 et une petite preuve par l’absurde. 
Supposons que sinh(x1) = sinh(x2) avec x1 # x2. Dans ce cas, le théorème de Rolle nous dit qu’il 
existe un x entre æ1 et x2 tel que sinh’/(x) = 0. La dérivée de sinus hyperbolique étant cosinus 
hyperbolique, il faut se demander il existe un x tel que cosh(x) = 0. Étant donné que e* > 0 pour 
tout x, en fait le cosinus hyperbolique ne s’annule jamais. 


1 


FIGURE 42.1: En rouge, la fonction x — sinh(x) et en bleu, la fonctige re rest 6buEusti 


Un très bon exercice serait de faire un étude complète des fonctions cosinus et sinus hyperbo- 
lique. Leur graphes sont donnés à la figure 42.1 

Un corolaire de la surjectivité de sinh sur R est que si je prends n’importe quel deux nombres 
dont la différence des carrés vaut 1, alors ces carrés sont représentables avec des fonctions hyper- 
boliques : 


Vr,ye R tels que x? — y? = 1, 1e R tel que x? = cosh(£) et y? = sinh(é). 
La tangente hyperbolique est définie par 


ee Re (42.32) 


Un bon exercice est de prouver les deux relations suivantes : 


| : tanh(x) : 1 EqRelSinh Rss 
sinh(x cosh(x ; .33)l 
® 1— tanh?(x) " 1—tanh”(x) 


8. Théorème 10.89. 
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42.4.8.2 Les transformations de Lorentz (bis) 


Nous avons prouvé qu’en relativité, l'intervalle est un invariant. Pour cela, nous avons utilisé 
les transformations de Lorentz démontrées à partir de l’hypothèse d’invariance de la vitesse de la 
lumière. Eh bien, oublions un instant que la vitesse de la lumière soit invariante, et posons à la 
place comme hypothèse que l’intervalle soit invariant. C'est-à-dire que si Bob mesure un événement 
aux coordonnées (t,x) et Alice en (#/,x'), alors c?t? — x? = c?(#}? — (x')2. 


Théorème 42.4. 


Les transformations de Lorentz sont les seules qui laissent l'intervalle invariant. 


Démonstration. Toute la partie comme quoi les transformations doivent êtres linéaires reste parce 
que cette partie ne demandait pas l’invariance de la vitesse de la lumière. 
Nous cherchons donc les transformations entre Alice et Bob sous la forme 


t = at + Ex 
x! = yt+ x 


telles que c2(#)? — (x’)? = c?t? — x?. Lorsque Alice passe devant Bob, ils déclenchent tous deux 
leurs chronomètre et leurs axes. C'est-à-dire que si à ce moment un événement se trouve à droite 
pour Alice, il est aussi à droite pour Bob. On doit donc avoir, quand t = t#’ = 0, que x > 0 implique 
x’ > 0. Cela donne la contrainte que 6 > 0. D'autre part, comme leurs chronomètres vont dans le 
même sens (ils choisissent tout les deux de compter le temps et non décompter), on à a > 0. 

En développant l'expression de (s/)? en termes de t et x, on trouve la condition d’invariance de 
l'intervalle sous la forme : 


EqCondI 
(ot? + 2aBtx + B?x?) — (y? + 2-y0tx + 827?) = c?t? — x?, Log TD) 
qui doit être valable pour tout t et pour tout x. En t = 0 on trouve la condition 
8 — CB? = 1. (42.35) 
Cela implique qu'il existe un € € R tel que 62 = cosh?(£) et «25? = sinh(£). La première équation 
donne Ô = cosh(£) (il faut rejeter Ô = —cosh(£) parce qu’on a demandé que Ô > 0). Pour la 
seconde, on trouve cB = sinh(£) où l’on peut oublier la possibilité cB = — sinh(£) parce que cela 


revient juste à renommer £ — —£ (la fonction sinus hyperbolique est impaire). Bref, il existe un & 
tel que 


sinh(é) Fe) 


Pour les mêmes raisons qu'avant, il existe un 7 € R tel que 
a = cosh(n) Eappiets 
7 = csinh(n). | 


Rien qu’en regardant deux cas très particuliers, on a déjà bien avancé, non ? Remettons maintenant 
les valeurs (42.36) et (42.37) dans la condition (42.34). En utilisant l'identité cosh?(x) —sinh?(x) = 
1, et en séparant les termes en #?, x? et tx pour satisfaire la condition, il faut 


cosh(n) sinh(£) = sinh(n) cosh(£) FacoreRy ai, 
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parce que les termes en {? et x? donnent exactement cf? — x? et qu’il faut que le terme en 
tx s’annule. Mettons la condition (42.38) au carré, et substituons cosh?(7) = 1 + sinh?(n) et 
cosh?(£) = 1 + sinh?(£), il reste 

sinh? £ = sinh? », 


ce qui signifie sinh £ = +sinh 7, ou encore € = +. On voit que £ = —7 ne fonctionne pas dans 
(42.38), donc on reste avec £ = n et les transformations prennent la forme 
sinh(é) 


t’ = cosh(£)t + =. «0 Faptp) 


x” = csinh(£)t + cosh(£)x. 


Ce que nous avons prouvé, c’est qu'il existe un £ € R tel que les transformations entre Alice et Bob 
aient cette forme. Il faut trouver ce que vaut £ en fonction de la vitesse v à laquelle Alice court. 
Pour ce faire, étudions le mouvement d’Alice. Bob la voit aux coordonnées (4, ut), ce qui cor- 
respond à 
© = csinh(£}t + cosh(£)ut 


pour Alice. Mais ces coordonnées sont celles de Alice elle-même, donc x = 0, ce qui donne” 


ut = —csinh(£)t/cosh(£), ou encore 


tanh(£) = -! (42.40) 
C 
En utilisant les relations (42.33), on trouve 
1 = 
cosh(£) = = sinh(£) = ee (42.41) 
1-5 1=% 
En remettant ces valeurs dans les transformations (42.39), on trouve 
ge. 
2" (42.49) 
Y(v) 
1 TU 
al , 42.43 
(v) nn 


exactement les transformations de Lorentz! 


Ce résultat est important pour une raison assez simple : maintenant, la théorie de la relativité 
est indépendante de toute considérations sur la lumière. En effet, ce que nous venons de prouver, 
c’est que si il existe une vitesse c telle que ct? — x? = c?(t/)? — (x'}?, alors (t,x) et (t/,x!) sont liés 
par les transformations de Lorentz. 


42.49 Vitesse limite 


Afin de nous passer de l’hypothèse d’invariance de la vitesse de la lumière, nous avons prouvé 
que l’hypothèse d’invariance de l'intervalle était suffisante. Mais il faut avouer que cette hypothèse 
n’est pas très intuitive. Nous allons montrer maintenant que l’existence d’une vitesse limite est une 
troisième hypothèse qui peut être utilisée comme alternative aux deux premières. 


42.5 Applications 


Une première application sympa est le logiciel 10 Jightspeed. Si tu es sous Ubuntu-Linux, installe 
juste le paquet nommé lightspeed, et régales-toi ! Tu verras c’est marrant. Si tu utilise des fenêtres, 
je laisse faire l’adage « Windows c’est facile ». 


9. Conditions d’existence : cosh(£) Æ 0; heureusement, nous avons vu que le cosinus hyperbolique ne s’annule 
jamais. 
10. jeu de mot sur « application » ! ah ah! 
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42.5.1 Le GPS 


Pour qu’un système GPS puisse te localiser, en gros, il t'envoie un signal, tu lui réponds et il 
mesure le temps qu’il à fallu à la lumière pour faire l’aller-retour. Déjà, tu remarques que cela n’est 
possible que grâce au fait que la vitesse de la lumière soit finie. Sinon, le GPS ne fonctionnerait 
pas. Mais il y a mieux. 

Comme pour te localiser il faut plusieurs satellites en plus de ton appareil, il faut que les horloges 
internes de tout ce petit monde soient bien synchronisées, sinon pour mesurer des intervalles de 
temps et calculer des distances, c’est mal parti. Eh mais un satellite, ça bouge assez vite (surtout 
que les mesures doivent être très précises), et en plus ça ne fait même pas un MRU, vu que ça 
tourne en rond. Comme tu vois tout le travail qu’il a fallu faire pour trouver les transformations 
de Lorentz d’un MRU, tu t’imagines le travail pour un mouvement circulaire! Eh bien ce travail 
a été fait, et le résultat est que si on en tient pas compte, les contractions temporelles liées à la 
relativité sont suffisamment grandes pour complètement dérégler le GPS. 


42.5.2 Les ondes électromagnétiques 


Tu te souviens qu’au début du chapitre, nous avons dit que le problème qui a amené la relati- 
vité était la propagation du champ électrique. Maintenant que nous avons déjà vu une partie des 
conséquences du problème, il est temps de se rendre compte que les champs électriques et magné- 
tiques sont les objets les plus soumis aux bizarreries relativistes du monde : elles se propagent à la 
vitesse de la lumière. Regarde un coup autour de toi; tout ce qui est champ électromagnétique a 
besoin de la relativité pour être bien compris : GSM, lumière, four à micro-onde, radio, wifi, fibre 
optique, ... 

Si un jour un ingénieur te dit qu'il n’y a pas besoin de connaitre la relativité pour inventer la 
radio (c’est vrai : la radio à été inventée avant la relativité), ni pour construire une fibre optique, 
dis lui en pensant à moi qu’il utilise tout le temps les équations de Maxwell !!, et que ces équations 
sont relativistes. 

Bref, soit convaincu que tu vis dans un monde relativiste et que les transformations de Lorentz 
te suivent à chacun de tes pas. 


42.6 Mécanique relativiste 


Cela est bien beau, mais la dilatation du temps, et les contractions de longueurs doivent bien 
avoir des répercussions sur la cinématique et la dynamique des objets. Est-ce que le théorème de 
l'énergie cinétique est encore valable ? est-ce que les lois de Newton tiennent encore la route ? 


42.6.1 Des problèmes, toujours des problèmes 


Attardons-nous un peu pour faire quelques commentaires sur cette citation du chevalier pégase 
dans les chevaliers du zodiaque : 


Ses coups vont à la vitesse de la lumière et pourtant je les vois distinctement arriver. 


Est-ce possible ? Nous avons vu qu’il y avait des dénominateurs qui s’annulent quand des objets 
se déplacent plus vite que la lumière ; or pour voir venir un rayon de lumière qui vient vers soi, il 
faudrait que le rayon émette de la lumière devant elle. Ça semble un peu mal parti pour respecter 
les lois de la relativité, non ? 

Cela pose en tout cas une question qu’il faudra résoudre. On entend venir une ambulance parce 
qu’elle émet du son qui avance plus vite qu’elle. Pas de problèmes avec ça. Mais quid de la voir 
venir ? 

On peut voir venir un tram parce qu’il émet de la lumière ; cette lumière allant plus vite que 
le tram, elle arrive à nos yeux avant le tram lui-même. Cela est très bien. Mettons que le tram 
avance à 50 km/h ; pour le conducteur, la lumière de son phare avant avance devant lui à la vitesse 


11. C’est sous ce nom là qu’on nomme l’ensemble des équations de l’électromagnétisme comme la loi de l’induction. 
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c. Par conséquent pour un observateur au sol, cette même lumière devrait avancer à la vitesse 
c + 50. Encore une fois, on a un problème d’invariance de la vitesse de la lumière ; mais comme 
c’est de la lumière, on est habitué à ce que des trucs bizarres arrivent. On ne sera pas étonné 
que € + 50 = c d’une manière ou d’une autre 2. Pire. Si un vaisseau spatial avance à la vitesse 
200000 km/s et qu’il envoie en reconnaissance un vaisseau devant lui à la vitesse de 150000 km/s, 
le vaisseau de reconnaissance ira à la vitesse 150000 km/s par rapport au vaisseau principal. Et par 
rapport au sol, il ira à la vitesse 150000 + 200000 = 350000 km/s, ce qui est impossible. Il faudra 
trouver quelque chose pour que ça se passe bien. 

Un autre problème maintenant. 

Prenons une masse m que l’on soumet à une force constante F. Par la loi de Newton, a = F/m 
est constante et la vitesse après un temps { vaut v = Ft/m. Pas de bol, ça devient plus grand que 
la vitesse de la lumière à partir du temps t = cm/F. Ça est un problème hein ? Il faut trouver un 
truc pour qu'avec une force constante, l’accélération diminue. 


42.6.2 Loi d’addition des vitesses 


Si Bob observe un objet se déplacer à la vitesse V, alors Alice devrait l’observer bouger à la 
vitesse V — v. Tout comme si une vache voit passer un train à 90 km/h, alors le vélo qui avance à 
25 km/h le voit passer à 65 km/h. 

Maintenant, tu es habitué à ce que rien ne se passe comme d'habitude, donc tu te doutes bien 
qu'en réalité la bonne formule ne va pas être V — vw. 

Bob observe l’objet aux coordonnées (t, Vt), ce qui fait pour Alice : 


(ann) 


En divisant le x’ d’Alice par le t’ d’Alice, on trouve la vitesse mesurée par Alice : 


Woo) rt) V-v 
FE 0 4-7 1-% 


La loi de transformation des vitesses relativiste est donc 


Es A FAR GE A 


Qu'en est-il de notre c + 50 = c? Disons que Bob lance un bisou à Alice pendant qu’elle arrive 
vers lui. Le bisou arrive à la vitesse de la lumière (càd V = c) tandis que Alice s’approche de Bob 
à la vitesse 50 m/s (càd v = 50). Donc la vitesse à laquelle Alice devrait voir arriver le bisou est 
bien c + 50. En utilisant la formule d’addition relativiste des vitesses (42.44), nous trouvons 
c—50 _c—50  c(c—50) 


v' = = 
1-5 1-2  c—50 


C. 


Donc effectivement en relativité quand on additionne des vitesses il faut penser à la règle du 
«C+50 = c». 


42.6.3 L'action d’une force 
L’équation fondamentale de la mécanique classique est 
F = ma. 


Or tu n’es pas sans savoir que l’accélération est la dérivée seconde de la position par rapport au 
temps. Nous noterions donc F = mx”(t). Le problème est évidemment que si F est constante, on 
trouve v = Ft/m qui dépasse toujours la vitesse c quand t est assez grand. Il faudra donc modifier 


12. et je ne te cache pas que c’est ce qui va arriver. 
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la loi F = ma. Pour cela, posons-nous des questions sur la dérivée x/(t). On dérive par rapport au 
temps; oui mais nous avons vu que le temps n’est pas le même pour tout le monde. Introduisons 


donc la notation 
= © East 


qui ne signifie rien d’autre que nous dérivons x par rapport à # et non par rapport au temps t’ de 
quelqu'un d’autre. Dans le cadre de la relativité, ce que signifie l'équation (42.45) est que v est 
la dérivée de x par rapport à {. Dans le cas où x et t sont les coordonnées de la position d'Alice 
mesurées par Bob, cela signifie qu’on dérive la position mesurée par Bob par rapport au temps 
mesuré par Bob. 

Ce que dit la relativité est que cette quantité v ne peut pas varier proportionnellement à la 
force sous peine de dépasser la vitesse de la lumière. La subtilité est de modifier la loi de Newton 
en disant que la quantité qui varie sous l’action d’une force n’est plus dx/dt = v, mais 


dx VU 


dt 


c’est-à-dire la dérivée de la position mesurée par Bob par rapport au temps mesuré par Alice! La 
loi de Newton v = Ft/m devient donc 


a F6 


Est-ce que cela résoud le problème ? Pour le savoir, regardons la vitesse acquise par le mobile de 
masse m soumit à la force F pendant un temps t Il faut résoudre l'équation (42.46) par rapport à 
v et voir si cela reste bien toujours inférieur à c. On commence par mettre la racine à droite et à 
élever toute l'équation au carré : 


FE Jr 


272 ? 
\1+E8 


u(t) = nn Fate) 
mA /1 + Et 


Tu dois remarquer que si F et t ne sont pas trop grands, l’expression F 282 /c?m? est minuscule 
parce que c est énorme. Si on fait l’approximation F?#?/c2m? = 0 dans cette expression, on 
retrouve vu = Ft/m. Cela montre qu’à moins de faire des expérience avec de très grandes forces 
pendant énormément de temps, on ne peut pas voir la différence entre la mécanique de Newton et 
la mécanique relativiste. 


et donc finalement 


Sur le graphe suivant, la vitesse en fonction du temps lorsqu'une particule de masse m = 1 est 
soumise à une force constante. Pour les besoins du graphique, nous avons mis à 1 la vitesse c. Tu 
vois que quand la vitesse n’est pas très grande, le graphique est presque celui d’une droite; et à 
partir d’un certain moment, la courbe s’infléchit pour tendre vers 1 sans l’atteindre. 
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Remarque que si on maintient une accélération constante égale à celle de la gravité terrestre 
pendant deux heures, on arrive déjà sur la Lune, à une vitesse de 75 km/s, c’est-à-dire encore rien 
par rapport à la vitesse de la lumière! Cela pour te dire que la formule (42.47) a l’air d’être très 
différente de la formule classique v = Ft/m, mais en réalité tant qu’on n’atteint pas des forces 
énormes, elle ressemble très fort. 

Vérifions maintenant que la formule (42.47) n’est pas en contradiction avec l'impossibilité de 
dépasser la vitesse de la lumière. Pour cela, regardons ce qu’il se passe si on applique une force 
constante F' sur un objet de masse m pendant un temps très long. C’est-à-dire : calculons la limite 


lim v(t). 


t—00 


Tu vois tout de suite qu’on est sur un cas ©, ce qui t’oblige à utiliser la règle de l’Hospital. On 

peut cependant un peu réfléchir et deviner la réponse sans passer par des math trop compliquées. 
242 { : 

En effet, quand t est vraiment énorme, l'expression LE devient très grande, et le 1 qui se 


trouve à côté ne vaut plus grand chose, on peut le négliger. 


; Ft . Ft 
lim = lim 
t— 00 F2t2 t—00 F2t2 
1 + c2m2 m2c2 
. Ft (42.48) 
= lim 
V—00 M 
6: 


Tout est bien : on arrive au maximum à la vitesse de la lumière, mais il faut un temps infini pour 
y parvenir. Conclusion : il n’est pas possible d’accélérer un objet jusqu’à atteindre la vitesse de la 
lumière. 


42.6.4 Équivalence entre la masse et l’énergie 


Le moment est venu de montrer ce que signifie la fameuse formule E = mc. 


42.7 Principe de correspondance 


Nous ne sommes pas parvenu à démontrer la formule (42.46) de la mécanique relativiste qui 
montre comme un objet accélère sous l’effet d’une force constante. Nous avons juste montré qu’il 
fallait modifier la loi vu = Ft/m et nous avons prit la première modification qui nous soit tombée 
sous la main, à savoir qu'il faut dériver la position par rapport au temps de l’objet qu’on observe 
plutôt que par rapport au temps de l’observateur. 

En fait, il est possible de prouver rigoureusement l* la formule 


Ft : av 


mm 1% 


Mais il n’y a pas moyen de trouver la valeur de la constante a. Tout ce qu’il y a moyen de trouver 
avec l’hypothèse de l’invariance de la vitesse de la lumière est l’existence d’une constante telle que 
cette formule soit vraie. 

Afin de fixer la constante «, il faut faire intervenir un principe physique supplémentaire, le 
principe de correspondance 


Loi numéro 4. 
Lorsque la vitesse d’une particule est faible, les équations doivent être en première approximation 
les mêmes que celles de la mécanique classique. 


13. Mais il n’existe pas de démonstrations simples à ma connaissance. 
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Que signifie en première approximation ? Tu sais qu’une fonction x > f(x) peut être approxi- 
mée (pour des petits x) par la formule 


f(x) = f(0) + xf(0). 


Nous voudrions donc que Ft/m soit en première approximation égal à v. Nous devons étudier la 


fonction 
av 


Voir ce que vaut cette fonction en première approximation lorsque v est petit est un exercice de 
dérivation. En utilisant la règle de dérivation des fractions, on trouve que 


a av? 


f'(v) = ee + 2 : a 


ce2 
et donc que f’(0) = «. Bien entendu, f(0) = 0. En première approximation, nous trouvons donc 
f(v) = av (42.49) 


qui doit être égal à la quantité non relativiste v. Nous en déduisons qu’il faut fixer à = 1, et on 
tombe sur la formule relativiste proposée plus haut 


EC. v 


Der: 
m LT 


L'utilisation cruciale du principe de correspondance a une répercussion énorme sur notre vision 
de la physique. En effet, la relativité d’Einstein ne parvient pas à remplacer la mécanique de 
Newton. On a besoin d’invoquer la mécanique de Newton pour fixer la théorie. On peut écrire 
l’axiome suivant : 

lim Einstein = Newton. (42.50) 


v— 
Cela n’est pas une propriété de la théorie d’Einstein, mais un de ses axiomes! 
La relativité ne fait donc pas table rase des principes physiques de la mécanique newtonienne : 
elle les complète et les contient. 


Chapitre 43 


Exemples avec Sage 


Ce chapitre est un foure-tout de choses que l’on peut faire avec Sage. 


43.1 Graphiques 


Pour afficher le graphe d’une fonction, vous pouvez faire 


| SageMath version 8.1, Release Date: 2017-12-07 | 
| Type "notebook()" for the browser-based notebook interface. | 
| Type "help()" for help. 


sage: plot(cos(x) ,0,5) 

Launched png viewer for Graphics object consisting of 1 graphics primitive 
sage: f(x)=sin(x) 

sage: f.plot(-pi,pi) 

Launched png viewer for Graphics object consisting of 1 graphics primitive 


Un programme externe se lance automatiquement pour afficher le graphique que vous avez de- 
mandé. 

Il se peut qu'aucun programme ne se lance et vous ayez, au lieu de Launched png viewer for 
Graphics object ... uniquement Created graphics object .... Disons pour faire court que 
Sage a produit un png et qu’il ne sait pas quel programme externe utiliser pour l'afficher. 

La solution est à l'adresse http://doc.sagemath.org/html/en/reference/misc/sage/misc/ 
viewer.html 


43.1.1 Autres 


Dans le but d’automatiser certaines tâches, j'ai écrit ce module, nomé outilsINGE.sage, dans 
le cadre d’un cours de première année donné à des ingénieurs. Certaines des fonctions définies ici 
sont utilisée dans les exemples qui suivent. 


# -*— codinpg: utfe -*-— 
| from sage.all import * 


1 num 


s\ This module provides _pragmatic_ tools for solving exercise for 


à first year in general mathematics. 


# TODO : trouver une bonne traduction pour "point de selle ." 
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def automatedVar (symbol ,n): 
MU I£ symbol = "x" and n=4, return the string ’xi,x2,x3,x4? <— 
s = ",".join([ symbol+str(i) for i in range(1,n+1)l]) 
return $ 


class SolveLinearSystem(object): 


Solve Ax=v and print it in a nice way 
Example 


Semateis(L 1,:-2,8,-2,01,18.,-7,-9,4,01.,14,5,6.,2,01 13 
v=vector ((0,0,0,0,0)) 
print SolveLinearSystem(A,v) 


def __init__(self ,A,v): 


self .matrix = A 

self.vector = v 

self.nvars = A.ncols() 

s = automatedVar("x",self.nvars) 


self.xx=var(s) 
def equations(self): 
"UUReturn the equations corresponding to the 
self .matrix and self.vector as a list of equations 
mun 
X=matrix( [self.xxli] for i in range(0,self.nvars) ]).<— 
transpose() 


eqs=[] 
for i in range (0,self.matrix.nrows ()): 
exp = (self.matrix*xX) [i][0]==self.vectorli] 


eqs.append(exp) 
return eqs 
def solutions(self): 
return solve(self.equations () ,self.xx) 
def latex(self): 
"UUlReturn the LaTeX’s code of the system.""" 
a=[] 


a.append(r""" 


\item 
$ 
\left \{ 
\begin{array}{11} 
M) 
for eq in self.equations (): 
a.append(" "+str(eq).replace("x","x _").replace("x"— 
,""). replace ("==","=")+"\\\\ \n") 
a.append(r'""" 
\end{array} 
\right. 
$ 
re 
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60 return "".join(a) 

61 def __str__(self): 

62 a = [] 

63 a.append("The given matrix corresponds to the system") 
64 for eq in self.equations (): 


65 a.append(str(eq)) 
66 a.append("And the solutions are" 
67 a.append(str(self.solutions())) 
68 return "\n'".join(a) 


ro def QuadraticMap(A,v): 

mn 

72 Return the result of the quadratic form associated 

73 with A applied on the vector v, that is the number 
74 A_ij v'iv-)j 

75 using the summation convention. 


7| n = A.nrows() 

78 if not A.is_ symmetric(): 

79 print "Warning : Given matrix is not symmetric" 

80 if not A.is_ square (): 

81 raise TypeError,"Error : The matrix À is not square" 

82 if not v.degree ()==n 

83 raise TypeError,"The size do not agree" 

s4 return sum([ Afi,jl*xvlil*xv[j] for i in range(n) for j in range(— 


n) ]J).simplify_full() 


ss|class SymmetricMatrix(object): 


88 Provide informations about the matrix À assuming it is symmetric— 


90 def __init__(self ,A): 

91 if not A.is_ square (): 

92 print "Error : A symnetric matrix must be square” 
93 raise TypeError 

94 self .matrix A 

95 self.degree A.nrows () 

96 self.matrix.set _immutable() 

97 def primary _ principal _submatrix(self ,n): 


99 Return the primary principal submatrix of order n, that is the 
matrix obtained 


100 by removing the n last lines and columns from self 
101 HER 

102 taille=self.degree-n 

103 v={[] 

104 for i in range(0,taille): 

105 v.append(self.matrix[i][0:taille]) 

106 return matrix(v) 


107 def principal _minors(self): 


108 wun 


109 


110 


116 


146 
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Return the list of principal minors. The principal minor of — 
order k is 
the determinant of the primary principal matrix of 


order K. 


a=[] 
for i in range (self.degree): 
a.append(self.primary_principal_submatrix(i).determinant ()) 
return a 
def genre_list(self): 
mu 
Return the genius of the matrix as a list of booleans in the — 
order 
positive defined, negative defined; 
semidefinite positive, semidefinite negative, <— 
indefinité.. 


defpos = True 
defneg = True 
semidefpos = True 
semidefneg = True 
indefinie=True 
mineurs = self.principal _minors() 
for i in range (len(mineurs)): 
m = mineurs/li] 
if m == ©: 


defneg=False 
defpos=False 

if m < O: 
defpos=False 
semidefpos=False 


defneg=False 
if m > O: 
semidefneg=False 
if 142==1: 
defneg=False 
if O not in mineurs: 
semidefneg=False 
semidefpos=False 
if (defpos==True)or (defneg==True)or (semidefpos==True)or (<— 
semidefneg==True):indefinie-False 
return [defpos ,defneg ,semidefpos ,semidefneg ,indefiniel] 
def __str__(self): 
return str(self.matrix) 


class QuadraticForm(SymmetricMatrix): 
nun 
From a symmetric matrix À, provide informations concerning the — 
associated quadratic form. 


def __init__(self ,A): 


169 
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SymmetricMatrix. __init __(self,A) 
if not A.is_ symmetric(): 

print "Warning : matrix is not symmetric" 
f evaluate(self ,v): 


Return the value of the quadratic form on the vector v. 
nu 

return QuadraticMap(self.matrix,v) 

f diagonalizing_martrix(self): 


Return the matrix B such that B°tAB is diagonal. 

mun 

# The transposition is because , in the matrix B, the <— 
eigenvectors have 

# to be read as column while Sage”’s matrix constructor takes 
rows. 

return matrix (self.orthonormal basis()).transpose) 

f new_variables (self): 

un 

Give the change of variables needed to put the quadratic form — 
under its normal form 

X=BY 

where X are the "old" variables 

mu 

variables = var(automatedVar("y",self.degree)) 

Y = vector(variables) 

return self.diagonalizing_martrix()*xY 

f eigenmatrix_ left (self): 

return self.matrix.eigenmatrix_ left () 

f eigenvectors(self): 


Return a list of eigenvectors of the matrix. 


As the matrix is symmetric, that list has to be a basis. 

nnun 

D,P = self.eigenmatrix_left() 

return [P[i] for i in range(P.nrows())] 

f eigenvalues (self): 

unun 

Return a list of eigenvalues of the matrix in the same order <— 
as the list of eigenvectors given in 
self.eigenvectors () 

uunn 

D,P = self.eigenmatrix_left() 

return [ D[i,il for i in range(D.nrows()) ] 

f orthonormal_ basis(self): 


Return a basis of eigenvectors normalised to 1 as a list. 
wun 

M,mu = matrix(self.eigenvectors()).gram_schmidt() 

return [ v/v.norm() for v in M] 

f verification(self): 
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return the value of the quadratic form on the vector + 


new_variables() 


return self.evaluate(self.new_variables()) 


def __str__(self): 


da [] 
a.append("Hi guy; IL’m the quadratic form associated with the <— 
matix") 
a.append(str(self.matrix)) 
a.append("My eigenvalues and eigenvectors are : ") 
veps = self.eigenvectors() 
vaps = self.eigenvalues() 
for i in range (len(veps)): 
a.append("#s -> #%s"#(str(vapslil),str(vepslil))) 
a.append("Il’ve the following orthonormal basis of eigenvectors<— 
5") 
for v in self.orthonormal basis): 
a.append(str(v)) 
a.append("A matrix B such that B°tAB is diagonal is ") 
a.append(str(self.diagonalizing martrix())) 


a.append("Il’m quite pretty in the following variables ...") 
for i in range (self.degree): 
a.append("x#s = #%s"#(str(i+1) ,str(self.new_variables ()[i]l))— 
) 


a.append("Look at me when I wear my cool variables") 
a.append(str(self.verification())) 
return "\n'".join(a) 


class Extrema(object): 


From a function f, provides the informations for the study of < 


the extrema 


partial derivative 


critical points 


Hessian matrix at the critical points 


Genius of the Hessian and conclusion as local min/max 


Dear student : remember that this class does not furnish any <— 


informations 
concerning *global* extrema. The latter have to be found 


among the critical points OR on the border of the domain. 


def __init__(self ,f): 


var(’x,y”’) 

self.fun = f 

self.gx=self.fun.diff(x).full simplify() 
self.gy=self.fun.diff(y).full simplify() 
self.gxx=self.gx.diff(x).simplify_full() 
self.gxy=self.gx.diff(y).full simplify() 
self.gyy=self.gy.diff(y).full_simplify() 

self.cp = solve( [self.gx(x,y)==0,self.gy(x,y)==0] ,[x,y] ) 


def critical _points(self): 
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253 Return the critical points as a list of tuples (x,y) 
254 PEER 

255 a = f{] 

256 for pt in self.cp 

257 ECT 

258 px = SR(pt[O].rhs()) 


259 py SR(ptl1]l.rhs()) 

260 a.append((px,py)) 

261 except TypeError 

262 a.append(" I’m not able to solve these equations.") 

263 return a 

264 def hessienne(self ,a,b): 

265 return matrix(SR,2,2,[self.gxx(a,b) ,self.gxy(a,b),self.gxy(a,— 
b) ,self.gyy(a,b)]) 

266 def __str__(self): 


267 a = [] 

268 a.append ("The function :") 

269 a.append(str(self.fun)) 

270 a.append ("Derivative x and y :") 

271 a.append(str(self.gx)) 

272 a.append(str(self.gy)) 

27 a.append ("Hessian matrix :") 

274 a.append(str(self.hessienne(x,y))) 

275 a.append ("Critical points :") 

276 for pt in self.critical_points() 

277 a.append(str(pt)) 

278 for pt in self.critical_points(): 

279 try 

280 px = pt[o] 

281 py = ptli] 

282 a.append("at (%s,%s), the Hessian is"#(str (px) ,str(py))) 

283 try 

284 Hess = SymmetricMatrix(self.hessienne (px,py)) 

285 for Ll in Hess.matrix: 

286 a.append(" "+str(1)) 

287 a.append(" Primary principal minors are %s"#str (Hess. 
principal minors())) 

288 1 = Hess.genre list () 

289 if 1[0]==True: 

290 a.append(" Hessian positive defined") 

291 a.append(" local minimum") 

292 if 1[1]==True: 

293 a.append(" Hessian negative defined") 

294 a.append(" local maximum") 

295 if 1[2]==True: 

296 a.append(" Hessian positive semidéfinite") 

297 a.append(" I don’t conclude") 

298 if 1[13]==True: 

299 a.append(" Hessian negative semidefinite") 

300 a.append(" I don’t conclude") 

301 if 1[4]==True: 


302 a.append(" Undefinite Hessian") 
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a.append(" «selle» point") 
except RuntimeError ,data 
a.append(" ‘"+str(data)) 
except TypeError 
a.append(" I’m not able to solve these equations.") 


return "\n'".join(a) 


tex/sage/outilsINGE.sage 


ExBCRXooDVUdcf 
Exemple 43.1. 
Calculer la limite 
_ sin(x) cos(x) 


æ—00 TX 


(43.1) 


var(’x?) 
f(x)=sin(x)*xcos(x) /x 
limit (f(x) ,x=00) 


La première ligne déclare que la lettre x désignera une variable. Pour la troisième ligne, notez que 


l'infini est écrit par deux petits « o ». A 
ExCWDRooKxnjGL 


Exemple 43.2. 
Quelques limites et graphes avec Sage. 


sin(ax) 


(1) Émis Sfax): 
Pour effectuer cet exercice avec Sage, il faut taper les lignes suivantes : 


sage: var(’x,a,b’) 

(x, a, b) 

sage: f(x)=sin(axx)/sin(bxx) 
sage: limit( f(x) ,x=0 ) 

a/b 


Notez qu'il faut déclarer les variables x, a et b. 
(2) Mimi Vs 
sage: f(x)=(sqrt(xxx2+1))/(x-2) 
sage: limit(f(x) ,x=00) 
1 
sage: limit(f(x) ,x=-00) 
= 


Notez la commande pour la racine carré : sgrt. Etant donné que cette fonction diverge en 
x = 2, si nous voulons la tracer, il faut procéder en deux fois : 


sage: plot(f,(-100,1.9)) 

Launched png viewer for Graphics object consisting of 1 graphics primitive 
sage: plot(f,(2.1,100)) 

Launched png viewer for Graphics object consisting of 1 graphics primitive 


La première ligne trace de —100 à 1.9 et la seconde de 2.1 à 100. Ces graphiques vous 
permettent déjà de voir les limites. Attention : ils ne sont pas des preuves! Mais ils sont de 
sérieux indices qui peuvent vous inspirer dans vos calculs. 
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a 
exJMGTooZcZYNy 


Exemple 43.3. 
Calculer les dérivées partielles 0: f, yf, @2f, de f, He f et œ j des fonctions suivantes. 


(1) 2x + 3x2y — 2ÿ° (3) tan(x/y) 
(2) In(xy?) (4) 


Le script Sage suivant (exoDV002.sage) résout l'exercice : 


# =*k= çcoding: utf8 “+= 


sldef LesCalculs(f): 


print "Pour la fonction #%s"#str(f) 

print "d_x",f.diff(x).simplify_full() 

print "d_y",f.diff(y).simplify_full() 

print "d”72 _x",f.diff(x).diff(x).simplify _full() 
print "d_xd_y",f.diff(x).diff(y).simplify_full() 
print "d_yd_x'",f.diff(y).diff(x).simplify _full() 
prine "4d"2 v',f.diff(y):diff(y):.simplify full( 


print un 


def exercise _DVOO2(): 


var (’x,y’) 
fa(x,y)=2*x*xx8+3*xxxx2*xy-2XxV*xx2 
fb(x,y)=1n(xxyxx2) 
fc(x,y)=tan(x/y) 
fa(x,y)=x+xyx*x2/(x+y) 
LesCalculs(fa) 

LesCalculs(fb) 

LesCalculs(fc) 

LesCalculs(fd) 


tex/sage/exoDV002.sage 


La sortie est : 


Pour la fonction (x, y) |--> 2+%x73 + 3*xx72*xy - 2*xy72 
d_x (x, y) |--> 6*x72 + 6xxxy 

d_y (x, y) |--> 3xx72 - 4xy 

d"2_x (x, y) |--> 12*xx + 6*y 

d_xd_y (x, y) |1--> 6*xx 

d_yd_x (x, y) |1--> 6*xx 

d"2_y (x, y) |--> -4 


Pour la fonction (x, y) |--> log(xxy”2) 
d_x (x, y) |--> 1/x 

dy CG, y) Ve 27 

d"2_x (x, y) |--> -1/x72 

d_xd_y (x, y) |--> 0 

d_yd_x (x, y) |--> 0 

d"2_y (x, y) |--> -2/y°2 


Pour la fonction (x, y) |--> tan(x/y) 
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d_x (x, y) 1--> 1/(yxcos(x/y)72) 

d_y (x, y) 1--> -x/(yT2*cos(x/y) 72) 

d"2_x (x, y) |--> 2*sin(x/y)/(y72*xcos(x/y)73) 

d_xd_y (x, y) |--> -(2*xxsin(x/y) + yxcos(x/y))/(y738*xcos(x/y)73) 
d_yd_x (x, y) |--> -(2xxxsin(x/y) + yxcos(x/y))/(y°3+cos(x/y)73) 
d"2_y (x, y) |--> 2*x(x72*xsin(x/y) + x*y*cos(x/y))/(y74xcos(x/y) 73) 


Pour la fonction (x, y) |--> xxy=2/(x + y) 

d_x (x, y) |--> y73/(x72 + 2*xxy + y72) 

d_y (x, y) 1--> (2xx72*xy + xxy72)/(x72 + 2%xxxy + y72) 

d72_x (x, y) 1--> -2xy73/(x738 + 3xx72*y + 3xxxy72 + y73) 

d_xd_y (x, y) 1--> (3*xxy72 + y73)/(x78 + 3xx72*xy + B*xxxy72 + y73) 
d_yd_x (x, y) 1--> (3*xxy72 + y73)/(x738 + 3%xx72*%y + 8*xxxy72 + y73) 
d"2_y (x, y) |--> 2*x738/(x73 + 3xx72*%y + 3xxxy72 + y73) 


A 
exKGDIooVefujD 


Exemple 43.4. 
Résoudre les systèmes suivants. 


T1 — 2%2 + 8x3 — 274 = 0 T1 — 2%9 + 343 — 2x%4 = Ù 
(1) 321 — 7x2 — 223 + 4x4 = 0 (8) 321 — 722 — 223 + 4x4 = 0 
Ax1 + 3x2 + 5%3 + 2x4 = 0 Ax1 + 3x2 + 5t%3 + 274 = 0 


2%1 + Zo — 2%3 + 3x4 = 0 2%1 + Zo — 2%3 + 3x4 = 0 
3x1 + 229 — x3 + 3x4 = 4 (9) 3æ1 + 272 — x3 + 374 = 4 


321 + 372 + 323 — 3x4 = 9 
T1 + 279 — 3x3 = 0 finies 


321 + 3T2 + 3XZ3 — 3x4 = 9 


2x1 + 5x0 + 2x3 = 0 (10) 2x1 + 5x2 + 2x3 = 0 


341 — Z2 — 4x3 = 0 341 — 2 — 4x3 = 0 


1 + 4% + 7z3 = 0 1 + 479 + 7xæ3 = 0 


x 
21 + 322 + 343 = 0 T1 + 372 + 373 = 0 


T1 + 2%2 — t3 = 0 T1 + 2%0 — 3 = 0 
2%1 + DTo + 223 = 0 2%1 + 5x2 + 2%3 = 0 


T1 + Lo + T3 + La = 0 T1 + Lo + T3 + za = 0 
(5) T1 + Lo + Z3 — X4 = 4 (12) 1 + Lo + 3 — X4 = 4 
T1 + Lo — X3 + La = —4 1 + Lo — X3 + X4 = —4 
T1 — Lo + T3 + La = 2 T1 — Lo + T3 + T4 = 2 
T1 + 3%2 + 843 = 1 T1 + 3%2 + 8t3 = l 
(6) d1 + 329 + 4x3 = 0 (13) 21 + 3x9 + 4x3 = 0 
æ1 + 4x9 + 3x3 = 3 di + 4x2 + 373 = 3 
%1 — 3%2 + 2%3 = —-6 T1 — 322 + 2243 = —-6 
(7) —3x1 + 3242 — x3 = 17 (14) —3x1 + 3x2 — x3 = 17 
2%] — Zo = 3 2% — To = 3 


Nous résolvons les systèmes en utilisant Sage avec le script suivant. 


# -4x- coding: utf8 -*- 


,[uun 


3lCe script Sage résout un certain nombre 
alde systèmes d’équations linéaires du cours INGE1121 


E nu 
> 


43.1. GRAPHIQUES 


import outilsINGE 


def exercise _1_1_bcdefhi(): 
# Exercice 1.1.b (INGE1121) 
A=matrix(L [1,-2,8,-2,01,[18,-7,-2,4,01,14,3,6,2,01 1) 
v=vector((0,0,0,0,0)) 
print outilsINGE.SolveLinearSystem(A,v) 
# Exercice 1.1.c (CINGE1121) 
A=matrix(l [2,1,-2,81,[18,2,-1,81,18,8,8,-31 1) 
v=vector((0,4,9)) 
print outilsINGE.SolveLinearSystem(A,v) 
# Exercice 1.1.4 (INGE1121) 
A=matrir(l [1,2,-381,/2,5,21,[8:-1,-41 D 
v=vector((0,0,0)) 
print outilsINGE.SolveLinearSystem(A,v) 
# Exercice 1.1.e (INGE1121) 
A=matrix(l [1,2:-11:12,5,21:114,4,71;:11,3;8]1 1) 
v=vector((0,0,0,0)) 
print outilsINGE.SolveLinearSystem(A,v) 
# Exercice L:1l:f CINGELL21) 
P=mabrieCtl (1,111, Et,1,1, 112014 1=1,11.0t,-1,1,1) 1) 
v=vector((0,4,-4,2)) 
print outilsINGE.SolveLinearSystem(A,v) 
# Exercice 1.1.h (INGE1121) 
A=matrix([ [1,3,3]1,11,3,4]1,11,4,3] ]) 
v=vector((1,0,3)) 
print outilsINGE.SolveLinearSystem(A,v) 
# Exercice 1.1.i CINGE1121) 
A=matrix(l [1,-38,21,:1-3,8,-11,/12;,=1,61 1) 
v=vector((-6,17,3)) 
print outilsINGE.SolveLinearSystem(A,v) 
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tex/sage/exoll.sage 


Le résultat est le suivant : 


The given matrix corresponds to the system 
x1 — 2*%x2 + 3*x3 - 2xx4 == 

3xx1 — 7*x2 - 2%x3 + 4xx4 == 0 

Axx1 + 3Xxx2 + Dxx3 + 2%xx4 == 0 

And the solutions are 

C 

[x1 == -23/16*r19, x2 == -5/16%xr19, x3 == 15/16*r19, x4 == r19, x5 == r18] 
] 

The given matrix corresponds to the system 
2xx1 + x2 - 2%xx3 + 3*xx4 == 

3xx1 + 2*%x2 - x3 + 3*xx4 == 


3*xx1 + 3Xxx2 + 3*+xx3 - 3xx4 == 9 

And the solutions are 

C 

[xi == 3*r20 - 7, x2 == -4xr20 + 11, x3 == r20, x4 == 1] 
] 


The given matrix corresponds to the system 
x1 + 2%x2 - 3*xx3 == 
2xx1 + Dxx2 + 2*x3 == 
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3xx1 - x2 - Axx3 == 

And the solutions are 

C 

[x1 == 0, x2 == 0, x3 == 0] 

] 

The given matrix corresponds to the system 
X1 + 2*%x2 - x3 == 

2xx1 + Exx2 + 2*xx3 == 0 

x1 + 4%xx2 + 7xx3 == 0 

x1 + 3*xx2 + 3*%xx3 == 0 

And the solutions are 

C 

[xi == 9xr21, x2 == -4xr21, x3 == r2i] 

] 

The given matrix corresponds to the system 
xl x2 + x3 + x4 == 

x2 + x3 - x4 == 4 

x2 —- x3 + x4 == -4 

x1 - x2 + x3 + x4 == 2 

And the solutions are 


> 
a 
+ + + 


[xi == 1, x2 == -1, x3 == 2, x4 == -2] 

] 

The given matrix corresponds to the system 
x1 + 3*x2 + 3*x3 == 1 

x1 + 3*xx2 + 4*xx3 == 0 

x1 + 4kx2 + 3*x3 == 3 

And the solutions are 


C 

[xi == -2, x2 == 2, x3 == -1] 
] 

The given matrix corresponds to the system 
x1 — 3*x2 + 2*x3 == -6 

—S3*xx1 + 3*x2 - x3 == 17 

2*x1 - x2 == 

And the solutions are 

C 

[x1 == 37, x2 == 71, x3 == 85] 
] 


Exemple 43.5. 
Pour chacun des systèmes suivants À + X = B, 


(1) Résoudre le système par échelonnement, 
(2) Calculer A7, 
(3) Vérifier votre réponse en calculant A-!B. Qu’êtes-vous censé obtenir ? 


Les énoncés sont 


(1) 


A 
ExBGCEooPIQgGW 


(43.2) 
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Nous utilisons Sage pour fournir la réponse. Le code suivant résout le système et donne l'inverse 
de la matrice : 


# -*+- coding: utf8 -*- 


import outilsINGE 


s\def exercise _ 1 _3(): 


A=matrix([[2,1,-21,18,2,21.,15,4,311) 
v=vector((10,1,4)) 

print outilsINGE.SolveLinearSystem(A,v) 
print "Matrice inverse :" 

print A.inverse() 


tex/sage/exo13.sage 


La sortie est ici : 


The given matrix corresponds to the system 
2*x1 + x2 - 2xx3 == 10 

3*+kx1 + 2%xx2 + 2xx3 == 1 
Dxx1 + 4kx2 + 3xx3 == 4 

And the solutions are 

C 

[xi == 1, x2 == 2, x3 == -3] 
] 

Matrice inverse : 

[ 2/7 11/7 -6/7] 

[ -1/7 -16/7 10/7] 

[ -2/7 3/7 -1/7] 


A 
exBNGVooIvKfTT 
Exemple 43.6. 
Sachant que (—1,0,1,0) est un vecteur propre de la matrice 
2 1 —1 1 
1 0 1 1 
DRE (43.3) 
1 1 1 0 
(1) Diagonaliser À au moyen d’une matrice orthogonale 
(2) Écrire la forme quadratique X*AX sous forme d’une somme pondérée de carrés. 
Calculons Av afin de savoir la valeur propre associée au vecteur donné : 
2 1 —1 1 —] —3 
1 0 1 1 0 0 
—1 1 2 1 1 | | 3 Fo. 
1 1 1 0 0 0 


La valeur propre est donc 3. Nous savons donc que (À — 3) pourra être factorisé dans le polynôme 
caractéristique. 


Pour le reste de l’exercice c’est standard et c’est résolu de la façon suivante : 


1 


# -*+- coding: utf8 -*- 
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| import outilsINGE 


5def exercise 6 _5(): 
A=matrix(QQ,4,4,12,1,-1,1,1,0,1,1,-1,1,2,1,1,1,1,01]) 
x=outilsINGE.QuadraticForm(A) 

print x 


tex/sage/exo65.sage 


qui retourne 


Hi guy; I’m the quadratic form associated with the matix 
L 3 1=1: 1] 

LÉO A] 

És1 4 2 1] 

[C1 1 1 01] 

My eigenvalues and eigenvectors are : 

3 -> (1, O, -1, 0) 

3 -> (0, 1, 2, 1) 

-1 -> (1, O0, 1, -2) 

-1 -> (0, 1, O, -1) 

l’ve the following orthonormal basis of eigenvectors : 
(1/2*sqgrt(2), O0, -1/2xsqrt(2), 0) 

(1/2, 1/2, 1/2, 1/2) 

(1/6*sqrt(6), O0, 1/6*xsqrt(6), -1/3xsqrt(6)) 
(-1/2*sgrt(1/3), 3/2*sqrt(1/3), -1/2*sqrt(1/3), -1/2xsqrt(1/3)) 
A matrix B such that B°"tAB is diagonal is 


[  1/2xsqrt(2) 1/2 1/6*xsqrt(6) -1/2*xsqrt(1/3)] 
C 0 1/2 O0 3/2xsqrt(1/3)] 
[ -1/2xsqrt (2) 1/2 1/6*xsqrt(6) -1/2*xsqrt(1/3)] 
C (0) 1/2 -1/3*xsqrt(6) -1/2*xsqrt(1/3)] 


l’m quite pretty in the following variables ... 

xi = -1/2*sqrt(1/3)*xy4 + 1/2*sqrt(2)*xy1 + 1/6*xsqrt(6)*y3 + 1/2xy2 
x2 = 3/2*xsqrt(1/3)*xy4 + 1/2*y2 

x3 = -1/2*sqrt(1/3)*xy4 - 1/2*sqrt(2)*xy1 + 1/6*xsqrt(6)*y3 + 1/2xy2 
x4 = -1/2*sqrt(1/3)*xy4 - 1/3*xsqrt(6)*xy3 + 1/2*y2 

Look at me when I wear my cool variables 

3*y172 + 3xy272 - y372 - y472 


À 
exZHGRooTQpVpq 
Exemple 43.7. 


Rechercher les extrémums des fonctions suivantes 


(1) f(x, y) = 2 — 4/22 + 


(2) f(x, y) = 2% + 3xy? — 15x — 12y 
(3) f(x, y) = a à 4 x? — 3x — Ay —3 


Les corrigés sont créés par le script Sage exo101.sage 


# -*x- coding: utf8 -*- 
import outilsINGE 


def exercise_10_1_A(): 
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var(’x,y’) 

f(x, y)=2-sqrt(xxx2+yxx2) 

print outilsINGE.Extrema(f) 
def exercise _10_1_B(): 

var(’x,y’) 

FR, y)=xxkx3+3xxxky*xk2-1D4xx-12*%Y 

print outilsINGE.Extrema(f) 
def exercise _10_1 C(): 

var(’x,y’) 

(x, y)=xx*x3/3+4*xy*xx3/3-xxx2-3%xx-4xÿ-3 

print outilsINGE.Extrema(f) 


Des réponses : 


(1) The function : 
(x, y) 1--> -sgrt(x72 + y72) + 2 
Derivative x and y : 
(x, :Y). [==> =x/sagrt(x"2 + y72) 
(x, y) 1--> -y/sqrt(x"2 + y°2) 
Hessian matrix : 


[-sqrt(x"2 + y72)xy72/(x74 + 2xx72xy72 + y74) xky/(x72 + y72)7( 
C R#ÿ/(x°2/+-ÿ"2)" (8/2) =sqrt ("2 + y°2)4x72/ CRT + 24x28" 2 + à 
Critical points : 

(0, 0) 


At (0,0), the Hessian is 
power::eval(): division by zero 


Ici nous voyons que Sage à du mal à calculer la matrice hessienne en (0,0). En effet, nous 
tombons sur une division par zéro. Pour résoudre l'exercice, il faut se rendre compte que 
la fonction (x,y) - 4/x? + y? est toujours positive et est nulle seulement au point (0,0). 
Donc f est toujours plus petite ou égale à deux tandis que f(0,0) = 2. Le point est donc un 
maximum global. 


(2) The function : 
(x, y) |--> x78 + 3xxxy72 - 15%x - 12*y 
Derivative x and y : 
(x, y) |1--> 3%xx72 + 3*y72 - 15 
(x, y) |--> 6*xx*y - 12 
Hessian matrix : 
[6*+x 6*xy] 
[6*xy 6xx] 
Critical points : 
(2; 1) 
(1, 2) 
is #2) 
20 
At (2,1), the Hessian is 
(12, 6) 
(6: 12) 
Primary principal minors are [108, 12] 
Hessian positive defined 
local minimum 
At (1,2), the Hessian is 
(6-19) 
(12, 6) 
Primary principal minors are [-108, 6] 
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Undefinite Hessian 
«<selle> point 


At (-1,-2), the Hessian is 
(-6, -12) 
(512;,.:=6) 


Primary principal minors 
Undefinite Hessian 
«<selle> point 

(-2,-1), the Hessian is 
(212; #6) 

(-6, -12) 

Primary principal minors 
Hessian negative defined 


At 


local maximum 


The function : 

CR, les SRE SCD 
Derivative x and y : 

(x, y) |--> x72 - 2%xx - 3 
(x, y) |--> 4xy72 - 4 
Hessian matrix : 

[2*xx - 2 0] 

C (0) 8*y] 

Critical points 

(8,1) 

(GS 

(As. -#T) 

(A EE 

At (3,1), the Hessian is 
(4, 0) 

(0, 8) 

Primary principal minors 
Hessian positive defined 
local minimum 

(-1,1), the Hessian is 
(-4, 0) 

(03.8) 

Primary principal minors 
Undefinite Hessian 


At 


<selle> point 

(3,-1), the Hessian is 
(4, 0) 

(0, -8) 

Primary principal minors 
Undefinite Hessian 
<selle> point 

(-1,-1), the Hessian is 
(-4, 0) 

(0, -8) 

Primary principal minors 
Hessian negative defined 


At 


At 


local maximum 
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are [-108, -6] 


are [108, -12] 


4/3*xy73 - 3*x - 4xy - 3 


are [32, 4] 


are [-32, -4] 


are [-32, 4] 


are [32, -4] 


EXEMPLES AVEC SAGE 


A 
exHWIHooUAvaDQ 


43.1. GRAPHIQUES 


Exemple 43.8. 


Déterminer les valeurs extrêmes et les points de selle des fonctions suivantes. 


(1) f(x, y) = x? + 4x + y? — 2y. 
(2) Fe, y) = "+, 


(3) f(x, y) = esin(y). 
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Certains corrigés de cet exercice ont étés réalisés par Sage. Le script utilisé est exo103.sage 


# -*+- coding: utf8 -*- 


slimport outilsINGE 


s5\def exercise 10 3 A(): 


var (’x,y’) 
f(x, yY)=x*x*x2+4Kkx+Y*xXx2-2*XxV 
print outilsINGE.Extrema(f) 


def exercise _10 3 H(): 
var (ts, 
f(x,y)=exp(x*x*x2+xxy) 
print outilsINGE.Extrema(f) 


sdef exercise _10_3_Q(): 


var (?x,y”’) 
f(x,y)=exp(x)+sin(y) 
print outilsINGE.Extrema(f) 


tex/sage/exo103.sage 


Des réponses : 


(1) The function : 
(x, y) 1--> x72 + y°2 + 4xx - 2*%y 
Derivative x and y : 
(x, y) Î|--> 2*xx + 4 
(x, y) 1--> 2*xy - 2 
Hessian matrix : 
[2 0] 
[Oo 2] 
Critical points : 
(22, 1) 
At (-2,1), the Hessian is 
(2, 0) 
(0, 2) 
Primary principal minors are [4, 2] 
Hessian positive defined 
local minimum 


(2) The function : 
(x, y) 1--> e7(x°2 + xxy) 
Derivative x and y : 
(x, y) 1--> (2xxke7(x72) + yre7(x72))xe" (xxy) 
(x, y) 1--> xxeT(x72 + xxy) 
Hessian matrix : 


[(Axxkyxke®(x72) + y72%xe"(x72) + 2x (2%xx72 + 1)+e7(x72))xe(xxy) 


(CSS ET 
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C (xkyxe" (x72) + (24x72 + 1)xe7(x72))+eT(xxy) 
Critical points : 
(0, 0) 
At (0,0), the Hessian is 
(2, 1) 
(1, 0) 


Primary principal minors are [-1, 2] 
Undefinite Hessian 
«selle> point 


The function : 


(x, y) Î|--> e°xxsin(y) 
Derivative x and y : 

(x, y) |--> e"xxsin(y) 
(x, y) |--> e"xxcos(y) 


Hessian matrix : 
[ e"xxsin(y) e"x*xcos(y)] 
[ e"xxcos(y) -e"x*xsin(y)] 
Critical points : 
l’m not able to solve these equations. 
l’m not able to solve these equations. 
At ( ,1), the Hessian is 
l’m not able to solve these equations. 
At ( ,1), the Hessian is 
l’m not able to solve these equations. 


Ici, Sage n’est pas capable de résoudre les équations qui annulent le jacobien. Les équations 
à résoudre sont pourtant faciles : 


(43.5a) 
(43.5b) 


Étant donné que l’exponentielle ne s’annule jamais, il faudrait avoir en même temps cos(y) = 
0 et sin(y) = 0, ce qui est impossible. La fonction n’a donc aucun extrémums local. 


A 
exEEHPooKDxLTJ 
Exemple 43.9. 
Considérons la fonction 
2 2 
fa =age FU, (43.6) 


(1) 
(2) 


Montrer qu’il y a une infinité de points critiques. 


Déterminer leur nature. 


Voici la fonction Sage qui fournit les informations : 


# -4- coding: utf8 -*- 


3|import outilsINGE 


s| def 


exercise _10 _4(): 


var(’x,y”) 
f(x,y)=xxy*x*x2+exp (-(x*k*x2+y*xx2) /4) 
print outilsINGE.Extrema(f) 


tex/sage/exo104.sage 
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La sortie est 


The function : 


(x, y) |--> xxy72*e7(-1/4xx72 - 1/4xy72) 


Derivative x and y : 
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(x, y) 1--> -1/2x(x72 - 2)*xy72*%e7(-1/4xx72 - 1/4xy72) 
(x, y) 1--> -1/2x(xxy73 - 4xxxy)*e7(-1/4xx72 - 1/4xy72) 


Hessian matrix : 


C 1/4Kk(x78 - 6*x)*xy"2*e"(-1/4xx72 - 1/4xy72) 1/4kx((x72 - 2)xy73 - Ak(x72 - 2 
[1/4k((x72 - 2)xy73 - 4k(x72 - 2)xy)xe"(-1/4xx72 - 1/4xy72) 


Critical points : 

(r17, 0) 

(-sgrt(2), -2) 

(sgrt(2), -2) 

(-sgrt(2), 2) 

(sqrt(2), 2) 

At (r17,0), the Hessian is 
(0, 0) 
(O, 2*xr17*xe"(-1/4xr1772)) 
Primary principal minors are [0, 0] 
Hessian positive semidéfinite 
I don’t conclude 
Hessian negative semidefinite 
I don’t conclude 

At (-sqgrt(2),-2), the Hessian is 
(4xsqrt(2)*e7(-3/2), 0) 
(0, 4ksqrt(2)*xe7(-3/2)) 


Primary principal minors are [32*e”"(-3), 


Hessian positive defined 
local minimum 

At (sgrt(2),-2), the Hessian is 
(-4xsqrt(2)*xe"(-3/2), 0) 
(0, -4xsqrt(2)*e"(-3/2)) 


Primary principal minors are [32*e”"(-3), 


Hessian negative defined 
local maximum 

At (-sqrt(2),2), the Hessian is 
(4ksqrt(2)*e"(-3/2), 0) 
(0, 4ksqrt(2)*xe7(-3/2)) 


Primary principal minors are [32*e”"(-3), 


Hessian positive defined 
local minimum 

At (sgrt(2),2), the Hessian is 
(-4xsqrt(2)*e"(-3/2), 0) 
(0, -4xsqrt(2)*e"(-3/2)) 


Primary principal minors are [32*e”"(-3), 


Hessian negative defined 
local maximum 


4xsqrt(2)*e”(-3/2)] 


-4xsqrt(2)*e”(-3/2)] 


4xsqrt(2)*e”(-3/2)] 


-4xsqrt(2)*e"(-3/2)] 


Notez la présence de r1 comme paramètres dans les solutions. Tous les points avec y = 0 sont 
des points critiques. Cependant, Sage ! ne parvient pas à conclure la nature de ces points (x, 0). 

Notons que le nombre f(x,y) a toujours le signe de x parce que y? et l’exponentielle sont 
positives. Toujours ? En tout cas lorsque x # 0. Prenons un point (a,0) avec a > 0. Dans un 


1. ou, plus précisément, le programme que j’ai écrit avec Sage. 


1/4k(xxy74 —- 10*xx*xy72 + 


H 
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voisinage de ce point, nous avons f(x, y) > 0 parce que si a > 0, alors x > 0 dans un voisinage de 
a. Le point (a, 0) est un minimum local parce que 0 = f(a,0) < f(x,y) pour tout (x,y) dans un 
voisinage de (a, 0). 

De la même façon, les points (a, 0) avec a < 0 sont des maximums locaux parce que dans un 
voisinage, la fonction est négative. 

Le point (0,0) n’est ni maximum ni minimum local. C’est un point de selle. 


A 
exRNZKooUIOfPU 


Exemple 43.10. 
Dériver les fonctions suivantes. 


(1) sin (In(x)) 


(2) sinT. 
(3) 
(4) cos(r)""(®) 


Le programme suivant par Sage résout l'exercice : 


; 
T 
2 

e? 


#! /usr/bin/sage -python 
# -*- coding: utf8 -*- 


from sage.all import * 


var(’x’) 


f=sin(ln(x)) 
print f.diff(x) 
f=sin(x)/x 
print f.diff(x) 
f=exp(x**x2) 


| print f.diff(x) 
:f=cos(x)xx(sin(x)) 


print f.diff(x) 


tex/sage/corrDerive_0002.sage 
Le résultat est : 


cos(log(x))/x 

cos(x)/x - sin(x)/x72 

2*x+ke7(x72) 

(log(cos(x))*cos(x) - sin(x)”72/cos(x))*cos(x)"sin(x) 


VA 
exLFYFooNCXCJz 


Exemple 43.11. 
Donner une approximation de In(1.0001). 


| Sage Version 4.5.3, Release Date: 2010-09-04 | 
| Type notebook() for the GUI, and license() for information. | 
sage: numerical_approx(ln(1.0001)) 

0.0000999950003332973 
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Épilogue : la constante de Weiner 


Nous voici à la fin du Frido. Nous avons étudié beaucoup de math, et beaucoup reste à voir. 
En guise de conclusion, je voudrais vous parler de la constante de Weiner, introduite dans [774]. 
Il s’agit d’une constante, qui comme r ou e intervient dans à peu près tous les domaines de la 
mathématique. 

Comme toujours, il existe énormément de définitions équivalentes différentes ; nous choisissons 


celle-ci, motivée par le théorème de Weinersmith 27.45. 
DEFooXVXSooVJDTPy 


Définition 44.1. 
La constante de Weiner W. est l’unique réel p tel que l’espace LP(R7) soit un espace de Hilbert. 


Cette constante intervient de façon centrale dans de nombreux résutats dans tous les domaines ; 
nous en citons quelques-uns. 


(1) La moyenne de tout couple de réels peut être calculée en divisant leur somme par la constante 
de Weiner |. 


(2) La constante de Weiner donne l’indice du groupe alterné dans le groupe symétrique pour 
tous les ordres, théorème 5.44. 


(3) La constante de Weiner donne une borne inférieure optimale pour l’ensemble des nombres 
premiers. 


(4) La constante de Weiner est à la fois l’unique point fixe non trivial de la fonction factorielle 
et le nombre de points fixes de la même fonction. 


(5) Tout automorphisme d’anneau à un polynôme minimal dont le degré est donné par la 
constante de Weiner. 


(6) Le théorème de Jordan 27.200 affirme que le nombre de composantes connexes du complé- 
mentaire d’une courbe de Jordan dans R? est donné par la constante de Weiner. 


(7) L'égalité ab = 0 dans un anneau n'implique pas spécialement a = 0 ou b = 0 lorsque la 
caractéristique de l’anneau est égale à la constante de Weiner, et seulement dans ce cas. 


(8) Pour l’anecdote, la constante de Weiner donne le rapport 7/7 ; elle est aussi la partie entière 
de e. 


Il reste encore de nombreuses conjectures mettant en valeur la constante de Weiner : 


(1) La fameuse droite critique de la conjecture de Riemann est donnée par linverse de la 
constante de Weiner. 


(2) Soit P l’ensemble de nombres premiers. Est-ce que l’ensemble 
{(p,q) € P x P tel que 0 < |p — q| = We} (44.1) 


est fini ? 


1. C’est historiquement la première propriété énoncée de la constante de Weiner; elle suggère également une 
notion de constante de Weiner généralisée pour moyenner un nombre arbitraire de nombres. La construction des 
nombres de Weiner généralisés est en projet dans la section 1.3. 
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D'’aucuns pourraient objecter que tout cela n’est que fantaisie et trivialité. Il n’en est rien. La 
preuve que la constante de Weiner est centrale en mathématique est précisément qu’elle avait déjà 
un nom et un symbole réservé bien avant le début de l’histoire des mathématiques. 

Le fait est que toutes les mathématiques que vous connaissez se basent sur les nombres entiers ; 
cela n’est pas du tout une trivialité. 


Chapitre 45 


Développements possibles 


Nous donnons ici quelques idées de développements associés aux leçons mises à jour en 2021. 
Parfois, il est bon d’ajouter quelques lemmes au développement proposé, si il est trop court. Si 
l’un ou l’autre ne vous semble pas adapté à l’énoncé de la leçon, faites le moi savoir. 


45.1 Algèbre et géométrie 
Exemples d'équations en arithmétique. 


PGCD et PPCM, algorithmes de calcul. Applications. 


Racines d’un polynôme. Fonctions symétriques élémentaires. Exemples et applica- 
tions. 


Endomorphismes diagonalisables en dimension finie. 

Formes linéaires et dualité en dimension finie. Exemples et applications. 
Distances et isométries d’un espace affine euclidien. 

Formes quadratiques réelles. Coniques. Exemples et applications. 


Exemples d'utilisation de techniques d’algèbre en géométrie. 
— Partitions d’un entier en parts fixées, théorème 26.99. 


— Théorème de Sophie Germain, théorème 6.19. 


Groupes abéliens et non abéliens finis. Exemples et applications. 
— Structure des groupes d’ordre pq, théorème 5.25. 


— Les groupes abéliens finis, théorème 5.23. 


Conjugaison dans un groupe. Exemples de sous-groupes distingués et de groupes 
quotients. Applications. 


— Le groupe alterné À, est simple, théorème 5.50. 


— Structure des groupes d’ordre pq, théorème 5.25. 
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Méthodes combinatoires, problèmes de dénombrement. 
— Coloriage de roulette (18.10.15.1) et composition de colliers (18.10.15.2). 
— Nombres de Bell, théorème 15.166. 


— Le dénombrement des solutions de l'équation ain1 + ...apnp = n utilise des séries entières 
et des décompositions de fractions en éléments simples, théorème 26.99. 


Barycentres dans un espace affine réel de dimension finie, convexité. Applications. 
— Théorème de Carathéodory 8.41. 
— Points extrémaux de la boule unité dans £(E), théorème 13.37. 


— Enveloppe convexe du groupe orthogonal 13.38. 


Formes quadratiques sur un espace vectoriel de dimension finie. Orthogonalité, iso- 
tropie. Applications. 


— Le lemme au lemme de Morse, lemme 17.121, voir le lemme de Morse lui-même 20.194. 
— Connexité des formes quadratiques de signature donnée, proposition 17.120. 

— Sous-groupes compacts de GL(n, R), lemme 13.40 ou proposition 13.41. 

— Ellipsoïde de John-Loewner, proposition 17.125. 


Systèmes d’équations linéaires ; opérations élémentaires, aspects algorithmiques et 
conséquences théoriques. 


— Algorithme des facteurs invariants 4.113. 


— Méthode du gradient à pas optimal 17.117. 


Endomorphismes remarquables d’un espace vectoriel euclidien (de dimension finie). 
— Décomposition polaire 13.32. 
— Sous-groupes compacts de GL(n, R), lemme 13.40 ou proposition 13.41. 


— Théorème 9.221 sur la diagonalisation de matrices symétriques. 


Matrices symétriques réelles, matrices hermitiennes. 
— Racine carrée d’une matrice hermitienne positive, proposition 13.27. 
— Le lemme au lemme de Morse, lemme 17.121. 
— Connexité des formes quadratiques de signature donnée, proposition 17.120. 


— Théorème 9.221 sur la diagonalisation de matrices symétriques. 


Endomorphismes trigonalisables. Endomorphismes nilpotents. 
— Théorème de Burnside sur les sous-groupes d’exposant fini de GL(n, C), théorème 9.307. 
— Décomposition de Dunford, théorème 9.259. 


— Théorème de Lie-Kolchin 12.106. 


Exponentielle de matrices. Applications. 
— Décomposition de Dunford, théorème 9.259. 


— Théorème de Von Neumann 17.64. 
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Endomorphismes diagonalisables en dimension finie. 
— Théorème de Burnside sur les sous-groupes d’exposant fini de GL(n, C), théorème 9.307. 


— Racine carrée d’une matrice hermitienne positive, proposition 13.27, parce qu’un utilise le 
résultat de diagonalisation simultanée. 


— Équation de Hill y” + qy = 0, proposition 32.48. 
— Décomposition de Dunford, théorème 9.259. 


— Endomorphismes cycliques et commutant dans le cas diagonalisable, proposition 9.295. 


Sous-espaces stables par un endomorphisme ou une famille d’endomorphismes d’un 
espace vectoriel de dimension finie. Applications. 


— Équation de Hill y” + qy = 0, proposition 32.48. 
— Décomposition de Dunford, théorème 9.259. 
— Théorème de Lie-Kolchin 12.106. 


Polynômes d’endomorphisme en dimension finie. Réduction d’un endomorphisme en 
dimension finie. Applications. 


— Racine carrée d’une matrice hermitienne positive, proposition 13.27. 
— Théorème de Burnside sur les sous-groupes d’exposant fini de GL(n, C), théorème 9.307. 
— Décomposition de Dunford, théorème 9.259. 


— Algorithme des facteurs invariants 4.113. 


Déterminant. Exemples et applications. 


— Forme alternées de degré maximum, proposition 9.7, parce que c’est ce théorème qui donne 
l’unicité du déterminant du fait que l’espace est de dimension un. 


— Théorème de Rothstein-Trager 20.94 parce que le résultant en est un. 


— Ellipsoïde de John-Loewner, proposition 17.125. 


Dimension d’un espace vectoriel (on se limitera au cas de la dimension finie). Rang. 
Exemples et applications. 


— Forme alternées de degré maximum, proposition 9.7, parce que c’est ce théorème qui donne 
l’unicité du déterminant du fait que l’espace est de dimension un. 


— Théorème de la dimension 4.13. 
— Extrema liés, théorème 17.76. 
— Théorème 9.221 sur la diagonalisation de matrices symétriques. 


— Stabilité du rang par extension des scalaires, proposition 9.278. 


Exemples d’actions de groupes sur les espaces de matrices. 
— Action du groupe modulaire sur le demi-plan de Poincaré, théorème 23.95. 
— Lemme de Morse, lemme 20.194. 
— Sous-groupes compacts de GL(n,R), lemme 13.40 ou proposition 13.41. 


— Algorithme des facteurs invariants 4.113. 


Polynômes irréductibles à une indéterminée. Corps de rupture. Exemples et applica- 
tions. 


— Irréductibilité des polynômes cyclotomiques, proposition 19.23. 


— Polynômes irréductibles sur F,. 
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Extensions de corps. Exemples et applications. 
— Polynômes séparables, proposition 6.161. 
— Lien entre les racines (multiples) de P et P”, proposition 6.161. 
— Théorème de l’élément primitif 6.170. 
— À propos d'extensions de Q, le lemme 6.181. 
— Polynômes irréductibles sur F,. 


— Polygones réguliers constructibles, théorème de Gauss-Wantzel, 19.87. 


Corps finis. Applications. 
— Théorème de Chevalley-Warning 19.43. 
— Loi de réciprocité quadratique 19.39. 
— (Z/pZ)* = Z/(p — 1)Z, corolaire 19.32. 


— Polynômes irréductibles sur F,. 


Nombres premiers. Applications. 
— Structure des groupes d’ordre pq, théorème 5.25. 
— Divergence de la somme des inverses des nombres premiers, théorème 15.118. 
— RSA, section 19.2, plus l’exponentielle rapide, plus la recherche de couples de Bézout. 
— Forme faible du théorème de Dirichlet (avec ses deux lemmes) 19.28. 
— (Z/pZ)* = Z/(p — 1)Z, corolaire 19.32, peut-être redondant avec les groupes d’ordre pq. 
— Irréductibilité des polynômes cyclotomiques, proposition 19.23. 


— Théorème des deux carrés, théorème 6.25. 


Anneaux Z/nZ. Applications. 
— RSA, section 19.2, plus l’exponentielle rapide, plus la recherche de couples de Bézout. 
— Forme faible du théorème de Dirichlet (avec ses deux lemmes) 19.28. 
— (Z/pZ)* = Z/(p — 1)Z, corolaire 19.32. 
— Groupes d'ordre pq, théorème 5.25. 


— Irréductibilité des polynômes cyclotomiques, proposition 19.23. 


Exemples de parties génératrices d’un groupe. Applications. 


— RSA, section 19.2. Assez indirect : la système RSA se base sur la formule w(pq) = (p—1)(q—-1), 
laquelle se base sur l’isomorphisme Z/pZ x 7/qZ = Z%/pqZ et leurs générateurs. 


— Action du groupe modulaire sur le demi-plan de Poincaré, théorème 23.95, parce que c’est 
avec lui qu’on montre les générateurs du groupe modulaire dans le corolaire 23.96. 


— Générateurs du groupe diédral, proposition 18.175 
— Table des caractères du groupe diédral, section 18.17. 
— Le groupe alterné est simple, théorème 5.50. 


—— Les groupes de pavage de R?, théorème 18.219. 


Représentations et caractères d’un groupe fini sur un C-espace vectoriel. Exemples 
— Table des caractères du groupe diédral, section 18.17. 


— Table des caractères du groupe symétrique S4, section 16.5. 
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Groupe linéaire d’un espace vectoriel de dimension finie E , sous-groupes de GL(F). 
Applications. 


— Théorème de Burnside sur les sous-groupes d’exposant fini de GL(n, C), théorème 9.307. 
— Décomposition de Bruhat, théorème 13.39. 

— Le lemme au lemme de Morse, lemme 17.121. 

— Décomposition polaire 13.32. 

— Enveloppe convexe du groupe orthogonal 13.38. 

— Sous-groupes compacts de GL(n,R), lemme 13.40 ou proposition 13.41. 


— Théorème de Von Neumann 17.64. 


Groupe des permutations d’un ensemble fini. Applications. 
— RSA, section 19.2, plus l’exponentielle rapide, plus la recherche de couples de Bézout. 
— Coloriage de roulette (18.10.15.1) et composition de colliers (18.10.15.2). 
— Forme alternées de degré maximum, proposition 9.7. 
— Décomposition de Bruhat, théorème 13.39. 
— Polynômes semi-symétriques, proposition 9.17. 
— Table des caractères du groupe diédral, section 18.17. 
— Table des caractères du groupe symétrique S4, section 16.5. 
— Isométries du cube, section 5.7. 


— Le groupe alterné est simple, théorème 5.50. 


Groupe des nombres complexes de module 1. Sous-groupes des racines de l’unité. 
Applications. 


— Théorème de Burnside sur les sous-groupes d’exposant fini de GL(n, C), théorème 9.307. 


— Forme faible du théorème de Dirichlet (avec ses deux lemmes) 19.28 (parce qu’on parle de 
polynômes cyclotomiques qui sont basés sur les racines de l'unité). 


— Action du groupe modulaire sur le demi-plan de Poincaré, théorème 23.95, parce qu'on y 
utilise un peu les propriétés des nombres du type |2| = 1. 


— Générateurs du groupe diédral, proposition 18.175. 
— Irréductibilité des polynômes cyclotomiques, proposition 19.23. 
— Théorème de Wedderburn 19.29. 


Groupe opérant sur un ensemble. Exemples et applications. 
— Les groupes de pavage de R?, théorème 18.219. 
— Action du groupe modulaire sur le demi-plan de Poincaré, théorème 23.95. 
— Polynômes semi-symétriques, proposition 9.17. 
— Lemme de Morse, lemme 20.194. 
— Générateurs du groupe diédral, proposition 18.175. 
— Sous-groupes compacts de GL(n,R), lemme 13.40 ou proposition 13.41. 
— Théorème de Wedderburn 19.29. 
— Isométries du cube, section 5.7. 


— Algorithme des facteurs invariants 4.113. 


45.2 Analyse 


Extremums : existence, caractérisation, recherche. Exemples et applications. 
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Approximation d’une fonction par des fonctions régulières. Exemples et applications. 


Théorème d’inversion locale, théorème des fonctions implicites. Exemples et applica- 
tions en analyse et en géométrie. 


Applications différentiables définies sur un ouvert de R". Exemples et applications. 


Équations différentielles ordinaires. Exemple de résolution et d’études de solutions en 
dimension 1 et 2. 


Exemples d'équations aux dérivées partielles linéaires 
Suites numériques. Convergence, valeurs d’adhérence. Exemples et applications. 


Suites vectorielles et réelles définies par une relation de récurrence un+1 = f(un). 
Exemples. Applications à la résolution approchée d’équations. 


Séries de nombres réels ou complexes. Comportement des restes ou des sommes par- 
tielles des séries numériques. Exemples. 


Analyse numérique matricielle : résolution approchée de systèmes linéaires, recherche 
de vecteurs propres, exemples. 


Fonctions et espaces de fonctions Lebesgue-intégrables. 
Problèmes d’interversion de limites et d’intégrales. 


Illustrer par des exemples quelques méthodes de calcul d’intégrales de fonctions d’une 
ou plusieurs variables. 


Fonctions d’une variable complexe. Exemples et applications 
Loi d’une variable aléatoire : caractérisations, exemples, applications. 


Convergences d’une suite de variables aléatoires. Théorèmes limite. Exemples et ap- 
plications. 


Variables aléatoires discrètes. Exemples et applications. 

Exemples d’études et d’applications de fonctions usuelles et spéciales. 
Illustration de la notion d’indépendance en probabilité. 

Exemples d'utilisation de courbes en dimension 2 ou supérieure. 


Fonctions définies par une intégrale dépendant d’un paramètre. Exemples et applica- 
tions. 


— Le théorème de Weierstrass sur la limite uniforme de fonctions holomorphes, théorème 26.106. 
— Les théorèmes sur les fonctions définies par des intégrales, section 17.4. 
— Lemme de Morse, lemme 20.194. 


— Prolongement méromorphe de la fonction l d’Euler. 


45.2. ANALYSE 2767 


Utilisation de la notion de convexité en analyse. 
— Ellipsoïde de John-Loewner, proposition 17.125. 


— Peut-être la méthode de Newton, théorème 34.63, mais je ne sais pas très bien pourquoi. 


Transformation de Fourier. Applications. 
— Formule sommatoire de Poisson, proposition 29.15. 


—— Équation de Schrüdinger, théorème 32.51. 


Séries de Fourier. Exemples et applications. 
— Formule sommatoire de Poisson, proposition 29.15. 
— Inégalité isopérimétrique, théorème 28.23. 


— Fonction continue et périodique dont la série de Fourier ne converge pas, proposition 28.21. 


Suites et séries de fonctions. Exemples et contre-exemples. 
— Formule sommatoire de Poisson, proposition 29.15. 
— Théorème taubérien de Hardy-Littlewood 17.6. 
— Le théorème de Weierstrass sur la limite uniforme de fonctions holomorphes, théorème 26.106. 
— La proposition 27.18 qui donne des indications sur la notion de classes dans LP. 
— Théorème de Montel 27.231. 


— Prolongement méromorphe de la fonction l d'Euler. 


Fonctions monotones. Fonctions convexes. Exemples et applications. 
— La proposition 32.46 donne un résultat sur y/+qy = 0 à partir d’une hypothèse de croissance. 
— L'inégalité de Jensen, proposition 36.72. 


— Méthode de Newton, théorème 34.63, si on parvient à expliquer quelle est le lien entre la 
méthode de Newton et la convexité. 


— Ellipsoïde de John-Loewner, proposition 17.125. 


— Extrema liés, théorème 17.76. 
— Théorème d’inversion locale, théorème 17.50. 


— Lemme de Morse, lemme 20.194. 


Espaces de Hilbert. Bases hilbertiennes. Exemples et applications. 
— Espace de Sobolev H!(1), théorème 31.6. 
— Inégalité isopérimétrique, théorème 28.23. 


— Dual de LP([0: 1]) pour 1 < p < 2, proposition 27.169. 


Espaces de fonctions : exemples et applications. 
— Théorème de Fischer-Riesz 27.44. 
— Espace de Sobolev H1(1), théorème 31.6. 
— Théorème de Cauchy-Lipschitz 17.42. 
— Dual de L?([0, 1]) pour 1 < p < 2, proposition 27.169. 
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Utilisation de la notion de compacité. 
— Le théorème de Weierstrass sur la limite uniforme de fonctions holomorphes, théorème 26.106. 
— Suite telle que limg_,0 d(ux+1,ux) = 0, théorème 7.289. 
— Sous-groupes compacts de GL(n, R), lemme 13.40 ou proposition 13.41. 
— Théorème de Montel 27.231. 
— Ellipsoïde de John-Loewner, proposition 17.125. 


Connexité. Exemples et applications. 
— Théorème de Runge 26.70. 
— Suite telle que limg_,0 d(ux+1,ux) = 0, théorème 7.289. 
— Théorème de Brouwer en dimension 2 via l’homotopie 26.66. 
— Théorème de Lie-Kolchin 12.106. 


Espaces complets. Exemples et applications. 
— La proposition 27.18 qui donne des indications sur la notion de classes dans LP. 
— Prolongement de fonction définie sur une partie dense, théorème 17.131 
— Complétion d’un espace métrique, théorème 17.138. 
— Théorème de Fischer-Riesz 27.44. 
— Théorème de Cauchy-Lipschitz global 17.43. 


Prolongement de fonctions. Exemples et applications. 
— Prolongement de fonction définie sur une partie dense, théorème 17.131 
— Lemme de Borel 15.164. 
— Prolongement méromorphe de la fonction l d’Euler. 


— Théorème de Tietze 27.163. 


Espaces vectoriels normés, applications linéaires continues. Exemples. 
— Théorème de Fischer-Riesz 27.44. 
— Théorème de Banach-Steinhaus 11.139. 
— Dual de LP([0, 1]) pour 1 < p < 2, proposition 27.169. 


45.3 Anciennes leçons 


Transformation de Fourier. Applications. 


— Théorème de Cauchy-Lipschitz global 17.43. 


Équations différentielles linéaires. Systèmes d’équations différentielles linéaires. 
Exemples et applications. 


— Équation de Hill y” + qy = 0, proposition 32.48. 
— Théorème de stabilité de Lyapunov 32.43. 
— Le système proie-prédateur de Lotka-Volterra 32.44 


— Théorème de Cauchy-Lipschitz global 17.43, si on parvient à réexprimer le théorème dans le 
cas linéaire. 
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Exemples de parties denses et applications. 
— Prolongement de fonction définie sur une partie dense, théorème 17.131 
— Complétion d’un espace métrique, théorème 17.138. 
— Points extrémaux de la boule unité dans £L(E), théorème 13.37. 
— Critère de Weyl, proposition 28.10. 
— Densité des polynômes dans C9([0, 1]); théorème de Bernstein 36.168. 


— Enveloppe convexe du groupe orthogonal 13.38. 


Applications des formules de Taylor. 
— Méthode de Newton, théorème 34.63 


— Lemme de Morse, lemme 20.194. 


Continuité et dérivabilité des fonctions réelles d’une variable réelle. Exemples et ap- 
plications. 


— Divergence de la somme des inverses des nombres premiers, théorème 15.118. 
— Formule sommatoire de Poisson, proposition 29.15. 

— Théorème taubérien de Hardy-Littlewood 17.6. 

— Nombres de Bell, théorème 15.166. 

— Partitions d’un entier en parts fixes, proposition 26.99. 

— Théorème d’Abel angulaire 20.85. 


Espaces LP, 1 < p < © 
— La proposition 27.18 qui donne des indications sur la notion de classes dans LP. 
— Théorème de Fischer-Riesz 27.44. 
— Espace de Sobolev H1(1), théorème 31.6. 
— Dual de LP([0, 1]) pour 1 < p < 2, proposition 27.169. 


Convergence des séries entières, propriétés de la somme. Exemples et applications. 
— Processus de Galton-Watson, théorème 38.59. 
— Formule sommatoire de Poisson, proposition 29.15. 
— Nombres de Bell, théorème 15.166. 
— Théorème d’Abel angulaire 20.85. 


Applications des nombres complexes à la géométrie. 
— Action du groupe modulaire sur le demi-plan de Poincaré, théorème 23.95. 
— Générateurs du groupe diédral, proposition 18.175 


— Le groupe circulaire, proposition 23.94. 


Sous-groupes discrets de R?. Réseaux. Exemples 


—— Les groupes de pavage de R?, théorème 18.219. 


Isométries d’un espace affine euclidien de dimension finie. Applications en dimensions 
2 et 3. 


— Isométries du cube, section 5.7. 
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Exemples d'équations diophantiennes. 
— Dans 3.2.6, nous résolvons ax + by = c en utilisant Bézout (théorème 1.229). 
— L'exemple 3.89 résout l'équation x? +2 = y° en parlant de l’extension Z[iV2] et de stathme. 
— Les propositions 3.93 et 3.95 parlent de triplets pythagoriciens. 


— Le dénombrement des solutions de l'équation ain1 + ...a,n, = n utilise des séries entières 
et des décompositions de fractions en éléments simples, théorème 26.99. 


Exemples de sous-groupes distingués et de groupes quotients. Applications. 
— Suites de décomposition et théorème de Jordan-Hôlder 2.21. 
— Groupes d'ordre pq, théorème 5.25. 
— Le groupe alterné est simple, théorème 5.50. 
— Théorème de Lie-Kolchin 12.106. 


Sous-groupes finis de O(2,R) et O(3,R). Applications 
— Les groupes de pavage de R?, théorème 18.219. 


Groupes finis. Exemples et applications. 
— RSA, section 19.2, plus l’exponentielle rapide, plus la recherche de couples de Bézout. 
— Théorème de Wedderburn 19.29. 


— Théorème de Sylow 5.11. Tout le théorème, c’est un peu long. On peut se contenter de la 
partie qui dit que G contient un p-Sylow. 


— Coloriage de roulette (18.10.15.1) et composition de colliers (18.10.15.2). 

— Suites de décomposition et théorème de Jordan-Hôlder 2.21. 

— Théorème de Burnside sur les sous-groupes d’exposant fini de GL(n, C), théorème 9.307. 
— (Z/pZ)* = Z/(p — 1)Z, corolaire 19.32. 

— Groupes d'ordre pq, théorème 5.25. 

— Générateurs du groupe diédral, proposition 18.175. 

— Le groupe alterné est simple, théorème 5.50. 


— Isométries du cube, section 5.7. 


Angles : Définitions et utilisation en géométrie 


— Les groupes de pavage de R?, théorème 18.219. 


Isométries d’un espace affine euclidien de dimension finie. Formes réduites. Applica- 
tions 


— Les groupes de pavage de R?, théorème 18.219. 


Applications affines 
—— Les groupes de pavage de R?, théorème 18.219. 


Utilisation des groupes en géométrie. 
— Coloriage de roulette (18.10.15.1) et composition de colliers (18.10.15.2). 


— Forme alternées de degré maximum, proposition 9.7, parce que c’est ce théorème qui donne 
l’unicité du déterminant du fait que l’espace est de dimension un. 


— Action du groupe modulaire sur le demi-plan de Poincaré, théorème 23.95. 
— Générateurs du groupe diédral, proposition 18.175 
— Isométries du cube, section 5.7. 


— Les groupes de pavage de R?, théorème 18.219. 
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Opérations élémentaires sur les lignes et les colonnes d’une matrice. Exemples et 
applications. 


— Décomposition de Bruhat, théorème 13.39. 


— Algorithme des facteurs invariants 4.113. 


Exemples de décompositions remarquables dans le groupe linéaire. Applications 
— Décomposition polaire 13.32. 


— Décomposition de Dunford, théorème 9.259. 


Résultant. Applications. 
— Théorème de Rothstein-Trager 20.94. 


— Théorème de Kronecker 9.25. 


Matrices équivalentes. Matrices semblables. Applications. 
— Racine carrée d’une matrice hermitienne positive, proposition 13.27. 


— Sous-groupes compacts de GL(n,R), lemme 13.40 ou proposition 13.41. 


Exemples d'utilisation de la notion de dimension d’un espace vectoriel. 


— Forme alternées de degré maximum, proposition 9.7, parce que c’est ce théorème qui donne 
l’unicité du déterminant du fait que l’espace est de dimension un. 


— Théorème de la dimension 4.13, bien que ce soit plutôt dans la définition de la dimension 
que dans l’utilisation. 


— Théorème de Carathéodory 8.41. 


Corps des fractions rationnelles à une indéterminée sur un corps commutatif. Appli- 
cations. 


— Théorème de Rothstein-Trager 20.94. 


— Partitions d’un entier en parts fixes, proposition 26.99. 


Anneau de séries formelles. Applications. 
— Nombres de Bell, théorème 15.166. 


— Partitions d’un entier en parts fixes, proposition 26.99. 


Formes linéaires et hyperplans en dimension finie. Exemples et applications. 
— Extrema liés, théorème 17.76. 
— Enveloppe convexe du groupe orthogonal 13.38. 


— Une forme canonique pour les transvections et dilatations, théorème 13.8. 


Algèbre des polynômes d’un endomorphisme en dimension finie. Applications. 


— Racine carrée d’une matrice hermitienne positive, proposition 13.27. 


Formes quadratiques réelles. Exemples et applications. 
— Le lemme au lemme de Morse, lemme 17.121. 
— Connexité des formes quadratiques de signature donnée, proposition 17.120. 
— Sous-groupes compacts de GL(n,R), lemme 13.40 ou proposition 13.41. 
— Ellipsoïde de John-Loewner, proposition 17.125. 
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Polynômes d’endomorphisme en dimension finie. Applications à la réduction d’un 
endomorphisme en dimension finie. 


— Endomorphismes cycliques et commutant dans le cas diagonalisable, proposition 9.295. 


Applications des nombres complexes à la géométrie. Homographies. 


— Action du groupe modulaire sur le demi-plan de Poincaré, théorème 23.95. Parce que l’action 
est avec des homographies. 


Anneaux principaux. Applications 
— Polynôme minimal d’endomorphisme semi-simple, théorème 9.107. 
— Théorème de Bézout, corolaire 3.70. 
— Théorème des deux carrés, théorème 6.25. 


— Algorithme des facteurs invariants 4.113. 


Représentations de groupes finis de petit cardinal. 
— Table des caractères du groupe diédral, section 18.17. 


— Table des caractères du groupe symétrique S4, section 16.5. 


Algèbre des polynômes à n indéterminées (n > 2). Polynômes symétriques. Applica- 
tions. 


— À propos d'extensions de Q, le lemme 6.181. 
— Polynômes semi-symétriques, proposition 9.17. 
— Théorème de Chevalley- Warning 19.43. 


— Théorème de Kronecker 9.25. 


Racines d’un polynômes. Fonctions symétriques élémentaires. Localisation des racines 
dans les cas réel et complexe. 


— À propos d'extensions de Q, le lemme 6.181. 


135 - Isométries d’un espace affine euclidien de dimension finie. Forme réduite. Ap- 
plications en dimensions 2 et 3. 


— Points extrémaux de la boule unité dans £(E), théorème 13.37. 
— Générateurs du groupe diédral, proposition 18.175 


— Isométries du cube, section 5.7. 


248 - Approximation des fonctions numériques par des fonctions polynomiales. 
Exemples. 


— Théorème taubérien de Hardy-Littlewood 17.6. 
— Théorème de Runge 26.70. 
— Densité des polynômes dans C9 ([0: 1|); théorème de Bernstein 36.168. 


250 - Loi des grands nombres. Théorème central limite. Applications. 
— Presque tous les nombres sont normaux, proposition 36.166. 


— Estimation des grands écarts, théorème 36.152. 
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251 - Indépendance d’événements et de variables aléatoires. Exemples. 
— Presque tous les nombres sont normaux, proposition 36.166. 
— Estimation des grands écarts, théorème 36.152. 
— Densité des polynômes dans CY([0, 1]: théorème de Bernstein 36.168. 


— Problème de la ruine du joueur, section 39.4. 


252 - Loi binomiale. Loi de Poisson. Applications. 
— Estimation des grands écarts, théorème 36.152. 
— Densité des polynômes dans CU [O, 1]); théorème de Bernstein 36.168. 


— Problème de la ruine du joueur, section 39.4. 


219 - Problèmes d’extrémums. 
— Extrema liés, théorème 17.76. 
— Lemme de Morse, lemme 20.194. 


— Ellipsoïde de John-Loewner, proposition 17.125. 


Équations différentielles X’ = f(t, X). Exemples d’étude des solutions en dimension 1 
et 2. 


— Théorème de Cauchy-Lipschitz 17.42. 

— Théorème de stabilité de Lyapunov 32.43. 

— Équation de Hill y” + qy = 0, proposition 32.48. 

— Le système proie-prédateur de Lotka-Volterra 32.44 


223 - Convergence des suites numériques. Exemples et applications. 
— Calcul d’intégrale par suite équirépartie 28.10. 
— Théorème taubérien de Hardy-Littlewood 17.6. 
— Méthode de Newton, théorème 34.63 
— Théorème d’Abel angulaire 20.85. 


224 - Comportement asymptotique de suites numériques. Rapidité de convergence. 
Exemples. 


— Le dénombrement des solutions de l'équation ain + ...a,n, = n utilise des séries entières 
et des décompositions de fractions en éléments simples, théorème 26.99. 


— Divergence de la somme des inverses des nombres premiers, théorème 15.118. 
— Formule sommatoire de Poisson, proposition 29.15, grâce à l’exemple 29.16. 
— Méthode de Newton, théorème 34.63 

— Estimation des grands écarts, théorème 36.152. 


— Le dénombrement des solutions de l'équation ain1 + ...a,n, = n utilise des séries entières 
et des décompositions de fractions en éléments simples, théorème 26.99. 


226 - Comportement d’une suite réelle ou vectorielle définie par une itération u,+1 = 
f(un). Exemples. 


— Processus de Galton-Watson, section 38.7. 
— Méthode de Newton, théorème 34.63 
— Méthode du gradient à pas optimal 17.117. 
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245 - Fonctions holomorphes et méromorphes sur un ouvert de C. Exemples et appli- 
cations. 


— Le théorème de Weierstrass sur la limite uniforme de fonctions holomorphes, théorème 26.106. 
— Théorème de Montel 27.231. 


— Prolongement méromorphe de la fonction l d’Euler. 


238 - Méthodes de calcul approché d’intégrales et de solutions d’équations différen- 
tielles. 


— Calcul d’intégrale par suite équirépartie 28.10. 


222 - Exemples d’équations différentielles. Solutions exactes ou approchées. 


— Équation y” + qy = 0, 32.9.3. 


225 - Étude locale de surfaces. Exemples. 


— Lemme de Morse, lemme 20.194. 


Exemples de problèmes d’interversion de limites. 


— Théorème taubérien de Hardy-Littlewood 17.6 parce que l’énoncé revient à montrer la limite 
lim; 1 DER Ant" = Een An: 
— Le théorème de Weierstrass sur la limite uniforme de fonctions holomorphes, théorème 26.106. 


— La proposition 27.18 qui donne des indications sur la notion de classes dans LP. Ça utilise la 
convergence monotone pour pour permuter une somme et une intégrale. 


— Les théorèmes sur les fonctions définies par des intégrales, section 17.4. 


— Nombres de Bell, théorème 15.166. 


254 - Espaces de Schwartz et distributions tempérées. 
— Formule sommatoire de Poisson, proposition 29.15. 


— Équation de Schrôdinger, théorème 32.51. 


Théorème d’inversion locale, théorème des fonctions implicites. Exemples et applica- 
tions. 


— Extrema liés, théorème 17.76. 
— Théorème d’inversion locale, théorème 17.50. 
— Lemme de Morse, lemme 20.194. 


— Théorème de Von Neumann 17.64. 


Continuité et dérivabilité des fonctions réelles d’une variable réelle. Exemples et 
contre-exemples. 


— Les théorèmes sur les fonctions définies par des intégrales, section 17.4. 


— Lemme de Borel 15.164. 


232 - Méthodes d’approximation des solutions d’une équation F(X) = 0. Exemples. 
— Méthode de Newton, théorème 34.63 
— Méthode du gradient à pas optimal 17.117. 
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Illustrer par des exemples quelques méthodes de calcul d’intégrales de fonctions d’une 
ou plusieurs variables réelles. 


— Calcul d’intégrale par suite équirépartie 28.10. 
— Théorème de Rothstein-Trager 20.94. 


256 - Transformation de Fourier dans .7(R1) et .7’(R°). 
— Formule sommatoire de Poisson, proposition 29.15. 


—— Équation de Schrüdinger, théorème 32.51. 


Espaces de Schwartz .7(R‘) et distributions tempérées. Transformation de Fourier 
dans .7(R‘) et .7/(R4) 


— Formule sommatoire de Poisson, proposition 29.15. 


—— Équation de Schrüdinger, théorème 32.51. 


Espaces de Schwartz. Distributions. Dérivation au sens des distributions. 
— L'équation (x — xo)*u = 0 pour u € Ÿ'(R), théorème 30.52. 
— Espace de Sobolev H{(1), théorème 31.6. 
—— Équation de Schrüdinger, théorème 32.51. 


Fonctions développables en série entière, fonctions analytiques. Exemples. 


— Le dénombrement des solutions de l'équation ain + ...a,n, = n utilise des séries entières 
et des décompositions de fractions en éléments simples, théorème 26.99. 


Théorèmes de point fixe. Exemples et applications. 
— Processus de Galton-Watson, théorème 38.59. 
— Théorème d’inversion locale, théorème 17.50. 
— Théorème de Brouwer en dimension 2 via l’homotopie 26.66. 
— Théorème de Picard 17.37 et l’inséparable théorème de Cauchy-Lipschitz 17.42 
— Inégalité isopérimétrique, théorème 28.23. 
— Théorème des quatre sommets, théorème 21.106. 


— Formule sommatoire de Poisson, proposition 29.15. 


Sous-variétés de R’”. Exemples. 
— Extrema liés, théorème 17.76. 
— Théorème de Von Neumann 17.64. 


— Lemme de Morse, lemme 20.194. 


Suites et séries de fonctions intégrables. Exemples et applications. 
— La proposition 27.18 qui donne des indications sur la notion de classes dans LP. 
— Le théorème de Weierstrass sur la limite uniforme de fonctions holomorphes, théorème 26.106. 
— Les théorèmes sur les fonctions définies par des intégrales, section 17.4. 
— Théorème de Fischer-Riesz 27.44. 
— Prolongement méromorphe de la fonction l d’Euler. 


— Problème de la ruine du joueur, section 39.4. 
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Utilisation en probabilités du produit de convolution et de la transformation de Fou- 
rier ou de Laplace. 


— Processus de Galton-Watson, lemme 38.58 et théorème 38.59. 
— Fonction caractéristique 36.77. 


— Théorème central limite 36.121. 


Suites de variables de Bernoulli indépendantes. 
— Processus de Galton-Watson, section 38.7. 
— Estimation des grands écarts, théorème 36.152. 
— Densité des polynômes dans C‘([0, 11): théorème de Bernstein 36.168. 


— Problème de la ruine du joueur, section 39.4. 
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GNU Free Documentation License 


Version 1.3, 3 November 2008 
Copyright © 2000, 2001, 2002, 2007, 2008 Free Software Foundation, Inc. 


http://fsf.org/ 


Everyone is permitted to copy and distribute verbatim copies of this license document, but 
changing it is not allowed. 


Preamble 


The purpose of this License is to make àa manual, textbook, or other functional and useful 
document “free” in the sense of freedom : to assure everyone the effective freedom to copy and 
redistribute it, with or without modifying it, either commercially or noncommercially. Secondarily, 
this License preserves for the author and publisher a way to get credit for their work, while not 
being considered responsible for modifications made by others. 

This License is à kind of “copyleft”, which means that derivative works of the document must 
themselves be free in the same sense. It complements the GNU General Public License, which is a 
copyleft license designed for free software. 

We have designed this License in order to use it for manuals for free software, because free 
software needs free documentation : a free program should come with manuals providing the same 
freedoms that the software does. But this License is not limited to software manuals ; it can be 
used for any textual work, regardless of subject matter or whether it is published as a printed 
book. We recommend this License principally for works whose purpose is instruction or reference. 


APPLICABILITY AND DEFINITIONS 


This License applies to any manual or other work, in any medium, that contains à notice 
placed by the copyright holder saying it can be distributed under the terms of this License. Such 
a notice grants a world-wide, royalty-free license, unlimited in duration, to use that work under 
the conditions stated herein. The “Document”, below, refers to any such manual or work. Any 
member of the public is a licensee, and is addressed as “you”. You accept the license if you copy, 
modify or distribute the work in à way requiring permission under copyright law. 

À “Modified Version” of the Document means any work containing the Document or a 
portion of it, either copied verbatim, or with modifications and/or translated into another language. 

À “Secondary Section” is a named appendix or a front-matter section of the Document 
that deals exclusively with the relationship of the publishers or authors of the Document to the 
Document’s overall subject (or to related matters) and contains nothing that could fall directly 
within that overall subject. (Thus, if the Document is in part a textbook of mathematics, a Secon- 
dary Section may not explain any mathematics.) The relationship could be à matter of historical 
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connection with the subject or with related matters, or of legal, commercial, philosophical, ethical 
or political position regarding them. 

The “Invariant Sections” are certain Secondary Sections whose titles are designated, as being 
those of Invariant Sections, in the notice that says that the Document is released under this License. 
If a section does not fit the above definition of Secondary then it is not allowed to be designated as 
Invariant. The Document may contain zero Invariant Sections. If the Document does not identify 
any Invariant Sections then there are none. 

The “Cover Texts” are certain short passages of text that are listed, as Front-Cover Texts 
or Back-Cover Texts, in the notice that says that the Document is released under this License. A 
Front-Cover Text may be at most 5 words, and a Back-Cover Text may be at most 25 words. 

À “Transparent” copy of the Document means a machine-readable copy, represented in a 
format whose specification is available to the general public, that is suitable for revising the docu- 
ment straightforwardly with generic text editors or (for images composed of pixels) generic paint 
programs or (for drawings) some widely available drawing editor, and that is suitable for input 
to text formatters or for automatic translation to à variety of formats suitable for input to text 
formatters. À copy made in an otherwise Transparent file format whose markup, or absence of 
markup, has been arranged to thwart or discourage subsequent modification by readers is not 
Transparent. An image format is not Transparent if used for any substantial amount of text. À 
copy that is not “Transparent” is called “Opaque”. 

Examples of suitable formats for Transparent copies include plain ASCIT without markup, 
Texinfo input format, LaTeX input format, SGML or XML using a publicly available DTD, 
and standard-conforming simple HTML, PostScript or PDF designed for human modification. 
Examples of transparent image formats include PNG, XCF and JPG. Opaque formats include 
proprietary formats that can be read and edited only by proprietary word processors, SGML or 
XML for which the DTD and/or processing tools are not generally available, and the machine- 
generated HTML, PostScript or PDF produced by some word processors for output purposes only. 

The “Title Page” means, for a printed book, the title page itself, plus such following pages 
as are needed to hold, legibly, the material this License requires to appear in the title page. For 
works in formats which do not have any title page as such, “Title Page” means the text near the 
most prominent appearance of the work’s title, preceding the beginning of the body of the text. 

The “publisher” means any person or entity that distributes copies of the Document to the 
public. 

À section “Entitled XYZ” means a named subunit of the Document whose title either is pre- 
cisely XYZ or contains XYZ in parentheses following text that translates XYZ in another language. 
(Here XYZ stands for a specific section name mentioned below, such as “Acknowledgements”, 
“Dedications”, “Endorsements”, or “History”.) To “Preserve the Title” of such a section 
when you modify the Document means that it remains a section “Entitled XYZ” according to this 
definition. 

The Document may include Warranty Disclaimers next to the notice which states that this 
License applies to the Document. These Warranty Disclaimers are considered to be included by 
reference in this License, but only as regards disclaiming warranties : any other implication that 
these Warranty Disclaimers may have is void and has no effect on the meaning of this License. 


VERBATIM COPYING 


You may copy and distribute the Document in any medium, either commercially or noncommer- 
cially, provided that this License, the copyright notices, and the license notice saying this License 
applies to the Document are reproduced in all copies, and that you add no other conditions what- 
soever to those of this License. You may not use technical measures to obstruct or control the 
reading or further copying of the copies you make or distribute. However, you may accept com- 
pensation in exchange for copies. If you distribute a large enough number of copies you must also 
follow the conditions in section 3. 
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You may also lend copies, under the same conditions stated above, and you may publicly display 
copies. 


COPYING IN QUANTITY 


If you publish printed copies (or copies in media that commonly have printed covers) of the 
Document, numbering more than 100, and the Document’s license notice requires Cover Texts, you 
must enclose the copies in covers that carry, clearly and legibly, all these Cover Texts : Front-Cover 
Texts on the front cover, and Back-Cover Texts on the back cover. Both covers must also clearly 
and legibly identify you as the publisher of these copies. The front cover must present the full title 
with all words of the title equally prominent and visible. You may add other material on the covers 
in addition. Copying with changes limited to the covers, as long as they preserve the title of the 
Document and satisfy these conditions, can be treated as verbatim copying in other respects. 

If the required texts for either cover are too voluminous to fit legibly, you should put the first 
ones listed (as many as fit reasonably) on the actual cover, and continue the rest onto adjacent 
pages. 

If you publish or distribute Opaque copies of the Document numbering more than 100, you must 
either include a machine-readable Transparent copy along with each Opaque copy, or state in or 
with each Opaque copy à computer-network location from which the general network-using public 
has access to download using public-standard network protocols a complete Transparent copy of the 
Document, free of added material. If you use the latter option, you must take reasonably prudent 
steps, when you begin distribution of Opaque copies in quantity, to ensure that this Transparent 
copy will remain thus accessible at the stated location until at least one year after the last time 
you distribute an Opaque copy (directly or through your agents or retailers) of that edition to the 
public. 

It is requested, but not required, that you contact the authors of the Document well before 
redistributing any large number of copies, to give them a chance to provide you with an updated 
version of the Document. 


MODIFICATIONS 


You may copy and distribute a Modified Version of the Document under the conditions of 
sections 2 and 3 above, provided that you release the Modified Version under precisely this Li- 
cense, with the Modified Version filling the role of the Document, thus licensing distribution and 
modification of the Modified Version to whoever possesses à copy of it. In addition, you must do 
these things in the Modified Version : 


A. Use in the Title Page (and on the covers, if any) a title distinct from that of the Document, 
and from those of previous versions (which should, if there were any, be listed in the History 
section of the Document). Vou may use the same title as a previous version if the original 
publisher of that version gives permission. 

B. List on the Title Page, as authors, one or more persons or entities responsible for authorship 
of the modifications in the Modified Version, together with at least five of the principal 
authors of the Document (all of its principal authors, if it has fewer than five), unless they 
release you from this requirement. 


C. State on the Title page the name of the publisher of the Modified Version, as the publisher. 


Ü 


. Preserve all the copyright notices of the Document. 


E. Add an appropriate copyright notice for your modifications adjacent to the other copyright 
notices. 


F. Include, immediately after the copyright notices, a license notice giving the public permission 
to use the Modified Version under the terms of this License, in the form shown in the 
Addendum below. 


2780 CHAPITRE 46. GNU FREE DOCUMENTATION LICENSE 


G. Preserve in that license notice the full lists of Invariant Sections and required Cover Texts 
given in the Document’s license notice. 


H. Include an unaltered copy of this License. 


[. Preserve the section Entitled “History”, Preserve its Title, and add to it an item stating at 
least the title, year, new authors, and publisher of the Modified Version as given on the Title 
Page. If there is no section Entitled “History” in the Document, create one stating the title, 
year, authors, and publisher of the Document as given on its Title Page, then add an item 
describing the Modified Version as stated in the previous sentence. 


J. Preserve the network location, if any, given in the Document for public access to a Trans- 
parent copy of the Document, and likewise the network locations given in the Document 
for previous versions it was based on. These may be placed in the “History” section. You 
may omit a network location for a work that was published at least four years before the 
Document itself, or if the original publisher of the version it refers to gives permission. 


K. For any section Entitled “Acknowledgements” or “Dedications”, Preserve the Title of the 
section, and preserve in the section all the substance and tone of each of the contributor 
acknowledgements and/or dedications given therein. 


L. Preserve all the Invariant Sections of the Document, unaltered in their text and in their 
titles. Section numbers or the equivalent are not considered part of the section titles. 


M. Delete any section Entitled “Endorsements”. Such a section may not be included in the 
Modified Version. 


N. Do not retitle any existing section to be Entitled “Endorsements” or to conflict in title with 
any Invariant Section. 


O. Preserve any Warranty Disclaimers. 


If the Modified Version includes new front-matter sections or appendices that qualify as Se- 
condary Sections and contain no material copied from the Document, you may at your option 
designate some or all of these sections as invariant. To do this, add their titles to the list of In- 
variant Sections in the Modified Version’s license notice. These titles must be distinct from any 
other section titles. 

You may add a section Entitled “Endorsements”, provided it contains nothing but endorsements 
of your Modified Version by various parties —for example, statements of peer review or that the 
text has been approved by an organization as the authoritative definition of a standard. 

You may add à passage of up to five words as a Front-Cover Text, and à passage of up to 
25 words as a Back-Cover Text, to the end of the list of Cover Texts in the Modified Version. 
Only one passage of Front-Cover Text and one of Back-Cover Text may be added by (or through 
arrangements made by) any one entity. If the Document already includes a cover text for the same 
cover, previously added by you or by arrangement made by the same entity you are acting on 
behalf of, you may not add another ; but you may replace the old one, on explicit permission from 
the previous publisher that added the old one. 

The author(s) and publisher(s) of the Document do not by this License give permission to use 
their names for publicity for or to assert or imply endorsement of any Modified Version. 


COMBINING DOCUMENTS 


You may combine the Document with other documents released under this License, under the 
terms defined in section 4 above for modified versions, provided that you include in the combination 
all of the Invariant Sections of all of the original documents, unmodified, and list them all as 
Invariant Sections of your combined work in its license notice, and that you preserve all their 
Warranty Disclaimers. 

The combined work need only contain one copy of this License, and multiple identical Invariant 
Sections may be replaced with a single copy. If there are multiple Invariant Sections with the same 
name but different contents, make the title of each such section unique by adding at the end of 
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it, in parentheses, the name of the original author or publisher of that section if known, or else a 
unique number. Make the same adjustment to the section titles in the list of Invariant Sections in 
the license notice of the combined work. 

In the combination, you must combine any sections Entitled “History” in the various original 
documents, forming one section Entitled “History” ; likewise combine any sections Entitled “Ack- 
nowledgements”, and any sections Entitled “Dedications”. You must delete all sections Entitled 
“Endorsements”. 


COLLECTIONS OF DOCUMENTS 


You may make a collection consisting of the Document and other documents released under 
this License, and replace the individual copies of this License in the various documents with a 
single copy that is included in the collection, provided that you follow the rules of this License for 
verbatim copying of each of the documents in all other respects. 

You may extract a single document from such a collection, and distribute it individually under 
this License, provided you insert a copy of this License into the extracted document, and follow 
this License in all other respects regarding verbatim copying of that document. 


AGGREGATION WITH INDEPENDENT WORKS 


À compilation of the Document or its derivatives with other separate and independent docu- 
ments or works, in or on a volume of a storage or distribution medium, is called an “aggregate” if 
the copyright resulting from the compilation is not used to limit the legal rights of the compilation’s 
users beyond what the individual works permit. When the Document is included in an aggregate, 
this License does not apply to the other works in the aggregate which are not themselves derivative 
works of the Document. 

If the Cover Text requirement of section 3 is applicable to these copies of the Document, then 
if the Document is less than one half of the entire aggregate, the Document’s Cover Texts may be 
placed on covers that bracket the Document within the aggregate, or the electronic equivalent of 
covers if the Document is in electronic form. Otherwise they must appear on printed covers that 
bracket the whole aggregate. 


TRANSLATION 


Translation is considered a kind of modification, so you may distribute translations of the 
Document under the terms of section 4. Replacing Invariant Sections with translations requires 
special permission from their copyright holders, but you may include translations of some or all 
Invariant Sections in addition to the original versions of these Invariant Sections. You may include 
a translation of this License, and all the license notices in the Document, and any Warranty 
Disclaimers, provided that you also include the original English version of this License and the 
original versions of those notices and disclaimers. In case of a disagreement between the translation 
and the original version of this License or a notice or disclaimer, the original version will prevail. 

If a section in the Document is Entitled “Acknowledgements”, “Dedications”, or “History”, the 
requirement (section 4) to Preserve its Title (section 1) will typically require changing the actual 
title. 


TERMINATION 


You may not copy, modify, sublicense, or distribute the Document except as expressly provided 
under this License. Any attempt otherwise to copy, modify, sublicense, or distribute it is void, and 
will automatically terminate your rights under this License. 
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However, if you cease all violation of this License, then your license from a particular copyright 
holder is reinstated (a) provisionally, unless and until the copyright holder explicitly and finally 
terminates your license, and (b) permanently, if the copyright holder fails to notify you of the 
violation by some reasonable means prior to 60 days after the cessation. 

Moreover, your license from à particular copyright holder is reinstated permanently if the 
copyright holder notifies you of the violation by some reasonable means, this is the first time you 
have received notice of violation of this License (for any work) from that copyright holder, and 
you cure the violation prior to 30 days after your receipt of the notice. 

Termination of your rights under this section does not terminate the licenses of parties who 
have received copies or rights from you under this License. If your rights have been terminated 
and not permanently reinstated, receipt of a copy of some or all of the same material does not give 
you any rights to use it. 


FUTURE REVISIONS OF THIS LICENSE 


The Free Software Foundation may publish new, revised versions of the GNU Free Documen- 
tation License from time to time. Such new versions will be similar in spirit to the present version, 
but may differ in detail to address new problems or concerns. See http://www.gnu.org/copyleft/ . 

Each version of the License is given a distinguishing version number. If the Document specifies 
that a particular numbered version of this License “or any later version” applies to it, you have 
the option of following the terms and conditions either of that specified version or of any later 
version that has been published (not as a draft) by the Free Software Foundation. If the Document 
does not specify a version number of this License, you may choose any version ever published (not 
as a draft) by the Free Software Foundation. If the Document specifies that à proxy can decide 
which future versions of this License can be used, that proxy’s public statement of acceptance of 
a version permanently authorizes you to choose that version for the Document. 


RELICENSING 


“Massive Multiauthor Collaboration Site” (or “MMC Site”) means any World Wide Web server 
that publishes copyrightable works and also provides prominent facilities for anybody to edit 
those works. À public wiki that anybody can edit is an example of such a server. À “Massive 
Multiauthor Collaboration” (or “MMC”) contained in the site means any set of copyrightable 
works thus published on the MMC site. 

“CC-BY-SA” means the Creative Commons Attribution-Share Alike 3.0 license published by 
Creative Commons Corporation, a not-for-profit corporation with a principal place of business in 
San Francisco, California, as well as future copyleft versions of that license published by that same 
organization. 

“Incorporate” means to publish or republish a Document, in whole or in part, as part of another 
Document. 

An MM is “eligible for relicensing” if it is licensed under this License, and if all works that were 
first published under this License somewhere other than this MMC, and subsequently incorporated 
in whole or in part into the MMC, (1) had no cover texts or invariant sections, and (2) were thus 
incorporated prior to November 1, 2008. 

The operator of an MMC Site may republish an MMC contained in the site under CC-BY-SA 
on the same site at any time before August 1, 2009, provided the MMC is eligible for relicensing. 


ADDENDUM : How to use this License for your documents 


To use this License in a document you have written, include à copy of the License in the 
document and put the following copyright and license notices just after the title page : 
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Copyright © YEAR YOUR NAME. Permission is granted to copy, distribute and/or 
modify this document under the terms of the GNU Free Documentation License, Ver- 
sion 1.3 or any later version published by the Free Software Foundation ; with no Inva- 
riant Sections, no Front-Cover Texts, and no Back-Cover Texts. À copy of the license 
is included in the section entitled “GNU Free Documentation License”. 


If you have Invariant Sections, Front-Cover Texts and Back-Cover Texts, replace the “with ... 
Texts line with this : 


with the Invariant Sections being LIST THEIR TITLES, with the Front-Cover Texts 
being LIST, and with the Back-Cover Texts being LIST. 


If you have Invariant Sections without Cover Texts, or some other combination of the three, 
merge those two alternatives to suit the situation. 

If your document contains nontrivial examples of program code, we recommend releasing these 
examples in parallel under your choice of free software license, such as the GNU General Public 
License, to permit their use in free software. 
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